KR20130132250A

KR20130132250A - 신규 7α-히드록시스테로이드 데히드로게나제 녹아웃 돌연변이체 및 그의 용도

Info

Publication number: KR20130132250A
Application number: KR1020127033785A
Authority: KR
Inventors: 롤프 슈미트; 미하엘 브라운; 뤄 류; 아르노 아이그너; 디르크 보이스터-보츠
Original assignee: 파마젤 게엠베하
Priority date: 2010-05-27
Filing date: 2011-05-27
Publication date: 2013-12-04
Also published as: AU2011257168B2; EP2576600B1; AU2011257168A1; JP2013528381A; US20130224792A1; JP6023045B2; NZ603816A; CN103097400A; CN103097400B; WO2011147957A1; KR101812366B1; EP2576600A1; US9096825B2

Abstract

본 발명은 신규 미생물 7α-히드록시스테로이드 데히드로게나제 (7α-HSDH) 녹아웃 돌연변이체, 및 다양한 기능을 갖는 다른 HSDH, 예컨대 3α-, 7β- 또는 12α-HSDH의 생산을 위한 그의 용도, 및 이에 따라 생산된 HSDH 효소의 콜산 화합물의 효소적 반응 및 특히 우르소데옥시콜산 (UDCA)의 생산에서의 용도에 관한 것이다. 본 발명은 특히 UDCA의 신규 합성 방법에 관한 것이다.

Description

신규 7α-히드록시스테로이드 데히드로게나제 녹아웃 돌연변이체 및 그의 용도 {NOVEL 7α-HYDROXYSTEROID DEHYDROGENASE KNOCKOUT MUTANTS AND USE THEREOF}

본 발명은 신규 미생물 7α-히드록시스테로이드 데히드로게나제 (7α-HSDH) 녹아웃 돌연변이체, 및 다양한 기능의 다른 HSDH, 예컨대 3α-, 7β- 또는 12α-HSDH의 생산을 위한 그의 용도, 및 이에 따라 생산된 HSDH 효소의 콜산 화합물의 효소적 반응 및 특히 우르소데옥시콜산 (UDCA)의 생산에서의 용도에 관한 것이고; 본 발명은 특히 UDCA의 신규 합성 방법에 관한 것이다.

활성 물질 우르소데옥시콜산 (UDCA) 및 연관된 부분입체이성질체 케노데옥시콜산 (CDCA)은 특히 담석의 의학적 치료를 위해 수년 동안 사용되어 왔다. 상기 두 화합물은 C 원자 7 상에서의 히드록실 기의 배위만이 상이하다 (UDCA: β-배위, CDCA: α-배위). 선행 기술에서는, UDCA 생산을 위한 다양한 방법이 기재되어 있고, 이것은 순수하게 화학적으로 수행되거나 또는 화학적 및 효소적 공정 단계의 조합으로 이루어진다. 각각의 경우에 출발점은 콜산 (CA) 또는 콜산으로부터 생산된 CDCA이다.

따라서, UDCA 생산을 위한 전형적인 화학적 방법은 다음과 같이 도식적으로 나타낼 수 있다:

특히 심각한 단점은 다음과 같다: 화학적 산화는 선택적이지 않기 때문에, 카르복시 기 및 3α 및 7α-히드록시 기는 에스테르화에 의해 보호되어야 한다.

효소 12α-HSDH의 사용을 기반으로 하는 대안적인 화학적/효소적 방법은 예를 들어 본 출원인의 PCT/EP2009/002190에 기재되어 있다. 특히, 재조합적으로 생산된 12α-HSDH가 여기서 사용된다. 상기 효소는 바람직하게는 여기서 재조합 이. 콜라이(E. coli) 숙주에 의해 생산되고, 이로부터 단리되고, 반응을 위해 사용된다.

여기서 12α-HSDH는 CA를 선택적으로 12-케토-CDCA로 산화시킨다. 전형적인 화학적 방법에 필수적인 2가지 화학적 보호 단계가 여기서는 불필요하다.

상기 방법에서는, 이러한 방식으로 생산된 가치있는 생성물 UDCA가 현재까지 알려지지 않은 이유로 리토콜산 (LCA)으로 오염된다는 것이 문제가 된다.

신규 7β-HSDH 및 환원 경로에서의 UDCA 생산에서의 그의 용도는 본 출원인의 PCT/EP2010/068576에 기재되어 있다. 여기서는 재조합 이. 콜라이 숙주가 또한 내인성 7α-HSDH를 생산하고, 7α-HSDH가 데히드로콜산으로부터 3,12-디케토-CDCA 부산물을 생산한다는 것이 여기서 문제가 된다. 이어서, 상기 3,12-디케토-CDCA는 더 이상 7β-HSDH의 기질이 아니므로, 목적 생성물 외에도, 목적하지 않은 부산물이 또한 축적된다.

따라서, 본 발명의 목적은 상기 기재된 단점을 피하면서 UDCA의 신규 생산 방법을 제공하는 것이다. 특히, 불순물, 예컨대 LCA 또는 3,12-디케토-CDCA가 없는 UDCA의 효소적/화학적 생산이 가능하여야 한다.

발명의 간단한 개요:

본 발명에 따르면, 놀랍게도 목적하지 않은 불순물, 예컨대 LCA 발생의 원인이 복합적인 화학적 부반응의 목적하지 않은 결과가 아니라는 것이 밝혀졌다. LCA의 발생은 또한 12α-HSDH 자체에 의해 촉매화되는 부반응의 결과는 아니다. 오히려, 효소적 반응 단계를 촉매화하는 12α-HSDH 효소가 7α-HSDH 활성의 결과로서의 효소적 불순물을 함유한다. 이것의 결과로서, 추가의 화학적 전환 반응의 과정에서 UDCA로 이어지는 12-케토-CDCA는 화학적 부반응에서 7,12-디케토-LCA로 산화되고, 이것은 LCA로 환원된다. 이것을 하기 반응식에 나타낸다.

특히, 7,12 디케토-LCA의 형성 원인은 12α-HSDH의 7α-HSDH 효소로의 오염이라는 것이 밝혀졌다. 12α-HSDH (예컨대 그의 단쇄형)의 재조합 생산에서, 특히 이. 콜라이 숙주 세포를 이용하는 생산에서, 12α-HSDH 자체는 실제로 정제 후에 내인성 7α HSDH-효소로 오염된다. 두 가지 효소는 사실상 동일한 서열 길이 (12α-HSDH (단쇄형) 또는 7α-HSDH의 경우에 257 또는 255 아미노산) 때문에 매우 유사한 분자량 및 또한 다르게는 실제로 정제 동안 유사한 분리 거동을 가지므로, 이러한 방식으로 생산된 12α-HSDH는 사실상 항상 7α-HSDH로 오염된다.

7β-HSDH는 또한 목적하지 않은 7α-hSDH 활성으로부터 어려움 없이 분리될 수는 없다.

본 발명에 따르면, HSDH, 예컨대 12α-HSDH 또는 7β-HSDH (7α-HSDH 활성을 더 이상 갖지 않음)의 생산은 놀랍게도 12α-HSDH 또는 다른 HSDH, 예컨대 7β-HSDH의 재조합 생산에 사용된 발현 숙주에서 단지 2차 활성의 선택적 스위칭 오프에 의해서만 달성된다.

따라서, 발현 숙주 이. 콜라이 BL21(DE3) (유전자형: F^- ompT gal dcm lon hsdS_B(r_B ^- m_B ^-) λ(DE3 [lacI lacUV5-T7 gene 1 ind1 sam7 nin5]) (노바젠(Novagen)) (문헌 [Journal of Molecular Biology (1985) 189, 113-130])은 재조합 단백질의 생산에 광범위하게 사용된다. 그러나, 본 발명에 따라 현재 밝혀진 바와 같이, 이. 콜라이 BL21(DE3)은, 예를 들어 UDCA 생산시에 목적하지 않은 부산물 리토콜산의 형성을 야기하는 NADH-의존성 7α-HSDH를 함유한다.

UDCA 생산에서, 이. 콜라이 BL21(DE3)으로부터 7α-HSDH의 결과로서의 부반응을 회피하기 위해, 내인성 7α-HSDH를 코딩하는 유전자는 예를 들어 상동성 재조합에 의해 이. 콜라이 BL21(DE3)으로부터 본 발명에 따라 첫번째로 성공적으로 녹아웃된다. 생성된 균주 이. 콜라이 BL21(DE3) Δ7α-HSDH는 UDCA의 생산에서 상기 목적하지 않은 부반응을 더 이상 일으키지 않는 12α-HSDH 생산의 재조합 생산을 허용한다.

본 발명에 따르면, UDCA의 합성은 이에 따라 7α-HSDH에 의해 촉매화되는 부반응 없이 처음으로 하기 개략적인 도시에 나타난 바와 같이 가능하게 된다. 따라서, 12α-HSDH는 CA를 선택적으로 12-케토-CDCA로 산화시킨다.

따라서, 상기 목적을 위해 제안된 해결책은, 내인성 7α-HSDH가 NADH-의존성 효소이지만, 재조합적으로 발현된 12α-HSDH가 NADPH 의존성이라는 것이 밝혀졌기 때문에 더욱 더 놀라운 것이다. 그러나, 7α-HSDH는 또한, 본 발명에 따라 밝혀진 바와 같이, NADPH의 존재 하에 및 NADH의 부재에도 불구하고 미량 활성을 나타낸다. 효소적 합성 단계가 전세포가 아닌 단리된 효소를 사용하여 수행되는 경우라해도, 이러한 미량 활성은 목적하지 않은 방식으로 가치있는 생성물 UDCA를 LCA로 오염시키기에 충분하다. 전세포를 사용하는 경우, 세포로부터의 세포 NADH의 존재 때문에, 7α-HSDH는 완전 활성이며, 이에 따라 부산물 형성이 더 추가로 급격하게 증가될 것이다.

따라서, 본 발명에 따르면, 또한 상기 효소적/화학적 합성 경로에 따른 LCA-무함유 UDCA의 생산은, 12α-HSDH-활성을 나타내지만 간섭하는 7α-HSDH 활성이 없는 재조합 전세포를 이용하여 가능하게 된다.

도 1은 콜로니 PCR의 결과를 보여준다. 특히, 1500 bp를 함유하는 밴드는 재조합에 의해 혼입된 아프라마이신 내성 유전자에 상응함을 나타낼 수 있다. 따라서, 내성이 게놈 내에 혼입되고, 7α-HSDH의 유전자는 녹아웃되었다. 트레이스 1은 DNA 마커를 나타낸다. 트레이스 2는 1500 bp를 함유하는 PCR 산물을 나타낸다.
도 2는 다양한 이. 콜라이 배양물을 사용한 콜산 (CA)의 인큐베이션의 결과를 보여준다. A: 이. 콜라이 BL21(DE3)을 사용한 콜산; B: 녹아웃 돌연변이체 이. 콜라이 BL21(DE3) Δ7α-HSDH를 사용한 콜산; C: 대조군으로서의 콜산. 다이어그램 A에서의 화살표는 이. 콜라이 BL21(DE3)에 의한 형질전환에서의 산화 생성물 (7-케토-3,12-디히드록시콜란산; 체류 시간 (RT) = 7.5분)을 나타낸다. 불순물 때문에, 7-케토-3,12-디히드록시콜란산의 영역에서의 작은 피크가 또한 녹아웃 균주 이. 콜라이 BL21(DE3)에서 나타났지만, 관측된 피크는 음성 대조군 (C)에서보다 더 크지는 않았다.
도 3은 녹아웃 기술에 의해 7α-HSDH 유전자를 스위칭 오프시키기 위한 전략을 개략적으로 설명한다. H1 및 H2는 상동성 서열을 표시하고; P1 및 P2는 프라이머를 표시한다. 유전자 A 및 C는 7α-HSDH 유전자를 플랭킹한 서열 절편을 표시한다. H1 및 H2는 둘 다 플랭킹 영역의 서열 절편일 수 있거나 (예컨대 도 3에 나타냄), 또한 예를 들어 7α-HSDH 유전자로부터의 5'- 및 3'-말단 절편을 나타낼 수 있다 (공급원: 문헌 [K. Datsenko and B. Wanner, PNAS June 6, 2000 vol. 97 no. 12 6640-6645]).

발명의 특정한 실시양태

본 발명은 특히 하기 실시양태에 관한 것이다:

1. 7α-히드록시스테로이드 데히드로게나제 (7α-HSDH)의 효소적 활성은 억제되지만, 기능적으로 상이한 히드록시스테로이드 데히드로게나제 (예컨대 3α-, 3β-, 7β-, 11α-, 11β-, 12α-, 12β-, 17α-, 17β-, 20α- 또는 20β-HSDH, 특히 3α-, 7β- 또는 12α-HSDH)의 효소적 활성은 발현가능하게 함유되어 있는 재조합 미생물.

억제된 7α-HSDH는 여기서 임의의 목적하는 보조인자 의존성, 예컨대 NADH 또는 NADPH (또는 NAD⁺ 또는 NADP⁺)에 의존성인 것으로 나타날 수 있다.

임의로, 이러한 변형된 미생물은 또한, 이것이 목적하는 HSDH 활성(들) 뿐만 아니라 HSDH와 조합하여 임의로 작용할 수 있는 다른 단백질 또는 효소, 예컨대 (하기에 보다 상세하게 설명된 바와 같이) 보조인자 재생을 보조하는 효소를 발현하도록 추가로 변형될 수 있다. 이들의 예는 효소, 예컨대 알콜 데히드로게나제 (ADH) 및 포르메이트 데히드로게나제 (FDH)이다.

특히, 본 발명은 여기서, 7α-HSDH의 효소적 활성은 억제되지만 외인성 12α-HSDH의 효소적 활성은 발현가능하게 함유되어 있는 재조합 미생물; 예컨대 특히 (예를 들어 NADH-의존성) 7α-HSDH의 내인성 효소적 활성은 억제되지만 (예를 들어 NADPH-의존성) 12α-HSDH의 효소적 활성은 발현가능하게 함유되어 있는 유형의 미생물에 관한 것이다. 근본적으로, 7α-HSDH 및 12α-HSDH는 여기서 동일하거나 상이한 보조인자 의존성을 나타낼 수 있고, 즉, 7α-HSDH 및 12α-HSDH는 둘 다 NADH 또는 NADPH (또는 NAD⁺ 또는 NADP⁺)에 의존성일 수 있다. 그러나, 7α-HSDH 및 12α-HSDH는 또한 다양한 보조인자에 의존성일 수 있고; 따라서 7α-HSDH는, 예를 들어 NADH (또는 NAD⁺)에 의존성일 수 있고, 12α-HSDH는 NADPH (또는 NADP⁺)에 의존성일 수 있거나, 또는 그 반대일 수 있다. 특히, 다양한 보조인자에 대해 의존성인 경우에, 분석적으로 검출가능한 효소 활성은 또한 각각의 경우에 다른 보조인자의 존재 하에도 관찰될 수 있다. 따라서, 예를 들어, 7α-HSDH는 NADH (또는 NAD⁺)에 의존성일 수 있지만, 또한 NADPH (또는 NADP⁺)의 존재 하에서도 분석적으로 검출가능한 효소적 활성을 나타낼 수 있다.

상기한 것은 12α-HSDH 대신에, 하나 이상의 다른 HSDH, 예컨대 3α-, 3β-, 7β-, 11α-, 11β-, 12β-, 17α-, 17β-, 20α- 및 20β-HSDH로부터 선택된 것, 예컨대 3α- 및/또는 7β-HSDH가 발현되고 임의로 단리되도록 의도되는 경우에도 상응하게 적용한다.

2. 실시양태 1에 있어서, 7α-HSDH를 코딩하는 핵산 서열이, 특히 상동성 재조합에 의해 또는 유전자 파괴에 의해 (특히 코딩된 유전자 산물의 효소 기능을 억제하는 핵산 서열의 삽입에 의해) 녹아웃된 것인 재조합 미생물.

3. 상기 실시양태 중 하나에 있어서, 7α-HSDH를 발현하는 전구체 미생물, 특히 7α-HSDH를 내인성으로 발현하는 전구체 미생물, 예컨대 에스케리키아 속의 박테리아, 특별히 이. 콜라이로부터 유래된 재조합 미생물.

4. 실시양태 3에 있어서, 이. 콜라이 BL21로부터 유래된 재조합 미생물.

5. 상기 실시양태 중 하나에 있어서, 7α-HSDH와 기능적으로 상이한 HSDH, 예컨대 특히 3α-, 7β- 및/또는 12α-HSDH를 재조합적으로 발현하는 재조합 미생물.

6. 상기 실시양태 중 하나에 있어서, 억제된 (녹아웃된) 7α-HSDH가 서열 10에 따른 아미노산 서열을 갖거나 또는 서열 9에 따른 핵산 서열에 의해 코딩된 것인 재조합 미생물.

7. 상기 실시양태 중 하나에 있어서, 7α-HSDH와 기능적으로 상이한 발현된 HSDH가 하기 아미노산 서열:

a) 서열 29 및 31로부터 선택된 3α-HSDH 서열

b) 서열 25로부터 선택된 7β-HSDH 서열

및

c) 서열 12, 14, 16으로부터 선택된 12α-HSDH 서열

중 하나를 함유하거나; 또는

d) a), b) 또는 c) 하의 상기 서열 중 하나에 대해 50% 이상 또는 60% 이상 또는 75% 이상, 특히 85% 이상, 예컨대 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성 정도를 갖는, a), b) 또는 c)로부터 유래된 HSDH를 코딩하는 아미노산 서열을 함유하는 것인

재조합 미생물.

8. 7α-HSDH의 효소적 활성이 억제된 상기 실시양태 중 하나에 따른 재조합 미생물을 목적하는 HSDH가 발현되는 조건 하에 배양하고, 이에 따라 발현된 HSDH를 단리하며, 여기서 본질적으로 어떠한 기능적 7α-HSDH도 단리된 HSDH 중에서 검출되지 않는 것인, 7α-HSDH, 예컨대 3α-, 3β-, 7β-, 11α-, 11β-, 12α-, 12β-, 17α-, 17β-, 20α- 또는 20β-HSDH, 특히 3α-, 7β- 또는 12α-HSDH와 기능적으로 상이한 목적하는 HSDH의 재조합 생산 방법.

특히, 본 발명은 여기서 특히 상기 실시양태 중 하나에 따른 재조합 미생물을 12α-HSDH가 발현되는 조건 하에 배양하고, 발현된 12α-HSDH를 단리하며, 여기서 단리된 효소는 7α-HSDH 효소에 의해 오염되지 않은 것인, 특히 NADPH-의존성 12α-HSDH의 생산에 관한 것이다.

그러나, 특히 본 발명은 여기서 또한, 상기 실시양태 중 하나에 따른 재조합 미생물을 7β-HSDH가 발현되는 조건 하에 배양하고, 발현된 7β-HSDH를 단리하며, 여기서 단리된 효소는 7α-HSDH 효소에 의해 오염되지 않은 것인, NADH- 또는 특히 NADPH-의존성 7β-HSDH의 생산에 관한 것이다.

9. 실시양태 1 내지 7 중 하나에 따른 재조합 미생물로부터 수득가능한, 7α-HSDH 효소 또는 효소 활성에 의해 오염되지 않은, 특히 NADPH-의존성 2차 활성을 갖는 NADPH-의존성 7α-HSDH 또는 NADH-의존성 7α-HSDH에 의해 오염되지 않은 재조합 HSDH, 예컨대 3α-, 3β-, 7β-, 11α-, 11β-, 12α-, 12β-, 17α-, 17β-, 20α- 또는 20β-HSDH, 특히 3α-, 7β- 또는 12α-HSDH, 특히 NADPH-의존성 7β-HSDH 또는 12α-HSDH.

10. 실시양태 9에 있어서, 실시양태 6에 따른 서열로부터 선택된 아미노산 서열, 및 이들 서열 중 하나에 대해 50% 이상 또는 60% 이상 또는 75% 이상, 특히 85% 이상, 예컨대 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성 정도를 갖는 상기 서열로부터 유래된 아미노산 서열을 포함하는 재조합 HSDH, 예컨대 3α-, 3β-, 7β-, 11α-, 11β-, 12α-, 12β-, 17α-, 17β-, 20α- 또는 20β-HSDH, 특히 3α-, 7β- 또는 12α-HSDH.

11. 스테로이드 구조의 위치 3α-, 3β-, 11α-, 11β-, 12α-, 12β-, 17α-, 17β-, 20α- 또는 20β- 중 하나 이상, 특히 스테로이드 구조의 12α-위치에 있는 히드록실 기 이외에도 스테로이드 구조의 7α-위치에 1개 이상의 추가의 히드록실 기를 함유하는 히드록시스테로이드를 실시양태 9 또는 10에 따른 3α-, 3β-, 11α-, 11β-, 12α-, 12β-, 17α-, 17β-, 20α- 또는 20β-HSDH, 특히 12α-HSDH의 존재 하에 또는 실시양태 1 내지 7 중 하나에 따른 재조합 미생물의 존재 하에 반응시키고, 형성된 하나 이상의 산화 생성물을 반응 배치로부터 임의로 단리하는, 상기 히드록시스테로이드의 선택적 효소적 산화 방법.

12. 실시양태 11에 있어서, 히드록시스테로이드가 콜산 (CA) 또는 콜산 유도체, 예컨대 특히 염, 아미드 또는 알킬 에스테르인 방법.

13. 실시양태 12에 있어서, CA 또는 그의 유도체가 반응하여 12-케토케노데옥시콜산 (12-케토-CDCA)을 제공하거나 또는 상응하는 유도체를 제공하는 것인 방법.

14. 실시양태 11 내지 13 중 하나에 있어서, 반응이 NAD(P)⁺의 존재 하에 수행되는 것인 방법.

15. 실시양태 14에 있어서, 소비된 NAD(P)⁺가 전기화학적으로 또는 효소적으로 재생되는 것인 방법.

16. a) 하기 화학식 2의 콜산 (CA)을 실시양태 9 또는 10에 따른 12α-HSDH의 존재 하에 또는 실시양태 1 내지 7 중 하나에 따른 재조합 미생물의 존재 하에 하기 화학식 3의 상응하는 12-케토케노데옥시콜산 (12-케토 CDCA)으로 산화시키고;

<화학식 2>

(상기 식에서, R은 알킬, NR¹R², H, 알칼리 금속 이온 또는 N(R³)₄ ⁺를 나타내고, 여기서 라디칼 R³은 동일하거나 상이하고 H 또는 알킬을 나타내고, 라디칼 R_a는 동일하거나 상이하고 H 또는 아실을 나타냄)

<화학식 3>

(상기 식에서, R 및 R_a는 상기 나타낸 의미를 가짐)

후속적으로

b) 화학식 3의 12-케토-CDCA를 탈산소화에 의해 반응시켜 하기 화학식 4의 케노데옥시콜산 (CDCA)를 수득하고;

<화학식 4>

(상기 식에서, R 및 R_a는 상기 나타낸 의미를 가짐)

c) 화학식 4의 CDCA를 위치 7에서 하기 화학식 5의 7-케토리토콜산 (KLCA)으로 화학적으로 산화시키고;

<화학식 5>

(상기 식에서, R 및 R_a는 상기 나타낸 의미를 가짐)

d) 화학식 5의 KLCA를 환원시키고;

e) 반응 생성물을 임의로 추가로 정제하는,

하기 화학식 1의 우르소데옥시콜산 (UDCA)의 생산 방법.

<화학식 1>

(상기 식에서, R은 상기 나타낸 의미를 가짐)

17. 실시양태 16에 있어서, R_a가 아실을 나타내는 경우, 이 아실 기가 반응 단계 b) 또는 d)를 수행한 후에 임의로 제거되는 것인 방법.

18. 실시양태 16 또는 17에 있어서, 단계 a)가 NAD(P)⁺의 존재 하에 수행되는 것인 방법.

19. 실시양태 18에 있어서, 소비된 NAD(P)⁺가 전기화학적으로 또는 효소적으로 재생되는 것인 방법.

20. 스테로이드 구조의 위치 3, 11, 12, 17 또는 20, 특히 스테로이드 구조의 위치 12 및/또는 위치 3에 있는 1개 이상의 케토 기 이외에도 스테로이드 구조의 위치 7에 1개 이상의 추가의 케토 기를 갖는 케토스테로이드를 실시양태 9 또는 10에 따른 3α-, 3β-, 7β-, 11α-, 11β-, 12α-, 12β-, 17α-, 17β-, 20α- 또는 20β-HSDH, 특히 7β-HSDH 및/또는 3α-HSDH 및/또는 12α-HSDH의 존재 하에 또는 실시양태 1 내지 7 중 하나에 따른 재조합 미생물의 존재 하에 반응시키고, 형성된 하나 이상의 환원 생성물을 반응 배치로부터 임의로 단리하는, 상기 케토스테로이드의 선택적 효소적 환원 방법.

21. a) 임의로 하기 화학식 2의 콜산 (CA)을 하기 화학식 3의 데히드로콜산 (DHCA)으로 화학적으로 산화시키고;

<화학식 2>

(상기 식에서, R은 알킬, NR¹R², H, 알칼리 금속 이온 또는 N(R³)₄ ⁺를 나타내고, 여기서 라디칼 R³은 동일하거나 상이하고 H 또는 알킬을 나타냄)

<화학식 3>

(상기 식에서, R은 상기 나타낸 의미를 가짐)

b) DHCA를 임의의 목적하는 순서로 또는 두 가지 효소의 동시 존재 하에 실시양태 9 또는 10 중 하나에 따라 7β-HSDH 및 3α-HSDH를 사용하여 하기 화학식 5의 상응하는 12-케토우르소데옥시콜산 (12-케토 UDCA)으로 환원시키고;

<화학식 5>

(상기 식에서, R은 상기 나타낸 의미를 가짐)

후속적으로

d) 화학식 5의 12-케토-UDCA를 UDCA로 화학적으로 환원시키고;

e) 반응 생성물을 임의로 추가로 정제하는,

하기 화학식 1의 우르소데옥시콜산 (UDCA)의 생산 방법.

<화학식 1>

(상기 식에서, R은 상기 나타낸 의미를 가짐)

22. 실시양태 11 내지 22 중 하나에 있어서, 효소적 산화환원 단계(들)가 (특히 효소적) 보조인자 재생 단계와 커플링되는 것인 방법.

23. 실시양태 11 내지 22 중 하나에 있어서, HSDH가 용해, 분산 또는 고정화 형태로 사용되거나; 또는 실시양태 1 내지 7 중 하나에 따른 재조합 미생물의 임의로 고정화된 전세포의 존재 하에 수행되는 방법.

발명의 추가 실시양태

1. 일반적인 정의 및 사용된 약어

스테로이드 구조의 치환기와 관련하여 본원에 사용된 상세 위치는 하기 명명법과 일치하도록 제공된다:

하기 표에서, 구조 화학식, 그의 화학 명칭 및 사용된 약어를 표 형태로 요약한다:

특정한 유전자 (예컨대 7α-HSDH 유전자)에 대한 유기체의 "녹아웃" 돌연변이체 (또는 녹아웃 균주)는 본 발명의 문맥에서 관련 유전자가 DNA 수준에서 "불활성화된" 유기체의 돌연변이체를 의미하는 것으로 이해된다. 이러한 불활성화는 가장 넓은 의미로 이해되어야 하며, 예를 들어, 적절한 구조 유전자의 핵산 서열의 완전 결실 (어떠한 단백질도 번역되지 않음) 또는 그의 부분 결실 (이에 따라 불완전 단백질이 코딩되고 번역됨)을 기초로 할 수 있으며, 이들의 기능은 본래의 구조 유전자에 의해 코딩된 단백질과 비교하여 제한되며, 특히 완전히 억제된다. 또한, 구조 유전자는, 구조 유전자의 핵산 서열을 변형시켜 1개 이상의 미성숙 정지 코돈을 리딩 프레임 내에 발생시키고, 단백질의 중요한 부분이 번역되지 않게 하는, 당업자에게 공지된 "무의미 돌연변이"에 의해 녹아웃될 수 있다. 대안적으로, 기능에 필수적인 개별 또는 다중 아미노산 (예를 들어, 효소에서 기질 결합, 촉매 중심 또는 리알로스테릭 영역에 대해 책임이 있는 아미노산, 또는 다른 단백질 또는 분자와의 결합 또는 상호작용에 책임이 있는 아미노산)이 제거되거나 또는 관련 기능의 부분 또는 완전 손실을 유도하는 아미노산에 의해 대체되는 "과오 돌연변이"가 도입될 수 있다. 또한, 1개 이상의 뉴클레오티드의 삽입이 수행될 수 있으며, 이것은 리딩 프렘임의 이동 (프레임시프트) 및 이에 따라 제한된 기능의 단백질의 발현을 유도하고, 특히 N-말단에 근접한 프레임시프트가 발생한 경우에는 완전한 기능 손실을 유도한다. 또한, 개별 단백질 (마커 단백질) (예를 들어, 항생제 내성을 유도하는 단백질)을 코딩하는 핵산을 녹아웃될 단백질의 구조 유전자 내로 삽입하는 것이 이용될 수 있고, 성공적인 녹아웃에 대한 표현형 검출로서, 삽입된 핵산의 발현에서 이용될 수 있다. 녹아웃 돌연변이체는 또한 관련 구조 유전자의 발현에 필요한 조절 영역, 예를 들어 구조 유전자의 프로모터 또는 인핸서에서 핵산의 완전 또는 부분 결실 또는 삽입의, 상기 언급된 조치에 의해 생산될 수 있다. 특히, 녹아웃은 그러나 구조 유전자의 부분 또는 완전 결실에 의해, 녹아웃될 구조 유전자의 핵산 서열 내로 마커 단백질을 위한 전사가능한 핵산 서열의 삽입에 의해, 또는 두 가지 방법의 조합에 의해 발생한다. 관련 유전자의 기능을 수행할 수 있는, 관련 유전자 또는 그의 상동체의 수많은 카피, 예를 들어 박테리아 염색체, 박테리아 염색체, 및 동시에 염색체외 요소, 예컨대 원핵 세포 내 또는 진핵 염색체의 상이한 지점에서의 플라스미드, 또는 다양한 진핵 염색체, 임의로 추가로 진핵 세포의 염색체외 DNA 상의 수많은 유전자가 유기체 또는 세포 내에 존재하는 경우, 관련 유전자의 수많은, 바람직하게는 모든 카피 또는 상동체가 이에 따라 녹아웃될 수 있다.

"내인성"은 (본원에 정의된 바와 같은) 야생형 게놈에 이미 함유되어 있는 유전자 정보, 예컨대 유전자를 의미하는 것으로 이해되어야 한다.

"외인성"은 야생형 게놈에 함유되어 있지 않은 유전자 정보, 예컨대 유전자를 의미하는 것으로 이해되어야 한다. 외인성 유전자 정보, 예를 들어 본 발명에 따른 12α-HSDH-함유 발현 단위가 야생형 균주의 게놈 내에 도입되고, 이에 따라 유전자 변형된 균주가 생산되는 경우, 이 유전자 정보는 따라서 처음으로 생산된 유전자 균주를 그의 자손과 비교시에는 내인성이지만, 이 유전자 정보를 함유하지 않은 본래의 야생형 균주와 비교시에는 외인성이다.

본 발명에 따라, 용어 "야생형"은 상응하는 출발 유기체를 의미하는 것으로 이해되어야 하고, 반드시 자연 발생 유기체에 상응할 필요는 없다.

이러한 관계에 따라, 용어 "미생물"은 본 발명에 따른 출발 미생물 (야생형) 또는 유전자 변형된 미생물, 또는 둘 다를 의미하는 것으로 이해될 수 있다.

코딩 서열이 상응하는 단백질 생성물로 영구적으로 번역되거나 또는 시간과 관련하여 (예를 들어, 유도 후) 제한되는 경우, 상기 코딩 서열은 유기체 내에 "발현가능하게" 함유된다.

본 발명의 의미 내에서 "억제"는 생물학적 기능의 부분 또는 완전 억제를 포함한다. 특히, 본 발명에 따라 특정 이유로 인해 더 이상 목적하지 않는 생물학적 기능, 예컨대 효소 활성, 예컨대 7α-HSDH의 효소적 활성이 더 이상 분석적으로 검출가능하지 않은 경우가 존재한다.

따라서, 다른 상세사항이 제공되지 않는다면, 용어 "7α-HSDH"는 NAD(P), 특히 NAD를 화학량론적으로 소비하면서 적어도 12-케토-CDCA의 7,12-디케토-LCA로의 입체특이적 및/또는 위치특이적 산화를 촉매화하는 데히드로게나제 효소를 지칭한다. 이러한 효소는 또한 EC 번호 1.1.1.159 하에 편집되어 있다. 7α-HSDH는 특히 장내 균총의 유기체, 예컨대 클로스트리디아(Clostridia), 예컨대 클로스트리디움 아브소눔(Clostridium absonum), 클로스트리디움 소르델리이(Clostridium sordellii) (문헌 [Journal of Bacteriology, 1994, 4865-4874]), 에스케리키아 콜라이(Escherichia coli) (문헌 [Journal of Bacteriology 1991, 2173-2179]), 박테로이데스 프라길리스(Bacteroides fragilis) (문헌 [Current Microbiology, 2003, 47, 475-484]) 및 브루셀라(Brucella), 유박테리움(Eubacterium)에서 발견된다. 따라서, 본 발명은 이 모든 미생물에 근본적으로 적용가능하다.

따라서, 다른 상세사항이 제공되지 않는다면, 용어 "12α-HSDH"는 NAD⁺ 또는 NADP⁺를 화학량론적으로 소비하면서 적어도 콜산 (CA)의 12-케토케노데옥시콜산 (12-케토-CDCA)으로의 입체특이적 및/또는 위치특이적 산화를 촉매화하는 데히드로게나제 효소를 지칭한다. 이러한 효소는 또한 EC 번호 1.1.1.176 하에 편집되어 있다. NADP⁺-의존성 (문헌 [Harris and Hylemon (1978) Biochim Biophys Acta 528(1): 148-57]) 뿐만 아니라 NAD⁺-의존성 대표물질 (문헌 [Macdonald et al. (1976) Biochim Biophys Acta 450(2): 142-53]) 둘 다가 존재한다. 다른 HSDH의 부재 하에서 높은 12α-HSDH 활성을 발현하는 유일하게 공지된 미생물은 클로스트리듐 종(Clostridium sp.) 군 P 균주 48-50 DSM 4029이다. 적합한 12α-HSDH 및 이들의 돌연변이체/변이체는 특히 명백하게 참고되는 본 출원인의 PCT/EP2009/002190에 상세하게 기재되어 있다.

따라서, 다른 상세사항이 제공되지 않는다면, 용어 "7β-HSDH"는 특히 NADPH를 화학량론적으로 소비하면서 적어도 DHCA의 3,12-디케토-7β-CA로의 입체특이적 및/또는 위치특이적 환원, 및 임의로 상응하는 역반응을 촉매화하는 데히드로게나제 효소를 지칭한다. 여기서 상기 효소는 천연 또는 재조합 방식으로 생산된 효소일 수 있다. 상기 효소는 원칙적으로 세포, 예를 들어 단백질 불순물과의 혼합물로, 그러나 바람직하게는 순수한 형태로 존재할 수 있다. 적합한 검출 방법은, 예를 들어 하기 섹션에 기재되어 있거나 또는 문헌으로부터 공지되어 있다 (예를 들어, 문헌 [Characterization of NADP-Dependent 7 β-hydroxysteroid Dehydrogenases from Peptostreptococcus productus and Eubacterium aerofaciens. S Hirano and N Masuda. Appl Environ Microbiol. 1982]; 그러나, 여기서 7-케토 기의 환원을 가능하게 하는, 유박테리움 아에로파시엔스(Eubacterium aerofaciens)로부터의 7β-HSDH는 검출될 수 없음). 이러한 활성의 효소는 EC 번호 1.1.1.201 하에 분류된다.

따라서, 다른 상세사항이 제공되지 않는다면, 용어 "3α-HSDH"는 특히 NADH 및/또는 NADPH를 화학량론적으로 소비하면서 적어도 13,2-디케토-7β-CA의 12-케토-UDCA로의 입체특이적 및/또는 위치특이적 환원 및 임의로 상응하는 역반응을 촉매화하는 데히드로게나제 효소를 지칭한다. 적합한 검출 방법은 예를 들어 하기 실험 섹션에 기재되어 있거나 또는 문헌으로부터 공지되어 있다. 적합한 효소는 예를 들어 코마노모나스 테스토스테로니(Comanomonas testosteroni) (예를 들어, ATCC11996)로부터 얻을 수 있다. NADPH 의존성 3α-HSDH는, 예를 들어 설치류로부터 공지되어 있고, 마찬가지로 사용가능하다 (문헌 [Cloning and sequencing of the cDNA for rat liver 3 alpha-hydroxysteroid/dihydrodiol dehydrogenase, J E Pawlowski, M Huizinga and T M Penning, May 15, 1991 The Journal of Biological Chemistry, 266, 8820-8825]). 이러한 활성의 효소는 EC 번호 1.1.1.50 하에 분류된다.

"순수한 형태" 또는 "순수한" 또는 "본질적으로 순수한" 효소는 본 발명에 따라, 통상적인 단백질 검출 방법, 예컨대 뷰렛 방법 또는 로우리(Lowry) 등의 단백질 검출 방법 (문헌 [R.K. Scopes, Protein Purification, Springer Verlag, New York, Heidelberg, Berlin (1982)]에서의 설명 참조)에 의해 측정되는 전체 단백질 함량을 기준으로 하여 80 중량% 초과, 바람직하게는 90 중량% 초과, 특히 95 중량% 초과, 및 특히 99 중량% 초과의 순도를 갖는 효소를 의미하는 것으로 이해된다.

"산화환원 등가물"은 전자 공여체 또는 전자 수용체로서 사용가능한 저분자량 유기 화합물, 예컨대 니코틴아미드 유도체, 예컨대 NAD⁺ 및 NADH⁺ 또는 그의 환원된 형태 NADH 또는 NADPH를 의미하는 것으로 이해된다. NAD(P)⁺는 본원에서 NAD⁺ 및/또는 NADP⁺을 나타내고, NAD(P)H는 NADH 및/또는 NADPH를 나타낸다. 이들은 또한 "보조인자"로 표시된다.

"콜산 화합물"은 본 발명에 따라 콜산의 탄소 골격, 특히 스테로이드 구조, 및 고리 위치 7 및 임의로 고리 위치 3 및/또는 12에서 케토 및/또는 히드록시 또는 아실옥시 기의 존재를 갖는 화합물을 의미하는 것으로 이해된다.

특정한 유형의 화합물, 예컨대 "콜산 화합물" 또는 "우르소데옥시콜산 화합물"은 특히 기본 출발 화합물 (예컨대 콜산 또는 우르소데옥시콜산)의 유도체를 의미하는 것으로 이해된다.

이러한 유도체는 "염", 예컨대 알칼리 금속 염, 예컨대 상기 화합물의 리튬, 나트륨 및 칼륨 염; 및 암모늄 염을 포함하고, 여기서 암모늄 염은 NH₄ ⁺ 염, 또는 1개 이상의 수소 원자가 C₁-C₆-알킬 라디칼로 대체될 수 있는 암모늄 염을 포함한다. 전형적인 알킬 라디칼은 특히 C₁-C₄-알킬 라디칼, 예컨대 메틸, 에틸, n- 또는 i-프로필, n-, sec- 또는 tert-부틸, 및 n-펜틸 및 n-헥실, 및 그의 단순 또는 다중 분지형 유사체이다.

본 발명에 따른 화합물의 "알킬 에스테르"는 특히 저급 알킬 에스테르, 예컨대 C₁-C₆-알킬 에스테르이다. 언급될 수 있는 비제한적 예는 메틸, 에틸, n- 또는 i-프로필, n-, sec- 또는 tert-부틸 에스테르, 또는 장쇄 에스테르, 예컨대 n-펜틸 및 n-헥실 에스테르, 및 그의 단순 또는 다중-분지형 유사체이다.

"아미드"는 특히 본 발명에 따른 산과 암모니아 또는 1급 또는 2급 모노아민과의 반응 생성물이다. 이러한 아민은 예를 들어 모노- 또는 디-C₁-C₆-알킬-모노아민이고, 여기서 알킬 라디칼은 서로 독립적으로, 예컨대 카르복실, 히드록실, 할로겐 (예컨대 F, Cl, Br, I), 니트로 및 술포네이트 기에 의해 임의로 더 치환될 수 있다.

본 발명에 따른 "아실 기"는 특히 2 내지 4개 탄소 원자를 갖는 비방향족 기, 예컨대 아세틸, 프로피오닐 및 부티릴, 및 임의로 치환된 단핵 방향족 고리인 방향족 기이고, 여기서 적합한 치환기는, 예를 들어 히드록실, 할로겐 (예컨대 F, Cl, Br, I), 니트로 및 C₁-C₆-알킬 기, 예컨대 벤조일 또는 톨루오일로부터 선택된다.

본 발명에 따라 사용되거나 생산된 히드록시스테로이드 화합물, 예컨대 콜산, 우르소데옥시콜산, 12-케토케노데옥시콜산, 케노데옥시콜산 및 7-케토리토콜산은 본 발명에 따른 방법에서 입체이성질적으로 순수한 형태로 또는 다른 입체이성질체와의 혼합물로 사용될 수 있거나 또는 이들로부터 수득될 수 있다. 그러나, 바람직하게는, 사용되거나 생산된 화합물은 필수적으로 입체이성질적으로 순수한 형태로 사용되고/되거나 단리된다.

"고정화"는 본 발명에 따라 고체, 즉 주변 액체 배지 중에 본질적으로 불용성인 담체 물질에 대한 본 발명에 따라 사용되는 생체촉매, 예컨대 7β-HSDH의 공유 또는 비공유 결합을 의미하는 것으로 이해된다.

2. 본 발명에 따라 생산될 수 있는 단백질, 특히 재조합 효소

2.1 12α-HSDH

이러한 12α-HSDH는 특히 본 출원인의 WO 2009/118176에 기재되어 있다.

본 발명에 따르면, 12α-HSDH는 특히 클로스트리디움 종으로부터 수득가능하고, 환원 조건 하에 SDS 폴리아크릴아미드 겔 전기영동 (SDS PAGE)에 의해 측정되는, 대략 26 kD 초과, 특히 대략 26.5 초과, 예컨대 대략 27 내지 30 kD 범위의 분자량을 갖는다. 이들은 특히 12α-HSDH 장쇄 버전의 경우에는 대략 29 kD 초과, 특히 대략 29.1 내지 29.5 kD, 예컨대 특히 29.359 kD, 또는 12α-HSDH 단쇄 버전의 경우에는 대략 27.8의 계산된 분자량을 갖는다. 상기 분자량 상세사항은 효소의 단백질 서브유닛의 분자량에 관한 것이고; 이에 제한되지는 않지만, 천연 단백질은, 예를 들어 특히 대략 동일한 크기의 4개의 이들 서브유닛으로 이루어진다.

특히, 이러한 단백질은 클로스트리디움 종 군 P 균주 48-50 (DSM4029)로부터 수득가능하다. 효소는 예를 들어 대략 10, 15, 20 또는 25 U/mg 초과, 예컨대 20 내지 100 U/mg, 또는 25 내지 80 U/mg 범위의 비활성으로 생산될 수 있다. 비활성의 측정은 본원에서 실험 섹션에 규정된 표준 조건 하에 수행된다.

본 발명에 따라서, 특히 하기 아미노산 서열 모티프 중 1개 이상을 포함하는 12α-HSDH가 사용된다:

a) LINN

b) RMGIFD

c) 하기로부터 선택된 N-말단 서열

d)

또는, 예컨대

로부터 유래된 서열.

또한, 본 발명에 따라 사용된 12α-HSDH 효소는, 이들이 유형 TGX₃GXG (여기서, X는 임의의 목적하는 아미노산 잔기를 나타냄)의 N-말단 서열 모티프를 (즉, 대략 1 내지 30개 아미노산 라디칼의 N-말단 끝 영역에) 함유하지 않는다는 점을 특징으로 한다.

특히,

a) 위치 +1 또는 +2에서 시작하는 각각의 경우에서, 서열 12, 14 또는 16에 따른 아미노산 서열 중 하나를 포함하거나; 또는

b) 60% 이상의 서열 동일성 백분율을 갖는, a)에 따른 서열로부터 유래된 아미노산 서열을 포함하거나; 또는

c) a) 및 b)에 따른 단백질을 코딩하는 핵산 서열에 의해 코딩되거나; 또는

d) 서열 11, 13 또는 15에 따른 코딩 핵산 서열에 의해; 또는 발현을 위해 사용되는 유기체의 각각의 코돈 사용에 적합화된, 상기 서열로부터 유래된 서열에 의해 코딩되거나; 또는

e) 60% 이상의 서열 동일성 백분율을 갖는, 서열 11, 13 또는 15에 따른 핵산 서열 중 하나로부터 유래된 코딩 서열에 의해 코딩되는

12α-HSDH가 또한 사용된다.

코돈 사용을 위한 핵산 서열의 적합화는 통상적인 방법에 따라, 예컨대 접근가능한 http://slam.bs.jhmi.edu/cgi-bin/gd/gdRevTrans.cgi 하에 수행될 수 있다.

변형된 공-기질 사용 및/또는 감소된 생성물 억제를 갖는 12α-HSDH 돌연변이체; 및 특히 서열 모티프 VLTGRNE에서 공-기질 사용을 변형시키는 하나 이상의 돌연변이를 갖는, 특히 상기 정의에 따른 12α-히드록시스테로이드 데히드로게나제로부터 유래된 돌연변이체가 사용될 수 있다. 이러한 돌연변이체의 비제한적인 예는, 이 모티프에서 다음의 아미노산 치환: G→D; R→A 중 하나 이상을 갖는 돌연변이체; 및 효소의 기질 결합 포켓을 형성하는 아미노산 라디칼의 영역에서 생성물 억제를 감소시키는 하나 이상의 돌연변이를 갖는 돌연변이체; 예컨대 서열 16의 위치 98 또는 100에 상응하는 아미노산 Q의 돌연변이를 적어도 포함하는 돌연변이체; 특히 서열 16에서 Q98H에 상응하는 돌연변이를 포함하는 돌연변이체를 포함한다.

위치 98 (서열 16을 기반으로 함)에서 추가의 가능한 아미노산 치환기는 A, N,D,C,E,G,H,M,S,T,V를 포함한다. 본 발명에 따른 12α-HSDH-HSDH의 상동성 모델을 기준으로, 여기서 치환이 생성물의 카르복실 결합의 약화를 유도한다고 가정된다. 따라서, 인접하는 위치 S100 (서열 16을 기반으로 함)은 또한 다음의 아미노산에 돌연변이되었다: A,N,D,C,Q,E,G,H,M,T,V,K.

본 발명에 따른 일군의 12α-HSDH 돌연변이체는 위치 98 또는 100 (서열 16에 따름)에서 하기로부터 선택된 1 또는 2개의 돌연변이를 포함한다:

2.2 7β-HSDH

이러한 7β-HSDH는 특히 본 출원인의 PCT/EP2010/068576에 기재되어 있고, 예컨대 특히 하기와 같다:

혐기성 박테리아, 특히 콜린셀라(Collinsella ) 속, 예컨대 균주 콜린셀라 아에로파시엔스(Collinsella aerofaciens ) DSM 3979 (ATCC 25986)로부터 얻을 수 있는, 특히 서열 25에 따른 아미노산 서열을 포함하는 7β-HSDH 및 그로부터 유래된 기능적 등가물.

콜린셀라 아에로파시엔스 DSM 3979로부터 얻을 수 있는 7β-HSDH는 특히 한가지 이상의 하기의 특성, 예컨대 2, 3, 4, 5, 6 또는 7가지, 또는 이러한 모든 특성을 특징으로 한다:

a) 분자량 (SDS 겔 전기영동): 대략 28-32 kDa, 특히 대략 29 내지 31 kDa 또는 대략 30 kDa;

b) 분자량 (특히 SDS 무함유와 같은 비-변성 조건 하의 겔 여과): 대략 53 내지 60 kDa, 특히 대략 55 내지 57 kDa, 예컨대 56.1 kDa (여기서, 본 발명에 따른 효소는 히라노(Hirano) 등 (상기 참조)에 의해 기재된 씨. 아에로파시엔스(C. aerofaciens ) ATCC25986으로부터의 45kDa의 7β-HSDH 효소와 명백히 상이함. 이것은 콜린셀라 아에로파시엔스 DSM 3979로부터의 7β-HSDH의 이량체 특성 (4차 구조)를 확인함);

c) 7-케토-LCA의 7-카르보닐 기의 7β-히드록시 기로의 입체선택적 환원;

d) pH 8.5 내지 10.5, 특히 9 내지 10의 범위의 UDCA의 산화를 위한 최적 pH;

e) pH 3.5 내지 6.5, 특히 pH 4 내지 6의 범위의 DHCA 및 7-케토-LCA의 환원을 위한 최적 pH (이에 따라, 놀랍게도 제공된 가능성은 pH의 선택에 의해 산화 (특징 d)) 및 환원 공정에 영향을 미침);

f) 본원에서 언급되는 하나 이상의 기질/보조인자에 대한 하기 표로부터의 하나 이상의 동역학적 파라미터; 각각의 경우에 하기 표에서 실제로 언급되는 값에 대하여 ±20%, 특히 ±10%, ±5%, ±3%, ±2% 또는 ±1%의 범위.

^a) 매우 낮은 활성 때문에 측정될 수 없음

^b) 1 U = 1 μmol/min

^c) 여기서, 본 발명에 따른 효소는 히라노 등 (상기 참조)에 의해 기재된 씨. 아에로파시엔스 ATCC25986으로부터의 7β-HSDH 효소와 명백히 상이하며, 이에 대해 명백하게 더 낮은 K_M 및 V_max 값 (0.4 및 0.2)이 기재되어 있고, NADPH에 대한 활성은 측정되지 않았다.

g) 카비아 포르셀루스(Cavia porcellus), 호모 사피엔스(Homo sapiens) 및 무스 무스쿨루스(Mus musculus)를 포함하는, 동물 11β-HSDH 하위군과 관련된 콜린셀라 아에로파시엔스 DSM 3979로부터의 원핵 7β-HSDH의 계통발생학적 서열 관계.

예를 들어, 본 발명에 따른 7β-HSDH는 하기 특성 또는 특성의 조합을 나타낸다; a); b); a) 및 b); a) 및/또는 b) 및 c); a) 및/또는 b) 및 c) 및 d); a) 및/또는 b) 및 c) 및 d) 및 e); a) 및/또는 b) 및 c) 및 d) 및 e) 및 f).

이러한 7β-HSDH는 7-케토스테로이드의 상응하는 7β-히드록시스테로이드로의 입체특이적 환원 (수소화), 및/또는 7-위치에서 케토 기 및 스테로이드 구조 상에 1개 이상의 추가의 케토 기를 포함하는 케토스테로이드의 상응하는 7β-히드록시스테로이드로의, 예컨대 특히 7-위치에서의 데히드로콜산 (DHCA)의 상응하는 3,12-디케토-7β-콜란산으로의 위치특이적 수소화 (환원)을 촉매화하고, 이것은 예를 들어 NADPH 의존성이다.

적합한 7β-HSDH는 서열 25 (등록 번호 ZP_01773061)에 따른 아미노산 서열 또는 상기 서열에 대해 60% 이상, 예컨대 65, 70, 75, 80, 85 또는 90 이상, 예컨대 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 99.5%의 동일성 정도를 갖는 상기 서열로부터 유래된 서열을 갖고; 임의로 추가로 하기 특성 중 하나 또는 특성의 조합을 특징으로 한다; 상기 정의에 따른 a); b); a) 및 b); a) 및/또는 b) 및 c); a) 및/또는 b) 및 c) 및 d); a) 및/또는 b) 및 c) 및 d) 및 e); a) 및/또는 b) 및 c) 및 d) 및 e) 및 f).

2.3 기타 단백질

상응하는 방식으로, 하기하는 것은 예를 들어 본 발명에 따른 7α-HSDH-억제된 미생물을 이용하여 생산될 수 있다:

3α-HSDH, 예컨대 슈도모나스 테스토스테로니(Pseudomonas testosteroni) (문헌 [J. Biol. Chem. 276 (13), 9961-9970 (2001)]) (서열 28, 29); 또는 라투스 노르베기쿠스(Rattus norvegicus) (서열 30, 31)로부터 공지됨;

3β-HSDH, 예컨대 클로스트리디움 이노쿰(Clostridium innocuum) (문헌 [Applied and Environmental Microbiology, June 1989, p. 1656-1659]) 또는 슈도모나스 테스토스테로니로부터 공지됨;

20β-HSDH, 예컨대 스트렙토미세스(Streptomyces) 속의 유기체 (문헌 [The Journal of Biological Chemistry, 1977, Vol 252 No 1, Jan 10, 205-211])로부터 공지됨;

20α-HSDH, 예컨대 클로스트리디아, 특히 클로스트리디움 신덴스(Clostridium scindens) (문헌 [Journal of Bacteriology, June 1989, p. 2925-2932]), 및 테트라히메나 피리포르미스(Tetrahymena pyriformis) (문헌 [Biochem.J. (1994) 297, 195-200])로부터 공지됨;

17β-HSDH, 예컨대 진균, 예컨대 실린드로카르폰 라디콜라(Cylindrocarpon radicola) (문헌 [J. Biochemistry 103, 1988, 1039-1044]) 및 코클리오볼루스 루나투스(Cochliobolus lunatus) (문헌 [J. Steroid Biochem. Molec.Biol. Vol 59, 1996, No. 2, p. 205-214]), 스트렙토미세스 과의 박테리아 (문헌 [Hoppe-Seyler's Z. Physiol. Chem, Vol. 356, 1975, 1843-1852]), 슈도모나스(Pseudomonas) (문헌 [The Journal of Biological Chemistry, Vol. 252 No.l l, June 10, 1977, p. 3775-3783]) 및 알칼리게네스(Alcaligenes) (문헌 [The Journal of Biological Chemistry, Vol. 260, No. 25, Nov 5, 1985, p. 13648-13655])로부터 공지됨;

17α-HSDH, 예컨대 유박테리움 종 (문헌 [Journal of Lipid Research, Vol. 35, 1994, p. 922-929])으로부터 공지됨;

또는 11β-HSDH, 예컨대 고등 포유동물로부터 공지됨.

2.4 기능적 등가물

본 발명은 HSDH 활성, 예컨대 3α-, 3β-, 7β-, 11α-, 11β-, 12α-, 12β-, 17α-, 17β-, 20α- 또는 20β-HSDH, 특히 3α-, 7β- 또는 12α-HSDH 활성을 갖는, 실제로 개시된 단백질 또는 효소에만 제한되지는 않고, 그 반대로 또한 그의 기능적 등가물로도 확장된다.

본 발명의 문맥에서 실제로 개시된 효소의 "기능적 등가물" 또는 유사체는, 또한 목적하는 생물학적 활성, 예컨대 7β- 또는 12α-HSDH 활성을 갖는, 그와는 상이한 폴리펩티드이다.

따라서, 예를 들어, "기능적 등가물"은 HSDH 활성, 예컨대 7β- 또는 12α-HSDH 활성에 대해 이용되는 시험에서 본원에 정의된 아미노산 서열을 포함하는 효소의 1% 이상, 예컨대 10% 또는 20% 이상, 예컨대 50% 또는 75% 또는 90% 이상 만큼 높거나 낮은 활성을 갖는 효소를 의미하는 것으로 이해된다. 기능적 등가물은 또한 바람직하게는 pH 4 내지 11에서 안정하고, 유리하게는 pH 6 내지 10, 예컨대 특히 8.5 내지 9.5 범위의 최적 pH, 및 15℃ 내지 80℃ 또는 20℃ 내지 70℃, 예컨대 대략 45 내지 60℃ 또는 대략 50 내지 55℃ 범위의 최적 온도를 갖는다.

HSDH 활성, 예컨대 7β- 또는 12α-HSDH 활성은 다양한 공지된 시험에 의해 검출될 수 있다. 이에 제한되지는 않지만, 실험 섹션에서 정의된 바와 같은 표준화 조건 하에서 참조 기질, 예를 들어 콜산을 사용하는 시험이 언급될 수 있다.

본 발명에 따라 "기능적 등가물"은 특히 상기 언급된 아미노산 서열 중 하나 이상의 서열 위치에서 실제로 언급된 것 이외의 상이한 아미노산을 갖지만, 그럼에도 불구하고 상기 언급된 생물학적 활성 중 하나를 갖는 "돌연변이체"를 의미하는 것으로 이해된다. 따라서, "기능적 등가물"은 1개 이상의 아미노산 첨가, 치환, 결실 및/또는 역위에 의해 수득가능한 돌연변이체를 포함하고, 여기서 언급된 변화는, 이것이 본 발명에 따른 특성 프로파일을 갖는 돌연변이체를 유도하는 한, 임의의 서열 위치에서 발생할 수 있다. 기능적 등가물은, 돌연변이체 및 미변화 폴리펩티드 사이의 반응성 패턴이 질적으로 일치하는 경우에, 즉 예를 들어 동일한 기질이 상이한 비율로 전환되는 경우에 수득된다. 적합한 아미노산 치환의 예는 다음 표에 요약된다:

상기 의미에서 "기능적 등가물"은 또한 기재된 폴리펩티드의 "전구체" 및 폴리펩티드의 "기능적 유도체" 및 "염"이다.

여기서 "전구체"는 목적하는 생물학적 활성을 갖거나 갖지 않은, 폴리펩티드의 천연 또는 합성 전구체이다.

표현 "염"은 카르복실 기의 염 뿐만 아니라 본 발명에 따른 단백질 분자의 아미노 기의 산 부가염 둘 다를 의미하는 것으로 이해된다. 카르복실 기의 염은 그 자체로 공지된 방법으로 제조될 수 있고, 무기 염, 예컨대 나트륨, 칼슘, 암모늄, 철 및 아연 염, 및 유기 염기와의 염, 예컨대 아민, 예컨대 트리에탄올아민, 아르기닌, 리신, 피페리딘 등을 포함한다. 산 부가염, 예컨대 염산 또는 황산과 같은 무기 산과의 염, 및 아세트산 및 옥살산과 같은 유기 산과의 염이 마찬가지로 본 발명의 대상이다.

본 발명에 따른 폴리펩티드의 "기능적 유도체"는 마찬가지로 공지된 기술에 의해 기능적 아미노산 측기 또는 그의 N- 또는 C-말단 끝에서 제조될 수 있다. 이러한 유도체는, 예를 들어 암모니아 또는 1급 또는 2급 아민과의 반응에 의해 수득가능한 카르복실산 기의 지방족 에스테르, 카르복실산 기의 아미드; 아실 기와의 반응에 의해 제조되는 유리 아미노 기의 N-아실 유도체; 또는 아실 기와의 반응에 의해 제조되는 유리 히드록실 기의 O-아실 유도체를 포함한다.

"기능적 등가물"은 물론 또한 다른 유기체로부터 접근가능한 폴리펩티드, 및 천연 발생 변이체를 포함한다. 예를 들어, 상동성 서열 영역의 범위는 서열 비교에 의해 결정될 수 있고, 등가의 효소는 본 발명의 실제 명세서에 따라 확인될 수 있다.

"기능적 등가물"은 마찬가지로, 예를 들어 목적하는 생물학적 기능을 갖는 본 발명에 따른 폴리펩티드의 단편, 바람직하게는 개개의 도메인 또는 서열 모티프를 포함한다.

"기능적 등가물"은 또한, 상기 언급된 폴리펩티드 서열 또는 그로부터 유래된 기능적 등가물 중 하나, 및 기능적 N- 또는 C-말단 연결에서 그와는 기능적으로 상이한 추가의 이종 서열 (즉, 융합 단백질 부분의 상호 유의한 기능적 손상이 없음)을 하나 이상 함유하는 융합 단백질이다. 이러한 이종 서열의 비제한적인 예는 예를 들어 신호 펩티드, 히스티딘 앵커 또는 효소이다.

본 발명에 따라서, 포함되는 "기능적 등가물"은 실제로 개시된 단백질에 대한 상동체이다. 이들은 문헌 [Pearson and Lipman, Proc. Natl. Acad, Sci. (USA) 85(8), 1988, 2444-2448]의 알고리즘에 따라 계산된, 실제로 개시된 아미노산 서열 중 하나에 대해 60% 이상, 바람직하게는 75% 이상, 특히 85% 이상, 예컨대 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 상동성 (또는 동일성)을 갖는다. 본 발명에 따른 상동성 폴리펩티드의 상동성 또는 동일성 백분율은 특히 본원에 실제로 기재된 아미노산 서열 중 하나의 전체 길이를 기준으로 하는 아미노산 라디칼의 동일성 백분율을 의미한다.

동일성 백분율 값은 BLAST 정렬, 알고리즘 blastp (단백질-단백질 BLAST), 또는 하기 나타낸 클러스탈(Clustal) 설정의 이용에 의해 측정될 수 있다.

가능한 단백질 글리코실화의 경우에, 본 발명에 따른 "기능적 등가물"은 탈글리코실화 또는 글리코실화 형태의 상기 기재된 유형의 단백질 및 글리코실화 패턴의 변화에 의해 수득가능한 변형된 형태를 포함한다.

본 발명에 따른 단백질 또는 폴리펩티드의 상동체는 돌연변이유발에 의해, 예를 들어 단백질의 점 돌연변이, 신장 또는 말단절단에 의해 제조될 수 있다.

본 발명에 따른 단백질의 상동체는 돌연변이체, 예컨대 말단절단 돌연변이체의 조합 은행의 스크리닝에 의해 확인될 수 있다. 예를 들어, 단백질 변이체의 다양한 은행은, 예를 들어 합성 올리고뉴클레오티드의 혼합물의 효소적 라이게이션에 의해서와 같이 핵산 수준에서 조합 돌연변이유발에 의해 생성될 수 있다. 변성 올리고뉴클레오티드 서열로부터 잠재적인 상동체의 은행을 생성하기 위해 사용될 수 있는 다수의 방법이 존재한다. 변성 유전자 서열의 화학적 합성은 DNA 합성장치에서 수행될 수 있고, 이어서 합성 유전자는 적합한 발현 벡터 내로 라이게이션될 수 있다. 변성 유전자 세트의 사용은 목적하는 잠재적인 단백질 서열 세트를 코딩하는, 혼합물 내의 모든 서열을 제조할 수 있다. 변성 올리고뉴클레오티드의 합성 방법은 당업자에게 공지되어 있다 (예를 들어, 문헌 [Narang, S.A. (1983) Tetrahedron 39:3]; [Itakura et al. (1984) Annu. Rev. Biochem. 53:323]; [Itakura et al., (1984) Science 198:1056]; [Ike et al. (1983) Nucleic Acids Res. 11:477]).

선행 기술에서, 점 돌연변이 또는 말단절단에 의해 제조된, 조합 은행의 유전자 산물의 스크리닝 및 선택된 특성을 갖는 유전자 산물에 대한 cDNA 은행의 스크리닝을 위한 다수의 기술이 공지되어 있다. 이러한 기술은 본 발명에 따른 상동체의 조합 돌연변이유발에 의해 생산된 유전자 은행을 빠르게 스크리닝하는데 적합할 수 있다. 고처리량으로의 분석에 적용되는 큰 유전자 은행의 스크리닝을 위해 가장 흔하게 이용되는 기술은 유전자 은행의 복제가능한 발현 벡터 내로의 클로닝, 생성된 벡터 은행을 이용한 적합한 세포의 형질전환, 및 목적하는 활성의 검출이, 그의 산물이 검출되는 유전자를 코딩하는 벡터의 단리를 용이하게 하는 조건 하에서의 조합 유전자의 발현을 포함한다. 은행에서 기능적 돌연변이체의 빈도를 증가시키는 기술인 재귀적 앙상블 돌연변이유발 (REM)을 스크리닝 검사와 조합하여 이용하여 상동체를 확인할 수 있다 (문헌 [Arkin and Yourvan (1992) PNAS 89:7811-7815]; [Delgrave et al. (1993) Protein Engineering 6(3):327-331]).

3. 핵산 및 구축물

3.1 핵산

본 발명은 본 발명에 따른 녹아웃 돌연변이체의 생산에 사용되는, HSDH 활성, 예컨대 3α-, 3β-, 7β-, 11α-, 11β-, 12α-, 12β-, 17α-, 17β-, 20α- 또는 20β-HSDH 활성, 특히 3α-, 7β- 또는 12α-HSDH 활성을 갖는 효소를 코딩하는 핵산 서열 또는 구축물에 관한 것이다.

본 발명은 또한 본원에 실제로 기재된 서열에 대한 특정한 정도의 동일성을 갖는 핵산에 관한 것이다.

2개 핵산 사이의 "동일성"은 하기 파라미터의 설정과 함께, 각각의 경우에 전체 핵산 길이에 걸친 뉴클레오티드의 동일성, 특히 클러스탈 방법 (문헌 [Higgins DG, Sharp PM. Fast and sensitive multiple sequence alignments on a microcomputer. Comput Appl. Biosci. 1989 Apr;5(2):151-1])을 이용하는 인포맥스(Informax) (USA)의 벡터 NTI 스위트 7.1(Vector NTI Suite 7.1) 소프트웨어에 의한 비교에 의해 계산된 동일성을 의미하는 것으로 이해된다.

다중 정렬 파라미터:

갭 시작 페널티 10

갭 확장 페널티 10

갭 분리 페널티 범위 8

갭 분리 페널티 오프

정렬 지연에 대한 % 동일성 40

잔기 특이적 갭 오프

친수성 잔기 갭 오프

전이 가중치 0

쌍방식 정렬 파라미터:

FAST 알고리즘 온

K-튜플 크기 1

갭 페널티 3

윈도우 크기 5

최적 대각선 수 5

이에 대안적으로, 동일성은 문헌 [Chenna, Ramu, Sugawara, Hideaki, Koike,Tadashi, Lopez, Rodrigo, Gibson, Toby J, Higgins, Desmond G, Thompson, Julie D. Multiple sequence alignment with the Clustal series of programs. (2003) Nucleic Acids Res 31 (13):3497-500]에 따라, 인터넷 주소: http://www.ebi.ac.uk/Tools/clustalw/index.html#에 따라 및 하기 파라미터를 이용하여 측정될 수 있다.

DNA 갭 시작 페널티 15.0

DNA 갭 연장 페널티 6.66

DNA 매트릭스 동일성

단백질 갭 시작 페널티 10.0

단백질 갭 연장 페널티 0.2

단백질 매트릭스 고넷(Gonnet)

단백질/DNA ENDGAP -1

단백질/DNA GAPDIST 4

본원에 언급된 모든 핵산 서열 (단일- 및 이중-가닥 DNA 및 RNA 서열, 예를 들어, cDNA 및 mRNA)은 그 자체로 공지된 방식으로 뉴클레오티드 빌딩 블록으로부터 화학적 합성에 의해, 예를 들어 이중 나선의 개개의 중첩된 상보적 핵산 빌딩 블록의 단편 축합에 의해 제조될 수 있다. 올리고뉴클레오티드의 화학적 합성은 예를 들어 공지된 방식으로, 포스포아미다이트 방법에 따라 수행될 수 있다 (문헌 [Voet, Voet, 2nd edition, Wiley Press New York, pages 896-897]). 합성 올리고뉴클레오티드의 첨가, 및 DNA 폴리머라제의 클레나우(Klenow) 단편 및 라이게이션 반응에 의한 갭의 충진 및 일반적인 클로닝 방법이 문헌 [Sambrook et al. (1989), Molecular Cloning: A laboratory manual, Cold Spring Harbor Laboratory Press]에 기재되어 있다.

본 발명은 또한, 상기 폴리펩티드 중 하나, 및 예를 들어 합성 뉴클레오티드 유사체를 사용하여 접근가능한 그의 기능적 등가물을 코딩하는 핵산 서열 (단일- 및 이중-가닥 DNA 및 RNA 서열, 예컨대 cDNA 및 mRNA)에 관한 것이다.

본 발명은 본 발명에 따른 폴리펩티드 또는 단백질 또는 그의 생물학적 활성 절편을 코딩하는 단리된 핵산 분자 뿐만 아니라, 예를 들어 본 발명에 따라 코딩되는 핵산의 확인 또는 증폭을 위한 혼성화 프로브 또는 프라이머로서의 용도를 위해 사용될 수 있는 핵산 단편에 관한 것이다.

본 발명에 따른 핵산 분자는 또한 코딩 유전자 영역의 3'- 및/또는 5'-말단의 비번역 서열을 함유할 수 있다.

본 발명은 또한 실제로 기재된 뉴클레오티드 서열에 상보성인 핵산 분자 또는 그의 절편을 포함한다.

본 발명에 따른 뉴클레오티드 서열은 다른 세포형 및 유기체에서 상동성 서열의 확인 및/또는 클로닝을 위해 사용될 수 있는 프로브 및 프라이머의 제조가 가능하다. 이러한 프로브 또는 프라이머는 통상적으로 "엄격한" 조건 (하기 참조) 하에 본 발명에 따른 핵산 서열의 센스 가닥 또는 상응하는 안티센스 가닥의 적어도 대략 12, 바람직하게는 적어도 대략 25, 예컨대 대략 40, 50 또는 75의 연속 뉴클레오티드에 혼성화되는 뉴클레오티드 서열 영역을 포함한다.

"단리된" 핵산 분자는 핵산의 천연 공급원에 존재하는 다른 핵산 분자로부터 분리되고, 또한 재조합 기술에 의해 제조되는 경우에는 본질적으로 다른 세포 물질 또는 배양 배지 무함유일 수 있거나, 또는 화학적으로 합성되는 경우에는 화학 전구체 또는 다른 화학물질 무함유일 수 있다.

본 발명에 따른 핵산 분자는 분자 생물학 표준 기술 및 본 발명에 따라 제공된 서열 정보에 의해 단리될 수 있다. 예를 들어, cDNA는 혼성화 프로브로서 실제로 개시된 완전 서열 중의 하나 또는 그의 절편 및 표준 혼성화 기술을 이용하여 적합한 cDNA 은행으로부터 단리될 수 있다 (예를 들어, 문헌 [Sambrook, J., Fritsch, E.F. and Maniatis, T. Molecular Cloning: A Laboratory Manual. 2. ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989]에 기재된 바와 같음). 또한, 개시된 서열 중 하나 또는 그의 절편을 포함하는 핵산 분자는 폴리머라제 연쇄 반응에 의해 단리될 수 있고, 여기서는 이 서열을 기초로 하여 제조된 올리고뉴클레오티드 프라이머가 사용된다. 이에 따라 증폭된 핵산은 적합한 벡터 내로 클로닝되고, DNA 서열 분석에 의해 특징화될 수 있다. 본 발명에 따른 올리고뉴클레오티드는 또한 표준 합성 방법에 의해, 예를 들어 자동 DNA 합성 장치를 이용하여 제조될 수 있다.

본 발명에 따른 핵산 서열 또는 그의 유도체, 이러한 서열의 상동체 또는 절편은 다른 박테리아로부터, 예를 들어 통상적인 혼성화 방법 또는 PCR 선행 기술을 이용하여, 예를 들어 게놈 또는 cDNA 은행에 의해 단리될 수 있다. 이러한 DNA 서열은 표준 조건 하에 본 발명에 따른 서열과 혼성화된다.

"혼성화"는, 표준 조건 하에서 거의 상보성인 서열에는 결합하지만 상기 조건 하에서 비-상보성 파트너 사이의 비특이적 결합은 발생시키지 않는 폴리- 또는 올리고뉴클레오티드의 능력을 의미하는 것으로 이해된다. 이를 위하여, 서열은 90 내지 100%까지 상보성일 수 있다. 서로에 특이적으로 결합할 수 있는 상보성 서열의 특성은 예를 들어 노던(Northern) 또는 서던(Southern) 블롯 기술에서 또는 PCR 또는 RT-PCR에서의 프라이머 결합에서 이점이 있다.

보존 영역을 갖는 짧은 올리고뉴클레오티드가 혼성화에 유리하게 사용된다. 그러나, 본 발명에 따른 핵산의 더욱 긴 단편 또는 전체 서열을 혼성화를 위해 사용하는 것도 가능하다. 사용된 핵산 (올리고뉴클레오티드, 상대적으로 긴 단편 또는 전체 서열)에 따라 또는 혼성화에 사용된 핵산 DNA 또는 RNA의 유형에 따라 표준 조건은 다양하다. 따라서, 예를 들어 DNA:DNA 하이브리드에 대한 용융 온도는 동일한 길이의 DNA:RNA 하이브리드의 용융 온도에 비해 약 10℃ 더 낮다.

표준 조건은, 예를 들어 핵산에 따라, 0.1 내지 5 x SSC (1 X SSC = 0.15M NaCl, 15 mM 시트르산나트륨, pH 7.2)의 농도를 갖는 수성 완충 용액에서 42 내지 58℃의 온도, 또는 추가로 50% 포름아미드의 존재 하에서, 예컨대 5 x SSC, 50% 포름아미드에서 42℃를 의미하는 것으로 이해된다. 유리하게는, DNA:DNA 하이브리드를 위한 혼성화 조건은 0.1 x SSC 및 대략 20℃ 내지 45℃, 바람직하게는 대략 30℃ 내지 45℃의 온도이다. DNA:RNA 하이브리드를 위해, 혼성화 조건은 유리하게는 0.1 x SSC 및 대략 30℃ 내지 55℃, 바람직하게는 대략 45℃ 내지 55℃의 온도이다. 혼성화를 위해 명시된 이들 온도는 일례로서 포름아미드의 부재 하에 약 100개 뉴클레오티드 길이 및 50%의 G + C 함량을 갖는 핵산을 위해 계산된 용융 온도 값이다. DNA 혼성화를 위한 실험 조건은 관련된 유전학 문헌, 예를 들어 [Sambrook et al., "Molecular Cloning", Cold Spring Harbor Laboratory, 1989]에 기재되어 있고, 예를 들어 핵산의 길이, 하이브리드의 유형 또는 G + C 함량에 의존적으로 당업자에게 공지된 식에 따라 계산될 수 있다. 당업자는 하기 문헌으로부터 혼성화에 관한 추가의 정보를 수집할 수 있다: [Ausubel et al. (eds), 1985, Current Protocols in Molecular Biology, John Wiley & Sons, New York]; [Hames and Higgins (eds), 1985, Nucleic Acids Hybridization: A Practical Approach, IRL Press at Oxford University Press, Oxford]; [Brown (ed), 1991, Essential Molecular Biology: A Practical Approach, IRL Press at Oxford University Press, Oxford].

"혼성화"는 특히 엄격한 조건 하에 수행될 수 있다. 이러한 혼성화 조건은 예를 들어 문헌 [Sambrook, J., Fritsch, E.F., Maniatis, T., in: Molecular Cloning (A Laboratory Manual), 2nd edition, Cold Spring Harbor Laboratory Press, 1989, pages 9.31-9.57] 또는 [Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6]에 기재되어 있다.

"엄격한" 혼성화 조건은 특히 다음을 의미하는 것으로 이해된다: 50% 포름아미드, 5 x SSC (750 mM NaCl, 75 mM 시트르산삼나트륨), 50 mM 인산나트륨 (pH 7.6), 5x 덴하르트(Denhardt) 용액, 10% 덱스트란 술페이트 및 20g/ml 변성, 전단된 연어 정자 DNA로 이루어진 용액 중에서 42℃에서 밤새 인큐베이션, 이어서 65℃에서 0.1x SSC를 사용하는 필터의 세척 단계.

본 발명은 또한 실제로 개시되거나 유래될 수 있는 핵산 서열의 유도체에 관한 것이다.

따라서, 본 발명에 따른 추가의 핵산 서열은 예를 들어 서열 1 내지 9, 11, 13, 15, 17 내지 22, 24, 26, 27, 28, 30 및 33 내지 37로부터 유래될 수 있고, 단일 또는 다중 뉴클레오티드의 첨가, 치환, 삽입 또는 결실에 의해 그로부터 구분되지만 목적하는 특성 프로파일을 갖는 폴리펩티드를 코딩한다.

본 발명에 따르면, 또한, "침묵" 돌연변이를 포함하거나 또는 실제로 언급된 서열에 비하여 특별한 기원 또는 숙주 유기체의 코돈 사용에 상응하도록 변형된 핵산 서열 뿐만 아니라 자연 발생 변이체, 예컨대 스플라이스 변이체 또는 그의 대립유전자 변이체가 포함된다.

본 발명은 마찬가지로 보존적 뉴클레오티드 치환에 의해 수득가능한 서열에 관한 것이다 (즉, 관련된 아미노산은 동일한 하전, 크기, 극성 및/또는 용해도의 아미노산에 의해 대체됨).

본 발명은 또한 실제로 개시된 핵산의 서열 다형성에 의해 유래된 분자에 관한 것이다. 이러한 유전자 다형성은 천연 변이 때문에 집단 내의 개체 사이에 존재할 수 있다. 이들 천연 변이는 통상적으로 유전자의 뉴클레오티드 서열에서 1 내지 5％의 변화를 생성한다.

본 발명에 따른 상기 언급된 핵산 서열의 유도체는, 예를 들어, 전체 서열 범위에 걸쳐, 유래된 아미노산 수준에서 60% 이상의 상동성, 바람직하게는 80% 이상의 상동성, 매우 특히 바람직하게는 90% 이상의 상동성을 갖는 대립유전자 변이체를 의미하는 것으로 이해된다 (아미노산 수준에서의 상동성에 대하여, 폴리펩티드를 위한 상기 실시양태가 언급될 수 있음). 유리하게는, 상동성은 서열의 하위영역보다 더 높을 수 있다.

또한, 유도체는 예를 들어 프로모터와의 융합을 의미하는 것으로 이해되어야 한다. 명시된 뉴클레오티드 서열의 상류에 위치하는 프로모터는, 그러나 프로모터의 기능성 또는 효능의 손상 없이도 하나 이상의 뉴클레오티드 교환, 하나 이상의 삽입, 역위 및/또는 결실에 의해 변형될 수 있다. 추가로, 프로모터는 그의 서열의 변형에 의해 활성이 증가될 수 있거나, 또는 외래 유기체는 더 활성 프로모터에 의해 완전히 대체될 수 있다.

또한, 기능적 돌연변이체의 제조 방법은 당업자에게 공지되어 있다.

이용된 기술에 따라, 당업자는 랜덤 또는 대안적으로 더욱 표적화된 돌연변이를 유전자 또는 대안적으로 비코딩 핵산 영역 내에 완전히 도입할 수 있고 (예를 들어, 이것은 발현의 조절을 위해 중요함), 후속적으로 유전자 은행을 제작한다. 이를 위해 필요한 분자 생물학 방법은 당업자에게 공지되어 있고, 예를 들어 문헌 [Sambrook and Russell, Molecular Cloning. 3rd Edition, Cold Spring Harbor Laboratory Press 2001]에 기재되어 있다.

유전자 변형 방법 및 이에 따른 코딩된 단백질의 변형 방법은 장기간 동안 당업자에게 익숙하였으며, 예를 들어 다음과 같다.

- 부위-특이적 돌연변이유발 (여기서, 유전자의 단일 또는 다중 뉴클레오티드는 표적화된 방식으로 대체됨) (문헌 [Trower MK (Ed.) 1996; In vitro mutagenesis protocols. Humana Press, New Jersey]),

- 포화 돌연변이유발 (여기서, 임의의 목적하는 아미노산에 대한 코돈은 유전자의 임의의 목적하는 부위에서 대체되거나 첨가될 수 있음) (문헌 [Kegler-Ebo DM, Docktor CM, DiMaio D (1994) Nucleic Acids Res 22:1593]; [Barettino D, Feigenbutz M, Valcarel R, Stunnenberg HG (1994) Nucleic Acids Res 22:541]; [Barik S (1995) Mol Biotechnol 3:1]),

- 오류-유발 폴리머라제 연쇄 반응 (오류-유발 PCR) (여기서, 뉴클레오티드 서열은 오류-유발 DNA 폴리머라제에 의해 돌연변이됨) (문헌 [Eckert KA, Kunkel TA (1990) Nucleic Acids Res 18:3739]);

- 돌연변이유발 균주에서의 유전자의 계대 (여기서, 뉴클레오티드 서열의 돌연변이 비율이, 예를 들어 결함이 있는 DNA 복구 메카니즘 때문에 증가됨) (문헌 [Greener A, Callahan M, Jerpseth B (1996) An efficient random mutagenesis technique using an E.coli mutator strain. In: Trower MK (Ed.) In vitro mutagenesis protocols. Humana Press, New Jersey]), 또는

- DNA 셔플링 (여기서, 밀접하게 관련된 유전자의 풀을 형성하고 소화시키고, 단편을 폴리머라제 연쇄 반응을 위한 주형으로서 사용하며, 최종적으로 전장의 모자이크 유전자가 반복되는 가닥 분리 및 재접근에 의해 생성됨) (문헌 [Stemmer WPC (1994) Nature 370:389]; [Stemmer WPC (1994) Proc Natl Acad Sci USA 91:10747]).

"지정된 진화" (특히, 문헌 [Reetz MT and Jaeger K-E (1999), Topics Curr Chem 200:31]; [Zhao H, Moore JC, Volkov AA, Arnold FH (1999), Methods for optimizing industrial enzymes by directed evolution, in: Demain AL, Davies JE (Ed.) Manual of industrial microbiology and biotechnology. American Society for Microbiology]에 기재됨)를 이용하여, 당업자는 또한 선택적 방식으로 및 또한 대규모로 기능적 돌연변이체를 생성할 수 있다. 여기서, 제1 단계에서 각각의 단백질의 유전자 은행을 먼저 제작하고, 예를 들어 상기 명시낸 방법을 이용할 수 있다. 유전자 은행은 적합한 방식으로, 예를 들어 박테리아 또는 파지 디스플레이 시스템에 의해 발현시킨다.

목적하는 특성에 대부분 상응하는 특성을 갖는 기능적 돌연변이체를 발현하는 숙주 유기체의 관련된 유전자를 추가 회차의 돌연변이에 적용시킬 수 있다. 돌연변이 및 선택 또는 스크리닝의 단계는 현재의 기능적 돌연변이체가 목적하는 특성을 적절한 정도로 나타낼 때까지 반복적으로 되풀이하였다. 이러한 반복적 절차에 의해, 제한된 수의 돌연변이, 예컨대 1 내지 5회 돌연변이를 단계적으로 수행하고, 관련된 효소 성질에 대한 영향에 대해 평가하고 선택할 수 있다. 이어서, 선택된 돌연변이체를 동일한 방식으로 추가의 돌연변이 단계에 적용할 수 있다. 이에 의해 조사될 개별 돌연변이체의 수가 상당히 감소될 수 있다.

본 발명에 따른 결과는 목적하는 변형된 특성을 갖는 추가의 효소를 선택적으로 생성하기 위해 필요한, 관련된 효소의 구조 및 서열에 대한 중요한 정보를 제공한다. 특히, "열점", 즉 선택된 돌연변이유발의 도입에 의해 효소 특성을 변형하기 위해 잠재적으로 적합한 서열 절편이 정의될 수 있다.

본 발명에 따른 HSDH의 이러한 열점 영역의 비제한적 예는 하기에 요약된다:

35-40, 특히 37-38 (각각의 경우에, HSDH_단쇄 (서열 14)의 아미노산 서열을 기반으로 함).

90-105, 93-100 또는 96-100, 특히 97 및/또는 98 (각각의 경우에 HSDH_단쇄 (서열 14)의 아미노산 서열을 기반으로 함)

3.2 구축물

본 발명은 또한 조절 핵산 서열의 유전자 제어 하에서 본 발명에 따른 폴리펩티드를 코딩하는 핵산 서열을 함유하는 발현 구축물; 및 하나 이상의 이러한 발현 구축물을 포함하는 벡터에 관한 것이다.

"발현 단위"는, 본 발명에 따르면, 본원에서 정의된 바와 같은 프로모터를 포함하고, 발현될 핵산 또는 유전자와의 기능적 연결 후에 발현, 즉 상기 핵산 또는 유전자의 전사 및 번역을 조절하는, 발현 활성을 갖는 핵산을 의미하는 것으로 이해된다. 따라서, 이와 관련하여 "조절 핵산 서열"이라고 지칭된다. 프로모터 외에도, 조절 요소, 예컨대 인핸서도 추가로 함유될 수 있다.

"발현 카세트" 또는 "발현 구축물"은, 본 발명에 따르면, 발현될 핵산과 기능적으로 결합되거나 또는 발현될 유전자와 기능적으로 연결된 발현 단위를 의미하는 것으로 이해된다. 따라서, 발현 단위와 달리, 발현 카세트는 전사 및 번역을 조절하는 핵산 서열 뿐만 아니라, 전사 및 번역의 결과로서 단백질로 발현되어야 하는 핵산 서열도 포함한다.

용어 "발현" 또는 "과다발현"은 본 발명의 문맥에서 상응하는 DNA에 의해 코딩되는 미생물 내의 하나 이상의 효소의 세포내 활성의 생성 또는 증가를 기재한다. 이를 위해, 예를 들어, 유전자를 유기체 내에 도입할 수 있고, 존재하는 유전자를 또 다른 유전자에 의해 대체할 수 있으며, 유전자 또는 유전자들의 카피수를 증가시킬 수 있고, 강력한 프로모터를 사용할 수 있거나, 또는 고 활성을 갖는 상응하는 효소를 코딩하는 유전자를 사용할 수 있고, 이러한 수단을 임의로 조합할 수 있다.

바람직하게는, 본 발명에 따른 구축물은 각각의 코딩 서열의 5'-상류에 있는 프로모터 및 3'-하류에 있는 터미네이터 서열 및 임의로 다른 통상적인 조절 요소, 즉 각각의 경우에 코딩 서열과 작동적으로 연결된 요소를 포함한다.

본 발명에 따라, "프로모터", "프로모터 활성을 갖는 핵산" 또는 "프로모터 서열"은 전사될 핵산과 기능적으로 연결되어 핵산의 전사를 조절하는 핵산을 의미하는 것으로 이해된다.

이와 관련하여, "기능적" 또는 "작동적" 연결은 예를 들어 프로모터 활성을 갖는 핵산 중 하나 및 전사될 핵산 서열 및 임의로 추가의 조절 요소, 예컨대 핵산의 전사를 보장하는 핵산 서열 및 예를 들어 터미네이터의 순차적 배열을 의미하는 것으로 이해되고, 각각의 조절 요소들이 핵산 서열의 전사에서 그 기능을 수행할 수 있도록 한다. 이를 위해, 화학적 의미에서의 직접적인 연결이 절대적으로 필요한 것은 아니다. 유전자 제어 서열, 예컨대 인핸서 서열이 표적 서열 상에서 추가의 제거된 위치로부터 또는 심지어 다른 DNA 분자로부터 그의 기능을 발휘할 수 있다. 전사될 핵산 서열이 프로모터 서열의 하류 (즉, 3'-말단)에 위치하여, 양쪽 서열이 서로 공유 결합되는 배열이 바람직하다. 여기서, 유전자도입으로 발현되는 프로모터 서열 및 핵산 서열 간의 거리는 200 염기 쌍 미만, 또는 100 염기 쌍 미만 또는 50 염기 쌍 미만일 수 있다.

프로모터 및 터미네이터 외에도, 표적 서열, 인핸서, 폴리아데닐화 신호, 선택 마커, 증폭 신호, 복제 기점 등이 추가의 조절 요소의 예로서 언급될 수 있다. 적합한 조절 서열은 예를 들어, 문헌 [Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA (1990)]에 기재되어 있다.

특히 본 발명에 따른 핵산 구축물은 서열 11, 13 또는 15, 또는 그의 유도체 및 상동체, 및 그로부터 유래가능한 핵산 서열을 포함하고, 이것은 유전자 발현의 제어, 예를 들어 증가를 위해 유리하게는 하나 이상의 조절 신호와 작동적으로 또는 기능적으로 연결된다.

이러한 조절 서열 외에도, 실제 구조 유전자 앞에 이들 서열의 천연 조절이 존재하고, 임의로 유전자 변형될 수 있으므로, 천연 조절이 스위칭 오프되고 유전자의 발현의 증가되었다. 그러나, 핵산 구축물은 더욱 단순하게 구성될 수 있고, 즉 어떠한 추가의 조절 신호도 코딩 서열 앞에 삽입되지 않으며, 그의 조절을 갖는 천연 프로모터가 제거되지 않는다. 이것 대신에, 천연 조절 서열을 돌연변이시켜, 조절이 더 이상이 일어나지 않고 유전자 발현이 증가되도록 한다.

또한, 바람직한 핵산 구축물은 유리하게는 하나 이상의 이미 언급된 "인핸서" 서열을 함유하고, 핵산 서열의 발현 증가가 가능해지도록 프로모터와 기능적으로 연결된다. 추가의 유리한 서열, 예컨대 추가의 조절 요소 또는 터미네이터는 DNA 서열의 3'-말단에 삽입될 수 있다. 본 발명에 따른 핵산은 구축물 내에 하나 이상의 카피로 함유될 수 있다. 구축물 내에, 추가의 마커, 예컨대 항생제 내성 또는 영양요구성-보완 유전자가 구축물에 대한 선택을 위해 임의로 함유될 수 있다.

적합한 조절 서열의 예는 그람-음성 박테리아에서 유리하게 사용되는, cos, tac, trp, tet, trp-tet, lpp, lac, lpp-lac, lacI^q,T7, T5, T3, gal, trc, ara, rhaP (rhaP_BAD)SP6, 람다-P_R과 같은 프로모터에 또는 람다-P_L 프로모터에 함유된다. 추가의 유리한 조절 서열은 예를 들어 그람-양성 프로모터 amy 및 SPO2에 및 효모 또는 진균 프로모터 ADC1, MF알파, AC, P-60, CYC1, GAPDH, TEF, rp28, ADH에 함유된다. 인공 프로모터가 또한 조절에 사용될 수 있다.

숙주 유기체에서의 발현을 위해, 핵산 구축물은 유리하게는 벡터, 예컨대 숙주에서 유전자의 최적의 발현을 가능하게 하는 플라스미드 또는 파지 내에 삽입된다. 플라스미드 및 파지와는 별개로, 벡터는 당업자에게 공지된 모든 다른 벡터, 즉 예를 들어 바이러스, 예컨대 SV40, CMV, 바큘로바이러스 및 아데노바이러스, 트랜스포손, IS 요소, 파스미드, 코스미드, 및 선형 또는 원형 DNA를 의미하는 것으로 이해된다. 이들 벡터는 숙주 유기체에서 자율 복제되거나 또는 염색체 복제될 수 있다. 이러한 벡터는 본 발명의 추가의 실시양태이다.

적합한 플라스미드는 예를 들어 이. 콜라이에서 pLG338, pACYC184, pBR322, pUC18, pUC19, pKC30, pRep4, pHS1, pKK223-3, pDHE19.2, pHS2, pPLc236, pMBL24, pLG200, pUR290, pIN-III¹¹³-B1, λgt11 또는 pBdCI, 스트렙토미세스에서 pIJ101, pIJ364, pIJ702 또는 pIJ361, 바실루스(Bacillus)에서 pUB110, pC194 또는 pBD214, 코리네박테리움(Corynebacterium)에서 pSA77 또는 pAJ667, 진균에서 pALS1, pIL2 또는 pBB116, 효모에서 2알파M, pAG-1, YEp6, YEp13 또는 pEMBLYe23, 또는 식물에서 pLGV23, pGHlac⁺, pBIN19, pAK2004 또는 pDH51이다. 언급된 플라스미드는 가능한 플라스미드의 일부 선택을 나타낸다. 추가의 플라스미드는 당업자에게 공지되어 있으며, 예를 들어 문헌 [Cloning Vectors (Eds. Pouwels P. H. et al. Elsevier, Amsterdam-New York-Oxford, 1985, ISBN 0 444 904018)]으로부터 취해질 수 있다.

벡터의 추가의 실시양태에서, 본 발명에 따른 핵산 구축물 또는 본 발명에 따른 핵산을 함유하는 벡터는 또한 유리하게는 선형 DNA의 형태로 미생물 내로 도입될 수 있고, 이종 또는 상동성 재조합에 의해 숙주 유기체의 게놈 내로 통합될 수 있다. 이러한 선형 DNA는 선형화 벡터, 예컨대 플라스미드 또는 단지 본 발명에 따른 핵산 구축물 또는 핵산으로 구성될 수 있다.

유기체에서 이종 유전자의 최적의 발현을 위하여, 유기체에서 사용되는 특정 "코돈 사용빈도"에 상응하는 핵산 서열을 변화시키는 것이 유리하다. "코돈 사용빈도"는 관련된 유기체의 다른 공지된 유전자의 컴퓨터 분석에 의해 용이하게 결정될 수 있다.

본 발명에 따른 발현 카세트의 제작은 적합한 코딩 뉴클레오티드 서열 및 터미네이터 또는 폴리아데닐화 신호와 적합한 프로모터와의 융합에 의해 수행된다. 이를 위해, 예를 들어 문헌 [T. Maniatis, E.F. Fritsch and J. Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1989)] 및 [T.J. Silhavy, M.L. Berman and L.W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1984)] 및 [Ausubel, F.M. et al., Current Protocols in Molecular Biology, Greene Publishing Assoc. and Wiley Interscience (1987)]에 기재되어 있는 바와 같은 통상적인 재조합 및 클로닝 기술을 이용한다.

재조합 핵산 구축물 또는 유전자 구축물은 적합한 숙주 유기체에서의 발현을 위해 숙주 내에서 유전자의 최적의 발현을 가능하게 하는 숙주-특이적 벡터 내로 유리하게 삽입된다. 벡터는 당업자에게 널리 공지되어 있으며, 예를 들어 문헌 ["Cloning Vectors" (Pouwels P. H. et al., ed, Elsevier, Amsterdam-New York-Oxford, 1985)]으로부터 취해질 수 있다.

4. 미생물

조성에 따라, 용어 "미생물"은 출발 미생물 (야생형) 또는 유전자 조작된 재조합 미생물, 또는 둘 다를 의미하는 것으로 이해될 수 있다.

본 발명에 따른 벡터에 의해, 예를 들어 본 발명에 따른 하나 이상의 벡터로 형질전환된 재조합 녹아웃 미생물이 생산될 수 있고, 본 발명에 따른 폴리펩티드의 생성을 위해 사용될 수 있다. 유리하게는, 상기 기재된 본 발명에 따른 재조합 구축물은 적합한 숙주 시스템 내로 도입되고 발현된다. 여기서, 당업자에게 공지되어 있는 통상적인 클로닝 및 형질감염 방법, 예를 들어 공침전, 원형질체 융합, 전기천공, 레트로바이러스 형질감염 등을 바람직하게 이용하여, 언급된 핵산을 각각의 발현 시스템에서 발현시킨다. 적합한 시스템은 예를 들어 문헌 [Current Protocols in Molecular Biology, F. Ausubel et al., ed., Wiley Interscience, New York 1997], 또는 [Sambrook et al. Molecular Cloning: A Laboratory Manual. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989]에 기재되어 있다.

본 발명에 따른 핵산 또는 핵산 구축물에 적합한 재조합 숙주 유기체는 원칙적으로 모두 원핵 또는 진핵 유기체이다. 유리하게는, 미생물, 예컨대 박테리아, 진균 또는 효모가 숙주 유기체로서 사용된다. 유리하게는, 그람-양성 또는 그람-음성 박테리아, 바람직하게는 엔테로박테리아세아에(Enterobacteriaceae), 슈도모나다세아에(Pseudomonadaceae), 리조비아세아에(Rhizobiaceae), 스트렙토미세타세아에(Streptomycetaceae) 또는 노카르디아세아에 (Nocardiaceae) 과의 박테리아, 특히 바람직하게는 에스케리키아, 슈도모나스, 스트렙토미세스, 노카르디아(Nocardia), 부르크홀데리아(Burkholderia), 살모넬라(Salmonella), 아그로박테리움(Agrobacterium), 클로스트리디움 또는 로도코쿠스(Rhodococcus) 속의 박테리아가 사용된다. 에스케리키아 콜라이 속 및 종이 매우 특히 바람직하다. 추가의 유리한 박테리아는 또한 알파-프로테오박테리아, 베타-프로테오박테리아 또는 감마-프로테오박테리아의 군으로부터 발견될 수 있다.

본 발명에 따른 숙주 유기체 또는 숙주 유기체들은 여기서 바람직하게는 상기 정의에 따라, HSDH 활성, 예컨대 3α-, 3β-, 7β-, 11α-, 11β-, 12α-, 12β-, 17α-, 17β-, 20α-, 또는 20β-HSDH 활성, 특히 3α-, 7β- 또는 12α-HSDH 활성을 갖는 효소를 코딩하는, 본 발명에 기재된 핵산 서열, 핵산 구축물 또는 벡터 중 하나 이상을 함유한다.

본 발명에 따른 방법에 사용되는 유기체를 숙주 유기체에 따라 당업자에게 공지된 방식으로 각각 배양하거나 성장시킨다. 미생물은 일반적으로 주로 당 형태의 탄소 공급원, 주로 유기 질소원 형태의 질소 공급원, 예컨대 효모 추출물, 또는 염, 예컨대 황산암모늄, 미량 원소, 예컨대 철, 망가니즈 및 마그네슘 염 및 임의로 비타민을 함유하는 액체 배지 중에서 0℃ 내지 100℃, 바람직하게는 10℃ 내지 60℃의 온도에서 산소 폭기와 함께 배양된다. 여기서, 영양액의 pH는 배양 동안 조절되거나 조절되지 않는 고정값으로 유지될 수 있다. 배양은 "배치"-식으로, "반 배치"-식으로 또는 연속식으로 수행할 수 있다. 영양소는 발효 출발 시에 도입될 수 있거나, 도는 후속적으로 반-연속식으로 또는 연속식으로 공급될 수 있다.

5. UDCA의 효소적/화학적 생산

5.1 산화적 방법

이는, 예를 들어 본 출원인의 WO 2009/118176에 기재되어 있다.

담석증의 의학적 치료를 위해, 수년 동안, 특히 활성 물질 우르소데옥시콜산 (UDCA) 및 연관된 부분입체이성질체 케노데옥시콜산 (CDCA)이 사용되어 왔다. 상기 두 화합물은 7 C 원자 상에 있는 히드록실 기의 배위 만이 상이하다 (UDCA: β-배위, CDCA: α-배위). 상업적인 양의 UDCA의 생산을 위해, CDCA가 원료로서 사용되는 방법이 이전에 바람직하게 이용되어 왔다. 바람직하게는 CDCA는 다시 콜산 (CA)으로부터 제조된다.

5.1.1 CDCA 생산

배타적 화학적 방법에 대한 대안으로서, 본 발명에 따라, CA의 12-케토케노데옥시콜산 (12-케토-CDCA, CAS 2458-08-4) (이어서, 이것은 CDCA로 추가로 전환됨)으로의 효소-촉매화 산화가 제공된다. 이러한 합성 경로는 단지 2 단계만을 포함하고, 따라서 순수한 화학적 경로와 비교하여 명백히 더욱 단순하게 수행되는 것이다.

제1 단계: 효소적 산화

제2 단계: 탈산소화

단계 1에 따르면, 콜산은 12α-HSDH에 의해 NADP⁺-의존적으로 12-케토케노데옥시콜산 (12-케토-CDCA)으로 산화된다. 이러한 반응은 가역적이다. 12α-HSDH는 효소 부류 1.1.1.176에 속하고, 클로스트리디움 속의 박테리아에서 주로 발견된다.

상기 효소적 산화는 본 발명에 따라 바람직하게는 본 발명에 따른 12α-HSDH (장쇄 또는 단쇄 버전)에 의해 수행되고, 보조인자 재생은 ADH, 예를 들어 ADH ms 또는 ADH t에 의해 수행된다.

단계 2에 따른 탈산소화는 전통적인 화학적 볼프-키쉬너(Wolff-Kishner) 환원이고, 상기 기재된 CDCA III의 탈산소화와 유사하게 수행된다. 이러한 경로의 주요 장점은, 효소의 선택성으로 인해 불순물 리토콜산이 형성되지 않는다는 것이다.

5.1.2 CDCA의 UDCA로의 반응

상기 CDCA는 UDCA (CAS 128-13-2)를 위한 원료로서 사용된다. 제1 합성 단계에서, CDCA의 위치 7에 있는 히드록실 기를 상응하는 케톤으로 산화시킨다. 7-케토리소콜산 (3α-히드록시-7-케토콜란산, 간단하게: KLCA, CAS 4651-67-6)이 생산된다. 제2 단계에서는, 위치 7에 있는 케토 기의 위치선택적 환원이 이어진다. 그 목적은, 가능한 한 높은 부분입체선택성을 갖는 UDCA를 수득하는 것이다. 일반적으로, 환원 직후의 UDCA는 여전히 약간의 퍼센트의 부분입체이성질체 CDCA를 함유한다. 활성 물질 UDCA에 도달하기 위해, 조 UDCA를 제3 단계에서 정제해야만 한다.

제1 단계: 산화

제2 단계: 환원

제3 단계: 정제

조 UDCA → 순수한 UDCA

CDCA의 산화는 수성 차아염소산나트륨 용액으로 통상적으로 수행된다. 문헌에서, 제2크롬산 산화가 또한 대안으로서 발견된다. KLCA는 고체로서 수득되고, 이어서 이것은 제2 단계에서 추가로 가공된다. 환원은 알콜 중에서 나트륨 금속을 사용하여 수행될 수 있다. 약 85 : 15의 UDCA : CDCA 조성을 갖는 조 생성물이 생성된다. 대안적 방법에서, KLCA를 염기, 예컨대 칼륨 t-부틸레이트 또는 수산화칼륨과 함께 용매로서의 알콜 (예컨대, 지방족 알콜) 중에서 니켈 촉매 (라니(Raney) 니켈) 상에서 수소를 사용하여 환원시킨다 (EP-A-0 230 085). 추가로, 칼륨 및 리튬을 사용한 환원 (나트륨보다 더 높은 선택성, 문헌 [C. Giordano et al., Angew.Chem. 1985, 97, 510], 및 아연을 사용한 환원 (ES 489661) 및 전기화학적 환원 (US 4 547 271)이 추가로 가능하다.

조 UDCA의 순수한 UDCA로의 정제는 부분입체이성질체 염의 분리를 포함한다. 이것은 UDCA의 적합한 염의 제조, 단리 및 후속 절단에 의해 수행된다. 하기 대안적 정제 방법이 문헌에 언급되어 있다: 상응하는 UDCA 에스테르의 제조, 재결정화 및 절단 (EP-A-0 386 538), 추출 (JP 60006699) 및 크로마토그래피 방법 (IT 2000MI1177).

5.2 환원적 방법

이러한 방법은, 예를 들어 본 출원인의 PCT/EP2010/068576에 기재되어 있다.

5.2.1 CA의 DHCA로의 화학 반응

CA의 히드록실 기는 전형적인 화학적 경로에서 그 자체로 공지된 방식으로 산성 용액 (예를 들어 H₂SO₄) 중 크로뮴산 또는 크로메이트를 사용하여 카르보닐 기로 산화된다. 이에 따라, DHCA가 생성된다.

5.2.2 DHCA의 12-케토-UDCA로의 효소적 또는 미생물적 반응

수용액 중에서, DHCA는 구체적으로 NADPH 또는 NADH의 존재 하에 3α-HSDH 및 7β-HSDH 또는 그의 돌연변이체에 의해 12-케토-UDCA로 환원된다. 보조인자 NADPH 또는 NADH는 알콜 데히드로게나제 (ADH) 또는 포르메이트 데히드로게나제 (FDH) 또는 글루코스 데히드로게나제 (GDH) 또는 그의 돌연변이체에 의해 및 이소프로판올 또는 포름산나트륨 또는 글루코스의 존재 하에 재생될 수 있다. 상기 반응은 온화한 조건 하에 진행한다. 예를 들어, 상기 반응은 pH = 6 내지 9, 특히 대략 pH = 8에서 및 대략 10 내지 30, 15 내지 25 또는 대략 23℃에서 수행될 수 있다. 3α-HSDH 및 7β-HSDH는 여기서 단계적으로, 즉 임의의 목적하는 순서로 연속적으로, 또는 또한 동시에, 즉 조합물로 사용될 수 있다.

미생물적 반응 단계의 경우에, 필요한 효소 활성(들)이 발현되는 재조합 미생물은 적합한 액체 배지 중에서 반응시킬 기질 (DHCA)의 존재 하에 혐기적으로 또는 호기적으로 배양될 수 있다. 적합한 배양 조건은 당업자에게 그 자체로 공지되어 있다. 이들은, 예를 들어, 5 내지 10 또는 6 내지 9의 pH 범위에서, 10 내지 60, 15 내지 45 또는 25 내지 40의 범위 또는 37℃의 온도에서의 반응을 포함한다. 적합한 배지는, 예를 들어 LB 및 TB 배지를 포함한다. 반응 시간은 여기서, 예를 들어, 배치식으로 또는 연속적으로, 또는 다른 통상적 변형 방법 (상기에서 기재된 바와 같음)으로 수행할 수 있다. 여기서 반응 시간은, 예를 들어 수분 내지 수시간 또는 수일의 범위일 수 있고, 예를 들어 1 h 내지 48 h일 수 있다. 임의로, 효소 활성이 연속적으로 발현되지 않는 경우에, 이것은 예를 들어 대략 OD₆₀₀ = 0.5 내지 1.0의 표적 세포 밀도에 도달한 후에, 적합한 유도제의 첨가에 의해 유도될 수 있다.

5.2.3: 12-케토-UDCA의 UDCA로의 화학 반응

12-케토-UDCA의 12-카르보닐 기는 그 자체로 공지된 방식으로 볼프-키쉬너 환원에 의해 제거되고, 이에 의해 UDCA가 12-케토-UDCA로부터 생성된다. 상기 반응에서, 상기 카르보닐 기는 먼저 히드라진을 히드라존으로 전환시킨다. 후속적으로, 히드라존을 염기 (예를 들어, KOH)의 존재 하에 200℃로 가열하고, 여기서 질소는 제거되고, UDCA가 형성된다.

6. HSDH의 재조합 생산

본 발명은 또한 HSDH-생산 녹아웃 미생물을 배양하고, 폴리펩티드의 발현을 임의로 유도하고, 이들을 배양물로부터 단리하는, HSDH, 예컨대 3α-, 3β-, 7β-, 11α-, 11β-, 12α-, 12β-, 17α-, 17β-, 20α- 또는 20β-HSDH, 특히 3α-, 7β- 또는 12α-HSDH, 또는 이들의 기능적, 생물학적 활성 단편의 재조합 생산을 포함한다. 따라서, 이것이 목적된다면, 폴리펩티드는 또한 대량의 산업적 규모로 생산될 수 있다.

본 발명에 따라 생산된 녹아웃 미생물은 배치 방법 (배치 배양), 또는 유가식 방법 (유가식 공정) 또는 반복된 유가식 방법 (반복적 유가식 공정)에서 연속적으로 또는 배치식으로 배양될 수 있다. 공지된 배양 방법과 관련된 요약은 문헌 [Bioprozesstechnik 1. Einfuehrung in die Bioverfahrenstechnik [Bioprocess technology 1. Introduction to bioprocess technology] (Gustav Fischer Verlag, Stuttgart, 1991)] 또는 문헌 [Storhas (Bioreaktoren und periphere Einrichtungen [Bioreactors and peripheral devices] (Vieweg Verlag, Brunswick/Wiesbaden, 1994)]에서 발견될 수 있다.

사용된 배양 배지는 적합하게는 각각의 균주의 요건을 만족시켜야 한다. 다양한 미생물의 배양 배지에 대한 기재는 편람 ["Manual of Methods for General Bacteriology" of the American Society for Bacteriology (Washington D. C., USA, 1981)]에 포함된다.

본 발명에 따라 사용될 수 있는 이러한 배지는 보통 하나 이상의 탄소 공급원, 질소 공급원, 무기 염, 비타민 및/또는 미량 원소를 포함한다.

바람직한 탄소 공급원은 당, 예를 들어 모노-, 디- 또는 폴리사카라이드이다. 매우 우수한 탄소 공급원은, 예를 들어 글루코스, 프룩토스, 만노스, 갈락토스, 리보스, 소르보스, 리불로스, 락토스, 말토스, 수크로스, 라피노스, 전분 또는 셀룰로스이다. 당은 또한 착체 화합물, 예컨대 당밀 또는 당 정제의 다른 부산물에 의해 배지에 첨가될 수 있다. 또한, 다양한 탄소 공급원의 혼합물을 첨가하는 것이 유리할 수 있다. 다른 가능한 탄소 공급원은 오일 및 지방, 예컨대 대두 오일, 해바라기 오일, 땅콩 오일 및 코코넛 지방, 지방산, 예컨대 팔미트산, 스테아르산 또는 리놀레산, 알콜, 예컨대 글리세롤, 메탄올 또는 에탄올, 및 유기 산, 예컨대 아세트산 또는 락트산이다.

질소 공급원은 보통 유기 또는 무기 질소 화합물, 또는 이들 화합물을 함유하는 물질이다. 예시적인 질소 공급원은 암모니아 기체 또는 암모늄 염, 예컨대 황산암모늄, 염화암모늄, 인산암모늄, 탄산암모늄 또는 질산암모늄, 질산염, 우레아, 아미노산 또는 복합 질소 공급원, 예컨대 옥수수 침지수, 대두분, 대두 단백질, 효모 추출물, 고기 추출물 등을 포함한다. 질소 공급원이 개별적으로 또는 혼합물로서 사용될 수 있다.

배지에 함유될 수 있는 무기 염 화합물은 칼슘, 마그네슘, 나트륨, 코발트, 몰리브데넘, 칼륨, 망가니즈, 아연, 구리 및 철의 클로라이드, 인 또는 술페이트 염을 포함한다.

황 공급원으로서, 무기 황-함유 화합물, 예컨대 술페이트, 술파이트, 디티오나이트, 테트라티오네이트, 티오술페이트, 술피드, 및 또한 유기 황 화합물, 예컨대 메르캅탄 및 티올이 사용될 수 있다.

인 공급원으로서, 인산, 인산이수소칼륨 또는 인산수소이칼륨 또는 상응하는 나트륨-함유 염이 사용될 수 있다.

킬레이트화제는 용액 중에 금속 이온을 유지하기 위해 배지에 첨가될 수 있다. 특히 적합한 킬레이트화제는 디히드록시페놀, 예컨대 카테콜 또는 프로토카테쿠에이트, 또는 유기 산, 예컨대 시트르산을 포함한다.

본 발명에 따라 사용되는 발효 배지는 통상적으로 다른 성장 인자, 예컨대 비타민 또는 성장 프로모터를 함유하며, 이것은 예를 들어 비오틴, 리보플라빈, 티아민, 폴산, 니코틴산, 판토테네이트 및 피리독신을 포함한다. 성장 인자 및 염은 종종 복합 배지 성분, 예컨대 효모 추출물, 당밀, 옥수수 침지수 등으로부터 유래한다. 또한, 적합한 전구체를 배양 배지에 첨가할 수 있다. 배지 화합물의 정확한 조성은 각각의 실험에 강하게 의존적이고, 각각의 구체적인 경우에 대해 개별적으로 결정된다. 배지 최적화에 대한 정보는 문헌 ["Applied Microbiol. Physiology, A Practical Approach" (ed. P.M. Rhodes, P.F. Stanbury, IRL Press (1997) pp. 53-73, ISBN 0 19 963577 3)]으로부터 얻을 수 있다. 성장 배지는 또한 상업적 공급업체, 예컨대 스탠다드(Standard) 1 (머크(Merck)) 또는 BHI (브레인 하트 인퓨전(Brain heart infusion), DIFCO) 등으로부터 입수가능할 수 있다.

모든 배지 성분은 열 (1.5 bar 및 121℃에서 20분)에 의해 또는 멸균 여과에 의해 멸균된다. 성분들은 함께, 또는 필요한 경우에는 개별적으로 멸균될 수 있다. 모든 배지 성분은 배양 출발시에 존재할 수 있거나, 또는 연속적으로 또는 배치식으로 임의로 첨가될 수 있다.

배양 온도는 통상적으로 15℃ 내지 45℃, 바람직하게는 25℃ 내지 40℃이고, 실험 동안 일정하게 유지되거나 또는 변화될 수 있다. 배지의 pH는 5 내지 8.5의 범위, 바람직하게는 약 7.0이어야 한다. 배양을 위한 pH는 배양 동안 염기성 화합물, 예컨대 수산화나트륨, 수산화칼륨, 암모니아 또는 암모니아수, 또는 산성 화합물, 예컨대 인산 또는 황산의 첨가에 의해 제어될 수 있다. 기포 발생을 제어하기 위해, 소포제, 예컨대 지방산 폴리글리콜 에스테르가 사용될 수 있다. 플라스미드의 안정성을 유지하기 위해, 적합한 선택적 작용 물질, 예컨대 항생제를 배지에 첨가할 수 있다. 호기성 조건을 유지하기 위해, 산소 또는 산소-함유 기체 혼합물, 예컨대 주위 공기를 배양물 내에 도입한다. 배양 온도는 일반적으로 20℃ 내지 45℃이다. 목적 생성물의 최대가 형성될 때까지 배양을 계속한다. 이러한 목적은 일반적으로 10시간 내지 160시간 내에 달성된다.

후속적으로, 발효 브로쓰를 추가로 처리한다. 요건에 따라, 바이오매스는, 분리 방법, 예컨대 원심분리, 여과, 경사분리 또는 이러한 방법의 조합에 의해 발효 브로쓰로부터 완전히 또는 부분적으로 제거되거나 또는 그 안에 완전히 남겨질 수 있다.

폴리펩티드가 배양 배지 내로 분비되지 않는 경우에는, 세포를 파괴시키고, 생성물을 공지된 단백질 단리 방법에 따라 용해물로부터 수득할 수 있다. 상기 세포를 고주파 초음파에 의해, 고압, 예컨대 프렌치 가압 셀에서의 고압에 의해, 삼투압에 의해, 세제, 용해 효소 또는 유기 용매의 작용에 의해, 균질화기에 의해 또는 열거된 다수의 방법의 조합에 의해 임의로 파괴시킬 수 있다.

폴리펩티드의 정제는 공지된 크로마토그래피 방법, 예컨대 분자체 크로마토그래피 (겔 여과), 예컨대 Q-세파로스 크로마토그래피, 이온-교환 크로마토그래피 및 소수성 크로마토그래피를 이용하고, 기타 통상적인 방법, 예컨대 한외여과, 결정화, 염석, 투석 및 천연 겔 전기영동을 이용하여 달성될 수 있다. 적합한 방법은 예를 들어 문헌 [Cooper, F. G., Biochemische Arbeitsmethoden [Biochemical Working Methods], Verlag Walter de Gruyter, Berlin, New York] 또는 [Scopes, R., Protein Purification, Springer Verlag, New York, Heidelberg, Berlin]에 기재되어 있다.

재조합 단백질의 단리를 위해, 결정된 뉴클레오티드 서열에 의해 cDNA를 연장시키고, 따라서 예를 들어 더 간단한 정제를 위해 사용되는 변형된 폴리펩티드 또는 융합 단백질을 코딩하는 벡터 시스템 또는 올리고뉴클레오티드를 사용하는 것이 유리할 수 있다. 이러한 유형의 적합한 변형은, 예를 들어 앵커로서 작용하는 "태그", 예컨대 항체의 항원으로서 인식될 수 있는 헥사-히스티딘 앵커로서 공지된 에피토프의 변형이다 (예를 들어, 문헌 [Harlow, E. and Lane, D., 1988, Antibodies: A Laboratory Manual. Cold Spring Harbor (N.Y.) Press)]에 기재됨). 이러한 앵커는, 예를 들어 크로마토그래피 칼럼 내로 충진될 수 있거나 또는 마이크로타이터 플레이트 또는 또 다른 담체 상에서 사용될 수 있는 고체 담체, 예컨대 중합체 매트릭스에 단백질을 부착시키는데 사용될 수 있다.

동시에, 상기 앵커는 또한 단백질의 인식을 위해 사용될 수 있다. 단백질의 인식을 위해, 통상적인 마커, 예컨대 형광 염료, 기질과의 반응 후에 검출가능한 반응 생성물을 형성하는 효소 마커, 또는 방사성 마커는 단독으로 또는 단백질의 유도체화를 위한 앵커와 조합하여 사용될 수 있다.

효소 고정화

본 발명에 따른 효소는 유리 또는 고정화 형태로 본원에 기재된 방법에 사용될 수 있다. 고정화 효소는 불활성 담체에 고정된 효소를 의미하는 것으로 이해된다. 적합한 담체 물질 및 그 위에 고정화된 효소는 EP-A-1149849, EP-A-1 069 183 및 DE-A 100193773, 및 그에 인용된 참고문헌으로부터 공지되어 있다. 이러한 관점에서 이들 명세서의 개시내용을 충분히 참고한다. 적합한 담체 물질은 예를 들어 점토, 점토 미네랄, 예컨대 카올리나이트, 규조토, 펄라이트, 산화규소, 산화알루미늄, 탄산나트륨, 탄산칼슘, 셀룰로스 분말, 음이온 교환 물질, 합성 중합체, 예컨대 폴리스티렌, 아크릴 수지, 페놀-포름알데히드 수지, 폴리우레탄 및 폴리올레핀, 예컨대 폴리에틸렌 및 폴리프로필렌을 포함한다. 담체 물질은 지지된 효소의 제조를 위해 통상적으로 미분된 미립자 형태로 사용되고, 여기서 다공성 형태가 바람직하다. 담체 물질의 입자 크기는 통상적으로 5 mm 이하, 특히 2 mm 이하 (체 라인)이다. 유사하게, 전세포 촉매로서의 데히드로게나제 사용 시, 유리 또는 고정화 형태가 선택될 수 있다. 담체 물질은 예를 들어 Ca 알기네이트 및 카라기난이다. 또한, 세포와 같이 효소도 글루타르알데히드와 직접 가교결합될 수 있다 (CLEA에 대한 가교결합). 상응하는 추가의 고정화 방법은 예를 들어 [J. Lalonde and A. Margolin "Immobilization of Enzymes" in K. Drauz and H. Waldmann, Enzyme Catalysis in Organic Synthesis 2002, Vol.III, 991-1032, Wiley-VCH, Weinheim]에 기재되어 있다.

8. 녹아웃 돌연변이체의 제작

녹아웃 방법, 예를 들어 핵산 또는 핵산 서열의 결실 또는 삽입 방법은 당업자에게 공지되어 있고, 예를 들어 올리고뉴클레오티드 프라이머 및 PCR를 이용하는 통상적인 방법, 및 플라스미드 및 제한 효소 (이것에 의해 목적하는 변형된 핵산 서열을 플라스미드 내에 통합시킬 수 있음)를 이용하는 방법을 포함한다. 상기 및 기타 분자 유전적 방법이 일반적으로 공지되어 있고, 예를 들어, 문헌 [T. Maniatis, E.F. Fritsch and J. Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1989)], [T.J. Silhavy, M.L. Berman and L.W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1984)], [Ausubel, F.M. et al., Current Protocols in Molecular Biology, Greene Publishing Assoc. and Wiley Interscience (1987)]; ["Gene Expression Technology", in: Methods in Enzymology, Vol 185, Elsevier, 1990]; ["Bacterial Genetic Systems", in: Methods in Enzymology, Vol. 204, Elsevier, 1991]; ["Recombinant DNA, Part E", in Methods in Enzymology, Vol. 154, Elsevier, 1987]; [C.D. Smolke (ed.), The metabolic pathway engineering handbook: tools and applications, CRC Press. Boca Raton, 2010]; [C. Muehlhardt, "The Experimentator: Molekularbiologie/Genomics", 6th ed., Spektrum Akademischer Verlag, Heidelberg 2010]; [D. Clark, N. Pazdernik, "Molekulare Biotechnologie", Spektrum Akademischer Verlag, Heidelberg, 2009; M. Jahnson (Ed.), "Gentechnische Methoden", 4th ed., Spektrum Akademischer Verlag, Heidelberg, 2006]; [J.M.S. Bartlett, D. Stirling (Ed.), "Methods in Molecular Biology", Vol. 226, "PCR Protocols", Springer Verlag GmbH, 2003]에 기재되어 있다.

녹아웃 돌연변이체의 추가의 공지된 제작 방법은 상동성 재조합을 기초로 한다. 여기서, 마커 유전자는 특히 녹아웃될 유전자의 서열에 상동성인 플랭킹 서열과 함께 제공되고, 적합한 비히클 (예를 들어, 플라스미드, 삽입 서열, 트랜스포손)에 의해 녹아웃될 표적 서열과 접합시켰다. 이것을 바람직하게는 숙주 유기체 내에, 예를 들어 (숙주 유기체 박테리아 염색체 또는 진핵 염색체에 따라) 염색체 내에, 또는 관련된 숙주 내의 염색체외 핵산 구축물 (예를 들어 플라스미드) 상에 위치시켰다. 그러나, 무세포 또는 시험관내 시스템도 마찬가지로 가능하다. 적합한 재조합 시스템 (예를 들어 레콤비나제)의 존재 하에 상동성 재조합이 발생하고, 여기서 마커 유전자는 플랭킹 서열의 상동성 때문에 표적 서열 내로 통합되고, 표적 서열의 플랭킹 서열 사이에 놓인 핵산 영역의 대체 시에 제거된다. 이러한 방식으로 삽입된 마커 유전자의 유전자 산물은 녹아웃 돌연변이체의 선택에 사용될 수 있다. 항생제-함유 고체 배지 플레이트 또는 액체 배지에 의한 선택이 수행될 수 있도록, 마커 유전자는 바람직하게는 항생제 내성을 매개하는 단백질을 코딩한다. 그러나, 마커 유전자는 또한, 선택이 형광 현미경에서의 콜로니 관측에 의해 또는 형광-활성화 세포 분류기 (FACS)에 의해 수행될 수 있도록, 다른 단백질, 예를 들어 형광 단백질, 예를 들어 "녹색 형광 단백질" (GFP)을 코딩할 수 있다. 상동성 재조합의 원리는 일반적으로 공지되어 있고, 재조합의 추가의 형태 이외에도, 예를 들어, 문헌 [R.Y. Stanier, J.L. Ingraham, M. L. Wheelis, P. R. Painter (ed.) "General Microbiology", 5th ed., 1986, Macmillan Education Ltd., Houndmills, London, pp. 278 - 285], 추가로 ["DNA Cloning", Volume II, D.M. Glover (ed.), IRL Press, Oxford, Washington D.C., 1986, pp. 57-65]; [Karl Drlica, "DNA und Genklonierung - ein Leitfaden", G. Fischer Verlag, Stuttgart, Jena, 1995, "Transposition" chapter. pp. 155-161], 및 [D.H. Jones and S.C. Winistorfer, "Recombination and Site-Directed Mutagenesis using Recombination PCR", in: J.M.S. Bartlett, D. Stirling (eds.), "Methods in Molecular Biology", Vol. 226, "PCR Protocols", Springer Verlag GmbH, 2003, Chapter 70, pp. 517-525]; 및 [A.S. Waldman (ed.), "Methods in Molecular Biology", Vol. 262, "Genetic Recombination - Reviews and Protocols", Springer Verlag GmbH, 2004]; [F.P. Miller, A.F. Vandome, J. McBrewster (Ed.), "Genetic Recombination", Alphascript Publishing, 2009]; [F.P. Miller, A.F. Vandome, J. McBrewster (Eds.), "Gene Targeting", Alphascript Publishing, 2010]; [A. Aguilera and R. Rothstein, Molecular Genetics of Recombination, Springer-Verlag GmbH, 2007]에 기재되어 있다. 특히 진핵 세포 및 동물에 대한 유전자-녹아웃 방법에 대해서는 구체적인 공개물인 문헌 ["Gene Knockout Protocols", Ralf Kuehn and Wolfgang Wurst (eds.), Humana Press., 2nd edition 2009], 및 [Wolf S.E. and Woodside, K.J, Transgenic and gene knockout techniques and burn research, J. Surg. Res. 123(2):328-339, 2005]에 기재되어 있다.

또한, 유전자-녹아웃 제작을 위한 상업용 키트, 예를 들어 특히 이. 콜라이 및 관련된 박테리아 종의 경우에는 시그마-알드리치(Sigma-Aldrich)의 "타켓트론(TargeTron) 유전자 녹아웃 시스템"을 구입할 수 있다.

녹아웃 돌연변이체 또는 유전자 변형의 생산에 적합한 추가 시스템의 예는, 특히 문헌 [Sauer B and Henderson N, Proc. Natl. Acad. Sci. USA 85(14):5166-5170, 1988]에 기재된 Cre/Lox 시스템, 또는 "레드(Red)/ET 재조합" 시스템 (진 브릿지스 게엠베하(Gene Bridges GmbH), 독일 하이델베르크; 사용자 편람 ["Red/ET Recombination - Cloning without Restrictions Enzymes", Gene Bridges GmbH]에 기재되어 있고, 추가로 특히 특허 US 6,355,412, US 6,509,156 및 EP 4139561에 기재되어 있음)이다.

9. 보조인자 재생

보조인자에 대한 필요는 보조인자-재생 효소와의 커플링에 의해 감소시킬 수 있다. 이를 위해, 선행 기술의 다양한 방법이 이용될 수 있다.

선행 기술은, 예를 들어 글루타메이트 데히드로게나제 (GLDH)의 용도를 교시한다 (문헌 [Carrea, G., et al., Biotechnology and Bioengineering, 1984. 26(5): p. 560-563]). GLDH는 α-케토글루타레이트의 글루타메이트로의 동시 환원성 아미노화와 함께 NADPH를 NADP⁺로 재산화시킨다.

이에 대안적으로, 알콜 데히드로게나제 ADH-Tb, ADH-Lb 및 ADH-ms가 또한 보조인자 재생을 위해 제안된다 (문헌 [Fossati, E., et al., Biotechnol Bioeng, 2006, 93(6): p.1216-20]). ADH는 NADP⁺를 재생시키면서 아세톤을 2-프로판올로 전환시킨다.

NADH 또는 NAD의 재생을 위한 추가의 2급 알콜 데히드로게나제는, 예를 들어 칸디다(Candida) 및 피키아(Pichia) 속의 효모로부터 단리될 수 있는 것들, 예컨대 칸디다 파랍실로시스(Candida parapsilosis) (CPCR) (US 5,523,223 및 US 5,763,236; 문헌 [Enzyme Microb. Technol. 1993 Nov; 15(ll):950-8]), 피키아 캅술라타(Pichia capsulate) (DE 10327454.4), 피키아 파리노스(Pichia farinosa) (A 1261/2005, Kl. C12N), 피키아핀란디카(Pichiafinlandica) (EP 1179595 Al), 칸디다 네모덴드라(Candida nemodendra) (A 1261/2005, Kl. C12N), 피키아 트레할로필라(Pichia trehalophila) (A 1261/2005, Kl. C12N), 로도토룰라 무실라기노사(Rhodotorula mucilaginosa) (A 1261/2005, Kl. C12N), 로데로마이세스 엘롱기스포루스(Lodderomyces elongisporus) (A 1261/2005, Kl. C12N) 및 피키아 스티피디스(Pichia stipidis) (A 1261/2005, Kl. C12N)로부터의 카르보닐 리덕타제이다. 추가로, NADH의 재생은 또한 악티노박테리아(Actinobacteria) 부류의 박테리아로부터, 예를 들어, 로도코쿠스 에리트로폴리스(Rhodococcus erythropolis) (US 5,523,223), 노르카디아 푸스카(Norcardia fusca) (문헌 [Biosci. Biotechnol. Biochem., 63 (10) (1999), pages 1721-1729]; [Appl. Microbiol. Biotechnol. 2003 Sep; 62(4):380-6, Epub 2003 Apr 26]), 로도코쿠스 루버(Rhodococcus ruber) (문헌 [J. Org. Chem. 2003 Jan 24; 8(2):402-6]) 또는 마이크로박테리움(Microbacterium) 종 (1261/2005, Kl. C12N)으로부터 단리된 것과 같은 2급 알콜 데히드로게나제를 사용하여 수행될 수 있다.

NADPH 또는 NADP의 재생에 적합한 2급 알콜 데히드로게나제/옥시도리덕타제는, 예를 들어, 락토바실랄레스(Lactobacillales) 락토바실루스 케피르(Lactobacillus kefir) (US 5,200,335), 락토바실루스 브레비스(Lactobacillus brevis) (DE 19610984 Al; 문헌 [Acta Crystallogr. D. Biol. Crystallogr. 2000 Dec; 56 Pt 12:1696-8]), 락토바실루스 마이너(Lactobacillus minor) (DE 10119274), 류코노스톡 카르노숨(Leuconostoc carnosum) (A 1261/2005, Kl. C12N) 목의 유기체로부터 단리된 것, 또는 상기 기재된 바와 같이 테르모아네로븀 브록키이(Thermoanerobium brockii), 테르모아네로븀 에타놀리쿠스(Thermoanerobium ethanolicus) 또는 클로스트리디움 베이예린크키이(Clostridium beijerinckii)로부터의 것들이다.

락테이트 데히드로게나제 (LDH; NAD⁺를 재생시키면서 피루베이트를 락테이트로 반응시킴)에 의한 보조인자 재생은 EP-A-1 731 618에 기재되어 있다.

보조인자 재생에 적합한 추가의 데히드로게나제는 글루코스 데히드로게나제 (GDH), 포르메이트 데히드로게나제 (FDH) (특히 적어도 포름산의 CO₂로의 효소적 산화를 촉매화함), 글루코스-6-포스페이트 데히드로게나제 또는 포스파이트 데히드로게나제이다.

실험 섹션

다른 상세사항이 제공되지 않는다면, 본 발명의 문맥에서 수행된 클로닝 단계, 예컨대 PCR (폴리머라제 연쇄 반응), 제한 절단, 아가로스 겔 전기영동, DNA 단편의 정제, 니트로셀룰로스 및 나일론 막으로의 핵산 전달, DNA 단편의 연결, 미생물의 형질전환, 미생물의 배양, 파지의 복제 및 재조합 DNA의 서열 분석을 상기 문헌 [Sambrook et al. (1989)]에 기재된 바와 같이 수행할 수 있다.

상동성 재조합에 의한 녹아웃 실험은 문헌 [K. Datsenko and B. Wanner, (PNAS June 6, 2000 vol. 97 no. 12 6640-6645)]에 따라 수행되며, 도 3을 참조한다.

A. 일반 상세사항

1. 물질:

2. 방법

2.1 12α-HSDH 활성 측정을 위한 표준 조건

활성을 다음과 같이 정의하였다: 1 U의 효소는 실온 (즉, 약 20℃-23℃)에서 인산칼륨 완충액 (50 mM, pH 8.0) 중에서 1 μmol/분의 5 mM 콜산 용액의 반응을 촉매화하는 효소의 양에 상응한다.

반응 혼합물은 총 부피 1 ml 중에 다음을 함유하였다:

880 μl 50 mM 인산칼륨 완충제, pH 8.0

10 μl 100 mM 콜산 (물 중 용해됨, 2 M KOH를 사용하여 pH 8로 조정됨)

10 μl 효소 용액 (상기와 같은 완충제 중, 1 내지 10 U/ml의 범위)

100 μl 1 mM NADP+ (상기와 같은 완충제 중) (이와 함께 반응 출발)

340 nm에서 흡광 증가를 측정하고, 6.22 mM^-1xcm^-1의 몰 흡광 계수를 이용하여 활성을 효소 단위 (U, 즉 μmol/min)로서 계산하였다.

2.2 7β-HSDH 활성 측정을 위한 표준 조건

반응 혼합물은 총 부피 1 ml 중 다음을 함유하였다:

880 μl 50 mM 인산칼륨 완충제, pH 8.0

10 μl 10 mM UDCA (물 중에 용해됨, pH 8)

10 μl 효소 용액 (상기한 바와 같은 완충제 중, 1 내지 10 U/ml의 범위)

100 μl 1 mM NADP+ (상기한 바와 같은 완충제 중)

2.3 콜산의 반응 생성물의 분석을 위한 HPLC 방법.

칼럼: 푸로스페르(Purospher)® 스타(STAR) RP-18 (미리 패킹된 히트바(Hitbar)® RT 125-4, 예비-칼럼 리크로카트(LiChroCART)® 스타 RP18, 머크)

HPLC 시스템: LC20AD (시마즈(Shimadzu, 일본)

유량: 1 ml/min.

샘플: 20 μl (1 mg/ml)

검출 파장: 200 nm

구배:

pH 2.6은 오르토아인산 85%를 사용하여 조정됨

체류 시간:

7-케토-3,12-데히드록시콜란산 7.5 min

콜산 13.5 min

3. 발현 벡터 및 플라스미드 및 그의 제조

pIJ773 (서열 1)

플라스미드 pIJ773은 아프라마이신 내성을 코딩하는 유전자를 함유한다 (문헌 [B. Gust et al. PNAS February 18, 2003 vol. 100 no. 4 1541-1546]). 이러한 내성은 재조합이 수행된 후에 선택을 위해 필요하다.

pJOE6038.1 (pIJ790으로부터 유래됨) (서열 2)

플라미드 pJOE6038.1 (문헌 [B. Gust et al. PNAS February 18, 2003 vol. 100 no. 4 1541-1546])은 세가지 유전자 Gam, Bet 및 Exo로 이루어진 람다 레드(Lambda Red) 재조합 시스템을 함유한다 (문헌 [K. Murthy, J. Bacteriology, Apr. 1998, p. 2063-2071]). Gam은 숙주 엑소뉴클레아제 RecBCD V를 억제하고, Bet 및 Exo가 재조합을 수행하는 것을 가능하게 한다.

pCP20

선택 마크의 절제를 위해, 플라스미드 pCP20 (문헌 [K. Datsenko and B. Wanner, PNAS June 6, 2000 vol. 97 no. 12 6640-6645])을 사용하여 절제에 필요한 FLP 레콤비나제를 코딩한다. FLP 레콤비나제는 FRT 부위 사이의 DNA를 절단한다.

pET28a(+)

pET28a(+) (노바젠, 다름슈타트)는 T7 프로모터의 제어 및 전사 출발 사이에 MCS를 함유하고 T7 터미네이터를 갖는 벡터이고, 12α-HSDH의 발현에 작용한다. 상기 발현은 이소프로필-β-D-티오갈락토피라노시드 (IPTG)에 의해 유도된다.

pET28a(+)-7β-HSDH

플라스미드는 다음과 같이 제조되었다 (또한, 본 출원인의 PCT/EP20100/ 068576 참조):

첫째로, 7β-HSDH 코딩 서열을 증폭시켰다. PCR 산물을 주형으로서의 콜린셀라 아에로파시엔스 ATCC 25986 (DSM 3979)의 게놈 DNA 및 프라이머

및

을 사용하여 수득하였다. 프라이머 서열 내의 NdeI 및 HindIII 절단 부위는 밑줄로 표시하였다. PCR 산물을 PCR 정제 키트 (퀴아젠(Qiagen))에 의해 정제하고, 이어서 효소 NdeI 및 HindIII를 사용하여 절단하였다.

소화된 PCR 산물을 정제하고, T4 리가제를 사용하여 pET-28a(+) 벡터 내에 클로닝하여 발현 벡터를 제조하였다. 이어서, 제조된 발현 구축물을 이. 콜라이 DH5α 세포에 형질전환시켰다. 예상되는 단백질은 신호 펩티드 및 N-말단 6xHis 태그 및 트롬빈 절단 부위를 포함하는 20 아미노산 라디칼을 함유해야 한다. 삽입된 DNA의 서열을 서열분석에 의해 확인하였다 (서열 24 및 25 참조).

pET22b(+) 3α-HSDH:

이것은 코마모나스 테스토스테로니(Comamonas testosteroni) (서열 28 및 29 참조)로부터의 3α-HSDH 서열을 종래 방식으로 절단 부위 Nde I 및 EcoR I를 통해 클로닝시킨 pET22b(+) 벡터이다 (문헌 [Oppermann et al., J Biochem, 1996, 241(3):744-749]).

pET21a(+) FDH D221G

이것은 미코박테리움 박카에(Mycobacterium vaccae ) N10 (서열 32)으로부터의 포르메이트 데히드로게나제를 절단 부위 Nde I 및 EcoR I를 통해 클로닝시킨 pET21a(+)- 벡터이다. 부위-지정 돌연변이유발에 의해, 포르메이트 데히드로게나제의 위치 221 (위치 1에서의 메티오닌을 고려하지 않음) 또는 위치 222 (위치 1에서 메티오닌으로부터 계산됨; 참조 서열 38 및 23)에서의 아스파르테이트 라디칼 (D)을 글리신 라디칼에 의해 대체하였다. 이에 따라 수득된 FDH 돌연변이체는 NADH 뿐만 아니라 NADHP도 재생할 수 있다. 포르메이트 데히드로게나제는 뉴클레오티드 서열의 위치 1202 (개시 코돈 ATG를 고려하여 계산됨) 상에서, 마지막 아미노산 발린을 알라닌으로 교환하는 단일 염기 결실을 수행한다. 동시에, 이 염기 결실은 정지 코돈의 스위칭 오프 및 원래 리딩 프레임 밖에 놓인 His·태그의 활성화를 유도한다 (서열 22 및 23 참조). (His 태그 없는 FDH D221G, 서열 37 및 38 참조).

발현 플라스미드를 다음과 같이 제조하였다 (또한, 본 출원인의 EP 출원 10015726 참조):

a) 클로닝 pET21a(+) FDH

러시아 모스크바 주립 대학의 생물학부의 배양 수집으로부터 주문한 미코박테리움 박카에 N10의 게놈 DNA (기탁 번호 43292)를 증폭의 주형으로서 사용하였다. 증폭을 위한 프라이머는 유로핀스(Eurofins) MWG 게엠베하 (에베르스베르크)로부터 주문한 하기 서열이다.

제한 효소를 위한 인식 부위를 밑줄로 표시하였다. rev 프라이머는 EcoRI 절단 부위를 함유하고, for 프라이머는 NdeI 절단 부위를 함유한다.

PCR 배치 및 PCR 프로그램은 하기 표에 명시하였다.

표: 미코박테리움 박카에로부터의 포르메이트 데히드로게나제의 증폭을 위한 PCR 배치

표: 미코박테리움 박카에로부터의 포르메이트 데히드로게나제의 증폭을 위한 PCR 프로그램

물 중에 용해된 DNA (pET21a(+) 또는 FDH-PCR 산물) 1-5 μg을 10x NE 완충액 EcoRI 5μl, NdeI (20 U/mL) 2.5 μl 및 EcoRI (20 U/mL) 2.5 μl로 처리하고 (각각 경우에 뉴 잉글랜드 바이오랩스(New England Biolabs), 프랑크푸르트), 증류수를 사용하여 전체 부피 50 μl를 만들었다. 배치를 각각의 경우에 37℃에서 1 h 동안 인큐베이션하였다. 후속적으로, 절단된 DNA 단편을 1% 농도의 아가로스 겔 (1% (m/v) 아가로스, 0.05% (v/v) 브로민화에티듐)에 적용하고, DNA 단편을 55분 동안 120 V에서 전기영동법으로 분리하였다. 후속적으로, 정확한 크기 (FDH 유전자 중 1.2 kb, pET21a(+) 플라스미드 중 5.4 kb)의 밴드를 아가로스 겔로부터 메스를 이용하여 절단하고, 퀴아퀵(QIAQuick) 겔 추출 키트 (퀴아젠(QIAGEN), 힐덴)를 사용하여 제조업체의 프로토콜에 따라 단리하였다.

절단된 벡터 DNA 100 ng 및 절단된 FDH-DNA 111 ng을 T4 리가제 (3 U/μL) 1 μl 및 10x 리가제 완충액 1 μl로 처리하고 (각각 경우에 뉴 잉글랜드 바이오랩스, 프랑크푸르트), 증류수로 전체 부피 10 μl를 채웠다. 라이게이션 배치를 밤새 4℃에서 인큐베이션하였다.

라이게이션 단계의 완료 후에, 10 μL 라이게이션 배치를 표준 프로토콜에 따라 생산된 화학적 적격 이. 콜라이 DH5α 200 μl에 첨가하였다. 그 후에, 얼음 상의 인큐베이션 단계를 30분 동안 수행한 다음, 42℃ (90초)에서 열 충격을 수행하였다. 후속적으로, 멸균 LB 배지 600 μl를 형질전환 배치에 첨가하고, 세포를 45분 동안 진탕 인큐베이터에서 200 rpm 및 37℃에서 인큐베이션하였다. 다음 단계에서, 배치를 벤치 원심분리기에서 60초 동안 3000 rpm에서 원심분리하고, 상청액 700 μl를 경사분리하고, 세포를 남아있는 상청액 중에 재현탁시키고, 암피실린 100 mg/l를 갖는 LB 한천 플레이트 상에 플레이팅하였다. 한천 플레이트를 후속적으로 37℃에서 밤새 인큐베이션하였다.

b) pET21a(+) FDH D221G 제조

하기 프라이머를 사용하였다:

먼저, mt 프라이머 및 프라이머 NI_fdh_R에 의해, 2개의 보완적 메가프라이머 세트를 제조하였다. 사용된 주형은 플라스미드 pET21a(+)FDH였다. 이용된 PCR 프로그램은 하기 표로부터 추론될 수 있다:

표: PCR 프로그램 메가프라이머

프라이머 mt1과 프라이머 NI_fdh_R의 조합에 의해, 메가프라이머의 길이는 650 bp인 것으로 판명되었다. 제1 PCR의 이 PCR 산물을 사용하여, 겔 전기영동 및 겔로부터의 목적하는 밴드의 단리를 수행하였다. 제2 PCR은 프라이머로서의 메가프라이머 및 주형으로서의 플라스미드 DNA (pETfdh)를 사용하여 전체 플라스미드 PCR로서 수행하였다. 하기 표는 전체 플라스미드 PCR을 위한 반응 배치 및 온도 반응식을 보여준다. 2x 이지클론(EZClone) 효소 믹스, 이지클론 용액 1, 1.1 kb 마커 및 DpnI은 진모르프(GeneMorph) II 이지클론 도메인 돌연변이유발 키트 (스트라타진(Stratagene))로부터 유래하였다.

표: 메가 WHOP PCR을 위한 배치 (전체 부피 50 μL)

PCR 프로그램에서의 제1 단계 (68℃, 5분)는 메가 WHOP PCR에 사용된 폴리머라제의 3'→5' 엑소뉴클레아제 활성의 Taq 폴리머라제에 의해 비-특이적으로 부가된 염기를 제거하도록 작용하였다.

표: PCR 프로그램 메가 WHOP

PCR 산물은 단지 이. 콜라이에서만 폐쇄되는 단일-가닥 절단을 갖는 이중-가닥 플라스미드이다. DpnI 10 U를 50 μL PCR 산물에 첨가하고, 배치를 2시간 동안 37℃에서 인큐베이션하였다. DpnI은 사용된 메틸화 DNA, 즉, 주형 DNA만을 분해하지만, 메가프라이머 또는 합성된 플라스미드는 분해하지 않는다. 주형 플라스미드는 메틸화된 출발 DNA를 수득하기 위해 dam⁺ 균주 (예컨대 DH10B 또는 JM109)를 이용하여 생산되어야 한다.

이러한 방식으로, 상기 언급된 발현 플라스미드 pET21a(+) FDH D221G를 수득하였다

4. 미생물

B. 실시예

실시예 1: 이. 콜라이 균주 BL21(DE3) (이. 콜라이 BL21(DE3) Δ7α-HSDH)의 7α-HSDH 결실 돌연변이체 (유형 1)의 생산 (상동성 재조합에 의한 녹아웃)

1.1 이. 콜라이 BL21(DE3)으로부터의 7α-HSDH에 대한 서열 정보

아미노산 서열: (서열 10)

길이: 255개 아미노산

유형: 단백질

공급원: 이. 콜라이 BL21(DE3)

뉴클레오티드 서열 (서열 9)

길이: 768 염기쌍

유형: 핵산

공급원: 이. 콜라이 BL21(DE3)

등록: NC_012971 영역: 1642470..1643237

1.2 아프라마이신 결실 카세트의 생산

하기 프라이머를 이. 콜라이 BL21(DE3)으로부터 7α-HSDH의 녹아웃을 위해 제조하였다.

7α-HSDH-서열을 위한 상동성 서열을 밑줄로 표시하였고, 여기서 정방향 프라이머로부터의 밑줄로 표시된 서열은

를 코딩하고, 역방향 프라이머로부터의 밑줄로 표시된 서열은

을 코딩한다.

아프라마이신 내성 카세트를 위한 상동성 서열은 이탤릭체로 되어 있다. 플라스미드 pIJ773으로부터의 아프라마이신 내성 카세트는 FRT 부위에 의해 플랭킹되고 (문헌 [B. Gust et al. PNAS February 18, 2003 vol. 100 no. 4 1541-1546]), 재조합을 수행한 후에 내성을 게놈으로부터 다시 제거하도록 한다.

주형으로서의 플라스미드 pIJ773으로부터 아프라마이신 내성 카세트를 사용하는 PCR을 표준 프로토콜, 예컨대 샘브룩(Sambrook) (1998)에 따라 수행하였다. 이에 따라 생산된, 7α-HSDH의 유전자로부터 2개의 상동성 아암을 갖는 PCR 산물을 정제하였다.

1.3 표적 서열의 재조합/결실

pIJ790의 역위 NheI 절단 부위를 갖춘 플라스미드 pJOE6038.1 (문헌 [B. Gust et al. PNAS February 18, 2003 vol. 100 no. 4 1541-1546])은 엑소뉴클레아제 (람다 레드 레콤비나제, 문헌 [K. Murthy, J. Bacteriology, Apr. 1998, p. 2063-2071])를 코딩한다. 플라스미드 pJOE6038.1은 온도-민감성이고, 37℃에서 배양 시 손실된다. 플라스미드 pJOE6038.1을 이. 콜라이 BL21(DE3)에서 전기천공 (25μF, 200 ohms 및 2.5 kV)에 의해 형질전환시켰다. LB 5 ml 중에서 콜로니를 선택하고, 30℃에서 밤새 배양하였다. LB 배지 40 ml에 1:100로 접종하고, 30℃에서 인큐베이션하였다. OD₆₀₀ 약 0.3에서 배양물을 0.4% L-아라비노스로 유도하고, 1시간 동안 37℃에서 인큐베이션하여 재조합을 가능하게 하는 엑소뉴클레아제 (람다 레드 레콤비나제)를 발현시켰다.

세포를 원심분리하고, 빙냉수 30 ml로 세척하였다. 세포를 다시 원심분리하고, 빙냉수 700 μl와 재현탁시켰다. 이것의 50 μl를 PCR 산물 (상기 단계 1로부터) 5 μl와 함께 30분 동안 얼음 상에서 인큐베이션하였다. 전기천공 (25μF, 200 ohm 및 2.5 kV) 후에 미리 냉각된 LB 배지 1 ml를 여기에 즉시 피펫팅하였다. 세포를 2시간 45분 동안 37℃에서 인큐베이션하였다. 이어서, 세포를 LB 아프라마이신 한천 플레이트 상에 플레이팅하였다. 콜로니를 선택하였다. 7α-HSDH 프라이머를 사용한 콜로니 PCR은 1500 bp 밴드 (아마파이신 내성)를 나타냈다. 이것은 7α-HSDH의 유전자가 대체되었고, 여기서 아프라마이신 내성이 게놈 내에 통합되었다는 것을 보여준다 (도 1 참조). 이에 따라 수득된 녹아웃 균주는 이. 콜라이 BL21(DE3) Δ7α-HSDH Apar^R로 명시된다.

1.4 내성의 절제

2개의 FRT 부위에 의해 플랭킹된 녹아웃에 사용된 내성 유전자를 다시 절제해야 한다. 절제를 위해, 절제에 필요한 FLP 레콤비나제를 코딩하는 플라스미드 pCP20 (문헌 [K. Datsenko and B. Wanner, PNAS June 6, 2000 vol. 97 no. 12 6640-6645])을 사용하였다. FLP 레콤비나제는 FRT 부위 사이의 DNA를 절단한다. 플라스미드 pCP20은 또한 온도-민감성이고, 37℃에서의 배양 시 손실된다. 플라스미드 pCP20을 녹아웃 균주 이. 콜라이 BL21(DE3) Δ7α-HSDH Apar^R에서 전기천공 (25μF, 200 ohm 및 2.5 kV)에 의해 형질전환시켰다. 4개의 콜로니를 LB-0 상에 스트리킹하고, 밤새 42℃에서 배양하였으며, 여기서 FLP 레콤비나제를 발현시키고, 이것은 아프라마이신 내성 유전자를 절제한다. 이에 따라 녹아웃 균주 이. 콜라이 BL21(DE3) Δ7α-HSDH를 수득하였다.

내성 손실을 시험하기 위해, 50개 콜로니를 LB 아프라마이신 배지 및 LB-0 배지 상에 스트리킹하였다. 단지 LB-0 상에서만 성장한 콜로니가 더 이상 아프라마이신 내성을 보유하지 않는다. 콜로니를 LB 5 ml 중에서 선택하였다. 20 mM 콜산을 배양물 5 ml에 첨가하였다. 어떠한 산화 생성물 7-케토-3,12-디히드록시콜란산 (RT: 7.5 min)도 HPLC에 의해 녹아웃 균주로 검출될 수 없었다. 그러나, 이. 콜라이 BL21(DE3)는 분명히 콜산에 대해 7α-HSDH 활성을 나타냈다 (RT: 13.5 min). 따라서, 7α-HSDH 유전자를 성공적으로 녹아웃시켰다 (도 2 참조).

따라서, 7α-HSDH-무함유 균주 이. 콜라이 BL21(DE3) Δ7α-HSDH를 성공적으로 생산하였다.

실시예 2: 이. 콜라이 BL21(DE3) Δ7α-HSDH (유형 1)를 사용하는 12α-HSDH의 이종 발현

T7 프로모터의 제어 및 전사 출발 사이에 MCS를 함유하고 T7 터미네이터를 갖는 벡터 pET28a(+) (노바젠, 다름슈타트)는 12α-HSDH의 발현에 작용하였다. 발현은 이소프로필-β-D-티오갈락토피라노시드 (IPTG)에 의해 유도된다.

이를 위해, 12α-HSDH (단쇄 버전) 코딩 서열을 PCR 증폭시켰다 (또한 본 출원인의 PCT/EP2009/002190 참조). PCR 산물은 주형으로서의 클로스트리디움 종 군 P 균주 48-50의 게놈 DNA 및 프라이머 쌍을 사용하여 수득하였다:

이탤릭체로 표시된 뉴클레오티드 라디칼은 잉여의 것이다. 볼드체의 라디칼은 절단 부위를 코딩한다. 다른 라디칼은 12α-HSDH에 대한 상동성 서열이다.

PCR 산물을 아가로스 겔에 적용하고, 분리하고, 이로부터 절제하였다. 후속적으로, 이들을 NdeI 및 BamHI를 사용하여 제한하고, 마찬가지로 NdeI 및 BamHI로 절단된 pET28a(+) 벡터와 라이게이션하였다.

후속적으로, N-말단 히스-태그를 하기 프라이머를 사용하는 퀵-체인지(Quick-Change)에 의해 제거하였다. 플라스미드를 서열분석하고 확인하였다.

이. 콜라이 BL21(DE3) Δ7α-HSDH를 사용하는 발현의 조사를 위해, 화학적 적격 세포를 하기 나타낸 프로토콜에 따라 생산하였다. 12α-HSDH (His-태그 없음)를 갖는 벡터 pET28a+ (노바젠, T7 프로모터 및 카나마이신 내성 함유)를 이. 콜라이 BL21(DE3) Δ7α-HSDH에서 형질전환시켰다.

화학적 적격 세포의 생산:

이. 콜라이의 밤샘 배양물 1 ml를 LB 배지 100 ml 중에 접종하였다. 세포를 37℃ 및 180 rpm에서 OD₆₀₀ 0.4 - 0.6까지 인큐베이션하였다. 세포를 얼음 상에서 15분 동안 냉각시키고, 4℃ 및 4000 rpm에 10분 동안 원심분리하였다. 상청액을 제거하고, 세포를 사전냉각된 TfbI 용액 (아세트산칼륨 30 mM, 염화루비듐 100 mM, 염화칼슘 10 mM, 염화망가니즈 50 mM, 글리세롤 15%) 40 ml 중에 재현탁시켰다. 15분 동안 얼음 상에서 인큐베이션한 후에, 세포를 원심분리하였다. 상청액을 제거하였다. 세포를 사전냉각된 TfbII 용액 (MOPS 10 mM, 염화칼슘 75 mM, 염화루비듐 10 mM, 글리세롤 15%) 4 ml 중에 재현탁시켰다. 형질전환을 위해, 적격 세포200 μl 중 플라스미드 DNA 1 μl를 첨가하고, 혼합물을 10분 동안 얼음 상에서 인큐베이션하였다. 세포의 열 충격을 40초 동안 42℃에서 수행하였다. 이어서, LB 배지 800 μl를 즉시 첨가하였다. 세포를 1시간 동안 37℃ 및 200 rpm에서 인큐베이션하였다. 형질전환된 세포를 원심분리하고, 상청액을 제거하였다. 펠릿을 LB 한천 플레이트 상에 플레이팅하였다. 플레이트를 콜로니의 형성을 위해 37℃에서 인큐베이션하였다.

콜로니를 LB 5 ml 중에서 선택하였다. 4시간 후에, LB 50 ml에 사전-배양물 5 ml를 접종하였다. OD₆₀₀ 약 0.8에서, 세포를 0.5 mM IPTG로 유도하였다. 세포를 25℃ 및 140 rpm에서 밤새 인큐베이션하였다. 이어서, 세포를 원심분리하고, 재현탁시키고, 소화시켰다. 12α-HSDH 활성을 상기에 나타낸 방법에 따라 측정하였다. 12α-HSDH의 수율은 LB 배지의 리터 당 약 50 kU였다.

실시예 3: 이. 콜라이 7α-HSDH 녹아웃 돌연변이체 (이. 콜라이 BL21(DE3) hdhA^- KanR⁺)의 생산 (유형 2) (유전자 파괴에 의한 녹아웃)

본 목적은 발현 균주 이. 콜라이 BL21(DE3)에서의 간섭 7α-HSDH 활성의 결실이다.

하기에 기재된 방법을 이용하여, 항생제 내성 유전자를 7α-HSDH의 표적 유전자 내로 삽입하고, 이것에 의해 표적 유전자가 스위치 오프되었다.

3.1 이. 콜라이 BL21(DE3)으로부터의 7α-HSDH에 대한 서열 정보

실시예 1 참조

3.2 사용된 프라이머

하기 프라이머를 이. 콜라이 BL21(DE3)으로부터 7α-HSDH의 스위치 오프를 위해 제조하였다:

타켓트론^TM 유전자 녹아웃 시스템에서 사용된 Ll.LtrB 인트론의 재표적화를 위한 프라이머 (섹션 3.3 참조):

EBS 유니버셜:

(대조 반응을 위해 사용자 지침서에 따름)

하기 부위 내로의 재프로그램된 인트론의 삽입

위치

3.3 녹아웃 돌연변이체의 생산

녹아웃 돌연변이체의 생산을 제조업체의 지침에 따라 시그마 알드리치의 타켓트론^TM 유전자 녹아웃 시스템에 의해 수행하였다. 이것을 퀴아젠의 퀴아퀵 PCR 정제 키트의 타켓트론^TM 유전자 녹아웃 시스템의 단계 B.6.에 따라 PCR 산물의 정제에 활용하였다.

선형화된 pACD4K-C 벡터에서 HindIII/BsrGl-소화된 인트론 PCR 산물의 라이게이션을 다음과 같이 수행하였다: 상기 반응을 16℃에서 밤새 수행하였다.

20μl 배치:

2 μl pACD4K-C 선형 벡터 (40 ng)

6 μl HindIII/BsrGI-소화된 인트론 PCR 산물

2 μl ATP (10 mM)

2 μl 리가제 완충액 (10 x) (퍼멘타스(Fermentas))

2 μl T4 리가제 (퍼멘타스)

6 μl H₂O

라이게이션 반응 용액 5 μl를 화학적 적격 이. 콜라이 BL21(DE3) 세포 200 μl에 첨가하고, 얼음 상에서 20분 동안 인큐베이션하였다. 추가의 형질전환은 헤르스텔레르사이트(Herstellerseite)에 의해 기재된 바와 같이 수행하였다.

형질전환 배치를 33 μg/mL의 카나마이신을 함유하는 LB 한천 플레이트 상에 플레이팅하였다. 카나마이신-내성 세포를 선택하고, 이들을 LB 밤샘 배양물 5 ml (각각 경우에 카나마이신 용액 (33 mg/ml) 5 μl를 함유함) 중에 몇일 밤에 걸쳐 재접종하였다. 최종적으로, LB 배양물 200 ml (카나마이신 용액 (33 mg/mL) 200 μl를 함유함)를 밤샘 배양물로 접종하고, 진탕기 인큐베이터에서 5시간 동안 37℃ 및 180 rpm에서 인큐베이션하였다. 이어서, 온도를 1시간 동안 42℃로 증가시켰다. LB 밤샘 배양물 5 mL에 상기 배양물을 접종하였다 (각각 경우에 카나마이신 용액 (33 mg/mL) 5 μl를 함유함). 밤새 37℃ 및 180 rpm에서 인큐베이션한 후에, 배양물을 33 μg/mL의 카나마이신을 함유하는 LB 한천 플레이트 상에 스트리킹하였다. 37℃에서 밤새 인큐베이션한 후에, 콜로니를 선택하고, 33 μg/mL의 카나마이신 및 34 μg/mL의 클로람페니콜을 갖는 LB 한천 플레이트 상에 스트리킹하였다.

37℃에서 밤새 인큐베이션한 후에, 클로람페니콜-민감성 돌연변이체를 발견하였다. 이것은 유도가능한 녹아웃 시스템이 지지하는 플라스미드의 손실을 확인하는 것을 필요로 하고, 성공적 녹아웃 후에는 더 이상 요구되지 않는다.

카나마이신 내성은 단지 삽입으로만 활성이 된다. 이것은 벡터 pACD4K-C 상에 결실을 갖는다. 따라서, 카나마이신 및 클로람페니콜 상에서 둘 다 성장한 콜로니는 아마도 반드시 목적하는 녹아웃 및 또한 추가로 pACD4K-C 벡터를 함유한다. 단지 균주가 추가로 카나마이신-내성인 경우, 이들은 pACD4K-C 벡터 및 또한 목적하는 녹아웃을 상실한다.

3.4 녹아웃의 검출

7α-HSDH 유전자를 하기의 프라이머를 사용하여 콜로니 PCR에 의해 증폭시켰다.

형성된 단편은 약 2.5-3 kb의 길이를 갖고, 프라이머 7alpha-ko-check_fwd를 사용하여 서열분석하였다. 서열분석을 기반으로, 7α-HSDH의 DNA 서열을 7α-HSDH의 녹아웃을 생성하는 pACD4K 벡터로부터 삽입물에 의해 개재시킨다는 것이 검출될 수 있었다. (서열분석 데이터는 나타나지 않음)

3.5 KO 균주를 사용한 12알파- 및 7베타-HSDH 돌연변이체의 발현

이 녹아웃 균주의 유용성은, 예를 들어 진탕기 플라스크 규모 상에서 12α- 및 7β-HSDH 돌연변이체의 효소 발현에 의해 확인되었다 (결과는 나타내지 않음).

실시예 4: 녹아웃 균주 이. 콜라이 BL21(DE3)Δ7α-HSDH (유형 1)의 사용에 의해 생산된 각각의 경우에, 7β-HSDH, FHD D221G 및 3α-HSDH에 의한 DHCA의 12-케토-UDCA로의 효소적 반응

본 실시예에서, 특정 FDH 돌연변이체를 사용하는 동시 보조인자 재생과 함께 DHCA의 12-케토-UDCA로의 2단계 효소적 반응을 연구하였다. 사용된 FDH 돌연변이체 D221G가 NADP⁺ 뿐만 아니라 NAD⁺ 둘 다를 보조인자로서 수용하기 때문에, 어떠한 추가의 보조인자 재생 시스템도 NADH-의존성 3α-HSDH를 위한 반응 배치 내에 도입되지 않아야 한다.

반응은 하기에 도표로 나타낸 2가지 부분 반응에 의해 예로서 설명된다. FDH^*는 돌연변이체 FDH D221G를 지칭한다.

이러한 목적을 위해, 콜린셀라 아에로파시엔스로부터의 효소 7β-HSDH, 코마모나스 테스토스테로니로부터의 3α-HSDH, 및 미코박테리움 바카에로부터의 FDH로부터 유래된 FDH 돌연변이체 D221G를, 상기 실시예 1에 따라 생산되고 반응을 위해 발현되고 사용되는 녹아웃 균주 이. 콜라이 BL21(DE3)Δ7α-HSDH (유형 1)에서 서로 개별적으로 생산하였다.

4.1 사용된 플라스미드

7β-HSDH, 3α-HSDH 및 FDH D221G의 발현을 위한 플라스미드:

4.2 박테리아 균주 및 배양 조건:

실시예 1에 따라 생산된 녹아웃 균주 이. 콜라이BL21(DE3)Δ7α-HSDH (유형 1)를 필요한 항생제를 함유한 LB 배지 중 37℃에서 배양하였다. 0.5 mM IPTG로 유도 후에, OD₆₀₀ = 0.8에 도달한 후에, 인큐베이션을 25℃에서 12시간 동안 140 rpm에서 계속하였다.

4.3 효소 과다발현 및 정제

이. 콜라이 BL21(DE3)Δ7α-HSDH에서 7β-HSDH, 3α-HSDH 및 FDH 돌연변이체 D221G의 과다발현, 및 효소 정제는 다음의 조건 하에 수행하였다:

이. 콜라이 녹아웃 균주를 발현 구축물을 이용하여 형질전환시켰다. 이를 위해, 발현 구축물을 함유한 균주를 카나마이신 30 μg/ml를 함유한 LB 배지 (2 리터 진탕기 플라스크에서 2 x 400 ml) 중에서 증대시켰다.

세포를 원심분리 (10,000xg, 15분, 4℃)에 의해 수거하였다. 펠릿을 20 ml의 포스페이트 완충액 (50 mM, pH 8, 0.1 mM PMSF 함유) 중에 재현탁시켰다. 세포를 일정하게 냉각하면서 소니파이어(Sonifier) 250 초음파 장치 (브렌슨(Branson), 독일)를 이용하여 1분 동안 초음파 처리 (40 W 전력, 40% 작동 간격 및 1분 휴식)에 의해 소화시켰다. 소화를 3회 반복하였다. 세포 추출물을 원심분리하였다 (22,000xg, 20분, 4℃). 최종적으로, 샘플을 새로운 튜브에 옮기고, 추가의 분석을 위해 -20℃에서 저장하였다. 단백질 농도를 제조업체의 지시에 따라 BCA 시험 키트 (써모(Thermo), 미국)를 사용하여 측정하였다. 또한, 샘플을 12.5% 농도 SDS-PAGE 및 쿠마시 브릴리언트 블루(Coomassie Brilliant Blue)로의 염색에 의해 분석하였다. 단백질의 순도를 싸이언 이미지 베타(Scion Image Beta) 4.0.2 (싸이언(Scion), 미국)에 의한 밀도측정에 의해 측정하였다. 7β-HSDH, 3α-HSDH 및 FDH의 세포 추출물은 조 추출물이었다. 7α-HSDH는 이미 녹아웃되었으므로, 추가의 정제는 불필요하다.

배양 배지 (OD₆₀₀ ~ 6에서의 진탕기 플라스크)의 리터 당 수율은 다음과 같았다:

7β-HSDH: 3883U (DHCA 및 NADPH의 경우)

3α-HSDH: 6853 U (DHCA 및 NADH의 경우)

FDH 돌연변이체: 47 U (포름산나트륨 및 NAD⁺의 경우).

단백질의 함량 및 순도를 SDS-PAGE 및 싸이언 이미지 베타 4.0.2 (싸이언, USA)에 의한 덴시토미터 스캐닝에 의해 측정하였다.

4.4 정제용 규모 상의 12-케토-UDCA의 효소적 합성

7β-HSDH (2.4 U x ml^-1), 3α-HSDH (2.4 U x ml^-1), FDH D221G (0.325 U x ml^-1), NADP⁺ (10 μM), NAD⁺ (10 μM), 포름산나트륨 (250 mM), DHCA (10 mM, 3.2 g) 및 인산칼륨 완충액 (50 mM, pH 6)을 함유한 반응 배치 800 ml를 24℃에서 교반하였다. 이 실험에 사용된 모든 3가지 효소를 추가의 정제 단계 없이 세포 조 추출물로서 사용하였다. 12시간 후에, 반응을 10 kDa의 기공 크기를 갖는 막 (밀리포어(Millipore), USA)을 사용하는 한외여과에 의한 효소의 제거에 의해 중단시켰다. 여과물 중의 생성물을 염산을 사용하여 pH 2로 산성화 및 후속적 종이 여과에 의해 정제하였다. 밤새 60℃에서 생성물을 건조시킨 후, 목적 생성물 2.9 g을 수득하였다.

생성물을 HPLC 및 NMR에 의해 분석하였다.

분석 데이터 (부분적):

서열의 배열:

AA = 아미노산 서열

NA= 핵산 서열

L = 장쇄형

K = 단쇄형

참고문헌은 본원에 인용된 공개의 개시내용이 명백히 언급된다.

SEQUENCE LISTING <110> PHARMAZELL GmbH <120> 7alpha-Hydroxysterioddehydrogenase-Knock-Out-Mutanten <130> M/50273-PCT <160> 38 <170> PatentIn version 3.3 <210> 1 <211> 4334 <212> DNA <213> Artificial <220> <223> Plasmid <400> 1 gtgtaggctg gagctgcttc gaagttccta tactttctag agaataggaa cttcggaata 60 ggaacttatg agctcagcca atcgactggc gagcggcatc gcattcttcg catcccgcct 120 ctggcggatg caggaagatc aacggatctc ggcccagttg acccagggct gtcgccacaa 180 tgtcgcggga gcggatcaac cgagcaaagg catgaccgac tggaccttcc ttctgaaggc 240 tcttctcctt gagccacctg tccgccaagg caaagcgctc acagcagtgg tcattctcga 300 gataatcgac gcgtaccaac ttgccatcct gaagaatggt gcagtgtctc ggcaccccat 360 agggaacctt tgccatcaac tcggcaagat gcagcgtcgt gttggcatcg tgtcccacgc 420 cgaggagaag tacctgccca tcgagttcat ggacacgggc gaccgggctt gcaggcgagt 480 gaggtggcag gggcaatgga tcagagatga tctgctctgc ctgtggcccc gctgccgcaa 540 aggcaaatgg atgggcgctg cgctttacat ttggcaggcg ccagaatgtg tcagagacaa 600 ctccaaggtc cggtgtaacg ggcgacgtgg caggatcgaa cggctcgtcg tccagacctg 660 accacgaggg catgacgagc gtccctcccg gacccagcgc agcacgcagg gcctcgatca 720 gtccaagtgg cccatcttcg aggggccgga cgctacggaa ggagctgtgg accagcagca 780 caccgccggg ggtaacccca aggttgagaa gctgaccgat gagctcggct tttcgccatt 840 cgtattgcac gacattgcac tccaccgctg atgacatcag tcgatcatag cacgatcaac 900 ggcactgttg caaatagtcg gtggtgataa acttatcatc cccttttgct gatggagctg 960 cacatgaacc cattcaaagg ccggcatttt cagcgtgaca tcattctgtg ggccgtacgc 1020 tggtactgca aatacggcat cagttaccgt gagctgcatt ttccgctgca taaccctgct 1080 tcggggtcat tatagcgatt ttttcggtat atccatcctt tttcgcacga tatacaggat 1140 tttgccaaag ggttcgtgta gactttcctt ggtgtatcca acggcgtcag ccgggcagga 1200 taggtgaagt aggcccaccc gcgagcgggt gttccttctt cactgtccct tattcgcacc 1260 tggcggtgct caacgggaat cctgctctgc gaggctggcg ggaacttcga agttcctata 1320 ctttctagag aataggaact tcgaactgca ggtcgacgga tccccggaat atcaagctta 1380 tcgataccgt cgacctcgag ggggggcccg gtacccaatt cgccctatag tgagtcgtat 1440 tacaattcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa 1500 cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc 1560 accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgcga cgcgccctgt 1620 agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc 1680 agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc 1740 tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg 1800 cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga 1860 tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc 1920 caaactggaa caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg 1980 ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt 2040 aacaaaatat taacgtttac aatttcccag gtggcacttt tcggggaaat gtgcgcggaa 2100 cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac 2160 cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg 2220 tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc 2280 tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg 2340 atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga 2400 gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc 2460 aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag 2520 aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga 2580 gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg 2640 cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga 2700 atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt 2760 tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact 2820 ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt 2880 ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg 2940 ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta 3000 tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac 3060 tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat ttttaattta 3120 aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt 3180 tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt 3240 tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt 3300 gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc 3360 agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg 3420 tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg 3480 ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt 3540 cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac 3600 tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg 3660 acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg 3720 gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat 3780 ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt 3840 tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg 3900 attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa 3960 cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc 4020 ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt cccgactgga 4080 aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg 4140 ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc 4200 acacaggaaa cagctatgac catgattacg ccaagctcgg aattaaccct cactaaaggg 4260 aacaaaagct ggagctccac cgcggtggcg gccgctctag aactagtgga tcccccgggc 4320 tgcaggaatt cgat 4334 <210> 2 <211> 7220 <212> DNA <213> Artificial <220> <223> Plasmid <400> 2 catcgattta ttatgacaac ttgacggcta catcattcac tttttcttca caaccggcac 60 ggaactcgct cgggctggcc ccggtgcatt ttttaaatac ccgcgagaaa tagagttgat 120 cgtcaaaacc aacattgcga ccgacggtgg cgataggcat ccgggtggtg ctcaaaagca 180 gcttcgcctg gctgatacgt tggtcctcgc gccagcttaa gacgctaatc cctaactgct 240 ggcggaaaag atgtgacaga cgcgacggcg acaagcaaac atgctgtgcg acgctggcga 300 tatcaaaatt gctgtctgcc aggtgatcgc tgatgtactg acaagcctcg cgtacccgat 360 tatccatcgg tggatggagc gactcgttaa tcgcttccat gcgccgcagt aacaattgct 420 caagcagatt tatcgccagc agctccgaat agcgcccttc cccttgcccg gcgttaatga 480 tttgcccaaa caggtcgctg aaatgcggct ggtgcgcttc atccgggcga aagaaccccg 540 tattggcaaa tattgacggc cagttaagcc attcatgcca gtaggcgcgc ggacgaaagt 600 aaacccactg gtgataccat tcgcgagcct ccggatgacg accgtagtga tgaatctctc 660 ctggcgggaa cagcaaaata tcacccggtc ggcaaacaaa ttctcgtccc tgatttttca 720 ccaccccctg accgcgaatg gtgagattga gaatataacc tttcattccc agcggtcggt 780 cgataaaaaa atcgagataa ccgttggcct caatcggcgt taaacccgcc accagatggg 840 cattaaacga gtatcccggc agcaggggat cattttgcgc ttcagccata cttttcatac 900 tcccgccatt cagagaagaa accaattgtc catattgcat cagacattgc cgtcactgcg 960 tcttttactg gctcttctcg ctaaccaaac cggtaacccc gcttattaaa agcattctgt 1020 aacaaagcgg gaccaaagcc atgacaaaaa cgcgtaacaa aagtgtctat aatcacggca 1080 gaaaagtcca cattgattat ttgcacggcg tcacactttg ctatgccata gcatttttat 1140 ccataagatt agcggatcct acctgacgct ttttatcgca actctctact gtttctccat 1200 acccgttttt ttgggaattc gagctctaag gaggttataa aaaatggata ttaatactga 1260 aactgagatc aagcaaaagc attcactaac cccctttcct gttttcctaa tcagcccggc 1320 atttcgcggg cgatattttc acagctattt caggagttca gccatgaacg cttattacat 1380 tcaggatcgt cttgaggctc agagctgggc gcgtcactac cagcagctcg cccgtgaaga 1440 gaaagaggca gaactggcag acgacatgga aaaaggcctg ccccagcacc tgtttgaatc 1500 gctatgcatc gatcatttgc aacgccacgg ggccagcaaa aaatccatta cccgtgcgtt 1560 tgatgacgat gttgagtttc aggagcgcat ggcagaacac atccggtaca tggttgaaac 1620 cattgctcac caccaggttg atattgattc agaggtataa aacgaatgag tactgcactc 1680 gcaacgctgg ctgggaagct ggctgaacgt gtcggcatgg attctgtcga cccacaggaa 1740 ctgatcacca ctcttcgcca gacggcattt aaaggtgatg ccagcgatgc gcagttcatc 1800 gcattactga tcgttgccaa ccagtacggc cttaatccgt ggacgaaaga aatttacgcc 1860 tttcctgata agcagaatgg catcgttccg gtggtgggcg ttgatggctg gtcccgcatc 1920 atcaatgaaa accagcagtt tgatggcatg gactttgagc aggacaatga atcctgtaca 1980 tgccggattt accgcaagga ccgtaatcat ccgatctgcg ttaccgaatg gatggatgaa 2040 tgccgccgcg aaccattcaa aactcgcgaa ggcagagaaa tcacggggcc gtggcagtcg 2100 catcccaaac ggatgttacg tcataaagcc atgattcagt gtgcccgtct ggccttcgga 2160 tttgctggta tctatgacaa ggatgaagcc gagcgcattg tcgaaaatac tgcatacact 2220 gcagaacgtc agccggaacg cgacatcact ccggttaacg atgaaaccat gcaggagatt 2280 aacactctgc tgatcgccct ggataaaaca tgggatgacg acttattgcc gctctgttcc 2340 cagatatttc gccgcgacat tcgtgcatcg tcagaactga cacaggccga agcagtaaaa 2400 gctcttggat tcctgaaaca gaaagccgca gagcagaagg tggcagcatg acaccggaca 2460 ttatcctgca gcgtaccggg atcgatgtga gagctgtcga acagggggat gatgcgtggc 2520 acaaattacg gctcggcgtc atcaccgctt cagaagttca caacgtgata gcaaaacccc 2580 gctccggaaa gaagtggcct gacatgaaaa tgtcctactt ccacaccctg cttgctgagg 2640 tttgcaccgg tgtggctccg gaagttaacg ctaaagcact ggcctgggga aaacagtacg 2700 agaacgacgc cagaaccctg tttgaattca cttccggcgt gaatgttact gaatccccga 2760 tcatctatcg cgacgaaagt atgcgtaccg cctgctctcc cgatggttta tgcagtgacg 2820 gcaacggcct tgaactgaaa tgcccgttta cctcccggga tttcatgaag ttccggctcg 2880 gtggtttcga ggccataaag tcagcttaca tggcccaggt gcagtacagc atgtgggtga 2940 cgcgaaaaaa tgcctggtac tttgccaact atgacccgcg tatgaagcgt gaaggcctgc 3000 attatgtcgt gattgagcgg gatgaaaagt acatggcgag ttttgacgag atcgtgccgg 3060 agttcatcga aaaaatggac gaggcactgg ctgaaattgg ttttgtattt ggggagcaat 3120 ggcgatgata agctagctta aaaaagcaaa agggccgcag atgcgaccct tgtgtatcaa 3180 acaagacgat taaaaatctt cgttagtttc tgctacgcct tcgctatcat ctacagagaa 3240 atccggcgtt gagttcgggt tgctcagcag caactcacgt actttcttct cgatctcttt 3300 cgcggtttcc gggttatctt tcagccaggc agtcgcattc gctttaccct gaccgatctt 3360 ctcacctttg tagctgtacc acgcgcctgc tttctcgatc agcttctctt ttacgcccag 3420 gtcaaccagt tcgccgtaga agttgatacc ttcgccgtag aggatctgga attcagcctg 3480 tttaaacggc gcagcgattt tgttcttcac cactttcacg cgggtttcgc tacccaccac 3540 gttttcgccc tctttcaccg cgccgatacg acggatgtcg agacgaacag aggcgtagaa 3600 tttcagcgcg ttaccaccgg tagtggtttc cgggttaccg aacatcacac caattttcat 3660 acggatctgg ttgatgaaga tcagcagcgt gttggactgc ttcaggttac ccgccagctt 3720 acgcatcgcc tggctcatca tacgtgccgc aaggcccatg tgagagtcgc cgatttcgcc 3780 ttcgatttcc gctttcggcg tcagtgccgc cacggagtca acgacgataa cgtctactgc 3840 gccagaacgc gccagggcgt cacagatttc cagtgcctgc tcgccggtgt ccggctggga 3900 gcacagcagg ttgtcgatat cgacgcccag tttacgtgcg tagattgggt ccagcgcgtg 3960 ttcagcatcg ataaacgcac aggttttacc ttcacgctgc gctgcggcga tcacctgcag 4020 cgtcagcgtg gttttaccgg aagattccgg tccgtagatt tcgacgatac ggcccatcgg 4080 cagaccacct gccccaagcg cgatatccag tgaaagcgaa ccggtagaga tggtttccac 4140 atccatggaa cggtcttcac ccaggcgcat gatggagcct ttaccaaatt gtttctcaat 4200 ctggcccagt gctgccgcca acgctttctg tttgttttcg tcgatagcca tttttactcc 4260 tgtcatgcct agcccatggg tatggacagt tttccctttg atatgtaacg gtgaacagtt 4320 gttctacttt tgtttgttag tcttgatgct tcactgatag atacaagagc cataagaacc 4380 tcagatcctt ccgtatttag ccagtatgtt ctctagtgtg gttcgttgtt tttgcgtgag 4440 ccatgagaac gaaccattga gatcatactt actttgcatg tcactcaaaa attttgcctc 4500 aaaactggtg agctgaattt ttgcagttaa agcatcgtgt agtgtttttc ttagtccgtt 4560 acgtaggtag gaatctgatg taatggttgt tggtattttg tcaccattca tttttatctg 4620 gttgttctca agttcggtta cgagatccat ttgtctatct agttcaactt ggaaaatcaa 4680 cgtatcagtc gggcggcctc gcttatcaac caccaatttc atattgctgt aagtgtttaa 4740 atctttactt attggtttca aaacccattg gttaagcctt ttaaactcat ggtagttatt 4800 ttcaagcatt aacatgaact taaattcatc aaggctaatc tctatatttg ccttgtgagt 4860 tttcttttgt gttagttctt ttaataacca ctcataaatc ctcatagagt atttgttttc 4920 aaaagactta acatgttcca gattatattt tatgaatttt tttaactgga aaagataagg 4980 caatatctct tcactaaaaa ctaattctaa tttttcgctt gagaacttgg catagtttgt 5040 ccactggaaa atctcaaagc ctttaaccaa aggattcctg atttccacag ttctcgtcat 5100 cagctctctg gttgctttag ctaatacacc ataagcattt tccctactga tgttcatcat 5160 ctgagcgtat tggttataag tgaacgatac cgtccgttct ttccttgtag ggttttcaat 5220 cgtggggttg agtagtgcca cacagcataa aattagcttg gtttcatgct ccgttaagtc 5280 atagcgacta atcgctagtt catttgcttt gaaaacaact aattcagaca tacatctcaa 5340 ttggtctagg tgattttaat cactatacca attgagatgg gctagtcaat gataattact 5400 agtccttttc ctttgagttg tgggtatctg taaattctgc tagacctttg ctggaaaact 5460 tgtaaattct gctagaccct ctgtaaattc cgctagacct ttgtgtgttt tttttgttta 5520 tattcaagtg gttataattt atagaataaa gaaagaataa aaaaagataa aaagaataga 5580 tcccagccct gtgtataact cactacttta gtcagttccg cagtattaca aaaggatgtc 5640 gcaaacgctg tttgctcctc tacaaaacag accttaaaac cctaaaggct taagtagcac 5700 cctcgcaagc tcggttgcgg ccgcaatcgg gcaaatcgct gaatattcct tttgtctccg 5760 accatcaggc acctgagtcg ctgtcttttt cgtgacattc agttcgctgc gctcacggct 5820 ctggcagtga atgggggtaa atggcactac aggcgccttt tatggattca tgcaaggaaa 5880 ctacccataa tacaagaaaa gcccgtcacg ggcttctcag ggcgttttat ggcgggtctg 5940 ctatgtggtg ctatctgact ttttgctgtt cagcagttcc tgccctctga ttttccagtc 6000 tgaccacttc ggattatccc gtgacaggtc attcagactg gctaatgcac ccagtaaggc 6060 agcggtatca tcaacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 6120 ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt 6180 taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 6240 tgaggcacct atctcagcga ttaagggcac caataactgc cttaaaaaaa ttacgccccg 6300 ccctgccact catcgcagta ctgttgtaat tcattaagca ttctgccgac atggaagcca 6360 tcacagacgg catgatgaac ctgaatcgcc agcggcatca gcaccttgtc gccttgcgta 6420 taatatttgc ccatggtgaa aacgggggcg aagaagttgt ccatattggc cacgtttaaa 6480 tcaaaactgg tgaaactcac ccagggattg gctgagacga aaaacatatt ctcaataaac 6540 cctttaggga aataggccag gttttcaccg taacacgcca catcttgcga atatatgtgt 6600 agaaactgcc ggaaatcgtc gtggtattca ctccagagcg atgaaaacgt ttcagtttgc 6660 tcatggaaaa cggtgtaaca agggtgaaca ctatcccata tcaccagctc accgtctttc 6720 attgccatac ggaattccgg atgagcattc atcaggcggg caagaatgtg aataaaggcc 6780 ggataaaact tgtgcttatt tttctttacg gtctttaaaa aggccgtaat atccagctga 6840 acggtctggt tataggtaca ttgagcaact gactgaaatg cctcaaaatg ttctttacga 6900 tgccattggg atatatcaac ggtggtatat ccagtgattt ttttctccat tttagcttcc 6960 ttagctcctg aaaatctcga taactcaaaa aatacgcccg gtagtgatct tatttcatta 7020 tggtgaaagt tggaacctct tacgtgccga aaagggaata agggcgacac ggaaatgttg 7080 aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 7140 gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 7200 tccccgaaaa gtgccacctg 7220 <210> 3 <211> 59 <212> DNA <213> Artificial <220> <223> PCR Primer <400> 3 gtgtttaatt ctgacaacct gagactcgac ggaaaaatga ttccggggat ccgtcgacc 59 <210> 4 <211> 58 <212> DNA <213> Artificial <220> <223> PCR Primer <400> 4 ttaattgagc tcctgtaccc caccaccgga gacggtttat gtaggctgga gctgcttc 58 <210> 5 <211> 33 <212> DNA <213> Artificial <220> <223> PCR Primer <400> 5 ggtattccat atgatctttg acggaaaggt cgc 33 <210> 6 <211> 24 <212> DNA <213> Artificial <220> <223> PCR Primer <400> 6 cgggatccct aggggcgctg accc 24 <210> 7 <211> 56 <212> DNA <213> Artificial <220> <223> PCR Primer <400> 7 gtttaacttt aagaaggaga tataccatga tctttgacgg aaaggtcgca atcatt 56 <210> 8 <211> 56 <212> DNA <213> Artificial <220> <223> PCR Primer <400> 8 aatgattgcg acctttccgt caaagatcat ggtatatctc cttcttaaag ttaaac 56 <210> 9 <211> 768 <212> DNA <213> Escherichia coli <220> <221> CDS <222> (1)..(768) <400> 9 gtg ttt aat tct gac aac ctg aga ctc gac gga aaa tgc gcc atc atc 48 Val Phe Asn Ser Asp Asn Leu Arg Leu Asp Gly Lys Cys Ala Ile Ile 1 5 10 15 aca ggt gcg ggt gca ggt att ggt aaa gaa atc gcc att aca ttc gcg 96 Thr Gly Ala Gly Ala Gly Ile Gly Lys Glu Ile Ala Ile Thr Phe Ala 20 25 30 aca gct ggc gca tct gtg gtg gtc agt gat att aac gcc gac gca gct 144 Thr Ala Gly Ala Ser Val Val Val Ser Asp Ile Asn Ala Asp Ala Ala 35 40 45 aac cat gtt gta gac gaa att caa caa ctg ggt ggt cag gca ttt gcc 192 Asn His Val Val Asp Glu Ile Gln Gln Leu Gly Gly Gln Ala Phe Ala 50 55 60 tgc cgt tgt gat att act tcc gaa cag gaa ctc tct gca ctg gca gac 240 Cys Arg Cys Asp Ile Thr Ser Glu Gln Glu Leu Ser Ala Leu Ala Asp 65 70 75 80 ttt gct atc agt aag ctg ggt aaa gtt gat att ctg gtt aac aac gcc 288 Phe Ala Ile Ser Lys Leu Gly Lys Val Asp Ile Leu Val Asn Asn Ala 85 90 95 ggt ggc ggt gga cct aaa ccg ttt gat atg cca atg gcg gat ttt cgc 336 Gly Gly Gly Gly Pro Lys Pro Phe Asp Met Pro Met Ala Asp Phe Arg 100 105 110 cgt gct tat gaa ctg aat gtg ttt tct ttt ttc cat ctg tca caa ctt 384 Arg Ala Tyr Glu Leu Asn Val Phe Ser Phe Phe His Leu Ser Gln Leu 115 120 125 gtt gcg cca gaa atg gaa aaa aat ggc ggt ggc gtt att ctg acc atc 432 Val Ala Pro Glu Met Glu Lys Asn Gly Gly Gly Val Ile Leu Thr Ile 130 135 140 act tct atg gcg gca gaa aat aaa aat ata aac atg act tcc tat gca 480 Thr Ser Met Ala Ala Glu Asn Lys Asn Ile Asn Met Thr Ser Tyr Ala 145 150 155 160 tca tct aaa gct gcg gcc agt cat ctg gtc aga aat atg gcg ttt gac 528 Ser Ser Lys Ala Ala Ala Ser His Leu Val Arg Asn Met Ala Phe Asp 165 170 175 cta ggt gaa aaa aat att cgg gta aat ggc att gcg ccg ggg gca ata 576 Leu Gly Glu Lys Asn Ile Arg Val Asn Gly Ile Ala Pro Gly Ala Ile 180 185 190 tta acc gat gcc ctg aaa tcc gtt att aca cca gaa att gaa caa aaa 624 Leu Thr Asp Ala Leu Lys Ser Val Ile Thr Pro Glu Ile Glu Gln Lys 195 200 205 atg tta cag cac acg ccg atc aga cgt ctg ggc caa ccg caa gat att 672 Met Leu Gln His Thr Pro Ile Arg Arg Leu Gly Gln Pro Gln Asp Ile 210 215 220 gct aac gca gcg ctg ttc ctt tgc tcg cct gct gcg agc tgg gta agc 720 Ala Asn Ala Ala Leu Phe Leu Cys Ser Pro Ala Ala Ser Trp Val Ser 225 230 235 240 gga caa att ctc acc gtc tcc ggt ggt ggg gta cag gag ctc aat taa 768 Gly Gln Ile Leu Thr Val Ser Gly Gly Gly Val Gln Glu Leu Asn 245 250 255 <210> 10 <211> 255 <212> PRT <213> Escherichia coli <400> 10 Val Phe Asn Ser Asp Asn Leu Arg Leu Asp Gly Lys Cys Ala Ile Ile 1 5 10 15 Thr Gly Ala Gly Ala Gly Ile Gly Lys Glu Ile Ala Ile Thr Phe Ala 20 25 30 Thr Ala Gly Ala Ser Val Val Val Ser Asp Ile Asn Ala Asp Ala Ala 35 40 45 Asn His Val Val Asp Glu Ile Gln Gln Leu Gly Gly Gln Ala Phe Ala 50 55 60 Cys Arg Cys Asp Ile Thr Ser Glu Gln Glu Leu Ser Ala Leu Ala Asp 65 70 75 80 Phe Ala Ile Ser Lys Leu Gly Lys Val Asp Ile Leu Val Asn Asn Ala 85 90 95 Gly Gly Gly Gly Pro Lys Pro Phe Asp Met Pro Met Ala Asp Phe Arg 100 105 110 Arg Ala Tyr Glu Leu Asn Val Phe Ser Phe Phe His Leu Ser Gln Leu 115 120 125 Val Ala Pro Glu Met Glu Lys Asn Gly Gly Gly Val Ile Leu Thr Ile 130 135 140 Thr Ser Met Ala Ala Glu Asn Lys Asn Ile Asn Met Thr Ser Tyr Ala 145 150 155 160 Ser Ser Lys Ala Ala Ala Ser His Leu Val Arg Asn Met Ala Phe Asp 165 170 175 Leu Gly Glu Lys Asn Ile Arg Val Asn Gly Ile Ala Pro Gly Ala Ile 180 185 190 Leu Thr Asp Ala Leu Lys Ser Val Ile Thr Pro Glu Ile Glu Gln Lys 195 200 205 Met Leu Gln His Thr Pro Ile Arg Arg Leu Gly Gln Pro Gln Asp Ile 210 215 220 Ala Asn Ala Ala Leu Phe Leu Cys Ser Pro Ala Ala Ser Trp Val Ser 225 230 235 240 Gly Gln Ile Leu Thr Val Ser Gly Gly Gly Val Gln Glu Leu Asn 245 250 255 <210> 11 <211> 813 <212> DNA <213> Clostridium sp. <220> <221> CDS <222> (1)..(813) <400> 11 atg gat ttt att gat ttt aag gag atg ggc aga atg ggg atc ttt gac 48 Met Asp Phe Ile Asp Phe Lys Glu Met Gly Arg Met Gly Ile Phe Asp 1 5 10 15 gga aag gtc gca atc att act ggc ggg ggc aag gcc aaa tcg atc ggc 96 Gly Lys Val Ala Ile Ile Thr Gly Gly Gly Lys Ala Lys Ser Ile Gly 20 25 30 tac ggc att gcc gtg gcc tat gct aag gag ggg gcc aac ctg gtc ctg 144 Tyr Gly Ile Ala Val Ala Tyr Ala Lys Glu Gly Ala Asn Leu Val Leu 35 40 45 acc ggc aga aac gag cag aaa ctg ctg gac gcc aag gag gag ctg gag 192 Thr Gly Arg Asn Glu Gln Lys Leu Leu Asp Ala Lys Glu Glu Leu Glu 50 55 60 cgc ctc tac ggc atc aag gtg ttg ccg ctg gcg gtg gac gtc acc ccc 240 Arg Leu Tyr Gly Ile Lys Val Leu Pro Leu Ala Val Asp Val Thr Pro 65 70 75 80 agc gat gag tcg gag gac cgg gtc aag gaa gcc gtg cag aag gtc atc 288 Ser Asp Glu Ser Glu Asp Arg Val Lys Glu Ala Val Gln Lys Val Ile 85 90 95 gcc gaa ttc ggc cgc atc gac gtg ctg atc aac aac gcc cag gcg tcg 336 Ala Glu Phe Gly Arg Ile Asp Val Leu Ile Asn Asn Ala Gln Ala Ser 100 105 110 gcc tcg ggc atc ccc ctg tcc atg cag acc aaa gac cac ttt gac ctg 384 Ala Ser Gly Ile Pro Leu Ser Met Gln Thr Lys Asp His Phe Asp Leu 115 120 125 ggc atc tac tcc ggg ctc tac gcc acc ttc tac tac atg agg gag tgc 432 Gly Ile Tyr Ser Gly Leu Tyr Ala Thr Phe Tyr Tyr Met Arg Glu Cys 130 135 140 tat ccc tac ctg aag gag acc cag ggc tcg gtc atc aac ttc gcc tcc 480 Tyr Pro Tyr Leu Lys Glu Thr Gln Gly Ser Val Ile Asn Phe Ala Ser 145 150 155 160 ggc gcc ggc ctc ttc ggc aac gtg ggt cag tgc tcc tac gcc gcc gcc 528 Gly Ala Gly Leu Phe Gly Asn Val Gly Gln Cys Ser Tyr Ala Ala Ala 165 170 175 aaa gag ggc atc cgc ggc ctc tcc cgc gtc gcg gcc acc gag tgg ggc 576 Lys Glu Gly Ile Arg Gly Leu Ser Arg Val Ala Ala Thr Glu Trp Gly 180 185 190 aag gac aac atc aac gtc aac gtg gtc tgc ccc ctg gcc atg acc gcc 624 Lys Asp Asn Ile Asn Val Asn Val Val Cys Pro Leu Ala Met Thr Ala 195 200 205 cag ctg gag aac ttc aag ctc tcc tac cct gag gcc tac gag aaa aac 672 Gln Leu Glu Asn Phe Lys Leu Ser Tyr Pro Glu Ala Tyr Glu Lys Asn 210 215 220 ctc aga ggg gtg ccc atg ggc cgc ttc ggt gac ccc gag ctg gac atc 720 Leu Arg Gly Val Pro Met Gly Arg Phe Gly Asp Pro Glu Leu Asp Ile 225 230 235 240 ggc cgg gtc tgc gtg cag ctc ggc tcg ccc gac ttc aag tac atg tcc 768 Gly Arg Val Cys Val Gln Leu Gly Ser Pro Asp Phe Lys Tyr Met Ser 245 250 255 ggc gag acc ctc acc ctg gaa ggc ggc atg ggt cag cgc ccc tag 813 Gly Glu Thr Leu Thr Leu Glu Gly Gly Met Gly Gln Arg Pro 260 265 270 <210> 12 <211> 270 <212> PRT <213> Clostridium sp. <400> 12 Met Asp Phe Ile Asp Phe Lys Glu Met Gly Arg Met Gly Ile Phe Asp 1 5 10 15 Gly Lys Val Ala Ile Ile Thr Gly Gly Gly Lys Ala Lys Ser Ile Gly 20 25 30 Tyr Gly Ile Ala Val Ala Tyr Ala Lys Glu Gly Ala Asn Leu Val Leu 35 40 45 Thr Gly Arg Asn Glu Gln Lys Leu Leu Asp Ala Lys Glu Glu Leu Glu 50 55 60 Arg Leu Tyr Gly Ile Lys Val Leu Pro Leu Ala Val Asp Val Thr Pro 65 70 75 80 Ser Asp Glu Ser Glu Asp Arg Val Lys Glu Ala Val Gln Lys Val Ile 85 90 95 Ala Glu Phe Gly Arg Ile Asp Val Leu Ile Asn Asn Ala Gln Ala Ser 100 105 110 Ala Ser Gly Ile Pro Leu Ser Met Gln Thr Lys Asp His Phe Asp Leu 115 120 125 Gly Ile Tyr Ser Gly Leu Tyr Ala Thr Phe Tyr Tyr Met Arg Glu Cys 130 135 140 Tyr Pro Tyr Leu Lys Glu Thr Gln Gly Ser Val Ile Asn Phe Ala Ser 145 150 155 160 Gly Ala Gly Leu Phe Gly Asn Val Gly Gln Cys Ser Tyr Ala Ala Ala 165 170 175 Lys Glu Gly Ile Arg Gly Leu Ser Arg Val Ala Ala Thr Glu Trp Gly 180 185 190 Lys Asp Asn Ile Asn Val Asn Val Val Cys Pro Leu Ala Met Thr Ala 195 200 205 Gln Leu Glu Asn Phe Lys Leu Ser Tyr Pro Glu Ala Tyr Glu Lys Asn 210 215 220 Leu Arg Gly Val Pro Met Gly Arg Phe Gly Asp Pro Glu Leu Asp Ile 225 230 235 240 Gly Arg Val Cys Val Gln Leu Gly Ser Pro Asp Phe Lys Tyr Met Ser 245 250 255 Gly Glu Thr Leu Thr Leu Glu Gly Gly Met Gly Gln Arg Pro 260 265 270 <210> 13 <211> 774 <212> DNA <213> Clostridium sp. <220> <221> CDS <222> (1)..(774) <400> 13 atc ttt gac gga aag gtc gca atc att act ggc ggg ggc aag gcc aaa 48 Ile Phe Asp Gly Lys Val Ala Ile Ile Thr Gly Gly Gly Lys Ala Lys 1 5 10 15 tcg atc ggc tac ggc att gcc gtg gcc tat gct aag gag ggg gcc aac 96 Ser Ile Gly Tyr Gly Ile Ala Val Ala Tyr Ala Lys Glu Gly Ala Asn 20 25 30 ctg gtc ctg acc ggc aga aac gag cag aaa ctg ctg gac gcc aag gag 144 Leu Val Leu Thr Gly Arg Asn Glu Gln Lys Leu Leu Asp Ala Lys Glu 35 40 45 gag ctg gag cgc ctc tac ggc atc aag gtg ttg ccg ctg gcg gtg gac 192 Glu Leu Glu Arg Leu Tyr Gly Ile Lys Val Leu Pro Leu Ala Val Asp 50 55 60 gtc acc ccc agc gat gag tcg gag gac cgg gtc aag gaa gcc gtg cag 240 Val Thr Pro Ser Asp Glu Ser Glu Asp Arg Val Lys Glu Ala Val Gln 65 70 75 80 aag gtc atc gcc gaa ttc ggc cgc atc gac gtg ctg atc aac aac gcc 288 Lys Val Ile Ala Glu Phe Gly Arg Ile Asp Val Leu Ile Asn Asn Ala 85 90 95 cag gcg tcg gcc tcg ggc atc ccc ctg tcc atg cag acc aaa gac cac 336 Gln Ala Ser Ala Ser Gly Ile Pro Leu Ser Met Gln Thr Lys Asp His 100 105 110 ttt gac ctg ggc atc tac tcc ggg ctc tac gcc acc ttc tac tac atg 384 Phe Asp Leu Gly Ile Tyr Ser Gly Leu Tyr Ala Thr Phe Tyr Tyr Met 115 120 125 agg gag tgc tat ccc tac ctg aag gag acc cag ggc tcg gtc atc aac 432 Arg Glu Cys Tyr Pro Tyr Leu Lys Glu Thr Gln Gly Ser Val Ile Asn 130 135 140 ttc gcc tcc ggc gcc ggc ctc ttc ggc aac gtg ggt cag tgc tcc tac 480 Phe Ala Ser Gly Ala Gly Leu Phe Gly Asn Val Gly Gln Cys Ser Tyr 145 150 155 160 gcc gcc gcc aaa gag ggc atc cgc ggc ctc tcc cgc gtc gcg gcc acc 528 Ala Ala Ala Lys Glu Gly Ile Arg Gly Leu Ser Arg Val Ala Ala Thr 165 170 175 gag tgg ggc aag gac aac atc aac gtc aac gtg gtc tgc ccc ctg gcc 576 Glu Trp Gly Lys Asp Asn Ile Asn Val Asn Val Val Cys Pro Leu Ala 180 185 190 atg acc gcc cag ctg gag aac ttc aag ctc tcc tac cct gag gcc tac 624 Met Thr Ala Gln Leu Glu Asn Phe Lys Leu Ser Tyr Pro Glu Ala Tyr 195 200 205 gag aaa aac ctc aga ggg gtg ccc atg ggc cgc ttc ggt gac ccc gag 672 Glu Lys Asn Leu Arg Gly Val Pro Met Gly Arg Phe Gly Asp Pro Glu 210 215 220 ctg gac atc ggc cgg gtc tgc gtg cag ctc ggc tcg ccc gac ttc aag 720 Leu Asp Ile Gly Arg Val Cys Val Gln Leu Gly Ser Pro Asp Phe Lys 225 230 235 240 tac atg tcc ggc gag acc ctc acc ctg gaa ggc ggc atg ggt cag cgc 768 Tyr Met Ser Gly Glu Thr Leu Thr Leu Glu Gly Gly Met Gly Gln Arg 245 250 255 ccc tag 774 Pro <210> 14 <211> 257 <212> PRT <213> Clostridium sp. <400> 14 Ile Phe Asp Gly Lys Val Ala Ile Ile Thr Gly Gly Gly Lys Ala Lys 1 5 10 15 Ser Ile Gly Tyr Gly Ile Ala Val Ala Tyr Ala Lys Glu Gly Ala Asn 20 25 30 Leu Val Leu Thr Gly Arg Asn Glu Gln Lys Leu Leu Asp Ala Lys Glu 35 40 45 Glu Leu Glu Arg Leu Tyr Gly Ile Lys Val Leu Pro Leu Ala Val Asp 50 55 60 Val Thr Pro Ser Asp Glu Ser Glu Asp Arg Val Lys Glu Ala Val Gln 65 70 75 80 Lys Val Ile Ala Glu Phe Gly Arg Ile Asp Val Leu Ile Asn Asn Ala 85 90 95 Gln Ala Ser Ala Ser Gly Ile Pro Leu Ser Met Gln Thr Lys Asp His 100 105 110 Phe Asp Leu Gly Ile Tyr Ser Gly Leu Tyr Ala Thr Phe Tyr Tyr Met 115 120 125 Arg Glu Cys Tyr Pro Tyr Leu Lys Glu Thr Gln Gly Ser Val Ile Asn 130 135 140 Phe Ala Ser Gly Ala Gly Leu Phe Gly Asn Val Gly Gln Cys Ser Tyr 145 150 155 160 Ala Ala Ala Lys Glu Gly Ile Arg Gly Leu Ser Arg Val Ala Ala Thr 165 170 175 Glu Trp Gly Lys Asp Asn Ile Asn Val Asn Val Val Cys Pro Leu Ala 180 185 190 Met Thr Ala Gln Leu Glu Asn Phe Lys Leu Ser Tyr Pro Glu Ala Tyr 195 200 205 Glu Lys Asn Leu Arg Gly Val Pro Met Gly Arg Phe Gly Asp Pro Glu 210 215 220 Leu Asp Ile Gly Arg Val Cys Val Gln Leu Gly Ser Pro Asp Phe Lys 225 230 235 240 Tyr Met Ser Gly Glu Thr Leu Thr Leu Glu Gly Gly Met Gly Gln Arg 245 250 255 Pro <210> 15 <211> 777 <212> DNA <213> Artificial <220> <223> Mutant Q97H <220> <221> CDS <222> (1)..(777) <400> 15 atg atc ttt gac gga aag gtc gca atc att act ggc ggg ggc aag gcc 48 Met Ile Phe Asp Gly Lys Val Ala Ile Ile Thr Gly Gly Gly Lys Ala 1 5 10 15 aaa tcg atc ggc tac ggc att gcc gtg gcc tat gct aag gag ggg gcc 96 Lys Ser Ile Gly Tyr Gly Ile Ala Val Ala Tyr Ala Lys Glu Gly Ala 20 25 30 aac ctg gtc ctg acc ggc aga aac gag cag aaa ctg ctg gac gcc aag 144 Asn Leu Val Leu Thr Gly Arg Asn Glu Gln Lys Leu Leu Asp Ala Lys 35 40 45 gag gag ctg gag cgc ctc tac ggc atc aag gtg ttg ccg ctg gcg gtg 192 Glu Glu Leu Glu Arg Leu Tyr Gly Ile Lys Val Leu Pro Leu Ala Val 50 55 60 gac gtc acc ccc agc gat gag tcg gag gac cgg gtc aag gaa gcc gtg 240 Asp Val Thr Pro Ser Asp Glu Ser Glu Asp Arg Val Lys Glu Ala Val 65 70 75 80 cag aag gtc atc gcc gaa ttc ggc cgc atc gac gtg ctg atc aac aac 288 Gln Lys Val Ile Ala Glu Phe Gly Arg Ile Asp Val Leu Ile Asn Asn 85 90 95 gcc cat gcg tcg gcc tcg ggc atc ccc ctg tcc atg cag acc aaa gac 336 Ala His Ala Ser Ala Ser Gly Ile Pro Leu Ser Met Gln Thr Lys Asp 100 105 110 cac ttt gac ctg ggc atc tac tcc ggg ctc tac gcc acc ttc tac tac 384 His Phe Asp Leu Gly Ile Tyr Ser Gly Leu Tyr Ala Thr Phe Tyr Tyr 115 120 125 atg agg gag tgc tat ccc tac ctg aag gag act cag ggc tcg gtc atc 432 Met Arg Glu Cys Tyr Pro Tyr Leu Lys Glu Thr Gln Gly Ser Val Ile 130 135 140 aac ttc gcc tcc ggc gcc ggc ctc ttc ggc aac gtg ggt cag tgc tcc 480 Asn Phe Ala Ser Gly Ala Gly Leu Phe Gly Asn Val Gly Gln Cys Ser 145 150 155 160 tac gcc gcc gcc aaa gag ggc atc cgc ggc ctc tcc cgc gtc gcg gcc 528 Tyr Ala Ala Ala Lys Glu Gly Ile Arg Gly Leu Ser Arg Val Ala Ala 165 170 175 acc gag tgg ggc aag gac aac atc aac gtc aac gtg gtc tgc ccc ctg 576 Thr Glu Trp Gly Lys Asp Asn Ile Asn Val Asn Val Val Cys Pro Leu 180 185 190 gcc atg acc gcc cag ctg gag aac ttc aag ctc tcc tac cct gag gcc 624 Ala Met Thr Ala Gln Leu Glu Asn Phe Lys Leu Ser Tyr Pro Glu Ala 195 200 205 tac gag aaa aac ctc aga ggg gtg ccc atg ggc cgc ttc ggt gac ccc 672 Tyr Glu Lys Asn Leu Arg Gly Val Pro Met Gly Arg Phe Gly Asp Pro 210 215 220 gag ctg gac atc ggc cgg gtc tgc gtg cag ctc ggc tcg ccc gac ttc 720 Glu Leu Asp Ile Gly Arg Val Cys Val Gln Leu Gly Ser Pro Asp Phe 225 230 235 240 aag tac atg tcc ggc gag acc ctc acc ctg gaa ggc ggc atg ggt cag 768 Lys Tyr Met Ser Gly Glu Thr Leu Thr Leu Glu Gly Gly Met Gly Gln 245 250 255 cgc ccc tag 777 Arg Pro <210> 16 <211> 258 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 16 Met Ile Phe Asp Gly Lys Val Ala Ile Ile Thr Gly Gly Gly Lys Ala 1 5 10 15 Lys Ser Ile Gly Tyr Gly Ile Ala Val Ala Tyr Ala Lys Glu Gly Ala 20 25 30 Asn Leu Val Leu Thr Gly Arg Asn Glu Gln Lys Leu Leu Asp Ala Lys 35 40 45 Glu Glu Leu Glu Arg Leu Tyr Gly Ile Lys Val Leu Pro Leu Ala Val 50 55 60 Asp Val Thr Pro Ser Asp Glu Ser Glu Asp Arg Val Lys Glu Ala Val 65 70 75 80 Gln Lys Val Ile Ala Glu Phe Gly Arg Ile Asp Val Leu Ile Asn Asn 85 90 95 Ala His Ala Ser Ala Ser Gly Ile Pro Leu Ser Met Gln Thr Lys Asp 100 105 110 His Phe Asp Leu Gly Ile Tyr Ser Gly Leu Tyr Ala Thr Phe Tyr Tyr 115 120 125 Met Arg Glu Cys Tyr Pro Tyr Leu Lys Glu Thr Gln Gly Ser Val Ile 130 135 140 Asn Phe Ala Ser Gly Ala Gly Leu Phe Gly Asn Val Gly Gln Cys Ser 145 150 155 160 Tyr Ala Ala Ala Lys Glu Gly Ile Arg Gly Leu Ser Arg Val Ala Ala 165 170 175 Thr Glu Trp Gly Lys Asp Asn Ile Asn Val Asn Val Val Cys Pro Leu 180 185 190 Ala Met Thr Ala Gln Leu Glu Asn Phe Lys Leu Ser Tyr Pro Glu Ala 195 200 205 Tyr Glu Lys Asn Leu Arg Gly Val Pro Met Gly Arg Phe Gly Asp Pro 210 215 220 Glu Leu Asp Ile Gly Arg Val Cys Val Gln Leu Gly Ser Pro Asp Phe 225 230 235 240 Lys Tyr Met Ser Gly Glu Thr Leu Thr Leu Glu Gly Gly Met Gly Gln 245 250 255 Arg Pro <210> 17 <211> 53 <212> DNA <213> Artificial <220> <223> PCR Primer <400> 17 aaaaaagctt ataattatcc ttataggacg tcatggtgcg cccagatagg gtg 53 <210> 18 <211> 60 <212> DNA <213> Artificial <220> <223> PCR Primer <400> 18 cagattgtac aaatgtggtg ataacagata agtcgtcatg tttaacttac ctttctttgt 60 <210> 19 <211> 49 <212> DNA <213> Artificial <220> <223> PCR Primer <400> 19 tgaacgcaag tttctaattt cggtttccta tcgatagagg aaagtgtct 49 <210> 20 <211> 27 <212> DNA <213> Artificial <220> <223> PCR Primer <400> 20 ttaattgagc tcctgtaccc caccacc 27 <210> 21 <211> 30 <212> DNA <213> Artificial <220> <223> PCR Primer <400> 21 gtgtttaatt ctgacaacct gagactcgac 30 <210> 22 <211> 1266 <212> DNA <213> Artificial <220> <223> FDH D221G Mutante mit His-Tag <220> <221> CDS <222> (1)..(1266) <400> 22 atg gca aag gtc ctg tgc gtt ctt tac gat gat ccg gtc gac ggc tac 48 Met Ala Lys Val Leu Cys Val Leu Tyr Asp Asp Pro Val Asp Gly Tyr 1 5 10 15 ccg aag acc tat gcc cgc gac gat ctt ccg aag atc gac cac tat ccg 96 Pro Lys Thr Tyr Ala Arg Asp Asp Leu Pro Lys Ile Asp His Tyr Pro 20 25 30 ggc ggc cag atc ttg ccg acg ccg aag gcc atc gac ttc acg ccc ggg 144 Gly Gly Gln Ile Leu Pro Thr Pro Lys Ala Ile Asp Phe Thr Pro Gly 35 40 45 cag ttg ctc ggc tcc gtc tcc ggc gag ctc ggc ctg cgc gaa tat ctc 192 Gln Leu Leu Gly Ser Val Ser Gly Glu Leu Gly Leu Arg Glu Tyr Leu 50 55 60 gaa tcc aac ggc cac acc ctg gtc gtg acc tcc gac aag gac ggc ccc 240 Glu Ser Asn Gly His Thr Leu Val Val Thr Ser Asp Lys Asp Gly Pro 65 70 75 80 gac tcg gtg ttc gag cgc gag ctg gtc gat gcg gat gtc gtc atc tcc 288 Asp Ser Val Phe Glu Arg Glu Leu Val Asp Ala Asp Val Val Ile Ser 85 90 95 cag ccc ttc tgg ccg gcc tat ctg acg ccc gag cgc atc gcc aag gcc 336 Gln Pro Phe Trp Pro Ala Tyr Leu Thr Pro Glu Arg Ile Ala Lys Ala 100 105 110 aag aac ctg aag ctc gcg ctc acc gcc ggc atc ggt tcc gac cac gtc 384 Lys Asn Leu Lys Leu Ala Leu Thr Ala Gly Ile Gly Ser Asp His Val 115 120 125 gat ctt cag tcg gct atc gac cgc aac gtc acc gtg gcg gaa gtc acc 432 Asp Leu Gln Ser Ala Ile Asp Arg Asn Val Thr Val Ala Glu Val Thr 130 135 140 tac tgc aac tcg atc agc gtc gcc gag cat gtg gtg atg atg atc ctg 480 Tyr Cys Asn Ser Ile Ser Val Ala Glu His Val Val Met Met Ile Leu 145 150 155 160 tcg ctg gtg cgc aac tat ctg ccc tcg cac gaa tgg gcg cgg aag ggc 528 Ser Leu Val Arg Asn Tyr Leu Pro Ser His Glu Trp Ala Arg Lys Gly 165 170 175 ggc tgg aac atc gcc gac tgc gtc tcc cac gcc tac gac ctc gag gcg 576 Gly Trp Asn Ile Ala Asp Cys Val Ser His Ala Tyr Asp Leu Glu Ala 180 185 190 atg cat gtc ggc acc gtg gcc gcc ggc cgc atc ggt ctc gcg gtg ctg 624 Met His Val Gly Thr Val Ala Ala Gly Arg Ile Gly Leu Ala Val Leu 195 200 205 cgc cgt ctg gcg ccg ttc gac gtg cac ctg cac tac acc ggc cgt cac 672 Arg Arg Leu Ala Pro Phe Asp Val His Leu His Tyr Thr Gly Arg His 210 215 220 cgc ctg ccg gaa tcg gtc gag aag gag ctc aac ctc acc tgg cac gcg 720 Arg Leu Pro Glu Ser Val Glu Lys Glu Leu Asn Leu Thr Trp His Ala 225 230 235 240 acc cgc gag gac atg tat ccg gtt tgc gac gtg gtg acg ctg aac tgc 768 Thr Arg Glu Asp Met Tyr Pro Val Cys Asp Val Val Thr Leu Asn Cys 245 250 255 ccg ctg cac ccc gaa acc gag cac atg atc aat gac gag acg ctg aag 816 Pro Leu His Pro Glu Thr Glu His Met Ile Asn Asp Glu Thr Leu Lys 260 265 270 ctg ttc aag cgt ggc gcc tac atc gtc aac acc gcc cgc ggc aag ctg 864 Leu Phe Lys Arg Gly Ala Tyr Ile Val Asn Thr Ala Arg Gly Lys Leu 275 280 285 tgc gac cgc gat gcc gtg gca cgt gcg ctc gaa tcc ggc cgg ctg gcc 912 Cys Asp Arg Asp Ala Val Ala Arg Ala Leu Glu Ser Gly Arg Leu Ala 290 295 300 ggc tat gcc ggc gac gtg tgg ttc ccg cag ccg gcg ccg aag gac cac 960 Gly Tyr Ala Gly Asp Val Trp Phe Pro Gln Pro Ala Pro Lys Asp His 305 310 315 320 ccc tgg cgg acg atg ccc tat aac ggc atg acc ccg cac atc tcc ggc 1008 Pro Trp Arg Thr Met Pro Tyr Asn Gly Met Thr Pro His Ile Ser Gly 325 330 335 acc acg ctg acc gcg cag gcg cgt tat gcg gcg ggc acc cgc gag atc 1056 Thr Thr Leu Thr Ala Gln Ala Arg Tyr Ala Ala Gly Thr Arg Glu Ile 340 345 350 ctg gag tgc ttc ttc gag ggc cgt ccg atc cgc gac gaa tac ctc atc 1104 Leu Glu Cys Phe Phe Glu Gly Arg Pro Ile Arg Asp Glu Tyr Leu Ile 355 360 365 gtg cag ggc ggc gct ctt gcc ggc acc ggc gcg cat tcc tac tcg aag 1152 Val Gln Gly Gly Ala Leu Ala Gly Thr Gly Ala His Ser Tyr Ser Lys 370 375 380 ggc aat gcc acc ggc ggt tcg gaa gag gcc gcc aag ttc aag aag gcg 1200 Gly Asn Ala Thr Gly Gly Ser Glu Glu Ala Ala Lys Phe Lys Lys Ala 385 390 395 400 gct gag aat tcg agc tcc gtc gac aag ctt gcg gcc gca ctc gag cac 1248 Ala Glu Asn Ser Ser Ser Val Asp Lys Leu Ala Ala Ala Leu Glu His 405 410 415 cac cac cac cac cac tga 1266 His His His His His 420 <210> 23 <211> 421 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 23 Met Ala Lys Val Leu Cys Val Leu Tyr Asp Asp Pro Val Asp Gly Tyr 1 5 10 15 Pro Lys Thr Tyr Ala Arg Asp Asp Leu Pro Lys Ile Asp His Tyr Pro 20 25 30 Gly Gly Gln Ile Leu Pro Thr Pro Lys Ala Ile Asp Phe Thr Pro Gly 35 40 45 Gln Leu Leu Gly Ser Val Ser Gly Glu Leu Gly Leu Arg Glu Tyr Leu 50 55 60 Glu Ser Asn Gly His Thr Leu Val Val Thr Ser Asp Lys Asp Gly Pro 65 70 75 80 Asp Ser Val Phe Glu Arg Glu Leu Val Asp Ala Asp Val Val Ile Ser 85 90 95 Gln Pro Phe Trp Pro Ala Tyr Leu Thr Pro Glu Arg Ile Ala Lys Ala 100 105 110 Lys Asn Leu Lys Leu Ala Leu Thr Ala Gly Ile Gly Ser Asp His Val 115 120 125 Asp Leu Gln Ser Ala Ile Asp Arg Asn Val Thr Val Ala Glu Val Thr 130 135 140 Tyr Cys Asn Ser Ile Ser Val Ala Glu His Val Val Met Met Ile Leu 145 150 155 160 Ser Leu Val Arg Asn Tyr Leu Pro Ser His Glu Trp Ala Arg Lys Gly 165 170 175 Gly Trp Asn Ile Ala Asp Cys Val Ser His Ala Tyr Asp Leu Glu Ala 180 185 190 Met His Val Gly Thr Val Ala Ala Gly Arg Ile Gly Leu Ala Val Leu 195 200 205 Arg Arg Leu Ala Pro Phe Asp Val His Leu His Tyr Thr Gly Arg His 210 215 220 Arg Leu Pro Glu Ser Val Glu Lys Glu Leu Asn Leu Thr Trp His Ala 225 230 235 240 Thr Arg Glu Asp Met Tyr Pro Val Cys Asp Val Val Thr Leu Asn Cys 245 250 255 Pro Leu His Pro Glu Thr Glu His Met Ile Asn Asp Glu Thr Leu Lys 260 265 270 Leu Phe Lys Arg Gly Ala Tyr Ile Val Asn Thr Ala Arg Gly Lys Leu 275 280 285 Cys Asp Arg Asp Ala Val Ala Arg Ala Leu Glu Ser Gly Arg Leu Ala 290 295 300 Gly Tyr Ala Gly Asp Val Trp Phe Pro Gln Pro Ala Pro Lys Asp His 305 310 315 320 Pro Trp Arg Thr Met Pro Tyr Asn Gly Met Thr Pro His Ile Ser Gly 325 330 335 Thr Thr Leu Thr Ala Gln Ala Arg Tyr Ala Ala Gly Thr Arg Glu Ile 340 345 350 Leu Glu Cys Phe Phe Glu Gly Arg Pro Ile Arg Asp Glu Tyr Leu Ile 355 360 365 Val Gln Gly Gly Ala Leu Ala Gly Thr Gly Ala His Ser Tyr Ser Lys 370 375 380 Gly Asn Ala Thr Gly Gly Ser Glu Glu Ala Ala Lys Phe Lys Lys Ala 385 390 395 400 Ala Glu Asn Ser Ser Ser Val Asp Lys Leu Ala Ala Ala Leu Glu His 405 410 415 His His His His His 420 <210> 24 <211> 792 <212> DNA <213> Collinsella aerofaciens <220> <221> CDS <222> (1)..(792) <400> 24 atg aac ctg agg gag aag tac ggt gag tgg ggc ctg atc ctg ggc gcg 48 Met Asn Leu Arg Glu Lys Tyr Gly Glu Trp Gly Leu Ile Leu Gly Ala 1 5 10 15 acc gag ggc gtc ggc aag gcg ttc tgc gag aag atc gcc gcc ggc ggc 96 Thr Glu Gly Val Gly Lys Ala Phe Cys Glu Lys Ile Ala Ala Gly Gly 20 25 30 atg aac gtc gtc atg gtc ggc cgt cgc gag gag aag ctg aac gtg ctc 144 Met Asn Val Val Met Val Gly Arg Arg Glu Glu Lys Leu Asn Val Leu 35 40 45 gca ggc gag atc cgc gag acc tac ggc gtg gag acc aag gtc gtg cgc 192 Ala Gly Glu Ile Arg Glu Thr Tyr Gly Val Glu Thr Lys Val Val Arg 50 55 60 gcc gac ttt agc cag ccc ggc gct gcc gag acc gtc ttc gcc gcg acc 240 Ala Asp Phe Ser Gln Pro Gly Ala Ala Glu Thr Val Phe Ala Ala Thr 65 70 75 80 gag ggc ctg gac atg ggc ttc atg agc tac gtg gcc tgc ctg cac agc 288 Glu Gly Leu Asp Met Gly Phe Met Ser Tyr Val Ala Cys Leu His Ser 85 90 95 ttc ggt aag atc cag gac acc ccc tgg gag aag cac gag gcc atg atc 336 Phe Gly Lys Ile Gln Asp Thr Pro Trp Glu Lys His Glu Ala Met Ile 100 105 110 aac gtc aac gtc gtg acc ttc ctc aag tgc ttc cac cac tac atg cgg 384 Asn Val Asn Val Val Thr Phe Leu Lys Cys Phe His His Tyr Met Arg 115 120 125 atc ttt gcc gcc cag gac cgc ggc gcc gtg atc aac gtc tcg tcg atg 432 Ile Phe Ala Ala Gln Asp Arg Gly Ala Val Ile Asn Val Ser Ser Met 130 135 140 acc ggc atc agc tcc agc ccc tgg aac ggc cag tac ggc gcg ggc aag 480 Thr Gly Ile Ser Ser Ser Pro Trp Asn Gly Gln Tyr Gly Ala Gly Lys 145 150 155 160 gcc ttc atc ctc aag atg acc gag gcc gtg gcc tgc gag tgc gag ggc 528 Ala Phe Ile Leu Lys Met Thr Glu Ala Val Ala Cys Glu Cys Glu Gly 165 170 175 acc ggc gtc gac gtc gag gtc atc acc ctc ggc acc acc cta acc ccc 576 Thr Gly Val Asp Val Glu Val Ile Thr Leu Gly Thr Thr Leu Thr Pro 180 185 190 agc ctg ctg tcc aac ctc ccc ggc ggc ccg cag ggc gag gcc gtc atg 624 Ser Leu Leu Ser Asn Leu Pro Gly Gly Pro Gln Gly Glu Ala Val Met 195 200 205 aag atc gcc ctc acc ccc gag gag tgc gtt gac gag gcc ttt gag aag 672 Lys Ile Ala Leu Thr Pro Glu Glu Cys Val Asp Glu Ala Phe Glu Lys 210 215 220 ctg ggt aag gag ctc tcc gtc atc gcc ggc cag cgc aac aag gac tcc 720 Leu Gly Lys Glu Leu Ser Val Ile Ala Gly Gln Arg Asn Lys Asp Ser 225 230 235 240 gtc cac gac tgg aag gca aac cac acc gag gac gag tac atc cgc tac 768 Val His Asp Trp Lys Ala Asn His Thr Glu Asp Glu Tyr Ile Arg Tyr 245 250 255 atg ggg tcg ttc tac cgc gac tag 792 Met Gly Ser Phe Tyr Arg Asp 260 <210> 25 <211> 263 <212> PRT <213> Collinsella aerofaciens <400> 25 Met Asn Leu Arg Glu Lys Tyr Gly Glu Trp Gly Leu Ile Leu Gly Ala 1 5 10 15 Thr Glu Gly Val Gly Lys Ala Phe Cys Glu Lys Ile Ala Ala Gly Gly 20 25 30 Met Asn Val Val Met Val Gly Arg Arg Glu Glu Lys Leu Asn Val Leu 35 40 45 Ala Gly Glu Ile Arg Glu Thr Tyr Gly Val Glu Thr Lys Val Val Arg 50 55 60 Ala Asp Phe Ser Gln Pro Gly Ala Ala Glu Thr Val Phe Ala Ala Thr 65 70 75 80 Glu Gly Leu Asp Met Gly Phe Met Ser Tyr Val Ala Cys Leu His Ser 85 90 95 Phe Gly Lys Ile Gln Asp Thr Pro Trp Glu Lys His Glu Ala Met Ile 100 105 110 Asn Val Asn Val Val Thr Phe Leu Lys Cys Phe His His Tyr Met Arg 115 120 125 Ile Phe Ala Ala Gln Asp Arg Gly Ala Val Ile Asn Val Ser Ser Met 130 135 140 Thr Gly Ile Ser Ser Ser Pro Trp Asn Gly Gln Tyr Gly Ala Gly Lys 145 150 155 160 Ala Phe Ile Leu Lys Met Thr Glu Ala Val Ala Cys Glu Cys Glu Gly 165 170 175 Thr Gly Val Asp Val Glu Val Ile Thr Leu Gly Thr Thr Leu Thr Pro 180 185 190 Ser Leu Leu Ser Asn Leu Pro Gly Gly Pro Gln Gly Glu Ala Val Met 195 200 205 Lys Ile Ala Leu Thr Pro Glu Glu Cys Val Asp Glu Ala Phe Glu Lys 210 215 220 Leu Gly Lys Glu Leu Ser Val Ile Ala Gly Gln Arg Asn Lys Asp Ser 225 230 235 240 Val His Asp Trp Lys Ala Asn His Thr Glu Asp Glu Tyr Ile Arg Tyr 245 250 255 Met Gly Ser Phe Tyr Arg Asp 260 <210> 26 <211> 31 <212> DNA <213> artificial <220> <223> PCR Primer <400> 26 gggaattcca tatgaacctg agggagaagt a 31 <210> 27 <211> 27 <212> DNA <213> Artificial <220> <223> PCR Primer <400> 27 cccaagcttc tagtcgcggt agaacga 27 <210> 28 <211> 774 <212> DNA <213> Comamonas testosteroni <220> <221> CDS <222> (1)..(774) <400> 28 atg tcc atc atc gtg ata agc ggc tgc gcc acc ggc att ggt gcc gct 48 Met Ser Ile Ile Val Ile Ser Gly Cys Ala Thr Gly Ile Gly Ala Ala 1 5 10 15 acg cgc aag gtc ctg gag gcg gcc ggt cac cag atc gta ggc atc gat 96 Thr Arg Lys Val Leu Glu Ala Ala Gly His Gln Ile Val Gly Ile Asp 20 25 30 ata cgc gat gcg gaa gtg att gcc gat ctc tcg acg gcc gaa ggt cga 144 Ile Arg Asp Ala Glu Val Ile Ala Asp Leu Ser Thr Ala Glu Gly Arg 35 40 45 aag cag gcg att gcc gat gta ctg gcg aag tgc agc aag ggc atg gac 192 Lys Gln Ala Ile Ala Asp Val Leu Ala Lys Cys Ser Lys Gly Met Asp 50 55 60 ggc ctg gtg ctg tgc gcc ggc ctg gga ccg cag acc aag gtg ctt ggc 240 Gly Leu Val Leu Cys Ala Gly Leu Gly Pro Gln Thr Lys Val Leu Gly 65 70 75 80 aat gtg gtt tcg gtc aat tat ttt ggc gcg acc gag ctg atg gat gcc 288 Asn Val Val Ser Val Asn Tyr Phe Gly Ala Thr Glu Leu Met Asp Ala 85 90 95 ttt ttg cca gcg ctg aaa aaa ggc cat cag ccc gca gcc gtc gtc atc 336 Phe Leu Pro Ala Leu Lys Lys Gly His Gln Pro Ala Ala Val Val Ile 100 105 110 tcg tcc gtg gct tcc gcg cat ctg gct ttt gac aag aac cca ctg gcg 384 Ser Ser Val Ala Ser Ala His Leu Ala Phe Asp Lys Asn Pro Leu Ala 115 120 125 ctg gca ctg gaa gcc ggc gag gaa gcc aag gcc cgc gcc att gtc gaa 432 Leu Ala Leu Glu Ala Gly Glu Glu Ala Lys Ala Arg Ala Ile Val Glu 130 135 140 cat gcg gga gag cag ggc gga aat ctg gcc tat gcg ggc agc aag aat 480 His Ala Gly Glu Gln Gly Gly Asn Leu Ala Tyr Ala Gly Ser Lys Asn 145 150 155 160 gct ttg acg gtg gct gtg cgc aaa cgc gcc gcc gcc tgg ggc gag gct 528 Ala Leu Thr Val Ala Val Arg Lys Arg Ala Ala Ala Trp Gly Glu Ala 165 170 175 ggc gtg cgc ctg aac acc atc gcc ccc ggt gca acc gag act ccc ttg 576 Gly Val Arg Leu Asn Thr Ile Ala Pro Gly Ala Thr Glu Thr Pro Leu 180 185 190 ctg cag gcg ggc ctg cag gac ccg cgc tat ggc gaa tcc att gcc aag 624 Leu Gln Ala Gly Leu Gln Asp Pro Arg Tyr Gly Glu Ser Ile Ala Lys 195 200 205 ttc gtt cct ccc atg ggc cgc cgt gcc gag ccg tcc gag atg gcg tcg 672 Phe Val Pro Pro Met Gly Arg Arg Ala Glu Pro Ser Glu Met Ala Ser 210 215 220 gtc atc gcc ttt ttg atg agc ccg gcc gca agc tat gtg cat ggc gcg 720 Val Ile Ala Phe Leu Met Ser Pro Ala Ala Ser Tyr Val His Gly Ala 225 230 235 240 cag atc gtc att gat ggc ggc att gat gcg gtg atg cgc ccg aca cag 768 Gln Ile Val Ile Asp Gly Gly Ile Asp Ala Val Met Arg Pro Thr Gln 245 250 255 ttc tga 774 Phe <210> 29 <211> 257 <212> PRT <213> Comamonas testosteroni <400> 29 Met Ser Ile Ile Val Ile Ser Gly Cys Ala Thr Gly Ile Gly Ala Ala 1 5 10 15 Thr Arg Lys Val Leu Glu Ala Ala Gly His Gln Ile Val Gly Ile Asp 20 25 30 Ile Arg Asp Ala Glu Val Ile Ala Asp Leu Ser Thr Ala Glu Gly Arg 35 40 45 Lys Gln Ala Ile Ala Asp Val Leu Ala Lys Cys Ser Lys Gly Met Asp 50 55 60 Gly Leu Val Leu Cys Ala Gly Leu Gly Pro Gln Thr Lys Val Leu Gly 65 70 75 80 Asn Val Val Ser Val Asn Tyr Phe Gly Ala Thr Glu Leu Met Asp Ala 85 90 95 Phe Leu Pro Ala Leu Lys Lys Gly His Gln Pro Ala Ala Val Val Ile 100 105 110 Ser Ser Val Ala Ser Ala His Leu Ala Phe Asp Lys Asn Pro Leu Ala 115 120 125 Leu Ala Leu Glu Ala Gly Glu Glu Ala Lys Ala Arg Ala Ile Val Glu 130 135 140 His Ala Gly Glu Gln Gly Gly Asn Leu Ala Tyr Ala Gly Ser Lys Asn 145 150 155 160 Ala Leu Thr Val Ala Val Arg Lys Arg Ala Ala Ala Trp Gly Glu Ala 165 170 175 Gly Val Arg Leu Asn Thr Ile Ala Pro Gly Ala Thr Glu Thr Pro Leu 180 185 190 Leu Gln Ala Gly Leu Gln Asp Pro Arg Tyr Gly Glu Ser Ile Ala Lys 195 200 205 Phe Val Pro Pro Met Gly Arg Arg Ala Glu Pro Ser Glu Met Ala Ser 210 215 220 Val Ile Ala Phe Leu Met Ser Pro Ala Ala Ser Tyr Val His Gly Ala 225 230 235 240 Gln Ile Val Ile Asp Gly Gly Ile Asp Ala Val Met Arg Pro Thr Gln 245 250 255 Phe <210> 30 <211> 969 <212> DNA <213> Rattus norvegicus <220> <221> CDS <222> (1)..(969) <400> 30 atg gat tcc ata tct ctg cgt gta gca cta aat gat ggt aac ttc att 48 Met Asp Ser Ile Ser Leu Arg Val Ala Leu Asn Asp Gly Asn Phe Ile 1 5 10 15 cct gta ctg ggg ttt gga acc act gtg cct gag aag gtt gct aag gat 96 Pro Val Leu Gly Phe Gly Thr Thr Val Pro Glu Lys Val Ala Lys Asp 20 25 30 gaa gtt atc aag gct act aaa ata gct ata gat aat gga ttc cgc cat 144 Glu Val Ile Lys Ala Thr Lys Ile Ala Ile Asp Asn Gly Phe Arg His 35 40 45 ttt gac tct gct tat ttg tac gaa gta gaa gag gaa gtg ggc caa gcc 192 Phe Asp Ser Ala Tyr Leu Tyr Glu Val Glu Glu Glu Val Gly Gln Ala 50 55 60 att aga agc aag att gaa gac ggc act gtg aag aga gaa gat ata ttc 240 Ile Arg Ser Lys Ile Glu Asp Gly Thr Val Lys Arg Glu Asp Ile Phe 65 70 75 80 tat act tca aag ctt tgg agc act ttc cat aga cca gag ctg gtc cga 288 Tyr Thr Ser Lys Leu Trp Ser Thr Phe His Arg Pro Glu Leu Val Arg 85 90 95 act tgc ttg gaa aag aca ctg aaa agc act caa ctg gac tat gtg gat 336 Thr Cys Leu Glu Lys Thr Leu Lys Ser Thr Gln Leu Asp Tyr Val Asp 100 105 110 ctt tat att att cat ttc cca atg gct ttg cag cct gga gat ata ttt 384 Leu Tyr Ile Ile His Phe Pro Met Ala Leu Gln Pro Gly Asp Ile Phe 115 120 125 ttc cca cga gat gag cat gga aaa cta ttg ttt gaa aca gtg gat atc 432 Phe Pro Arg Asp Glu His Gly Lys Leu Leu Phe Glu Thr Val Asp Ile 130 135 140 tgt gac aca tgg gag gcc atg gaa aag tgt aag gat gca gga ttg gcc 480 Cys Asp Thr Trp Glu Ala Met Glu Lys Cys Lys Asp Ala Gly Leu Ala 145 150 155 160 aag tct att ggg gtg tcc aac ttt aac tgc agg cag ctg gag agg att 528 Lys Ser Ile Gly Val Ser Asn Phe Asn Cys Arg Gln Leu Glu Arg Ile 165 170 175 ctg aat aag cca ggg ctc aaa tac aag cct gtg tgc aac cag gtg gaa 576 Leu Asn Lys Pro Gly Leu Lys Tyr Lys Pro Val Cys Asn Gln Val Glu 180 185 190 tgt cac ctt tat ctc aac cag agc aaa atg ctg gac tat tgt aag tca 624 Cys His Leu Tyr Leu Asn Gln Ser Lys Met Leu Asp Tyr Cys Lys Ser 195 200 205 aaa gac atc att ctg gtt tcc tac tgc acg ctg gga agt tca cga gac 672 Lys Asp Ile Ile Leu Val Ser Tyr Cys Thr Leu Gly Ser Ser Arg Asp 210 215 220 aaa aca tgg gtg gat cag aaa agt cca gtt ctc cta gat gat cca gtt 720 Lys Thr Trp Val Asp Gln Lys Ser Pro Val Leu Leu Asp Asp Pro Val 225 230 235 240 ctt tgt gcc ata gca aag aag tac aag caa acc cca gcc cta gtt gcc 768 Leu Cys Ala Ile Ala Lys Lys Tyr Lys Gln Thr Pro Ala Leu Val Ala 245 250 255 ctt cgc tac cag ctg cag cgt ggg gtt gtg ccc ctg atc agg agt ttc 816 Leu Arg Tyr Gln Leu Gln Arg Gly Val Val Pro Leu Ile Arg Ser Phe 260 265 270 aac gcg aag cgg atc aaa gag cta aca cag gtt ttt gaa ttc cag ttg 864 Asn Ala Lys Arg Ile Lys Glu Leu Thr Gln Val Phe Glu Phe Gln Leu 275 280 285 gct tca gag gac atg aaa gcc ctg gat ggc ttg aac aga aat ttc aga 912 Ala Ser Glu Asp Met Lys Ala Leu Asp Gly Leu Asn Arg Asn Phe Arg 290 295 300 tac aac aat gca aaa tat ttt gat gac cat ccc aat cat cca ttt act 960 Tyr Asn Asn Ala Lys Tyr Phe Asp Asp His Pro Asn His Pro Phe Thr 305 310 315 320 gat gaa tag 969 Asp Glu <210> 31 <211> 322 <212> PRT <213> Rattus norvegicus <400> 31 Met Asp Ser Ile Ser Leu Arg Val Ala Leu Asn Asp Gly Asn Phe Ile 1 5 10 15 Pro Val Leu Gly Phe Gly Thr Thr Val Pro Glu Lys Val Ala Lys Asp 20 25 30 Glu Val Ile Lys Ala Thr Lys Ile Ala Ile Asp Asn Gly Phe Arg His 35 40 45 Phe Asp Ser Ala Tyr Leu Tyr Glu Val Glu Glu Glu Val Gly Gln Ala 50 55 60 Ile Arg Ser Lys Ile Glu Asp Gly Thr Val Lys Arg Glu Asp Ile Phe 65 70 75 80 Tyr Thr Ser Lys Leu Trp Ser Thr Phe His Arg Pro Glu Leu Val Arg 85 90 95 Thr Cys Leu Glu Lys Thr Leu Lys Ser Thr Gln Leu Asp Tyr Val Asp 100 105 110 Leu Tyr Ile Ile His Phe Pro Met Ala Leu Gln Pro Gly Asp Ile Phe 115 120 125 Phe Pro Arg Asp Glu His Gly Lys Leu Leu Phe Glu Thr Val Asp Ile 130 135 140 Cys Asp Thr Trp Glu Ala Met Glu Lys Cys Lys Asp Ala Gly Leu Ala 145 150 155 160 Lys Ser Ile Gly Val Ser Asn Phe Asn Cys Arg Gln Leu Glu Arg Ile 165 170 175 Leu Asn Lys Pro Gly Leu Lys Tyr Lys Pro Val Cys Asn Gln Val Glu 180 185 190 Cys His Leu Tyr Leu Asn Gln Ser Lys Met Leu Asp Tyr Cys Lys Ser 195 200 205 Lys Asp Ile Ile Leu Val Ser Tyr Cys Thr Leu Gly Ser Ser Arg Asp 210 215 220 Lys Thr Trp Val Asp Gln Lys Ser Pro Val Leu Leu Asp Asp Pro Val 225 230 235 240 Leu Cys Ala Ile Ala Lys Lys Tyr Lys Gln Thr Pro Ala Leu Val Ala 245 250 255 Leu Arg Tyr Gln Leu Gln Arg Gly Val Val Pro Leu Ile Arg Ser Phe 260 265 270 Asn Ala Lys Arg Ile Lys Glu Leu Thr Gln Val Phe Glu Phe Gln Leu 275 280 285 Ala Ser Glu Asp Met Lys Ala Leu Asp Gly Leu Asn Arg Asn Phe Arg 290 295 300 Tyr Asn Asn Ala Lys Tyr Phe Asp Asp His Pro Asn His Pro Phe Thr 305 310 315 320 Asp Glu <210> 32 <211> 401 <212> PRT <213> Mycobacterium vaccae <400> 32 Met Ala Lys Val Leu Cys Val Leu Tyr Asp Asp Pro Val Asp Gly Tyr 1 5 10 15 Pro Lys Thr Tyr Ala Arg Asp Asp Leu Pro Lys Ile Asp His Tyr Pro 20 25 30 Gly Gly Gln Ile Leu Pro Thr Pro Lys Ala Ile Asp Phe Thr Pro Gly 35 40 45 Gln Leu Leu Gly Ser Val Ser Gly Glu Leu Gly Leu Arg Glu Tyr Leu 50 55 60 Glu Ser Asn Gly His Thr Leu Val Val Thr Ser Asp Lys Asp Gly Pro 65 70 75 80 Asp Ser Val Phe Glu Arg Glu Leu Val Asp Ala Asp Val Val Ile Ser 85 90 95 Gln Pro Phe Trp Pro Ala Tyr Leu Thr Pro Glu Arg Ile Ala Lys Ala 100 105 110 Lys Asn Leu Lys Leu Ala Leu Thr Ala Gly Ile Gly Ser Asp His Val 115 120 125 Asp Leu Gln Ser Ala Ile Asp Arg Asn Val Thr Val Ala Glu Val Thr 130 135 140 Tyr Cys Asn Ser Ile Ser Val Ala Glu His Val Val Met Met Ile Leu 145 150 155 160 Ser Leu Val Arg Asn Tyr Leu Pro Ser His Glu Trp Ala Arg Lys Gly 165 170 175 Gly Trp Asn Ile Ala Asp Cys Val Ser His Ala Tyr Asp Leu Glu Ala 180 185 190 Met His Val Gly Thr Val Ala Ala Gly Arg Ile Gly Leu Ala Val Leu 195 200 205 Arg Arg Leu Ala Pro Phe Asp Val His Leu His Tyr Thr Asp Arg His 210 215 220 Arg Leu Pro Glu Ser Val Glu Lys Glu Leu Asn Leu Thr Trp His Ala 225 230 235 240 Thr Arg Glu Asp Met Tyr Pro Val Cys Asp Val Val Thr Leu Asn Cys 245 250 255 Pro Leu His Pro Glu Thr Glu His Met Ile Asn Asp Glu Thr Leu Lys 260 265 270 Leu Phe Lys Arg Gly Ala Tyr Ile Val Asn Thr Ala Arg Gly Lys Leu 275 280 285 Cys Asp Arg Asp Ala Val Ala Arg Ala Leu Glu Ser Gly Arg Leu Ala 290 295 300 Gly Tyr Ala Gly Asp Val Trp Phe Pro Gln Pro Ala Pro Lys Asp His 305 310 315 320 Pro Trp Arg Thr Met Pro Tyr Asn Gly Met Thr Pro His Ile Ser Gly 325 330 335 Thr Thr Leu Thr Ala Gln Ala Arg Tyr Ala Ala Gly Thr Arg Glu Ile 340 345 350 Leu Glu Cys Phe Phe Glu Gly Arg Pro Ile Arg Asp Glu Tyr Leu Ile 355 360 365 Val Gln Gly Gly Ala Leu Ala Gly Thr Gly Ala His Ser Tyr Ser Lys 370 375 380 Gly Asn Ala Thr Gly Gly Ser Glu Glu Ala Ala Lys Phe Lys Lys Ala 385 390 395 400 Val <210> 33 <211> 29 <212> DNA <213> Artificial <220> <223> PCR Primer <400> 33 cgatcatatg gcaaaggtcc tgtgcgttc 29 <210> 34 <211> 29 <212> DNA <213> Artificial <220> <223> PCR Primer <400> 34 gctagaattc tcagccgcct tcttgaact 29 <210> 35 <211> 29 <212> DNA <213> Artificial <220> <223> PCR Primer <400> 35 cctgcactac accggccgtc accgcctgc 29 <210> 36 <211> 23 <212> DNA <213> Artificial <220> <223> PCR Primer <400> 36 gctcgaattc tcagaccgcc ttc 23 <210> 37 <211> 1206 <212> DNA <213> Artificial <220> <223> Formiate Deydrogenase Mutant <220> <221> CDS <222> (1)..(1206) <400> 37 atg gca aag gtc ctg tgc gtt ctt tac gat gat ccg gtc gac ggc tac 48 Met Ala Lys Val Leu Cys Val Leu Tyr Asp Asp Pro Val Asp Gly Tyr 1 5 10 15 ccg aag acc tat gcc cgc gac gat ctt ccg aag atc gac cac tat ccg 96 Pro Lys Thr Tyr Ala Arg Asp Asp Leu Pro Lys Ile Asp His Tyr Pro 20 25 30 ggc ggc cag atc ttg ccg acg ccg aag gcc atc gac ttc acg ccc ggg 144 Gly Gly Gln Ile Leu Pro Thr Pro Lys Ala Ile Asp Phe Thr Pro Gly 35 40 45 cag ttg ctc ggc tcc gtc tcc ggc gag ctc ggc ctg cgc gaa tat ctc 192 Gln Leu Leu Gly Ser Val Ser Gly Glu Leu Gly Leu Arg Glu Tyr Leu 50 55 60 gaa tcc aac ggc cac acc ctg gtc gtg acc tcc gac aag gac ggc ccc 240 Glu Ser Asn Gly His Thr Leu Val Val Thr Ser Asp Lys Asp Gly Pro 65 70 75 80 gac tcg gtg ttc gag cgc gag ctg gtc gat gcg gat gtc gtc atc tcc 288 Asp Ser Val Phe Glu Arg Glu Leu Val Asp Ala Asp Val Val Ile Ser 85 90 95 cag ccc ttc tgg ccg gcc tat ctg acg ccc gag cgc atc gcc aag gcc 336 Gln Pro Phe Trp Pro Ala Tyr Leu Thr Pro Glu Arg Ile Ala Lys Ala 100 105 110 aag aac ctg aag ctc gcg ctc acc gcc ggc atc ggt tcc gac cac gtc 384 Lys Asn Leu Lys Leu Ala Leu Thr Ala Gly Ile Gly Ser Asp His Val 115 120 125 gat ctt cag tcg gct atc gac cgc aac gtc acc gtg gcg gaa gtc acc 432 Asp Leu Gln Ser Ala Ile Asp Arg Asn Val Thr Val Ala Glu Val Thr 130 135 140 tac tgc aac tcg atc agc gtc gcc gag cat gtg gtg atg atg atc ctg 480 Tyr Cys Asn Ser Ile Ser Val Ala Glu His Val Val Met Met Ile Leu 145 150 155 160 tcg ctg gtg cgc aac tat ctg ccc tcg cac gaa tgg gcg cgg aag ggc 528 Ser Leu Val Arg Asn Tyr Leu Pro Ser His Glu Trp Ala Arg Lys Gly 165 170 175 ggc tgg aac atc gcc gac tgc gtc tcc cac gcc tac gac ctc gag gcg 576 Gly Trp Asn Ile Ala Asp Cys Val Ser His Ala Tyr Asp Leu Glu Ala 180 185 190 atg cat gtc ggc acc gtg gcc gcc ggc cgc atc ggt ctc gcg gtg ctg 624 Met His Val Gly Thr Val Ala Ala Gly Arg Ile Gly Leu Ala Val Leu 195 200 205 cgc cgt ctg gcg ccg ttc gac gtg cac ctg cac tac acc ggc cgt cac 672 Arg Arg Leu Ala Pro Phe Asp Val His Leu His Tyr Thr Gly Arg His 210 215 220 cgc ctg ccg gaa tcg gtc gag aag gag ctc aac ctc acc tgg cac gcg 720 Arg Leu Pro Glu Ser Val Glu Lys Glu Leu Asn Leu Thr Trp His Ala 225 230 235 240 acc cgc gag gac atg tat ccg gtt tgc gac gtg gtg acg ctg aac tgc 768 Thr Arg Glu Asp Met Tyr Pro Val Cys Asp Val Val Thr Leu Asn Cys 245 250 255 ccg ctg cac ccc gaa acc gag cac atg atc aat gac gag acg ctg aag 816 Pro Leu His Pro Glu Thr Glu His Met Ile Asn Asp Glu Thr Leu Lys 260 265 270 ctg ttc aag cgt ggc gcc tac atc gtc aac acc gcc cgc ggc aag ctg 864 Leu Phe Lys Arg Gly Ala Tyr Ile Val Asn Thr Ala Arg Gly Lys Leu 275 280 285 tgc gac cgc gat gcc gtg gca cgt gcg ctc gaa tcc ggc cgg ctg gcc 912 Cys Asp Arg Asp Ala Val Ala Arg Ala Leu Glu Ser Gly Arg Leu Ala 290 295 300 ggc tat gcc ggc gac gtg tgg ttc ccg cag ccg gcg ccg aag gac cac 960 Gly Tyr Ala Gly Asp Val Trp Phe Pro Gln Pro Ala Pro Lys Asp His 305 310 315 320 ccc tgg cgg acg atg ccc tat aac ggc atg acc ccg cac atc tcc ggc 1008 Pro Trp Arg Thr Met Pro Tyr Asn Gly Met Thr Pro His Ile Ser Gly 325 330 335 acc acg ctg acc gcg cag gcg cgt tat gcg gcg ggc acc cgc gag atc 1056 Thr Thr Leu Thr Ala Gln Ala Arg Tyr Ala Ala Gly Thr Arg Glu Ile 340 345 350 ctg gag tgc ttc ttc gag ggc cgt ccg atc cgc gac gaa tac ctc atc 1104 Leu Glu Cys Phe Phe Glu Gly Arg Pro Ile Arg Asp Glu Tyr Leu Ile 355 360 365 gtg cag ggc ggc gct ctt gcc ggc acc ggc gcg cat tcc tac tcg aag 1152 Val Gln Gly Gly Ala Leu Ala Gly Thr Gly Ala His Ser Tyr Ser Lys 370 375 380 ggc aat gcc acc ggc ggt tcg gaa gag gcc gcc aag ttc aag aag gcg 1200 Gly Asn Ala Thr Gly Gly Ser Glu Glu Ala Ala Lys Phe Lys Lys Ala 385 390 395 400 gtc tga 1206 Val <210> 38 <211> 401 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 38 Met Ala Lys Val Leu Cys Val Leu Tyr Asp Asp Pro Val Asp Gly Tyr 1 5 10 15 Pro Lys Thr Tyr Ala Arg Asp Asp Leu Pro Lys Ile Asp His Tyr Pro 20 25 30 Gly Gly Gln Ile Leu Pro Thr Pro Lys Ala Ile Asp Phe Thr Pro Gly 35 40 45 Gln Leu Leu Gly Ser Val Ser Gly Glu Leu Gly Leu Arg Glu Tyr Leu 50 55 60 Glu Ser Asn Gly His Thr Leu Val Val Thr Ser Asp Lys Asp Gly Pro 65 70 75 80 Asp Ser Val Phe Glu Arg Glu Leu Val Asp Ala Asp Val Val Ile Ser 85 90 95 Gln Pro Phe Trp Pro Ala Tyr Leu Thr Pro Glu Arg Ile Ala Lys Ala 100 105 110 Lys Asn Leu Lys Leu Ala Leu Thr Ala Gly Ile Gly Ser Asp His Val 115 120 125 Asp Leu Gln Ser Ala Ile Asp Arg Asn Val Thr Val Ala Glu Val Thr 130 135 140 Tyr Cys Asn Ser Ile Ser Val Ala Glu His Val Val Met Met Ile Leu 145 150 155 160 Ser Leu Val Arg Asn Tyr Leu Pro Ser His Glu Trp Ala Arg Lys Gly 165 170 175 Gly Trp Asn Ile Ala Asp Cys Val Ser His Ala Tyr Asp Leu Glu Ala 180 185 190 Met His Val Gly Thr Val Ala Ala Gly Arg Ile Gly Leu Ala Val Leu 195 200 205 Arg Arg Leu Ala Pro Phe Asp Val His Leu His Tyr Thr Gly Arg His 210 215 220 Arg Leu Pro Glu Ser Val Glu Lys Glu Leu Asn Leu Thr Trp His Ala 225 230 235 240 Thr Arg Glu Asp Met Tyr Pro Val Cys Asp Val Val Thr Leu Asn Cys 245 250 255 Pro Leu His Pro Glu Thr Glu His Met Ile Asn Asp Glu Thr Leu Lys 260 265 270 Leu Phe Lys Arg Gly Ala Tyr Ile Val Asn Thr Ala Arg Gly Lys Leu 275 280 285 Cys Asp Arg Asp Ala Val Ala Arg Ala Leu Glu Ser Gly Arg Leu Ala 290 295 300 Gly Tyr Ala Gly Asp Val Trp Phe Pro Gln Pro Ala Pro Lys Asp His 305 310 315 320 Pro Trp Arg Thr Met Pro Tyr Asn Gly Met Thr Pro His Ile Ser Gly 325 330 335 Thr Thr Leu Thr Ala Gln Ala Arg Tyr Ala Ala Gly Thr Arg Glu Ile 340 345 350 Leu Glu Cys Phe Phe Glu Gly Arg Pro Ile Arg Asp Glu Tyr Leu Ile 355 360 365 Val Gln Gly Gly Ala Leu Ala Gly Thr Gly Ala His Ser Tyr Ser Lys 370 375 380 Gly Asn Ala Thr Gly Gly Ser Glu Glu Ala Ala Lys Phe Lys Lys Ala 385 390 395 400 Val

Claims

7α-히드록시스테로이드 데히드로게나제 (7α-HSDH)의 효소적 활성은 억제되지만, 기능적으로 상이한 히드록시스테로이드 데히드로게나제 (예컨대 3α-, 3β-, 7β-, 11α-, 11β-, 12α-, 12β-, 17α-, 17β-, 20α- 또는 20β-HSDH, 특히 3α-, 7β- 또는 12α-HSDH)의 효소적 활성은 발현가능하게 함유되어 있는 재조합 미생물.
제1항에 있어서, 7α-HSDH를 코딩하는 핵산 서열이 상동성 재조합에 의해 또는 유전자 파괴에 의해 (특히 코딩된 유전자 산물의 효소 기능을 억제하는 핵산 서열의 삽입에 의해) 녹아웃된 것인 재조합 미생물.
제1항 또는 제2항에 있어서, 7α-HSDH를 발현하는 전구체 미생물, 특히 7α-HSDH를 내인성으로 발현하는 전구체 미생물, 특히 에스케리키아(Escherichia) 속의 박테리아, 특별히 이. 콜라이(E. coli)로부터 유래된 재조합 미생물.
제1항 내지 제3항 중 어느 한 항에 있어서, 7α-HSDH와 기능적으로 상이한 HSDH, 예컨대 특히 3α-, 7β- 및/또는 12α-HSDH를 재조합적으로 발현하는 재조합 미생물.
제1항 내지 제4항 중 어느 한 항에 있어서, 녹아웃된 7α-HSDH가 서열 10에 따른 아미노산 서열을 갖거나 또는 서열 9에 따른 핵산 서열에 의해 코딩된 것인 재조합 미생물.
제1항 내지 제5항 중 어느 한 항에 있어서, 7α-HSDH와 기능적으로 상이한 발현된 HSDH가 하기 아미노산 서열:
a) 서열 29 및 31로부터 선택된 3α-HSDH 서열
b) 서열 25로부터 선택된 7β-HSDH 서열
및
c) 서열 12, 14, 16으로부터 선택된 12α-HSDH 서열
중 하나; 또는
d) a), b) 및 c) 하의 서열 중 하나에 대해 50% 이상의 동일성 정도를 가지며 HSDH를 코딩하는, 상기 서열로부터 유래된 아미노산 서열
을 함유하는 것인 재조합 미생물.
7α-HSDH의 효소적 활성이 억제된 제1항 내지 제6항 중 어느 한 항에 청구된 바와 같은 재조합 미생물을 목적하는 HSDH가 발현되는 조건 하에 배양하고, 이에 따라 발현된 HSDH를 단리하며, 여기서 본질적으로 어떠한 기능적 7α-HSDH도 단리된 HSDH 중에서 검출되지 않는 것인, 7α-HSDH와 기능적으로 상이한 목적하는 HSDH의 재조합 생산 방법.
제1항 내지 제6항 중 어느 한 항에 청구된 바와 같은 재조합 미생물로부터 수득가능한, 7α-HSDH 효소 또는 효소 활성에 의해 오염되지 않은 3α-, 3β-, 7β-, 11α-, 11β-, 12α-, 12β-, 17α-, 17β-, 20α- 또는 20β-HSDH로부터 선택된, 특히 3α-, 7β- 및 12α-HSDH로부터 선택된 재조합 HSDH.
제8항에 있어서,
a) 서열 29 및 31로부터 선택된 3α-HSDH 서열
b) 서열 25로부터 선택된 7β-HSDH 서열
및
c) 서열 12, 14, 16으로부터 선택된 12α-HSDH 서열
로부터 선택된 아미노산 서열, 또는
d) a), b) 및 c) 하의 서열 중 하나에 대해 50% 이상의 동일성 정도를 갖는, 상기 서열로부터 유래된 아미노산 서열
을 포함하는 재조합 HSDH.
스테로이드 구조의 위치 3α-, 3β-, 11α-, 11β-, 12α-, 12β-, 17α-, 17β-, 20α- 또는 20β- 중 하나 이상, 특히 스테로이드 구조의 12α-위치에 있는 히드록실 기 이외에 스테로이드 구조의 7α-위치에 1개 이상의 추가의 히드록실 기를 함유하는 히드록시스테로이드를 제8항 또는 제9항에 청구된 바와 같은 3α-, 3β-, 11α-, 11β-, 12α-, 12β-, 17α-, 17β-, 20α- 또는 20β-HSDH, 특히 12α-HSDH의 존재 하에 또는 제1항 내지 제6항 중 어느 한 항에 청구된 바와 같은 재조합 미생물의 존재 하에 반응시키고, 형성된 하나 이상의 산화 생성물을 반응 배치로부터 임의로 단리하는, 상기 히드록시스테로이드의 선택적 효소적 산화 방법.
제10항에 있어서, 히드록시스테로이드가 콜산 (CA) 또는 콜산 유도체, 예컨대 특히 염, 아미드 또는 알킬 에스테르인 방법.
제11항에 있어서, CA 또는 그의 유도체가 반응하여 12-케토케노데옥시콜산 (12-케토-CDCA)을 제공하거나 또는 상응하는 유도체를 제공하는 것인 방법.
a) 하기 화학식 2의 콜산 (CA)을 제8항 또는 제9항에 청구된 바와 같은 12α-HSDH의 존재 하에 또는 제1항 내지 제6항 중 어느 한 항에 청구된 바와 같은 재조합 미생물의 존재 하에 하기 화학식 3의 상응하는 12-케토케노데옥시콜산 (12-케토 CDCA)으로 산화시키고;
<화학식 2>

(상기 식에서, R은 알킬, NR¹R², H, 알칼리 금속 이온 또는 N(R³)₄ ⁺를 나타내고, 여기서 라디칼 R³은 동일하거나 상이하고 H 또는 알킬을 나타내고, 라디칼 R_a는 동일하거나 상이하고 H 또는 아실을 나타냄)
<화학식 3>

(상기 식에서, R 및 R_a는 상기 나타낸 의미를 가짐)
후속적으로
b) 화학식 3의 12-케토-CDCA를 탈산소화에 의해 반응시켜 하기 화학식 4의 케노데옥시콜산 (CDCA)를 수득하고;
<화학식 4>

(상기 식에서, R 및 R_a는 상기 나타낸 의미를 가짐)
c) 화학식 4의 CDCA를 위치 7에서 하기 화학식 5의 7-케토리토콜산 (KLCA)으로 화학적으로 산화시키고;
<화학식 5>

(상기 식에서, R 및 R_a는 상기 나타낸 의미를 가짐)
d) 화학식 5의 KLCA를 환원시키고;
e) 반응 생성물을 임의로 추가로 정제하는,
하기 화학식 1의 우르소데옥시콜산 (UDCA)의 생산 방법.
<화학식 1>

(상기 식에서, R은 상기 나타낸 의미를 가짐)
스테로이드 구조의 위치 3, 11, 12, 17 또는 20, 특히 스테로이드 구조의 위치 12 및/또는 위치 3에 1개 이상의 케토 기 이외에도 스테로이드 구조의 위치 7에 1개 이상의 추가의 케토 기를 갖는 케토스테로이드를 제8항 또는 제9항에 청구된 바와 같은 3α-, 3β-, 7β-, 11α-, 11β-, 12α-, 12β-, 17α-, 17β-, 20α- 또는 20β-HSDH, 특히 7β-HSDH 및/또는 3α-HSDH 및/또는 12α-HSDH의 존재 하에 또는 제1항 내지 제6항 중 어느 한 항에 청구된 바와 같은 재조합 미생물의 존재 하에 반응시키고, 형성된 하나 이상의 환원 생성물을 반응 배치로부터 임의로 단리하는, 상기 케토스테로이드의 선택적 효소적 환원 방법.
제10항 내지 제14항 중 어느 한 항에 있어서, 목적하는 반응을 촉매화하는 하나 이상의 HSDH (예컨대 특히 7β-HSDH, 3α-HSDH 및/또는 12α-HSDH)가 용해, 분산 또는 고정화 형태로 사용되거나; 또는 제1항 내지 제6항 중 어느 한 항에 청구된 바와 같은 재조합 미생물의 임의로 고정화된 전세포의 존재 하에 수행되는 방법.
a) 임의로 하기 화학식 2의 콜산 (CA)을 하기 화학식 3의 데히드로콜산 (DHCA)으로 화학적으로 산화시키고;
<화학식 2>

(상기 식에서, R은 알킬, NR¹R², H, 알칼리 금속 이온 또는 N(R³)₄ ⁺를 나타내고, 여기서 라디칼 R³은 동일하거나 상이하고 H 또는 알킬을 나타냄)
<화학식 3>

(상기 식에서, R은 상기 나타낸 의미를 가짐)
b) DHCA를 임의의 목적하는 순서로 또는 두 가지 효소의 동시 존재 하에 제8항 또는 제9항에 청구된 바와 같은 7β-HSDH 및 3α-HSDH를 사용하여 하기 화학식 5의 상응하는 12-케토우르소데옥시콜산 (12-케토 UDCA)으로 환원시키고;
<화학식 5>

(상기 식에서, R은 상기 나타낸 의미를 가짐)
후속적으로
d) 화학식 5의 12-케토-UDCA를 UDCA로 화학적으로 환원시키고;
e) 반응 생성물을 임의로 추가로 정제하는,
하기 화학식 1의 우르소데옥시콜산 (UDCA)의 생산 방법.
<화학식 1>

(상기 식에서, R은 상기 나타낸 의미를 가짐)
제10항 내지 제16항 중 어느 한 항에 있어서, 효소적 산화환원 단계(들)가 (특히 효소적) 보조인자 재생 단계와 커플링되는 것인 방법.