KR20070041792A

KR20070041792A - 신규 시토크롬 ｐ450 모노옥시게나제 및 유기 화합물의산화를 위한 그의 용도

Info

Publication number: KR20070041792A
Application number: KR1020077007332A
Authority: KR
Inventors: 베른하르트 하우어; 위르겐 플라이스; 울리히 슈바네버크; 유타 슈미트; 마쿠스 피셔; 롤프 슈미트; 킹-샨 리; 다니엘 아펠; 사비네 루츠-발
Original assignee: 바스프 악티엔게젤샤프트
Priority date: 1999-07-27
Filing date: 2000-07-27
Publication date: 2007-04-19
Also published as: EP1196605A1; ES2311470T3; JP4791664B2; ATE409232T1; IL147580A; KR20020016924A; WO2001007630A1; EE200200048A; BR0012772B1; NO20020380L; HUP0202074A2; AU780694B2; CN1183252C; IL147580A0; US7960155B1; BR0012772A; CN1365393A; DE50015373D1; JP2003521889A; CA2380186C

Abstract

본 발명은 변형 기질 특이성을 갖는 신규 시토크롬 P450 모노옥시게나제, 이를 코딩하는 뉴클레오티드 서열, 상기 서열을 포함하는 발현 구조체 및 벡터, 및 이를 사용하여 형질전환된 미생물에 관한 것이다. 또한, 본 발명은 상이한 유기 기질을 미생물에 의해 산화시키는 방법, 예를 들어 인디고 및 인디루빈의 제조 방법에 관한 것이다.

시토크롬 P450 모노옥시게나제, 뉴클레오티드 서열, 발현 구조체, 벡터, 형질전환된 미생물, 유기 화합물의 산화, 인디고 및 인디루빈의 제조

Description

신규 시토크롬 Ｐ450 모노옥시게나제 및 유기 화합물의 산화를 위한 그의 용도 {Novel Cytochrome P450 Monooxygenases and Their Use for Oxidizing Organic Compounds}

본 발명은 유기 기질, 예를 들어 N-헤테로시클릭 방향족 화합물을 산화시킬 수 있는 변형 기질 특이성을 갖는 신규 시토크롬 P450 모노옥시게나제, 이를 코딩하는 뉴클레오티드 서열, 상기 서열을 포함하는 발현 구조체 및 벡터, 이를 사용하여 형질전환된 미생물, 상이한 유기 기질, 예를 들어 N-헤테로시클릭 방향족 화합물을 미생물에 의해 산화시키는 방법 및 특히 인디고 및 인디루빈의 제조 방법에 관한 것이다.

신규한 기능과 특성을 갖는 효소는 천연 시료의 스크리닝에 의해, 또는 공지 효소의 단백질 공학에 의해 제조할 수 있다. 특정 환경 하에서, 상기한 공지 효소의 단백질 공학에 의한 방법은 자연 선택 경로에 의해서는 발생할 것 같지 않은 특성들을 유도하기 위해 보다 적합할 수 있다. 효소 공학에서 수많은 시도가 있었음에도 불구하고, 현재까지 특정 기질에 대한 효소 변이체의 촉매 활성을 촉진시키는 연구는 단지 몇가지만 성공하였다 (참고문헌 1-10 참조). 이들 공지된 경우에서, 기질은 각 효소의 천연 기질과 구조적으로 밀접하게 관련되어 있다. 아직까지, 변형 후에 효소의 천연 기질과 구조적으로 완전히 상이한 화합물의 반응을 촉매화하는 효소의 성공적인 공학에 관한 보고는 없다.

세균 바실러스 메가테리움 (Bacillus megaterium)으로부터 단리가능한 시토크롬 P450 모노옥시게나제는 일반적으로 장쇄 포화산과 그의 대응하는 아미드 및 알콜의 하위말단 히드록실화, 또는 장쇄 불포화 지방산 또는 중쇄 포화 지방산의 에폭시드화를 촉매화한다 (참고문헌 11-13 참조). 포화 지방산의 최적 사슬 길이는 탄소원자수 14 내지 16이다. 사슬 길이가 12 미만인 지방산은 히드록실화되지 않는다 (참고문헌 11 참조).

P450 BM-3의 헴 (heme) 도메인의 구조는 X-선 구조 분석에 의해 결정되었다 (참고문헌 14-16 참조). 기질 결합 부위는 분자의 표면으로부터 헴 분자만큼 멀리 뻗어있고 소수성 아미노산 잔기에 의해 거의 독점적으로 둘러싸인 긴 터널형 구멍 형태로 존재한다. 헴 도메인 표면 상의 하전된 잔기는 잔기 Arg47과 Tyr51 뿐이다. 이들 잔기가 수소 결합의 형성에 의해 기질의 카르복실레이트기의 결합에 관여하는 것으로 추정된다 (참고문헌 14 참조). Arg47을 Glu로 돌연변이시키면 아라키돈산에 대해 효소가 불활성화되지만 (참고문헌 13 참조), C₁₂-C₁₄-알킬트리메틸암모늄 화합물에 비해서는 그 활성이 증가한다 (참고문헌 17 참조). 상기 효소에 대해 방향족 화합물, 특히 1핵, 2핵 또는 다핵 (필요한 경우 헤테로시클릭) 방향족 화합물, 알칸, 알켄, 시클론알칸 및 시클로알켄에 대한 기질 이용성은 설명되지 않 았다. 따라서, 지금까지 전문가 집단에서는 지금까지 설명된 유기 기질 이외의 기질, 예를 들어 인돌은 P450 BM-3의 천연 기질과 구조가 명백하게 상이하며 특히 기질 포켓 내의 상기 언급한 잔기에 결합할 수 있는 관능기가 존재하기 않기 때문에 기질이 아닌 것으로 추정되었다.

본 발명의 목적은 변형 기질 특이성 또는 변형 기질 프로파일을 갖는 신규 시토크롬 P450 모노옥시게나제를 제공하는 것이다. 특히, 비변이 야생형 효소에 비교하여, 구조적으로 명백히 상이한 기질에 대해 효소 활성을 갖는 모노옥시게나제 변이체를 제공한다.

야생형 효소에 비교하여, "변형 기질 프로파일"은 본 발명에 따른 변이체에서 관찰할 수 있다. 특히, 논의된 변이체에서, 군 a) 내지 d)에 정의된 1종 이상의 산화가능한 화합물의 전환에서, 반응성의 개선, 예를 들어 비활성도 (전환된 기질의 nmol/분/P450 효소의 nmol로 표현됨)의 증가, 및(또는) Kcat, Km 및 Kcat/Km으로 이루어진 군 중에서 선택된 하나 이상의 동력학적 파라미터의 증가 (예를 들어 1% 이상, 예를 들어 10 내지 1000%, 10 내지 500%, 또는 10 내지 100%)가 관찰된다. 본 발명에 따른 산화 반응은 1종 이상의 외생성 (즉, 반응 매질에 첨가됨) 또는 내생성 (즉, 반응 매질 내에 이미 존재함) 유기 기질의 효소 촉매화된 산화를 포함한다. 특히, 본 발명에 따른 산화 반응은 지방족 또는 방향족 C-H기에서의 모노- 및(또는) 폴리히드록실화, 예를 들어 모노- 및(또는) 디히드록실화, 또는 바람 직하게는 비방향족인 C=C기에서의 에폭시드화를 포함한다. 상기 반응들의 조합도 또한 가능하다. 또한 즉각의 반응 생성물은 효소에 의하지 않은 후속 반응 또는 부반응에서 추가로 전환시킬 수 있다. 효소에 의한 공정과 효소에 의하지 않은 공정의 그러한 조합도 마찬가지로 본 발명의 주제의 일부를 형성한다.

본 발명자들은 놀랍게도 예를 들어 N-헤테로시클릭 2핵 또는 다핵 방향족 화합물을 산화시킬 수 있는 신규 시토크롬 P450 모노옥시게나제에 의해 상기 목적을 달성할 수 있음을 발견하기에 이르렀다.

특히, 본 발명은 그 기질 결합 영역이 부위 특이적 돌연변이에 의해 신규의, 예를 들어 N-헤테로시클릭 기질을 기능적으로 흡입할 수 있는, 상기한 모노옥시게나제에 관한 것이다.

본 발명의 바람직한 실시형태에서, 신규 모노옥시게나제는 가용성이며, 즉 막에 결합하지 않은 형태로 존재하며 이 형태로 효소 활성을 갖는다.

본 발명에 따른 모노옥시게나제는 바람직하게는 아미노산 서열 영역 172-224 (F/G 루프 영역), 39-43 (β-스트랜드 1), 48-52 (β-스트랜드 2), 67-70 (β-스트랜드 3), 330-335 (β-스트랜드 5), 352-356 (β-스트랜드 8), 73-82 (헬릭스 5) 및 86-88 (헬릭스 6) 중 하나에서 적어도 하나의 기능적 돌연변이를 갖는, 즉 신규 유기 기질 (특히 아래에 정의된 군 a) 내지 d)의 화합물 참조), 예를 들어 N-헤테로시클릭 1핵, 2핵 또는 다핵 방향족 화합물의 산화를 촉진하는, 특히 서열 번호 2에 따른 아미노산 서열을 갖는 바실러스 메가테리움으로부터의 시토크롬 P450 모노옥시게나제 BM-3로부터 유래하는 것과 같이, 세균 기원의 시토크롬 P450 모노옥시 게나제로부터 유래한다.

본 발명에 따라 제공되는 시토크롬 P450 모노옥시게나제 변이체는 바람직하게는

a) 비치환 또는 치환된 N-, O- 또는 S-헤테로시클릭 1핵, 2핵 또는 다핵 방향족 화합물의 산화;

b) 비치환 또는 치환된 1핵 또는 다핵 방향족 화합물의 산화;

c) 직쇄 또는 분지쇄 알칸 및 알켄의 산화; 및

d) 비치환 또는 치환된 시클로알칸 및 시클로알켄의 산화

중 하나 이상의 반응을 수행할 수 있다.

바람직한 모노옥시게나제 변이체는 서열 영역 73-82, 86-88 및 172-224 중 적어도 하나에서 적어도 하나의 기능적 돌연변이, 특히 아미노산 치환을 갖는다. 따라서, 예를 들어 Phe87은 지방족 측쇄를 갖는 아미노산, 예를 들어 Ala, Val, Leu, 특히 Val으로 치환될 수 있고; Leu188은 아미드 측쇄를 갖는 아미노산, 예를 들어 Asn 또는 특히 Gln으로 치환될 수 있으며; Ala74는 지방족 측쇄를 갖는 다른 아미노산, 예를 들어 Val 및 특히 Gly로 치환될 수 있다.

이러한 유형의 특히 바람직한 모노옥시게나제 변이체는

1) Phe87Val;

2) Phe87Val, Leu188Gln; 또는

3) Phe87Val, Leu188Gln, Ala74Gly의 단일 아미노산 또는 다중 아미노산 치환체 및 그의 기능적 등가물 중 적어도 하나를 갖는 것이다. 숫자는 돌연변이의 위치를 나타내며; 원래 아미노산은 숫자 앞에 표시되고 새로 도입된 아미노산은 숫자 다음에 표시된다.

본 명세서에서, 구체적으로 개시된 변이체의 "기능적 등가물" 또는 유사체는 변이체와는 상이하고 추가로 상기한 산화 반응 a) 내지 d) 중 적어도 하나에 대한, 예를 들어 헤테로시클릭 방향족 화합물에 대한 목적하는 기질 특이성을 가지며, 예를 들어 인돌을 히드록실화하거나, 또는 추가로 야생형 효소에 관해 목적하는 "변형 기질 프로파일"을 보이는 변이체이다.

또한, "기능적 등가물"은 본 발명에서 상기 언급한 서열 위치 중 적어도 하나에서 구체적으로 언급된 것 이외의 다른 아미노산 치환을 갖지만, 구체적으로 언급된 변이체처럼 야생형 효소에 관해 "변형 기질 프로파일"을 보이며 상기 언급한 산화 반응 중 적어도 하나를 촉매화하는 변이체를 여전히 이끄는 변이체를 의미하는 것으로 이해된다. 또한, 기능적 등가성은 특히 기질 프로파일에서의 변형이 질적으로 상응하는 경우에, 즉 예를 들어 동일한 기질이 상이한 속도로 전환되는 경우에 존재한다.

"기능적 등가물"은 또한 원래 구체적으로 언급한 P450 BM3 변이체처럼, 다른 유기체로부터의 P450 효소를 돌연변이시켜 얻을 수 있는 P450 모노옥시게나제 변이체를 포함하다. 예를 들어, 상동성 서열 영역들의 영역은 서열 비교에 의해 확인할 수 있다. 따라서, 본 발명에서 구체적으로 설명한 원칙에 따르면, 현대 분자 모델링 방법에 의해 반응 패턴에 영향을 미치는 등가 돌연변이를 수행할 수 있다.

"기능적 등가물"은 하나 이상의 부가적인 아미노산 부가, 치환, 결실 및(또 는) 역위에 의해 얻을 수 있는 변이체를 또한 포함하고, 상기 부가적인 변형은 상기한 의미의 변형 기질 프로파일을 갖는 변이체를 생성시키는 한 어느 서열 위치에서도 일어날 수 있다.

본 발명에 따라 산화될 수 있는 군 a)의 기질은 비치환 또는 치환된 헤테로시클릭 1핵, 2핵 또는 다핵 방향족 화합물; 특히 산화가능한 또는 히드록실화가능한 N-, O- 또는 S-헤테로시클릭 1핵, 2핵 또는 다핵 방향족 화합물이다. 이들은 바람직하게는 2 또는 3개, 특히 2개의 4원 내지 7원, 특히 6원 또는 5원의 융합 고리 (여기서, 적어도 하나, 바람직하게는 모든 고리가 방향족 특성을 갖고, 적어도 하나의 방향족 고리는 고리 내에 1 내지 3개, 바람직하게는 1개의 N-, O- 또는 S-헤테로원자를 포함한다)를 포함한다. 전체 고리 구조는 1개 또는 2개의 동일하거나 상이한 헤테로원자를 추가로 포함할 수 있다. 방향족 화합물은 고리 탄소 또는 헤테로원자에서 1 내지 5개의 치환체를 추가로 포함할 수 있다. 적합한 치환체의 예는 C₁-C₄-알킬, 예를 들어 메틸, 에틸, n- 또는 이소프로필, n-, 이소- 또는 t-부틸, 또는 C₂-C₄-알케닐, 예를 들어 에테닐, 1-프로페닐, 2-프로페닐, 1-부테닐, 2-부테닐 또는 3-부테닐, 히드록실 및 할로겐, 예를 들어 F, Cl 및 Br이다. 상기 언급한 알킬 또는 알케닐 치환체는 또한 케토 또는 알데히드기를 가질 수 있으며; 그 예는 프로판-2-온-3-일, 부탄-2-온-4-일, 3-부텐-2-온-4-일이다. 적합한 헤테로시클릭 기질의 비제한적인 예는 특히 2핵 헤테로환, 예를 들어 인돌, N-메틸-인돌, 및 탄소 원자 상에 1 내지 3개의 상기 정의된 치환체를 갖는 그의 치환 유사체, 예 를 들어 5-클로로- 또는 5-브로모인돌; 및 또한 퀴놀린 및 퀴놀린 유도체, 예를 들어 8-메틸퀴놀린, 6-메틸퀴놀린 및 퀴날딘; 및 벤조티오펜, 및 탄소 원자 상에 1 내지 3개의 상기 정의된 치환체를 갖는 그의 치환 유사체이다. 또한, 3핵 헤테로 방향족 화합물, 예를 들어 아크리딘, 및 탄소 원자 상에 1 내지 3개의 상기 정의된 치환체를 갖는 그의 치환 유사체도 언급할 수 있다.

본 발명에 따라 산화가능한 군 b)의 기질은 비치환 또는 치환된 1핵 또는 다핵, 특히 1핵 또는 2핵 방향족 화합물, 예를 들어 벤젠 및 나프탈렌이다. 방향족 화합물은 비치환되거나 또는 1치환 또는 다치환될 수 있으며, 예를 들어 고리 탄소 원자 상에 1 내지 5개의 치환체를 가질 수 있다. 적합한 치환체의 예는 C₁-C₄-알킬, 예를 들어 메틸, 에틸, n- 또는 이소프로필, 또는 n-, 이소- 또는 t-부틸, 또는 C₂-C₄-알케닐, 예를 들어 에테닐, 1-프로페닐, 2-프로페닐, 1-부테닐, 2-부테닐 또는 3-부테닐, 히드록실 및 할로겐, 예를 들어 F, Cl 및 Br이다. 상기 언급한 알킬 또는 알케닐 치환체는 또한 케토 또는 알데히드기를 가질 수 있고; 그 예는 프로판-2-온-3-일, 부탄-2-온-4-일, 3-부텐-2-온-4-일이다. 방향족 화합물은 4원 내지 7원의 비방향족 고리와 융합될 수 있다. 비방향족 고리는 1 또는 2개의 C=C 이중 결합을 가질 수 있고, 상기 언급한 치환체에 의해 1치환 또는 다치환될 수 있으며, 하나 또는 2개의 헤테로 고리 원자를 가질 수 있다. 특히 적합한 방향족 화합물의 예는 1핵 방향족 화합물, 예를 들어 쿠멘, 및 2핵 기질, 예를 들어 인덴 및 나프탈렌, 및 탄소 원자 상에 1 내지 3개의 상기 정의된 치환체를 갖는 그의 치환 유사체이다.

본 발명에 따라 산화될 수 있는 군 c)의 기질은 탄소원자수 4 내지 15, 바람직하게는 6 내지 12의 직쇄 또는 분지쇄 알칸 또는 알켄이다. 언급할 수 있는 예는 n-부탄, n-펜탄, n-헥산, n-헵탄, n-옥탄, n-노난, n-데칸, n-운데칸 및 n-도데칸, 및 1회 이상 분지된 이들 화합물의 유사체, 예를 들어 1 내지 3개의 메틸 측쇄기를 갖는 유사체 화합물; 또는 상기 언급한 알칸의 1치환 또는 다치환, 예를 들어 1치환된 유사체이다.

본 발명에 따라 산화될 수 있는 군 d)의 기질은 고리 탄소 원자가 4 내지 8개인 비치환 또는 치환된 시클로알칸 및 시클로알켄이다. 그 예로는 시클로펜탄, 시클로펜텐, 시클로헥산, 시클로헥센, 시클로헵탄 및 시클로헵텐이 있다. 고리 구조는 군 a) 내지 b)의 화합물에 대한 상기 정의에 따른 하나 이상, 예를 들어 1 내지 5개의 치환체를 가질 수 있다. 그의 비제한적인 예는 이오논, 예를 들어 α-, β- 및 γ-이오논, 및 대응하는 메틸 이오논 및 이소메틸 이오논이다. α- 및 β-이오논이 특히 바람직하다.

또한, 본 발명은 본 발명에 따른 모노옥시게나제 중 하나를 코딩하는 핵산 서열에 관한 것이다. 바람직한 핵산 서열은 서열 번호 1로부터 유도되며, 이는 상기한 기능적 아미노산 돌연변이 중 하나를 일으키는 적어도 하나의 뉴클레오티드 치환을 갖는다. 본 발명은 또한 개별 또는 다수의 뉴클레오티드의 부가, 치환, 삽입 및(또는) 결실에 의해 얻어진 핵산의 기능적 유사체에 관한 것이며, 이는 목적하는 기질 특이성, 예를 들어 인돌 산화 활성을 갖는 모노옥시게나제를 더욱 코딩 한다.

본 발명은 소위 침묵 돌연변이를 포함하거나 또는 특정 기원 또는 숙주 유기체의 코돈 사용에 따라 구체적으로 언급된 서열에 비해 변형된 핵산 서열, 및 상기 핵산 서열의 천연 변형체 (variants)를 또한 포함한다. 또한, 본 발명은 유전 암호의 퇴화 (즉, 대응하는 아미노산 서열에서 어떠한 변화도 없음) 또는 보존적 뉴클레오티드 치환 (즉, 대응하는 아미노산이 동일한 하전, 크기, 극성 및(또는) 용해도의 다른 아미노산으로 치환됨)에 의해 얻어진 핵산 서열의 변형, 및 "변형 기질 프로파일"을 갖는 본 발명에 따른 모노옥시게나제를 코딩하는 서열인 뉴클레오티드 부가, 삽입, 역위 또는 결실에 의해 변형된 서열과 대응하는 상보성 서열을 포함한다.

또한, 본 발명은 조절 핵산 서열의 유전적 제어 하에서 본 발명에 따른 변이체를 코딩하는 핵산 서열을 포함하는 발현 구조체, 및 하나 이상의 상기 발현 구조체를 포함하는 벡터에 관한 것이다.

바람직하게는, 본 발명에 따른 구조체는 논의된 코딩 서열의 프로모터 5'-상류 및 종결 서열 3'-하류, 및 임의로 각각 코딩 서열에 작동가능하게 연결된 추가의 통상의 조절 성분을 포함한다. 작동가능한 연결은 프로모터, 코딩 서열, 종결 서열 및 적합한 경우 다른 조절 성분이, 각 조절 성분이 코딩 서열의 발현에 대한 그의 의도된 기능을 이행할 수 있는 방식으로 순차적으로 배열되는 것을 의미하는 것으로 이해된다. 작동가능하게 연결될 수 있는 서열의 예는 표적화 (targeting) 서열, 또는 다른 번역 인핸서, 인핸서, 폴리아데닐화 시그날 등이다. 추가의 조절 성분은 선택가능한 마커, 증폭 시그날, 복제 기원 등을 포함한다.

인공 조절 서열 외에, 천연 조절 서열이 실제 구조 유전자의 상류에 계속 존재할 수 있다. 필요한 경우, 상기 천연 조절은 유전자 변형에 의해 스위치 오프될 (switched off) 수 있고, 유전자의 발현은 증강되거나 또는 저하될 수 있다. 그러나, 유전자 구조체는 또한 보다 단순한 구조일 수 있으며, 즉, 구조 유전자의 상류에 추가의 조절 시그날이 삽입되지 않고 그의 조절을 갖는 천연 프로모터가 제거되지 않는다. 대신에, 천연 조절 서열은 더이상 조절이 일어나지 않고 유전자 발현이 증가되거나 또는 감소되는 방식으로 돌연변이된다. 핵산 서열의 하나 이상의 카피가 유전자 구조체에 존재할 수 있다.

적합한 프로모터의 예는 그람 음성균에서 유리하게 사용되는 cos, tac, trp, tet, trp-tet, lpp, lac, lpp-lac, lacIq, T7, T5, T3, gal, trc, ara, SP6, 1-PR 또는 1-PL 프로모터; 및 그람 양성균 프로모터 amy 및 SPO2, 효모 프로모터 ADC1, MFa, Ac, P-60, CYC1, GAPDH, 또는 식물 프로모터 CaMV/35S, SSU, OCS, lib4, usp, STLS1, B33, nos 또는 유비퀴틴 또는 파세올린 프로모터이다. 유도성 프로모터, 예를 들어 광- 및 특히 온도-유도성 프로모터, 예를 들어 P_rP₁ 프로모터를 사용하는 것이 특히 바람직하다.

원칙적으로, 그의 조절 서열을 갖는 모든 천연 프로모터를 사용할 수 있다. 또한, 합성 프로모터도 또한 유리한 방식으로 사용될 수 있다.

상기 언급한 조절 서열은 핵산 서열 및 단백질 발현의 표적화된 발현을 허용 하도록 의도한 것이다. 이것은 숙주 유기체에 따라 예를 들어 유전자가 유도가 일어난 후에만 발현되거나 또는 과발현되는 것, 또는 유전자가 즉시 발현되고(되거나) 과발현되는 것을 의미할 수 있다.

조절 서열 또는 팩터는 바람직하게는 발현에 대한 긍정적인 효과를 갖고, 이러한 방식으로 발현을 증가시키거나 또는 저하시킨다. 따라서, 조절 성분의 증강은 강한 전사 시그날, 예를 들어 프로모터 및(또는) "인핸서"를 사용하여 전사 수준에서 유리하게 일어날 수 있다. 또한, 번역은 예를 들어 mRNA 안정성을 개선시킴으로써 증강될 수도 있다.

발현 카세트는 적합한 프로모터를 적합한 모노옥시게나제 뉴클레오티드 서열 및 종결 시그날 또는 폴리아데닐화 시그날과 융합시킴으로써 제조된다. 이를 위해, 통상의 재조합 및 클로닝 기술이 예를 들어 문헌[T. Maniatis, E.F. Fritsch 및 J. Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1989); 및 T.J. Silhavy, M.L. Berman 및 L.W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1984); 및 Ausubel, F.M. 등, Current Protocols in Molecular Biology, Greene Publishing Assoc. and Wiley Interscience (1987)]에 기술되어 있는 바와 같이 사용된다.

적합한 숙주 유기체에서의 발현을 위해, 재조합 핵산 구조체 또는 유전자 구조체를 숙주에서의 최적 유전자 발현을 허용하는 숙주 특이적 벡터에 삽입하는 것이 유리하다. 벡터는 당업자에게 잘 알려져 있으며, 예를 들어 문헌["Cloning Vector", Pouwels P.H. 등, Ed., Elsevier, Amsterdam-New York-Oxford, 1985]에서 찾을 수 있다. 벡터는 플라스미드 뿐만 아니라 당업자에게 알려진 모든 다른 벡터, 예를 들어 파지, 바이러스, 예를 들어 SV40, CMV, 바큘로바이러스 및 아데노바이러스, 프랜스포존, IS 성분, 파스미드, 코스미드 및 선형 또는 원형 DNA를 의미하는 것으로 이해해야 한다. 이들 벡터는 숙주 유기체 내에서 자발적으로 복제가능하거나 또는 염색체에 통합된 상태로 복제될 수 있다.

본 발명에 따른 벡터는 예를 들어 본 발명에 따른 적어도 하나의 벡터로 형질전환되며, 변이체를 제조하기 위해 사용될 수 있는 재조합 미생물의 생성을 가능하게 한다. 본 발명에 따른 상기한 재조합 구조체는 유리하게 적합한 숙주 시스템에 도입되어 발현된다. 논의된 발현 시스템에서 상기 언급한 핵산의 발현을 일으키기 위해 당업자에게 공지된 통상의 클로닝 및 형질감염 방법을 사용하는 것이 바람직하다. 적합한 시스템은 예를 들어 문헌[Current Protocols in Molecular Biology, F. Ausubel 등, Ed., Wiley Interscience, New York, 1997]에 기재되어 있다.

적합한 숙주 유기체는 원칙적으로 본 발명에 따른 핵산, 그의 대립유전자 변형체 및 그들의 기능적 등가물 또는 유도체의 발현을 허용하는 모든 유기체이다. 숙주 유기체는 예를 들어 세균, 진균류, 효모 또는 식물 또는 동물 세포를 의미하는 것으로서 이해해야 한다. 바람직한 유기체는 세균, 예를 들어 에스케리치아속 (Escherichia), 예를 들어 에스케리치아 콜라이 (Escherichia coli), 스트렙토마이세스속 (Streptomyces), 바실러스속 (Bacillus) 또는 슈도모나스속 (Pseudomonas), 원핵 미생물, 예를 들어 사카로마이세스 세레비지애 (Saccharomyces cerevisiae), 아스퍼길러스 (Aspergillus), 및 동물 또는 식물의 고등 진핵 세포, 예를 들어 Sf9 또는 CHO 세포이다.

필요한 경우, 유전자 산물의 발현은 또한 트랜스제닉 유기체, 예를 들어 트랜스제닉 동물, 예를 들어 특히 마우스, 양 또는 트랜스제닉 식물에서 일어날 수도 있다. 또한, 트랜스제닉 유기체는 대응하는 내생성 유전자가 예를 들어 돌연변이 또는 부분 결실 또는 완전 결실에 의해 제거된 낙아웃 (knock-out) 동물 또는 식물일 수 있다.

성공적으로 형질전환된 유기체는 마찬가지로 벡터 또는 발현 카세트에 포함된 마커 유전자에 의해 선별될 수 있다. 상기 마커 유전자의 예는 항생제에 내성인 유전자, 및 형질전환된 세포의 염색을 유발하는 색깔 반응을 촉매화하는 효소에 대한 유전자이다. 이들 형질전환된 세포는 이어서 자동 세포 선별을 이용하여 선별할 수 있다. 벡터를 사용하여 성공적으로 형질전환되고 항생제에 대해 내성인 적합한 유전자 (예를 들어 G418 또는 하이그로마이신)를 갖는 미생물은 적합한 항생제 함유 배지 또는 기질을 사용하여 선별할 수 있다. 세포 표면 상에 제시될 수 있는 마커 단백질은 친화도 크로마토그래피에 의한 선별에 사용될 수 있다.

숙주 유기체와 이 유기체에 적합한 벡터, 예를 들어 플라스미드, 바이러스 또는 파지, 예를 들어 RNA 폴리머라제/프로모터 시스템을 갖는 플라스미드, 파지 λ, μ 또는 다른 용원성 (temperate) 파지 또는 트랜스포존 및(또는) 다른 유리한 조절 서열과의 조합은 발현 시스템을 형성한다. 용어 "발현 시스템"은 예를 들어 포유동물 세포, 예를 들어 CHO 세포와 포유동물 세포에 적합한 벡터, 예를 들어 pcDNA3neo 벡터와의 조합을 의미한다.

상기한 바와 같이, 유전자 산물은 트랜스제닉 동물, 예를 들어 마우스, 양 또는 트랜스제닉 식물에서 또한 유리하게 발현될 수 있다. 핵산에서 유래된 RNA를 갖는 세포 배제 (cell-free) 번역 시스템을 프로그램하는 것도 마찬가지로 가능하다.

또한, 본 발명은 모노옥시게나제 생산 미생물을 배양하고, 적합하게 모노옥시게나제의 발현을 유도하며, 배양물로부터 모노옥시게나제를 단리하는 것을 포함하는, 본 발명에 따른 모노옥시게나제의 제조 방법을 제공한다. 필요한 경우, 본 발명에 따른 모노옥시게나제는 공업 규모로 또한 생산할 수 있다.

미생물은 공지 방법에 의해 배양하여 발효시킬 수 있다. 예를 들어, 세균은 20 내지 40℃ 및 pH 6 내지 9에서 TB 또는 LB 배지에서 성장시킬 수 있다. 적합한 배양 조건은 예를 들어 문헌[T. Maniatis, E.F. Fritsch 및 J. Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1989)]에 상세히 기재되어 있다.

모노옥시게나제가 배양 배지 내로 분비되지 않으면, 세포를 용해시키고 공지의 단백질 단리 방법을 사용하여 용해물로부터 모노옥시게나제를 얻는다. 별법으로 세포는 고주파 초음파에 의해, 예를 들어 French pressure cell에서의 고압에 의해, 삼투작용에 의해, 세제, 용해성 효소 또는 유기 용매의 작용에 의해, 균질화에 의해 또는 상기 언급된 다수의 방법들의 조합에 의해 용해시킬 수 있다. 모노 옥시게나제의 정제는 공지의 크로마토그래피 방법, 예를 들어 분자체 크로마토그래피 (겔 여과), 예를 들어 Q-세파로스 크로마토그래피, 이온 교환 크로마토그래피 및 소수성 크로마토그래피에 의해, 및 다른 통상의 방법, 예를 들어 한외여과, 결정화, 염석, 투석 및 천연 겔 전기영동에 의해 달성할 수 있다. 적합한 방법은 예를 들어 문헌[Cooper, F.G., Biochemische Arbeitsmethoden (Biochemical Procedures), Verlag Walter de Gruyter, Berlin, New York 또는 Scopes, R., Protein Purification, Springer Verlag, New York, Heidelberg, Berlin]에 기재되어 있다.

재조합 단백질을 단리하기 위해서, 특정 뉴클레오티드 서열에 의해 cDNA를 신장시켜 정제를 단순화하는 기능을 하는 변형 폴리펩티드 또는 융합 단백질을 코딩하는 벡터 시스템 또는 올리고뉴클레오티드를 사용하는 것이 특이 유리하다. 이러한 유형의 적합한 변형은 예를 들어 앵커로서 작용하는 소위 "tag", 예를 들어 헥사-히스티딘 앵커로서 알려진 변형, 또는 항체에 의해 항원으로서 인식될 수 있는 에피토프이다 (예를 들어 문헌[Harlow, E. 및 Lane, D., 1988, Antibodies: A Laboratory Manual. Cold Spring Harbor (N.Y.) Press] 참조). 이들 앵커는 단백질을 고체 지지체, 예를 들어 크로마토그래피 컬럼에 충전될 수 있는 중합체 매트릭스에, 또는 미세적정판 또는 다른 지지체에 부착시키기 위해 사용할 수 있다.

이들 앵커는 또한 동시에 단백질을 인식하기 위해 사용될 수 있다. 또한, 단백질의 인식을 위해 통상의 마커, 예를 들어 형광 염료, 기질과 반응한 후 검출가능한 반응 생성물을 형성하는 효소 마커 또는 방사성 마커를 단독으로 또는 단백 질을 유도체화하기 위한 앵커와 조합하여 사용하는 것도 가능하다.

또한, 본 발명은

a1) 상기 정의된 재조합 미생물을 배양 배지 내에서 본 발명에 따른 모노옥시게나제에 의해 산화가능한 기질인 외생성 (첨가된) 기질 또는 중간체로서 형성된 기질의 존재 하에 바람직하게는 산소의 존재 하에 (즉, 호기적 조건 하에) 배양하거나; 또는

a2) 기질 함유 반응 배지를 본 발명에 따른 효소와 함께 바람직하게는 산소 및 전자 공여체의 존재 하에 인큐베이션하고;

b) 형성된 산화 생성물 또는 그의 2차 생성물을 배지로부터 단리하는 것

을 포함하는, 유기 화합물, 예를 들어 상기 정의한 바와 같은 N-헤테로시클릭 1핵, 2핵 또는 다핵 방향족 화합물의 미생물에 의한 산화에 관한 것이다.

상기 반응에 필요한 산소는 대기로부터 반응 매질 내로 통과되거나 또는 필요한 경우 공지의 방식으로 첨가될 수 있다.

산화가능한 기질은 바람직하게는

a) 비치환 또는 치환된 N-헤테로시클릭 1핵, 2핵 또는 다핵 방향족 화합물;

b) 비치환 또는 치환된 1핵 또는 다핵 방향족 화합물;

c) 직쇄 또는 분지쇄 알칸 및 알켄; 및

d) 비치환 또는 치환된 시클로알칸 및 시클로알켄

중에서 선택된다.

바람직한 변법은 인디고/인디루빈의 형성으로서, 상기 기질이 배양액 중에 중간체로서 형성된 인돌이며, 배지 중에 형성된 인디고 및(또는) 인디루빈을 히드록시인돌 중간체의 산화에 의해 단리한다는 사실을 특징으로 한다.

본 발명에 따른 산화를 재조합 미생물을 사용하여 수행하는 경우, 미생물의 배양은 바람직하게는 먼저 산소의 존재 하에 복합 배지, 예를 들어 TB 또는 LB 배지 중에서 약 20 내지 40℃의 배양 온도 및 약 6 내지 9의 pH에서, 적당한 세포 밀도에 도달할 때까지 수행한다. 인돌은 미생물에 의해 중간체로서 형성되기 때문에, 외생성 인돌을 첨가하는 것은 일반적으로 불필요하다. 그러나, 다른 기질을 사용하는 경우에는 외생성 기질의 첨가가 요구될 수 있다. 산화 반응을 보다 양호하게 조절할 수 있도록, 유도성, 특히 온도 유도성 프로모터를 사용하는 것이 바람직하다. 이 경우, 온도를 필요한 유도 온도, 예를 들어 P_rP₁ 프로모터의 경우 42℃까지 증가시키고, 이 온도를 모노옥시게나제 활성의 발현에 충분한 시간, 예를 들어 1 내지 10시간 또는 5 내지 6시간 동안 유지한 후 약 30 내지 40℃로 다시 저하시킨다. 이어서, 산소의 존재 하에 12시간 내지 3일 동안 계속 배양한다. pH는 특히 인돌 산화의 경우 NaOH를 첨가하여 예를 들어 9 내지 10으로 증가시킬 수 있고, 이에 의해 효소 작용으로 형성된 산화 생성물인 2- 및 3-히드록시인돌의 대기중 산화에 의해 인디고 형성 또는 인디루빈 형성이 부가적으로 촉진된다.

본 발명에 따른 인디고/인디루빈 형성은 하기 반응식으로 예시된다.

그러나, 본 발명에 따른 산화를 정제된 또는 풍부한 효소 변이체를 사용하여 수행하는 경우, 본 발명에 따른 효소를 외생성 기질 함유, 예를 들어 인돌 함유 배지 (약 0.01 내지 10 mM, 또는 0.05 내지 5 mM)에 용해시키고, 반응은 바람직하게는 산소의 존재 하에 약 10 내지 50℃, 예를 들어 30 내지 40℃의 온도 및 약 6 내지 9의 pH (예를 들어 100 내지 200 mM의 인산염 또는 Tris 완충액을 사용하여 확립된 바와 같이)에서, 그리고 환원제의 존재 하에 수행하며, 상기 기질 함유 배지 는 산화하고자 하는 기질에 비해 약 1 내지 100배, 또는 10배 내지 100배 몰 과량의 환원 등가물을 추가로 함유한다. 바람직한 환원제는 NADPH이다. 필요한 경우, 환원제는 몇회로 나누어 첨가할 수 있다.

유사한 방식으로, 바람직하게 사용되는 산화가능성 기질은 n-헥산, n-옥탄, n-데칸, n-도데칸, 쿠멘, 1-메틸인돌, 5-Cl- 또는 Br-인돌, 인덴, 벤조티오펜, α-, β- 및 γ-이오논, 아크리딘, 나프탈렌, 6-메틸- 또는 8-메틸퀴놀린, 퀴놀린 및 퀴날딘이다.

본 발명에 따른 효소적 산화 반응은 예를 들어 다음 조건 하에 수행할 수 있다.

기질 농도: 0.01 내지 20 mM

효소 농도: 0.1 내지 10 ㎎/㎖

반응 온도: 10 내지 50℃

pH: 6 내지 8

완충액: 0.05 내지 0.2M의 인산칼륨 또는 Tris/HCl

전자 공여체: 바람직하게는 소량씩 나누어 첨가한다

(초기 농도: 약 0.1 내지 2 ㎎/㎖)

혼합물은 예를 들어 전자 공여체 (예를 들어 NADPH)를 첨가함으로써 반응이 개시되기 전에 잠깐 동안 (1 내지 5분) 예비인큐베이션시킬 수 있다 (약 20 내지 40℃에서). 반응은 적절하게 산소를 추가로 도입하면서 호기적으로 수행한다.

본 발명에 따른 기질 산화 방법에서, 반응 배지 내에 존재하거나 또는 첨가 되는 산소는 효소에 의해 환원적으로 제거된다. 필요한 환원 등가물은 첨가되는 환원제 (전자 공여체)에 의해 제공된다.

이어서 형성된 산화 생성물을 배지로부터 분리시키고 통상의 방식, 예를 들어 추출 또는 크로마토그래피에 의해 정제할 수 있다.

또한, 본 발명의 주제는 본 발명에 따른 효소 또는 본 발명에 따른 재조합 미생물을 고정된 형태로 포함하는 생물반응기 (bioreactor)에 관한 것이다.

마지막으로, 본 발명의 주제는 본 발명에 따른 시토크롬 P450 모노옥시게나제, 또는 본 발명에 따른 벡터 또는 미생물의, 군 a) 내지 d) 중 어느 한 군의 기질, 특히 N-헤테로시클릭 1핵, 2핵 또는 다핵 방향족 화합물의 미생물에 의한 산화를 위한, 및 바람직하게는 인디고 및(또는) 인디루빈의 형성을 위한 용도에 관한 것이다.

하기 실시예를 참고하여 본 발명을 보다 상세하게 설명한다.

실시예

<실시예 1>

P450 BM-3의 특이적 코돈의 랜덤화

실험은 본질적으로 참고문헌 (19)에 기재된 바와 같이 수행하였다. 3 위치 (Phe87, Leu188 및 Ala74)를 Stratagene QuikChange 키트 (La Jolla, CA, USA)를 사용하는 부위 특이적 돌연변이를 통해 랜덤화시켰다. 다음 PCR 프라이머를 개별 위치에 대해 사용하였다.

Phe87: 5'-gcaggagacgggttgnnnacaagctggacg-3' (서열 번호 3)

5'-cgtccagcttgtnnncaacccgtctcctgc-3' (서열 번호 4)

Leu188: 5'-gaagcaatgaacaagnnncagcgagcaaatccag-3' (서열 번호 5)

5'-ctggatttgctcgctgnnncttgttcattgcttc-3' (서열 번호 6)

Ala74: 5'-gctttgataaaaacttaaagtcaannncttaaatttgtacg-3' (서열 번호 7)

5'-cgtacaaatttaagnnnttgacttaagtttttatcaaagc-3' (서열 번호 8)

PCR 조건은 3 위치 모두에 대해 동일하였다. 특히, 17.5 pmol의 각 프라이머 중의 하나, 20 pmol의 주형 플라스미드 DNA, 3U의 Pfu 폴리머라제, 및 3.25 nmol의 각 dNTP를 50 ㎕의 반응 부피당 사용하였다. PCR 반응은 94℃/분에서 시작한 다음 94℃, 1분; 46℃, 2.5분; 72℃, 17분의 온도 싸이클을 20회 수행하였다. 20 싸이클 후, 72℃에서 15분 동안 계속 반응시켰다. PCR 후, 20U의 DpnI를 사용하여 주형 DNA를 37℃에서 3시간 동안 분해시켰다. 이어서, 이. 콜라이 DH5α를 형질전환시켰다. 형질전환된 이. 콜라이 DH5α 세포를 150 ㎍/㎖의 암피실린을 함유하는 LB 한천 평판 상에 플레이팅하였다. 이어서, 37℃에서 18시간 동안 인큐베이션하였다.

<실시예 2>

P450 BM-3 및 그의 변이체의 발현 및 정제와 청색 색소의 생산

P450 BM-3 유전자 및 그의 변이체를 참고문헌 (20)에 기재된 바와 같이 플라스미드 pCYTEXP1의 강한 온도 유도성 P_RP_L 프로모터의 제어 하에 이. 콜라이 DH5α에서 발현시켰다. 멸균 이쑤시개를 사용하여 콜로니를 집어 웰 (hollow) 당 200 ㎕의 TB 배지와 100 ㎍/㎖의 암피실린을 포함하는 96웰의 미세적정판에 옮겼다. 이어서, 37℃에서 철야 인큐베이션하였다. 이어서, 각 웰 중 하나의 세포 배양액 40 ㎕를 2 ㎖의 TB 배지를 100 ㎍/㎖의 암피실린과 함께 함유한 배양관에 옮겼다. 이어서, 37℃에서 2시간 동안 배양하였다. 이어서, 유도를 위해 온도를 6시간 동안 42℃로 상승시켰다. 이어서, 37℃에서 계속 철야 배양시켰으며, 청색 색소가 생산되었다.

효소 또는 청색 색소의 예비적 생산은 300 ㎖의 세포 배양액 (OD_578㎚= 0.8 내지 1.0)으로부터 출발하여 수행하였다. 효소의 단리를 위해, 세포를 4,000 rpm에서 10분 동안 원심분리하고 0.1M K_xPO₄ 완충액, pH 7.4에 재현탁시켰다. Branson sonifer W25 (Dietzenbach, Germany)를 사용하여 에너지 출력 80 W에서 2분간 초음파 처리를 3회 실시하여 빙냉시킨 세포를 조심스럽게 파괴시켰다. 현탁액을 32,570×g에서 20분 동안 원심분리하였다. 조 추출물은 활성도 결정 또는 효소 정제를 위해 사용하였다. 효소 정제는 본원에 참고로 포함된 참고문헌 (21)에 기재된 바와 같이 수행하였다. 정제된 효소의 농도는 91 mM^-1㎝^-1의 흡광 계수를 사용하여 문헌 (11)에 기재된 바와 같이 450 및 490 ㎚에서의 흡광도 차이에 의해 결정하였다.

<실시예 3>

다량의 청색 색소를 생산하는 변이체의 단리

대응하는 위치의 코돈의 랜덤화 돌연변이에 의해 생산된 각 위치 중 하나의 변이체들로부터 각 경우에 대해 100개의 콜로니를 단리하였다. 이들 콜로니를 청색 색소의 생산을 위해 배양관에서 배양하였다.

세포를 물로 세척하고 수회의 저속 원심분리 단계 (500 rpm)를 수행한 후, 디메틸 술폭시드 (DMSO)를 사용하여 청색 색소를 추출하였다. 청색 색소의 용해도는 DMSO에서 최대였다. 추출물의 흡광도는 677 ㎚에서 측정하였다. 최대량의 청색 색소를 생산하는 변이체, 특히 특수 위치로부터의 변이체를 DNA 서열결정 (ABI DNA 서열결정 키트; ABI Prism™ 377 DNA 서열결정기)을 위해 사용하였고, 또한 부위 특이적 랜덤화 돌연변이를 위한 주형으로서 사용하였다.

<실시예 4>

인돌 히드록실화에 대한 활성 시험

인돌 히드록실화 활성은 DMSO 중 10 내지 500 mM 인돌 용액 8 ㎕, Tris/HCl 완충액 (0.1 M, pH 8.2) 850 ㎕, 및 P450 BM-3 야생형 또는 변이체 0.6 nmol을 최종 부피 1 ㎖로 포함하는 용액에서 시험하였다. 혼합물을 9분 동안 예비인큐베이션한 후, NADPH 1 mM 수용액 50 ㎕를 첨가하여 반응을 개시시켰다. 20초 후 1.2 M KOH 60 ㎕를 첨가하여 반응을 중지시켰다. 5 내지 30초 이내에 (호기적 조건 하에), 효소 생성물은 인디고 ([△^2,2'-비인돌린]-3,3'-디온) 및 인디루빈 ([△^2,3'-비인돌린]-2',3-디온)으로 완전히 전환되었다. 인디고 생산은 670 ㎚에서의 흡광도에 의해 측정하였다. 순수 인디고를 사용한 검정 곡선은 상기 파장에서 3.9 mM^-1㎝^-1의 흡광 계수를 보여주었다. 0.6 nmol의 야생형 또는 P450 BM-3 변이체, 및 0.05 내지 5.0 mM의 인돌을 사용하여 40초의 반응 시간에서 인디고 생산에 대한 선형 커브를 얻었다. 인디루빈은 670 ㎚에서 매우 약한 흡광도를 보였고, 형성된 인디루빈의 양은 형성된 인디고의 양보다 훨씬 더 적었다. 인디루빈의 형성은 동력학적 파라미터의 결정에서 무시되었다. NADPH 소비는 340 ㎚에서 측정하여 6.2 mM^-1㎝^-1의 흡광 계수를 사용하여 참고문헌 (17)에 기재된 바와 같이 산출하였다.

<실시예 5>

인디고 및 인디루빈의 정제

세포를 물로 세척하고 500 g에서 반복하여 원심분리한 후, 형성된 청색 펠렛을 테트라히드로푸란 (THF)을 사용하여 추출하였다. 추출물을 증발시켜 거의 무수 상태로 하고, 적색 색소를 무수 에탄올 50 ㎖로 여러번 추출하였다. 잔류 청색 고형물을 THF에 용해시키고 박층 크로마토그래피 (TLC)로 분석하였다. 에탄올 용액을 증발시키고 실리카겔 크로마토그래피 (TLC 60, Merck, Darmstadt, Germany; 2 ㎝×30 ㎝)로 정제한 후, THF 및 석유 에테르 (비율 1:2)로 세척하였다. 수득한 적색 용액을 증발시키고 그 순도를 TLC에 의해 측정하였다. 청색 및 적색 색소의 흡광 스펙트럼은 Ultraspec 3000 분광광도계 (Pharmacia, Uppsala, Sweden)를 사용하여 400 내지 800 ㎚ 범위에서 측정하였다. 청색 및 적색 색상을 또한 질량 분광분석법 및 ¹H-NMR 분광계로 더욱 분석하였다.

실험 결과

1. P450 BM-3 돌연변이에 의한 청색 색소에 대한 생산성 증가

천연 P450 BM-3은 청색 인디고 함유 색소, 또는 전구체 물질인 2- 또는 3-히드록시인돌 생산능을 갖지 않는다. 충분한 양의 청색 색소를 제조할 수 있도록 하기 위해, P450 BM-3을 제어된 방식으로 진화시켰다. 청색 색소를 생산하는 모든 변이체를 서열결정하였다. 3 위치: Phe87, Leu188 및 Ala74 중 적어도 하나의 위치가 돌연변이된 것으로 밝혀졌다. 따라서, 이들 3 위치가 청색 색소의 생산에서 P450 BM-3의 활성에 대해 결정적인 역할을 하는 것으로 추정되었다. 팔미톨레산과 착화된 시토크롬 P450 BM-3의 헴 도메인의 구조로부터, Phe87은 기질이 헴기에 더 가까이 근접하는 것을 방해한다는 것을 알 수 있다 (참고문헌 14). 변이체 Phe87Val은 (14S, 15R)-아라키돈산의 에폭시드화에서 높은 레지오- 및 입체-선택성을 보이며 (참고문헌 13), 변이체 Phe87Ala는 ω-1, ω-2 및 ω-3의 히드록실화 위치를 ω로 이동시킨다 (참고문헌 22). 따라서 위치 87은 PCR에 의한 부위 특이적 랜덤화 돌연변이를 위해 우선적인 위치로서 선택되었다. 배양관에서, 유도 후 소량의 청색 색소를 생산하는 7개의 콜로니를 얻었다. 최대량의 청색 색소를 생산하는 콜로니를 선택하여 DNA 서열결정하였다. 서열 데이타는 Phe87이 Val로 치환된 것을 보여주었다. 이어서 변이체 Phe87Val을 위치 Leu188에 대한 부위 특이적 랜덤화 돌연변이의 제2 실시를 위한 주형으로서 사용하였다. 팔미톨레산과 착화된 헴 도메인의 구조는 F 및 G 나선의 위치변경에 의해 잔기 Leu188이 기질과 직접 접촉한다는 것을 보여준다 (참고문헌 14). 따라서, 이 위치는 기질 결합 또는 배향에서 중요한 역할을 할 수 있다. 제2 스크리닝 통과 후, 청색 색소를 생산하는 31개의 콜로니를 관찰하였다. 최대량의 색소를 생산하는 변이체는 치환 Phe87Val 및 Leu188Gln을 포함하였다. 이어서, 이 변이체를 제3 통과의 부위 특이적 랜덤화 돌연변이에서 위치 Ala74에서 돌연변이시켰다. 이 경우에 3중 변이체 F87L188A74 (Phe87Val, Leu188Gln 및 Ala74Gly)를 얻었고, 이는 300 ㎖의 TB 배지를 포함하는 2리터 플라스크 내에서 수 ㎎의 청색 색소를 생산하였다. 이 양은 청색 색소의 단리 및 특성화를 위해 충분한 양이었다.

2. 청색 색소의 단리 및 동정

세포를 세척한 후, 잔류 청색 펠렛을 THF로 추출하고 TLC로 분석하였다. 청색 색소를 빠르게 이동하는 청색 성분과 보다 느리게 이동하는 적색 성분으로 분리하였다. 두 성분은 모두 시판 인디고 시료의 성분들과 정확히 동일한 이동 파라미터를 보였다.

정제 후, 두 성분의 흡광 스펙트럼을 DMSO 내에서 측정하였다. 청색 성분은 시판 인디고 시료와 동일한 스펙트럼을 보였다. 정제된 청색 및 적색 성분을 각각 질량 분광분석법으로 분석하였다. 두 색소의 질량 스펙트럼은 m/e= 262에서 강한 분자 이온 피크와 m/e= 234 및 205에서 2개의 단편 피크 (각 경우 상대 강도 10%)를 보였다. 이 패턴은 인디고이드 화합물의 전형적인 것이다. 이들 이온의 원소 조성은 고해상 질량 분광분석법에 의해 C₁₆H₁₀N₂O₂, C₁₅H₁₀N₂O 및 C₁₄H₉N₂로 결정되었다. 이는 또한 인디고 종류의 구조의 특징이다. 따라서 청색 색소는 인디고로서, 적색 색소는 인디루빈으로서 확인되었다. 구조 확정을 위해, 두 색소의 500 ㎒ ¹H-NMR 스펙트럼을 DMSO-D₆ 용액에서 수행하였다. 그 결과는 참고문헌의 데이타 (참고문헌 23)와 일치하였다.

3. 단리된 효소를 사용한 인디고의 생산

인디고는 미생물 형질전환에 의해 인돌로부터 입수가능한 것으로 알려져 있다 (참고문헌 24-26). 그러나, 이들 미생물 시스템은 어느 것도 P450 모노옥시게나제를 포함하지 않았다. 본 발명에 따라, 인돌에 대한 순수 효소의 촉매 활성을 최초로 결정하였다. 변이체 F87L188A74를 인돌과 혼합하였다. 어떠한 색상 반응도 관찰할 수 없었다. NADPH를 반응 혼합물에 첨가한 후에만 약 20분 후 청색 색소가 형성되었다. 반응 혼합물의 pH를 약 11로 조절함으로써, NADPH를 첨가한 지 30초 후 청색 발색이 수초 내에 가시화되었다. 천연 P450 BM-3을 사용한 대조 실험은 효소, 인돌 및 NADPH의 농도를 증가시킨 경우에도 항상 음성 결과를 보였다. 에틸 아세테이트를 사용하여 청색 색소를 추출하고 TLC로 분석하였다. 청색 색소를 다시 보다 빠르게 이동하는 청색 성분과 보다 느리게 이동하는 적색 성분으로 분리하였다. Rf값 및 흡광 스펙트럼은 발효 브로쓰로부터의 추출물의 값들과 동일하였다. 따라서, P450 BM-3의 F87L188A74 변이체는 인돌 히드록실라제이다.

인돌의 인디고로의 효소적 전환을 위한 2가지 경로가 이전에 개시되었다. 한 경로는 디옥시게나제에 의해 촉매화되고, 다른 경로는 스티렌 모노옥시게나제에 의해 촉매화된다 (참고문헌 24 및 25). NADPH 화학양론은 두 경우 모두 2이다. 따라서, 디옥시게나제와 대조적으로, 본 발명에 따른 변이체 F87L188A74는 단지 한 위치에서만 인돌을 히드록실화하여 옥스인돌 (2-히드록시인돌) 또는 인독실 (3-히드록시인돌)을 형성하는 것으로 추정되었다.

4. 인돌 히드록실화의 동력학적 파라미터

야생형 효소 P450 BM-3과 변이체 Leu188Gln, Phe87Val, F87L188 및 F87L188A74의 순수 시료를 인돌 히드록실화의 동력학적 파라미터의 결정을 위해 사용하였다. 그 결과를 하기 표 1에 요약하였다.

인돌 히드록실화를 위한 P450 BM-3 변이체의 동력학적 파라미터

변이체	K_cat (S^-1)	K_m (mM)	K_cat/K_m (M^-1s^-1)
야생형	- ^a)	-	-
Leu188Gln	n.d. ^b)	n.d.	n.d.
Phe87Val	2.03 (0.14)	17.0 (1.0)	119
F87L188	2.28 (0.16)	4.2 (0.4)	543
F87L188A74	2.73 (0.16)	2.0 (0.2)	1365
a) 활성이 관찰되지 않음. b) 측정되지 않음 (활성이 너무 낮아 측정되지 않음)

과량의 정제된 효소와 고농도의 인돌을 사용하는 경우에도, 야생형 효소는 인돌을 산화시킬 수 없었다. 변이체 Leu188Gln은 낮은 활성을 보였다. 변이체 Phe87Val은 인돌 히드록실화에 대해 119 M^-1s^-1의 촉매 활성을 보였다. 이중 변이체 F87L188 (Phe87Val, Leu188Gln)의 촉매 효율은 543 M^-1s^-1으로 증가하였고, 추가 치환 Ala74Gly의 도입으로 1365 M^-1s^-1으로 증가하였다. K_cat 값은 Phe87Val에서 3중 변이체까지 총 35% 증가한 반면, K_m 값은 약 7배 감소하였다. 이는 Ala74Gly 및 Leu188Gln이 기질 결합에 주로 관여한다는 것을 나타낸다.

3중 변이체 F87L188A74의 경우, 인돌 전환율 (K_cat= 2.73 s^-1)은 대부분의 P450 효소보다 10배 더 높았다 (참고문헌 18).

<실시예 6>

변형 시토크롬 P450 모노옥시게나제를 사용한 n-옥탄의 히드록실화

Phe87Val, Leu188Gln 및 Ala74Gly의 돌연변이를 포함하는 P450 BM-3 모노옥시게나제 변이체를 사용하여 반응을 수행하였다.

선택된 기질은 n-옥탄이었다. n-옥탄의 히드록실화를 위해 하기 호기적 반응 혼합물을 사용하였다.

P450 BM-3 변이체: 17.5 ㎎ (동결건조물)

반응 완충액: 9.1 ㎖ (인산칼륨 완충액 50 mM, pH 7.5)

기질: 50 ㎕의 60 mM 용액 (아세톤 중)

온도: 25℃

효소 동결건조물을 500 ㎕의 반응 완충액에 용해시키고, 처츰에 기질 및 반응 완충액과 함께 실온에서 5분 동안 인큐베이션하였다. 이어서 300 ㎕의 NADPH 용액 (5 ㎎/㎖)을 첨가하였다. NADPH를 2회 더 반복하여 첨가하였다. 반응의 진행은 NADPH 감소를 관찰할 수 있는 340 ㎚에서의 흡광도를 측정하여 모니터하였다. 반응 용액 중 지나치게 고농도의 NADPH는 효소를 불활성화시키기 때문에, NADPH를 300 ㎕의 분취액으로 첨가하였다. 이어서 생성물을 단리하기 위해, 반응 용액을 디에틸 에테르 5 ㎖로 3회 추출하였다. 유기상을 합하여 MgSO₄ 상에서 건조시키고 농축하였다. 이어서, 생성물을 TLC, GC/MS 및 NMR로 특성화하였다.

반응 혼합물의 GC/MS 분석의 결과는 다음과 같았다.

화합물	Rt[분]¹⁾	전환율 [%]
4-옥탄올	13.51	37
3-옥탄올	14.08	47
2-옥탄올	14.26	16
¹⁾ 온도 프로그램: 40℃ 1분(등온)/ 3℃/분으로 95℃까지/ 10℃/분으로 275℃; 장치: Finnigan MAT 95; GC: HP 5890 Series II Split Injector; 칼럼: HP-5MS (메틸실록산) 30 m×0.25 ㎜; 캐리어 기체: He 0.065 ㎖/분.

출발 물질은 발견되지 않았다.

<실시예 7>

방향족 화합물, 헤테로방향족 화합물 및 트리메틸시클로헥세닐 화합물의 히드록실화

a) 실시예 6을 반복하되, n-옥탄 대신에 나프탈렌을 기질로 사용하였다. 확인된 생성물은 1-나프톨 및 시스-1,2-디히드록시-1,2-디히드로나프탈렌이었다. 나프탈렌 출발 물질의 88%가 전환되었다.

나프탈렌을 사용한 반응물에 대한 분석 방법

GC:

장치: Carlo Erba Strumentazion Typ HRGC 4160 on Column Injector; 칼럼: DB5 30 m×0.2 ㎜; 물질: 5% 디페닐-95% 디메틸폴리실록산; 캐리어 기체: 0.5 바아 H₂; 온도 프로그램: 40℃ 1분(등온) / 10℃/분으로 300℃.

Rt (1-나프톨)= 16.68

NMR:

1-나프톨 및 시스-1,2-디히드록시-1,2-디히드로-나프탈렌을 ¹H NMR에서 확인하였다.

b) 실시예 6을 반복하되, n-옥탄 대신에 8-메틸퀴놀린을 기질로 사용하였다. 5-히드록시-8-메틸퀴놀린이 주요 생성물로서 다른 유도체와 함께 확인되었다 (생성물비 5:1). 사용된 출발 물질의 35%가 전환되었다.

c) 실시예 6을 반복하되, n-옥탄 대신에 α-이오논을 기질로 사용하였다. 3-히드록시-α-이오논이 주요 생성물로서 다른 유도체와 함께 확인되었다 (생성물비 76:24). 사용된 출발 물질의 60%가 전환되었다.

d) 실시예 6을 반복하되, n-옥탄 대신에 쿠멘 (이소프로필벤젠)을 기질로 사용하였다. 5개의 모노히드록시 생성물 및 1개의 디히드록시 생성물이 확인되었다. 사용된 출발 물질의 70%가 전환되었다.

<참고문헌>

본 발명은 변형 기질 특이성 또는 변형 기질 프로파일을 갖는 신규 시토크롬 P450 모노옥시게나제를 제공한다다. 특히, 비변이 야생형 효소에 비교하여, 구조 적으로 명백히 상이한 기질에 대해 효소 활성을 갖는 모노옥시게나제 변이체를 제공한다.

<110> BASF Aktiengesellschaft <120> Novel cytochrome P450 monooxygenases and their use for the oxidation of organic substrates <130> M/40241 <140> <141> <160> 9 <170> PatentIn Ver. 2.1 <210> 1 <211> 3150 <212> DNA <213> Bacillus megaterium <220> <221> CDS <222> (4)..(3150) <400> 1 atg aca att aaa gaa atg cct cag cca aaa acg ttt gga gag ctt aaa 48 Thr Ile Lys Glu Met Pro Gln Pro Lys Thr Phe Gly Glu Leu Lys 1 5 10 15 aat tta ccg tta tta aac aca gat aaa ccg gtt caa gct ttg atg aaa 96 Asn Leu Pro Leu Leu Asn Thr Asp Lys Pro Val Gln Ala Leu Met Lys 20 25 30 att gcg gat gaa tta gga gaa atc ttt aaa ttc gag gcg cct ggt cgt 144 Ile Ala Asp Glu Leu Gly Glu Ile Phe Lys Phe Glu Ala Pro Gly Arg 35 40 45 gta acg cgc tac tta tca agt cag cgt cta att aaa gaa gca tgc gat 192 Val Thr Arg Tyr Leu Ser Ser Gln Arg Leu Ile Lys Glu Ala Cys Asp 50 55 60 gaa tca cgc ttt gat aaa aac tta agt caa gcg ctt aaa ttt gta cgt 240 Glu Ser Arg Phe Asp Lys Asn Leu Ser Gln Ala Leu Lys Phe Val Arg 65 70 75 gat ttt gca gga gac ggg tta ttt aca agc tgg acg cat gaa aaa aat 288 Asp Phe Ala Gly Asp Gly Leu Phe Thr Ser Trp Thr His Glu Lys Asn 80 85 90 95 tgg aaa aaa gcg cat aat atc tta ctt cca agc ttc agt cag cag gca 336 Trp Lys Lys Ala His Asn Ile Leu Leu Pro Ser Phe Ser Gln Gln Ala 100 105 110 atg aaa ggc tat cat gcg atg atg gtc gat atc gcc gtg cag ctt gtt 384 Met Lys Gly Tyr His Ala Met Met Val Asp Ile Ala Val Gln Leu Val 115 120 125 caa aag tgg gag cgt cta aat gca gat gag cat att gaa gta ccg gaa 432 Gln Lys Trp Glu Arg Leu Asn Ala Asp Glu His Ile Glu Val Pro Glu 130 135 140 gac atg aca cgt tta acg ctt gat aca att ggt ctt tgc ggc ttt aac 480 Asp Met Thr Arg Leu Thr Leu Asp Thr Ile Gly Leu Cys Gly Phe Asn 145 150 155 tat cgc ttt aac agc ttt tac cga gat cag cct cat cca ttt att aca 528 Tyr Arg Phe Asn Ser Phe Tyr Arg Asp Gln Pro His Pro Phe Ile Thr 160 165 170 175 agt atg gtc cgt gca ctg gat gaa gca atg aac aag ctg cag cga gca 576 Ser Met Val Arg Ala Leu Asp Glu Ala Met Asn Lys Leu Gln Arg Ala 180 185 190 aat cca gac gac cca gct tat gat gaa aac aag cgc cag ttt caa gaa 624 Asn Pro Asp Asp Pro Ala Tyr Asp Glu Asn Lys Arg Gln Phe Gln Glu 195 200 205 gat atc aag gtg atg aac gac cta gta gat aaa att att gca gat cgc 672 Asp Ile Lys Val Met Asn Asp Leu Val Asp Lys Ile Ile Ala Asp Arg 210 215 220 aaa gca agc ggt gaa caa agc gat gat tta tta acg cat atg cta aac 720 Lys Ala Ser Gly Glu Gln Ser Asp Asp Leu Leu Thr His Met Leu Asn 225 230 235 gga aaa gat cca gaa acg ggt gag ccg ctt gat gac gag aac att cgc 768 Gly Lys Asp Pro Glu Thr Gly Glu Pro Leu Asp Asp Glu Asn Ile Arg 240 245 250 255 tat caa att att aca ttc tta att gcg gga cac gaa aca aca agt ggt 816 Tyr Gln Ile Ile Thr Phe Leu Ile Ala Gly His Glu Thr Thr Ser Gly 260 265 270 ctt tta tca ttt gcg ctg tat ttc tta gtg aaa aat cca cat gta tta 864 Leu Leu Ser Phe Ala Leu Tyr Phe Leu Val Lys Asn Pro His Val Leu 275 280 285 caa aaa gca gca gaa gaa gca gca cga gtt cta gta gat cct gtt cca 912 Gln Lys Ala Ala Glu Glu Ala Ala Arg Val Leu Val Asp Pro Val Pro 290 295 300 agc tac aaa caa gtc aaa cag ctt aaa tat gtc ggc atg gtc tta aac 960 Ser Tyr Lys Gln Val Lys Gln Leu Lys Tyr Val Gly Met Val Leu Asn 305 310 315 gaa gcg ctg cgc tta tgg cca act gct cct gcg ttt tcc cta tat gca 1008 Glu Ala Leu Arg Leu Trp Pro Thr Ala Pro Ala Phe Ser Leu Tyr Ala 320 325 330 335 aaa gaa gat acg gtg ctt gga gga gaa tat cct tta gaa aaa ggc gac 1056 Lys Glu Asp Thr Val Leu Gly Gly Glu Tyr Pro Leu Glu Lys Gly Asp 340 345 350 gaa cta atg gtt ctg att cct cag ctt cac cgt gat aaa aca att tgg 1104 Glu Leu Met Val Leu Ile Pro Gln Leu His Arg Asp Lys Thr Ile Trp 355 360 365 gga gac gat gtg gaa gag ttc cgt cca gag cgt ttt gaa aat cca agt 1152 Gly Asp Asp Val Glu Glu Phe Arg Pro Glu Arg Phe Glu Asn Pro Ser 370 375 380 gcg att ccg cag cat gcg ttt aaa ccg ttt gga aac ggt cag cgt gcg 1200 Ala Ile Pro Gln His Ala Phe Lys Pro Phe Gly Asn Gly Gln Arg Ala 385 390 395 tgt atc ggt cag cag ttc gct ctt cat gaa gca acg ctg gta ctt ggt 1248 Cys Ile Gly Gln Gln Phe Ala Leu His Glu Ala Thr Leu Val Leu Gly 400 405 410 415 atg atg cta aaa cac ttt gac ttt gaa gat cat aca aac tac gag ctg 1296 Met Met Leu Lys His Phe Asp Phe Glu Asp His Thr Asn Tyr Glu Leu 420 425 430 gat att aaa gaa act tta acg tta aaa cct gaa ggc ttt gtg gta aaa 1344 Asp Ile Lys Glu Thr Leu Thr Leu Lys Pro Glu Gly Phe Val Val Lys 435 440 445 gca aaa tcg aaa aaa att ccg ctt ggc ggt att cct tca cct agc act 1392 Ala Lys Ser Lys Lys Ile Pro Leu Gly Gly Ile Pro Ser Pro Ser Thr 450 455 460 gaa cag tct gct aaa aaa gta cgc aaa aag gca gaa aac gct cat aat 1440 Glu Gln Ser Ala Lys Lys Val Arg Lys Lys Ala Glu Asn Ala His Asn 465 470 475 acg ccg ctg ctt gtg cta tac ggt tca aat atg gga aca gct gaa gga 1488 Thr Pro Leu Leu Val Leu Tyr Gly Ser Asn Met Gly Thr Ala Glu Gly 480 485 490 495 acg gcg cgt gat tta gca gat att gca atg agc aaa gga ttt gca ccg 1536 Thr Ala Arg Asp Leu Ala Asp Ile Ala Met Ser Lys Gly Phe Ala Pro 500 505 510 cag gtc gca acg ctt gat tca cac gcc gga aat ctt ccg cgc gaa gga 1584 Gln Val Ala Thr Leu Asp Ser His Ala Gly Asn Leu Pro Arg Glu Gly 515 520 525 gct gta tta att gta acg gcg tct tat aac ggt cat ccg cct gat aac 1632 Ala Val Leu Ile Val Thr Ala Ser Tyr Asn Gly His Pro Pro Asp Asn 530 535 540 gca aag caa ttt gtc gac tgg tta gac caa gcg tct gct gat gaa gta 1680 Ala Lys Gln Phe Val Asp Trp Leu Asp Gln Ala Ser Ala Asp Glu Val 545 550 555 aaa ggc gtt cgc tac tcc gta ttt gga tgc ggc gat aaa aac tgg gct 1728 Lys Gly Val Arg Tyr Ser Val Phe Gly Cys Gly Asp Lys Asn Trp Ala 560 565 570 575 act acg tat caa aaa gtg cct gct ttt atc gat gaa acg ctt gcc gct 1776 Thr Thr Tyr Gln Lys Val Pro Ala Phe Ile Asp Glu Thr Leu Ala Ala 580 585 590 aaa ggg gca gaa aac atc gct gac cgc ggt gaa gca gat gca agc gac 1824 Lys Gly Ala Glu Asn Ile Ala Asp Arg Gly Glu Ala Asp Ala Ser Asp 595 600 605 gac ttt gaa ggc aca tat gaa gaa tgg cgt gaa cat atg tgg agt gac 1872 Asp Phe Glu Gly Thr Tyr Glu Glu Trp Arg Glu His Met Trp Ser Asp 610 615 620 gta gca gcc tac ttt aac ctc gac att gaa aac agt gaa gat aat aaa 1920 Val Ala Ala Tyr Phe Asn Leu Asp Ile Glu Asn Ser Glu Asp Asn Lys 625 630 635 tct act ctt tca ctt caa ttt gtc gac agc gcc gcg gat atg ccg ctt 1968 Ser Thr Leu Ser Leu Gln Phe Val Asp Ser Ala Ala Asp Met Pro Leu 640 645 650 655 gcg aaa atg cac ggt gcg ttt tca acg aac gtc gta gca agc aaa gaa 2016 Ala Lys Met His Gly Ala Phe Ser Thr Asn Val Val Ala Ser Lys Glu 660 665 670 ctt caa cag cca ggc agt gca cga agc acg cga cat ctt gaa att gaa 2064 Leu Gln Gln Pro Gly Ser Ala Arg Ser Thr Arg His Leu Glu Ile Glu 675 680 685 ctt cca aaa gaa gct tct tat caa gaa gga gat cat tta ggt gtt att 2112 Leu Pro Lys Glu Ala Ser Tyr Gln Glu Gly Asp His Leu Gly Val Ile 690 695 700 cct cgc aac tat gaa gga ata gta aac cgt gta aca gca agg ttc ggc 2160 Pro Arg Asn Tyr Glu Gly Ile Val Asn Arg Val Thr Ala Arg Phe Gly 705 710 715 cta gat gca tca cag caa atc cgt ctg gaa gca gaa gaa gaa aaa tta 2208 Leu Asp Ala Ser Gln Gln Ile Arg Leu Glu Ala Glu Glu Glu Lys Leu 720 725 730 735 gct cat ttg cca ctc gct aaa aca gta tcc gta gaa gag ctt ctg caa 2256 Ala His Leu Pro Leu Ala Lys Thr Val Ser Val Glu Glu Leu Leu Gln 740 745 750 tac gtg gag ctt caa gat cct gtt acg cgc acg cag ctt cgc gca atg 2304 Tyr Val Glu Leu Gln Asp Pro Val Thr Arg Thr Gln Leu Arg Ala Met 755 760 765 gct gct aaa acg gtc tgc ccg ccg cat aaa gta gag ctt gaa gcc ttg 2352 Ala Ala Lys Thr Val Cys Pro Pro His Lys Val Glu Leu Glu Ala Leu 770 775 780 ctt gaa aag caa gcc tac aaa gaa caa gtg ctg gca aaa cgt tta aca 2400 Leu Glu Lys Gln Ala Tyr Lys Glu Gln Val Leu Ala Lys Arg Leu Thr 785 790 795 atg ctt gaa ctg ctt gaa aaa tac ccg gcg tgt gaa atg aaa ttc agc 2448 Met Leu Glu Leu Leu Glu Lys Tyr Pro Ala Cys Glu Met Lys Phe Ser 800 805 810 815 gaa ttt atc gcc ctt ctg cca agc ata cgc ccg cgc tat tac tcg att 2496 Glu Phe Ile Ala Leu Leu Pro Ser Ile Arg Pro Arg Tyr Tyr Ser Ile 820 825 830 tct tca tca cct cgt gtc gat gaa aaa caa gca agc atc acg gtc agc 2544 Ser Ser Ser Pro Arg Val Asp Glu Lys Gln Ala Ser Ile Thr Val Ser 835 840 845 gtt gtc tca gga gaa gcg tgg agc gga tat gga gaa tat aaa gga att 2592 Val Val Ser Gly Glu Ala Trp Ser Gly Tyr Gly Glu Tyr Lys Gly Ile 850 855 860 gcg tcg aac tat ctt gcc gag ctg caa gaa gga gat acg att acg tgc 2640 Ala Ser Asn Tyr Leu Ala Glu Leu Gln Glu Gly Asp Thr Ile Thr Cys 865 870 875 ttt att tcc aca ccg cag tca gaa ttt acg ctg cca aaa gac cct gaa 2688 Phe Ile Ser Thr Pro Gln Ser Glu Phe Thr Leu Pro Lys Asp Pro Glu 880 885 890 895 acg ccg ctt atc atg gtc gga ccg gga aca ggc gtc gcg ccg ttt aga 2736 Thr Pro Leu Ile Met Val Gly Pro Gly Thr Gly Val Ala Pro Phe Arg 900 905 910 ggc ttt gtg cag gcg cgc aaa cag cta aaa gaa caa gga cag tca ctt 2784 Gly Phe Val Gln Ala Arg Lys Gln Leu Lys Glu Gln Gly Gln Ser Leu 915 920 925 gga gaa gca cat tta tac ttc ggc tgc cgt tca cct cat gaa gac tat 2832 Gly Glu Ala His Leu Tyr Phe Gly Cys Arg Ser Pro His Glu Asp Tyr 930 935 940 ctg tat caa gaa gag ctt gaa aac gcc caa agc gaa ggc atc att acg 2880 Leu Tyr Gln Glu Glu Leu Glu Asn Ala Gln Ser Glu Gly Ile Ile Thr 945 950 955 ctt cat acc gct ttt tct cgc atg cca aat cag ccg aaa aca tac gtt 2928 Leu His Thr Ala Phe Ser Arg Met Pro Asn Gln Pro Lys Thr Tyr Val 960 965 970 975 cag cac gta atg gaa caa gac ggc aag aaa ttg att gaa ctt ctt gat 2976 Gln His Val Met Glu Gln Asp Gly Lys Lys Leu Ile Glu Leu Leu Asp 980 985 990 caa gga gcg cac ttc tat att tgc gga gac gga agc caa atg gca cct 3024 Gln Gly Ala His Phe Tyr Ile Cys Gly Asp Gly Ser Gln Met Ala Pro 995 1000 1005 gcc gtt gaa gca acg ctt atg aaa agc tat gct gac gtt cac caa gtg 3072 Ala Val Glu Ala Thr Leu Met Lys Ser Tyr Ala Asp Val His Gln Val 1010 1015 1020 agt gaa gca gac gct cgc tta tgg ctg cag cag cta gaa gaa aaa ggc 3120 Ser Glu Ala Asp Ala Arg Leu Trp Leu Gln Gln Leu Glu Glu Lys Gly 1025 1030 1035 cga tac gca aaa gac gtg tgg gct ggg taa 3150 Arg Tyr Ala Lys Asp Val Trp Ala Gly 1040 1045 <210> 2 <211> 1048 <212> PRT <213> Bacillus megaterium <400> 2 Thr Ile Lys Glu Met Pro Gln Pro Lys Thr Phe Gly Glu Leu Lys Asn 1 5 10 15 Leu Pro Leu Leu Asn Thr Asp Lys Pro Val Gln Ala Leu Met Lys Ile 20 25 30 Ala Asp Glu Leu Gly Glu Ile Phe Lys Phe Glu Ala Pro Gly Arg Val 35 40 45 Thr Arg Tyr Leu Ser Ser Gln Arg Leu Ile Lys Glu Ala Cys Asp Glu 50 55 60 Ser Arg Phe Asp Lys Asn Leu Ser Gln Ala Leu Lys Phe Val Arg Asp 65 70 75 80 Phe Ala Gly Asp Gly Leu Phe Thr Ser Trp Thr His Glu Lys Asn Trp 85 90 95 Lys Lys Ala His Asn Ile Leu Leu Pro Ser Phe Ser Gln Gln Ala Met 100 105 110 Lys Gly Tyr His Ala Met Met Val Asp Ile Ala Val Gln Leu Val Gln 115 120 125 Lys Trp Glu Arg Leu Asn Ala Asp Glu His Ile Glu Val Pro Glu Asp 130 135 140 Met Thr Arg Leu Thr Leu Asp Thr Ile Gly Leu Cys Gly Phe Asn Tyr 145 150 155 160 Arg Phe Asn Ser Phe Tyr Arg Asp Gln Pro His Pro Phe Ile Thr Ser 165 170 175 Met Val Arg Ala Leu Asp Glu Ala Met Asn Lys Leu Gln Arg Ala Asn 180 185 190 Pro Asp Asp Pro Ala Tyr Asp Glu Asn Lys Arg Gln Phe Gln Glu Asp 195 200 205 Ile Lys Val Met Asn Asp Leu Val Asp Lys Ile Ile Ala Asp Arg Lys 210 215 220 Ala Ser Gly Glu Gln Ser Asp Asp Leu Leu Thr His Met Leu Asn Gly 225 230 235 240 Lys Asp Pro Glu Thr Gly Glu Pro Leu Asp Asp Glu Asn Ile Arg Tyr 245 250 255 Gln Ile Ile Thr Phe Leu Ile Ala Gly His Glu Thr Thr Ser Gly Leu 260 265 270 Leu Ser Phe Ala Leu Tyr Phe Leu Val Lys Asn Pro His Val Leu Gln 275 280 285 Lys Ala Ala Glu Glu Ala Ala Arg Val Leu Val Asp Pro Val Pro Ser 290 295 300 Tyr Lys Gln Val Lys Gln Leu Lys Tyr Val Gly Met Val Leu Asn Glu 305 310 315 320 Ala Leu Arg Leu Trp Pro Thr Ala Pro Ala Phe Ser Leu Tyr Ala Lys 325 330 335 Glu Asp Thr Val Leu Gly Gly Glu Tyr Pro Leu Glu Lys Gly Asp Glu 340 345 350 Leu Met Val Leu Ile Pro Gln Leu His Arg Asp Lys Thr Ile Trp Gly 355 360 365 Asp Asp Val Glu Glu Phe Arg Pro Glu Arg Phe Glu Asn Pro Ser Ala 370 375 380 Ile Pro Gln His Ala Phe Lys Pro Phe Gly Asn Gly Gln Arg Ala Cys 385 390 395 400 Ile Gly Gln Gln Phe Ala Leu His Glu Ala Thr Leu Val Leu Gly Met 405 410 415 Met Leu Lys His Phe Asp Phe Glu Asp His Thr Asn Tyr Glu Leu Asp 420 425 430 Ile Lys Glu Thr Leu Thr Leu Lys Pro Glu Gly Phe Val Val Lys Ala 435 440 445 Lys Ser Lys Lys Ile Pro Leu Gly Gly Ile Pro Ser Pro Ser Thr Glu 450 455 460 Gln Ser Ala Lys Lys Val Arg Lys Lys Ala Glu Asn Ala His Asn Thr 465 470 475 480 Pro Leu Leu Val Leu Tyr Gly Ser Asn Met Gly Thr Ala Glu Gly Thr 485 490 495 Ala Arg Asp Leu Ala Asp Ile Ala Met Ser Lys Gly Phe Ala Pro Gln 500 505 510 Val Ala Thr Leu Asp Ser His Ala Gly Asn Leu Pro Arg Glu Gly Ala 515 520 525 Val Leu Ile Val Thr Ala Ser Tyr Asn Gly His Pro Pro Asp Asn Ala 530 535 540 Lys Gln Phe Val Asp Trp Leu Asp Gln Ala Ser Ala Asp Glu Val Lys 545 550 555 560 Gly Val Arg Tyr Ser Val Phe Gly Cys Gly Asp Lys Asn Trp Ala Thr 565 570 575 Thr Tyr Gln Lys Val Pro Ala Phe Ile Asp Glu Thr Leu Ala Ala Lys 580 585 590 Gly Ala Glu Asn Ile Ala Asp Arg Gly Glu Ala Asp Ala Ser Asp Asp 595 600 605 Phe Glu Gly Thr Tyr Glu Glu Trp Arg Glu His Met Trp Ser Asp Val 610 615 620 Ala Ala Tyr Phe Asn Leu Asp Ile Glu Asn Ser Glu Asp Asn Lys Ser 625 630 635 640 Thr Leu Ser Leu Gln Phe Val Asp Ser Ala Ala Asp Met Pro Leu Ala 645 650 655 Lys Met His Gly Ala Phe Ser Thr Asn Val Val Ala Ser Lys Glu Leu 660 665 670 Gln Gln Pro Gly Ser Ala Arg Ser Thr Arg His Leu Glu Ile Glu Leu 675 680 685 Pro Lys Glu Ala Ser Tyr Gln Glu Gly Asp His Leu Gly Val Ile Pro 690 695 700 Arg Asn Tyr Glu Gly Ile Val Asn Arg Val Thr Ala Arg Phe Gly Leu 705 710 715 720 Asp Ala Ser Gln Gln Ile Arg Leu Glu Ala Glu Glu Glu Lys Leu Ala 725 730 735 His Leu Pro Leu Ala Lys Thr Val Ser Val Glu Glu Leu Leu Gln Tyr 740 745 750 Val Glu Leu Gln Asp Pro Val Thr Arg Thr Gln Leu Arg Ala Met Ala 755 760 765 Ala Lys Thr Val Cys Pro Pro His Lys Val Glu Leu Glu Ala Leu Leu 770 775 780 Glu Lys Gln Ala Tyr Lys Glu Gln Val Leu Ala Lys Arg Leu Thr Met 785 790 795 800 Leu Glu Leu Leu Glu Lys Tyr Pro Ala Cys Glu Met Lys Phe Ser Glu 805 810 815 Phe Ile Ala Leu Leu Pro Ser Ile Arg Pro Arg Tyr Tyr Ser Ile Ser 820 825 830 Ser Ser Pro Arg Val Asp Glu Lys Gln Ala Ser Ile Thr Val Ser Val 835 840 845 Val Ser Gly Glu Ala Trp Ser Gly Tyr Gly Glu Tyr Lys Gly Ile Ala 850 855 860 Ser Asn Tyr Leu Ala Glu Leu Gln Glu Gly Asp Thr Ile Thr Cys Phe 865 870 875 880 Ile Ser Thr Pro Gln Ser Glu Phe Thr Leu Pro Lys Asp Pro Glu Thr 885 890 895 Pro Leu Ile Met Val Gly Pro Gly Thr Gly Val Ala Pro Phe Arg Gly 900 905 910 Phe Val Gln Ala Arg Lys Gln Leu Lys Glu Gln Gly Gln Ser Leu Gly 915 920 925 Glu Ala His Leu Tyr Phe Gly Cys Arg Ser Pro His Glu Asp Tyr Leu 930 935 940 Tyr Gln Glu Glu Leu Glu Asn Ala Gln Ser Glu Gly Ile Ile Thr Leu 945 950 955 960 His Thr Ala Phe Ser Arg Met Pro Asn Gln Pro Lys Thr Tyr Val Gln 965 970 975 His Val Met Glu Gln Asp Gly Lys Lys Leu Ile Glu Leu Leu Asp Gln 980 985 990 Gly Ala His Phe Tyr Ile Cys Gly Asp Gly Ser Gln Met Ala Pro Ala 995 1000 1005 Val Glu Ala Thr Leu Met Lys Ser Tyr Ala Asp Val His Gln Val Ser 1010 1015 1020 Glu Ala Asp Ala Arg Leu Trp Leu Gln Gln Leu Glu Glu Lys Gly Arg 1025 1030 1035 1040 Tyr Ala Lys Asp Val Trp Ala Gly 1045 <210> 3 <211> 30 <212> DNA <213> Synthetic sequence <220> <223> Description of the synthetic sequence: PCR primer <400> 3 gcaggagacg ggttgnnnac aagctggacg 30 <210> 4 <211> 30 <212> DNA <213> Synthetic sequence <220> <223> Description of the synthetic sequence: PCR primer <400> 4 cgtccagctt gtnnncaacc cgtctcctgc 30 <210> 5 <211> 34 <212> DNA <213> Synthetic sequence <220> <223> Description of the synthetic sequence: PCR primer <400> 5 gaagcaatga acaagnnnca gcgagcaaat ccag 34 <210> 6 <211> 30 <212> DNA <213> Synthetic sequence <220> <223> Description of the synthetic sequence: PCR primer <400> 6 ctggatttgc tcgctgnnnc ttgttcattg 30 <210> 7 <211> 41 <212> DNA <213> Synthetic sequence <220> <223> Description of the synthetic sequence: PCR primer <400> 7 gctttgataa aaacttaaag tcaannnctt aaatttgtac g 41 <210> 8 <211> 40 <212> DNA <213> Synthetic sequence <220> <223> Description of the synthetic sequence: PCR primer <400> 8 cgtacaaatt taagnnnttg acttaagttt ttatcaaagc 40 <210> 9 <211> 1049 <212> PRT <213> Bacillus megaterium <400> 9 Met Thr Ile Lys Glu Met Pro Gln Pro Lys Thr Phe Gly Glu Leu Lys 1 5 10 15 Asn Leu Pro Leu Leu Asn Thr Asp Lys Pro Val Gln Ala Leu Met Lys 20 25 30 Ile Ala Asp Glu Leu Gly Glu Ile Phe Lys Phe Glu Ala Pro Gly Arg 35 40 45 Val Thr Arg Tyr Leu Ser Ser Gln Arg Leu Ile Lys Glu Ala Cys Asp 50 55 60 Glu Ser Arg Phe Asp Lys Asn Leu Ser Gln Ala Leu Lys Phe Val Arg 65 70 75 80 Asp Phe Ala Gly Asp Gly Leu Phe Thr Ser Trp Thr His Glu Lys Asn 85 90 95 Trp Lys Lys Ala His Asn Ile Leu Leu Pro Ser Phe Ser Gln Gln Ala 100 105 110 Met Lys Gly Tyr His Ala Met Met Val Asp Ile Ala Val Gln Leu Val 115 120 125 Gln Lys Trp Glu Arg Leu Asn Ala Asp Glu His Ile Glu Val Pro Glu 130 135 140 Asp Met Thr Arg Leu Thr Leu Asp Thr Ile Gly Leu Cys Gly Phe Asn 145 150 155 160 Tyr Arg Phe Asn Ser Phe Tyr Arg Asp Gln Pro His Pro Phe Ile Thr 165 170 175 Ser Met Val Arg Ala Leu Asp Glu Ala Met Asn Lys Leu Gln Arg Ala 180 185 190 Asn Pro Asp Asp Pro Ala Tyr Asp Glu Asn Lys Arg Gln Phe Gln Glu 195 200 205 Asp Ile Lys Val Met Asn Asp Leu Val Asp Lys Ile Ile Ala Asp Arg 210 215 220 Lys Ala Ser Gly Glu Gln Ser Asp Asp Leu Leu Thr His Met Leu Asn 225 230 235 240 Gly Lys Asp Pro Glu Thr Gly Glu Pro Leu Asp Asp Glu Asn Ile Arg 245 250 255 Tyr Gln Ile Ile Thr Phe Leu Ile Ala Gly His Glu Thr Thr Ser Gly 260 265 270 Leu Leu Ser Phe Ala Leu Tyr Phe Leu Val Lys Asn Pro His Val Leu 275 280 285 Gln Lys Ala Ala Glu Glu Ala Ala Arg Val Leu Val Asp Pro Val Pro 290 295 300 Ser Tyr Lys Gln Val Lys Gln Leu Lys Tyr Val Gly Met Val Leu Asn 305 310 315 320 Glu Ala Leu Arg Leu Trp Pro Thr Ala Pro Ala Phe Ser Leu Tyr Ala 325 330 335 Lys Glu Asp Thr Val Leu Gly Gly Glu Tyr Pro Leu Glu Lys Gly Asp 340 345 350 Glu Leu Met Val Leu Ile Pro Gln Leu His Arg Asp Lys Thr Ile Trp 355 360 365 Gly Asp Asp Val Glu Glu Phe Arg Pro Glu Arg Phe Glu Asn Pro Ser 370 375 380 Ala Ile Pro Gln His Ala Phe Lys Pro Phe Gly Asn Gly Gln Arg Ala 385 390 395 400 Cys Ile Gly Gln Gln Phe Ala Leu His Glu Ala Thr Leu Val Leu Gly 405 410 415 Met Met Leu Lys His Phe Asp Phe Glu Asp His Thr Asn Tyr Glu Leu 420 425 430 Asp Ile Lys Glu Thr Leu Thr Leu Lys Pro Glu Gly Phe Val Val Lys 435 440 445 Ala Lys Ser Lys Lys Ile Pro Leu Gly Gly Ile Pro Ser Pro Ser Thr 450 455 460 Glu Gln Ser Ala Lys Lys Val Arg Lys Lys Ala Glu Asn Ala His Asn 465 470 475 480 Thr Pro Leu Leu Val Leu Tyr Gly Ser Asn Met Gly Thr Ala Glu Gly 485 490 495 Thr Ala Arg Asp Leu Ala Asp Ile Ala Met Ser Lys Gly Phe Ala Pro 500 505 510 Gln Val Ala Thr Leu Asp Ser His Ala Gly Asn Leu Pro Arg Glu Gly 515 520 525 Ala Val Leu Ile Val Thr Ala Ser Tyr Asn Gly His Pro Pro Asp Asn 530 535 540 Ala Lys Gln Phe Val Asp Trp Leu Asp Gln Ala Ser Ala Asp Glu Val 545 550 555 560 Lys Gly Val Arg Tyr Ser Val Phe Gly Cys Gly Asp Lys Asn Trp Ala 565 570 575 Thr Thr Tyr Gln Lys Val Pro Ala Phe Ile Asp Glu Thr Leu Ala Ala 580 585 590 Lys Gly Ala Glu Asn Ile Ala Asp Arg Gly Glu Ala Asp Ala Ser Asp 595 600 605 Asp Phe Glu Gly Thr Tyr Glu Glu Trp Arg Glu His Met Trp Ser Asp 610 615 620 Val Ala Ala Tyr Phe Asn Leu Asp Ile Glu Asn Ser Glu Asp Asn Lys 625 630 635 640 Ser Thr Leu Ser Leu Gln Phe Val Asp Ser Ala Ala Asp Met Pro Leu 645 650 655 Ala Lys Met His Gly Ala Phe Ser Thr Asn Val Val Ala Ser Lys Glu 660 665 670 Leu Gln Gln Pro Gly Ser Ala Arg Ser Thr Arg His Leu Glu Ile Glu 675 680 685 Leu Pro Lys Glu Ala Ser Tyr Gln Glu Gly Asp His Leu Gly Val Ile 690 695 700 Pro Arg Asn Tyr Glu Gly Ile Val Asn Arg Val Thr Ala Arg Phe Gly 705 710 715 720 Leu Asp Ala Ser Gln Gln Ile Arg Leu Glu Ala Glu Glu Glu Lys Leu 725 730 735 Ala His Leu Pro Leu Ala Lys Thr Val Ser Val Glu Glu Leu Leu Gln 740 745 750 Tyr Val Glu Leu Gln Asp Pro Val Thr Arg Thr Gln Leu Arg Ala Met 755 760 765 Ala Ala Lys Thr Val Cys Pro Pro His Lys Val Glu Leu Glu Ala Leu 770 775 780 Leu Glu Lys Gln Ala Tyr Lys Glu Gln Val Leu Ala Lys Arg Leu Thr 785 790 795 800 Met Leu Glu Leu Leu Glu Lys Tyr Pro Ala Cys Glu Met Lys Phe Ser 805 810 815 Glu Phe Ile Ala Leu Leu Pro Ser Ile Arg Pro Arg Tyr Tyr Ser Ile 820 825 830 Ser Ser Ser Pro Arg Val Asp Glu Lys Gln Ala Ser Ile Thr Val Ser 835 840 845 Val Val Ser Gly Glu Ala Trp Ser Gly Tyr Gly Glu Tyr Lys Gly Ile 850 855 860 Ala Ser Asn Tyr Leu Ala Glu Leu Gln Glu Gly Asp Thr Ile Thr Cys 865 870 875 880 Phe Ile Ser Thr Pro Gln Ser Glu Phe Thr Leu Pro Lys Asp Pro Glu 885 890 895 Thr Pro Leu Ile Met Val Gly Pro Gly Thr Gly Val Ala Pro Phe Arg 900 905 910 Gly Phe Val Gln Ala Arg Lys Gln Leu Lys Glu Gln Gly Gln Ser Leu 915 920 925 Gly Glu Ala His Leu Tyr Phe Gly Cys Arg Ser Pro His Glu Asp Tyr 930 935 940 Leu Tyr Gln Glu Glu Leu Glu Asn Ala Gln Ser Glu Gly Ile Ile Thr 945 950 955 960 Leu His Thr Ala Phe Ser Arg Met Pro Asn Gln Pro Lys Thr Tyr Val 965 970 975 Gln His Val Met Glu Gln Asp Gly Lys Lys Leu Ile Glu Leu Leu Asp 980 985 990 Gln Gly Ala His Phe Tyr Ile Cys Gly Asp Gly Ser Gln Met Ala Pro 995 1000 1005 Ala Val Glu Ala Thr Leu Met Lys Ser Tyr Ala Asp Val His Gln Val 1010 1015 1020 Ser Glu Ala Asp Ala Arg Leu Trp Leu Gln Gln Leu Glu Glu Lys Gly 1025 1030 1035 1040 Arg Tyr Ala Lys Asp Val Trp Ala Gly 1045

Claims

a) 비치환 또는 치환된 N-, O- 또는 S-헤테로시클릭 1핵 또는 다핵 방향족 화합물의 산화;

b) 비치환 또는 치환된 1핵 또는 다핵 방향족 화합물의 산화;

c) 직쇄 또는 분지쇄 알칸 및 알켄의 산화; 및

d) 비치환 또는 치환된 시클로알칸 및 시클로알켄의 산화

중 하나 이상의 반응을 수행할 수 있는 시토크롬 P450 모노옥시게나제.