KR101776863B1

KR101776863B1 - PAS1 변이 단백질을 포함하는 TodS 변이 단백질 및 이의 용도

Info

Publication number: KR101776863B1
Application number: KR1020150155951A
Authority: KR
Inventors: 김명희; 고세리; 황중원
Original assignee: 한국생명공학연구원
Priority date: 2014-11-06
Filing date: 2015-11-06
Publication date: 2017-09-11
Also published as: WO2016072798A1; KR20160054426A

Abstract

본 발명은 PAS1 변이 단백질, 상기 PAS1 변이 단백질을 포함하는 TodS 변이 단백질, 상기 변이 단백질을 생산하는 미생물, 상기 변이 단백질을 이용하는 방향족 탄화수소 감지용 바이오센서 및 방향족 탄화수소 분해용 미생물 제제에 관한 것이다.
또한, 본 발명은 PAS1 단백질 결정체, SeMet-PAS1 단백질과 톨루엔 복합체의 결정체, PAS1 단백질과 1,2,4-TMB(1,2,4-Trimethylbenzene) 복합체의 결정체 및 상기 결정체의 제조 방법, 및 이의 적용에 관한 것이다.

Description

PAS1 변이 단백질을 포함하는 TodS 변이 단백질 및 이의 용도{TodS mutein comprising PAS1 mutein and use thereof}

본 발명은 PAS1 변이 단백질, 상기 PAS1 변이 단백질을 포함하는 TodS 변이 단백질, 상기 변이 단백질을 생산하는 미생물, 상기 변이 단백질을 이용하는 방향족 탄화수소 감지용 바이오센서 및 방향족 탄화수소 분해용 미생물 제제에 관한 것이다.

또한, 본 발명은 PAS1 단백질 결정체, SeMet-PAS1 단백질과 톨루엔 복합체의 결정체, PAS1 단백질과 1,2,4-TMB(1,2,4-Trimethylbenzene) 복합체의 결정체 및 상기 결정체의 제조 방법, 및 이의 적용에 관한 것이다.

토양 내 축적된 다양한 벤젠계 방향성 휘발성 화학물질들은 토양 미생물인 슈도모나스 푸티타(Pseudomoans putida) 균에 의해 탄소원으로 사용된다. 이 균은 tod 오페론 내에 다양한 톨루엔(toluene) 분해효소를 코딩하고 있고, tod 오페론의 활성은 TodS/TodT 2개 인자 신호조절 시스템에 의해 이루어진다. TodS/TodT 2개 인자 신호조절을 구성하는 TodS는 2개의 PAS 도메인과 2개의 히스티딘 키나아제(Histidine kinase, HK) 도메인, 1개의 반응 조절자(response regulator, RRR)로 구성되어 있다. 톨루엔은 TodS의 N-말단 부위의 PAS1 도메인에 결합하여 TodS 내의 2개의 히스티딘 키나아제의 자기인산화(autophosphorylation)를 유도하고, 인산화된 신호가 전사조절인자 TodT의 인산화를 촉진하여 tod 오페론의 전사조절부위 todX box에 결합함으로써 tod 오페론의 유전자 발현을 가져온다(Proc. Natl. Acad. Sci., 2006, 103, 8191-8196). 슈도모나스 푸티다 F1균의 tod 오페론은 todF, todC1, todC2, todB, todA, todD, todE로 이루어져있고, 톨루엔 2산소화효소(toluene dioxygenase, todABC1C2), cis-톨루엔 디하이드로다이올 디하이드로게나아제(cis-toluene dihydrodiol dehydrogenase, todD), 30-메틸카테콜 2,3,-디옥시게나아제(30-methylcatechol 2,3,-dioxygense, todE), 2-하이드록시-6-옥소-2,4-헥타다이에노에이트 하이드롤라아제(2-hydroxy-6-oxo-2,4-heptadienoate hydrolase, todF) 등의 톨루엔 분해 효소를 코딩하고 있다(Appl. Environ. Microbiol., 1988, 54, 1498-1503). 따라서 TodS의 PAS1 도메인과 톨루엔의 결합은 토양 내 미생물들이 톨루엔을 대체 탄소 자원으로 활용하여 생존을 유지하는데 중요하며, 이러한 톨루엔 분해효소를 발현하는 슈도모나스 균주들은 최근 석유 오염지역 등에서 생물정화 역할을 수행하는 미생물로 활용되고 있다.

한편, 석유환경 오염지역에는 다양한 벤젠계의 방향성 휘발성 화학물질들이 혼합하여 존재하고 있고, TodS의 PAS1 도메인은 톨루엔뿐만 아니라, 스티렌(styrene), m-자일렌(m-xylene), o-자일렌(o-xylene), 1,2,4-TMB 등과 같은 다양한 종류의 방향성 탄화수소가 결합이 될 수 있다. 하지만, 톨루엔 이외의 리간드들이 톨루엔보다 더 높은 결합속도로 PAS1에 결합하게 되면 tod 오페론의 활성이 원활하게 이루어지지 않으며. 결과적으로 미생물에 의한 톨루엔 이화작용이 저해되는 한계를 가지고 있다. 즉, 톨루엔 결합이 가장 강하게 생체 내 신호전달을 가능하게 하는바, 이의 매커니즘 연구 및 이를 이용한 센서 개발이 요구되고 있으나, 정확한 매커니즘 및 PAS1을 포함하는 TodS의 정확한 구조를 규명할 수 없어 어려움이 있어왔다.

최근 단백질 효소공학 연구는 표적 단백질의 입체 구조와 기능을 규명하여, 명확하고 효율적인 과학적 단백질 엔지니어링을 통한 효율적 단백질을 설계하고 개발하는 방향으로 이루어지고 있으며, 이러한 연구는 리간드 특이성과 효능을 증진시킬 수 있는 감지센서 개발 접근 방식으로 활용될 수 있다. 선택적이고 특이적인 리간드의 결합부위을 설계하여 민감도를 증대하고, 리간드 특이성을 확대한 감지센서를 개발하기 위해서는 안정한 상태의 고순도 단백질을 대량으로 확보하고 결정화를 통해 단백질의 입체구조를 규명하는 것이 필수적이다. 그러나, TodS 또는 PAS1 단백질은 안정한 상태로 순수 정제하여 결정화하기에 매우 어려운 까닭에, 그 중요성에도 불구하고 그 동안 입체구조가 밝혀지지 않았다.

이러한 배경 하에 본 발명자들은 PAS1 단백질의 입체구조를 규명하기 위하여 예의 노력한 결과, Apo-PAS1 단백질 결정체, SeMet-PAS1 단백질과 톨루엔과의 복합체 결정체, 및 PAS1 단백질과 1,2,4-TMB와의 복합체 결정체를 제조하여 이로부터 수득한 3차 구조를 토대로 PAS1 단백질과 리간드의 결합부위를 고해상도 원자 수준에서 규명하였다. 또한, 규명한 리간드 결합부위를 이용하여 톨루엔 이외의 다른 방향족 화학 물질과 결합하여 신호를 전달할 수 있는 새로운 기능의 감지센서를 제조할 수 있음을 확인하여, 본 발명을 완성하였다.

본 발명의 하나의 목적은 서열번호 1의 TodS 단백질에서, 하기 (a) 내지 (w)로 이루어진 군에서 선택되는 하나 이상의 변이를 가지는 TodS 변이 단백질을 제공하는 것이다;

(a) 46번 페닐알라닌을 알라닌 또는 세린으로 치환

(b) 47번 발린을 알라닌 또는 류신으로 치환,

(c) 49번 류신을 아스파틱산 또는 알라닌으로 치환,

(d) 58번 글루탐산을 알라닌 또는 세린으로 치환,

(e) 59번 발린을 알라닌, 아스파틱산 또는 페닐알라닌으로 치환,

(f) 61번 글루타민을 류신, 알지닌 또는 알라닌으로 치환,

(g) 63번 알라닌을 발린 또는 세린으로 치환,

(h) 79번 페닐알라닌을 타이로신, 글루탐산 또는 류신으로 치환,

(i) 84번 트립토판을 발린, 히스티딘 또는 알지닌으로 치환,

(j) 85번 트립토판을 히스티딘, 알지닌, 또는 류신으로 치환,

(k) 114번 아이소류신이 발린, 페닐알라닌, 쓰레오닌 또는 세린으로 치환,

(l) 126번 발린을 알라닌, 세린, 쓰레오닌, 또는 류신으로 치환,

(m) 128번 페닐알라닌을 글루탐산, 히스티딘, 아스파틱산, 세린 또는 류신으로 치환,

(n) 131번 류신을 아스파틱산으로 치환,

(o) 145번 알라닌을 세린 또는 발린으로 치환,

(p) 146번 글루탐산을 알라닌 또는 류신으로 치환,

(q) 148번 알지닌을 알라닌 또는 메티오닌으로 치환,

(r) 619번 타이로신 및 620번 글루탐산을 알라닌으로 치환,

(s) 666번 글루탐산을 알라닌으로 치환

(t) 674번 루신을 알라닌으로 치환,

(u) 691번 타이로신을 아이소류신으로 치환,

(v) 703번 알라닌을 세린으로 치환, 및

(w) 617번 내지 623번 아미노산의 결손.

본 발명의 다른 목적은 서열번호 1의 TodS 단백질 중 43번 내지 168번째 또는 23번 내지 168번째 아미노산 서열을 가지는 PAS1 단백질에서, 서열번호 1의 아미노산 서열을 기준으로, 상기 (a) 내지 (q)로 이루어진 군에서 선택되는 하나 이상의 변이를 가지는 PAS1 변이 단백질을 제공하는 것이다.

본 발명의 또 다른 목적은 상기 단백질을 코딩하는 폴리뉴클레오티드; 상기 폴리뉴클레오티드를 포함하는 발현 벡터; 및 상기 발현 벡터가 도입된 미생물을 제공하는 것이다.

본 발명의 또 다른 목적은 상기 변이 단백질을 생산하는 미생물을 제공하는 것이다.

본 발명의 또 다른 목적은 (i) 하기 (a) 내지 (d)의 모듈을 포함하는 센서용 모듈 조합; (ii) 상기 모듈 조합을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트; (iii) 상기 발현 카세트를 포함하는 벡터; 또는 (i) 내지 (iii) 중 어느 하나를 포함하는 미생물을 함유하는, 방향족 탄화수소 감지용 바이오센서를 제공하는 것이다:

(a) 방향족 탄화수소와 특이적으로 결합하는 상기 PAS1 변이 단백질을 포함하는 제1모듈;

(b) 제1모듈에 방향족 탄화수소가 결합시 신호를 발생 및 전달하는 제2모듈;

(c) 상기 전달된 신호에 의해 인산화되는 전사조절인자를 포함하는 제3모듈; 및

(d) 상기 인산화되는 제3모듈에 의해 표지 단백질을 발현시키는 제4모듈.

본 발명의 또 다른 목적은 (i) 하기 (a) 내지 (d)의 모듈을 포함하는 센서용 모듈 조합; (ii) 상기 모듈 조합을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트; 또는 (iii) 상기 발현 카세트를 포함하는 벡터를 포함하는 미생물을 함유하는, 방향족 탄화수소 분해용 미생물 제제을 제공하는 것이다:

(d) 상기 인산화되는 제3모듈에 의해 방향족 탄화수소 분해 단백질을 발현시키는 제4모듈.

본 발명의 또 다른 목적은 상기 바이오센서를 포함하는, 방향족 탄화수소 감지용 조성물을 제공하는 것이다.

본 발명의 또 다른 목적은 상기 미생물 제제를 포함하는, 방향족 탄화수소 분해용 조성물을 제공하는 것이다.

본 발명의 또 다른 목적은 상기 바이오센서를 시료에 노출시키는 단계를 포함하는, 방향족 탄화수소 감지방법을 제공하는 것이다.

본 발명의 또 다른 목적은 상기 미생물 제제를 이용하여 방향족 탄화수소를 분해하는 단계를 포함하는, 방향족 탄화수소 분해방법을 제공하는 것이다.

본 발명의 또 다른 목적은 (a) 표 3에 나타낸 PAS1 단백질의 원자좌표, 표 4에 나타낸 SeMet-PAS1 단백질과 톨루엔 복합체의 원자좌표, 또는 표 5에 나타낸 PAS1 단백질과 1,2,4-TMB(1,2,4-Trimethylbenzene) 복합체의 원자좌표를 이용하여, PAS1 단백질 또는 이의 복합체의 3차 구조를 설계하는 단계;

(b) 상기 설계된 3차 구를 이용하여 PAS1 변이 단백질을 생성하는 단계; 및

(c) 상기 생성된 PAS1 변이 단백질과 주어진 리간드 간의 결합 활성을 측정하는 단계를 포함하는,

야생형 PAS1 단백질에 대하여 리간드 결합 활성이 변이된, PAS1 변이 단백질을 스크리닝하는 방법을 제공하는 것이다.

본 발명의 또 다른 목적은 서열번호 1의 TodS 단백질로부터 43번째 내지 168번째 아미노산 서열을 가지는 PAS1 단백질을 결정화시키는 단계를 포함하는, PAS1 단백질을 결정화시키는 방법을 제공하는 것이다.

본 발명의 또 다른 목적은 서열번호 1의 TodS 단백질 중 43번 내지 168번째 아미노산 서열을 가지는 PAS1 단백질과 톨루엔 또는 1,2,4-TMB(1,2,4-Trimethylbenzene)의 혼합물을 결정화시키는 단계를 포함하는, PAS1 단백질과 톨루엔 또는 1,2,4-TMB의 복합체를 결정화시키는 방법을 제공하는 것이다.

본 발명의 또 다른 목적은 공간군(space group)이 P21이고, 단위 셀 디멘션(unit-cell dimension)은 a=41.114Å, b=49.314Å, c=56.222Å, α=90°, β=109.22°, γ=90°인, 서열번호 1의 TodS 단백질로부터 43번째 내지 168번째 아미노산 서열을 가지는 PAS1 단백질 결정체를 제공하는 것이다.

본 발명의 또 다른 목적은 공간군이 P212121이고, 단위 셀 디멘션은 a=41.342Å, b=47.744Å, c=126.522Å, α=β=γ=90°인, 서열번호 1의 TodS 단백질로부터 43번째 내지 168번째 아미노산 서열을 가지는 PAS1 단백질 중 메티오닌이 셀레노메티오닌인 SeMet-PAS1 단백질과 톨루엔 복합체의 결정체를 제공하는 것이다.

본 발명의 또 다른 목적은 공간군이 P212121이고, 단위 셀 디멘션은 a=45.387Å, b=51.016Å, c=100.728Å, α=β=γ=90°인, 서열번호 1의 TodS 단백질로부터 43번째 내지 168번째 아미노산 서열을 가지는 PAS1 단백질과 1,2,4-TMB(1,2,4-Trimethylbenzene) 복합체의 결정체를 제공하는 것이다.

본 발명의 또 다른 목적은 (a) 표 3에 나타낸 PAS1 단백질의 원자좌표, 표 4에 나타낸 SeMet-PAS1 단백질과 톨루엔 복합체의 원자좌표 또는 표 5에 나타낸 PAS1 단백질과 1,2,4-TMB(1,2,4-Trimethylbenzene) 복합체의 원자좌표를 이용하여 PAS1 단백질 또는 이의 복합체의 3차 구조를 설계하는 단계; (b) 상기 설계된 3차 구조를 이용하여 PAS1에 결합하는 후보 물질을 생성하는 단계; 및 (c) 상기 후보 물질이 PAS1 단백질 또는 PAS1을 포함하는 TodS 단백질과 리간드 간의 결합을 조절하는지 여부를 확인하는 단계를 포함하는, PAS1 단백질 또는 TodS 단백질과 리간드 간의 결합을 조절하는 물질을 스크리닝하는 방법을 제공하는 것이다.

본 발명의 하나의 양태는 TodS 변이 단백질을 제공한다.

본 발명의 TodS 변이 단백질은 다양한 방향족 탄화수소에 대한 민감도가 야생형 TodS 단백질보다 높거나 또는 낮게 변화되어, 방향족 탄화수소의 감지 및/또는 분해에 유용하게 이용될 수 있다.

구체적으로, 서열번호 1의 TodS 단백질에서, 하기 (a) 내지 (w)로 이루어진 군에서 선택되는 하나 이상의 변이를 가지는 TodS 변이 단백질을 제공한다;

(a) 46번 페닐알라닌을 알라닌 또는 세린으로 치환

(b) 47번 발린을 알라닌 또는 류신으로 치환,

(c) 49번 류신을 아스파틱산 또는 알라닌으로 치환,

(d) 58번 글루탐산을 알라닌 또는 세린으로 치환,

(f) 61번 글루타민을 류신, 알지닌 또는 알라닌으로 치환,

(g) 63번 알라닌을 발린 또는 세린으로 치환,

(i) 84번 트립토판을 발린, 히스티딘 또는 알지닌으로 치환,

(j) 85번 트립토판을 히스티딘, 알지닌, 또는 류신으로 치환,

(n) 131번 류신을 아스파틱산으로 치환,

(o) 145번 알라닌을 세린 또는 발린으로 치환,

(p) 146번 글루탐산을 알라닌 또는 류신으로 치환,

(q) 148번 알지닌을 알라닌 또는 메티오닌으로 치환,

(r) 619번 타이로신 및 620번 글루탐산을 알라닌으로 치환,

(s) 666번 글루탐산을 알라닌으로 치환

(t) 674번 루신을 알라닌으로 치환,

(u) 691번 타이로신을 아이소류신으로 치환,

(v) 703번 알라닌을 세린으로 치환, 및

(w) 617번 내지 623번 아미노산의 결손.

본 발명에서 용어, "TodS 단백질"은 방향족 탄화수소를 감지하여 인산 신호를 발생 및 전달하는 단백질을 의미하며, 2개의 PAS 도메인과 2개의 히스티딘 키나아제(Histidine kinase, HK) 도메인, 1개의 반응 조절자(response regulator, RRR)를 포함한다. 상기 TodS 단백질은 슈도모나스 (Pseudomoans) 속 미생물 유래, 구체적으로 슈도모나스 푸티타(Pseudomoans putida) 유래일 수 있으나, 이에 제한되지 않는다. 또한, 상기 TodS 단백질은 특별히 이에 제한되지 않으나, NCBI 유전자 은행과 같은 공지의 데이터베이스를 통하여 이의 서열을 용이하게 수득할 수 있으며, 그 예로 GenBank ID: A5W4E3.1인 단백질일 수 있으며, 서열번호 1로 표시되는 아미노산 서열 또는 서열번호 2로 표시되는 염기서열을 가질 수 있다.

본 발명에서 용어, "TodS 변이 단백질"은 야생형 TodS 유전자 내의 PAS1 단백질에 하나 이상의 아미노산을 치환, 삽입, 제거 또는 변형한 단백질을 의미하며, 본 발명의 목적상 상기 TodS 변이 단백질은 톨루엔에 대한 민감도를 높이거나 낮추기 위해 변이시키거나, 톨루엔 외의 리간드에 대한 민감도를 변화시키기 위해 변이시킨 단백질을 의미할 수 있으나, 이에 제한되지 않는다.

상기 TodS 변이 단백질은 구체적으로는 TodS 단백질인 서열번호 1의 아미노산 서열에서 46번 페닐알라닌, 47번 발린, 48번 글라이신, 49번 류신, 58번 글루탐산, 59번 발린, 61번 글루타민, 63번 알라닌, 79번 페닐알라닌, 84번 트립토판, 85번 트립토판, 114번 아이소류신, 126번 발린, 128번 페닐알라닌, 131번 류신, 145번 알라닌, 146번 글루탐산, 147번 글라이신, 148번 알지닌, 619번 타이로신, 620번 글루탐산, 666번 글루탐산, 674번 루신, 691번 타이로신 및 703번 알라닌으로 이루어진 군 중에서 하나 이상이 변이된 단백질, 예컨대 다른 아미노산으로 치환된 형태의 단백질일 수 있다. 또한, 상기 군 중, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 또는 23개 변이를 포함하는 변이 단백질일 수 있다.

또한, 상기 TodS 변이 단백질은 서열번호 1의 아미노산 서열에서 617번 내지 623번 아미노산이 결손된 단백질 또는 상기 치환된 형태의 TodS 변이 단백질에 추가적으로 617번 내지 623번 아미노산이 결손된 단백질이 수 있다.

더욱 구체적으로는, 상기 TodS 변이 단백질은 TodS 단백질인 서열번호 1의 아미노산 서열에서, (a) 46번 페닐알라닌이 알라닌 또는 세린으로 치환, (b) 47번 발린이 알라닌 또는 류신으로 치환, (c) 49번 류신이 아스파틱산 또는 알라닌으로 치환, (d) 58번 글루탐산이 알라닌 또는 세린으로 치환, (e) 59번 발린이 알라닌, 아스파틱산 또는 페닐알라닌으로 치환, (f) 61번 글루타민이 류신, 알지닌 또는 알라닌으로 치환, (g) 63번 알라닌이 발린 또는 세린으로 치환, (h) 79번 페닐알라닌이 타이로신, 글루탐산 또는 류신으로 치환, (i) 84번 트립토판이 발린, 히스티딘 또는 알지닌으로 치환, (j) 85번 트립토판이 히스티딘, 알지닌, 또는 류신으로 치환, (k) 114번 아이소류신이 발린, 페닐알라닌, 쓰레오닌 또는 세린으로 치환, (l) 126번 발린이 알라닌, 세린, 쓰레오닌, 또는 류신으로 치환, (m) 128번 페닐알라닌이 글루탐산, 히스티딘, 아스파틱산, 세린 또는 류신으로 치환, (n) 131번 류신이 아스파틱산으로 치환, (o) 145번 알라닌이 세린 또는 발린으로 치환, (p) 146번 글루탐산이 알라닌 또는 류신으로 치환, (q) 148번 알지닌이 알라닌 또는 메티오닌(methionine)으로 치환, (r) 619번 타이로신 및 620번 글루탐산을 알라닌으로 치환, (s) 666번 글루탐산이 알라닌으로 치환, (t) 674번 루신이 알라닌으로 치환, (u) 691번 타이로신이 아이소류신으로 치환, (v) 703번 알라닌이 세린으로 치환, 및 (w) 617번 내지 623번 아미노산의 결손으로 이루어진 군에서 선택되는 하나 이상의 변이를 가질 수 있으나, 이에 제한되지 않는다.

상기 TodS 변이 단백질은 상기 변이 단백질뿐 아니라, 야생형 TodS 단백질에 비하여 방향족 탄화수소와 결합하는 능력이 조절된 이상, 상기 변이 위치를 포함하면서, 서열번호 1의 TodS 아미노산 서열과 70% 이상, 구체적으로는 80% 이상, 더욱 구체적으로는 95% 이상, 가장 구체적으로는 97%, 98% 또는 99% 이상의 유사성을 나타내는 아미노산 서열을 포함하는 단백질도 본 발명의 범위 내에 포함됨은 자명하다.

본 발명에서 방향족 탄화수소는 본 발명의 변이 단백질과 결합할 수 있는 방향족 탄화수소는 제한없이 포함될 수 있으며, 벤젠(benzene), 에틸벤젠(ethylbenzene), 프로필벤젠(propylbenzene), 부틸벤젠(butylbenzene), 니트로벤젠(nitrobenzene), 클로로벤젠(chlorobenzene), 플루오로벤젠(fluorobenzene), 톨루엔(toluene), 스티렌(styrene), o-자일렌(o-xylene), m-자일렌(m-xylene), p-자일렌(p-xylene), o-클로로톨루엔(o-chlorotoluene), m-클로로톨루엔(m-chlorotoluene), p-클로로톨루엔(p-chlorotoluene), o-톨루이딘(o-toluidine), m-톨루이딘(m-toluidine), p-톨루이딘(p-toluidine), 카테콜(catechol), 1,2,4-TMB(1,2,4-Trimethylbenzene), 1,2,3-TMB(1,2,3-Trimethylbenzene), 1,3,5-TMB(1,3,5-Trimethylbenzene), 1-나프톨(1-naphthol) 및 2,3-디히드록시나프탈렌(2,3-dihydroxynaphthalene)으로 이루어진 군으로부터 선택된 하나 이상의 화합물일 수 있다.

본 발명에서 서열번호 1의 43 - 978번째 또는 23 - 978번째 아미노산 서열을 가진 TodS 단백질은 각각 TodS (43 - 978) 또는 TodS (23 - 978)와 혼용된다.

본 발명의 다른 하나의 양태는 서열번호 1의 TodS 단백질 중, 23번 내지 168번 아미노산 서열, 또는 43번 내지 168번째 아미노산 서열을 가지는 PAS1 단백질에서, 서열번호 1의 아미노산 서열을 기준으로, 상기 (a) 내지 (q)로 이루어진 군에서 선택되는 하나 이상의 변이를 가지는 PAS1 변이 단백질을 제공한다.

본 발명의 PAS1 변이 단백질은 다양한 방향족 탄화수소에 대한 민감도가 야생형 PAS1 단백질보다 높거나 또는 낮게 변화되어, 방향족 탄화수소의 감지 및/또는 분해에 유용하게 이용될 수 있다.

본 발명에서 용어, "PAS1 단백질"은 톨루엔을 리간드로 감지하여 결합하여 톨루엔에 대한 센서 기능을 나타낼 수 있는, TodS 단백질의 N-말단에 위치한 단백질 부위를 말한다. 구체적으로, PAS1 단백질은 톨루엔과 결합할 수 있으며, 상기 결합에 의하여 PAS1 단백질의 구조변화에 의해 TodS 단백질의 형태 변화(conformational change)가 TodS 단백질의 자가인산화과정을 활성화하고 TodS에 의해 인산화된 TodT가 tod 오페론의 전사조절부위 DNA와 결합하여 tod 유전자들을 활성화 시킬 수 있다.

상기 PAS1 단백질 구조를 형성하는 아미노산 서열 및 염기서열과 같은 정보는 NCBI GenBank와 같은 데이터베이스로부터 얻을 수 있으며, 그 예로 서열번호 1로 표시된 TodS 단백질의 43번 아미노산 내지 168번 아미노산 서열(서열번호 3), 또는 23번 아미노산 내지 168번 아미노산 서열(서열번호 5)일 수 있다. 또한, 상기 PAS1 단백질은 상기 서열번호 3 또는 서열번호 5의 아미노산 서열을 가지는 단백질뿐만 아니라, 이와 80% 이상, 구체적으로는 90% 이상, 보다 구체적으로는 95% 이상, 보다 더욱 구체적으로는 97%, 98% 또는 99% 이상의 상동성을 갖는 아미노산 서열을 포함할 수 있다. 이러한 상동성을 갖는 서열로서 실질적으로 서열번호 또는 서열번호 4의 단백질과 동일하거나 상응하는 생물학적 활성을 갖는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 갖는 경우도 본 발명의 범주에 포함됨은 자명하다.

본 발명에서 용어, "PAS1 변이 단백질"은 야생형 PAS1 단백질에 하나 이상의 아미노산을 치환, 삽입, 제거 또는 변형한 단백질을 의미하며, 본 발명의 목적상 상기 PAS1 변이 단백질은 톨루엔 리간드에 대한 민감도를 높이거나 낮추기 위해 변형시키거나, 톨루엔 외의 리간드에 대한 민감도를 변화시키기 위해 변경시킨 단백질을 의미할 수 있으나, 이에 제한되지 않는다.

또한, 상기 PAS1 변이 단백질은 야생형 PAS1 단백질에 비하여 방향족 탄화수소와 결합하는 능력이 조절된 이상, 상기 (a) 내지 (q)로 이루어진 군에서 선택되는 하나 이상의 변이를 포함하면서, 서열번호 1의 43번 내지 168번째 아미노산 서열, 또는 23번 내지 168번째 아미노산 서열과 70% 이상, 구체적으로는 80% 이상, 더욱 구체적으로는 95% 이상, 가장 구체적으로는 97%, 98% 또는 99% 이상의 유사성을 나타내는 아미노산 서열을 포함하는 단백질도 본 발명의 범위 내에 포함됨은 자명하다.

본 발명에서 서열번호 1의 43 - 168번째 또는 23 - 168번째 아미노산 서열을 가진 PAS1 단백질은 각각 PAS1 (43 - 168) 또는 PAS1 (23 - 168)와 혼용된다.

본 발명의 일 실시예에서는 서열번호 1의 아미노산 서열을 가진 TodS 단백질에서 46번 페닐알라닌이 알라닌 또는 세린으로, 59번 발린이 알라닌, 아스파틱산 또는 페닐알라닌으로, 63번 알라닌이 발린 또는 세린으로, 79번 페닐알라닌이 타이로신, 글루탐산 또는 류신으로, 84번 트립토판이 발린, 히스티딘 또는 알지닌으로, 85번 트립토판이, 히스티딘, 말지닌, 또는 류신으로, 114번 아이소퓨신이 발린, 페닐알라닌, 쓰레오닌(threonine) 또는 세린으로, 126번 발린이 알라닌, 세린, 쓰레오닌, 또는 류신으로, 128번 페닐알라닌이 글루탐산, 히스티딘, 아스파틱산, 세린 또는 류신으로, 145번 알라닌이 세린 또는 발린으로, 47번 발린이 알라닌 또는 류신으로, 49번 류신이 아스파틱산 또는 알라닌으로, 58번 글루탐산이 알리닌 또는 세린으로 131번 류신 아스파틱산으로, 61번 글루타민이 류신, 알지닌, 알라닌으로, 146번 글루탐산이 알라닌 또는 류신으로, 또는 148번 알지닌이 알라닌 또는 메티오닌으로 치환시킨 PAS1 변이 단백질을 포함하는 TodS 변이 단백질을 제조하여, 리간드에 따른 감지 능력을 확인하였다.

또한, 본 발명의 일 실시예에서는 서열번호 1의 아미노산 서열을 가진 TodS 단백질에서 619번 타이로신 및 620번 글루탐산을 알라닌으로 치환, 666번 글루탐산을 알라닌으로 치환, 674번 루신을 알라닌으로 치환, 691번 타이로신을 아이소류신으로 치환, 703번 알라닌을 세린으로 치환, 또는 617번 내지 623번 아미노산이 결손된, TodS 변이 단백질을 제조하여, 리간드에 따른 감지 능력을 확인하였다.

본 발명에서 상기 서열번호 1의 TodS 단백질에서 114번 아이소류신이 발린으로 치환된 TodS 변이 단백질(I114V TodS, 서열번호 7); 또는 상기 TodS 변이 단백질의 아미노산 서열에서 43 내지 168번째, 또는 23번째 내지 168번째 아미노산 서열을 가지는 PAS1 변이 단백질은 톨루엔 및 m-자일렌으로 이루어진 군에서 선택되는 하나 이상의 방향족 탄화수소 감지 센서로서 사용될 수 있다.

본 발명의 일 실시예에 따르면, 상기 I114V TodS의 경우, 도 10에 기술된 방법을 사용하여 활성을 확인하였을 때, 야생형 TodS와 비교하여, 톨루엔에 의한 TodS/TodT 신호전달을 여전히 나타냈을 뿐만 아니라, 야생형 TodS에 비해 2 내지 5배 이상 민감도가 증가되는 결과를 나타내었다(실험예 10).

따라서 상기 I114V TodS는 톨루엔 또는/및 m-자일렌 감지 센서로서 사용될 수 있다. 예컨대, I114V TodS를 코딩하는 폴리뉴클레오티드, TodT를 코딩하는 폴리뉴클레오티드, 및 tod 오페론의 프로모터에 작동가능하게 연결된 리포터 유전자의 3가지 구성 요소를 포함하는 시스템을 미생물에 도입하는 방법 등으로 톨루엔 또는/및 m-자일렌 감지 센서로서 사용할 수 있다.

또한, 본 발명에서 서열번호 1의 TodS 단백질에서 61번 아미노산인 글루타민이 알지닌으로 치환된 TodS 변이 단백질(Q61R TodS, 서열번호 8) 또는 상기 TodS 변이 단백질의 아미노산 서열에서 43 내지 168번째, 또는 23번째 내지 168번째 아미노산 서열을 가지는 PAS1 변이 단백질은 톨루엔, 스티렌, m-자일렌, o-자일렌 및 1,2,4-TMB(1,2,4-Trimethylbenzene)으로 이루어진 군에서 선택되는 하나 이상의 방향족 탄화수소 감지 센서로서 사용될 수 있다.

본 발명의 일 실시예에 따르면, 상기 Q61R TodS의 경우, 도 8에 기술된 방법을 사용하여 활성을 확인하였을 때, 야생형 TodS와 비교하여, 톨루엔에 의한 TodS/TodT 신호전달을 2 내지 4배 가량 민감하게 인지하였을 뿐만 아니라, 스티렌, m-자일렌 및 o-자일렌에 대해서도 야생형 TodS에 비해 높은 민감도를 나타내었다(실험예 10).

따라서 상기 Q61R TodS는 톨루엔, 스티렌, m-자일렌, 또는/및 o-자일렌 감지 센서로서 사용될 수 있다. 예컨대, Q61R TodS를 코딩하는 폴리뉴클레오티드, TodT를 코딩하는 폴리뉴클레오티드, 및 tod 오페론의 프로모터에 작동가능하게 연결된 리포터 유전자의 3가지 구성 요소를 포함하는 시스템을 미생물에 도입하는 방법 등으로 톨루엔, 스티렌, m-자일렌, 또는/및 o-자일렌 감지 센서로서 사용할 수 있다.

본 발명에서 PAS1 단백질은 TodS 단백질의 특정 도메인에 해당하므로, PAS1 변이 단백질은 TodS 변이 단백질에 포함된다.

본 발명의 또 다른 하나의 양태는 TodS 변이 단백질 또는 PAS1 변이 단백질을 코딩하는 폴리뉴클레오티드; 상기 폴리뉴클레오티드를 포함하는, 발현 벡터; 및 상기 발현 벡터가 도입된 형질전환체를 제공한다.

상기 변이 단백질에 대해서는 앞서 설명한 바와 같다.

본 발명에서 제공하는 상기 TodS 변이 단백질 또는 PAS1 변이 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터는 특별히 이에 제한되지 않으나, 포유류 세포(예를 들어, 사람, 원숭이, 토끼, 래트, 햄스터, 마우스 세포 등), 식물 세포, 효모 세포, 곤충 세포 또는 박테리아 세포(예를 들어, 대장균 등)를 포함하는 진핵 또는 원핵세포에서 상기 폴리뉴클레오티드를 복제 및/또는 발현할 수 있는 벡터가 될 수 있고, 바람직하게는 숙주세포에서 상기 폴리뉴클레오티드가 발현될 수 있도록 적절한 프로모터에 작동 가능하도록 연결되며, 적어도 하나의 선별 마커를 포함하는 벡터가 될 수 있다,

본 발명에서 용어, "형질전환체"는 상기 벡터로 형질 전환된 숙주세포로 본 발명의 수용성, 또는 수용성 및 결정성을 갖는 TodS 변이 단백질 또는 PAS1 변이 단백질을 다량으로 생산할 수 있는 형질전환체를 의미하며, 또한 상기 TodS 변이 단백질 또는 PAS1 변이 단백질이 도입되어 NMR 등을 통한 신기능의 감지센서 개발 후보물질을 스크리닝할 수 있는 형질전환체를 포함하나, 이에 제한되지 않는다. 또한, 상기 형질전환체는 방향족 탄화수소와 같은 오염물질을 분해하는 미생물 균주로서도 제작될 수 있다.

본 발명에서 제공하는 상기 발현벡터가 도입된 형질전환체는 특별히 이에 제한되지 않으나, 상기 발현벡터가 도입되어 형질전환 된 대장균, 슈도모나스 등의 박테리아 세포(예, 슈도모나스 푸티다); 효모 세포; 피치아 파스토리스 등의 균류 세포; 또는 식물 세포가 될 수 있다.

본 발명에서 용어, "도입"은 상기 PAS1 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 발현벡터를 숙주세포에 전달하는 방법을 의미한다. 이와 같은 도입은 칼슘 포스페이트-DNA 공침전법, DEAE-덱스트란-매개 트랜스펙션법, 폴리브렌-매개 형질감염법, 전기충격법, 미세주사법, 리포좀 융합법, 리포펙타민 및 원형질체 융합법 등의 당 분야에 공지된 여러 방법에 의해 수행될 수 있다. 또한, 형질도입은 감염(infection)을 수단으로 하여 바이러스 입자를 사용하여 목적물을 세포 내로 전달시키는 것을 의미한다. 아울러, 유전자 밤바드먼트 등에 의해 벡터를 숙주세포 내로 도입할 수 있다. 본 발명에서 도입은 형질전환과 혼용되어 사용될 수 있다.

본 발명의 또 다른 하나의 양태는 상기 TodS 변이 단백질 또는 PAS1 변이 단백질을 생산하는 미생물을 제공한다.

상기 변이 단백질에 대해서는 앞서 설명한 바와 같다.

상기 TodS 변이 단백질 또는 PAS1 변이 단백질을 생산하는 미생물은 돌연변이 없이 상기 변이 단백질을 야생형 단백질로 생산하는 미생물뿐만 아니라, 인위적인 및/또는 자연적인 돌연변이에 의해 상기 변이 단백질을 생산하게 된 미생물을 포함한다. 구체적으로, 상기 TodS 변이 단백질 또는 PAS1 변이 단백질을 생산하는 미생물은 슈도모나스(Pseudomonas) 속 미생물, 더욱 구체적으로 슈도모나스 푸티다(Pseudomonas putida)일 수 있으나, 이에 제한되지 않는다.

본 발명의 또 다른 하나의 양태는 (i) 하기 (a) 내지 (d)의 모듈을 포함하는 센서용 모듈 조합; (ii) 상기 모듈 조합을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트; (iii) 상기 발현 카세트를 포함하는 벡터; 또는 (i) 내지 (iii) 중 어느 하나를 포함하는 미생물을 함유하는, 방향족 탄화수소 감지용 바이오센서를 제공한다:

본 발명의 PAS1 변이 단백질이 방향족 탄화수소와 특이적으로 결합하여 키나아제 단백질의 자기인산화를 유도하여 인산 신호를 발생 및 전달시키면, 상기 전달된 신호에 의해 전사조절인자가 활성화되어 표지 단백질의 프로모터에 결합하여 표지 단백질을 발현시킨다. 즉, 제1모듈 내지 제4모듈을 포함하는 센서용 모듈 조합에 의해 방향족 탄화수소의 종류에 따라 표지 단백질이 발현되므로, 상기 모듈 조합을 포함하는 바이오센서는 방향족 탄화수소 감지 용도로 사용될 수 있다.

상기 변이 단백질, 벡터 및 방향족 탄화수소에 대해서는 앞서 설명한 바와 같다.

상기 제2모듈의 신호는 PAS1 변이 단백질이 특정 방향족 탄화수소와 특이적으로 결합함에 따라 발생하는 신호를 의미한다. 구체적으로 제2모듈의 신호는 PAS1 변이 단백질과 특정 방향족 탄화수소의 결합에 의해 키나아제 단백질이 자기인산화되어 발생 및/또는 전달될 수 있으며, 더욱 구체적으로 1차 키나아제 단백질(HK 1)의 자기인산화에 의해 발생된 인산 신호가 반응 조절자(response regulator, RRR), PAS2 단백질, 및 2차 키나아제 단백질(HK 2)로 이루어진 군에서 선택되는 하나 이상의 단백질을 통해 전달될 수 있다. 또한, 상기 키나아제 단백질, 반응 조절자 및 PAS2 단백질은 인산 신호를 발생 및/또는 전달할 수 있는 한 특별히 제한되지 않으나, 구체적으로 슈노모나스 속 미생물, 더욱 구체적으로 슈도모나스 푸티다 유래일 수 있다.

또한, 상기 제2모듈은 본 발명의 TodS 변이 단백질 중에서 PAS1 변이 단백질을 제외한 단백질을 포함할 수 있다. 그 예로는 자기인산화에 의해 인산 신호를 발생 및/또는 전달할 수 있는 한, 본 발명의 TodS 변이 단백질 중에서 PAS1 변이 단백질을 제외한 단백질의 아미노산 서열과 70% 이상, 구체적으로는 80% 이상, 더욱 구체적으로는 95% 이상, 가장 구체적으로는 97%, 98% 또는 99% 이상의 유사성을 나타내는 아미노산 서열을 가지는 단백질도 포함할 수 있다.

본 발명에서 제3모듈은 제2모듈로부터 전달된 인산 신호에 의해 인산화되어 활성화되는 전사조절인자를 포함한다. 상기 활성화되는 전사조절인자는 표지 단백질을 발현시킬 수 있는 한 제한되지 않으나, 구체적으로 TodT 단백질일 수 있으며, 더욱 구체적으로 슈노모나스 속 미생물 유래, 더더욱 구체적으로 슈도모나스 푸티다 유래일 수 있다. 또한, 상기 TodT 단백질의 아미노산 서열 및 염기서열과 같은 정보는 NCBI GenBank와 같은 데이터베이스로부터 얻을 수 있으며, 그 예로 서열번호 9로 표시된 아미노산 서열 또는 서열번호 10으로 표시되는 염기서열일 수 있다. 또한, 상기 TodT 단백질은 상기 서열번호 9의 아미노산 서열 또는 서열번호 10의 염기서열을 가지는 단백질뿐만 아니라, 이와 80% 이상, 구체적으로는 90% 이상, 보다 구체적으로는 95% 이상, 보다 더욱 구체적으로는 97%, 98% 또는 99% 이상의 상동성을 갖는 아미노산 서열 또는 염기서열을 포함할 수 있다. 이러한 상동성을 갖는 서열로서 실질적으로 서열번호 9 또는 서열번호 10의 단백질과 동일하거나 상응하는 생물학적 활성을 갖는 서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 서열을 갖는 경우도 본 발명의 범주에 포함됨은 자명하다.

본 발명에서 제4모듈은 제3모듈에 의해 표지 단백질을 발현시키는 모듈을 의미한다. 구체적으로, 상기 단백질의 발현은 제3모듈의 인산화되어 활성화된 전사조절인자가 표지 단백질을 발현시키는 프로모터에 결합하여 이루어질 수 있다.

구체적으로, 본 발명에서 제4모듈은 제3모듈의 인산화된 전사조절인자가 결합하는 프로모터 및 상기 프로모터와 작동 가능하게 연결된 표지 단백질을 코딩하는 유전자를 포함할 수 있으나, 이에 제한되지 않는다.

상기 프로모터는 인산화된 전사조절인자가 결합하여 표지 단백질을 발현시킬 수 있는 한 제한되지 않으나, 구체적으로 todX 프로모터일 수 있으며, 더욱 구체적으로 슈노모나스 속 미생물 유래, 더더욱 구체적으로 슈도모나스 푸티다 유래일 수 있다. 또한, 상기 todX 프로모터의 염기서열과 같은 정보는 NCBI GenBank와 같은 데이터베이스로부터 얻을 수 있으며, 그 예로 서열번호 7으로 표시된 염기서열일 수 있다. 또한, 상기 todX 프로모터는 상기 서열번호 7의 염기서열을 가지는 프로모터뿐만 아니라, 이와 80% 이상, 구체적으로는 90% 이상, 보다 구체적으로는 95% 이상, 보다 더욱 구체적으로는 97%, 98% 또는 99% 이상의 상동성을 갖는 염기서열을 포함할 수 있다. 이러한 상동성을 갖는 서열로서 실질적으로 서열번호 7의 프로모터와 동일하거나 상응하는 생물학적 활성을 갖는 염기서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 염기서열을 갖는 경우도 본 발명의 범주에 포함됨은 자명하다.

또한, 상기 표지 단백질은 구체적으로 형광단백질 및 변종(GFP, YFP, RFP, CFP 등), 알칼라인 포스파타제(alkaline phosphatase), 반딧불 루시퍼라제(firefly luciferase), 생물 발광의 미생물(비브리오(Vibrio), 제노르하브두스(Xenorhabdus), 포토르하브두스(Photorhabdus), 및 포토박테리움(Photobacterium) 등) 및 베타-갈락토시다아제(β-galactosidase)로 구성된 군으로부터 선택되는 하나 이상일 수 있으며, 더욱 구체적으로는 베타-갈락토시다아제일 수 있으나, 이에 제한되지 않는다.

본 발명에서 방향족 탄화수소 감지용 바이오센서로 사용될 수 있는 미생물은 제1모듈 내지 제4모듈의 모듈 조합을 포함하여 방향족 탄화수소에 따라 특이적으로 표지 단백질을 발현시킬 수 있는한 제한되지 않으나, 구체적으로 슈노모나스 속 미생물, 더더욱 구체적으로 슈도모나스 푸티다일 수 있다.

본 발명에서 바이오센서는 추가로 표지 단백질의 발현을 측정할 수 있는 물질을 포함할 수 있으나, 이에 제한되지 않는다.

본 발명의 일 실시예에서는 슈도모나스 퓨티다 KT2440 염색체의 mexC 유전자에 TodT 결합 프로모터 P _tod _X, β-갈락토시다아제의 유전자 lacZ, 및 스트렙토마이신 저항 유전자 Sm ^R로 구성된 카세트(P _todX -lacZ-Sm ^R)가 삽입되어 있는, 슈도모나스 퓨티다 KT24400-PXZ 리포터 균주를 제작하였고, 상기 리포터 균주에 PAS1 내 톨루엔 결합부위에 위치-지정 돌연변이를 일으킨 TodS/TodT 플라스미드를 형질전환시켜 슈도모나스 형질전환체들을 제작하였다. 상기 슈도모나스 형질전환체들을 96-웰 딥 플레이트(96-well deep plate)에 배양하고, 효능제인 톨루엔, 스티렌, m-자일렌 또는 길항제인 o-자일렌, 1,2,4-TMB 리간드를 각각 가스형태로 공급하여 생체 내 β-갈락토시다아제 단백질 생성을 유도한 후, 4-MUG(4-methylumbelliferyl β-galactopyranoside) 기질을 이용하여 β-갈락토시다아제 단백질의 활성을 측정하였다(실시예 6). 그 결과, 서열번호 1의 아미노산 서열에서I114V 또는 Q61R로 변형된 PAS1 또는 TodS 변이 단백질을 포함하는 슈도모나스 형질전환체들은 각각 m-자일렌과 o-자일렌 등에 대한 β-갈락토시다아제 활성이 매우 증가하여 상기 방향족 탄화수소 감지용 바이오센서로 사용될 수 있음을 알 수 있었다(실험예 10).

본 발명의 또 다른 하나의 양태는 (i) 하기 (a) 내지 (d)의 모듈을 포함하는 센서용 모듈 조합; (ii) 상기 모듈 조합을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트; 또는 (iii) 상기 발현 카세트를 포함하는 벡터를 포함하는 미생물을 함유하는, 방향족 탄화수소 분해용 미생물 제제를 제공한다:

(a) 방향족 탄화수소와 특이적으로 결합하는 본 발명의 PAS1 변이 단백질을 포함하는 제1모듈;

본 발명의 방향족 탄화수소 분해용 미생물 제제의 모듈 조합은 상기 바이오센서의 모듈 조합에서 제4모듈의 표지 단백질이 방향족 탄화수소 분해 단백질로 교체되어 있는 형태이다. 즉, 제1모듈 내지 제4모듈을 포함하는 모듈 조합에 의해 방향족 탄화수소의 종류에 따라 방향족 탄화수소 분해 단백질이 발현되므로, 상기 모듈 조합을 포함하는 미생물 제제는 방향족 탄화수소를 분해하는 데에 사용될 수 있다.

상기 변이 단백질, 벡터, 방향족 탄화수소, 제1모듈, 제2모듈 및 제3모듈에 대해서는 앞서 설명한 바와 같다.

상기 제4모듈의 방향족 탄화수소 분해 단백질은 방향족 탄화수소를 분해하는 것으로 알려진 다양한 단백질 중에서 선택할 수 있으며, 1 종의 방향족 탄화수소를 분해하기 위해 필요한 2 이상의 단백질이거나, 또는 2 이상의 방향족 탄화수소를 분해할 수 있는 하나 이상의 단백질 일 수 있으나, 이에 제한되지 않는다.

구체적으로, 제4모듈의 방향족 탄화수소 분해 단백질은 톨루엔을 분해하는 데에 필요한 톨루엔 디옥시게나아제(toluene dioxygenase, todABC1C2), cis-톨루엔 디하이드로다이올 디하이드로게나아제(cis-toluene dihydrodiol dehydrogenase, todD), 30-메틸카테콜 2,3,-디옥시게나아제(30-methylcatechol 2,3,-dioxygense, todE) 및 2-하이드록시-6-옥소-2,4-헥타다이에노에이트 하이드롤라아제(2-hydroxy-6-oxo-2,4-heptadienoate hydrolase, todF)로 이루어진 군에서 선택되는 하나 이상일 수 있으나, 이에 제한되지 않는다.

또한, 구체적으로, 제4모듈의 방향족 탄화수소 분해 단백질은 스티렌을 분해하는 데에 필요한 스티렌 모노옥시게나아제(styrene monooxygenase, styAB), 스티렌 옥시드 이소머라아제(styrene oxide isomerase, styC), 페닐아세트알데히드 디하이드로게나아제(penylacetaldehyde dehydrogenase, styD), 및 페닐아세틸 코에이 리가아제(phenylacetyl coA ligase, paaF2)로 이루어진 군에서 선택되는 하나 이상일 수 있으나, 이에 제한되지 않는다.

또한, 구체적으로, 제4모듈의 방향족 탄화수소 분해 단백질은 m-자일렌을 분해하는 데에 필요한 자일렌 모노옥시게나아제(xylene monooxygenase), 벤질 알콜 디하이드로게나아제(benzyl alcohol dehydrogenase), 벤즈알데하이드 디하이드로게나아제(benzaldehyde dehydrogenase), 톨루에이트 디옥시게나아제(toluate dioxygenase), 및 1,2-디하이드록시-3-메틸시클로헥사-3,5-디엔카르복실레이트 디하이드로게나아제(1,2-dihydroxy-3-methylcyclohexa-3,5-dienecarboxylate dehydrogenase)로 이루어진 군에서 선택되는 하나 이상일 수 있으나, 이에 제한되지 않는다.

또한, 구체적으로, 제4모듈의 방향족 탄화수소 분해 단백질은 o-자일렌을 분해하는 데에 필요한 자일렌 모노옥시게나아제(xylene monooxygenase), 벤질 알콜 디하이드로게나아제(benzyl alcohol dehydrogenase), 벤즈알데하이드 디하이드로게나아제(benzaldehyde dehydrogenase), 톨루에이트 디옥시게나아제(toluate dioxygenase), 1,2-디하이드록시-6-메틸시클로헥사-3,5-디엔카르복실레이트 디하이드로게나아제(1,2-dihydroxy-6-methylcyclohexa-3,5-dienecarboxylate dehydrogenase), o-자일렌 3,4-디옥시게나아제(o-xylene 3,4-dioxygenase), 카테콜 2,3-디옥시게나아제(catechol 2,3-dioxygenase), o-자일렌 4,5-디옥시게나아제(o-xylene 4,5-dioxygenase), 및 4,5-디메틸카테콜 2,3-디옥시게나아제(4,5-dimethylcatechol 2,3-dioxygenase)로 이루어진 군에서 선택되는 하나 이상일 수 있으나, 이에 제한되지 않는다.

본 발명에서 방향족 탄화수소 분해용 미생물 제제로 사용될 수 있는 미생물은 상기 제1모듈 내지 제4모듈의 모듈 조합을 포함하여 방향족 탄화수소에 따라 특이적으로 분해 단백질을 발현시킬 수 있는 한 제한되지 않으나, 구체적으로 슈노모나스 속 미생물, 더더욱 구체적으로 슈도모나스 푸티다일 수 있다.

또한, 슈도모나스 속 미생물은 톨루엔 이외에도 스티렌의 이화작용을 위하여 styABCD 오페론을 필요로 하고, styABCD 오페론은styS/styR 2개 인자 신호전달 체계에 의해 조절 받는다. 스티렌에 의해 styS는 styR을 인산화시켜 sty 오페론의 발현을 상향조절 하지만, styS는 또한 스티렌보다 선호하는 글루코스에 존재 하에서는 sty 오페론의 발현을 저해하기도 한다. StyS 역시 TodS와 같이 센서 키나아제로 기능하며, 스티렌 결합은 PAS 도메인에서 이루어질 것으로 추정된다. 따라서, 톨루엔과 결합하는 PAS1 단백질의 입체구조 정보를 기반하여 재설계하여 제작된 PAS1 변이 단백질은, 스트렌 결합에 의해 특이적으로 반응하는 StyS로 도입되어 토양 내 스티렌 오염물질을 분해하는 미생물 균주의 제작을 가능하게 할 수 있다.

본 발명의 또 다른 하나의 양태는 상기 바이오센서를 포함하는, 방향족 탄화수소 감지용 조성물을 제공한다.

본 발명의 또 다른 하나의 양태는 상기 미생물 제제를 포함하는, 방향족 탄화수소 분해용 조성물을 제공한다.

본 발명의 또 다른 하나의 양태는 상기 바이오센서를 시료에 노출시키는 단계를 포함하는, 방향족 탄화수소 감지방법을 제공한다.

본 발명의 바이오센서는 시료에 함유된 방향족 탄화수소의 종류에 따라 표지 단백질이 발현되므로, 발현된 표지 단백질을 측정하여 특정 방향족 탄화수소를 감지할 수 있다.

본 발명의 방향족 탄화수소 감지방법은 추가적으로 바이오센서의 표지 단백의 발현 수준을 측정하여 대조군과 비교하는 단계를 포함할 수 있다.

또한, 본 발명의 방향족 탄화수소 감지방법은 추가적으로 표지 단백의 발현 수준이 대조군에 비하여 증가하는 경우, 시료에 방향족 탄화수소가 존재하는 것으로 판단하는 단계를 포함할 수 있다.

본 발명의 또 다른 하나의 양태는 상기 미생물 제제를 이용하여 방향족 탄화수소를 분해하는 단계를 포함하는, 방향족 탄화수소 분해방법을 제공한다.

본 발명의 미생물 제제는 방향족 탄화수소의 종류에 따라 방향족 탄화수소 분해 단백질이 발현되므로, 특정 방향족 탄화수소를 분해할 수 있다.

본 발명의 또 다른 하나의 양태는 서열번호 1의 TodS 단백질로부터 43번째 내지 168번째 아미노산 서열을 가지는 PAS1 단백질을 결정화시키는 단계를 포함하는, PAS1 단백질을 결정화시키는 방법과, 서열번호 1의 TodS 단백질로부터 43번째 내지 168번째 아미노산 서열을 가지는 PAS1 단백질과 톨루엔 또는 1,2,4-TMB(1,2,4-Trimethylbenzene)의 혼합물을 결정화시키는 단계를 포함하는, PAS1 단백질과 톨루엔 또는 1,2,4-TMB의 복합체를 결정화시키는 방법을 제공한다.

상기 PAS1 단백질 단독의 결정체('Apo-PAS1'으로 명명), 나아가 상기 TodS의 PAS1 단백질 부위에 결합하는 리간드인 톨루엔 및 1,2,4-TMB(1,2,4-Trimethylbenzene) 각각과 PAS1 단백질의 복합체의 결정체의 제조 방법에 대한 본 발명의 구체적인 내용은 하기와 같다.

본 발명에서 용어, " Apo-PAS1"은 PAS1 단백질 단독으로 형성된 결정체를 의미한다. 본 발명의 일 구현예에 따르면 PAS1 단백질은 리간드가 없는 상태에서도 두 분자의 이량체로 존재하나, 아미노산 150번에서 168번 사이의 구조는 유연성이 높다.

본 발명에서 용어, "SeMet-PAS1 단백질"은 PAS1의 메티오닌이 셀레노메티오닌(selenomethionine, SeMet)으로 치환된 단백질을 의미한다. 상기 셀레노메티오닌이란, 메티오닌을 구성하는 황(³²S)을 동족원소인 셀레늄(⁷⁵Se)으로 치환한 아미노산을 말한다. 셀레노메티오닌은 원래의 메티오닌과 유사한 동태 및 화학적 성질을 보이며, X-선 결정학에서 현재까지 밝혀진 유사한 형태의 입체구조가 없을 경우 3차원적 결정 구조를 얻기 위한 위상문제 해결을 위해 사용된다. 이러한 단백질의 구조를 분석하기 위해 메티오닌을 셀레노메티오닌으로 치환하여 결정화하는 방법을 셀레노메티오닌법이라고 지칭하기도 한다. 본 발명의 일 실시예에서는 톨루엔과의 복합체 제조에 있어서 결정화된 단백질의 위상문제를 해결하기 위해, 단백질을 구성하는 메티오닌이 셀레노메티오닌으로 치환된 SeMet-PAS1을 제조하여 톨루엔과 혼합하여 결정화하였다. 상기 셀레노메티오닌(selenomethionine, SeMet)-치환 PAS1 단백질을 얻기 위해서, 메티오닌 영양 요구체 E. coli B834(DE3) 균주(Novagen)를 50mg/ml의 SeMet을 첨가한 최소 배지에서 배양하였다. 상기 배양한 배양물에서 SeMet-치환 PAS1 단백질은 5mM 메티오닌을 모든 버퍼에 첨가하여 정제-수득하였다.

본 발명에서 용어, "톨루엔(toluene)"은, 방향족탄화수소로서 벤젠의 수소 하나가 메틸기로 치환된 무색의 휘발성, 가연성 액체, 메틸벤젠을 말한다. 상기 톨루엔, 대부분 석유로부터 촉매 개량방법에 의해 생산되나, 일부는 에틸렌과 프로필렌 제조 과정에서 가솔린 열분해 과정을 통해 분리 생산된다. 상기 톨루엔은 C₆H₅CH₃의 화학식을 가질 수 있다.

본 발명에서 용어, "SeMet-PAS1 단백질과 톨루엔의 복합체"는 SeMet-PAS1 단백질과 톨루엔 간의 상호작용에 의해 형성된 복합체를 의미한다. 구체적으로는 PAS1 단백질의 소수성 리간드 결합 부위의 46번 페닐알라닌(phenylalanine), 48번 글라이신(glycine), 59번 발린(valine), 63번 알라닌(alanine), 79번 페닐알라닌, 84번 트립토판(tryptophan), 85번 트립토판, 114번 아이소류신(isoleucine), 126번 발린, 128번 페닐알라닌, 145번 알라닌, 147번 글라이신과 톨루엔이 수소 결합(Hydrogen bond) 또는 물 분자-매개 수소 결합에 의하여 형성된 복합체를 의미할 수 있으나, 이에 제한되지 않는다.

본 발명의 구체적인 일 실시예에서는 SeMet-PAS1 단백질과 톨루엔 간의 결합 구조를 본 발명에서 제작한 결정체 구조를 분석하여 확인하였다. 구체적으로, 톨루엔이 PAS1 소수성 리간드 결합 부위에 결합하는 것을 확인하였다. 두 SeMet-PAS1 단량체들 간에 밀접한 결합은 각 SeMet-PAS1 단량체 47번 발린, 49번 류신 및 131번 류신을 통해 일어났다. 또한, PAS1 단백질에 리간드 결합이 일어날 때 나타난 46번 페닐알라닌, 146번 글루탐산과 148번 알지닌의 구조 변화는 TodS 단백질 이량체의 형태 변화와 tod 오페론 유전자들로의 신호 전달에 매우 중요하였다. 더욱이, 톨루엔 리간드의 벤젠 링은 46번 페닐알라닌, 79번 페닐알라닌, 84번 트립토판, 85번 트립토판, 128번 페닐알라닌에 의해 형성된 공간에 위치하며, 63번 알라닌, 114번 아이소류신, 126번 발린, 147번 글라이신도 톨루엔과의 결합에 중요한 역할을 하였다. 또한 톨루엔의 메틸 그룹은 48번 글라이신, 59번 발린, 145번 알라닌 아미노산 잔기들에 둘러싸여 있음을 확인하였다.

본 발명에서 용어, "1,2,4-TMB(1,2,4-trimethylbenzene)"는, 가연성 방향족 탄화수소로서 세 개의 메틸기로 포함하는 무색의 휘발성 액체 형태일 수 있다. 상기 1,2,4-TMB는 대부분 석유나 석탄으로부터 생산된다. 상기 1,2,4-TMB는 C₉H₁₂의 화학식을 가질 수 있다. 본 발명에서 1,2,4-TMB는 PAS1 단백질과 결합할 수 있으며, 상기 결합에 의하여 PAS1 단백질의 구조변화에 의해 나타나는 TodS 단백질의 형태 변화(conformational change)가 TodS 단백질의 자가 인산화과정을 불활성화 시키는 것일 수 있으나, 이에 제한되지 않는다.

본 발명에서 용어, "PAS1 단백질과 1,2,4-TMB의 복합체"는 PAS1 단백질과 1,2,4-TMB 간의 상호작용에 의해 형성된 복합체를 의미한다. 1,2,4-TMB 리간드도 톨루엔과 같이 PAS1 단백질의 소수성 리간드 결합 부위의 46번 페닐알라닌, 48번 글라이신, 59번 발린, 63번 알라닌, 79번 페닐알라닌, 84번 트립토판, 85번 트립토판, 114번 아이소류신, 126번 발린, 128번 페닐알라닌, 145번 알라닌, 또는/및 147번 글라이신과 수소 결합(Hydrogen bond) 또는 물 분자-매개 수소 결합을 하여, 상기 복합체를 형성할 수 있으나, 이에 제한되지 않는다.

본 발명에서 용어, "결정화"를 이룰 수 있게 한다는 것 또는 "결정성"을 갖는다는 것은 단백질을 X-선 단백질 3차 구조 분석을 위한 적합한 상태로 만들어주기 위해 단백질 분자에 변이를 도입하는 등으로 균일한 액상으로부터 일정한 모양과 크기를 갖는 고체입자를 형성하게 하거나 단백질의 결정 상태를 더욱 안정하게 하는 것을 말한다. 단백질의 3차원 구조는 단백질의 생체 내 작용을 이해하고, 분자기전을 규명하는데 매우 중요하다. 즉, 고분자인 단백질을 구성하는 원자의 배열과 3차원 구조를 안다면, PAS1 단백질과 톨루엔 복합체의 3차 구조 분석이 가능하며 PAS1 단백질과 톨루엔 간의 특이적 결합 부위 조절을 통해 리간드 특이성의 확대 및 민감도 증대를 가능하게 하는 신기능의 감지센서 제작의 기반을 마련할 수 있다. 그러나, 단백질, 또는 단백질과 리간드 복합체의 3차 구조의 구조 규명은 일반적으로 매우 어려웠다. 이는, PAS1 단백질 단독 또는 이의 복합체의 3차 구조 분석을 위해서는 먼저 해당 단백질을 결정체로 만들어야 하며, 이를 분석해야 하기 때문이다. 또한, 안정적인 결정체를 수득할 수 있는지 여부는 단백질의 종류에 따라 달라지며, 특히 결정화 조건은 단백질에 따라 전혀 다를 수 있기 때문이다.

상기 단계에서 결정화시키는 방법은 공지의 다양한 결정화 방법을 이용할 수 있으며, 구체적으로 증기 확산법(vapor diffusion method)에 의해 수행될 수 있다. 상기 증기 확산법은 시팅 드롭 증기 확산법(sitting drop vapo-diffusion method) 또는 방울 혼합 증기 확산법(Hanging-drop vapor diffusion method)을 포함하며, 더욱 구체적으로 시팅 드롭 증기 확산법에 의해 수행될 수 있으나, 이에 제한되지 않는다.

본 발명에서 용어, "시팅 드롭 증기 확산법"이란 밀폐된 공간에 모액의 작은 방울과 훨씬 큰 규모의 저수조(reservoir) 용액이 분리된 채 공존할 때, 이들 사이에 물 또는 다른 휘발성 물질의 이동이 일어나게 되고, 단백질의 용액조건에서 슈퍼포화상태가 되며, 그러한 열역학적 준안정 상태에서 침전제의 변화에 따라 단백질이 침전되는 것을 이용한 결정화 방법이다. 단백질이 침전될 때, 그 속도가 느리게 진행되면서 안정된 결정화 상태가 되고, 침전제로 알려져 있는 것은 농축상태의 단백질 용액의 용해도를 줄여 주는 역할을 하게 되며, 단백질 분자 주위의 상대적인 흡착층을 감소시키기 위하여 단백질들은 서로 모여들며 이것이 결정을 형성하게 된다. 저수조 용액은 이와 같은 침전제, 완충액, 염, 계면활성제(detergent) 등이 여러 농도로 섞여 있게 되는데, 단백질 용액과 이런 다양한 조건의 저수조 용액이 보통의 경우 1:1의 비율로 섞어 방울을 형성하게 되고, 이렇게 얻어진 방울을 마이크로브릿지(microbrige) 위에 놓은 후 밀봉한다. 이때, 초기에는 방울 중 단백질의 농도가 저수조 용액의 농도와 차이가 있어서 단백질이 결정 상태로 존재하지 않는다. 이렇게 밀봉된 상태로 놓아두면 서서히 평형이 이루어지고, 상기에 설명한 원리에 의해 특정상태의 조건에서 결정이 형성될 수 있는 것이다. 이와 같은 시팅 드롭 증기 평형법에서 저수조 용액 중의 침전제뿐만 아니라 염, 완충액 및 계면활성제의 종류와 적정 농도, 용액의 pH 및 실험온도는 단백질의 종류에 따라 달리 선택되고 경우에 따라서는 단백질의 결정형성에 있어서 아주 중요한 요소가 된다.

본 발명에서 용어, "방울 혼합 증기 확산법(Hanging-drop vapor diffusion method)"은 단백질의 결정화 방법 중 하나로서, 단백질 구조를 분석하기에 충분한 크기의 결정을 제공하는 방법이다. 방울 혼합 증기 확산법은 샘플이 포함된 시약과 액체 상태의 순수한 시약을 증기 평형 상태에 있는 용기 상단에 부착한다. 용기에 비해 시약의 함량이 적은 샘플이 평형에 도달하기 위해서, 샘플에 포함된 물이 용기로 떨어지게 하므로 액체 상태의 시약과 농도가 같아질 때까지 샘플에 함유된 물이 제거되고, 결과적으로 평형 상태에 도달한 단백질 결정을 얻을 수 있다.

본 발명의 일 실시예에서는 시팅 드롭 증기 확산법을 이용하여 PAS1 단백질의 결정체(Apo-PAS1), SeMet-PAS1 단백질과 톨루엔의 복합체, 및 PAS1 단백질과 1,2,4-TMB 복합체의 결정체를 수득하였다.

본 발명은 PAS1 단백질 단독 또는 이의 톨루엔 또는 1,2,4-TMB 복합체의 결정체를 제조할 수 있는 최적화된 방법을 제공한다. 상기 방법은 시팅 드롭 증기 확산법을 통해 수행될 수 있다.

구체적으로, 상기 PAS1 단백질과 톨루엔 또는 1,2,4-TMB를 1:2 내지 1:20(PAS1 단백질: 톨루엔 또는 1,2,4-TMB), 보다 구체적으로는 1:2의 몰비율로 혼합한 것일 수 있다.

본 발명의 방법에 사용되는 상기 PAS1 단백질은 별도로 발현시키거나 천연에 존재하는 단백질을 정제하는 과정을 통해 수득된 단백질일 수 있으며, 상기 정제는 당업계에 잘 알려진 정제 방법일 수 있다. 따라서, 상기 방법에서 결정화시키는 단계를 수행하기에 앞서, PAS1 단백질을 정제하는 단계를 포함할 수 있으며, 상기 단백질의 정제는 친화성 크로마토그래피 등 공지의 정제 방법에 의하여 수행될 수 있다. 예컨대, 면역친화성 크로마토그래피, 수용체 친화성 크로마토그래피, 소수성 작용 크로마토그래피, 렉틴 친화성 크로마토그래피, 크기배제 크로마토그래피, 양이온 또는 음이온 교환 크로마토그래피, 고성능 액체 크로마토그래피(HPLC) 및 역상 HPLC 등을 포함하는 종래의 크로마토그래피 방법에 의해 숙주 세포가 자라는 배지에서 분리될 수 있다. 또한, PAS1 단백질에 특이적 태그, 라벨 또는 킬레이트 모이어티를 융합하여 융합 단백질을 수득하여 특이적 결합 파트너 또는 제제에 의해 인식하여 정제하는 방법이 있다. 정제된 단백질은 원하는 단백질 부분으로 절단되거나 그 자체로 남아있을 수 있다. 융합 단백질의 절단으로 절단 과정에서 부가적인 아미노산을 가지는 원하는 단백질 형태가 만들어질 수 있다

또한 구체적으로, 상기 결정화는 암모늄 포스페이트 및 트리스 하이드로클로라이드를 포함하는 저수조 용액 조건 하에서 이루어지는 것일 수 있다.

보다 구체적으로, 상기 결정화는 2.8 내지 3.0M 암모늄 포스페이트(예, ammonium phosphate dibasic, trihydrate) 및 0.01 내지 0.1M, 구체적으로는 0.1M 트리스 하이드로클로라이드(Tris-Hydrochloride, pH 8.0 내지 8.5)를 포함하는 용액 조건에서 이루어지는 것일 수 있다.

상기와 같은 조성을 가진 저수조 용액에, PAS1 단백질 또는 이의 리간드를 추가로 포함하는 단백질 용액을 첨가하여 이를 혼합하고, 평형화하여 결정체를 제조할 수 있다.

상기 PAS1 단백질을 포함하는 단백질 용액은 PAS1 단백질을 5 내지 10 mg/ml의 농도로 포함할 수 있으나, 이에 제한되지 않는다. 또한, 상기 단백질 용액은 10 mg/ml의 농도로 PAS1 단백질을 포함하는 용액일 수 있다.

상기 저수조 용액에 단백질 용액을 혼합하는 경우에는, 저수조 용액과 단백질 용액이 바람직하게는 1:1의 비율이 되도록 혼합하나, 이에 제한되지 않는다.

이와 같이 혼합한 용액을 저수조 위쪽을 밀폐한 커버슬립 아래, 또는 용기 상단에 부착하여 결정체가 커지도록 할 수 있다.

여기서, 상기 결정화시키는 단계는 얼음 위에서 1 내지 24시간, 그 예로 1 내지 2시간 동안 정치시키는 것을 통해 이루어지는 것일 수 있다. 본 발명의 일 실시예에서는, 21℃에서 시팅 드랍 증기 확산법을 이용한 정제된 PAS1과 톨루엔을 1:2 몰비율로 혼합하여 1시간 동안 얼음상에 정치시켜 복합체를 얻을 수 있었다. 상기 단백질의 결정화는 3.0M 암모늄 포스페이트(ammonium phosphate dibasic, trihydrate), pH 8.0의 0.1M 트리스 하드로클로라이드(Tris-Hydrochloride) 조건하에서 최적 형성되었다.

본 발명의 또 다른 하나의 양태는 PAS1 단백질 결정체, SeMet-PAS1 단백질과 톨루엔 복합체의 결정체 및 PAS1 단백질과 1,2,4-TMB 복합체의 결정체를 제공한다.

상기 PAS1, SeMet-PAS1, 톨루엔, 1,2,4-TMB, 복합체 및 결정체에 대해서는 앞서 설명한 바와 같다.

구체적으로, 상기 PAS1 단백질 결정체는 공간군(space group)이 P21이고, 단위 셀 디멘션(unit-cell dimension)은 a=41.114Å, b=49.314Å, c=56.222Å, α=90°, β=109.22°, γ=90°인, 서열번호 1의 TodS 단백질로부터 43번째 내지 168번째 아미노산 서열을 가지는 PAS1 단백질 결정체일 수 있다.

또한, 구체적으로 상기 SeMet-PAS1 단백질과 톨루엔 복합체의 결정체는 공간군이 P212121이고, 단위 셀 디멘션은 a=41.342Å, b=47.744Å, c=126.522Å, α=β=γ=90°인, 서열번호 1의 TodS 단백질로부터 43번째 내지 168번째 아미노산 서열을 가지는 PAS1 단백질 중 메티오닌이 셀레노메티오닌인 SeMet-PAS1 단백질과 톨루엔 복합체의 결정체일 수 있다.

또한, 구체적으로 상기 PAS1 단백질과 1,2,4-TMB 복합체의 결정체는 공간군이 P212121이고, 단위 셀 디멘션은 a=45.387Å, b=51.016Å, c=100.728Å, α=β=γ=90°인, 서열번호 1의 TodS 단백질로부터 43번째 내지 168번째 아미노산 서열을 가지는 PAS1 단백질과 1,2,4-TMB(1,2,4-Trimethylbenzene) 복합체의 결정체일 수 있다.

본 발명에서 용어, "공간군(space group)"이란 결정의 단위 세포(unit cell)의 대칭(symmetry)을 의미하며, 대칭요소들을 조합하면 군(group)을 형성한다. 상기 공간은 공간 그룹과 혼용된다.

본 발명에서 용어, "단위 셀 디멘션(unit-cell dimension)"은 격자계수로도 불리며, 단위 셀은 공간군을 구성하는 가장 해석이 용이한 최소 반복 단위(repeating unit)으로, 세 crystallographic axes로 정의되며, 이 세 벡터(vector)에 대한 길이(a, b, c)와 이들이 서로 이루는 각(α, β, γ)을 의미한다. 상기 a, b, c는 각각 A, B 및 C로 표시될 수 있다.

상기 위상정보는 중금속 치환법(Multiple Isomorphous Replacement), 다중파장분석법(Multiwavelength Anomalous Dispersion) 및 구조 치환법(Molecular Replacement) 등을 통해 얻을 수 있다. 첫째, 중금속치환법은 여러 결정을 중금속으로 치환하여 데이터를 모은 후 그 정보를 분석, 위상정보를 얻는 것이다. 둘째, 다중파장분석법은 중금속 대신에 결정 내의 특이적인 금속 또는 원자를 이용하여 여러 파장에서의 그 원자의 변칙(anomalous)을 이용하여 데이터를 모은 후 위상 정보를 얻는 것으로 널리 이용되고 있는 기술 중 하나이다. 즉 여러 결정에서 데이터를 수집하는 번거로움 없이 하나의 결정으로부터 분자생물학적 방법을 이용하여 아미노산 메티오닌이 셀레노메티오닌(Se-Met)으로 치환되어 이 셀레늄 원자를 이용하여 쉽게 데이터를 얻을 수 있으나 이 방법은 꼭 방사광에서만 얻어야 하는 단점이 있다. 셋째, 구조 치환법은 이미 알려진 유사한 구조로부터 위상문제를 해결하는 방법으로, 이는 알려진 구조가 증가함에 따라 널리 이용되는 방법으로서, 각각의 구조를 데이터로부터 얻은 후, 이 데이터와 우리의 모델이 최대한 잘 맞게 해주는 정밀화단계 과정이 진행된다. 이러한 과정은 공지의 여러가지 프로그램(CCP4, Coot, Quanta, CNS 등)을 이용하여 수행되며, 각각의 각도 및 결합길이 등의 표준화 과정이 필요한데, 이 과정에서는 컴퓨터의 성능과 눈으로 보고 직접 모델을 얻어진 전자밀도 지도에 맞추는 과정이 반복 수행된다. 구조 정밀화 작업 후 분석단계에서는 그 구조로부터 여러 가지 정보를 유추 해석해 내며, 이러한 분석단계에서 구조에 바탕을 둔 작용 기작에 대한 연구를 할 수 있으며, 이러한 정확한 작용기작에 대한 연구는 신약개발에 필요한 여러 가지 정보를 얻어내는 기반이 된다. 또한, 그 단백질에 대한 조절화합물과의 복합체의 구조를 통해서는 직접적인 관련 잔기들을 알 수 있으므로, 그 다음 단계의 조절화합물 연구에 중요한 정보를 제공하게 된다.

본 발명의 일 실시예에서는 본 발명의 결정체를 위한 분산 데이터를 Apo-PAS1 단백질은 1.5Å 해상도로 측정하였고. SeMet-PAS1/톨루엔 복합체의 결정체 크리스탈에 대한 단일파장 비정상 회절 데이터는 1.65Å 해상도로, PAS1/1,2,4-TMB 복합결정체 수집하였다. 모든 데이터는 HKL2000 소프트웨어 패키지로 분석하였다. SeMet-PAS1/톨루엔 복합체의 구조는 Se 원자로부터 나오는 비정상 신호를 SOLVE 프로그램으로 분석하여 알아내었다. 밀도 조절 및 순차적 자동화 모델 빌딩 과정은 RESOLVE 프로그램으로 수행하였다. 복합체 결정 구조는 SeMet 결정의 부분 개선 모델을 이용하는 MOLREP 프로그램를 이용하여 분자 치환을 통해 1.65Å 해상도로 밝혔다. 복합체 결정 구조는 COOT 프로그램으로 교정되고 REFMAC5를 이용하여 개선하였다. 이러한 방법으로 얻은 PAS1 단독 단백질(Apo-PAS1), SeMet-PAS1 단백질과 toluene 복합체, PAS1과 1,2,4-TMB 복합체에 대한 원자 좌표 및 구조 인자 진폭(Structure factor amplitudes)는 PDB(Protein Data Bank)에 기탁하였으며, 이에 대한 각각의 접근 코드(Accession code)는 PAS1 단독 단백질 (Apo-PAS1)이 3X18, SeMet-PAS1/toluene 볼합체는 3X19, 또한 PAS1/1,2,4-TMB는 접근 코드가 3X1A이다. 이에 대한 결정체 정보는 표 3에, 원자좌표는 표 4 내지 6에 각각 나타내었다.

본 발명의 또 다른 하나의 양태는 (a) 표 4에 나타낸 PAS1 단백질의 원자좌표, 표 5에 나타낸 SeMet-PAS1 단백질과 톨루엔 복합체의 원자좌표 또는 표 6에 나타낸 PAS1 단백질과 1,2,4-TMB(1,2,4-Trimethylbenzene) 복합체의 원자좌표를 이용하여 PAS1 단백질 또는 이의 복합체의 3차 구조를 설계하는 단계; (b) 상기 설계된 3차 구조를 이용하여 PAS1에 결합하는 후보 물질을 생성하는 단계; 및 (c) 상기 후보 물질이 PAS1 단백질 또는 PAS1을 포함하는 TodS 단백질과 리간드 간의 결합을 조절하는지 여부를 확인하는 단계를 포함하는, PAS1 단백질 또는 TodS 단백질과 리간드 간의 결합을 조절하는 물질을 스크리닝하는 방법을 제공한다.

상기 PAS1 단백질, 복합체, 톨루엔, 1,2,4-TMB 등에 대해서는 앞서 설명한 바와 같다.

상기 PAS1 단백질 또는 이의 복합체에 대한 원자좌표는 컴퓨터와 같은 계산 장치로의 연속적인 사용을 위한 매체에 저장될 수 있다. 전형적으로 상기 좌표는 자기 또는 광학매체와 같은 다량의 데이터를 저장하는 데 유용한 매체(즉, 플로피 디스크, 하드 디스크, 컴팩트 디스크, 마그네토-광학 매체 또는 전자 매체 등)에 저장될 수 있다. 이와 관련한 컴퓨터, 저장매체, 네트워킹 및 다른 장치 또는 기술의 선택은 구조/계산 화학 분야의 당업자에게 익숙할 것이다.

상기 스크리닝 방법의 (a) 단계는 상기 복합체에 대한 3차 구조에 대한 원자 좌표 등에 대한 데이터를 적절한 소프트웨어 프로그램과 함께 컴퓨터 상에 입력하는 단계; 및 시각화 및 추가적인 컴퓨터 조작이 가능한 3차원적 단백질 구조로 나타내는 단계를 포함할 수 있으나, 이에 제한되지 않는다.

상기 스크리닝 방법의 (b) 단계는 상기 설계된 3차 구조를 이용하여 PAS1에 결합하는 후보 물질을 생성하는 단계이다.

본 발명에서 규명한 PAS1 단백질 또는 이의 복합체의 3차원 구조를 바탕으로 원자좌표 및/또는 3차원 구조 표시에 대한 데이터를 포함하는 컴퓨터-판독 매체를 이용하여 상호작용 부위를 포함하는 다양한 단백질 부위에 대한 정보를 제공받을 수 있다. 이러한 과정을 통하여 수많은 신약 후보물질들에 대한 실질적인 실험을 수행하지 않고도 그 반응 양상을 예측할 수 있고, 그 결과에 따라 선별된 물질에 한하여 실험을 수행함으로써 신약 개발의 경제성을 증대시킬 수 있다.

본 발명에서 용어, "후보 물질"은 PAS1과 결합할 수 있는 물질인 이상, 방향족 화합물들을 제한 없이 포함한다. 즉, 상기 분석된 PAS1 단백질 또는 이의 복합체의 3차 구조를 기반으로 해당 PAS1 부위에 결합할 수 있는 구조를 가진다고 예측되거나, 결합할 수 있는 구조를 가지도록 합성, 제조 또는 변형된 물질을 제한 없이 포함할 수 있다. 그 예로, PAS1에 결합하는 방향족 탄화수소일 수 있으며, 보다 구체적인 예로 하기 기술하는 방향족 탄화수소일 수 있으나, 이에 제한되지 않는다.

본 발명의 방법에서 상기 (c) 단계는 상기 후보 물질이 PAS1 단백질 또는 PAS1을 포함하는 TodS 단백질과 리간드 간의 결합을 조절하는지 여부를 확인하는 단계이다.

구체적으로, 상기 후보 물질이 단백질과 리간드 간의 결합을 조절하는지 여부는 PAS1 단백질 또는 PAS1 단백질을 포함하는 TodS 단백질을 함유하는, 바이오센서를 이용하여, 후보 물질에 의해 발현되는 표지 단백질의 수준을 측정함으로써 확인할 수 있다.

보다 구체적으로, 상기 (c) 단계는 (i) 하기 (a') 내지 (d')의 모듈을 포함하는 센서용 모듈 조합; (ii) 상기 모듈 조합을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트; (iii) 상기 발현 카세트를 포함하는 벡터; 또는 (i) 내지 (iii) 중 어느 하나를 포함하는 미생물을 함유하는, 바이오센서를 이용하여, 후보 물질에 의해 발현되는 표지 단백질의 수준을 측정함으로써 수행될 수 있다:

(a') PAS1 단백질을 포함하는 제1모듈;

(b') 제1모듈에 후보 물질이 결합시 신호를 발생 및 전달하는 제2모듈;

(c') 상기 전달된 신호에 의해 인산화되는 전사조절인자를 포함하는 제3모듈; 및

(d') 상기 인산화되는 제3모듈에 의해 표지 단백질을 발현시키는 제4모듈.

상기 PAS1 단백질이 후보 물질과 특이적으로 결합하여 키나아제 단백질의 자가인산화를 유도하여 인산 신호를 발생 및 전달시키면, 상기 전달된 신호에 의해 전사조절인자가 활성화되어 표지 단백질의 프로모터에 결합하여 표지 단백질을 발현시킨다. 즉, 제1모듈 내지 제4모듈을 포함하는 센서용 모듈 조합에 의해 후보 물질에 따라 표지 단백질이 발현되므로, 표지 단백질의 발현 수준을 측정하여 PAS1 단백질 또는 TodS 단백질과 리간드 간의 결합을 조절하는 물질을 스크리닝할 수 있다. 본 발명의 일 실시예에서는 표지 단백질로서 베타-갈락토시다아제(β-galactosidase) 단백질을 사용하였다.

이에 따라서, (d) 상기 후보 물질이 대조군에 비하여 표지 단백질의 발현을 증가시키면 TodS의 효능제로, 대조군에 비하여 표지 단백질의 발현을 감소시키면 TodS의 길항제로 판단하는 단계를 추가로 포함할 수 있다.

본 발명의 또 다른 하나의 양태는 (a) 표 4에 나타낸 PAS1 단백질의 원자좌표, 표 5에 나타낸 SeMet-PAS1 단백질과 톨루엔 복합체의 원자좌표 또는 표 6에 나타낸 PAS1 단백질과 1,2,4-TMB 복합체의 원자좌표를 이용하여 PAS1 단백질 또는 이의 복합체의 3차 구조를 설계하는 단계; (b) 상기 설계된 3차 구조를 이용하여 PAS1 변이 단백질을 생성하는 단계; 및 (c) 상기 생성된 PAS1 변이 단백질과 주어진 리간드 간의 결합 활성을 측정하는 단계를 포함하는, 야생형 PAS1 단백질에 대하여 리간드 결합 활성이 변이된, PAS1 변이 단백질을 스크리닝하는 방법을 제공한다.

상기 PAS1 단백질, 복합체, 톨루엔, 1,2,4-TMB, (a) 단계 등에 대해서는 앞서 설명한 바와 같다.

상기 (b) 단계는 설계된 3차 구조를 이용하여 PAS1 변이 단백질을 생성하는 단계이고, 상기 (c) 단계는 상기 생성된 PAS1 변이 단백질과 주어진 리간드 간의 결합 활성을 측정하는 단계이다.

구체적으로, 상기 변이 단백질과 주어진 리간드 간의 결합 활성 측정은 바이오센서를 이용하여, 생성된 PAS1 변이 단백질과 리간드의 결합에 의해 발현되는 표지 단백질의 수준을 측정함으로써 수행될 수 있다.

보다 구체적으로, 상기 (c) 단계는 (i) 하기 (a') 내지 (d')의 모듈을 포함하는 센서용 모듈 조합; (ii) 상기 모듈 조합을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트; (iii) 상기 발현 카세트를 포함하는 벡터; 또는 (i) 내지 (iii) 중 어느 하나를 포함하는 미생물을 함유하는, 바이오센서를 이용하여 상기 생성된 PAS1 변이 단백질과 주어진 리간드 간의 결합에 의해 발현되는 표지 단백질의 수준을 측정함으로써 수행될 수 있다.

(a') 리간드와 특이적으로 결합하는 상기 생성된 PAS1 변이 단백질을 포함하는 제1모듈;

(b') 제1모듈에 리간드가 결합시 신호를 발생 및 전달하는 제2모듈;

상기 생성된 PAS1 변이 단백질이 리간드와 특이적으로 결합하여 키나아제 단백질의 자가인산화를 유도하여 인산 신호를 발생 및 전달시키면, 상기 전달된 신호에 의해 전사조절인자가 활성화되어 표지 단백질의 프로모터에 결합하여 표지 단백질을 발현시킨다. 즉, 제1모듈 내지 제4모듈을 포함하는 센서용 모듈 조합에 의해 생성된 PAS1 변이 단백질에 따라 표지 단백질이 발현되므로, 표지 단백질의 발현 수준을 측정하여 야생형 PAS1 단백질에 대하여 방향족 탄화수소 결합 활성이 변이된, PAS1 변이 단백질을 스크리닝할 수 있다.

본 발명의 일 실시예에서는 표지 단백질로서 베타-갈락토시다아제(β-galactosidase) 단백질을 사용하였다.

상기 Apo-PAS1 및 SeMet-PAS1 단백질/톨루엔, PAS1/1,2,4-TMB 복합체의 3차 구조의 전부 또는 일부를 이용하는 경우, PAS1 단백질과 톨루엔의 결합에 중요한 PAS1 단백질의 결합부위를 재설계하여 다양한 리간드에 대한 새로운 감지센서를 디자인하여 제작할 수 있다. 본 발명자들이 확인한 바에 따르면, SeMet-PAS1 단백질과 톨루엔의 결합에 의하여 TodS 단백질의 형태변화가 일어나서 TodT의 인산화가 변화되고, TodT의 tod 오페론의 전사조절부위 DNA 간의 결합이 조절된다. 따라서, PAS1 단백질과 톨루엔의 결합을 조절하는 결합부위를 재설계하고, tod 오페론의 활성을 베타 갈락토시다아제 리포터 단백질을 이용해 스크리닝하는 방법으로, 궁극적으로 PAS1 단백질과 tod 오페론의 전사조절을 가능하게 하는 새로운 기질에 대한 PAS1 단백질 내 리간드 결합 부위를 규명하는 스크리닝을 할 수 있다.

또한, 본 발명의 방법은 (d) 야생형 PAS1 단백질의 값에 비해 측정된 리간드 결합 활성이 변화된 경우, 야생형 PAS1 단백질에 대하여 리간드 결합 활성이 변이된, PAS1 변이 단백질로 판정하는 단계를 추가로 포함할 수 있다.

또한, 톨루엔과 비교하여 PAS1 단백질과 결합하는 친화도가 유사하거나 높은 물질로서, 야생형 PAS1 단백질 대조군에 비하여 결합부위가 재설계된 PAS1 단백질, 즉 PAS1 변이 단백질과 상기 후보 물질의 결합이 높아져, tod 오페론 전사 활성 신호로 기능하는지를 베타 갈락토시다아제 발현에 의해 분해되는 형광물질로 재설계된 결합부위의 민감도를 정량화하여 비교할 수 있다. 이러한 스크리닝을 통해 결합부위의 재설계가 야생형 PAS1의 기능을 유지 또는 증진 시키는 정도와 비교하여 신기능의 방향족 화학물질의 감지센서로 판단할 수 있다. 특히, 상기 톨루엔은 PAS1에 결합하여 tod 오페론의 전사를 활성화 할 수 있다고 알려져 있으므로, 상기 SeMet-PAS1의 구조적 정보를 이용하여 PAS1에 결합하는 다양한 결합친화도를 가진 휘발성 방향성 화학물질들이 PAS1과 결합하지 못하도록 또는 PAS1과 결합하여 톨루엔과 같이 신호를 전달하도록 PAS1의 리간드 결합부위를 재설계할 수 있다. 이에 PAS1의 리간드 결합부위 재설계는 특정 화학물질 대한 결합 친화도를 높이고, 신호전달이 가능한 구조로의 변화를 유도하는 신기능의 감지센서 디자인을 하고 미생물에 도입하여 토양 내 석유오염물질을 지속적으로 모니터링 하거나, 특정 오염물질을 감지하여 분해하는 미생물 리포터 균주를 제작 할 수 있다. 즉, 생물 정화에 사용될 수 있다.

본 발명에서 용어, "생물 정화"는 미생물을 이용해 환경(토양, 대기, 강, 바다)에 축적된 다양한 난분해성 오염물질을 감지하고, 무해화하는 과정으로 미생물을 이용한 환경오염 물질을 정화하는 방법을 지칭한다. 바이오리메디에이션은 경제적이고 환경친화적인 방법으로 환경오염정화 및 복구 방법으로 활용되는 유망 기술의 하나이다. 따라서, 본 발명의 입체구조 정보를 기반으로 설계하여 제작된 PAS1 감지센서들은 벤젠계 방향족 휘발성 환경오염물질을 영양원으로 활용하는 유전자를 포함한 미생물 균주에 도입되어 오염물질 감지 민감도를 증대하고, 분해를 촉진하는 효과를 기대할 수 있다.

본 발명에서 톨루엔의 분해효과는 todS/todT 유전자를 도입한 세균, 특히 슈도모나스 푸티다 KT2440 균 유래의 베타 갈락토시다아제 리포터 발현 균주에서 밝혔으나, PAS1 단백질의 구조변화에 의해 tod 오페론의 발현이 증대됨은, 이 균주에 제한되지 않는다.

이러한 본 발명의 방법에 적용될 수 있는 기질 혹은 리간드는 방향족 탄화수소일 수 있으며, 그 예로 벤젠(benzene), 에틸벤젠(ethylbenzene), 프로필벤젠(propylbenzene), 부틸벤젠(butylbenzene), 니트로벤젠(nitrobenzene), 클로로벤젠(chlorobenzene), 플루오로벤젠(fluorobenzene), 톨루엔(toluene), 스티렌(styrene), o-자일렌(o-xylene), m-자일렌(m-xylene), p-자일렌(p-xylene), o-클로로톨루엔(o-chlorotoluene), m-클로로톨루엔(m-chlorotoluene), p-클로로톨루엔(p-chlorotoluene), o-톨루이딘(o-toluidine), m-톨루이딘(m-toluidine), p-톨루이딘(p-toluidine), 카테콜(catechol), 1,2,4-TMB(1,2,4-Trimethylbenzene), 1,2,3-TMB(1,2,3-Trimethylbenzene), 1,3,5-TMB(1,3,5-Trimethylbenzene), 1-나프톨(1-naphthol) 및 2,3-디히드록시나프탈렌(2,3-dihydroxynaphthalene)으로 이루어진 군으로부터 선택되는 것일 수 있으나, 이에 제한되는 것은 아니다.

본 발명에서 제공하는 PAS1 단백질과 PAS1/1,2,4-TMB 복합체 단백질 결정체 및 SeMet-PAS1/톨루엔 단백질 복합체의 결정체, 결정화시키는 방법 및 이의 3차원적 구조정보는, tod 유전자를 포함하는 다양한 세균의 환경오염정화 관련된 오염물질 분해 유전자들의 발현 증대를 목적하는 신기능의 감지센서 개발에 유용하게 이용될 수 있다. 또한, 본 발명에서 제공하는 PAS1 변이 단백질 또는 이를 포함하는 TodS 변이 단백질은 방향족 탄화수소 감지 및 분해에 유용하게 이용될 수 있다.

도 1a는 PAS1 단백질의 발현을 위해 사용한 아미노산 서열을 나타낸 도이다.
도 1b는 PAS1 단백질이 크기배제 크로마토그래피에서도 이량체 형태로 존재함을 확인한 도이다.
도 1c는 SeMet-PAS1/톨루엔 복합체, PAS1/1,2,4-TMB 복합체의 결정체 유도 및 TodS 변이단백질의 생체 내 신호전달 스크리닝에 사용한 벤젠계 방향족 화학물질을 표시한 도이다.
도 2a는 PAS1 (43 - 168) 단백질(Apo-PAS1)의 이량체 내 대칭 짝을 분석한 도이다.
도 2b는 Apo-PAS1 (43 - 168)의 구조를 리본으로 나타낸 도이다. 비대칭 유닛에는 두개의 PAS1 분자(분자 A 및 분자 B)가 있다.
도 2c는 SeMet-PAS1 (43 - 168)/톨루엔 복합체의 이량체 내 대칭 짝을 분석한 도이다.
도 2d는 PAS1 (43 - 168)/1,2,4-TMB 복합체의 이량체 내 대칭 짝을 분석한 도이다.
도 3은 SeMet-PAS1 (43 - 168) 단백질과 톨루엔 간의 결합을 구조적으로 분석한 도이다. PAS1의 결합에 필수적인 잔기들을 리간드와 함께 나타내었다.
도 4는 SeMet-PAS1 (43 - 168)/톨루엔 복합체 이량체를 구성하는 각 단량체 SeMet-PAS1-A와 SeMet-PAS1-B를 이차원적으로 겹쳐놓았을 때 보이는 구조적 차이를 표시한 도이다.
도 5a는 아고니스트 톨루엔과 복합체를 형성한 TodS PAS1 구조를 나타낸 도이다. 비대칭 단위에 두개의 톨루엔과 결합한 PAS1 분자가 있다. Apo-PAS1의 분자 B에서 정렬되지 않은 부위에 대응되는, 분자 B의 정렬되지 않은 C-말단 알파 헬릭스를 붉은색으로 표시하였다.
도 5b는 톨루엔 결합 포켓을 나타낸 도이다. 포켓은 정전기적 표면 표현(electrostatic surface representation)에서 검은색으로 표시되어 있다. PAS1에 의한 톨루엔 감지의 구체적인 환경을 분자 A 및 분자 B에서 확대하였다. 톨루엔 (붉은색)은 소수성의 PAS1 잔기(녹색)에 의해 둘러싸여 있다.
도 5c는 안타고니스트 1,2,4-TMB와 복합체를 형성한 PAS1의 구조를 나타낸 도이다. 비대칭 단위에 두개의 안타고니스트와 결합된 PAS1 분자가 있다. 1,2,4-TMB 분자는 붉은 색의 탄소 원자로 표시되어 있다. Apo-PAS1의 분자 B에서 정렬되지 않은 부위에 대응되는, 분자 B의 정렬되지 않은 C-말단 부위는 붉은색으로 표시되어 있다.
도 5d는 1,2,4-TMB 결합 포켓을 나타낸 도이다. 포켓은 정전기적 표면 표현에서 검은색으로 표시되어 있다. PAS1에 의한 1,2,4-TMB 결합의 구체적인 환경을 분자 A 및 분자 B에서 확대하였다. 특히, 1,2,4-TMB(붉은색)은 톨루엔 결합 포켓에서와 동일한 소수성 잔기(녹색)에 의해서 둘러싸여 있다. Apo-PAS1에서 소수성 포켓을 형성하기 위해 필요한 대응되는 잔기(노란색)는 톨루엔과 1,2,4-TMB 결합 잔기와 각각 겹쳐져 있다.
도 5e는 톨루엔과 결합하는 PAS1 (23-168)과 그 돌연변이들의 열역학적 파라미터를 나타낸 도이다. ORIGIN 소프트웨어 패키지 (MicroCal Inc., 미국)의 두개의 연속된 결합 모델을 사용하여 얻어졌다. 각 단백질 변이체와 톨루엔의 반응으로부터 생성된 열 데이터에서, 반응 버퍼에 톨루엔을 첨가하여 생성된 열 데이터를 뺐다. 야생형 PAS1(23-168)와 톨루엔 분자의 결합에 대한 대표적인 ITC 프로파일을 왼쪽에 나타내었다.
도 6은 PAS1 (43 - 168) 단백질(Apo-PAS1), PAS1 (43 - 168)/1,2,4-TMB 복합체 및 SeMet-PAS1 (43 - 168)/톨루엔 복합체의 SeMet-PAS1-B 단량체 구조를 겹쳐 놓고, PAS1-B 단백질의 각 리간드 결합 특이적 구조 변화를 원으로 표시한 도이다. SeMet-PAS1/톨루엔 복합체의 경우 톨루엔 결합 시 SeMet-PAS1-B의 E146과 R148의 결합으로 고정된 형태의 α5 헬릭스가 형성된다.
도 7a는 크기배제 크로마토그래피에서 TodS 단백질이 사량체의 크기를 갖는 길고 유연한 형태를 갖는 이량체로 존재함을 확인한 도이다.
도 7b는 C-말단에 His₆ 태그를 가진 TodS (서열번호 1의 43 - 978번째 아미노산 서열) 단백질을 순수 분리하여, 니켈-골드 분자를 히스티딘 마커와 결합시킨 후 음성 염색하여 전자현미경으로 관찰한 결과를 나타낸 도이다. 도 6b를 통하여 두 개의 골드 분자가 나란히 위치함을 확인하고, TodS 단백질이 이량체로 존재함을 확인하였다(화살표와 원으로 표시).
도 8a는 TodS(43-978) 단백질 단독(Apo-TodS)으로도 이량체로 존재함을 확인한 도이다.
도 8b는 TodS(43-978)/톨루엔 복합체 단백질도 이량체로 존재하나, TodS 단백질 단독으로 존재할 때에 비해, 길이가 길어진 양태를 보이는 것을 확인한 도이다.
도 8c는 TodS(43-978)/1,2,4-TMB 복합체 단백질도 이량체로 존재하나, 대다수의 단백질이 뭉침 현상을 보이는 것을 확인한 도이다.
도 9a는 정제된 TodS (서열번호 1 23 - 978번째 아미노산 서열, TodS(23-978)) 단백질의 사이즈 배제 크로마토그래피 분석 결과를 나타낸 도이다. TodS(23-978)를 표준 분자량 마커인 β-amylase (200kDa), apoferritin (443kDa)과 비교하였다.
도 9b는 TodS(23-978) 단백질(Apo-TodS) 및 이의 복합체(Toluene-TodS, 1,2,4-TMB-TodS)의 분자 외형을 보여주는 전자현미경 사진이다. 스케일 바: 20 nm.
도 10은 리간드 결합 부위를 변이시킨 PAS1 도메인을 포함하는 TodS 변이 단백질들의 리간드 결합 특이적 생체 내 TodS/TodT 2개 인자 신호전달 능력을 검증하기 위한, 96-딥-웰 플레이트 기반 스크리닝 시스템(in vivo β-galactosidase assay system)의 원리를 나타낸 모식도이다.
도 11a는 Azotobacter vinelandii NifL LOV 도메인(PDB ID: 2GJ3)의 구조하에서 모델화된 PAS1의 이량체 구조를 나타낸 도이다. 이량체화에 관여되는 것으로 예측된 소수성 잔기들을 녹색과 회색으로 각각 분자 A와 분자 B에 표시하였다.
도 11b는 이량체화에 관여하는 잔기들을 톨루엔 환경에서 생체내 β-갈락토시다아제 분석 시스템을 사용하여 평가하였다. 모든 결과들을 3번의 독립적인 실험을 통해 얻었다.
도 12a는 정제된 PAS2의 사이즈 배제 크로마토그래피 분석결과를 나타낸 도이다. 정제된 PAS2를 표준 분자량 마커인 카보닉 언하이드라제(carbonic anhydrase, 29 kDa)와 비교한 결과, 용액에서 이량체로서 분석되었다.
도 12b는 Azotobacter vinelandii NifL LOV 도메인 (PDB ID: 2GJ3)의 이량체 구조(녹색, 청록색)에 기초하여 모델화된 PAS2 구조(자홍색)를 나타낸 도이다. 각 NifL PAS 도메인에 결합한 FAD를 나타내었다. 이량체화에 관여하는 것으로 예측된 PAS2의 N-말단의 알파 헬릭스 (Ser611 내지 Ser622)를 표시하였다.
도 12c는 NifL FAD 결합 잔기인 Thr78과 Leu86에 대응하는 PAS2의 Glu666과 Leu674를 나타낸 도이다.
도 12d는 생체내 β-갈락토시다아제 분석 시스템을 사용하여 다양한 리간드 결합에 관여할 것으로 예측된 PAS2 잔기들을 평가한 도이다.
도 12e는 톨루엔이 결합된 PAS1 구조와 모델화된 PAS2 구조를 겹친 도이다.
도 13은 TodS/TodT의 신호 전달 과정에 대하여 분자 수준의 매커니즘 모델을 나타낸 도이다. PAS1 이량체에서 분자 A와 분자 B를 각각 어두운 녹색과 밝은 녹색으로 표시하였다. TodT 이량체를 밝은 노란색과 어두운 노란색으로 표시하였다. 톨루엔 분자는 붉은색으로 표시하였다.
도 14는 효능제(agonist)인 톨루엔 또는 길항제(antagonist)인 1,2,4-TMB 리간드를 100 μM의 농도로 가스 형태로 공급하였을 때, TodS 변이 단백질들을 발현하는 슈도모나스 푸티다(Pseudomonas putida) KT2440-PXZ 형질전환체들의 생체 내 베타 갈락토시다아제 활성 결과를 보여주는 도이다. PAS1/톨루엔 복합체의 입체구조 기반으로 규명된 10개의 아미노산 잔기를 위치-지정 변형시킨 PAS1 도메인을 포함한 TodS 변이 단백질들이 각각 야생형 TodS와 비교하여 100μM의 효능제인 톨루엔 또는 길항제인 1,2,4-TMB 리간드에 대해 보이는 반응을 상기 스크리닝 시스템으로 검증한 결과, 10개의 아미노산 잔기 모두 TodS/TodT 2개 인자 신호전달에 중요한 것으로 검증되었다.
도 15a는 10μM의 농도에서 각 리간드를 처리하여, 야생형 PAS1을 포함하는 TodS(WT)와 톨루엔 결합부위의 아미노산 잔기들을 위치-지정 돌연변이 유도 방법으로 치환시킨 10개의 TodS 변이 단백질간의 신호전달 능력을 비교한 결과를 나타낸 도이다.
도 15b는 리간드 농도 의존적으로, 야생형 TodS와 10종의 TodS 변이 단백질의 생체 내 베타 갈락토시다아제 활성 결과를 비교한 도이다.
도 16은 PAS1의 이량체화에 관여하는 아미노산들을 변형시킨 TodS 변이 단백질을 발현하는 슈도모나스 푸티다 KT2440-PXZ 형질전환체들의 리간드 농도 의존적 생체 내 베타 갈락토시다아제 활성 결과를 보여주는 도이다.
도 17은 톨루엔과 결합 특이적으로 구조변화가 일어나는 PAS1-B의 α5 헬릭스 형성부위의 아미노산들을 변이시킨 TodS 변이 단백질을 발현하는 슈도모나스 푸티다 KT2440-PXZ 형질전환체들의 리간드 농도 의존적 생체 내 베타 갈락토시다아제 활성 결과를 보여주는 도이다.
도 18a는 PAS1 단백질 61번 글루탐산 아미노산 잔기의 생화학적 특성을 변화시킨 TodS 변형단백질을 발현하는 슈도모나스 푸티다 KT2440-PXZ 형질전환체들의 리간드 농도(10μM, 50μM, 100μM) 의존적 생체 내 베타 갈락토시다아제 활성 결과를 보여주는 도이다.
도 18b는 10μM의 리간드를 가스 형태로 공급하였을 때, Q61R TodS와 Q61A TodS 변이 단백질들을 발현하는 슈도모나스 푸티다 KT2440-PXZ 형질전환체들의 생체 내 베타 갈락토시다아제 활성 결과를 보여주는 도이다.
도 19는 저농도의 톨루엔(0 내지 10μM)을 가스 형태로 공급하였을 때, Q61R TodS와 Q61A TodS 변이 단백질들을 발현하는 슈도모나스 푸티다 KT2440-PXZ 형질전환체들의 생체 내 베타 갈락토시다아제 활성 결과를 보여주는 도이다.

이하, 본 발명을 하기 실시예에서 보다 구체적으로 설명한다. 그러나 이들 실시예는 본 발명의 이해를 돕기 위한 것일 뿐, 이들에 의해 본 발명이 한정되는 것은 아니다.

실시예 1: 박테리아 균주, 플라스미드, 및 성장조건

본 발명에서 사용되는 박테리아 균주와 제조된 플라스미드를 하기 표 1에 정리하였다. 서열번호 1의 아미노산 서열 중 43 - 978번째 아미노산 서열 또는 23 - 978번째 아미노산 서열을 가지는 TodS (TodS (43 - 978), TodS (23 - 978))단백질을 코딩하는, todS 유전자를 슈도모나스 퓨티다(Pseudomonas Putida) F1 genomic DNA를 주형으로 하여 PCR을 통해 증폭하였다. 그 후 C-말단에 6개의 히스티딘 태그가 결합되는 단백질의 발현 벡터 pET28b(+) (Novagene, 미국)의 NcoI과 XhoI 부위를 통해 상기 증폭된 TodS 단백질(서열번호 1의 43 - 978번째 아미노산 서열)의 유전자를 삽입하였다. 또한, N-말단에 GST가 결합된 단백질 발현 벡터 pGST-Parallell(Sheffield et al., 1999)의 BamHI과 XhoI 부위를 통해 상기 TodS 단백질(서열번호 1의 23 - 978번째 아미노산 서열)의 유전자를 삽입하였다.

또한, 서열번호 1의 아미노산 서열 중 43 - 168번째 아미노산 서열을 가지는 PAS1 (서열번호 3, PAS1 (43 - 168), 도 1a) 단백질 또는 23 - 168번째 아미노산 서열을 가지는 PAS1 (서열번호 5, PAS1 (23 - 168)) 단백질을 코딩하는, pas1 유전자(각각 서열번호 4 및 서열번호 6)와 서열번호 1의 아미노산 서열 중 611 - 729번째 아미노산 서열을 가지는 PAS2 단백질을 코딩하는, pas2 유전자를 TodS 발현 벡터를 이용하여 PCR을 통해 증폭한 후, N-말단에 6개의 히스티딘 태그 및 rTEV 프로테아제 절단 부위(rTEV protease cleavage site)를 가지는 pHis-Parallell 벡터(Sheffield et al., 1999)의 NcoI과 XhoI 부위에 삽입하였다. 슈도모나스 퓨티다 F1의 todST 프로모터와 todST 유전자를 각각 TodSTpp-u 및 TodSTpp-m 프라이머와 TodST-F 및 TodST-R 프라이머를 사용하여 PCR을 통해 증폭하였다. 상기 todST 프로모터를 pBBRBB-eGFP 벡터(Vick et al., 2011)의 NsiI과 XbaI 부위에 삽입하여 pBBR-P_todST를 만들었다. 그 후, 야생형 todST 프로모터 하에 todST를 발현시키기 위하여 pBBR-P_todST의 SacI과 HindIII 부위에 todST를 삽입하여 pBBR-P_todST-TodST를 만들었다. 상기 발현 플라스미드는 녹색 형광 단백질 유전자를 포함하고 있지 않았다.

또한, 돌연변이체를 QuicKChange Site-Directed Mutagenesis kit(Stratagene, USA)를 사용하여 위치-지정 돌연변이를 통해 만들었다. 결정 구조를 알아내기 위한 셀레노메티오닌(selenomethionine, SeMet)으로의 치환을 위해, PAS1 (43 - 168)에 L71M 돌연변이를 유도하였다. 모든 돌연변이체들을 DNA 서열분석을 통해 확인하였다(Macrogene, 한국). 플라스미드들과 다양한 돌연변이체를 만들기 위해 사용된 프라이머를 하기 표 2에 나타내었다.

별다른 기재가 없는 한, 대장균(E. coli) 및 슈도모나스 퓨티다 균주는 각각 37℃ LB(Luria-Bertani) 배지, 30℃ LB 배지에 항생제를 하기 농도로 첨가한 배지에서 배양하였다.

대장균 - 100㎍/ml 암피실린(ampicillin), 50㎍/ml 카나마이신(kanamycin), 및 100㎍/ml 스트렙토마이신(streptomycin).

톨루엔은 시그마 (SigmaAldrich, USA)에서 구입하였다.

a: Amp^R은 암피실린 내성(ampicilin resistant); Km^R은 카나마이신 내성(Kanamycin resistant); Sm^R은 스트렙토마이신 내성 (streptomycin resistant); Tc^R은 테트라사이클린 내성(tetracyclin resistant)이다.

b: 변이체 표현에서 첫번째 문자는 원래 아미노산, 숫자는 변이된 위치, 마지막 문자는 변이로 인해 치환된 아미노산을 의미한다.

실시예 2: PAS1 단백질과 TodS 단백질의 발현 및 정제

E. coli BL21 Star (DE3) system (Invitrogen, 미국)을 0.5mM IPTG(isopropyl β-D-thiogalactopyranoside)와 함께 18°C에서 밤새 배양하여, N-말단에 His₆ 태그를 가진 PAS1 (43 - 168)과 PAS2 단백질을 발현시켰다. 모든 정제 단계는 버퍼 A(50 mM Tris-HCl pH 8.0 및 300 mM NaCl을 포함)를 사용하여 수행되었다. 배양된 세포들을 수확하여, 버퍼 A로 재현탁 시킨 후, 초음파로 분쇄하였다. 상기 분쇄액을 4°C에서 1시간 동안 16,000 x g로 원심분리하였다. 그 후 세포의 용해물을 Ni-NTA (Qiagen, 미국) 친화성 컬럼에 로딩하여, 6개의 히스티딘이 결합된 단백질을 200mM 이미다졸(imidazole)로 용출시켰다. 용출된 단백질을 rTEV 프로테아제 처리; Superdex G75 컬럼(GE Healthcare, 미국)을 사용한 사이즈 배제 크로마토그래피(size-exclusion chromatography); 및 His₆ 태그와 잘려지지 않은 His₆ 태그를 가진 단백질을 제거하기 위한 추가적인 Ni-NTA 친화 크로마토그래피를 사용하여 추가적으로 정제하였다(도 1b). 버퍼 A에 존재하는 정제된 단백질을 이후의 사용을 위해 15mg/ml의 농도로 농축하여, - 80°C에 보관하였다.

또한, N-말단에 His₆ 태그를 가진 PAS1 (23 - 168)과 이의 돌연변이 단백질을 전술한 방법과 같이 E. coli C41(DE3) system (Lucigen, 미국)을 사용하여 발현시킨 후, ITC(isothermal titration calorimetry) 분석에 사용하기 위해, 5% 글리세롤 및 2mM DTT를 포함하는 버퍼 A를 사용하여 Ni-NTA 친화 크로마토그래피로 정제하였다.

또한, SeMet이 치환된 PAS1(L71M)을 메티오닌 영양요구주인 E. coli B834 (DE3) (Novagen)를 사용하여, 50mg/ml의 SeMet가 함유된 최소 배지에서 발현시켰다. SeMet-PAS1(L71M)의 정제 절차는 버퍼에 5mM 메티오닌을 첨가하는 것을 제외하고는 야생형 단백질의 정제 절차와 동일하였다.

또한, C-말단에 His₆ 태그를 가진 TodS (43 - 978) 단백질을 E. coli BL21 Star (DE3) system (Invitrogen, 미국)에서 발현시켰고, Ni-NTA 친화 크로마토그래피 및 Superdex G200 컬럼(GE Healthcare, 미국)을 이용한 사이즈 배제 크로마토그래피를 사용하여 전술한 방법으로 정제하였다.

또한, N-말단에 GST가 융합된 TodS (23 - 978) 단백질을 전술한 방법과 같이 E. coli BL21-CodonPlus (DE3)-RIPL system (Agilent, 미국)에 서 발현시켰다. 배양된 세포를 수확한 후, PBS (pH 7.3, LPS solution, 대한민국), 5% 글리세롤, 2mM DTT, 및 프로테아제 억제제 칵테일(GenDEPOT, USA)을 포함하는 버퍼에 재현탁 시켜, 초음파로 분쇄하였다. 상기 분쇄액을 4°C에서 1시간 동안 16,000 x g로 원심분리하였다. 그 후 세포 용해물을 Glutathione Sepharose 4 Fast Flow (GE Healthcare, 스웨덴) 친화 컬럼에 로딩한 후, 50 mM Tris-HCl pH 8.0, 300 mM NaCl, 5% 글리세롤, 2mM DTT, 및 프로테아제 억제제 칵테일을 함유하는 버퍼를 사용하여 컬럼을 세척하였다. GST 융합 단백질을 10mM 감소된 글루타치온(glutathione)으로 용출시켰다. rTEV 프로테아제 처리; Superdex G200 컬럼을 이용한 사이즈 배제 크로마토그래피; 및 GST와 잘려지지 않은 GST 융합 단백질을 제거하기 위한, GST 친화 크로마토그래피를 사용하여 상기 용출된 단백질을 추가적으로 정제하였다. 정제된 TodS (23 - 978) 단백질을 TEM(transmission electron microscopy) 분석에 사용하였다.

실시예 3: PAS1 단백질의 결정화, 분산 및 구조 분석

21℃에서 시팅 드랍 증기 확산법을 이용한 정제된 PAS1 (43 - 168) 단백질을 단독으로 또는 SeMet-PAS1과 톨루엔(도 1c)을 1:2 몰비율로 혼합하여 1시간 동안 얼음상에 정치시켜 복합체를 얻을 수 있었다. PAS1과 1,2,4-TMB(도 1c)를 또한 1:2 몰비율로 혼합하여 1시간 동안 얼음상에 정치시켜 복합체를 얻을 수 있었다.

상기 PAS1 단독 단백질(Apo-PAS1) 및 복합체의 결정화는 다음과 같은 조건하에서 형성되었다:

Apo-PAS1과 PAS1/1,2,4-TMB 복합체는 2.8 내지 3.0M 암모늄 포스페이트(ammonium phosphate dibasic, trihydrate), pH 8.0 내지 8.5의 0.1M 트리스 하드로클로라이드(Tris-Hydrochloride)를 포함하는 용액 조건에서, SeMet-PAS/톨루엔 복합체 는 3.0 M 암모늄 포스페이트, pH 8.0, 0.1M 트리스 하드로클로라이드를 포함하는 용액 조건에서 복합체의 결정을 얻었다.

성장된 결정체는 3.0M 암모늄 포스페이트(ammonium phosphate dibasic, trihydrate), pH 8.0의 0.1M 트리스 하드로클로라이드를 포함하는 용액 조건에서 복합체의 결정체가 최적 형성되었다.

Apo-PAS1 단백질 결정체를 위한 분산 데이터는 1.5Å 해상도로 측정하였다 (도 2a). SeMet-치환 PAS1/톨루엔 복합체 단백질 결정체는 상기 개시된 바와 동일한 방법으로 결정화하였다. SeMet-치환 크리스탈에 대한 단일파장 비정상 회절 데이터는 1.65 Å 해상도로 수집하였다(도 2b). PAS1/1,2,4-TMB 복합체 단백질 결정체는 상기 개시된 바와 동일한 방법으로 결정화하였고 단일파장 비정상 회절 데이터는 2.0 Å 해상도로 수집하였다(도 2c). 모든 데이터는 HKL2000 소프트웨어 패키지로 분석하였다.

PAS1/톨루엔 복합체의 구조는 Se 원자로부터 나오는 비정상 신호를 SOLVE 프로그램으로 분석하여 알아내었다. 밀도 조절 및 순차적 자동화 모델 빌딩 과정은 RESOLVE 프로그램으로 수행하였다. 복합체 결정 구조는 SeMet 결정의 부분 개선 모델을 이용하는 MOLREP 프로그램를 이용하여 분자 치환을 통해 1.65Å 해상도로 밝혔다. 복합체 결정 구조는 COOT 프로그램으로 교정되고 REFMAC5를 이용하여 개선하였다. 해당 개선은 TLS(translation-liberation-screw) 과정을 포함했다. 최종 개선된 모델은 R_free과 R_cryst값이 각각 0.23 과 0.18를 나타내었다.

PAS1 단백질 결정체의 경우 PAS1-A와 PAS1-B의 Asn164에서 Glu168 영역은 아무런 전자밀도를 보이지 않았다. 하지만 SeMet-치환 PAS1/톨루엔 복합체 단백질 결정체는 SeMet-PAS1-A의 Glu166에서 Glu168 영역 및 SeMet-PAS1-B의 Glu168만 아무런 전자밀도를 보이지 않았다(도 3 내지 5).

한편, PAS1/1,2,4-TMB 복합체 단백질 결정체는 PAS1-A의 Glu166에서 Glu168 영역에서만 전자밀도가 보이지 않았으나, PAS1-B의 경우는 Ala155에서부터 Glu168까지 아무런 전자밀도를 보이지 않았기에, 유연성이 높은 부분임을 추측할 수 있었다. 따라서 상기 전자밀도를 보이지 않는 잔기들은 모델에 포함되지 않았다.

Apo-PAS1, SeMet-PAS1 단백질과 toluene 복합체, PAS1과 1,2,4-TMB 복합체에 대한 결정화 데이터 통계는 하기 표 3에, 원자좌표는 표 4 내지 6에 각각 나타내었다.

실시예 3: PAS1 단백질의 ITC 분석

PAS1 (23 - 168) 단백질과 리간드 사이의 상호작용을 ITC를 통해 분석하였다. 정제된 N-말단 His₆ 태그를 가진 PAS1 (23 - 168) 단백질과 이의 돌연변이 단백질을 50mM Tris-HCl pH7.5, 200mM KCl, 2mM MgCl₂, 1mM DTT, 및 0.1mM EDTA가 포함된 버퍼로 투석하였다. 그 후 진공 흡입기를 15분 동안 사용하여 샘플에서 가스를 제거하고, 로딩전 샘플에 에탄올(최종 농도 0.2%)을 첨가하였다. 0.2% 에탄올을 함유하는 리간드들을 상기 가스 제거에 사용한 버퍼로 희석하였다. 25°C에서 적정을 수행하였다. VP-ITC (MicroCal Inc., 미국)를 사용하여 열량측정법 (calorimetric assay)을 수행하였다. 스터링(stirring) 속도는 분당 300 회전이고, thermal power를 10초마다 기록하였다. 0.2% 에탄올에 녹아있는 2 - 6mM의 톨루엔은 반응 셀 (reaction cell, ~1.6mL)에 있는 50μM 단백질 (이량체로 계산되었음)에 대하여 적정되었다. 실험기구와 함께 제공된 Origin package (version 7)를 사용하여 적정의 열분석 (Thermogram analysis)을 수행하였다.

실시예 5: TodS 단백질의 전자현미경 및 단일 입자 분석

실시예 5-1: TodS (43 - 978) 단백질

C-말단에 His₆ 태그를 가진 TodS (43 - 978) 단백질(표 1)을 대장균에서 과발현시켜, 상기 방법으로 대량 분리 정제한 후 전자현미경 및 단일입자 분석을 실시하였다(도 7a 내지 도 8c).

정제된 Apo-TodS 단백질, TodS/톨루엔 복합체 및 TodS/1,2,4-TMB 복합체 단백질들을 각각 500 mM NaCl, 20 mM Tris-HCl (pH 8.0), 0.1 mM EDTA 용액에 최종 농도 100 내지 200 nM로 희석하여, 각 시료 용액 5μL를 3분간 공기 중에서 글로 방전(glow-discharged)시킨 탄소-코팅 망에 처리했다. 상기 망은 1% 우라닐 아세테이트(uranyl acetate)를 이용하여 즉시 음성 염색하였다. 망을 Technai G2 Spirit Twin 투과전자현미경(FEI, Hillsboro, OR, USA)에서 확인하였으며, 이미지를 0.36 nm/pixel 배율로 4K X 4K Ultrascan 895 CCD (Gatan, Pleasanton, CA, USA)로 저장하였다.

단일 분자 분석에서는, 단일 분자 이미지 분석을 위해, 각각의 분자 이미지가 선택되었으며 SPIDER 프로그램(Health Research, Rensselaer, NY, USA)을 이용하였다. 총 921개의 TodS 입자, 582개의 TodS/톨루엔 입자, 및 1631개의 TodS/1,2,4-TMB 입자들을 분석에 사용하였고, 클래스 평균은 기존에 알려진 임의의 방법으로 구하였다. 세 개의 시료의 유사한 view를 비교하여, 데이터들을 융합하고, 동시-정렬하여 분별하였다. 유사하게 관찰된 TodS 영역의 평균을 추후 분석을 위해 선택하였다. UCSF 키메라 프로그램을 시각화, 원자 모델 및 평균에 해당 비교 분석을 위해 사용하였다.

실시예 5-2: TodS (23 - 978) 단백질

N-말단에 GST가 융합된 TodS (23 - 978) 단백질을 대장균에서 과발현시켜, 상기 방법으로 대량 분리 정제한 후 전자현미경 및 단일입자 분석을 실시하였다 (도 9a 내지 도 9b).

정제된 Apo-TodS 단백질, TodS/톨루엔 복합체 및 TodS/1,2,4-TMB 복합체단백질들을 각각 PBS (pH 7.3), 5% 글리세롤, 2mM DTT, 및 프로테아제 억제제 칵테일을 포함하는 버퍼를 사용하여 최종농도 ~100 - 200nM로 희석하였다. 각각의 최종 용액 5μl를 사용하여 실시예 5-1과 동일한 방법으로 전자현미경 및 단일입자 분석을 수행하였다. 총 482개의 apo-TodS 입자, 411개의 TodS/톨루엔 입자 411 입자, 및 459개의 odS/1,2,4-TMB 입자들을 분석에 사용하였다.

실시예 6: 생체내 β-갈락토시다아제 분석 시스템( in vivo β- galactosidase assay system)

실시예 6-1: 슈도모나스 퓨티다 리포터 균주의 제작

in vivo β-갈락토시다아제 분석을 수행하기 위해, 슈도모나스 퓨티다 KT24400-PXZ 리포터 균주를 제작하였다. 상기 균주는 슈도모나스 퓨티다 KT2440 염색체의 mexC 유전자에 TodT 결합 프로모터 P _tod _X(서열번호 11), β-갈락토시다아제 단백질(서열번호 12)의 유전자 lacZ(서열번호 13), 및 스트렙토마이신 저항 유전자 Sm ^R로 구성된 카세트(P _todX -lacZ-Sm ^R)가 삽입되어 있는 형태이다. 리포터 균주 제작을 위해 다수의 유전자 복제 단계를 수행하였다. 첫째, 슈도모나스 퓨티다 KT2440 mexC 유전자의 539 bp, 509 bp의 절편 및 pEXT21 플라스미드 Sm ^R 유전자를 각각 mexCn-u와 mexCn-d, mexCc-u와 mexCc-d, 및 Sm-N과 Sm-C의 프라이머를 사용하여 PCR로 증폭하였다. 상기 3 종류의 PCR 생산물을 각각 EcoRI과 BamHI, BamHI과 SphI, 및 BamHI을 사용하여 절단하였다. 그 후 절단된 결과물을 pBR322 (New England Biolabs, Inc., 미국)의 EcoRI와 SphI 부위에 삽입하여 pSYK123를 얻었다. 그 후, P _tod _X-lacZ-Sm ^R 카세트가 mexC 염기서열에 삽입된, pSYK124를 만들기 위해, pSYK123의 HindIII 부위에 pEXT20-todST-P _tod _X의 P _todX -lacZ 발현 융합 카세트가 삽입되었다. 결국, 5528 bp의 mexC-P _tod _X-lacZ-Sm ^R -mexC 카세트를 mexCn-u와 mexCc-d 프라이머를 사용하여 PCR을 통해 증폭하였고, SmaI에 의해 절단된 pK18mobsacB(Schafer et al., 1994)에 삽입하여 pSYK135를 만들었다. 그 후, 슈도모나스 퓨티다 KT2440를 전기천공법을 통해 pSYK135로 형질전환시켰다. Km ^R 과 수크로즈에 민감한 슈도모나스 퓨티다 형질전환체들을 50㎍/ml의 카나마이신과 10% 수크로즈가 첨가된 LB 배지에서 이중으로 선별하였다. 선별된 형질전환체에서 single-crossover event를 PCR을 통해 추가적으로 확인하였다. 두번의 교차(second crossover)에 의해서 형성된, 염색체에 삽입된 P _tod _X-lacZ-Sm ^R 카세트를 가진 리포터 균주, 슈도모나스 퓨티다 KT2440-PXZ를 100㎍/ml의 스트렙토마이신이 첨가된 LB 플레이트에서 선별하였다.

실시예 6-2: 생체내 β-갈락토시다아제 리포터 발현 측정

PAS1 내 톨루엔 결합부위에 위치-지정 돌연변이를 일으킨 TodS 단백질들의 생체 내 인산화 신호전달 능력의 변화를 각각 야생형 TodS와 비교하여 측정하기 위해 PAS1-의존-TodS/TodT 플라스미드를 포함한 슈도모나스에 형질전환체들을 카나마이신 항생제를 포함한 LB 배지 200㎕가 들어 있는 96-웰 딥 플레이트(96-well deep plate)에 배양하고, 효능제인 톨루엔, 스티렌, m-자일렌 또는 길항제인 o-자일렌, 1,2,4-TMB 리간드를 각각 가스형태로 2.5 내지 400μM 농도로 공급하여 30℃, 500 rpm에서 4-5시간 배양하여 생체 내 β-갈락토시다아제 단백질 생성을 유도하였다.

20㎕의 슈도모나스 형질전환체들과 80㎕의 Z-완충액을 혼합하여, 세포 밀도를 595nm에서 측정한 후, 25㎕의 4-MUG(4-methylumbelliferyl β-galactopyranoside) 기질을 1 mg/ml의 농도로 넣고, 25℃ 내지 37℃에서 1시간 반응한 후, 30㎕의 1M 소디움카보네이트 용액을 넣어 효소반응을 중지시켰다. 그 다음, 365nm/465nm에서 분해된 7-하이드록시-4-메틸쿠마린(7-hydroxy-4-methylcoumarin)의 형광을 측정하여, 각 균주의 MUG 값을 [(F365nm/465nm)/60 (min) x cell density at Abs585]로 계산하였다 (도 10). 데이터는 최소 3번 실험을 반복한 값의 평균 ± 표준 편차(SD)를 나타낸다.

상기 스크리닝 방법은, 공기중의 가스 상태로 특정 리간드를 공급하면 슈도모나스 형질전환체에서 발현된 PAS1-의존 TodS 단백질이 특정 리간드와 결합하여 PAS1-B 단량체 구조가 변화되면, TodS의 활성화를 위한 형태 변화가 유도되고, TodS에 의해 인산화된 TodT가 P _todX 에 결합하여 tod 오페론 대신 연결된 β-갈락토시다아제 효소의 전사활성을 상향 조절하게 되어, 생체 내 β-갈락토시다아제 효소에 의해 분해된 형광물질의 양을 365nm/465nm에서 정량적으로 측정하는 원리다. 96-딥웰 플레이트를 이용한 스크리닝 방법은, 동시에 다수의 PAS1-의존 TodS 변이 단백질을 발현하는 슈도모나스 형질전환체를 야생형과 함께, 가스형태로 공급되는 특정 리간드에 대한 반응을 3 반복으로 검증할 수 있도록 구축하였다.

실험예 1 : PAS1 단백질의 구조

정제된 PAS1 (43 - 168) 단백질을 상기 결정화 방법으로 단독으로 결정화하여 Apo-PAS1의 입체구조를 확보하였고(도 2a), 비대칭적 유닛의 두 분자(PAS1-A 와 PAS1-B)를 포함한 입체구조는 리간드 존재 유무와 관계없이 두 분자의 이량체 구조를 이루고 있음을 크기배제 크로마토 그래피를 통해서도 확인할 수 있었다(도 1b). PAS1 단백질 입체구조에서 분석된 두 분자는 각각 C-말단 부위의 아미노산 150-163 부위에서 비대칭성을 보여주었는데, PAS1-A에서 헬릭스로 구조를 형성하는 아미노산 150-163 부위가 PAS1-B에서는 루프의 형태로 존재하며, Asn164에서 Glu168 영역은 아무런 전자밀도를 보이지 않은 것으로 보아, 이 부위의 유연성을 추측할 수 있었다.

각 PAS1 도메인의 구조는 45 - 149번째 아미노산 서열에 해당하는, 5개의 가닥이 역평행을 이루는 베타 시트와 3개의 알파 헬릭스로 구성된 다른 PAS 도메인의 구조와 매우 유사하였다(도 2b). 추가적인 알파 헬릭스(α4, 아미노산 잔기 150 - 163)는 분자 A에서 기본적인 PAS 폴드(fold)의 바로 밖에 위치하고 있었다. 특이적으로, α4와 대응되는 부위인 분자 B의 C-말단 부위는 완전히 정렬이 엉망이었다. PAS1의 중추는 녹조류(Chlamydomonas reinhardtii)의 광수용체(photoreceptor)의 LOV 도메인 (PDB ID: 1N9L, 11% 서열 상동성, RMSD (82 알파 탄소 쌍에 대한 1.52Å)) 및 아라비돕시스(Arabidopsis)의 청색광 수용체인 phototropin-2의 LOV1 도메인 (PDB ID: 2Z6D, 11% 서열 상동성, RMSD (58 알파 탄소 쌍에 대한 1.30Å))의 중추와 가장 유사하였다. 상기 LOV 도메인 및 LOV1 도메인은 모두 FMN과 결합한다.

많은 PAS 도메인들의 이량체화(dimerization)는 주로 핵심적인 PAS 폴드의 바로 윗 부위에 위치하는 양친매성의 알파 헬릭스를 통해 일어난다. 본 발명에서 제작된 TodS PAS1 도메인은 상응하는 헬릭스 부위를 포함하고 있지 않았다. 따라서, TodS PAS1 구조에서 관찰되는, 역평행의 마주보는 이량체화는 결정 팩킹(packing)의 대칭(symmetry)으로 인한 인위적인 결과 때문일 수 있다. TodS의 기본적인 PAS 폴드의 바로 윗 부분에 PAS1의 이량체화와 관련된 알파 헬릭스 부위 (아미노산 잔기 32 - 43)가 존재함을 이차구조(secondary structure)로부터 예측하 수 있다.

실험예 2 : SeMet-PAS1/톨루엔 복합체 단백질의 구조

상기 방법으로 SeMet-PAS1 (43 - 168)/톨루엔 복합체의 입체구조를 분석한 결과, 1.6 Å의 고해상도로 Apo-PAS1 (43 - 168) 결정체와 같이 비대칭적 유닛으로 두 분자(SeMet-PAS1-A 와 SeMet-PAS1-B)를 포함하고 있음을 확인하였다(도 2c). 톨루엔은 각 PAS1 단량체 내 소수성 결합 공간에 각각 한 분자씩 결합하는 것을 확인하였다(도 3). PAS1 단독 단백질 결정체의 경우 PAS1-A와 PAS1-B의 Asn164에서 Glu168 영역의 전자밀도를 볼 수 없었으나, SeMet-치환 PAS1/톨루엔 복합체 단백질 결정체의 경우는, SeMet-PAS1-A의 Glu166에서 Glu168 영역 및 SeMet-PAS1-B의 Glu168에서만 아무런 전자밀도를 보이지 않았다. 따라서 상기 전자밀도를 보이지 않는 잔기들은 모델에 포함되지 않았다. TodS의 46번 아미노산에서 149번 아미노산은 다섯 개의 베타 가닥과 세 개의 알파 헬릭스 구조로 이루어져 있는 전형적인 PAS 도메인의 구조를 형성하며, 기존에 보고된 Azotobacter vinelandi의 NifL, Chlamydomonas reinhardtii의 빛 수용체 LOV/PAS도메인과 유사한 구조를 보였다.

하지만, PAS1 (43 - 168)/톨루엔 복합체의 입체구조에서 분석된 PAS1은 FMN, Heme 등과 결합하는 기존의 PAS 도메인들과 달리 좁은 리간드 결합부위를 가지고 있으며, 상기 분석된 PAS1/톨루엔 복합체의 입체구조는 TodS의 히스티딘 키나제 1 도메인과 연결되는 알파 헬릭스 구조(아미노산 150부터 163까지)를 포함하고 있다. 따라서, PAS1-B의 알파 헬릭스 구조변화가 TodS의 히스티딘 키나제 1 도메인과의 연결에 영향을 주어, TodS의 형태 변화를 유도할 것으로 분석되었다. SeMet-PAS1-A와 SeMet-PAS1-B는 동일한 구조를 가지나, SeMet-PAS1-A와 SeMet-PAS1-B룰 겹쳐놓으면, 톨루엔 결합 특이적으로 형성된 알파 헬릭스가 약 25° 기울기 차이가 있었다(도 4).

실험예 3 : PAS1/1,2,4-TMB 복합체 단백질의 구조

상기 방법으로 PAS1 (43 - 168)/1,2,4-TMB 복합체의 입체구조를 분석한 결과, 전자 밀도 차이 지도에서 1,2,4-TMB가 각 PAS1 단량체의 소수성 결합 공간에 한 분자씩 결합하고 있는 것을 확인하였다(도 2d). 하지만, PAS1/1,2,4-TMB 복합체의 PAS1-B 단량체는 C-말단에 위치한 아미노산 Ala155에서부터 Glu168까지 아무런 전자밀도를 보이지 않았고, 이것은 PAS1 단백질 단독으로 얻은 결정체의 입체구조 분석결과와 비교해 보아, 이 부위가 기능적으로 매우 유연한 구조를 형성하고 있음을 예측할 수 있었다 (도 2d). 또한 155번 라이신의 경우도 1,2,4-TMB 결합시 전자밀도가 보이지 않았다. 상기 분석된 SeMet-PAS1/톨루엔 복합체의 입체구조와 비교하여, PAS1/1,2,4-TMB 복합체의 PAS1-B의 유연한 알파 헬릭스 구조는 TodS의 히스티딘 키나제 1 도메인과의 연결에 영향을 주어, PAS1-B의 1,2,4-TMB 결합은 TodS의 형태 변화를 비활성적으로 유도할 것으로 분석되었다.

실험예 4: PAS1의 톨루엔/1,2,4-TMB 결합부위에 대한 분석

상기 SeMet-PAS1/톨루엔 복합체 결정체의 전자 밀도 차이 지도 분석 결과, 톨루엔은 각 SeMet-PAS1-A와 SeMet-PAS1-B 두 분자의 소수성 결합 공간 (hydrophobic binding pocket)에 한 분자씩 결합하는 것을 확인하였다(도 2a, 도3). 구체적으로는, TodS 아미노산 서열 1번에서 PAS1 단백질의 톨루엔 결합 부위는 46번 페닐알라닌(phenylalanine), 48번 글라이신(glycine), 59번 발린(valine), 63번 알라닌(alanine), 79번 페닐알라닌, 84번 트립토판 (tryptophane), 85번 트립토판, 114번 아이소류신(isoleucine), 126번 발린, 128번 페닐알라닌, 145번 알라닌, 147번 글라이신과 톨루엔이 수소 결합(Hydrogen bond) 또는 물 분자-매개 수소 결합을 이루는 것을 확인하였다. 톨루엔의 벤젠 링이 상기 아미노산으로 둘러싸인 소수성 공간에 위치하며, 메틸기는 48번 글라이신, 59번 발린, 그리고 145번 알라닌에 둘러싸여 있었다. 흥미롭게도, 1,2,4-TMB 역시 톨루엔과 같은 부위에 위치하며 상동 아미노산 잔기들과 결합하고 있었으나, 각각 길항제로 작용하는 1,2,4-TMB의 PAS1 결합시 46번 페닐알라닌은 톨루엔 결합시보다 약 70°가량 기울어져 있음을 확인하였다. 이러한 차이는 톨루엔보다 2개의 메틸기를 더 가진 1,2,4-TMB가 PAS1-B 분자의 C-말단 헬릭스를 비정형화 상태로 만들어, 인산화 신호전달이 원활하지 못한 형태의 TodS 단백질로 기능하도록 하는 것으로 분석할 수 있다.

실험예 5: PAS1 단백질의 신호 감지

톨루엔은 TodS/TodT 신호 전달 시스템을 활성화 시키는데 필요한 핵심적인 신호 효능제(signal effector)이다. 톨루엔과 복합체를 형성하는 PAS1의 구조는 일반적으로 apo-PAS1 구조와 일치하였다(도 5a). 각각의 PAS1 분자에서 소수성 잔기인 Phe46, Gly48, Val59, Ala63, Phe79, Trp84, Trp85, Ile114, Val126, Phe128, Ala145, 및 Gly147에 의해 형성된 소수성 포켓에 아고니스트가 위치하였다(도 5b). 포켓의 파묻힌 표면부위는 PISA 소프트웨어에 의해 계산된 바에 의하면 247.27Å² 이었다. 구체적으로, 주로 방향족 아미노산인 Phe46, Phe79, Trp84, Trp85, 및 Phe128에 의해 형성된 부위에 톨루엔의 벤젠 고리가 위치하고, Ala63, Ile114, Val126, 및 Gly147는 상호작용에 관여하였다. 톨루엔의 메틸 그룹은 Gly48, Val59, Ala63, 및 Ala145 잔기에 의해서 둘러쌓여 있었다.

또한, 안타고니스트 1,2,4-TMB와 복합체를 형성하는 PAS1의 구조를 결정하였다(도 5c). 소수성 포켓에 존재하는 동일한 아미노산 잔기들은 안타고니스트와 상호작용에 관여하였다(도 5d). PAS1과 아고니스트와의 상호작용 및 PAS1과 안타고니스트와의 상호작용의 유일한 차이점이 Phe46 위치에서 발견되었다. 안타고니스트와 의 복합체에서 아미노산 잔기의 방향족 고리는, 분자 A와 분자 B 모두에서 톨루엔과의 복합체 Phe46의 방향족 고리에 대하여 상대적으로 ~80°기울어져 있었다(도 5b 및 5d)

리간드와 결합하는데 가장 핵심적인 잔기를 정제된 PAS1 (23-168) 단백질을 사용한 ITC 분석을 통해 분석하였다. PAS1 이량체의 각 분자에 대한 2.6μM 및 38.3μM의 톨루엔 결합 친화도(K _d, 해리상수)를 가진 연속적인 결합 모델을 통해 PAS1 이량체와 톨루엔을 위한 ITC 커브의 최적화를 수행하였다. PAS1에 F46A, F79Y, 및 W85H의 돌연변이를 도입함으로써, 톨루엔의 결합 친화도가 상당히 감소되었다. 특히, 돌연변이에 대한 톨루엔의 첫 번째 결합은 야생형(WT)에 비해 대략 5 - 50배의 약한 상호작용을 나타내었다. ITC에 의해 측정된 단백질에 결합하는 톨루엔의 열역학적 파라미터를 도 5e에 나타내었다.

C-말단의 키나아제 도메인과 직접적으로 연결되어 있는 C-말단(아미노산 잔기 150-163)의 구조적 형태는 어떤 리간드가 존재하는지에 따라서 다르다. 전술한 바와 같이, apo-PAS1 구조에서 헬릭스는 분자 B에서 완전히 흩어져 있다. 톨루엔과 결합한 PAS1 구조에서, 대응되는 부위는 알파 헬릭스가 재건되었다(도 5a). 안타고니스트 1,2,4-TMB의 경우, 대응되는 부위는 완전히 흩어져 있었고, 심지어 전자 밀도 지도에서는 분자 B에서 Lys155 이후에는 존재하지 않았다(도 5c). 모든 구조들에서 분자 A는 C-말단 부위(아미노산 잔기 150 - 163)에서 동일한 알파 헬릭스(α4) 형태를 보여주었다. 이러한 결과는 효능제 의존적인 PAS1 감지에 의해, TodS의 C-말단 키나아제 도메인에 대한 분자적 신호 전달을 시사하는 것이다. PAS1 C-말단 부위(아미노산 잔기 150 - 163)를 신호 전달 부위(STR, signal transfer region)라고 명명하였다.

실험예 6: PAS1 의존적 Tod S의 형태 분석

본 발명에서 분석한 Apo-PAS1, SeMet-PAS1/톨루엔 및 PAS1/1,2,4-TMB 복합체 입체구조 결과에 따르면, PAS1 단백질 내 같은 결합부위에 경쟁적으로 결합하는 톨루엔과 1,2,4-TMB과 같은 방향족 탄화수소들은, PAS1-B 분자 46번 페닐알라닌의 방향족 고리의 각도를 변화시켜 히스티딘 키나아제와 PAS1 도메인을 연결하는 아미노산 150-163 부위를 각각 정형화 혹은 비정형화된 C-말단 구조로 변형-유지함으로써, TodS의 다단계 인산화 신호전달이 리간드 특이적으로 조절되는 것으로 분석되었다(도 5a 내지 6).

또한, PAS1 단백질 내 소수성 결합공간의 리간드 결합부위를 위치-지정 돌연변이 생성 방법으로 변형시킨 PAS1 변이 단백질들이 대부분 단백질 정제과정에서 뭉침현상이 일어나는 등 단백질 구조에 심각한 영향을 받는 것은 PAS1-B분자의 소수성 결합공간과 C-말단의 헬릭스 구조 부위가 TodS의 리간드 특이적 신호전달에 필수적이라는 것을 시사한다. Apo-TodS 단백질과 1,2,4-TMB가 결합된 TodS 단백질의 전자현미경적 관찰 결과에서 보이는 TodS 이량체의 짧은 길이 및 뭉침현상도 PAS1-B 단량체의 비정형화된 C-말단 구조가 TodS 형태를 변화시켰음을 확인하게 한다(도 7a 내지 도 8c).

실험예 7: PAS1 단백질의 이량체화

중요한 PAS 도메인의 바로 윗 부위에 존재하는 이량체화 헬릭스 (아미노산 잔기 32-43)를 결정화를 위해 PAS1 도메인에서 제거하고, 인위적으로 역평행의 마주보는 이량체를 만들었다. 따라서, Azotobacter vinelandii NifL LOV 도메인의 구조(PDB ID: 2GJ3)에 기초하여 PAS1 이량체의 구조를 모델화하였다. 분자 A의 베타 시트 바깥에 존재하는 Val47, Leu49, 및 Leu131과 같은 소수성 잔기들은 각각 분자 B의 Ile39과 Leu43, His35과 Ile38, 및 Gly42와 상호작용 할 것으로 보이고, 이량체화 및 구조적 안정성의 유지에 관여할 것으로 보였다(도 11a).

따라서, 야생형 TodST 또는 이의 돌연변이체를 발현하는 플라스미드를 가진 슈도모나스 퓨티다 KT24400-PXZ 리포터 균주를 이용한 생체내 β-갈락토시다아제 분석 시스템(도 10)을 사용하여, 각 돌연변이체의 리간드 결합 및 다단계 신호 전달 능력을 평가하였다. 그 결과, V47L, L49D, 및 L131D 돌연변이체들은 톨루엔 환경에서 β-갈락토시다아제의 활성이 완전히 파괴되었다(도 11b). 이는 상기 잔기들이 PAS1의 이량화에 필수적 역할을 함을 시사하는 것이다. 이에 반하여, 베타 시트 밖에 위치하는, 전하를 띈 잔기인 Glu58의 돌연변이는 PAS1 이량화에 영향을 주지 않았다(도 11b).

실험예 8: TodS/TodT 시스템에서 PAS2의 역할

TodS는 PAS-형태 센서 도메인과 오토키나아제(autokinase) 도메인을 각각 함유하는 2개의 모듈을 포함한다. TodS는 두개의 센서 키나아제(double sensor kinase) 패밀리 멤버로 분류된다. TodS의 두 번째 모듈에 있는 PAS 도메인인 PAS2는 방향족 신호 분자를 감지하지 않는다. 따라서, 현재 PAS2의 역할은 명확히 알려져 있지 않다. 그러나, TodS의 동족체(homologue)인 StyS의 C-말단의 PAS 도메인은 세포의 산화환원 전위에 반응할 것으로 보인다. PAS2의 결정화를 위해 PAS2를 발현시켜 정제한 결과, 용액 내에서 이량체로 존재함을 알 수 있었다(도 12a). 그러나 PAS2의 결정화는 실패하였다.

서열 분석을 통해 PAS2가 Azotobacter vinelandii NifL LOV 도메인의 구조와 유사한 구조를 가질 것으로 예측되었다(PDB ID: 2GJ3). 따라서, NifL LOV 도메인의 구조를 주형으로 하여 PAS2 (아미노산 잔기 611 - 729)의 구조를 모델화하였다(도 12b). NifL의 FAD 결합 잔기 (Thr78 및 Leu86)에 대응되는 잔기들 중에서, PAS2의 Glu666 및 Leu674(도 12c)를 알라닌으로 변이시켜, 생체내 β-갈락토시다아제 분석 시스템을 사용하여 야생형 TodS에 대한 변이체들의 활성을 비교하였다. 그 결과, 야생형과 돌연변이 사이의 효소 활성에는 차이가 없음을 알 수 있었다(도 12d). 톨루엔과 복합체를 형성한 PAS1의 구조를 상기 모델화된 구조에 겹쳐(도 12e), PAS1과 톨루엔의 결합에 핵심적 역할을 하는, Ile114 및 Val126 잔기와 상응하는, PAS2의 Tyr691 및 Ala703 잔기를 선택하였다. Tyr691 및 Ala703 위치의 TodS 돌연변이체들은 야생형 TodS와 비교하여 톨루엔 신호 전달 능력에 큰 차이가 없었다(도 12d).

이러한 결과들을 통해, 알려진 바와 같이 PAS2 도메인이 톨루엔 또는 FAD 센서로서 기능하지 않는다는 것을 알 수 있었다. TodS가 이량체로서 기능하기 때문에, 인산의 전달(phospho-relay)을 정교하게 조절하는 과정에서 PAS2의 이량화가 중요하다는 가정을 하였다. 모델화된 PAS2 구조를 통해, Ser611 내지 Ser622까지를 둘러싸는 첫 번째 알파 헬릭스가 PAS2의 이량체화에 관여할 것으로 예측되었다. 흥미롭게도, TodS (아미노산 잔기 617 - 623)의 이량체화 부위를 결손시키면 m-자일렌 및 스티렌과 같은 약한 아고니스트에 대한 β-갈락토시다아제 활성의 기초적인 수준이 증가되었다(도 12d). 또한, 이중 돌연변이 (Y619A 및 E620A)가 일어난 TodS에서도 동일한 결과를 얻었다(도 12d). 이러한 결과들은 PAS2가 TodS의 정확한 이량체의 유지를 통해, C-말단의 HK2 및 TodT에 대해 phospho-relay를 정교하게 조절하는 기능을 함을 의미한다.

실험예 9: 전자 현미경을 이용한 TodS 단백질의 구조 분석

실험예 9-1: TodS (43 - 978) 단백질의 구조 분석

C-말단에 His₆ 태그를 가진 TodS (43 - 978) 단백질을 순수분리 정제한 후 음성 염색하여 단일 입자 분석법으로 전자 현미경 분석을 한 결과(도 7a 및 7b), 대략 2 nm 해상도의 분자 수준에서 Apo-TodS과 TodS/톨루엔 복합체, TodS/1,2,4-TMB 복합체의 형태를 분석할 수 있었다.

니켈-골드 입자로 C-말단의 His₆ 태그를 가진 TodS 단백질을 표지 한 후, 음성 염색으로 전자현미경 분석한 Apo-TodS 단백질은 두 개의 골드 입자를 나란히 가지고 있는 것으로 분석되어(도 7b), 동방향의 이량체 형태로 존재하는 것으로 판단되었다. 또한 Apo-TodS과 TodS/톨루엔 복합체는 N-말단 부위가 약간 벌어져 있는 이량체 형태로 유사한 구조적 특징을 공유하고 있었으나, PAS1/톨루엔 복합체의 길이가 Apo-TodS에 비해 상대적으로 긴 양상을 보였다(도 8a 및 8b). 또한, TodS/1,2,4-TMB 복합체는 TodS의 뭉침 현상(aggregation) 이 나타나는 빈도가 높은 것을 확인하였다(도 8c).

상기에서, SeMet-PAS1/톨루엔 복합체의 입체구조에서 보이는 C-말단의 α5 헬릭스 구조가 Apo-PAS1 단백질에서는 유연성을 보이는 루프의 형태로 보여진 바, Apo-TodS에서 보여지는 N-말단부위의 벌어짐은 이러한 유연성 때문일 것으로 판단되었다. 한편, TodS-톨루엔 복합체의 이량체의 길이가 상대적으로 긴 것은, PAS1 도메인의 α5 헬릭스가 톨루엔의 결합에 의해 형성되고, 효율적 인산화 기능을 수행하도록 전체 TodS의 형태에 영향을 준 것으로 판단되었다. 또한 TodS/1,2,4-TMB 복합체의 형태는, TodS 단백질 단독으로 있을 때 보이는 이량체 형태와 뭉침현상이 보이는 형태가 혼재하여 존재함을 확인하였고, 이는 리간드 특이적 PAS1 단백질의 구조변화가 TodS의 형태변화를 유도한다는 결과와 일치하였다.

실험예 9-2: TodS (23-978) 단백질의 구조 분석

완전한 길이의 TodS 단백질은 상당히 유동적(flexible)이고 쉽게 뭉쳐지므로, in vitro에서 단백질을 정제하고 생화학적인 실험을 수행하는 것은 어렵다. 그러나, C-말단에 His₆ 태그를 가진 TodS (43-978) 단백질과 N-말단의 GST가 결합된 TodS (23-978) 단백질은 상대적으로 수용성이 있고 정제과정이 용이하였다. 사이즈 배제 크로마토그래피 분석 결과, 정제된 TodS (23-978) 단백질은 크기 마커 단백질인 apoferritin (443 kDa)과 동일한 부분에서 분리되어 나왔고, 이를 통해 단백질이 유동적인 특성을 가짐을 알 수 있었다(도 9a). 또한, 전자 현미경 분석을 통해 이량체적인 배열을 가짐을 알 수 있었고, Apo-TodS 분자는 14.2nm의 길이 및 7.0nm의 너비를 가지고 있음을 알 수 있었다(도 9b).

PAS1의 톨루엔 감지에 따라 구조적 변화를 야기하여(특히, 아미노산 잔기 150 - 163) TodS/TodT 신호 전달에 영향을 주므로, TodS의 특성은 톨루엔의 존재하에 영향을 받을 것이라 예측하였다. 톨루엔을 감지한 TodS (23-978) 단백질은 분자적 수준에서 볼 때, Apo-TodS와 유사한 형태를 가지고 있었다. 그러나, TodS/톨루엔 복합체 단백질은 16.2nm의 길이 및 9.4nm의 너비를 가지고 있었고, 이는 더욱 곧은 형태가 되도록 구조적 변화가 있었음을 시사하는 것이다(도 9b). 또한, 안타고니스트 1,2,4-TMB와 TodS 복합체의 다량체화를 통해, 리간드 의존적인 TodS의 형태적 변화를 확인하였다(도 9b).

이러한 결과들은 TodS가 신호 전달의 활성화를 위해 리간드 의존적인 구조 변화를 겪음을 시사하는 것이다.

상기 결과를 종합하여, 리간드에 따라 TodS가 정렬되거나 또는 정렬되지 않은 구조로 변화함을 알 수 있었고, 이를 통해 TodS/TodT 신호 전달 과정에 대하여 분자 수준의 매커니즘을 모델을 만들었다(도 13). TodS는 신축성을 가지며, 오토키나아제(autokinase) 활성을 가지는 이량체로 존재한다. 이러한 상태에서 PAS1 감지 도메인은 STR의 신축성을 통해 C-말단의 HK1으로 신호를 효과적으로 전달하지 못한다. 따라서, 이러한 형태는 HK1의 자기인산화(autophosphorylation)가 가능한, 기능적인 이량체 형태를 유도하지 못한다. 톨루엔을 감지했을 때, PAS1 STR들은 신호를 전달하도록 재배열되고, TodS에 형태적 변화를 유도하여 HK1-RRR-PAS2-HK2 도메인이 다단계의 인산 신호 전달을 위해 배열되도록 만든다. TodS의 이량체 구조뿐만아니라, PAS1 센서 및 HK1 사이의 구조적 유동성은 특정 환경 조건 하에서 효율적인 신호 전달에 필수적이다.

실험예 10: PAS1 의존적 TodS의 돌연변이체의 생체내 베타 갈락토시다아제 발현 스크리닝 및 신기능 감지센서 선발

상기 SeMet-PAS1/톨루엔 복합체 입체구조 분석에 의거, 46번 페닐알라닌(phenylalanine), 48번 글라이신(glycine), 59번 발린(valine), 63번 알라닌(alanine), 79번 페닐알라닌, 84번 트립토판 (tryptophane), 85번 트립토판, 114번 아이소류신(isoleucine), 126번 발린, 128번 페닐알라닌, 145번 알라닌, 147번 글라이신이 톨루엔과 수소 결합(Hydrogen bond) 또는 물 분자-매개 수소 결합을 이루고, 특히 46번 페닐알라닌, 146번 알지닌, 148번 글루탐산이 SeMet-PAS1-B 분자의 C-말단 헬릭스 구조변화에 필수적임을 확인하였다(도 3 내지 6).

이에 본 발명자들은 pBBR-PtodS-TodST 클론에 위치-지정 돌연변이를 유도하여 서열번호 1의 아미노산 서열을 가진 TodS 단백질에서 46번 페닐알라닌을 알라닌 또는 세린으로, 59번 발린을 알라닌, 아스파틱산 또는 페닐알라닌으로, 63번 알라닌을 발린 또는 세린으로, 79번 페닐알라닌을 타이로신(tyrosine), 글루탐산 또는 류신으로, 84번 트립토판을 발린, 히스티딘(histidine) 또는 알지닌으로, 85번 트립토판을 히스티딘, 알지닌 또는 류신으로, 114번 아이소류신을 발린, 페닐알라닌, 쓰레오닌(threonine) 또는 세린으로, 126번 발린을 알라닌, 세린, 쓰레오닌 또는 류신으로, 128번 페닐알라닌을 글루탐산, 히스티딘, 아스파틱산, 세린 또는 류신으로, 145번 알라닌을 세린 또는 발린으로, 47번 발린을 알라닌 또는 류신으로, 49번 류신을 아스파틱산 또는 알라닌으로, 58번 글루탐산을 알라닌 또는 세린으로, 131번 류신을 아스파틱산으로, 61번 글루타민을 류신, 알지닌, 알라닌으로, 146번 글루탐산을 알라닌 또는 류신으로, 148번 알지닌을 알라닌 또는 메티오닌(methionine)으로 치환시킨 후, 슈도모나스 퓨티다 KT2440-PXZ 리포터 균주로 도입하였다 (표 1). 상기 TodS 변이 단백질을 발현하는 슈도모나스 퓨티다 KT2440-PXZ 리포터 균주는 특정 리간드 공급에 의해 생체 내에서 TodS 변이 단백질과 TodT의 단백질의 인산화을 순차적으로 유도하였다. 본 발명에서 구축된 96-딥 웰 스크리닝 방법은 가스 상태로 공급되는 2.5 내지 400μM 농도의 특정 리간드에 노출된 PAS1-의존 TodS 변이 단백질과 야생형 TodS 단백질을 3반복으로 검증하여, 최종 리간드 결합과 TodS/TodT 2개 인자 신호전달에 중요한 PAS1 단백질의 아미노산들을 각각 선발하였다(도 14 내지 19).

상기 스크리닝 결과, 46번 페닐알라닌을 알라닌 또는 세린으로, 59번 발린을 알라닌, 아스파틱산 또는 페닐알라닌으로, 63번 알라닌을 발린 또는 세린으로, 79번 페닐알라닌을 타이로신, 글루탐산 또는 류신으로, 84번 트립토판을 발린, 히스티딘 또는 알지닌으로, 85번 트립토판을 히스티딘, 알지닌, 또는 류신으로, 114번 아이소류신을 페닐알라닌, 쓰레오닌(threonine) 또는 세린으로, 126번 발린을 세린, 쓰레오닌, 또는 류신으로, 128번 페닐알라닌을 글루탐산, 히스티딘, 아스파틱산, 세린 또는 류신으로, 145번 알라닌을 세린 또는 발린으로 치환한 경우, 모두 10 μM 내지 100 μM 톨루엔에 의한 TodS/TodT 2개 인자 신호전달이 저해되었다(도 14 내지 15b).

그러나, 126번 발린을 알라닌으로 치환한 경우는 10μM 톨루엔에 대한 민감도가 낮아지기는 했으나, 100μM 톨루엔에 의해서는 여전히 신호전달이 이루어졌다(도 15b).

또한, 114번 아이소류신을 페닐알라닌 또는 세린으로 치환한 경우에는 100 μM의 톨루엔이 공급되어도 다른 잔기와 마찬가지로 톨루엔 결합이 저해되었으나(도 14), 114번 아이소류신을 발린으로 치환한 경우(I114V TodS)는 50-100μM m-자일렌에도 높은 신호전달 활성을 나타내었고, 이것은 야생형 TodS와 비교하여 약 2-4배 이상 높은 민감도를 보이는 것으로 확인되었다(도 15b).

또한, 47번 발린을 알라닌, 또는 류신으로, 49번 류신을 알라닌, 또는 아스파틱산으로, 58번 글루탐산을 알리닌 또는 세린으로, 131번 류신을 아스파틱산으로, 146번 글루탐산을 알라닌 또는 류신으로, 148번 알지닌을 알라닌 또는 메티오닌으로 치환시킨 경우, 역시 모두 10μM 톨루엔에 의한 TodS/TodT 2개 인자 신호전달이 저해되었다(도 16 및 17).

또한, 61번 글루타민이 알지닌으로 치환된, Q61R TodS의 경우에는 톨루엔에 비해 4배, 스티렌, m-자일렌에 비해 2 내지 5배 이상 민감도가 증대되었고, 야생형의 TodS의 길항제인 o-자일렌에도 TodS/TodT 2개 인자 신호전달이 매우 높게 이루어졌다(도 18a 내지 도 19). 이에, 톨루엔 결합부위를 디자인한 각 I114V와 Q61R로 변형된 PAS1과 TodS 단백질을 각각 m-자일렌과 o-자일렌 등에 민감하게 반응하는 신기능의 감지센서 모듈(ePAS1)로 선발하였다.

상기 결과를 종합하면, PAS1 단백질은 톨루엔과의 결합을 통하여, tod 오페론의 발현을 상향 조절함으로써, 톨루엔 분해를 촉진하게 되는 중요한 감지센서 단백질로 기능한다. 따라서, 본 발명의 Apo-PAS1, SeMet-PAS1/톨루엔, PAS1/1,2,4-TMB 복합체의 3차원적 입체구조를 이용하여, TodS가 톨루엔이외의 다양한 리간드 특이적 결합에 의해 tod 유전자의 발현을 조절하도록 리간드 결합부위를 재디자인하여 신기능의 감지센서 모듈을 개발할 수 있다. 또한, 96 딥 웰에서 가스 상인 리간드에 반응하여 생체 내 베타 갈락토시다아제 발현을 유도하는 PAS1 변이 단백질들을 동시에 대량 스크리닝하는 방범을 구축하여 민감도 높은 신기능의 감지센서를 선발할 수 있다.

또한, 본 발명의 PAS1 변이 단백질 또는 TodS 변이 단백질과 공지된 탄화수소 분해 단백질을 이용하여, 상기 변이 단백질과 방향족 탄화수소의 결합에 따라 탄화수소 분해 단백질이 발현되는, 방향족 탄화수소 분해용 미생물을 제작할 수 있다.

이상의 설명으로부터, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그 리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

<110> Korea Research Institute of Bioscience and Biotechnology <120> TodS mutein comprising PAS1 mutein and use thereof <130> KPA141137-KR-P1 <150> 10-2014-0153892 <151> 2014-11-06 <160> 130 <170> KopatentIn 2.0 <210> 1 <211> 978 <212> PRT <213> Pseudomonas putida F1 <400> 1 Met Ser Ser Leu Asp Arg Lys Lys Pro Gln Asn Arg Ser Lys Asn Asn 1 5 10 15 Tyr Tyr Asn Ile Cys Leu Lys Glu Lys Gly Ser Glu Glu Leu Thr Cys 20 25 30 Glu Glu His Ala Arg Ile Ile Phe Asp Gly Leu Tyr Glu Phe Val Gly 35 40 45 Leu Leu Asp Ala His Gly Asn Val Leu Glu Val Asn Gln Val Ala Leu 50 55 60 Glu Gly Gly Gly Ile Thr Leu Glu Glu Ile Arg Gly Lys Pro Phe Trp 65 70 75 80 Lys Ala Arg Trp Trp Gln Ile Ser Lys Lys Thr Glu Ala Thr Gln Lys 85 90 95 Arg Leu Val Glu Thr Ala Ser Ser Gly Glu Phe Val Arg Cys Asp Val 100 105 110 Glu Ile Leu Gly Lys Ser Gly Gly Arg Glu Val Ile Ala Val Asp Phe 115 120 125 Ser Leu Leu Pro Ile Cys Asn Glu Glu Gly Ser Ile Val Tyr Leu Leu 130 135 140 Ala Glu Gly Arg Asn Ile Thr Asp Lys Lys Lys Ala Glu Ala Met Leu 145 150 155 160 Ala Leu Lys Asn Gln Glu Leu Glu Gln Ser Val Glu Cys Ile Arg Lys 165 170 175 Leu Asp Asn Ala Lys Ser Asp Phe Phe Ala Lys Val Ser His Glu Leu 180 185 190 Arg Thr Pro Leu Ser Leu Ile Leu Gly Pro Leu Glu Ala Val Met Ala 195 200 205 Ala Glu Ala Gly Arg Glu Ser Pro Tyr Trp Lys Gln Phe Glu Val Ile 210 215 220 Gln Arg Asn Ala Met Thr Leu Leu Lys Gln Val Asn Thr Leu Leu Asp 225 230 235 240 Leu Ala Lys Met Asp Ala Arg Gln Met Gly Leu Ser Tyr Arg Arg Ala 245 250 255 Asn Leu Ser Gln Leu Thr Arg Thr Ile Ser Ser Asn Phe Glu Gly Ile 260 265 270 Ala Gln Gln Lys Ser Ile Thr Phe Asp Thr Lys Leu Pro Val Gln Met 275 280 285 Val Ala Glu Val Asp Cys Glu Lys Tyr Glu Arg Ile Ile Leu Asn Leu 290 295 300 Leu Ser Asn Ala Phe Lys Phe Thr Pro Asp Gly Gly Leu Ile Arg Cys 305 310 315 320 Cys Leu Ser Leu Ser Arg Pro Asn Tyr Ala Leu Val Thr Val Ser Asp 325 330 335 Ser Gly Pro Gly Ile Pro Pro Ala Leu Arg Lys Glu Ile Phe Glu Arg 340 345 350 Phe His Gln Leu Ser Gln Glu Gly Gln Gln Ala Thr Arg Gly Thr Gly 355 360 365 Leu Gly Leu Ser Ile Val Lys Glu Phe Val Glu Leu His Arg Gly Thr 370 375 380 Ile Ser Val Ser Asp Ala Pro Gly Gly Gly Ala Leu Phe Gln Val Lys 385 390 395 400 Leu Pro Leu Asn Ala Pro Glu Gly Ala Tyr Val Ala Ser Asn Thr Ala 405 410 415 Pro Arg Arg Asp Asn Pro Gln Val Val Asp Thr Asp Glu Tyr Leu Leu 420 425 430 Leu Ala Pro Asn Ala Glu Asn Glu Ala Glu Val Leu Pro Phe Gln Ser 435 440 445 Asp Gln Pro Arg Val Leu Ile Val Glu Asp Asn Pro Asp Met Arg Gly 450 455 460 Phe Ile Lys Asp Cys Leu Ser Ser Asp Tyr Gln Val Tyr Val Ala Pro 465 470 475 480 Asp Gly Ala Lys Ala Leu Glu Leu Met Ser Asn Met Pro Pro Asp Leu 485 490 495 Leu Ile Thr Asp Leu Ile Met Pro Val Met Ser Gly Asp Met Leu Val 500 505 510 His Gln Val Arg Lys Lys Asn Glu Leu Ser His Ile Pro Ile Met Val 515 520 525 Leu Ser Ala Lys Ser Asp Ala Glu Leu Arg Val Lys Leu Leu Ser Glu 530 535 540 Ser Val Gln Asp Phe Leu Leu Lys Pro Phe Ser Ala His Glu Leu Arg 545 550 555 560 Ala Arg Val Ser Asn Leu Val Ser Met Lys Val Ala Gly Asp Ala Leu 565 570 575 Arg Lys Glu Leu Ser Asp Gln Gly Asp Asp Ile Ala Ile Leu Thr His 580 585 590 Arg Leu Ile Lys Ser Arg His Arg Leu Gln Gln Ser Asn Ile Ala Leu 595 600 605 Ser Ala Ser Glu Ala Arg Trp Lys Ala Val Tyr Glu Asn Ser Ala Ala 610 615 620 Gly Ile Val Leu Thr Asp Pro Glu Asn Arg Ile Leu Asn Ala Asn Pro 625 630 635 640 Ala Phe Gln Arg Ile Thr Gly Tyr Gly Glu Lys Asp Leu Glu Gly Leu 645 650 655 Ser Met Glu Gln Leu Thr Pro Ser Asp Glu Ser Pro Gln Ile Lys Gln 660 665 670 Arg Leu Ala Asn Leu Leu Gln Gly Gly Gly Ala Glu Tyr Ser Val Glu 675 680 685 Arg Ser Tyr Leu Cys Lys Asn Gly Ser Thr Ile Trp Ala Asn Ala Ser 690 695 700 Val Ser Leu Met Pro Gln Arg Val Gly Glu Ser Pro Val Ile Leu Gln 705 710 715 720 Ile Ile Asp Asp Ile Thr Glu Lys Lys Gln Ala Gln Glu Asn Leu Asn 725 730 735 Gln Leu Gln Gln Gln Leu Val Tyr Val Ser Arg Ser Ala Thr Met Gly 740 745 750 Glu Phe Ala Ala Tyr Ile Ala His Glu Ile Asn Gln Pro Leu Ser Ala 755 760 765 Ile Met Thr Asn Ala Asn Ala Gly Thr Arg Trp Leu Gly Asn Glu Pro 770 775 780 Ser Asn Ile Pro Glu Ala Lys Glu Ala Leu Ala Arg Ile Ile Arg Asp 785 790 795 800 Ser Asp Arg Ala Ala Glu Ile Ile Arg Met Val Arg Ser Phe Leu Lys 805 810 815 Arg Gln Glu Thr Val Leu Lys Pro Ile Asp Leu Lys Ala Leu Val Thr 820 825 830 Asp Thr Ser Leu Ile Leu Lys Ala Pro Ser Gln Asn Asn Ser Val Asn 835 840 845 Leu Asp Val Val Ala Asp Asp Glu Leu Pro Glu Ile Trp Gly Asp Gly 850 855 860 Val Gln Ile Gln Gln Leu Ile Ile Asn Leu Ala Met Asn Ala Ile Glu 865 870 875 880 Ala Ile Ser Gln Ala Asp Cys Glu Thr Arg Gln Leu Thr Leu Ser Phe 885 890 895 Ser Gly Asn Asp Thr Gly Asp Ala Leu Val Ile Ser Val Lys Asp Thr 900 905 910 Gly Pro Gly Ile Ser Glu Arg Gln Met Ala Gln Leu Phe Asn Ala Phe 915 920 925 Tyr Thr Thr Lys Lys Glu Gly Leu Gly Met Gly Leu Ala Ile Cys Leu 930 935 940 Thr Ile Thr Glu Val His Asn Gly Lys Ile Trp Val Glu Cys Pro Pro 945 950 955 960 Ala Gly Gly Ala Cys Phe Leu Val Ser Ile Pro Ala Arg Gln Gly Ser 965 970 975 Gly Thr <210> 2 <211> 2937 <212> DNA <213> Pseudomonas putida F1 <400> 2 atgagctcct tggatagaaa aaagcctcaa aatagatcga aaaataatta ttataatatc 60 tgcctcaagg agaaaggatc tgaagagctg acgtgtgaag aacatgcacg catcatattt 120 gatgggctct acgagtttgt gggccttctt gatgctcatg gaaatgtgct tgaagtgaac 180 caggtcgcat tggagggggg cgggattact ctggaagaaa tacgagggaa gccattctgg 240 aaggcgcgtt ggtggcaaat ttcaaaaaaa accgaggcga cccaaaagcg acttgttgaa 300 actgcatcat ccggtgaatt tgttcgctgt gatgttgaga ttcttggaaa atcaggtgga 360 agagaggtaa tagccgtcga tttttcattg ctgccaattt gcaatgaaga agggagcatt 420 gtttaccttc ttgcggaagg gcgcaatatt accgataaga agaaagccga ggccatgctg 480 gcgttgaaga accaggaatt ggagcagtcg gttgagtgta tccgaaaact cgataatgcg 540 aagagtgatt tctttgccaa ggtgagccat gagttgcgca ctccgctgtc tttgattcta 600 gggccactgg aagccgttat ggcggcagag gctgggcgtg aatcgccgta ttggaagcag 660 tttgaggtca ttcagcgtaa tgcaatgacc ctgttgaaac aggttaacac gctgcttgac 720 ttggcgaaaa tggacgcccg gcagatgggg ctttcctatc ggcgagccaa tcttagtcag 780 ctcacccgta ctattagctc gaattttgaa ggaatagccc agcaaaaatc aataacgttc 840 gatacaaaac tgcctgtaca gatggtcgct gaggtggatt gtgagaaata cgaacgcatt 900 atccttaact tgctttccaa tgcgtttaaa ttcacccctg acggggggct tatccgttgc 960 tgtcttagtt tgagtcgacc aaattatgcc ttggttactg tatctgatag cgggccgggt 1020 attcctcctg cactgcgtaa agaaatattt gaacgtttcc accagctaag ccaggaaggt 1080 caacaagcta cgcggggtac aggcttgggg ctttccattg tgaaagaatt cgttgaattg 1140 caccgtggaa caatttctgt aagtgatgcc ccgggcgggg gggcgctttt tcaggtaaag 1200 ctgccgctga atgctcctga aggtgcttat gttgcgagta acaccgcgcc gcgaagagat 1260 aatcctcagg tcgtggatac ggatgagtac cttttgctgg cgcccaatgc ggaaaatgaa 1320 gccgaggtgc ttccatttca atccgaccag cctcgggtgc taatcgttga agataaccct 1380 gatatgcgtg gttttataaa ggactgtctc agtagcgact atcaagttta tgttgcaccc 1440 gacggtgcaa aggcattgga gttgatgtca aacatgccgc cagacctgtt gattacagac 1500 ctgataatgc ctgttatgag cggcgatatg ctggttcacc aagtgcgtaa gaaaaatgaa 1560 ctttcacata tcccgatcat ggtgctgtcg gccaagtcag acgcagaact gcgtgtgaaa 1620 ttgctctccg agtcggtgca ggactttctt cttaagccat tttctgctca tgagctacga 1680 gcgcgtgtaa gcaatctggt atccatgaag gtggcaggcg atgcgttgcg taaggagctt 1740 tccgatcagg gggatgatat tgcgatactt actcaccgtc tgatcaaaag tcgccatcgt 1800 cttcagcaga gtaacatcgc attatccgcc tcggaagcgc gttggaaagc agtgtatgaa 1860 aactctgcgg ccggtattgt actgaccgac ccggaaaacc gaatactcaa cgccaatcct 1920 gcatttcaac gcattaccgg atatggggaa aaggatttgg agggactttc catggagcaa 1980 ttgactccat ctgacgaaag cccacagata aagcagcgtc tggccaattt gcttcagggt 2040 gggggagcgg aatacagtgt ggagcgctcc tatctatgca aaaatggttc tacgatttgg 2100 gccaatgcga gtgtctcgct gatgcctcaa cgtgtcggtg aatctccagt tatactgcag 2160 atcatcgatg acatcactga gaagaaacaa gcacaggaaa atcttaacca attgcagcaa 2220 caacttgtgt acgtttcccg atcagctacg atgggtgaat ttgcagccta tattgcacac 2280 gagataaacc aaccgctctc ggcgatcatg accaatgcca atgctggcac acgttggtta 2340 ggtaatgagc catctaacat cccagaggct aaagaggcac tggctcgcat tatccgagat 2400 tccgaccgcg ctgcagaaat tatccgtatg gtacgctcct tcctgaagcg tcaagaaacg 2460 gtgctgaaac cgattgatct aaaagcactg gtaactgata caagcctgat acttaaggcc 2520 cctagtcaga ataacagtgt caatttggat gttgttgcgg atgatgaact ccctgagata 2580 tggggggatg gtgtacagat ccagcagttg ataataaatc tggctatgaa cgctattgaa 2640 gcgatcagcc aagccgactg tgaaaccagg cagctaaccc tgtcattctc aggcaatgat 2700 acaggtgatg cgcttgttat ctcagtgaaa gatacaggtc caggtatttc agagaggcag 2760 atggcgcagt tgttcaacgc attctacacc acaaaaaaag aagggcttgg tatgggattg 2820 gcaatctgtc ttacaatcac ggaagtgcat aacggtaaaa tatgggttga gtgcccgccc 2880 gctgggggtg cttgtttcct ggtaagtatc cctgccagac agggctccgg cacatga 2937 <210> 3 <211> 126 <212> PRT <213> Pseudomonas putida F1 <400> 3 Leu Tyr Glu Phe Val Gly Leu Leu Asp Ala His Gly Asn Val Leu Glu 1 5 10 15 Val Asn Gln Val Ala Leu Glu Gly Gly Gly Ile Thr Leu Glu Glu Ile 20 25 30 Arg Gly Lys Pro Phe Trp Lys Ala Arg Trp Trp Gln Ile Ser Lys Lys 35 40 45 Thr Glu Ala Thr Gln Lys Arg Leu Val Glu Thr Ala Ser Ser Gly Glu 50 55 60 Phe Val Arg Cys Asp Val Glu Ile Leu Gly Lys Ser Gly Gly Arg Glu 65 70 75 80 Val Ile Ala Val Asp Phe Ser Leu Leu Pro Ile Cys Asn Glu Glu Gly 85 90 95 Ser Ile Val Tyr Leu Leu Ala Glu Gly Arg Asn Ile Thr Asp Lys Lys 100 105 110 Lys Ala Glu Ala Met Leu Ala Leu Lys Asn Gln Glu Leu Glu 115 120 125 <210> 4 <211> 378 <212> DNA <213> Pseudomonas putida F1 <400> 4 ctctacgagt ttgtgggcct tcttgatgct catggaaatg tgcttgaagt gaaccaggtc 60 gcattggagg ggggcgggat tactctggaa gaaatacgag ggaagccatt ctggaaggcg 120 cgttggtggc aaatttcaaa aaaaaccgag gcgacccaaa agcgacttgt tgaaactgca 180 tcatccggtg aatttgttcg ctgtgatgtt gagattcttg gaaaatcagg tggaagagag 240 gtaatagccg tcgatttttc attgctgcca atttgcaatg aagaagggag cattgtttac 300 cttcttgcgg aagggcgcaa tattaccgat aagaagaaag ccgaggccat gctggcgttg 360 aagaaccagg aattggag 378 <210> 5 <211> 146 <212> PRT <213> Pseudomonas putida F1 <400> 5 Lys Glu Lys Gly Ser Glu Glu Leu Thr Cys Glu Glu His Ala Arg Ile 1 5 10 15 Ile Phe Asp Gly Leu Tyr Glu Phe Val Gly Leu Leu Asp Ala His Gly 20 25 30 Asn Val Leu Glu Val Asn Gln Val Ala Leu Glu Gly Gly Gly Ile Thr 35 40 45 Leu Glu Glu Ile Arg Gly Lys Pro Phe Trp Lys Ala Arg Trp Trp Gln 50 55 60 Ile Ser Lys Lys Thr Glu Ala Thr Gln Lys Arg Leu Val Glu Thr Ala 65 70 75 80 Ser Ser Gly Glu Phe Val Arg Cys Asp Val Glu Ile Leu Gly Lys Ser 85 90 95 Gly Gly Arg Glu Val Ile Ala Val Asp Phe Ser Leu Leu Pro Ile Cys 100 105 110 Asn Glu Glu Gly Ser Ile Val Tyr Leu Leu Ala Glu Gly Arg Asn Ile 115 120 125 Thr Asp Lys Lys Lys Ala Glu Ala Met Leu Ala Leu Lys Asn Gln Glu 130 135 140 Leu Glu 145 <210> 6 <211> 438 <212> DNA <213> Pseudomonas putida F1 <400> 6 aaggagaaag gatctgaaga gctgacgtgt gaagaacatg cacgcatcat atttgatggg 60 ctctacgagt ttgtgggcct tcttgatgct catggaaatg tgcttgaagt gaaccaggtc 120 gcattggagg ggggcgggat tactctggaa gaaatacgag ggaagccatt ctggaaggcg 180 cgttggtggc aaatttcaaa aaaaaccgag gcgacccaaa agcgacttgt tgaaactgca 240 tcatccggtg aatttgttcg ctgtgatgtt gagattcttg gaaaatcagg tggaagagag 300 gtaatagccg tcgatttttc attgctgcca atttgcaatg aagaagggag cattgtttac 360 cttcttgcgg aagggcgcaa tattaccgat aagaagaaag ccgaggccat gctggcgttg 420 aagaaccagg aattggag 438 <210> 7 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> I114V TodS <400> 7 Met Ser Ser Leu Asp Arg Lys Lys Pro Gln Asn Arg Ser Lys Asn Asn 1 5 10 15 Tyr Tyr Asn Ile Cys Leu Lys Glu Lys Gly Ser Glu Glu Leu Thr Cys 20 25 30 Glu Glu His Ala Arg Ile Ile Phe Asp Gly Leu Tyr Glu Phe Val Gly 35 40 45 Leu Leu Asp Ala His Gly Asn Val Leu Glu Val Asn Gln Val Ala Leu 50 55 60 Glu Gly Gly Gly Ile Thr Leu Glu Glu Ile Arg Gly Lys Pro Phe Trp 65 70 75 80 Lys Ala Arg Trp Trp Gln Ile Ser Lys Lys Thr Glu Ala Thr Gln Lys 85 90 95 Arg Leu Val Glu Thr Ala Ser Ser Gly Glu Phe Val Arg Cys Asp Val 100 105 110 Glu Val Leu Gly Lys Ser Gly Gly Arg Glu Val Ile Ala Val Asp Phe 115 120 125 Ser Leu Leu Pro Ile Cys Asn Glu Glu Gly Ser Ile Val Tyr Leu Leu 130 135 140 Ala Glu Gly Arg Asn Ile Thr Asp Lys Lys Lys Ala Glu Ala Met Leu 145 150 155 160 Ala Leu Lys Asn Gln Glu Leu Glu Gln Ser Val Glu Cys Ile Arg Lys 165 170 175 Leu Asp Asn Ala Lys Ser Asp Phe Phe Ala Lys Val Ser His Glu Leu 180 185 190 Arg Thr Pro Leu Ser Leu Ile Leu Gly Pro Leu Glu Ala Val Met Ala 195 200 205 Ala Glu Ala Gly Arg Glu Ser Pro Tyr Trp Lys Gln Phe Glu Val Ile 210 215 220 Gln Arg Asn Ala Met Thr Leu Leu Lys Gln Val Asn Thr Leu Leu Asp 225 230 235 240 Leu Ala Lys Met Asp Ala Arg Gln Met Gly Leu Ser Tyr Arg Arg Ala 245 250 255 Asn Leu Ser Gln Leu Thr Arg Thr Ile Ser Ser Asn Phe Glu Gly Ile 260 265 270 Ala Gln Gln Lys Ser Ile Thr Phe Asp Thr Lys Leu Pro Val Gln Met 275 280 285 Val Ala Glu Val Asp Cys Glu Lys Tyr Glu Arg Ile Ile Leu Asn Leu 290 295 300 Leu Ser Asn Ala Phe Lys Phe Thr Pro Asp Gly Gly Leu Ile Arg Cys 305 310 315 320 Cys Leu Ser Leu Ser Arg Pro Asn Tyr Ala Leu Val Thr Val Ser Asp 325 330 335 Ser Gly Pro Gly Ile Pro Pro Ala Leu Arg Lys Glu Ile Phe Glu Arg 340 345 350 Phe His Gln Leu Ser Gln Glu Gly Gln Gln Ala Thr Arg Gly Thr Gly 355 360 365 Leu Gly Leu Ser Ile Val Lys Glu Phe Val Glu Leu His Arg Gly Thr 370 375 380 Ile Ser Val Ser Asp Ala Pro Gly Gly Gly Ala Leu Phe Gln Val Lys 385 390 395 400 Leu Pro Leu Asn Ala Pro Glu Gly Ala Tyr Val Ala Ser Asn Thr Ala 405 410 415 Pro Arg Arg Asp Asn Pro Gln Val Val Asp Thr Asp Glu Tyr Leu Leu 420 425 430 Leu Ala Pro Asn Ala Glu Asn Glu Ala Glu Val Leu Pro Phe Gln Ser 435 440 445 Asp Gln Pro Arg Val Leu Ile Val Glu Asp Asn Pro Asp Met Arg Gly 450 455 460 Phe Ile Lys Asp Cys Leu Ser Ser Asp Tyr Gln Val Tyr Val Ala Pro 465 470 475 480 Asp Gly Ala Lys Ala Leu Glu Leu Met Ser Asn Met Pro Pro Asp Leu 485 490 495 Leu Ile Thr Asp Leu Ile Met Pro Val Met Ser Gly Asp Met Leu Val 500 505 510 His Gln Val Arg Lys Lys Asn Glu Leu Ser His Ile Pro Ile Met Val 515 520 525 Leu Ser Ala Lys Ser Asp Ala Glu Leu Arg Val Lys Leu Leu Ser Glu 530 535 540 Ser Val Gln Asp Phe Leu Leu Lys Pro Phe Ser Ala His Glu Leu Arg 545 550 555 560 Ala Arg Val Ser Asn Leu Val Ser Met Lys Val Ala Gly Asp Ala Leu 565 570 575 Arg Lys Glu Leu Ser Asp Gln Gly Asp Asp Ile Ala Ile Leu Thr His 580 585 590 Arg Leu Ile Lys Ser Arg His Arg Leu Gln Gln Ser Asn Ile Ala Leu 595 600 605 Ser Ala Ser Glu Ala Arg Trp Lys Ala Val Tyr Glu Asn Ser Ala Ala 610 615 620 Gly Ile Val Leu Thr Asp Pro Glu Asn Arg Ile Leu Asn Ala Asn Pro 625 630 635 640 Ala Phe Gln Arg Ile Thr Gly Tyr Gly Glu Lys Asp Leu Glu Gly Leu 645 650 655 Ser Met Glu Gln Leu Thr Pro Ser Asp Glu Ser Pro Gln Ile Lys Gln 660 665 670 Arg Leu Ala Asn Leu Leu Gln Gly Gly Gly Ala Glu Tyr Ser Val Glu 675 680 685 Arg Ser Tyr Leu Cys Lys Asn Gly Ser Thr Ile Trp Ala Asn Ala Ser 690 695 700 Val Ser Leu Met Pro Gln Arg Val Gly Glu Ser Pro Val Ile Leu Gln 705 710 715 720 Ile Ile Asp Asp Ile Thr Glu Lys Lys Gln Ala Gln Glu Asn Leu Asn 725 730 735 Gln Leu Gln Gln Gln Leu Val Tyr Val Ser Arg Ser Ala Thr Met Gly 740 745 750 Glu Phe Ala Ala Tyr Ile Ala His Glu Ile Asn Gln Pro Leu Ser Ala 755 760 765 Ile Met Thr Asn Ala Asn Ala Gly Thr Arg Trp Leu Gly Asn Glu Pro 770 775 780 Ser Asn Ile Pro Glu Ala Lys Glu Ala Leu Ala Arg Ile Ile Arg Asp 785 790 795 800 Ser Asp Arg Ala Ala Glu Ile Ile Arg Met Val Arg Ser Phe Leu Lys 805 810 815 Arg Gln Glu Thr Val Leu Lys Pro Ile Asp Leu Lys Ala Leu Val Thr 820 825 830 Asp Thr Ser Leu Ile Leu Lys Ala Pro Ser Gln Asn Asn Ser Val Asn 835 840 845 Leu Asp Val Val Ala Asp Asp Glu Leu Pro Glu Ile Trp Gly Asp Gly 850 855 860 Val Gln Ile Gln Gln Leu Ile Ile Asn Leu Ala Met Asn Ala Ile Glu 865 870 875 880 Ala Ile Ser Gln Ala Asp Cys Glu Thr Arg Gln Leu Thr Leu Ser Phe 885 890 895 Ser Gly Asn Asp Thr Gly Asp Ala Leu Val Ile Ser Val Lys Asp Thr 900 905 910 Gly Pro Gly Ile Ser Glu Arg Gln Met Ala Gln Leu Phe Asn Ala Phe 915 920 925 Tyr Thr Thr Lys Lys Glu Gly Leu Gly Met Gly Leu Ala Ile Cys Leu 930 935 940 Thr Ile Thr Glu Val His Asn Gly Lys Ile Trp Val Glu Cys Pro Pro 945 950 955 960 Ala Gly Gly Ala Cys Phe Leu Val Ser Ile Pro Ala Arg Gln Gly Ser 965 970 975 Gly Thr <210> 8 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> Q61R TodS <400> 8 Met Ser Ser Leu Asp Arg Lys Lys Pro Gln Asn Arg Ser Lys Asn Asn 1 5 10 15 Tyr Tyr Asn Ile Cys Leu Lys Glu Lys Gly Ser Glu Glu Leu Thr Cys 20 25 30 Glu Glu His Ala Arg Ile Ile Phe Asp Gly Leu Tyr Glu Phe Val Gly 35 40 45 Leu Leu Asp Ala His Gly Asn Val Leu Glu Val Asn Arg Val Ala Leu 50 55 60 Glu Gly Gly Gly Ile Thr Leu Glu Glu Ile Arg Gly Lys Pro Phe Trp 65 70 75 80 Lys Ala Arg Trp Trp Gln Ile Ser Lys Lys Thr Glu Ala Thr Gln Lys 85 90 95 Arg Leu Val Glu Thr Ala Ser Ser Gly Glu Phe Val Arg Cys Asp Val 100 105 110 Glu Ile Leu Gly Lys Ser Gly Gly Arg Glu Val Ile Ala Val Asp Phe 115 120 125 Ser Leu Leu Pro Ile Cys Asn Glu Glu Gly Ser Ile Val Tyr Leu Leu 130 135 140 Ala Glu Gly Arg Asn Ile Thr Asp Lys Lys Lys Ala Glu Ala Met Leu 145 150 155 160 Ala Leu Lys Asn Gln Glu Leu Glu Gln Ser Val Glu Cys Ile Arg Lys 165 170 175 Leu Asp Asn Ala Lys Ser Asp Phe Phe Ala Lys Val Ser His Glu Leu 180 185 190 Arg Thr Pro Leu Ser Leu Ile Leu Gly Pro Leu Glu Ala Val Met Ala 195 200 205 Ala Glu Ala Gly Arg Glu Ser Pro Tyr Trp Lys Gln Phe Glu Val Ile 210 215 220 Gln Arg Asn Ala Met Thr Leu Leu Lys Gln Val Asn Thr Leu Leu Asp 225 230 235 240 Leu Ala Lys Met Asp Ala Arg Gln Met Gly Leu Ser Tyr Arg Arg Ala 245 250 255 Asn Leu Ser Gln Leu Thr Arg Thr Ile Ser Ser Asn Phe Glu Gly Ile 260 265 270 Ala Gln Gln Lys Ser Ile Thr Phe Asp Thr Lys Leu Pro Val Gln Met 275 280 285 Val Ala Glu Val Asp Cys Glu Lys Tyr Glu Arg Ile Ile Leu Asn Leu 290 295 300 Leu Ser Asn Ala Phe Lys Phe Thr Pro Asp Gly Gly Leu Ile Arg Cys 305 310 315 320 Cys Leu Ser Leu Ser Arg Pro Asn Tyr Ala Leu Val Thr Val Ser Asp 325 330 335 Ser Gly Pro Gly Ile Pro Pro Ala Leu Arg Lys Glu Ile Phe Glu Arg 340 345 350 Phe His Gln Leu Ser Gln Glu Gly Gln Gln Ala Thr Arg Gly Thr Gly 355 360 365 Leu Gly Leu Ser Ile Val Lys Glu Phe Val Glu Leu His Arg Gly Thr 370 375 380 Ile Ser Val Ser Asp Ala Pro Gly Gly Gly Ala Leu Phe Gln Val Lys 385 390 395 400 Leu Pro Leu Asn Ala Pro Glu Gly Ala Tyr Val Ala Ser Asn Thr Ala 405 410 415 Pro Arg Arg Asp Asn Pro Gln Val Val Asp Thr Asp Glu Tyr Leu Leu 420 425 430 Leu Ala Pro Asn Ala Glu Asn Glu Ala Glu Val Leu Pro Phe Gln Ser 435 440 445 Asp Gln Pro Arg Val Leu Ile Val Glu Asp Asn Pro Asp Met Arg Gly 450 455 460 Phe Ile Lys Asp Cys Leu Ser Ser Asp Tyr Gln Val Tyr Val Ala Pro 465 470 475 480 Asp Gly Ala Lys Ala Leu Glu Leu Met Ser Asn Met Pro Pro Asp Leu 485 490 495 Leu Ile Thr Asp Leu Ile Met Pro Val Met Ser Gly Asp Met Leu Val 500 505 510 His Gln Val Arg Lys Lys Asn Glu Leu Ser His Ile Pro Ile Met Val 515 520 525 Leu Ser Ala Lys Ser Asp Ala Glu Leu Arg Val Lys Leu Leu Ser Glu 530 535 540 Ser Val Gln Asp Phe Leu Leu Lys Pro Phe Ser Ala His Glu Leu Arg 545 550 555 560 Ala Arg Val Ser Asn Leu Val Ser Met Lys Val Ala Gly Asp Ala Leu 565 570 575 Arg Lys Glu Leu Ser Asp Gln Gly Asp Asp Ile Ala Ile Leu Thr His 580 585 590 Arg Leu Ile Lys Ser Arg His Arg Leu Gln Gln Ser Asn Ile Ala Leu 595 600 605 Ser Ala Ser Glu Ala Arg Trp Lys Ala Val Tyr Glu Asn Ser Ala Ala 610 615 620 Gly Ile Val Leu Thr Asp Pro Glu Asn Arg Ile Leu Asn Ala Asn Pro 625 630 635 640 Ala Phe Gln Arg Ile Thr Gly Tyr Gly Glu Lys Asp Leu Glu Gly Leu 645 650 655 Ser Met Glu Gln Leu Thr Pro Ser Asp Glu Ser Pro Gln Ile Lys Gln 660 665 670 Arg Leu Ala Asn Leu Leu Gln Gly Gly Gly Ala Glu Tyr Ser Val Glu 675 680 685 Arg Ser Tyr Leu Cys Lys Asn Gly Ser Thr Ile Trp Ala Asn Ala Ser 690 695 700 Val Ser Leu Met Pro Gln Arg Val Gly Glu Ser Pro Val Ile Leu Gln 705 710 715 720 Ile Ile Asp Asp Ile Thr Glu Lys Lys Gln Ala Gln Glu Asn Leu Asn 725 730 735 Gln Leu Gln Gln Gln Leu Val Tyr Val Ser Arg Ser Ala Thr Met Gly 740 745 750 Glu Phe Ala Ala Tyr Ile Ala His Glu Ile Asn Gln Pro Leu Ser Ala 755 760 765 Ile Met Thr Asn Ala Asn Ala Gly Thr Arg Trp Leu Gly Asn Glu Pro 770 775 780 Ser Asn Ile Pro Glu Ala Lys Glu Ala Leu Ala Arg Ile Ile Arg Asp 785 790 795 800 Ser Asp Arg Ala Ala Glu Ile Ile Arg Met Val Arg Ser Phe Leu Lys 805 810 815 Arg Gln Glu Thr Val Leu Lys Pro Ile Asp Leu Lys Ala Leu Val Thr 820 825 830 Asp Thr Ser Leu Ile Leu Lys Ala Pro Ser Gln Asn Asn Ser Val Asn 835 840 845 Leu Asp Val Val Ala Asp Asp Glu Leu Pro Glu Ile Trp Gly Asp Gly 850 855 860 Val Gln Ile Gln Gln Leu Ile Ile Asn Leu Ala Met Asn Ala Ile Glu 865 870 875 880 Ala Ile Ser Gln Ala Asp Cys Glu Thr Arg Gln Leu Thr Leu Ser Phe 885 890 895 Ser Gly Asn Asp Thr Gly Asp Ala Leu Val Ile Ser Val Lys Asp Thr 900 905 910 Gly Pro Gly Ile Ser Glu Arg Gln Met Ala Gln Leu Phe Asn Ala Phe 915 920 925 Tyr Thr Thr Lys Lys Glu Gly Leu Gly Met Gly Leu Ala Ile Cys Leu 930 935 940 Thr Ile Thr Glu Val His Asn Gly Lys Ile Trp Val Glu Cys Pro Pro 945 950 955 960 Ala Gly Gly Ala Cys Phe Leu Val Ser Ile Pro Ala Arg Gln Gly Ser 965 970 975 Gly Thr <210> 9 <211> 227 <212> PRT <213> Pseudomonas putida F1 <400> 9 Val Pro Ala Arg Trp Gly Cys Leu Phe Pro Gly Lys Tyr Pro Cys Gln 1 5 10 15 Thr Gly Leu Arg His Met Ser Asp Arg Ala Ser Val Ile Tyr Ile Leu 20 25 30 Asp Asp Asp Asn Ala Val Leu Glu Ala Leu Ser Ser Leu Val Arg Ser 35 40 45 Ile Gly Leu Ser Val Glu Cys Phe Ser Ser Ala Ser Val Phe Leu Asn 50 55 60 Asp Val Asn Arg Ser Ala Cys Gly Cys Leu Ile Leu Asp Val Arg Met 65 70 75 80 Pro Glu Met Ser Gly Leu Asp Val Gln Arg Gln Leu Lys Glu Leu Gly 85 90 95 Glu Gln Ile Pro Ile Ile Phe Ile Ser Gly His Gly Asp Ile Pro Met 100 105 110 Ala Val Lys Ala Ile Lys Ala Gly Ala Val Asp Phe Phe Thr Lys Pro 115 120 125 Phe Arg Glu Glu Glu Leu Leu Gly Ala Ile Arg Ala Ala Leu Lys Leu 130 135 140 Ala Pro Gln Gln Arg Ser Asn Ala Pro Arg Val Ser Glu Leu Lys Glu 145 150 155 160 Asn Tyr Glu Ser Leu Ser Lys Arg Glu Gln Gln Val Leu Lys Phe Val 165 170 175 Leu Arg Gly Tyr Leu Asn Lys Gln Thr Ala Leu Glu Leu Asp Ile Ser 180 185 190 Glu Ala Thr Val Lys Val His Arg His Asn Ile Met Arg Lys Met Lys 195 200 205 Val Ser Ser Ile Gln Asp Leu Val Arg Val Thr Glu Arg Leu Lys Asp 210 215 220 Ser Leu Glu 225 <210> 10 <211> 684 <212> DNA <213> Pseudomonas putida F1 <400> 10 gtgcccgccc gctgggggtg cttgtttcct ggtaagtatc cctgccagac agggctccgg 60 cacatgagtg atcgggcatc tgttatctat atcctcgatg acgacaatgc agtactggaa 120 gcactgagca gcttggtgcg ttcaatcggc ctgagtgtcg agtgtttttc atccgctagc 180 gtattcctga acgatgtcaa tcgctctgcc tgtggctgtc taattttgga tgtccgtatg 240 cccgagatga gcgggttgga tgtgcaacga caactgaaag agcttggcga gcaaatcccc 300 attattttta tcagcggcca cggtgatatt ccgatggcag tcaaagcgat caaggcgggt 360 gcggtagact tcttcactaa accttttcga gaagaggagc tgcttggcgc tattcgcgcc 420 gcgctgaagt tggcgcccca gcagagatca aacgctcccc gagtcagcga gcttaaagag 480 aattacgaaa gcctcagcaa acgcgagcaa caggtgctta agttcgtctt gcgaggatat 540 ctaaacaagc agacggctct agagcttgat atatcggaag caacagtgaa agtgcaccgc 600 cataatatca tgaggaaaat gaaagtatct tcaatccagg atctggttcg agtaactgag 660 cggctcaagg atagcctgga atag 684 <210> 11 <211> 366 <212> DNA <213> Pseudomonas putida F1 <400> 11 ccgggatcaa cgcattgagc gccaccagca tgttcaggtc tgaggttttc atcgacatca 60 ggttatcaac ctgctcgtgg acctgaggga aactgccgtg gcggcgacgg ggcttgcgcg 120 taagcccccg ctatacgacc agcctgttcg aaagccgcaa agtgcttagg tttgggtgca 180 tatccatcag aagcggcata aaccatcgtt tatcacagtt aaactttggt tttctaagtt 240 gcgatagcca tataaaccca taagccaaaa aacaatattt cccagggcgt gattgtaata 300 ctgtgcgtgc tctaaggcgg tgtttgccta cttcacttta taaaaaaaat aagatgtgga 360 aggaga 366 <210> 12 <211> 1024 <212> PRT <213> Artificial Sequence <220> <223> beta galactosidase <400> 12 Met Thr Met Ile Thr Asp Ser Leu Ala Val Val Leu Gln Arg Arg Asp 1 5 10 15 Trp Glu Asn Pro Gly Val Thr Gln Leu Asn Arg Leu Ala Ala His Pro 20 25 30 Pro Phe Ala Ser Trp Arg Asn Ser Glu Glu Ala Arg Thr Asp Arg Pro 35 40 45 Ser Gln Gln Leu Arg Ser Leu Asn Gly Glu Trp Arg Phe Ala Trp Phe 50 55 60 Pro Ala Pro Glu Ala Val Pro Glu Ser Trp Leu Glu Cys Asp Leu Pro 65 70 75 80 Glu Ala Asp Thr Val Val Val Pro Ser Asn Trp Gln Met His Gly Tyr 85 90 95 Asp Ala Pro Ile Tyr Thr Asn Val Thr Tyr Pro Ile Thr Val Asn Pro 100 105 110 Pro Phe Val Pro Thr Glu Asn Pro Thr Gly Cys Tyr Ser Leu Thr Phe 115 120 125 Asn Val Asp Glu Ser Trp Leu Gln Glu Gly Gln Thr Arg Ile Ile Phe 130 135 140 Asp Gly Val Asn Ser Ala Phe His Leu Trp Cys Asn Gly Arg Trp Val 145 150 155 160 Gly Tyr Gly Gln Asp Ser Arg Leu Pro Ser Glu Phe Asp Leu Ser Ala 165 170 175 Phe Leu Arg Ala Gly Glu Asn Arg Leu Ala Val Met Val Leu Arg Trp 180 185 190 Ser Asp Gly Ser Tyr Leu Glu Asp Gln Asp Met Trp Arg Met Ser Gly 195 200 205 Ile Phe Arg Asp Val Ser Leu Leu His Lys Pro Thr Thr Gln Ile Ser 210 215 220 Asp Phe His Val Ala Thr Arg Phe Asn Asp Asp Phe Ser Arg Ala Val 225 230 235 240 Leu Glu Ala Glu Val Gln Met Cys Gly Glu Leu Arg Asp Tyr Leu Arg 245 250 255 Val Thr Val Ser Leu Trp Gln Gly Glu Thr Gln Val Ala Ser Gly Thr 260 265 270 Ala Pro Phe Gly Gly Glu Ile Ile Asp Glu Arg Gly Gly Tyr Ala Asp 275 280 285 Arg Val Thr Leu Arg Leu Asn Val Glu Asn Pro Lys Leu Trp Ser Ala 290 295 300 Glu Ile Pro Asn Leu Tyr Arg Ala Val Val Glu Leu His Thr Ala Asp 305 310 315 320 Gly Thr Leu Ile Glu Ala Glu Ala Cys Asp Val Gly Phe Arg Glu Val 325 330 335 Arg Ile Glu Asn Gly Leu Leu Leu Leu Asn Gly Lys Pro Leu Leu Ile 340 345 350 Arg Gly Val Asn Arg His Glu His His Pro Leu His Gly Gln Val Met 355 360 365 Asp Glu Gln Thr Met Val Gln Asp Ile Leu Leu Met Lys Gln Asn Asn 370 375 380 Phe Asn Ala Val Arg Cys Ser His Tyr Pro Asn His Pro Leu Trp Tyr 385 390 395 400 Thr Leu Cys Asp Arg Tyr Gly Leu Tyr Val Val Asp Glu Ala Asn Ile 405 410 415 Glu Thr His Gly Met Val Pro Met Asn Arg Leu Thr Asp Asp Pro Arg 420 425 430 Trp Leu Pro Ala Met Ser Glu Arg Val Thr Arg Met Val Gln Arg Asp 435 440 445 Arg Asn His Pro Ser Val Ile Ile Trp Ser Leu Gly Asn Glu Ser Gly 450 455 460 His Gly Ala Asn His Asp Ala Leu Tyr Arg Trp Ile Lys Ser Val Asp 465 470 475 480 Pro Ser Arg Pro Val Gln Tyr Glu Gly Gly Gly Ala Asp Thr Thr Ala 485 490 495 Thr Asp Ile Ile Cys Pro Met Tyr Ala Arg Val Asp Glu Asp Gln Pro 500 505 510 Phe Pro Ala Val Pro Lys Trp Ser Ile Lys Lys Trp Leu Ser Leu Pro 515 520 525 Gly Glu Thr Arg Pro Leu Ile Leu Cys Glu Tyr Ala His Ala Met Gly 530 535 540 Asn Ser Leu Gly Gly Phe Ala Lys Tyr Trp Gln Ala Phe Arg Gln Tyr 545 550 555 560 Pro Arg Leu Gln Gly Gly Phe Val Trp Asp Trp Val Asp Gln Ser Leu 565 570 575 Ile Lys Tyr Asp Glu Asn Gly Asn Pro Trp Ser Ala Tyr Gly Gly Asp 580 585 590 Phe Gly Asp Thr Pro Asn Asp Arg Gln Phe Cys Met Asn Gly Leu Val 595 600 605 Phe Ala Asp Arg Thr Pro His Pro Ala Leu Thr Glu Ala Lys His Gln 610 615 620 Gln Gln Phe Phe Gln Phe Arg Leu Ser Gly Gln Thr Ile Glu Val Thr 625 630 635 640 Ser Glu Tyr Leu Phe Arg His Ser Asp Asn Glu Leu Leu His Trp Met 645 650 655 Val Ala Leu Asp Gly Lys Pro Leu Ala Ser Gly Glu Val Pro Leu Asp 660 665 670 Val Ala Pro Gln Gly Lys Gln Leu Ile Glu Leu Pro Glu Leu Pro Gln 675 680 685 Pro Glu Ser Ala Gly Gln Leu Trp Leu Thr Val Arg Val Val Gln Pro 690 695 700 Asn Ala Thr Ala Trp Ser Glu Ala Gly His Ile Ser Ala Trp Gln Gln 705 710 715 720 Trp Arg Leu Ala Glu Asn Leu Ser Val Thr Leu Pro Ala Ala Ser His 725 730 735 Ala Ile Pro His Leu Thr Thr Ser Glu Met Asp Phe Cys Ile Glu Leu 740 745 750 Gly Asn Lys Arg Trp Gln Phe Asn Arg Gln Ser Gly Phe Leu Ser Gln 755 760 765 Met Trp Ile Gly Asp Lys Lys Gln Leu Leu Thr Pro Leu Arg Asp Gln 770 775 780 Phe Thr Arg Ala Pro Leu Asp Asn Asp Ile Gly Val Ser Glu Ala Thr 785 790 795 800 Arg Ile Asp Pro Asn Ala Trp Val Glu Arg Trp Lys Ala Ala Gly His 805 810 815 Tyr Gln Ala Glu Ala Ala Leu Leu Gln Cys Thr Ala Asp Thr Leu Ala 820 825 830 Asp Ala Val Leu Ile Thr Thr Ala His Ala Trp Gln His Gln Gly Lys 835 840 845 Thr Leu Phe Ile Ser Arg Lys Thr Tyr Arg Ile Asp Gly Ser Gly Gln 850 855 860 Met Ala Ile Thr Val Asp Val Glu Val Ala Ser Asp Thr Pro His Pro 865 870 875 880 Ala Arg Ile Gly Leu Asn Cys Gln Leu Ala Gln Val Ala Glu Arg Val 885 890 895 Asn Trp Leu Gly Leu Gly Pro Gln Glu Asn Tyr Pro Asp Arg Leu Thr 900 905 910 Ala Ala Cys Phe Asp Arg Trp Asp Leu Pro Leu Ser Asp Met Tyr Thr 915 920 925 Pro Tyr Val Phe Pro Ser Glu Asn Gly Leu Arg Cys Gly Thr Arg Glu 930 935 940 Leu Asn Tyr Gly Pro His Gln Trp Arg Gly Asp Phe Gln Phe Asn Ile 945 950 955 960 Ser Arg Tyr Ser Gln Gln Gln Leu Met Glu Thr Ser His Arg His Leu 965 970 975 Leu His Ala Glu Glu Gly Thr Trp Leu Asn Ile Asp Gly Phe His Met 980 985 990 Gly Ile Gly Gly Asp Asp Ser Trp Ser Pro Ser Val Ser Ala Glu Phe 995 1000 1005 Gln Leu Ser Ala Gly Arg Tyr His Tyr Gln Leu Val Trp Cys Gln Lys 1010 1015 1020 <210> 13 <211> 3075 <212> DNA <213> Artificial Sequence <220> <223> beta galactosidase <400> 13 atgaccatga ttacggattc actggccgtc gttttacaac gtcgtgactg ggaaaaccct 60 ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc 120 gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc 180 tttgcctggt ttccggcacc agaagcggtg ccggaaagct ggctggagtg cgatcttcct 240 gaggccgata ctgtcgtcgt cccctcaaac tggcagatgc acggttacga tgcgcccatc 300 tacaccaacg tgacctatcc cattacggtc aatccgccgt ttgttcccac ggagaatccg 360 acgggttgtt actcgctcac atttaatgtt gatgaaagct ggctacagga aggccagacg 420 cgaattattt ttgatggcgt taactcggcg tttcatctgt ggtgcaacgg gcgctgggtc 480 ggttacggcc aggacagtcg tttgccgtct gaatttgacc tgagcgcatt tttacgcgcc 540 ggagaaaacc gcctcgcggt gatggtgctg cgctggagtg acggcagtta tctggaagat 600 caggatatgt ggcggatgag cggcattttc cgtgacgtct cgttgctgca taaaccgact 660 acacaaatca gcgatttcca tgttgccact cgctttaatg atgatttcag ccgcgctgta 720 ctggaggctg aagttcagat gtgcggcgag ttgcgtgact acctacgggt aacagtttct 780 ttatggcagg gtgaaacgca ggtcgccagc ggcaccgcgc ctttcggcgg tgaaattatc 840 gatgagcgtg gtggttatgc cgatcgcgtc acactacgtc tgaacgtcga aaacccgaaa 900 ctgtggagcg ccgaaatccc gaatctctat cgtgcggtgg ttgaactgca caccgccgac 960 ggcacgctga ttgaagcaga agcctgcgat gtcggtttcc gcgaggtgcg gattgaaaat 1020 ggtctgctgc tgctgaacgg caagccgttg ctgattcgag gcgttaaccg tcacgagcat 1080 catcctctgc atggtcaggt catggatgag cagacgatgg tgcaggatat cctgctgatg 1140 aagcagaaca actttaacgc cgtgcgctgt tcgcattatc cgaaccatcc gctgtggtac 1200 acgctgtgcg accgctacgg cctgtatgtg gtggatgaag ccaatattga aacccacggc 1260 atggtgccaa tgaatcgtct gaccgatgat ccgcgctggc taccggcgat gagcgaacgc 1320 gtaacgcgaa tggtgcagcg cgatcgtaat cacccgagtg tgatcatctg gtcgctgggg 1380 aatgaatcag gccacggcgc taatcacgac gcgctgtatc gctggatcaa atctgtcgat 1440 ccttcccgcc cggtgcagta tgaaggcggc ggagccgaca ccacggccac cgatattatt 1500 tgcccgatgt acgcgcgcgt ggatgaagac cagcccttcc cggctgtgcc gaaatggtcc 1560 atcaaaaaat ggctttcgct acctggagag acgcgcccgc tgatcctttg cgaatacgcc 1620 cacgcgatgg gtaacagtct tggcggtttc gctaaatact ggcaggcgtt tcgtcagtat 1680 ccccgtttac agggcggctt cgtctgggac tgggtggatc agtcgctgat taaatatgat 1740 gaaaacggca acccgtggtc ggcttacggc ggtgattttg gcgatacgcc gaacgatcgc 1800 cagttctgta tgaacggtct ggtctttgcc gaccgcacgc cgcatccagc gctgacggaa 1860 gcaaaacacc agcagcagtt tttccagttc cgtttatccg ggcaaaccat cgaagtgacc 1920 agcgaatacc tgttccgtca tagcgataac gagctcctgc actggatggt ggcgctggat 1980 ggtaagccgc tggcaagcgg tgaagtgcct ctggatgtcg ctccacaagg taaacagttg 2040 attgaactgc ctgaactacc gcagccggag agcgccgggc aactctggct cacagtacgc 2100 gtagtgcaac cgaacgcgac cgcatggtca gaagccgggc acatcagcgc ctggcagcag 2160 tggcgtctgg cggaaaacct cagtgtgacg ctccccgccg cgtcccacgc catcccgcat 2220 ctgaccacca gcgaaatgga tttttgcatc gagctgggta ataagcgttg gcaatttaac 2280 cgccagtcag gctttctttc acagatgtgg attggcgata aaaaacaact gctgacgccg 2340 ctgcgcgatc agttcacccg tgcaccgctg gataacgaca ttggcgtaag tgaagcgacc 2400 cgcattgacc ctaacgcctg ggtcgaacgc tggaaggcgg cgggccatta ccaggccgaa 2460 gcagcgttgt tgcagtgcac ggcagataca cttgctgatg cggtgctgat tacgaccgct 2520 cacgcgtggc agcatcaggg gaaaacctta tttatcagcc ggaaaaccta ccggattgat 2580 ggtagtggtc aaatggcgat taccgttgat gttgaagtgg cgagcgatac accgcatccg 2640 gcgcggattg gcctgaactg ccagctggcg caggtagcag agcgggtaaa ctggctcgga 2700 ttagggccgc aagaaaacta tcccgaccgc cttactgccg cctgttttga ccgctgggat 2760 ctgccattgt cagacatgta taccccgtac gtcttcccga gcgaaaacgg tctgcgctgc 2820 gggacgcgcg aattgaatta tggcccacac cagtggcgcg gcgacttcca gttcaacatc 2880 agccgctaca gtcaacagca actgatggaa accagccatc gccatctgct gcacgcggaa 2940 gaaggcacat ggctgaatat cgacggtttc catatgggga ttggtggcga cgactcctgg 3000 agcccgtcag tatcggcgga attccagctg agcgccggtc gctaccatta ccagttggtc 3060 tggtgtcaaa aataa 3075 <210> 14 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> TodST-F <400> 14 aaaggatcca ggagacatat gagctccttg gata 34 <210> 15 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> TodST-R <400> 15 tataagcttc tattccaggc tatcctt 27 <210> 16 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> TodSTpp-u <400> 16 tatatgcatc tcgagaaacg agcccagtac 30 <210> 17 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> TodSTpp-m <400> 17 ccctctagaa gcttgctatt acctctcttc cacc 34 <210> 18 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> mexCn-u <400> 18 aaagaattcg caagacaggt tcgataaggg tg 32 <210> 19 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> mexCn-d <400> 19 aaaggatcca atgcgcccgg agatcgg 27 <210> 20 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> mexCc-u <400> 20 aaaggatccg atatccagca actcgacccg 30 <210> 21 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> mexCc-d <400> 21 tttgcatgcg tttctgcgca ggcgcaacg 29 <210> 22 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Sm-N <400> 22 aaaggatcca agcttgaacc ttgaccgaac gca 33 <210> 23 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Sm-C <400> 23 ataggatcct tatttgccga ctaccttggt gatc 34 <210> 24 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> PAS1(23) NcoI-F <400> 24 caaccatggg aaaggagaaa ggatctgaag 30 <210> 25 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> PAS1(43) NcoI-F <400> 25 caaccatggc gctctacgag tttgtg 26 <210> 26 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> PAS1(168) XhoI-R <400> 26 caactcgagt cactccaatt cctggttctt c 31 <210> 27 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> TodS(23) BamHI-F <400> 27 caaggatccg atgaaggaga aaggatctg 29 <210> 28 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> TodS(978) XhoI-R <400> 28 ccgctcgagt gtgccggagc cctgtctgg 29 <210> 29 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> L71M-F <400> 29 tggagggggg cgggattact atggaagaaa tacgagggaa g 41 <210> 30 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> L71M-R <400> 30 cttccctcgt atttcttcca tagtaatccc gcccccctcc a 41 <210> 31 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> F46A-F2 <400> 31 gatgggctct acgaggccgt gggccttctt gatg 34 <210> 32 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> F46A-R2 <400> 32 catcaagaag gcccacggcc tcgtagagcc catc 34 <210> 33 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> F46A_F <400> 33 gcgccatggc gctctacgag gctgtgggcc ttcttgatgc tc 42 <210> 34 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> F46A_R <400> 34 gagcatcaag aaggcccaca gcctcgtaga gcgccatggc gc 42 <210> 35 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> F46S_F <400> 35 cgccatggcg ctctacgagt ctgtgggcct tcttgatgct c 41 <210> 36 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> F46S_R <400> 36 gagcatcaag aaggcccaca gactcgtaga gcgccatggc g 41 <210> 37 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> V47A-F <400> 37 gatgggctct acgagtttgc gggccttctt gatgctcatg 40 <210> 38 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> V47A-R <400> 38 catgagcatc aagaaggccc gcaaactcgt agagcccatc 40 <210> 39 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> V47L-F <400> 39 gatgggctct acgagtttct gggccttctt gatgctc 37 <210> 40 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> V47L-R <400> 40 gagcatcaag aaggcccaga aactcgtaga gcccatc 37 <210> 41 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> L49A-F <400> 41 ggctctacga gtttgtgggc gctcttgatg ctcatggaaa tg 42 <210> 42 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> L49A-R <400> 42 catttccatg agcatcaaga gcgcccacaa actcgtagag cc 42 <210> 43 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> L49D-F <400> 43 ggctctacga gtttgtgggc gatcttgatg ctcatggaaa tg 42 <210> 44 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> L49D-R <400> 44 catttccatg agcatcaaga tcgcccacaa actcgtagag cc 42 <210> 45 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> E58A-F <400> 45 gctcatggaa atgtgcttgc agtgaaccag gtcgcattg 39 <210> 46 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> E58A-R <400> 46 caatgcgacc tggttcactg caagcacatt tccatgagc 39 <210> 47 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> E58S-F <400> 47 gctcatggaa atgtgctttc agtgaaccag gtcgcattg 39 <210> 48 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> E58S-R <400> 48 caatgcgacc tggttcactg aaagcacatt tccatgagc 39 <210> 49 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> V59F_F <400> 49 ctcatggaaa tgtgcttgaa tttaaccagg tcgcattgga ggg 43 <210> 50 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> V59F_R <400> 50 ccctccaatg cgacctggtt aaattcaagc acatttccat gag 43 <210> 51 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> V59D_F <400> 51 ctcatggaaa tgtgcttgaa gataaccagg tcgcattgga gggg 44 <210> 52 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> V59D_R <400> 52 cccctccaat gcgacctggt tatcttcaag cacatttcca tgag 44 <210> 53 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> V59A_F <400> 53 ctcatggaaa tgtgcttgaa gcgaaccagg tcgcattgga ggg 43 <210> 54 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> V59A_R <400> 54 ccctccaatg cgacctggtt cgcttcaagc acatttccat gag 43 <210> 55 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Q61L-F <400> 55 gtgcttgaag tgaacctggt cgcattggag gg 32 <210> 56 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Q61L-R <400> 56 ccctccaatg cgaccaggtt cacttcaagc ac 32 <210> 57 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Q61R-F <400> 57 gtgcttgaag tgaaccgagt cgcattggag gggg 34 <210> 58 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Q61R-R <400> 58 ccccctccaa tgcgactcgg ttcacttcaa gcac 34 <210> 59 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Q61A-F <400> 59 gtgcttgaag tgaacgcagt cgcattggag gggg 34 <210> 60 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Q61A-R <400> 60 ccccctccaa tgcgactgcg ttcacttcaa gcac 34 <210> 61 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> A63V_F <400> 61 gcttgaagtg aaccaggtcg tattggaggg gggcgggatt a 41 <210> 62 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> A63V_R <400> 62 taatcccgcc cccctccaat acgacctggt tcacttcaag c 41 <210> 63 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> A63S_F <400> 63 gtgcttgaag tgaaccaggt ctcattggag gggggcggga tta 43 <210> 64 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> A63S_R <400> 64 taatcccgcc cccctccaat gagacctggt tcacttcaag cac 43 <210> 65 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> F79Y_F <400> 65 gaaatacgag ggaagccata ctggaaggcg cgttggtgg 39 <210> 66 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> F79Y_R <400> 66 ccaccaacgc gccttccagt atggcttccc tcgtatttc 39 <210> 67 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> F79E_F <400> 67 gaaatacgag ggaagccaga gtggaaggcg cgttggtgg 39 <210> 68 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> F79E_R <400> 68 ccaccaacgc gccttccact ctggcttccc tcgtatttc 39 <210> 69 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> F79L_F <400> 69 gaagaaatac gagggaagcc actctggaag gcgcgttggt ggc 43 <210> 70 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> F79L_R <400> 70 gccaccaacg cgccttccag agtggcttcc ctcgtatttc ttc 43 <210> 71 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> W84V_F <400> 71 gaagccattc tggaaggcgc gtgtgtggca aatttcaaaa aaaacc 46 <210> 72 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> W84V_R <400> 72 ggtttttttt gaaatttgcc acacacgcgc cttccagaat ggcttc 46 <210> 73 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> W84R_F <400> 73 gaagccattc tggaaggcgc gtcgttggca aatttcaaaa aaaaccg 47 <210> 74 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> W84R_R <400> 74 cggttttttt tgaaatttgc caacgacgcg ccttccagaa tggcttc 47 <210> 75 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> W84H_F <400> 75 gaagccattc tggaaggcgc gtcattggca aatttcaaaa aaaaccg 47 <210> 76 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> W84H_R <400> 76 cggttttttt tgaaatttgc caatgacgcg ccttccagaa tggcttc 47 <210> 77 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> W85H_F <400> 77 ccattctgga aggcgcgttg gcatcaaatt tcaaaaaaaa ccgag 45 <210> 78 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> W85H_R <400> 78 ctcggttttt tttgaaattt gatgccaacg cgccttccag aatgg 45 <210> 79 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> W85R_F <400> 79 ccattctgga aggcgcgttg gcgtcaaatt tcaaaaaaaa ccgag 45 <210> 80 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> W85R_R <400> 80 ctcggttttt tttgaaattt gacgccaacg cgccttccag aatgg 45 <210> 81 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> W85L_F <400> 81 gccattctgg aaggcgcgtt ggctgcaaat ttcaaaaaaa accgag 46 <210> 82 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> W85L_R <400> 82 ctcggttttt tttgaaattt gcagccaacg cgccttccag aatggc 46 <210> 83 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> I114V_F <400> 83 gaatttgttc gctgtgatgt tgaggttctt ggaaaatcag gtggaagag 49 <210> 84 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> I114V_R <400> 84 ctcttccacc tgattttcca agaacctcaa catcacagcg aacaaattc 49 <210> 85 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> I114F_F <400> 85 gaatttgttc gctgtgatgt tgagtttctt ggaaaatcag gtggaagag 49 <210> 86 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> I114F_R <400> 86 ctcttccacc tgattttcca agaaactcaa catcacagcg aacaaattc 49 <210> 87 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> I114S_F <400> 87 gaatttgttc gctgtgatgt tgagagcctt ggaaaatcag gtggaagaga gg 52 <210> 88 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> I114S_R <400> 88 cctctcttcc acctgatttt ccaaggctct caacatcaca gcgaacaaat tc 52 <210> 89 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> V126A_F <400> 89 caggtggaag agaggtaata gccgccgatt tttcattgct gccaatttg 49 <210> 90 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> V126A_R <400> 90 caaattggca gcaatgaaaa atcggcggct attacctctc ttccacctg 49 <210> 91 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> V126S_F <400> 91 ggtggaagag aggtaatagc cagcgatttt tcattgctgc caat 44 <210> 92 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> V126S_R <400> 92 attggcagca atgaaaaatc gctggctatt acctctcttc cacc 44 <210> 93 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> V126L_F <400> 93 ggtggaagag aggtaatagc cctcgatttt tcattgctgc caa 43 <210> 94 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> V126L_R <400> 94 ttggcagcaa tgaaaaatcg agggctatta cctctcttcc acc 43 <210> 95 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> F128E_F <400> 95 gaggtaatag ccgtcgatga atcattgctg ccaatttgc 39 <210> 96 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> F128E_R <400> 96 gcaaattggc agcaatgatt catcgacggc tattacctc 39 <210> 97 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> F128H_F <400> 97 gaagagaggt aatagccgtc gatcattcat tgctgccaat ttgcaatg 48 <210> 98 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> F128H_R <400> 98 cattgcaaat tggcagcaat gaatgatcga cggctattac ctctcttc 48 <210> 99 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> F128L_F <400> 99 gagaggtaat agccgtcgat ctttcattgc tgccaatttg c 41 <210> 100 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> F128L_R <400> 100 gcaaattggc agcaatgaaa gatcgacggc tattacctct c 41 <210> 101 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> F128D-F <400> 101 gagaggtaat agccgtcgat gactcattgc tgccaatttg caa 43 <210> 102 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> F128D-R <400> 102 ttgcaaattg gcagcaatga gtcatcgacg gctattacct ctc 43 <210> 103 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> F128S-F <400> 103 gagaggtaat agccgtcgat tcgtcattgc tgccaatttg caa 43 <210> 104 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> F128S-R <400> 104 ttgcaaattg gcagcaatga cgaatcgacg gctattacct ctc 43 <210> 105 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> A145S_F <400> 105 ggagcattgt ttaccttctt tcggaagggc gcaatattac c 41 <210> 106 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> A145S_R <400> 106 ggtaatattg cgcccttccg aaagaaggta aacaatgctc c 41 <210> 107 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> A145V_F <400> 107 gagcattgtt taccttcttg tggaagggcg caatattacc g 41 <210> 108 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> A145V_R <400> 108 cggtaatatt gcgcccttcc acaagaaggt aaacaatgct c 41 <210> 109 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> L131D_F <400> 109 atagccgtcg atttttcatt ggatccaatt tgcaatgaag aaggg 45 <210> 110 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> L131D_R <400> 110 cccttcttca ttgcaaattg gatccaatga aaaatcgacg gctat 45 <210> 111 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> E146A-F <400> 111 cattgtttac cttcttgcgg cagggcgcaa tattaccgat aa 42 <210> 112 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> E146A-R <400> 112 ttatcggtaa tattgcgccc tgccgcaaga aggtaaacaa tg 42 <210> 113 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> E146L-F <400> 113 cattgtttac cttcttgcgc tggggcgcaa tattaccgat aa 42 <210> 114 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> E146L-R <400> 114 ttatcggtaa tattgcgccc cagcgcaaga aggtaaacaa tg 42 <210> 115 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> R148A-F <400> 115 ccttcttgcg gaaggggcaa atattaccga taagaag 37 <210> 116 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> R148A-R <400> 116 cttcttatcg gtaatatttg ccccttccgc aagaagg 37 <210> 117 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> R148M-F <400> 117 ccttcttgcg gaagggatga atattaccga taagaag 37 <210> 118 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> R148M-R <400> 118 cttcttatcg gtaatattca tcccttccgc aagaagg 37 <210> 119 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> YE619620AA-F <400> 119 gcgcgttgga aagcagtggc cgccaactct gcggccggta ttg 43 <210> 120 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> YE619620AA-R <400> 120 caataccggc cgcagagttg gcggccactg ctttccaacg cgc 43 <210> 121 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> 617-623D-F <400> 121 ccgcctcgga agcgcgttgg aaagccggta ttgtactgac cgacc 45 <210> 122 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> 617-623D-R <400> 122 ggtcggtcag tacaataccg gctttccaac gcgcttccga ggcgg 45 <210> 123 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> E666A-F <400> 123 ctgactccat ctgacgcaag cccacagata aagc 34 <210> 124 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> E666A-R <400> 124 gctttatctg tgggcttgcg tcagatggag tcag 34 <210> 125 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> L674A-F <400> 125 cagataaagc agcgtgcagc caatttgctt cag 33 <210> 126 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> L674A-R <400> 126 ctgaagcaaa ttggctgcac gctgctttat ctg 33 <210> 127 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Y691I-F <400> 127 cagtgtggag cgctccattc tatgcaaaaa tggttc 36 <210> 128 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Y691I-R <400> 128 gaaccatttt tgcatagaat ggagcgctcc acactg 36 <210> 129 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> A703S-F <400> 129 ctacgatttg ggccaattcg agtgtctcgc tgatg 35 <210> 130 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> A703S-R <400> 130 catcagcgag acactcgaat tggcccaaat cgtag 35

Claims

서열번호 1의 TodS 단백질에서, 하기 (a) 내지 (w)로 이루어진 군에서 선택되는 하나 이상의 변이를 가지는 TodS 변이 단백질;
(a) 46번 페닐알라닌을 알라닌 또는 세린으로 치환
(b) 47번 발린을 알라닌 또는 류신으로 치환,
(c) 49번 류신을 아스파틱산 또는 알라닌으로 치환,
(d) 58번 글루탐산을 알라닌 또는 세린으로 치환,
(e) 61번 글루타민을 류신, 알지닌 또는 알라닌으로 치환,
(f) 63번 알라닌을 발린 또는 세린으로 치환,
(g) 79번 페닐알라닌을 타이로신, 글루탐산 또는 류신으로 치환,
(h) 84번 트립토판을 발린, 히스티딘 또는 알지닌으로 치환,
(i) 85번 트립토판을 히스티딘, 알지닌, 또는 류신으로 치환,
(j) 114번 아이소류신이 발린으로 치환,
(k) 131번 류신을 아스파틱산으로 치환,
(l) 146번 글루탐산을 알라닌 또는 류신으로 치환,
(m) 148번 알지닌을 알라닌 또는 메티오닌으로 치환,
(n) 619번 타이로신 및 620번 글루탐산을 알라닌으로 치환,
(o) 617번 내지 623번 아미노산의 결손.
제1항에 있어서, 서열번호 1의 TodS 단백질에서 114번 아이소류신이 발린으로 치환된 TodS 변이 단백질은 톨루엔 및 m-자일렌으로 이루어진 군에서 선택되는 하나 이상의 방향족 탄화수소 감지 센서용인 것인, TodS 변이 단백질.
제1항에 있어서, 서열번호 1의 TodS 단백질에서 61번 글루타민이 알지닌으로 치환된 TodS 변이 단백질은 톨루엔, 스티렌, m-자일렌, o-자일렌 및 1,2,4-TMB(1,2,4-Trimethylbenzene)으로 이루어진 군에서 선택되는 하나 이상의 방향족 탄화수소 감지 센서용인 것인, TodS 변이 단백질.
서열번호 1의 TodS 단백질 중 43번 내지 168번째 또는 23번 내지 168번째 아미노산 서열을 가지는 PAS1 단백질에서, 서열번호 1의 아미노산 서열을 기준으로, 제1항의 (a) 내지 (m)로 이루어진 군에서 선택되는 하나 이상의 변이를 가지는 PAS1 변이 단백질.
제1항 내지 제4항 중 어느 한 항의 단백질을 코딩하는 폴리뉴클레오티드.
제5항의 폴리뉴클레오티드를 포함하는, 발현 벡터.
제6항의 발현 벡터가 도입된, 미생물.
제1항 내지 제4항 중 어느 한 항의 단백질을 생산하는 미생물.
제8항에 있어서, 상기 미생물은 슈도모나스(Pseudomonas) 속인 것인, 미생물.
제9항에 있어서, 상기 미생물은 슈도모나스 푸티다(Pseudomonas putida)인 것인, 미생물.
(i) 하기 (a) 내지 (d)의 모듈을 포함하는 센서용 모듈 조합; (ii) 상기 모듈 조합을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트; (iii) 상기 발현 카세트를 포함하는 벡터; 또는 (i) 내지 (iii) 중 어느 하나를 포함하는 미생물을 함유하는, 방향족 탄화수소 감지용 바이오센서:
(a) 방향족 탄화수소와 특이적으로 결합하는 제4항의 PAS1 변이 단백질을 포함하는 제1모듈;
(b) 제1모듈에 방향족 탄화수소가 결합시 신호를 발생 및 전달하는 제2모듈;
(c) 상기 전달된 신호에 의해 인산화되는 전사조절인자를 포함하는 제3모듈; 및
(d) 상기 인산화되는 제3모듈에 의해 표지 단백질을 발현시키는 제4모듈.
제11항에 있어서, 상기 신호는 키나아제 단백질의 자기인산화 (autophosphorylation)에 의해 발생 또는 전달되는 것인, 바이오센서.
제11항에 있어서, 상기 전사조절인자은 슈노모나스 속 미생물 유래 TodT 단백질인 것인, 바이오센서.
제11항에 있어서, 상기 제4모듈의 발현은 슈노모나스 속 미생물 유래 todX 프로모터에 의한 것인, 바이오센서.
제11항에 있어서, 추가로 표지 단백질의 발현을 측정할 수 있는 물질을 포함하는 것인, 바이오센서.
(i) 하기 (a) 내지 (d)의 모듈을 포함하는 센서용 모듈 조합; (ii) 상기 모듈 조합을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트; 또는 (iii) 상기 발현 카세트를 포함하는 벡터를 포함하는 미생물을 함유하는, 방향족 탄화수소 분해용 미생물 제제:
(a) 방향족 탄화수소와 특이적으로 결합하는 제4항의 PAS1 변이 단백질을 포함하는 제1모듈;
(b) 제1모듈에 방향족 탄화수소가 결합시 신호를 발생 및 전달하는 제2모듈;
(c) 상기 전달된 신호에 의해 인산화되는 전사조절인자를 포함하는 제3모듈; 및
(d) 상기 인산화되는 제3모듈에 의해 방향족 탄화수소 분해 단백질을 발현시키는 제4모듈.
제11항의 바이오센서를 포함하는, 방향족 탄화수소 감지용 조성물.
제16항의 미생물 제제를 포함하는, 방향족 탄화수소 분해용 조성물.
제11항의 바이오센서를 시료에 노출시키는 단계를 포함하는, 방향족 탄화수소 감지방법.
제16항의 미생물 제제를 이용하여 방향족 탄화수소를 분해하는 단계를 포함하는, 방향족 탄화수소 분해방법.
(a) 표 3에 나타낸 PAS1 단백질의 원자좌표, 표 4에 나타낸 SeMet-PAS1 단백질과 톨루엔 복합체의 원자좌표, 또는 표 5에 나타낸 PAS1 단백질과 1,2,4-TMB(1,2,4-Trimethylbenzene) 복합체의 원자좌표를 이용하여, PAS1 단백질 또는 이의 복합체의 3차 구조를 설계하는 단계;
(b) 상기 설계된 3차 구조를 이용하여 PAS1 변이 단백질을 생성하는 단계; 및
(c) 상기 생성된 PAS1 변이 단백질과 주어진 리간드 간의 결합 활성을 측정하는 단계를 포함하는,
야생형 PAS1 단백질에 대하여 리간드 결합 활성이 변이된, PAS1 변이 단백질을 스크리닝하는 방법.
제21항에 있어서, 상기 (c) 단계는 (i) 하기 (a') 내지 (d')의 모듈을 포함하는 센서용 모듈 조합; (ii) 상기 모듈 조합을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트; (iii) 상기 발현 카세트를 포함하는 벡터; 또는 (i) 내지 (iii) 중 어느 하나를 포함하는 미생물을 함유하는, 바이오센서를 이용하여 상기 생성된 PAS1 변이 단백질과 주어진 리간드 간의 결합에 의해 발현되는 표지 단백질의 수준을 측정함으로써 수행되는 것인, 방법.
(a') 주어진 리간드와 특이적으로 결합하는 상기 생성된 PAS1 변이 단백질을 포함하는 제1모듈;
(b') 제1모듈에 리간드가 결합시 신호를 발생 및 전달하는 제2모듈;
(c') 상기 전달된 신호에 의해 인산화되는 전사조절인자를 포함하는 제3모듈; 및
(d') 상기 인산화되는 제3모듈에 의해 표지 단백질을 발현시키는 제4모듈.
제21항에 있어서, (d) 야생형 PAS1 단백질의 값에 비해 측정된 리간드 결합 활성이 변화된 경우, 야생형 PAS1 단백질에 대하여 리간드 결합 활성이 변이된, PAS1 변이 단백질로 판정하는 단계를 추가로 포함하는 것인, 방법.
제21항에 있어서, 상기 리간드는 벤젠(benzene), 에틸벤젠(ethylbenzene), 프로필벤젠(propylbenzene), 부틸벤젠(butylbenzene), 니트로벤젠(nitrobenzene), 클로로벤젠(chlorobenzene), 플루오로벤젠(fluorobenzene), 톨루엔(toluene), 스티렌(styrene), o-자일렌(o-xylene), m-자일렌(m-xylene), p-자일렌(p-xylene), o-클로로톨루엔(o-chlorotoluene), m-클로로톨루엔(m-chlorotoluene), p-클로로톨루엔(p-chlorotoluene), o-톨루이딘(o-toluidine), m-톨루이딘(m-toluidine), p-톨루이딘(p-toluidine), 카테콜(catechol), 1,2,4-TMB(1,2,4-Trimethylbenzene), 1,2,3-TMB(1,2,3-Trimethylbenzene), 1,3,5-TMB(1,3,5-Trimethylbenzene), 1-나프톨(1-naphthol) 및 2,3-디히드록시나프탈렌(2,3-dihydroxynaphthalene)으로 이루어진 군으로부터 선택된 것인, 방법.