KR20140023424A

KR20140023424A - 알돌라제, 이것을 코딩하는 핵산과 그 제조 방법 및 사용 방법

Info

Publication number: KR20140023424A
Application number: KR1020147000809A
Authority: KR
Inventors: 엘렌 버크; 파울라 엠 힉스; 피터 루진불; 토비 리차드슨; 데이비드 피 웨이너; 리샨 쟈오
Original assignee: 베레늄 코포레이션
Priority date: 2006-03-07
Filing date: 2007-03-07
Publication date: 2014-02-26
Also published as: JP5793487B2; JP2013063068A; JP5733777B2; EP3153580A2; US9719079B2; JP2009531025A; KR20150020722A; CN101443446A; CN102690833A; AU2007223086A1; WO2007103989A2; EP1999256A2; EA201301267A1; CA2645225A1; BRPI0708614A2; JP2013066469A; US9290755B2; EA200870329A1; EA029538B1; EP2385108A1

Abstract

본 발명은 피루베이트 알돌라제 활성, 예로서, 제한없이, HMG 및 KHG 알돌라제 활성을 비롯한 알돌라제 활성을 갖는 폴리펩티드, 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및 상기 폴리펩티드 및 폴리뉴클레오티드를 제조 및 사용하는 방법에 관한 것이다. 일부 실시태양에서, 본 발명은 열안전성 또는 내열성 활성을 비롯한 피루베이트 알돌라제 활성, 예로서, 제한없이, HMG 및 KHG 알돌라제 활성을 비롯한 알돌라제 활성을 갖는 폴리펩티드, 이들 효소를 코딩하는 폴리뉴클레오티드, 및 상기 폴리펩티드 및 폴리뉴클레오티드를 제조 및 사용하는 방법을 제공한다. 본 발명에 따른 폴리펩티드는 다양하게 약제, 산업, 및/또는 농업과 관련하여 유용할 수 있다. 일부 실시태양에서, 본 발명은 R-2-하이드록시 2-(인돌-3일메틸)-4-케토 글루타르산(R-MP), 모나틴의 특정 입체이성체, 예로서, R,R 및 S,R 모나틴, 및 그의 염 뿐만 아니라, 모나틴 유도체의 특정 입체이성체, 예로서, R,R 및 S,R 배열 및 그의 염을 생산하는데 유용한 폴리펩티드 및 생합성 경로를 제공한다.

Description

알돌라제, 이것을 코딩하는 핵산과 그 제조 방법 및 사용 방법{ALDOLASES, NUCLEIC ACIDS ENCODING THEM AND METHODS FOR MAKING AND USING THEM}

관련 출원에 대한 상호 참조

본 출원은 2006년 3월 7일 출원된 미국 가특허 출원 번호 제60/780,515호의 잇점을 주장한다.

본 발명에 따른 분야

본 발명은 분자 생물학 및 세포 생물학, 및 생화학에 관한 것이다. 더욱 특히, 본 발명은 알돌라제 활성을 갖는 폴리펩티드, 이들 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및 이들 폴리뉴클레오티드 및 폴리펩티드를 제조 및 사용 방법에 관한 것이다.

모나틴은 하기 화학식을 갖는 고강도 감미제이다:

모나틴은 2개의 키랄 중심을 포함하는 바, 이로써 4개의 잠재적인 입체이성체 배열을 갖는다. R,R 배열("R,R 이성체" 또는 "R,R 모나틴"); S,S 배열("S,S 이성체" 또는 "S,S 모나틴"); R,S 배열("R,S 이성체" 또는 "R,S 모나틴"); 및 S,R 배열("S,R 이성체" 또는 "S,R 모나틴"). 본원에서 사용되는 바, 달리 언급하지 않는 한, "모나틴"이라는 용어는 모나틴 입체이성체 4개 모두를 포함하는 조성물, 모나틴 입체이성체의 임의 조합물을 포함하는 조성물(예로서, 모나틴의 R,R 및 S,S 입체이성체만을 포함하는 조성물) 뿐만 아니라, 단일 이성체 형태를 지칭하는 것으로 사용된다.

본 개시의 목적상, 모나틴 탄소 골격은 상기 도시한 바와 같이 번호가 매겨질 것이며, 알코올기에 직접적으로 공유결합된 탄소는 2번 위치의 탄소로서 확인되며, 아미노기에 직접적으로 공유결합된 탄소는 4번 위치의 탄소로서 확인된다. 결과적으로, 본원에서 R,R 모나틴, S,S 모나틴, R,S 모나틴, 및 S,R 모나틴에 대해 언급하는 것은 달리 명시하지 않는 한, 각각 2R,4R 모나틴, 2S,4S 모나틴, 2R,4S 모나틴, 및 2S,4R 모나틴을 의미한다.

문헌 상에서, 모나틴 탄소 골격은 또한 대체 규정을 사용하여 알코올기에 결합된 탄소는 4번 위치의 탄소로, 아미노기에 결합된 탄소는 2번 위치의 탄소로 번호매김될 수 있다는 것에 주의하여야 한다. 따라서, 예를 들면, 본 개시에서 2S,4R 모나틴에 대하여 언급하는 것은 대체 번호매김 규정을 사용한 문헌에서 2R,4S 모나틴에 대해 언급하는 것과 동일할 것이다.

더욱이, 명명 규정은 다양하기 때문에 모나틴은 2-하이드록시-2-(인돌-3-일메틸)-4-아미노글루타르산; 4-아미노-2-하이드록시-2-(1H-인돌-3-일메틸)-펜탄디오산; 4-하이드록시-4-(3-인돌일메틸)글루탐산; 및 3-(1-아미노-1,3-디카복시-3-하이드록시-부트-4-일)인돌을 비롯한 다수의 대체 화학명으로 알려져 있다.

모나틴의 특정 이성체 형태는 남아프리카의 트랜스발(Transvaal) 지방에서 자생하는 식물 슐레로치톤 일리시폴리어스(Schlerochiton ilicifolius)의 근피에서 찾을 수 있다. 미국 특허 출원 번호 제10/422,366호("'366 출원") 및 제10/979,821호("'821 출원")(참고로 인용된다)는 특히, 모나틴의 시험관내 및 생체내 생산에 관한 폴리펩티드, 경로, 및 미생물을 개시한다.

[개요]

본 발명은 피루베이트 알돌라제 활성, 예로서, 제한없이, HMG 및 KHG 알돌라제 활성을 비롯한 알돌라제 활성을 갖는 폴리펩티드(이하, "알돌라제"), 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및 상기 폴리펩티드 및 폴리뉴클레오티드를 제조 및 사용하는 방법을 제공한다. 일부 실시태양에서, 본 발명은 또한 본 발명에 따른 폴리펩티드 또는 폴리뉴클레오티드를 포함하는 조성물(예로서, 약제학적 조성물, 연료 및 연료 첨가제 조성물, 식품 및 식품 첨가제, 음료 및 음료 첨가제, 사료 및 사료 첨가제, 약물 및 약물 첨가제, 식이 보충제)을 제공한다. 이러한 조성물은 예로서, 정제, 겔제, 환제, 임플란트, 액제, 분무제, 필름제, 미셀, 분제, 식품, 사료 펠릿 또는 임의 유형의 캡슐화된 형태와 같은 다양한 형태로 제형화될 수 있다.

일부 실시태양에서, 알돌라제 및/또는 그의 조성물은 약제, 산업, 및/또는 농업과 관련하여 유용할 수 있다.

일부 실시태양에서, 알돌라제 및/또는 그의 조성물은 탄소-탄소 결합을 형성하거나 절단하는데 유용할 수 있다.

일부 실시태양에서, 알파-케토산 수용체와 피루베이트 또는 피루베이트 유도체 공여체(donor) 사이의 탄소-탄소 결합 형성 반응을 촉진시키는 알돌라제를 제공한다(하기 반응식 참조). 일부 실시태양에서, 수용체는 또한 케톤 또는 알데히드일 수 있다. 일부 실시태양에서, 4-하이드록시-2-옥소글루타레이트 알돌라제(예로서, 2-케토-4-하이드록시글루타레이트 알돌라제, 2-옥소-4-하이드록시글루타레이트 알돌라제, KHG-알돌라제, EC 4.1.3.16) 활성을 갖고, 하기 반응: 4-하이드록시-2-옥소글루타레이트 <=> 피루베이트 + 글리옥실레이트를 촉진시키는 알돌라제를 제공한다. 일부 실시태양에서, HMG-알돌라제(예로서, 4-하이드록시-4-메틸-2-옥소글루타레이트 알돌라제, 피루베이트 알돌라제, 감마-메틸-감마-하이드록시-알파-케토글루타린 알돌라제, 4-하이드록시-4-메틸-2-케토글루타레이트 알돌라제, EC 4.1.3.17) 활성을 갖고, 하기 반응: 4-하이드록시-4-메틸-2-옥소글루타레이트 <=> 2 피루베이트를 촉진시키는 알돌라제를 제공한다. HMG 알돌라제 또한 4-하이드록시-4-메틸-2-옥소아디페이트 및 4-카복시-4-하이드록시-2-옥소헥사디오에이트에 작용할 것이다.

일부 실시태양에서, 3,4-치환 2-케토-글루타레이트의 생산을 촉진시키는 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, 제한없이, HMG 및/또는 KHG 알돌라제를 제공한다. 하나의 실시태양에서, 본 발명은 (a) 알돌라제 활성, 예로서, 피루베이트 알돌라제 활성, 예로서, 제한없이, HMG 알돌라제 및/또는 KMG 알돌라제 활성을 갖는 폴리펩티드를 제공하는 단계; (b) 공여체(donor) 및 수용체(acceptor) 화합물을 제공하는 단계; 및 (c) 알돌라제가 3,4-치환 2-케토-글루타레이트의 합성을 촉진하는 조건하에서 단계 (a)의 폴리펩티드를 단계 (b)의 화합물과 접촉시키는 단계를 포함하며, 여기서, 경우에 따라, 공여체 및 수용체는 피루베이트 또는 피루베이트 공여체 및 α-케토산 수용체, 케톤 및/또는 알데히드인, 3,4-치환 2-케토-글루타레이트를 제조하는 방법을 제공한다.

일부 실시태양에서, R-2-하이드록시 2-(인돌-3일메틸)-4-케토 글루타르산(R-MP)인 모나틴 전구체의 생산을 촉진시키는 알돌라제를 제공한다. 일부 실시태양에서, 4-치환 D-글루탐산 또는 그의 유도체를 제조하기 위하여 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제는 D-아미노트랜스퍼라제와 함께 사용될 수 있다. 4-치환 D-글루탐산 및/또는 그의 유도체는 이들 화합물이 박테리아 글루타메이트 라세마제를 저해하는 것으로 밝혀진 바(WO0214261A3), 항생제로서 사용될 수 있다. 하나의 실시태양에서, 본 발명은 (a) 알돌라제 활성, 예로서, 피루베이트 알돌라제 활성, 예로서, 제한없이, HMG 알돌라제 및/또는 KMG 알돌라제 활성을 갖는 폴리펩티드를 제공하는 단계; (b) α-케토산 수용체 및 피루베이트 또는 피루베이트 공여체를 제공하는 단계; 및 (c) 알돌라제가 4-치환 D-글루탐산의 합성을 촉진하는 조건하에서 단계 (a)의 폴리펩티드를 단계 (b)의 화합물과 접촉시키는 단계를 포함하며, 여기서, 경우에 따라, 폴리펩티드는 피루베이트 알돌라제, HMG 알돌라제 및/또는 KHG 알돌라제 활성을 갖고, 여기서, 본 방법은 경우에 따라, D-아미노트랜스퍼라제 사용을 추가로 포함하는 것인, 4-치환 D-글루탐산을 제조하는 방법을 제공한다.

본 발명은 적어도 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 75개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개, 650개, 700개, 750개, 800개, 850개, 900개, 950개, 1000개, 1050개, 1100개, 1150개, 1200개, 1250개, 1300개, 1350개, 1400개, 1450개, 1500개, 1550개, 1600개, 1650개, 1700개, 1750개, 1800개, 1850개, 1900개, 1950개, 2000개, 2050개, 2100개, 2200개, 2250개, 2300개, 2350개, 2400개, 2450개, 2500개 또는 그 이상의 잔기로 이루어진 영역에 걸쳐서 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 67, 서열 번호: 69, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161, 서열 번호: 163, 서열 번호: 165, 서열 번호: 167, 서열 번호: 169, 서열 번호: 171, 서열 번호: 173, 서열 번호: 175, 서열 번호: 177, 서열 번호: 179, 서열 번호: 181, 서열 번호: 183, 서열 번호: 185, 서열 번호: 187, 서열 번호: 189, 서열 번호: 191, 서열 번호: 193, 서열 번호: 195, 서열 번호: 197, 서열 번호: 199, 서열 번호: 201, 서열 번호: 203, 서열 번호: 205, 서열 번호: 207, 서열 번호: 209, 서열 번호: 211, 서열 번호: 213, 서열 번호: 215, 서열 번호: 217, 서열 번호: 219, 서열 번호: 221, 서열 번호: 223, 서열 번호: 225, 서열 번호: 227, 서열 번호: 229, 서열 번호: 231, 서열 번호: 233, 서열 번호: 235, 서열 번호: 237, 서열 번호: 239, 서열 번호: 241, 서열 번호: 243, 서열 번호: 245, 서열 번호: 247, 서열 번호: 249, 서열 번호: 251, 서열 번호: 253, 서열 번호: 255, 서열 번호: 257, 서열 번호: 259, 서열 번호: 261, 서열 번호: 263, 서열 번호: 265, 서열 번호: 267, 서열 번호: 269, 서열 번호: 271, 서열 번호: 273, 서열 번호: 275, 서열 번호: 277, 서열 번호: 279, 서열 번호: 281, 서열 번호: 283, 서열 번호: 285, 서열 번호: 287, 서열 번호: 289, 서열 번호: 291, 서열 번호: 293, 서열 번호: 295, 서열 번호: 297, 서열 번호: 299, 서열 번호: 301, 서열 번호: 303, 서열 번호: 305, 서열 번호: 307, 서열 번호: 309, 서열 번호: 311, 서열 번호: 313, 서열 번호: 315, 서열 번호: 317, 서열 번호: 319, 서열 번호: 321, 서열 번호: 323, 서열 번호: 325, 서열 번호: 327, 서열 번호: 329, 서열 번호: 331, 서열 번호: 333, 서열 번호: 335, 서열 번호: 336, 서열 번호: 337, 및 서열 번호: 338을 비롯한, 본 발명에 따른 핵산과 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의, 또는 완벽한(100%) 서열 동일성을 갖는 핵산 서열을 포함하는 단리된 합성 또는 재조합 핵산을 제공한다. 일부 실시태양에서, 하나 이상의 핵산은 피루베이트 활성 예로서, 제한없이, HMG 및/또는 KHG 알돌라제 활성을 비롯한 알돌라제 활성을 갖는 적어도 하나의 폴리펩티드를 코딩한다. 일부 실시태양에서, 서열 동일성은 서열 비교 알고리즘을 사용하는 분석법 또는 시각적 조사에 의해 측정된다.

대체 실시태양에서, 하나 이상의 핵산은 본 발명의 폴리펩티드에 특이적으로 결합할 수 있는 항체를 생성할 수 있는 적어도 하나의 폴리펩티드를 코딩하거나, 이들 핵산은 알돌라제 코딩 핵산을 동정하거나 단리하기 위한 프로브로서 사용될 수 있거나, 알돌라제-발현 핵산의 발현을 저해하기 위하여 사용될 수 있다.

본 발명에 따른 핵산은 또한 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 66, 서열 번호: 68, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162, 서열 번호: 164, 서열 번호: 166, 서열 번호: 168, 서열 번호: 170, 서열 번호: 172, 서열 번호: 174, 서열 번호: 176, 서열 번호: 178, 서열 번호: 180, 서열 번호: 182, 서열 번호: 184, 서열 번호: 186, 서열 번호: 188, 서열 번호: 190, 서열 번호: 192, 서열 번호: 194, 서열 번호: 196, 서열 번호: 198, 서열 번호: 200, 서열 번호: 202, 서열 번호: 204, 서열 번호: 206, 서열 번호: 208, 서열 번호: 210, 서열 번호: 212, 서열 번호: 214, 서열 번호: 216, 서열 번호: 218, 서열 번호: 220, 서열 번호: 222, 서열 번호: 224, 서열 번호: 226, 서열 번호: 228, 서열 번호: 230, 서열 번호: 232, 서열 번호: 234, 서열 번호: 236, 서열 번호: 238, 서열 번호: 240, 서열 번호: 242, 서열 번호: 244, 서열 번호: 246, 서열 번호: 248, 서열 번호: 250, 서열 번호: 252, 서열 번호: 254, 서열 번호: 256, 서열 번호: 258, 서열 번호: 260, 서열 번호: 262, 서열 번호: 264, 서열 번호: 266, 서열 번호: 268, 서열 번호: 270, 서열 번호: 272, 서열 번호: 274, 서열 번호: 276, 서열 번호: 278, 서열 번호: 280, 서열 번호: 282, 서열 번호: 284, 서열 번호: 286, 서열 번호: 288, 서열 번호: 290, 서열 번호: 292, 서열 번호: 294, 서열 번호: 296, 서열 번호: 298, 서열 번호: 300, 서열 번호: 302, 서열 번호: 304, 서열 번호: 306, 서열 번호: 308, 서열 번호: 310, 서열 번호: 312, 서열 번호: 314, 서열 번호: 316, 서열 번호: 318, 서열 번호: 320, 서열 번호: 322, 서열 번호: 324, 서열 번호: 326, 서열 번호: 328, 서열 번호: 330, 서열 번호: 332, 및 서열 번호: 334에 제시된 서열, 및 그의 부분서열을 갖는 하나 이상의 폴리펩티드를 갖는 효소, 그의 변이체 및 그 효소 활성 단편과 같은 본 발명에 따른 효소를 코딩하는 단리된 합성 또는 재조합 핵산을 포함한다. 일부 실시태양에서, 폴리펩티드는 피루베이트 활성 예로서, 제한없이, HMG 및/또는 KHG 알돌라제 활성을 비롯한 알돌라제 활성을 갖는다.

일부 실시태양에서, 본 발명은 바람직하게 혼합 배양물로부터 유래된 알돌라제-코딩, 예로서, 피루베이트 알돌라제-, 예로서, HMG 및/또는 KHG 알돌라제-코딩 핵산을 제공한다. 일부 실시태양에서, 본 발명은 본 발명에 따른 폴리뉴클레오티드, 예로서, 적어도 약 50개, 75개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개, 650개, 700개, 750개, 800개, 850개, 900개, 950개, 1000개, 1050개, 1100개, 1150개 또는 그 이상의 영역에 걸쳐 본 발명에 따른 핵산, 예로서, 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 67, 서열 번호: 69, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161, 서열 번호: 163, 서열 번호: 165, 서열 번호: 167, 서열 번호: 169, 서열 번호: 171, 서열 번호: 173, 서열 번호: 175, 서열 번호: 177, 서열 번호: 179, 서열 번호: 181, 서열 번호: 183, 서열 번호: 185, 서열 번호: 187, 서열 번호: 189, 서열 번호: 191, 서열 번호: 193, 서열 번호: 195, 서열 번호: 197, 서열 번호: 199, 서열 번호: 201, 서열 번호: 203, 서열 번호: 205, 서열 번호: 207, 서열 번호: 209, 서열 번호: 211, 서열 번호: 213, 서열 번호: 215, 서열 번호: 217, 서열 번호: 219, 서열 번호: 221, 서열 번호: 223, 서열 번호: 225, 서열 번호: 227, 서열 번호: 229, 서열 번호: 231, 서열 번호: 233, 서열 번호: 235, 서열 번호: 237, 서열 번호: 239, 서열 번호: 241, 서열 번호: 243, 서열 번호: 245, 서열 번호: 247, 서열 번호: 249, 서열 번호: 251, 서열 번호: 253, 서열 번호: 255, 서열 번호: 257, 서열 번호: 259, 서열 번호: 261, 서열 번호: 263, 서열 번호: 265, 서열 번호: 267, 서열 번호: 269, 서열 번호: 271, 서열 번호: 273, 서열 번호: 275, 서열 번호: 277, 서열 번호: 279, 서열 번호: 281, 서열 번호: 283, 서열 번호: 285, 서열 번호: 287, 서열 번호: 289, 서열 번호: 291, 서열 번호: 293, 서열 번호: 295, 서열 번호: 297, 서열 번호: 299, 서열 번호: 301, 서열 번호: 303, 서열 번호: 305, 서열 번호: 307, 서열 번호: 309, 서열 번호: 311, 서열 번호: 313, 서열 번호: 315, 서열 번호: 317, 서열 번호: 319, 서열 번호: 321, 서열 번호: 323, 서열 번호: 325, 서열 번호: 327, 서열 번호: 329, 서열 번호: 331, 서열 번호: 333, 서열 번호: 335, 서열 번호: 336, 서열 번호: 337, 및 서열 번호: 338과 적어도 약 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의, 또는 완벽한(100%) 서열 동일성을 갖는 서열을 포함하는, 혼합 배양물로부터 단리된 탄소-탄소 결합을 형성하거나 절단하는 효소를 코딩하는 핵산을 제공한다.

일부 실시태양에서, 본 발명은 본 발명에 따른 효소, 예로서, 본 발명에 따른 폴리펩티드, 예로서, 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 66, 서열 번호: 68, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162, 서열 번호: 164, 서열 번호: 166, 서열 번호: 168, 서열 번호: 170, 서열 번호: 172, 서열 번호: 174, 서열 번호: 176, 서열 번호: 178, 서열 번호: 180, 서열 번호: 182, 서열 번호: 184, 서열 번호: 186, 서열 번호: 188, 서열 번호: 190, 서열 번호: 192, 서열 번호: 194, 서열 번호: 196, 서열 번호: 198, 서열 번호: 200, 서열 번호: 202, 서열 번호: 204, 서열 번호: 206, 서열 번호: 208, 서열 번호: 210, 서열 번호: 212, 서열 번호: 214, 서열 번호: 216, 서열 번호: 218, 서열 번호: 220, 서열 번호: 222, 서열 번호: 224, 서열 번호: 226, 서열 번호: 228, 서열 번호: 230, 서열 번호: 232, 서열 번호: 234, 서열 번호: 236, 서열 번호: 238, 서열 번호: 240, 서열 번호: 242, 서열 번호: 244, 서열 번호: 246, 서열 번호: 248, 서열 번호: 250, 서열 번호: 252, 서열 번호: 254, 서열 번호: 256, 서열 번호: 258, 서열 번호: 260, 서열 번호: 262, 서열 번호: 264, 서열 번호: 266, 서열 번호: 268, 서열 번호: 270, 서열 번호: 272, 서열 번호: 274, 서열 번호: 276, 서열 번호: 278, 서열 번호: 280, 서열 번호: 282, 서열 번호: 284, 서열 번호: 286, 서열 번호: 288, 서열 번호: 290, 서열 번호: 292, 서열 번호: 294, 서열 번호: 296, 서열 번호: 298, 서열 번호: 300, 서열 번호: 302, 서열 번호: 304, 서열 번호: 306, 서열 번호: 308, 서열 번호: 310, 서열 번호: 312, 서열 번호: 314, 서열 번호: 316, 서열 번호: 318, 서열 번호: 320, 서열 번호: 322, 서열 번호: 324, 서열 번호: 326, 서열 번호: 328, 서열 번호: 330, 서열 번호: 332, 또는 서열 번호: 334, 및 그 효소 활성 단편을 포함하는, 본 발명에 따른 폴리뉴클레오티드 서열 및 그에 의해 코딩된 폴리펩티드를 포함하는 것으로, 바람직하게는 보편적인 공급원, 예로서, 환경적 공급원으로부터 유래된 알돌라제 효소-, 예로서, 피루베이트 알돌라제 효소-, HMG 및/또는 KHG 효소 코딩 핵산을 제공한다. 일부 실시태양에서, 본 발명은 또한 바람직하게 환경적 공급원, 예로서, 혼합된 환경적 공급원으로부터 유래된 알돌라제 효소-, 예로서, 피루베이트 알돌라제 효소-, HMG 및/또는 KHG 효소-코딩 핵산을 제공한다.

일부 실시태양에서, 서열 비교 알고리즘은 필터링 셋팅이 blastall -p blastp -d"nr pataa" -FF로 설정되고 기타 모든 선택 사양은 디폴트값으로 설정되는 BLAST 버전 2.2.2 알고리즘이다.

본 발명의 다른 실시태양은 본 발명에 따른 핵산 서열, 그와 실질적으로 동일한 서열, 및 그에 상보적인 서열 중 적어도 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 75개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개, 650개, 700개, 750개, 800개, 850개, 900개, 950개, 1000개, 1050개, 1100개, 1150개, 1200개, 1250개, 1300개, 1350개, 1400개, 1450개, 1500개, 1550개, 1600개, 1650개, 1700개, 1750개, 1800개, 1850개, 1900개, 1950개, 2000개, 2050개, 2100개, 2200개, 2250개, 2300개, 2350개, 2400개, 2450개, 2500개 또는 그 이상의 연속된 염기를 포함하는 단리된 합성 또는 재조합 핵산이다.

일부 실시태양에서, 본 발명에 따른 단리된 합성 또는 재조합 핵산은 열안정성이며, 피루베이트 활성 예로서, 제한없이, HMG 및/또는 KHG 알돌라제 활성을 비롯한 알돌라제 활성을 갖는 폴리펩티드를 코딩한다. 본 발명에 따른 열안정성 폴리펩티드는 약 -100℃ 내지 약 -80℃, 약 -80℃ 내지 약 -40℃, 약 -40℃ 내지 약 -20℃, 약 -20℃ 내지 약 0℃, 약 0℃ 내지 약 37℃, 약 O℃ 내지 약 5℃, 약 5℃ 내지 약 15℃, 약 15℃ 내지 약 25℃, 약 25℃ 내지 약 37℃, 약 37℃ 내지 약 45℃, 약 45℃ 내지 약 55℃, 약 55℃ 내지 약 70℃, 약 7O℃ 내지 약 75℃, 약 75℃ 내지 약 85℃, 약 85℃ 내지 약 9O℃, 약 90℃ 내지 약 95℃, 약 95℃ 내지 약 100℃, 약 100℃ 내지 약 105℃, 약 105℃ 내지 약 110℃, 약 110℃ 내지 약 120℃, 또는 95℃, 96℃, 97℃, 98℃, 99℃, 100℃, 101℃, 102℃, 103℃, 104℃, 105℃, 106℃, 107℃, 108℃, 109℃, 110℃, 111℃, 112℃, 113℃, 114℃, 115℃ 또는 그 이상 범위의 온도를 포함하는 조건하에서도 알돌라제 활성, 예로서, 피루베이트 알돌라제 활성, 예로서, HMG 및/또는 KHG 알돌라제 활성을 유지할 수 있다. 본 발명에 따른 열안정성 폴리펩티드는 약 -100℃ 내지 약 -80℃, 약 -80℃ 내지 약 -40℃, 약 -40℃ 내지 약 -20℃, 약 -20℃ 내지 약 0℃, 약 O℃ 내지 약 5℃, 약 5℃ 내지 약 15℃, 약 15℃ 내지 약 25℃, 약 25℃ 내지 약 37℃, 약 37℃ 내지 약 45℃, 약 45℃ 내지 약 55℃, 약 55℃ 내지 약 70℃, 약 7O℃ 내지 약 75℃, 약 75℃ 내지 약 85℃, 약 85℃ 내지 약 9O℃, 약 90℃ 내지 약 95℃, 약 95℃ 내지 약 100℃, 약 100℃ 내지 약 105℃, 약 105℃ 내지 약 110℃, 약 110℃ 내지 약 120℃, 또는 95℃, 96℃, 97℃, 98℃, 99℃, 100℃, 101℃, 102℃, 103℃, 104℃, 105℃, 106℃, 107℃, 108℃, 109℃, 110℃, 111℃, 112℃, 113℃, 114℃, 115℃ 또는 그 이상 범위의 온도에서도 알돌라제 활성, 예로서, 피루베이트 알돌라제 활성, 예로서, HMG 및/또는 KHG 알돌라제 활성을 유지할 수 있다. 일부 실시태양에서, 본 발명에 따른 열안정성 폴리펩티드는 상기 기술된 범위의 온도하에 약 pH 3.0, 약 pH 3.5, 약 pH 4.0, 약 pH 4.5, 약 pH 5.0, 약 pH 5.5, 약 pH 6.0, 약 pH 6.5, 약 pH 7.0, 약 pH 7.5, 약 pH 8.0, 약 pH 8.5, 약 pH 9.0, 약 pH 9.5, 약 pH 10.0, 약 pH 10.5, 약 pH 11.0, 약 pH 11.5, 약 pH 12.0 또는 그 이상에서 알돌라제 활성을 유지한다.

다른 실시태양에서, 단리된 합성 또는 재조합 핵산은 내열성이며, 피루베이트 활성 예로서, 제한없이, HMG 및/또는 KHG 알돌라제 활성을 비롯한 알돌라제 활성을 갖는 폴리펩티드를 코딩한다. 본 발명에 따른 내열성 폴리펩티드는 약 -100℃ 내지 약 -80℃, 약 -80℃ 내지 약 -40℃, 약 -40℃ 내지 약 -20℃, 약 -20℃ 내지 약 0℃, 약 O℃ 내지 약 5℃, 약 5℃ 내지 약 15℃, 약 15℃ 내지 약 25℃, 약 25℃ 내지 약 37℃, 약 37℃ 내지 약 45℃, 약 45℃ 내지 약 55℃, 약 55℃ 내지 약 70℃, 약 7O℃ 내지 약 75℃, 약 75℃ 내지 약 85℃, 약 85℃ 내지 약 9O℃, 약 90℃ 내지 약 95℃, 약 95℃ 내지 약 100℃, 약 100℃ 내지 약 105℃, 약 105℃ 내지 약 110℃, 약 110℃ 내지 약 120℃, 또는 95℃, 96℃, 97℃, 98℃, 99℃, 100℃, 101℃, 102℃, 103℃, 104℃, 105℃, 106℃, 107℃, 108℃, 109℃, 110℃, 111℃, 112℃, 113℃, 114℃, 115℃ 또는 그 이상 범위의 온도를 포함하는 조건에 노출된 이후에도 알돌라제 활성, 예로서, 피루베이트 알돌라제 활성, 예로서, HMG 및/또는 KHG 알돌라제 활성을 유지할 수 있다. 본 발명에 따른 내열성 폴리펩티드는 약 -100℃ 내지 약 -80℃, 약 -80℃ 내지 약 -40℃, 약 -40℃ 내지 약 -20℃, 약 -20℃ 내지 약 0℃, 약 O℃ 내지 약 5℃, 약 5℃ 내지 약 15℃, 약 15℃ 내지 약 25℃, 약 25℃ 내지 약 37℃, 약 37℃ 내지 약 45℃, 약 45℃ 내지 약 55℃, 약 55℃ 내지 약 70℃, 약 7O℃ 내지 약 75℃, 약 75℃ 내지 약 85℃, 약 85℃ 내지 약 9O℃, 약 90℃ 내지 약 95℃, 약 95℃ 내지 약 100℃, 약 100℃ 내지 약 105℃, 약 105℃ 내지 약 110℃, 약 110℃ 내지 약 120℃, 또는 95℃, 96℃, 97℃, 98℃, 99℃, 100℃, 101℃, 102℃, 103℃, 104℃, 105℃, 106℃, 107℃, 108℃, 109℃, 110℃, 111℃, 112℃, 113℃, 114℃, 115℃ 또는 그 이상 범위의 온도에 노출된 이후에도 알돌라제 활성, 예로서, 피루베이트 알돌라제 활성, 예로서, HMG 및/또는 KHG 알돌라제 활성을 유지할 수 있다. 일부 실시태양에서, 본 발명에 따른 내열성 폴리펩티드는 상기 기술된 범위의 온도하에 약 pH 3.0, 약 pH 3.5, 약 pH 4.0, 약 pH 4.5, 약 pH 5.0, 약 pH 5.5, 약 pH 6.0, 약 pH 6.5, 약 pH 7.0, 약 pH 7.5, 약 pH 8.0, 약 pH 8.5, 약 pH 9.0, 약 pH 9.5, 약 pH 10.0, 약 pH 10.5, 약 pH 11.0, 약 pH 11.5, 약 pH 12.0 또는 그 이상에 노출된 이후에도 알돌라제 활성을 유지한다.

본 발명은 엄격한 조건하에 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 67, 서열 번호: 69, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호:105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161, 서열 번호: 163, 서열 번호: 165, 서열 번호: 167, 서열 번호: 169, 서열 번호: 171, 서열 번호: 173, 서열 번호: 175, 서열 번호: 177, 서열 번호: 179, 서열 번호: 181, 서열 번호: 183, 서열 번호: 185, 서열 번호: 187, 서열 번호: 189, 서열 번호: 191, 서열 번호: 193, 서열 번호: 195, 서열 번호: 197, 서열 번호: 199, 서열 번호: 201, 서열 번호: 203, 서열 번호: 205, 서열 번호: 207, 서열 번호: 209, 서열 번호: 211, 서열 번호: 213, 서열 번호: 215, 서열 번호: 217, 서열 번호: 219, 서열 번호: 221, 서열 번호: 223, 서열 번호: 225, 서열 번호: 227, 서열 번호: 229, 서열 번호: 231, 서열 번호: 233, 서열 번호: 235, 서열 번호: 237, 서열 번호: 239, 서열 번호: 241, 서열 번호: 243, 서열 번호: 245, 서열 번호: 247, 서열 번호: 249, 서열 번호: 251, 서열 번호: 253, 서열 번호: 255, 서열 번호: 257, 서열 번호: 259, 서열 번호: 261, 서열 번호: 263, 서열 번호: 265, 서열 번호: 267, 서열 번호: 269, 서열 번호: 271, 서열 번호: 273, 서열 번호: 275, 서열 번호: 277, 서열 번호: 279, 서열 번호: 281, 서열 번호: 283, 서열 번호: 285, 서열 번호: 287, 서열 번호: 289, 서열 번호: 291, 서열 번호: 293, 서열 번호: 295, 서열 번호: 297, 서열 번호: 299, 서열 번호: 301, 서열 번호: 303, 서열 번호: 305, 서열 번호: 307, 서열 번호: 309, 서열 번호: 311, 서열 번호: 313, 서열 번호: 315, 서열 번호: 317, 서열 번호: 319, 서열 번호: 321, 서열 번호: 323, 서열 번호: 325, 서열 번호: 327, 서열 번호: 329, 서열 번호: 331, 서열 번호: 333, 서열 번호: 335, 서열 번호: 336, 서열 번호: 337, 또는 서열 번호: 338에 제시된 서열, 또는 그의 단편 또는 부분서열을 포함하는 핵산에 혼성화하는 서열을 포함하는 단리된 합성 또는 재조합 핵산을 제공한다. 일부 실시태양에서, 핵산은 피루베이트 활성 예로서, 제한없이, HMG 및/또는 KHG 알돌라제 활성을 비롯한 알돌라제 활성을 갖는 폴리펩티드를 코딩한다. 핵산은 길이가 적어도 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 75개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개, 650개, 700개, 750개, 800개, 850개, 900개, 950개, 1000개, 1050개, 1100개, 1150개, 1200개 또는 그 이상인 잔기이거나 전체 길이의 유전자 또는 전사체일 수 있다. 일부 실시태양에서, 엄격한 조건은 약 15분 동안 약 65℃의 온도하에 0.2X SSC에서 세척하는 것을 포함하는 세척 단계를 포함한다.

본 발명은 본 발명에 따른 서열의 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개, 650개, 700개, 750개, 800개, 850개, 900개, 950개, 1000개 또는 그 이상의 연속된 염기를 포함하고, 결합 또는 혼성화에 의해 핵산을 동정하는 것인, 피루베이트 활성 예로서, 제한없이, HMG 및/또는 KHG 알돌라제 활성을 비롯한 알돌라제 활성을 갖는 폴리펩티드를 코딩하는 핵산을 동정하거나 단리하기 위한 핵산 프로브를 제공한다. 프로브는 본 발명에 따른 서열, 또는 그의 단편 또는 부분서열의 약 10-100개의 연속된 염기, 예를 들면, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95 또는 100개 또는 그 이상의 염기, 또는 그 사이의 임의 길이의 것을 포함하는 올리고뉴클레오티드를 포함할 수 있다.

본 발명은 본 발명에 따른 핵산 중 적어도 약 10개, 15개, 20개, 30개, 40개, 50개, 60개, 70개, 80개, 90개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개, 650개, 700개, 750개, 800개, 850개, 900개, 950개, 1000개 또는 그 이상의 잔기의 서열을 포함하는 핵산, 예로서, 본 발명에 따른 핵산과 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의, 또는 완벽한(100%) 서열 동일성을 갖는 폴리펩티드를 포함하는, 피루베이트 활성 예로서, 제한없이, HMG 및/또는 KHG 알돌라제 활성을 비롯한 알돌라제 활성을 갖는 폴리펩티드를 코딩하는 핵산을 동정하거나 단리하기 위한 핵산 프로브를 제공한다. 일부 실시태양에서, 서열 동일성은 서열 비교 알고리즘을 사용하는 분석법 또는 시각적 조사에 의해 측정된다. 다른 실시태양에서, 프로브는 본 발명에 따른 핵산 서열, 또는 그의 부분서열의 적어도 약 10-100개의 연속된 염기, 예를 들면, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 또는 100개 또는 그 이상의 염기, 또는 그 사이의 임의 길이의 것을 포함하는 올리고뉴클레오티드를 포함할 수 있다.

본 발명은 각 프라이머 쌍이 본 발명에 따른 서열, 또는 그의 단편 또는 부분서열(서열 목록 참조)을 포함하는 핵산을 증폭시킬 수 있는 것인, 피루베이트 활성 예로서, 제한없이, HMG 및/또는 KHG 알돌라제 활성을 비롯한 알돌라제 활성을 갖는 폴리펩티드를 코딩하는 핵산을 증폭시키기 위한(예로서, PCR에 의해) 증폭용 프라이머 쌍을 제공한다. 증폭용 프라이머 서열 쌍 중 하나 또는 각 구성원은 상기 서열 중 적어도 약 10개 내지 50개 또는 그 이상의 연속된 염기, 또는 상기 서열의 약 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개 또는 그 이상의 연속된 염기를 포함하는 올리고뉴클레오티드를 포함할 수 있다. 일부 실시태양에서, 본 발명은 각 프라이머 쌍이 본 발명에 따른 핵산의 처음(5') 약 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개 또는 그 이상의 잔기로 제시된 서열을 갖는 제1 구성원, 및 제1 구성원의 상보성 가닥의 처음(5') 약 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개 또는 그 이상의 잔기로 제시된 서열을 갖는 제2 구성원을 포함하는 것인, 증폭용 프라이머 쌍을 제공한다.

본 발명은 본 발명에 따른 증폭용 프라이머 쌍을 사용하여 증폭, 예로서, 중합효소 연쇄 반응(PCR: polymerase chain reaction)에 의해 생성된, 알돌라제 코딩, 예로서, 피루베이트 알돌라제 코딩, HMG 및/또는 KHG 알돌라제 코딩 핵산을 제공한다. 일부 실시태양에서, 본 발명은 본 발명에 따른 증폭용 프라이머 쌍을 사용하여 증폭, 예로서, 중합효소 연쇄 반응(PCR)에 의해 생성된, 알돌라제 코딩, 예로서, 피루베이트 알돌라제 코딩, HMG 및/또는 KHG 알돌라제 코딩 핵산을 제공한다. 일부 실시태양에서, 본 발명은 본 발명에 따른 증폭용 프라이머 쌍을 사용하여 증폭, 예로서, 중합효소 연쇄 반응(PCR)에 의해 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 제조하는 방법을 제공한다. 일부 실시태양에서, 증폭용 프라이머 쌍은 라이브러리, 예로서, 유전자 라이브러리, 예로서, 환경 라이브러리(environmental library)로부터 핵산을 증폭시킨다.

본 발명은 본 발명에 따른 핵산 서열, 또는 그의 단편 또는 부분서열을 증폭시킬 수 있는 증폭용 프라이머 서열 쌍으로 주형 핵산을 증폭시키는 단계를 포함하는, 피루베이트 활성 예로서, 제한없이, HMG 및/또는 KHG 알돌라제 활성을 비롯한, 알돌라제 활성을 갖는 폴리펩티드를 코딩하는 핵산을 증폭시키는 방법을 제공한다.

본 발명은 본 발명에 따른 핵산 또는 그의 부분서열을 포함하는 발현 카세트를 제공한다. 일부 실시태양에서, 발현 카세트는 프로모터에 작동 가능하게 연결된 핵산을 포함할 수 있다. 프로모터는 바이러스, 박테리아, 포유동물, 진균, 효모, 또는 식물 프로모터일 수 있다. 일부 실시태양에서, 식물 프로모터는 감자, 쌀, 옥수수, 소맥, 담배 또는 보리 프로모터일 수 있다. 프로모터는 구성적 프로모터일 수 있다. 구성적 프로모터는 CaMV35S를 포함할 수 있다. 다른 실시태양에서, 프로모터는 유도성 프로모터일 수 있다. 일부 실시태양에서, 프로모터는 조직-특이 프로모터 또는 환경적으로 조절되거나 발달상 조절된 프로모터일 수 있다. 따라서, 프로모터는 예로서, 종자-특이, 잎-특이, 뿌리-특이, 줄기-특이 또는 이탈-유도성 프로모터일 수 있다. 일부 실시태양에서, 발현 카세트는 추가로 식물 또는 식물 바이러스 발현 벡터를 포함할 수 있다.

본 발명은 본 발명에 따른 발현 카세트(예로서, 벡터) 또는 본 발명에 따른 핵산을 포함하는 클로닝 비히클을 제공한다. 클로닝 비히클은 바이러스 벡터, 플라스미드, 파지, 파지미드, 코스미드, 포스미드, 박테리오파지 또는 인공 염색체일 수 있다. 바이러스 벡터는 아데노바이러스 벡터, 레트로바이러스 벡터 또는 아데노 관련 바이러스 벡터를 포함할 수 있다. 클로닝 비히클은 박테리아 인공 염색체(BAC: bacterial artificial chromosome), 플라스미드, 박테리오파지 P1-유래 벡터(PAC: bacteriophage P1-derived vector), 효모 인공 염색체(YAC: yeast artificial chromosome), 또는 포유동물 인공 염색체(MAC: mammalian artificial chromosome)를 포함할 수 있다.

본 발명은 본 발명에 따른 핵산 또는 본 발명에 따른 발현 카세트(예로서, 벡터), 또는 본 발명에 따른 클로닝 비히클을 포함하는 형질전환된 세포를 제공한다. 일부 실시태양에서, 형질전환된 세포는 박테리아 세포, 포유동물 세포, 진균 세포, 효모 세포, 곤충 세포 또는 식물 세포일 수 있다. 일부 실시태양에서, 식물 세포는 대두, 유채씨, 유지종자, 토마토, 사탕수수, 시리얼, 감자, 소맥, 쌀, 옥수수, 담배 또는 보리 세포일 수 있다.

본 발명은 본 발명에 따른 핵산 또는 본 발명에 따른 발현 카세트(예로서, 벡터)를 포함하는 트랜스제닉(transgenic) 비인간 동물을 제공한다. 일부 실시태양에서, 동물은 마우스, 래트, 돼지, 염소 또는 양이다.

본 발명은 본 발명에 따른 핵산 또는 본 발명에 따른 발현 카세트(예로서, 벡터)를 포함하는 트랜스제닉 식물을 제공한다. 트랜스제닉 식물은 시리얼 식물, 옥수수 식물, 감자 식물, 토마토 식물, 소맥 식물, 유지종자 식물, 유채(rapeseed) 식물, 대두 식물, 쌀 식물, 보리 식물 또는 담배 식물일 수 있다.

본 발명은 본 발명에 따른 핵산 또는 본 발명에 따른 발현 카세트(예로서, 벡터)를 포함하는 트랜스제닉 종자를 제공한다. 트랜스제닉 종자는 시리얼 식물, 옥수수 종자, 밀알, 유지종자, 유채씨, 대두 종자, 야자씨, 해바라기씨, 참깨 종자, 땅콩 또는 담배 식물 종자일 수 있다.

본 발명은 본 발명에 따른 핵산에 상보적이거나, 엄격한 조건하에서 그에 혼성화할 수 있는 핵산 서열을 포함하는 안티센스 올리고뉴클레오티드를 제공한다. 일부 실시태양에서, 본 발명은 본 발명에 따른 핵산에 상보적이거나, 엄격한 조건하에서 그에 혼성화할 수 있는 핵산 서열을 포함하는 안티센스 올리고뉴클레오티드를 세포에 투여하거나, 세포에서 발현시키는 단계를 포함하는, 세포에서 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 메세지의 번역을 저해하는 방법을 제공한다. 일부 실시태양에서, 안티센스 올리고뉴클레오티드는 약 10개 내지 약 50개, 약 20개 내지 약 60개, 약 30개 내지 약 70개, 약 40개 내지 약 80개, 또는 약 60개 내지 약 100개의 염기 길이, 예로서, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개 또는 그 이상의 염기 길이이다.

본 발명은 본 발명에 따른 핵산에 상보적이거나, 엄격한 조건하에서 그에 혼성화할 수 있는 핵산 서열을 포함하는 안티센스 올리고뉴클레오티드를 세포에 투여하거나, 세포에서 발현시키는 단계를 포함하는, 세포에서 알돌라제 효소, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 메세지의 번역을 저해하는 방법을 제공한다.

본 발명은 본 발명에 따른 서열의 부분서열을 포함하는 이중 가닥 저해 RNA(RNAi, 또는 RNA 간섭) 분자(전사를 저해하는 경우, 작은 간섭 RNA, 또는 siRNA, 번역을 저해하는 경우, 마이크로RNA 또는 miRNA)를 제공한다. 일부 실시태양에서, siRNA는 약 21개 내지 약 24개의 잔기, 또는 약 적어도 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개 또는 그 이상의 이중 뉴클레오티드 길이이다. 일부 실시태양에서, 본 발명은 이중 가닥 저해 RNA(siRNA 또는 miRNA)를 세포에 투여하거나, 세포에서 발현시키는 단계를 포함하며, 여기서, RNA는 본 발명에 따른 서열의 부분서열을 포함하는 것인, 세포에서 알돌라제 효소, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소의 발현을 저해하는 방법을 제공한다.

본 발명은 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 125개, 150개, 175개, 200개, 225개, 250개, 275개, 300개, 325개, 350개 또는 그 이상의 잔기로 이루어진 영역에 걸쳐서 또는 전체 길이의 폴리펩티드에 걸쳐 본 발명에 따른 폴리펩티드 또는 펩티드와 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의, 또는 완벽한(100%) 서열 동일성을 갖는 아미노산 서열을 포함하는 단리된 합성 또는 재조합 폴리펩티드를 제공한다. 일부 실시태양에서, 서열 동일성은 서열 비교 알고리즘을 사용하는 분석법 또는 시각적 조사에 의해 측정된다. 본 발명에 따른 폴리펩티드 또는 펩티드는 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 66, 서열 번호: 68, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162, 서열 번호: 164, 서열 번호: 166, 서열 번호: 168, 서열 번호: 170, 서열 번호: 172, 서열 번호: 174, 서열 번호: 176, 서열 번호: 178, 서열 번호: 180, 서열 번호: 182, 서열 번호: 184, 서열 번호: 186, 서열 번호: 188, 서열 번호: 190, 서열 번호: 192, 서열 번호: 194, 서열 번호: 196, 서열 번호: 198, 서열 번호: 200, 서열 번호: 202, 서열 번호: 204, 서열 번호: 206, 서열 번호: 208, 서열 번호: 210, 서열 번호: 212, 서열 번호: 214, 서열 번호: 216, 서열 번호: 218, 서열 번호: 220, 서열 번호: 222, 서열 번호: 224, 서열 번호: 226, 서열 번호: 228, 서열 번호: 230, 서열 번호: 232, 서열 번호: 234, 서열 번호: 236, 서열 번호: 238, 서열 번호: 240, 서열 번호: 242, 서열 번호: 244, 서열 번호: 246, 서열 번호: 248, 서열 번호: 250, 서열 번호: 252, 서열 번호: 254, 서열 번호: 256, 서열 번호: 258, 서열 번호: 260, 서열 번호: 262, 서열 번호: 264, 서열 번호: 266, 서열 번호: 268, 서열 번호: 270, 서열 번호: 272, 서열 번호: 274, 서열 번호: 276, 서열 번호: 278, 서열 번호: 280, 서열 번호: 282, 서열 번호: 284, 서열 번호: 286, 서열 번호: 288, 서열 번호: 290, 서열 번호: 292, 서열 번호: 294, 서열 번호: 296, 서열 번호: 298, 서열 번호: 300, 서열 번호: 302, 서열 번호: 304, 서열 번호: 306, 서열 번호: 308, 서열 번호: 310, 서열 번호: 312, 서열 번호: 314, 서열 번호: 316, 서열 번호: 318, 서열 번호: 320, 서열 번호: 322, 서열 번호: 324, 서열 번호: 326, 서열 번호: 328, 서열 번호: 330, 서열 번호: 332, 및 서열 번호: 334, 및 그의 부분서열, 그의 변이체 및 그 효소 활성 단편을 포함한다. 본 발명에 따른 폴리펩티드는 또한 적어도 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 75개, 80개, 85개, 90개, 95개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개 또는 그 이상의 잔기 길이의 단편, 또는 전체 길이의 효소에 걸쳐 있는 단편을 포함한다. 본 발명에 따른 폴리펩티드 또는 펩티드 서열은 본 발명에 따른 핵산에 의해 코딩되는 서열을 포함한다. 본 발명에 따른 폴리펩티드 또는 펩티드 서열은 본 발명에 따른 항체에 의해 특이적으로 결합하는 폴리펩티드 또는 펩티드(예로서, 에피토프), 또는 본 발명에 따른 항체를 생성할 수 있는 폴리펩티드 또는 펩티드(예로서, 면역원)를 포함한다.

일부 실시태양에서, 본 발명에 따른 폴리펩티드는 적어도 하나의 알돌라제 효소 활성, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는다. 다른 실시태양에서, 본 발명에 따른 폴리뉴클레오티드는 적어도 하나의 알돌라제 효소 활성, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 폴리펩티드를 코딩한다.

본 발명의 또다른 실시태양은 본 발명에 따른 폴리펩티드 또는 펩티드 서열, 그와 실질적으로 동일한 서열, 및 그에 상보적인 서열 중 적어도 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 125개, 150개 또는 그 이상의 연속된 염기를 포함하는 단리된 합성 또는 재조합 폴리펩티드 또는 펩티드이다. 펩티드는 예로서, 면역원성 단편, 모티프(예로서, 결합 부위), 신호 서열, 프리프로 서열 또는 활성 부위일 수 있다.

본 발명은 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 폴리펩티드를 코딩하는 서열 및 신호 서열을 포함하며, 본 발명에 따른 서열을 포함하는 단리된 합성 또는 재조합 핵산을 제공한다. "신호 서열"은 분비 신호 또는 숙주 세포로부터 본 발명에 따른 알돌라제의 분비를 촉진시키는 기타 도메인을 의미한다. 신호 서열은 또다른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 또는 비-알돌라제, 예로서, 비-피루베이트 알돌라제, 예로서, 비-HMG 및/또는 비-KHG-알돌라제 효소(이종) 효소로부터 유래될 수 있다. 일부 실시태양에서, 본 발명은 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 폴리펩티드를 코딩하는 서열을 포함하는 것으로, 상기 서열은 신호 서열을 함유하지 않고, 핵산은 본 발명에 따른 서열을 포함하는 것인, 단리된 합성 또는 재조합 핵산을 제공한다. 일부 실시태양에서, 본 발명은 신호 서열 모두가 또는 그중 일부가 결여되어 있는, 본 발명에 따른 폴리펩티드를 포함하는 단리된 합성 또는 재조합 폴리펩티드를 제공한다. 일부 실시태양에서, 단리된 합성 또는 재조합 폴리펩티드는 이종 신호 서열, 예로서, 이종 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 신호 서열 또는 비-알돌라제, 예로서, 비-피루베이트 알돌라제, 예로서, 비-HMG 및/또는 비-KHG-알돌라제 효소 신호 서열을 포함하는, 본 발명에 따른 폴리펩티드를 포함할 수 있다.

일부 실시태양에서, 본 발명은 본 발명에 따른 신호 서열을 포함하는 제1 도메인 및 적어도 제2 도메인을 포함하는 키메라 단백질을 제공한다. 단백질은 융합 단백질일 수 있다. 제2 도메인은 효소를 포함할 수 있다. 단백질은 비-효소일 수 있다.

본 발명은 본 발명에 따른 신호 펩티드(SP: signal peptide), 프리프로 서열 및/또는 촉매 도메인(CD: catalytic domain)을 포함하는 적어도 제1 도메인, 및 이종 폴리펩티드 또는 펩티드를 포함하는 적어도 제2 도메인을 포함하는 키메라 폴리펩티드로서, 여기서, 이종 폴리펩티드 또는 펩티드는 천연적으로는 신호 펩티드(SP), 프리프로 서열 및/또는 촉매 도메인(CD)과 결합되지 않은 것인 키메라 폴리펩티드를 제공한다. 일부 실시태양에서, 이종 폴리펩티드 또는 펩티드는 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소가 아니다. 이종 폴리펩티드 또는 펩티드는 신호 펩티드(SP), 프리프로 서열 및/또는 촉매 도메인(CD)에 대하여 아미노 말단에, 카복시 말단에, 또는 이들 양 말단에 존재할 수 있다.

본 발명은 본 발명에 따른 신호 펩티드(SP), 프리프로 도메인 및/또는 촉매 도메인(CD)을 포함하는 적어도 제1 도메인, 및 이종 폴리펩티드 또는 펩티드를 포함하는 적어도 제2 도메인을 포함하는 키메라 폴리펩티드로서, 여기서, 이종 폴리펩티드 또는 펩티드는 천연적으로는 신호 펩티드(SP), 프리프로 도메인 및/또는 촉매 도메인(CD)과 결합되지 않은 것인 키메라 폴리펩티드를 코딩하는 단리된 합성 또는 재조합 핵산을 제공한다.

본 발명은 본 발명에 따른 폴리펩티드, 예로서, 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 66, 서열 번호: 68, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162, 서열 번호: 164, 서열 번호: 166, 서열 번호: 168, 서열 번호: 170, 서열 번호: 172, 서열 번호: 174, 서열 번호: 176, 서열 번호: 178, 서열 번호: 180, 서열 번호: 182, 서열 번호: 184, 서열 번호: 186, 서열 번호: 188, 서열 번호: 190, 서열 번호: 192, 서열 번호: 194, 서열 번호: 196, 서열 번호: 198, 서열 번호: 200, 서열 번호: 202, 서열 번호: 204, 서열 번호: 206, 서열 번호: 208, 서열 번호: 210, 서열 번호: 212, 서열 번호: 214, 서열 번호: 216, 서열 번호: 218, 서열 번호: 220, 서열 번호: 222, 서열 번호: 224, 서열 번호: 226, 서열 번호: 228, 서열 번호: 230, 서열 번호: 232, 서열 번호: 234, 서열 번호: 236, 서열 번호: 238, 서열 번호: 240, 서열 번호: 242, 서열 번호: 244, 서열 번호: 246, 서열 번호: 248, 서열 번호: 250, 서열 번호: 252, 서열 번호: 254, 서열 번호: 256, 서열 번호: 258, 서열 번호: 260, 서열 번호: 262, 서열 번호: 264, 서열 번호: 266, 서열 번호: 268, 서열 번호: 270, 서열 번호: 272, 서열 번호: 274, 서열 번호: 276, 서열 번호: 278, 서열 번호: 280, 서열 번호: 282, 서열 번호: 284, 서열 번호: 286, 서열 번호: 288, 서열 번호: 290, 서열 번호: 292, 서열 번호: 294, 서열 번호: 296, 서열 번호: 298, 서열 번호: 300, 서열 번호: 302, 서열 번호: 304, 서열 번호: 306, 서열 번호: 308, 서열 번호: 310, 서열 번호: 312, 서열 번호: 314, 서열 번호: 316, 서열 번호: 318, 서열 번호: 320, 서열 번호: 322, 서열 번호: 324, 서열 번호: 326, 서열 번호: 328, 서열 번호: 330, 서열 번호: 332, 또는 서열 번호: 334의 잔기 1번 내지 14번, 1번 내지 15번, 1번 내지 16번, 1번 내지 17번, 1번 내지 18번, 1번 내지 19번, 1번 내지 20번, 1번 내지 21번, 1번 내지 22번, 1번 내지 23번, 1번 내지 24번, 1번 내지 25번, 1번 내지 26번, 1번 내지 27번, 1번 내지 28번, 1번 내지 29번, 1번 내지 30번, 1번 내지 31번, 1번 내지 32번, 1번 내지 33번, 1번 내지 34번, 1번 내지 35번, 1번 내지 36번, 1번 내지 37번, 1번 내지 38번, 1번 내지 40번, 1번 내지 41번, 1번 내지 42번, 1번 내지 43번, 1번 내지 44번, 1번 내지 45번, 1번 내지 46 또는 1번 내지 47번에 제시된 서열로 구성되거나, 그를 포함하는, 단리된 합성 또는 재조합 신호 서열(예로서, 신호 펩티드)을 제공한다. 일부 실시태양에서, 본 발명은 본 발명에 따른 폴리펩티드의 처음 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개, 45개, 46개, 47개, 48개, 49개, 50개, 51개, 52개, 53개, 54개, 55개, 56개, 57개, 58개, 59개, 60개, 61개, 62개, 63개, 64개, 65개, 66개, 67개, 68개, 69개, 70개 또는 그 이상의 아미노 말단 잔기를 포함하는 신호 서열을 제공한다.

일부 실시태양에서, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성은 단백질 1 mg당 약 10 내지 약 12,000 유닛의 비활성을 포함한다. 다른 실시태양에서, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성은 단백질 1 mg당 약 1,000 내지 약 10,000 유닛, 또는 단백질 1 mg당 약 5,000 내지 약 7,500 유닛의 비활성을 포함한다. 별법으로, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성은 단백질 1 mg당 약 10 내지 약 7,500 유닛, 또는 단백질 1 mg당 약 5,000 내지 약 12,000 유닛 범위의 비활성을 포함한다. 일부 실시태양에서, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성은 단백질 1 mg당 약 10 내지 약 5,000 유닛, 또는 단백질 1 mg당 약 7,500 내지 약 10,000 유닛 범위의 비활성을 포함한다. 다른 실시태양에서, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성은 단백질 1 mg당 약 10 내지 약 2,500 유닛 범위의 비활성을 포함한다. 별법으로, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성은 1 mg당 약 10 내지 약 1,000 유닛 범위의 비활성을 포함한다. 상이한 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소의 활성을 측정하는 예시적인 방법은 일반 기질, 4-카복시-4-하이드록시-2-옥소아디페이트("CHA: 4-carboxy-4-hydroxy-2-oxiadipate")를 사용한다. 전형적인 분석법은 50mM 인산나트륨(pH 7.5), 1mM MgCl₂, 1mM CHA, 락토바실러스 레크마니(Lactobacillus leichmanii)로부터의 10㎍/ml D-젖산 데하이드로게나제("LDH: lactate dehydrogenase")(미주리주 세인트루이스에 소재하는 Sigma-Aldrich), 0.5mM NADH를 포함한다. 측정하고자 하는 효소를 첨가함으로써 분석법은 개시된다. NAD+ 형성과 커플을 이루는 피루베이트의 유리는 340nm에서 분광광도계로 연속하여 모니터한다. 효소 활성 유닛은 340nm에서의 흡광도를 1분당 1 OD 만큼 저하시키는데 충분한 피루베이트를 유리시키는 양으로서 정의된다.

다른 실시태양에서, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소의 내열성은 고온, 예로서, 약 0℃ 내지 약 20℃, 약 20℃ 내지 약 37℃, 약 37℃ 내지 약 50℃, 약 50℃ 내지 약 70℃, 약 70℃ 내지 약 75℃, 약 75℃ 내지 약 80℃, 약 80℃ 내지 약 85℃, 약 85℃ 내지 약 90℃, 약 90℃ 내지 약 95℃, 약 95℃ 내지 약 100℃, 약 100℃ 내지 약 110℃ 또는 그 이상의 온도로 가열된 이후에 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소의 비활성의 절반 이상이 유지되는 것을 포함한다. 별법으로, 내열성은 상기 기술된 바와 같은 고온으로 가열된 이후, 단백질 1 mg당 약 10 내지 약 12,000 유닛, 또는 단백질 1 mg당 약 5,000 내지 약 10,000 유닛의 비활성을 유지하는 것을 포함할 수 있다. 다른 실시태양에서, 내열성은 상기 기술된 바와 같은 고온으로 가열된 이후, 단백질 1 mg당 약 10 내지 약 5,000 유닛의 비활성을 유지하는 것을 포함할 수 있다.

본 발명은 적어도 하나의 당화 부위를 포함하는, 본 발명에 따른 단리된 합성 또는 재조합 폴리펩티드를 제공한다. 일부 실시태양에서, 당화는 N-결합 당화일 수 있다. 일부 실시태양에서, 폴리펩티드는 P. 파스토리스(P. pastoris) 또는 S. 폼베(S. pombe) 숙주에서, 또는 포유동물 숙주 세포에서 발현된 이후에 당화될 수 있다.

일부 실시태양에서, 폴리펩티드는 약 pH 6.5, pH 6, pH 5.5, pH 5, pH 4.5, pH 4.0, pH 3.5, pH 3.0 또는 그 이하의(더 강한 산성인) pH를 포함하는 조건하에서 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 유지할 수 있다. 다른 실시태양에서, 폴리펩티드는 약 pH 7, pH 7.5, pH 8.0, pH 8.5, pH 9, pH 9.5, pH 10, pH 10.5, pH 11.0, pH 11.5, pH 12, pH 12.5 또는 그 이상의(더 강한 염기성인) pH를 포함하는 조건하에서 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 유지할 수 있다. 일부 실시태양에서, 폴리펩티드는 약 pH 6.5, pH 6, pH 5.5, pH 5, pH 4.5, pH 4.0, pH 3.5, pH 3.0 또는 그 이하의(더 강한 산성인) pH를 포함하는 조건에 노출된 이후에도 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 유지할 수 있다. 다른 실시태양에서, 폴리펩티드는 약 pH 7, pH 7.5, pH 8.0, pH 8.5, pH 9, pH 9.5, pH 10, pH 10.5, pH 11.0, pH 11.5, pH 12, pH 12.5 이상의(더 강한 염기성인) pH를 포함하는 조건에 노출된 이후에도 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 유지할 수 있다.

일부 실시태양에서, 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소는 알칼리성 조건, 예로서, 장, 예로서, 소장의 알칼리성 조건하에서 활성을 갖는다. 일부 실시태양에서, 폴리펩티드는 위의 산성 pH에 노출된 이후에도 활성을 유지할 수 있다.

본 발명은 액제, 고체제, 또는 겔제를 포함하는, 본 발명에 따른 폴리펩티드(펩티드 포함)를 포함하는 단백질 제제를 제공한다. 일부 실시태양에서, 본 발명은 본 발명에 따른 폴리펩티드, 및 제2 구성원, 예로서, 폴리펩티드 또는 다른(제2) 도메인을 포함하는 이종이합체를 제공한다. 이종이합체의 제2 구성원은 상이한 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소, 상이한 효소 또는 또다른 단백질일 수 있다. 일부 실시태양에서, 제2 도메인은 폴리펩티드일 수 있고, 이종이합체는 융합 단백질일 수 있다. 일부 실시태양에서, 제2 도메인은 에피토프 또는 태그일 수 있다. 일부 실시태양에서, 본 발명은 동종이합체, 동종삼합체, 동종사합체, 동종오합체, 및 동종육합체를 비롯한, 본 발명에 따른 폴리펩티드를 포함하는 동종다합체를 제공한다.

본 발명은 본 발명에 따른 폴리펩티드, 본 발명에 따른 핵산에 의해 코딩된 폴리펩티드, 또는 본 발명에 따른 폴리펩티드 및 제2 도메인을 포함하는 폴리펩티드를 포함하는 고정된 폴리펩티드로서, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 고정된 폴리펩티드(펩티드 포함)를 제공한다. 일부 실시태양에서, 폴리펩티드는 세포, 금속, 수지, 중합체, 세라믹, 유리, 미세전극, 흑연 입자, 비드, 겔, 플레이트, 어레이(array) 또는 모세관 상에 고정될 수 있다.

본 발명은 또한 예로서, 본 발명에 따른 프로브를 비롯한 본 발명에 따른 고정된 핵산을 포함하는 어레이를 제공한다. 일부 실시태양에서, 본 발명은 또한 본 발명에 따른 항체를 포함하는 어레이를 제공한다.

본 발명은 본 발명에 따른 폴리펩티드 또는 본 발명에 따른 핵산에 의해 코딩된 폴리펩티드에 특이적으로 결합하는 단리된 합성 또는 재조합 항체를 제공한다. 본 발명에 따른 이들 항체는 모노클로날 또는 폴리클로날 항체일 수 있다. 일부 실시태양에서, 본 발명은 본 발명에 따른 항체, 예로서, 본 발명에 따른 폴리펩티드 또는 본 발명에 따른 핵산에 의해 코딩된 폴리펩티드에 특이적으로 결합하는 항체를 포함하는 하이브리도마를 제공한다. 일부 실시태양에서, 본 발명은 이들 항체를 코딩하는 핵산을 제공한다.

본 발명은 (a) 본 발명에 따른 핵산을 제공하는 단계; (b) 폴리펩티드를 포함하는 샘플을 제공하는 단계; 및 (c) 단계 (a)의 항체가 상기 폴리펩티드에 특이적으로 결합할 수 있는 조건하에서 단계 (b)의 샘플을 상기 항체와 접촉시켜 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 폴리펩티드를 단리 또는 동정하는 단계를 포함하는, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 폴리펩티드를 단리 또는 동정하는 방법을 제공한다.

본 발명은 비인간 동물에게 본 발명에 따른 핵산 또는 본 발명에 따른 폴리펩티드 또는 그의 부분서열을 체액성 면역 반응을 일으키기에 충분한 양으로 투여하여 항-알돌라제, 예로서, 항-피루베이트 알돌라제, 예로서, 항-HMG 및/또는 항-KHG 알돌라제 효소 항체를 제조하는 단계를 포함하는, 항-알돌라제, 예로서, 항-피루베이트 알돌라제, 예로서, 항-HMG 및/또는 항-KHG 알돌라제 효소 항체를 제조하는 방법을 제공한다. 일부 실시태양에서, 본 발명은 비인간 동물에게 본 발명에 따른 핵산 또는 본 발명에 따른 폴리펩티드 또는 그의 부분서열을 면역 반응(세포성 또는 체액성)을 일으키기에 충분한 양으로 투여하는 단계를 포함하는, 항-알돌라제, 예로서, 항-피루베이트 알돌라제, 예로서, 항-HMG 및/또는 항-KHG 알돌라제 면역 반응(세포성 또는 체액성)을 일으키는 방법을 제공한다.

본 발명은 (a) 프로모터에 작동 가능하게 연결된 본 발명에 따른 핵산을 제공하는 단계; 및 (b) 폴리펩티드가 발현할 수 있도록 하는 조건하에서 단계 (a)의 핵산을 발현시켜 재조합 폴리펩티드를 생산하는 단계를 포함하는, 재조합 폴리펩티드를 생산하는 방법을 제공한다. 일부 실시태양에서, 본 방법은 숙주 세포를 단계 (a)의 핵산으로 형질전환 시킨 후, 단계 (a)의 핵산을 발현시켜 형질전환된 세포에서 재조합 폴리펩티드를 생산하는 단계를 추가로 포함할 수 있다.

본 발명은 (a) 본 발명에 따른 폴리펩티드; 또는 본 발명에 따른 핵산에 의해 코딩된 폴리펩티드를 제공하는 단계; (b) 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 기질을 제공하는 단계; 및 (c) 단계 (a)의 폴리펩티드 또는 그의 단편 또는 변이체를 단계 (b)의 기질과 접촉시키고 기질 양의 감소 또는 반응 산물 양의 증가를 검출하며, 여기서, 기질 양의 감소 또는 반응 산물 양의 증가가 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 폴리펩티드를 검출하는 것인 단계를 포함하는, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 폴리펩티드를 동정하는 방법을 제공한다. 일부 실시태양에서, 기질은 당질, 당질-포함 화합물 및/또는 당질 모사체이다.

본 발명은 (a) 본 발명에 따른 폴리펩티드; 또는 본 발명에 따른 핵산에 의해 코딩된 폴리펩티드를 제공하는 단계; (b) 시험 기질을 제공하는 단계; 및 (c) 단계 (a)의 폴리펩티드를 단계 (b)의 시험 기질과 접촉시키고 기질 양의 감소 또는 반응 산물 양의 증가를 검출하며, 여기서, 기질 양의 감소 또는 반응 산물 양의 증가가 시험 기질을 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 기질로서 동정하는 것인 단계를 포함하는, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 기질을 동정하는 방법을 제공한다.

본 발명은 (a) 핵산이 폴리펩티드로 번역될 수 있도록 허용하는 조건하에서 핵산, 또는 핵산을 포함하는 벡터를 발현시키며, 여기서, 핵산은 본 발명에 따른 핵산을 포함하는 단계, 또는 본 발명에 따른 폴리펩티드를 제공하는 단계; (b) 시험 화합물을 제공하는 단계: (c) 폴리펩티드를 시험 화합물과 접촉시키는 단계; 및 (d) 단계 (b)의 시험 화합물이 폴리펩티드에 특이적으로 결합하는지 여부를 측정하는 단계를 포함하는, 시험 화합물이 폴리펩티드에 특이적으로 결합하는지 여부를 측정하는 방법을 제공한다.

본 발명은 (a) 본 발명에 따른 폴리펩티드 또는 본 발명에 따른 핵산에 의해 코딩된 폴리펩티드를 제공하는 단계; (b) 시험 화합물을 제공하는 단계; (c) 단계 (a)의 폴리펩티드를 단계 (b)의 시험 화합물과 접촉시키고 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소의 활성을 측정하며, 여기서, 시험 화합물의 부재하에서 측정된 알돌라제 활성과 비교한, 시험 화합물의 존재하에서 측정된 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성의 변화로 상기 시험 화합물이 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 조정하는지를 결정하는 것인 단계를 포함하는, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성의 조절제를 동정하는 방법을 제공한다. 일부 실시태양에서, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성은 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 기질을 제공하고, 기질 양의 감소 또는 반응 산물 양의 증가, 또는 기질의 양 증가 또는 반응 산물의 양 감소를 검출함으로써 측정될 수 있다. 시험 화합물의 부재하에서의 기질의 양 또는 반응 산물의 양과 비교한, 시험 화합물의 존재하에서의 기질 양의 감소 또는 반응 산물 양의 증가는, 이 시험 화합물이 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성의 활성화제라는 것을 확인시켜 준다. 시험 화합물의 부재하에서의 기질의 양 또는 반응 산물의 양과 비교한, 시험 화합물의 존재하에서의 기질 양의 증가 또는 반응 산물 양의 감소는, 이 시험 화합물이 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성의 저해제임을 확인시켜 준다.

본 발명은 프로세서 및 데이타 저장 장치를 포함하며, 여기서, 상기 데이타 저장 장치는 그 위에 본 발명에 따른 폴리펩티드 서열 또는 핵선 서열(예로서, 본 발명에 따른 핵산에 의해 코딩되는 폴리펩티드 또는 펩티드)을 저장하고 있는, 컴퓨터 시스템을 제공한다. 일부 실시태양에서, 컴퓨터 시스템은 서열 비교 알고리즘, 및 그 위에 적어도 하나의 참고 서열이 저장되어 있는 데이타 저장 장치를 추가로 포함할 수 있다. 다른 실시태양에서, 서열 비교 알고리즘은 다형성을 지시하는 컴퓨터 프로그램을 포함한다. 일부 실시태양에서, 컴퓨터 시스템은 상기 서열 내 하나 이상의 특징을 동정하는 식별자(identifier)를 추가로 포함할 수 있다. 일부 실시태양에서, 본 발명은 그 위에 본 발명에 따른 폴리펩티드 서열 또는 핵선 서열이 저장되어 있는 컴퓨터 판독가능한 매체를 제공한다. 일부 실시태양에서, 본 발명은 (a) 서열에서 하나 이상의 특징을 동정하는 컴퓨터 프로그램을 이용하여 서열을 판독하며, 상기 서열은 본 발명에 따른 폴리펩티드 서열 또는 핵선 서열을 포함하는 것인 단계; 및 (b) 컴퓨터 프로그램으로 서열에서 하나 이상의 특징을 동정하는 단계를 포함하는, 서열에서 특징을 동정하는 방법을 제공한다. 일부 실시태양에서, 본 발명은 (a) 서열을 비교하는 컴퓨터 프로그램을 이용하여 제1 서열 및 제2 서열을 판독하며, 여기서, 제1 서열은 본 발명에 따른 폴리펩티드 서열 또는 핵선 서열을 포함하는 것인 단계; 및 (b) 컴퓨터 프로그램을 이용하여 제1 서열과 제2 서열 사이의 차이를 측정하는 단계를 포함하는, 제1 서열과 제2 서열을 비교하는 방법을 제공한다. 제1 서열과 제2 서열 사이의 차이를 측정하는 단계는 다형성을 동정하는 단계를 추가로 포함할 수 있다. 일부 실시태양에서, 본 발명은 서열에서 하나 이상의 특징을 동정하는 식별자를 추가로 포함할 수 있다. 다른 실시태양에서, 본 발명은 컴퓨터 프로그램을 이용하여 제1 서열을 판독하고 서열에서 하나 이상의 특징을 동정하는 단계를 포함할 수 있다.

본 발명은 (a) 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 폴리펩티드를 코딩하는 핵산을 증폭시키기 위해 증폭용 프라이머 서열 쌍을 제공하며, 여기서, 상기 프라이머 쌍은 본 발명에 따른 핵산을 증폭시킬 수 있는 것인 단계; (b) 샘플내 핵산이 증폭용 프라이머 쌍에 혼성화하는데 접근가능하도록 샘플을 핵산으로부터 단리하거나 샘플을 처리하는 단계; 및 (c) 단계 (b)의 핵산을 단계 (a)의 증폭용 프라이머 쌍과 조합하고 핵산으로부터 핵산을 증폭시켜 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 폴리펩티드를 코딩하는 핵산을 샘플로부터 단리하거나 회수하는 단계를 포함하는, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 폴리펩티드를 코딩하는 핵산을 샘플, 예로서, 환경 샘플로부터 단리하거나 회수하는 방법을 제공한다. 증폭용 프라이머 서열 쌍 중 하나 또는 각각의 구성원은 예로서, 본 발명에 따른 서열의 적어도 약 10개 내지 50개의 연속된 염기를 갖는, 본 발명에 따른 증폭용 프라이머 서열 쌍을 포함하는 올리고뉴클레오티드를 포함할 수 있다. 본 발명의 하나의 실시태양에서, 샘플은 환경 샘플이다.

본 발명은 (a) 본 발명에 따른 핵산 또는 그의 부분서열을 포함하는 폴리뉴클레오티드 프로브를 제공하고; (b) 샘플내 핵산이 단계 (a)의 폴리뉴클레오티드 프로브에 혼성화하는데 접근가능하도록 샘플을 핵산으로부터 단리하거나 샘플을 처리하는 단계; (c) 단계 (b)의 단리된 핵산 또는 처리된 샘플을 단계 (a)의 폴리뉴클레오티드 프로브와 결합하는 단계; 및 (d) (a)의 폴리뉴클레오티드 프로브와 특이적으로 혼성화하는 핵산을 단리하여 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 폴리펩티드를 코딩하는 핵산을 샘플로부터 단리하거나 회수하는 단계를 포함하는, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 폴리펩티드를 코딩하는 핵산을 샘플, 예로서, 환경 샘플로부터 단리하거나 회수하는 방법을 제공한다. 샘플은 물 샘플, 액상 샘플, 고체 샘플, 기체 샘플 또는 생물학적 샘플을 포함할 수 있다. 일부 실시태양에서, 생물학적 샘플은 박테리아 세포, 원생동물 세포, 곤충 세포, 효모 세포, 식물 세포, 진균 세포 또는 포유동물 세포로부터 유래될 수 있다. 본 발명의 하나의 실시태양에서, 샘플은 환경 샘플이다.

본 발명은 (a) 본 발명에 따른 핵산을 포함하는 주형 핵산을 제공하는 단계; 및 (b) 주형 서열에서 하나 이상의 뉴클레오티드를 변형, 결실, 또는 첨가하거나, 또는 그를 조합하여 주형 핵산의 변이체를 주형 핵산의 변이체를 생성하는 단계를 포함하는, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 폴리펩티드를 코딩하는 핵산의 변이체를 생성하는 방법을 제공한다. 일부 실시태양에서, 본 방법은 변이체 핵산을 발현시켜 변이체 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 폴리펩티드를 생성하는 것을 추가로 포함할 수 있다. 상기 변형, 추가 또는 결실은 오류 빈발 PCR, 셔플링, 올리고뉴클레오티드 지정 돌연변이 유발법, 조립 PCR, 유성 PCR 돌연변이 유발법, 생체내 돌연변이 유발법, 카세트 돌연변이 유발법, 반복적 앙상블 돌연변이 유발법, 지수적 앙상블 돌연변이 유발법, 위치 특이적 돌연변이 유발법, 유전자 재조립법, 유전자 위치 포화 돌연변이 유발법(GSSM: Gene Site Saturation Mutagenesis), 합성 결찰 재조립법(SLR: Synthetic Ligation Reassembly), 염색체 포화 돌연변이 유발법(CSM: Chromosomal Saturation Mutagenesis) 또는 그의 조합을 포함하는 방법에 의해 도입될 수 있다. 다른 실시태양에서, 상기 변형, 추가 또는 결실은 재조합법, 반복적 서열 재조합법, 포스포티오에이트 변형 DNA 돌연변이 유발법, 우라실 함유 주형 돌연변이 유발법, 갭 형성 이중체 돌연변이 유발법, 점 미스매치 수복 돌연변이 유발법, 수복 결함 숙주 균주 돌연변이 유발법, 화학적 돌연변이 유발법, 방사능에 의한 돌연변이 유발법, 결실 돌연변이 유발법, 제한 선별 돌연변이 유발법, 제한 정제 돌연변이 유발법, 인공 유전자 합성법, 앙상블 돌연변이 유발법, 키메라 핵산 다량체 생성법 및 그의 조합을 포함하는 방법에 의해 도입된다.

일부 실시태양에서, 본 방법은 주형 핵산에 의해 코딩된 폴리펩티드의 활성으로부터 변경되었거나, 그와 활성이 상이하거나, 그의 안정성으로부터 변경되었거나, 그와 안정성이 상이한 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소가 생산될 때까지 되풀이되어 반복될 수 있다. 일부 실시태양에서, 변이체 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 폴리펩티드는 내열성이며, 고온에 노출된 이후에 더 일부 활성을 유지한다. 다른 실시태양에서, 변이체 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 폴리펩티드는 주형 핵산에 의해 코딩된 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소와 비교하여 증가된 당화를 갖는다. 별법으로, 변이체 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 폴리펩티드는 고온하에 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는데, 여기서, 주형 핵산에 의해 코딩된 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소는 고온하에서는 활성이 아니다. 일부 실시태양에서, 본 방법은 주형 핵산의 코돈 선호도(codon usage)로부터 변경된 코돈 선호도를 갖는 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 코딩 서열이 생산될 때까지 되풀이되어 반복될 수 있다. 다른 실시태양에서, 본 방법은 주형 핵산보다 더욱 높거나 낮은 수준의 메세지 발현 또는 안정성을 갖는 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소가 생산될 때까지 되풀이되어 반복될 수 있다.

본 발명은 (a) 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 폴리펩티드를 코딩하는 본 발명에 따른 핵산을 제공하는 단계; (b) 단계 (a)의 핵산 내 바람직하지 않거나, 덜 바람직한 코돈을 확인하고, 그를, 대체되는 코돈과 동일한 아미노산을 코딩하는 것으로서 바람직하거나 중립적으로 사용되는 코돈으로 대체하며, 여기서, 바람직한 코돈은 숙주 세포의 유전자 중 코딩 서열에서 과다표현되는 코돈이며, 바람직하지 않거나, 덜 바람직한 코돈은 숙주 세포의 유전자 중 코딩 서열에서 불충분하게 표현되는 코돈인 것으로서, 이에 의해 핵산을 변형시킴으로써 숙주 세포에서 그의 발현을 증가시키는 것인 단계를 포함하는, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 폴리펩티드를 코딩하는 핵산 내 코돈을 변형시키는 방법을 제공한다.

본 발명은 (a) 본 발명에 따른 핵산을 제공하는 단계; 및 (b) 단계 (a)의 핵산 내 코돈을 확인하고, 그를, 대체되는 코돈과 동일한 아미노산을 코딩하는 것으로서 상이한 코돈으로 대체하여 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 코딩하는 핵산 내 코돈을 변형시키는 단계를 포함하는, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 폴리펩티드를 코딩하는 핵산 내 코돈을 변형시키는 방법을 제공한다.

본 발명은 (a) 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 폴리펩티드를 코딩하는 본 발명에 따른 핵산을 제공하는 단계; (b) 단계 (a)의 핵산 내 바람직하지 않거나, 덜 바람직한 코돈을 확인하고, 그를, 대체되는 코돈과 동일한 아미노산을 코딩하는 것으로서 바람직하거나 중립적으로 사용되는 코돈으로 대체하며, 여기서, 바람직한 코돈은 숙주 세포의 유전자 중 코딩 서열에서 과다표현되는 코돈이며, 바람직하지 않거나, 덜 바람직한 코돈은 숙주 세포의 유전자 중 코딩 서열에서 불충분하게 표현되는 코돈인 것으로서, 이에 의해 핵산을 변형시킴으로써 숙주 세포에서 그의 발현을 증가시키는 것인 단계를 포함하는, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 폴리펩티드를 코딩하는 핵산 내 코돈을 숙주 세포에서 그의 발현을 증가시키도록 변형시키는 방법을 제공한다.

본 발명은 (a) 본 발명에 따른 핵산을 제공하는 단계; 및 (b) 단계 (a)의 핵산 내 적어도 하나의 바람직한 코돈을 확인하고, 그를, 대체되는 코돈과 동일한 아미노산을 코딩하는 것으로서 바람직하지 않거나, 덜 바람직한 코돈으로 대체하며, 여기서, 바람직한 코돈은 숙주 세포의 유전자 중 코딩 서열에서 과다표현되는 코돈이며, 바람직하지 않거나, 덜 바람직한 코돈은 숙주 세포의 유전자 중 코딩 서열에서 불충분하게 표현되는 코돈인 것으로서, 이에 의해 핵산을 변형시킴으로써 숙주 세포에서 그의 발현을 감소시키는 것인 단계를 포함하는, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 폴리펩티드를 코딩하는 핵산 내 코돈을 숙주 세포에서 그의 발현을 감소시키도록 변형시키는 방법을 제공한다. 일부 실시태양에서, 숙주 세포는 박테리아 세포, 진균 세포, 곤충 세포, 효모 세포, 식물 세포 또는 포유동물 세포일 수 있다.

본 발명은 (a) 제1 활성 부위 또는 제1 기질 결합 부위를 코딩하는 제1 핵산을 제공하며, 여기서, 제1 핵산 서열은 엄격한 조건하에서 본 발명에 따른 핵산에 혼성화하는 서열을 포함하고, 상기 핵산은 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 활성 부위 또는 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 기질 결합 부위를 코딩하는 것인 단계; (b) 제1 핵산 내 다수의 표적화된 코돈에 천연적으로 발생된 아미노산 변이체를 코딩하는 돌연변이 유발성 올리고뉴클레오티드 세트를 제공하는 단계; 및 (c) 상기의 돌연변이 유발성 올리고뉴클레오티드 세트를 사용하여 돌연변이가 일어난 각각의 아미노산 코돈에서 일련의 아미노산 변이를 코딩하는 활성 부위 코딩 또는 기질 결합 부위 코딩 변이체 세트를 생성하여 다수의 변형된 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성 부위 또는 기질 결합 부위를 코딩하는 핵산의 라이브러리를 제조하는 단계를 포함하는, 다수의 변형된 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성 부위 또는 기질 결합 부위를 코딩하는 핵산 라이브러리를 제조하며, 여기서, 변형된 활성 부위 또는 기질 결합 부위는 제1 활성 부위 또는 제1 기질 결합 부위를 코딩하는 서열을 포함하는 제1 핵산으로부터 유래되는 것인 방법을 제공한다. 일부 실시태양에서, 본 방법은 최적화된 유도 진화 시스템, 유전자 위치 포화 돌연변이 유발법(GSSM), 합성 결찰 재조립법(SLR), 오류 빈발 PCR, 셔플링, 올리고뉴클레오티드 지정 돌연변이 유발법, 조립 PCR, 유성 PCR 돌연변이 유발법, 생체내 돌연변이 유발법, 카세트 돌연변이 유발법, 반복적 앙상블 돌연변이 유발법, 지수적 앙상블 돌연변이 유발법, 위치 특이적 돌연변이 유발법, 유전자 재조립법, 및 그의 조합을 포함하는 방법에 의해 단계 (a)의 제1 핵산을 돌연변이화시키는 단계를 포함한다. 다른 실시태양에서, 본 방법은 재조합법, 반복적 서열 재조합법, 포스포티오에이트 변형 DNA 돌연변이 유발법, 우라실 함유 주형 돌연변이 유발법, 갭 형성 이중체 돌연변이 유발법, 점 미스매치 수복 돌연변이 유발법, 수복 결함 숙주 균주 돌연변이 유발법, 화학적 돌연변이 유발법, 방사능에 의한 돌연변이 유발법, 결실 돌연변이 유발법, 제한 선별 돌연변이 유발법, 제한 정제 돌연변이 유발법, 인공 유전자 합성법, 앙상블 돌연변이 유발법, 키메라 핵산 다량체 생성법 및 그의 조합을 포함하는 방법에 의해 단계 (a)의 제1 핵산 또는 그의 변이체를 돌연변이화시키는 단계를 포함한다.

본 발명은 (a) 소분자를 합성하거나 변형시킬 수 있는 다수의 생합성 효소를 제공하며, 여기서, 효소들 중 하나는 본 발명에 따른 핵산에 의해 코딩되는 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 포함하는 것인 단계; (b) 단계 (a)의 효소들 중 적어도 하나에 대한 기질을 제공하는 단계; 및 (c) 다수의 생체 촉매 반응을 촉진하는 조건하에서 단계 (b)의 기질과 상기 효소를 반응시켜 일련의 생체 촉매 반응에 의해 소분자를 생성하는 단계를 포함하는, 소분자를 제조하는 방법을 제공한다. 일부 실시태양에서, 본 발명은 (a) 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 제공하며, 여기서, 상기 효소는 본 발명에 따른 폴리펩티드, 또는 본 발명에 따른 핵산, 또는 그의 부분서열에 의해 코딩된 폴리펩티드를 포함하는 것인 단계; (b) 소분자를 제공하는 단계; 및 (c) 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소에 의해 촉진되는 효소 반응을 촉진하는 조건하에서 단계 (a)의 효소를 단계 (b)의 소분자와 반응시켜 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 반응에 의해 소분자를 변형시키는 단계를 포함하는, 소분자를 변형시키는 방법을 제공한다. 일부 실시태양에서, 본 방법은 단계 (a)의 효소에 대한 다수의 소분자 기질을 포함함으로써 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소에 의해 촉진되는 적어도 하나의 효소 반응에 의해 생산되는 변형된 소분자의 라이브러리를 생성하는 단계를 포함할 수 있다. 일부 실시태양에서, 본 방법은 다수의 효소 반응에 의해 생산되는 변형된 소분자의 라이브러리를 형성하기 위하여 효소에 의해 다수의 생체 촉매 반응을 촉진하는 조건하에 다수의 추가적인 효소를 포함할 수 있다. 다른 실시태양에서, 본 방법은 원하는 활성을 나타내는 변형된 특정 소분자가 라이브러리 내에 존재하는지 여부를 여부를 결정하기 위해 라이브러리를 시험하는 단계를 추가로 포함할 수 있다. 라이브러리를 시험하는 단계는 원하는 활성을 갖는 변형된 특정 소분자의 존재 또는 부재에 대해 변형된 소분자의 일부를 시험함으로써, 라이브러리내 다수의 변형된 소분자 중 일부를 생산하는 데 사용된 생체 촉매 반응 중 하나를 제외하고는 모두 체계적으로 제외시키고, 원하는 활성을 갖는 변형된 특정 소분자를 생산하는 적어도 하나의 특정 생체 촉매 반응을 확인하는 단계를 추가로 포함할 수 있다.

본 발명은 (a) 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 제공하며, 여기서, 본 발명에 따른 폴리펩티드, 또는 본 발명에 따른 핵산, 또는 그의 부분서열에 의해 코딩된 폴리펩티드를 포함하는 것인 단계; 및 (b) 다수의 아미노산 잔기를 단계 (a)의 서열로부터 결실시키고, 나머지 부분서열을 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성에 대하여 시험하여 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소의 기능성 단편을 결정하는 것인 단계를 포함하는, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소의 기능성 단편을 결정하는 방법을 제공한다. 일부 실시태양에서, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성은 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 기질을 제공하고, 기질 양의 감소 또는 반응 산물 양의 증가를 검출함으로써 측정된다.

본 발명은 (a) 세포의 유전자 조성을 변형시켜 변형된 세포를 제조하며, 여기서, 본 발명에 따른 핵산을 세포에 첨가함으로써 유전자 조성을 변형시키는 것인 단계; (b) 변형된 세포를 배양하여 다수의 변형된 세포를 생성하는 단계; (c) 단계 (b)의 세포 배양물을 실시간으로 모니터링하여 세포의 적어도 하나의 대사 매개 변수를 측정하는 단계; 및, (d) 단계 (c)의 데이타를 분석하여 측정된 매개 변수가 유사한 조건하에서 측정된 변형되지 않은 세포에서의 유사한 측정치와 상이한지 여부를 결정함으로써, 실시간 대사 흐름 분석법(real-time metabolic flux analysis)을 이용하여 세포 내의 조작된 표현형을 확인하는 단계를 포함하는, 실시간 대사 흐름 분석을 사용하여 신규 또는 변형 표현형의 전 세포를 조작하는 방법을 제공한다. 일부 실시태양에서, 세포의 유전자 조성은 서열 결실, 또는 세포내 서열의 변형, 또는 유전자 발현의 넉아웃(knock-out)을 포함하는 방법에 의해 변형될 수 있다. 일부 실시태양에서, 본 방법은 새로 조작된 표현형을 포함하는 세포를 선별하는 단계를 추가로 포함할 수 있다. 다른 실시태양에서, 본 방법은 선별된 세포를 배양하며 새로 조작된 표현형을 포함하는 신규의 세포 균주를 생성하는 단계를 포함할 수 있다.

본 발명은 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 폴리펩티드를 당화시켜 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 폴리펩티드의 내열성 또는 열안정성을 증가시키는 것인 단계를 포함하며, 여기서, 상기 폴리펩티드는 본 발명에 따른 폴리펩티드; 또는 본 발명에 따른 핵산 서열에 의해 코딩되는 폴리펩티드 중 적어도 30개의 연속된 아미노산을 포함하는 것인, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 폴리펩티드의 내열성 또는 열안정성을 증가시키는 방법을 제공한다. 일부 실시태양에서, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 비활성은 약 37℃ 내지 약 95℃ 초과 범위의 온도에서 열안정성이거나 내열성일 수 있다.

본 발명은 본 발명에 따른 핵산을 포함하는 핵산 또는 본 발명에 따른 핵산 서열을 포함하는 벡터를 발현시키며, 여기서, 서열 동일성은 서열 비교 알고리즘을 사용하는 분석법 또는 시각적 조사에 의해 측정되고, 여기서, 과발현은 고활성 프로모터, 이시스트론 벡터(dicistronic vector)의 사용 또는 상기 벡터의 유전자 증폭에 의해 이루어지는 것인 단계를 포함하는, 세포에서 재조합 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 폴리펩티드를 과발현시키는 방법을 제공한다.

본 발명은 (a) 이종 핵산 서열을 세포에 도입하여 형질전환된 식물 세포를 제조하며, 여기서, 이종 핵산 서열은 본 발명 따른 핵산 서열을 포함하는 것인 단계; 및 (b) 형질전환된 세포로부터 트랜스제닉 식물을 생산하는 단계를 포함하는, 트랜스제닉 식물을 제공하는 방법을 제공한다. 일부 실시태양에서, 단계 (a)는 식물 세포 원형질체의 전기천공법 또는 미세주입법에 의해 이종 핵산 서열을 도입하는 단계를 추가로 포함할 수 있다. 다른 실시태양에서, 단계 (a)는 DNA 입자 분사법(DNA particle bombardment)에 의해 식물 조직에 이종 핵산 서열을 직접 도입시키는 단계를 추가로 포함할 수 있다. 별법으로, 단계 (a)는 아그로박테리움 튜메페이션스(Agrobacterium tumefaciens) 숙주를 사용하여 식물 세포 DNA 내로 이종 핵산 서열을 직접 도입시키는 단계를 추가로 포함할 수 있다.

본 발명은 (a) 프로모터에 작동 가능하게 연결된 이종 핵산 서열로 식물 세포를 형질전환시키며, 여기서, 상기 이종 핵산 서열은 본 발명에 따른 핵산을 포함하는 것인 단계; 및 (b) 상기 이종 핵산 서열이 식물 세포에서 발현되는 조건하에서 식물을 재배하는 단계를 포함하는, 식물 세포에서 이종 핵산 서열을 발현시키는 방법을 제공한다. 일부 실시태양에서, 본 발명은 (a) 프로모터에 작동 가능하게 연결된 이종 핵산 서열로 식물 세포를 형질전환시키며, 여기서, 상기 이종 핵산 서열은 본 발명에 따른 서열을 포함하는 것인 단계; 및 (b) 상기 이종 핵산 서열이 식물 세포에서 발현되는 조건하에서 식물을 재배하는 단계를 포함하는, 식물 세포에서 이종 핵산 서열을 발현시키는 방법을 제공한다.

본 발명은 본 발명에 따른 폴리펩티드, 또는 본 발명에 따른 핵산에 의해 코딩된 폴리펩티드를 포함하는 사료 또는 식품을 제공한다. 일부 실시태양에서, 본 발명은 본 발명에 따른 폴리펩티드를 포함하는, 식품, 사료, 액체, 예로서, 음료(예로서, 과즙 또는 맥주), 빵 또는 가루 반죽 또는 빵 제품, 또는 음료 전구 물질(예로서, 맥아즙)을 제공한다. 다른 실시태양에서, 본 발명은 본 발명에 따른 폴리펩티드를 포함하는 식품, 사료, 또는 음료 첨가제를 제공한다. 일부 실시태양에서, 본 발명은 본 발명에 따른 폴리펩티드, 예로서, 본 발명에 따른 핵산에 의해 코딩된 폴리펩티드를 포함하는 것으로서, 예로서, 인간 또는 동물용 식품 또는 영양 보충제를 제공한다.

일부 실시태양에서, 식품 또는 영양 보충제 내의 폴리펩티드는 당화된 것일 수 있다. 일부 실시태양에서, 본 발명은 본 발명에 따른 폴리펩티드, 예로서, 예로서, 본 발명에 따른 핵산에 의해 코딩된 폴리펩티드를 포함하는 식용 효소 전달 매트릭스를 제공한다. 일부 실시태양에서, 전달 매트릭스는 펠릿을 포함한다. 일부 실시태양에서, 폴리펩티드는 당화된 것일 수 있다. 일부 실시태양에서, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성은 내열성이다. 다른 실시태양에서, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성은 열안정성이다.

본 발명은 본 발명에 따른 폴리펩티드를 포함하는 식품, 사료 또는 영양 보충제를 제공한다. 일부 실시태양에서, 본 발명은 본 발명에 따른 폴리펩티드 중 적어도 30개의 연속된 아미노산을 포함하는 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 함유하는 영양 보충제를 제조하는 단계; 및 상기 영양 보충제를 동물에게 투여하는 단계를 포함하는, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 동물 사료의 영양 보충제로서 사용하는 방법을 제공한다. 상기 동물은 인간, 또는 반추위 동물 또는 단위 동물일 수 있다. 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소는 박테리아, 효모, 식물, 곤충, 진균 및 동물로 구성된 군으로부터 선택되는 유기체에서 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 코딩하는 폴리뉴클레오티드를 발현시킴으로써 제조될 수 있다. 유기체는 S. 폼베, S. 세레비지아에(S. cerevisiae), 피치아 파스토리스(Pichia pastoris), E. 콜라이(E. coli), 스트렙토마이세스 종(Streptomyces sp.), 바실러스 종(Bacillus sp.), 슈도모나스 종(Pseudomonas sp.), 아스퍼질러스 종(Aspergillus sp.) 및 락토바실러스 종(Lactobacillus sp.)으로 구성된 군으로부터 선택될 수 있다.

본 발명은 열안정성 재조합 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소, 예로서, 본 발명에 따른 폴리펩티드를 포함하는 식용 효소 전달 매트릭스를 제공한다. 일부 실시태양에서, 본 발명은 과립형 식용 담체와 열안정성 재조합 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 포함하는 펠릿 형태의 식용 효소 전달 매트릭스를 제조하며, 여기서, 상기 펠릿은 이에 함유되어 있는 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 수성 매질에 용이하게 분산시키는 것인 단계, 및 상기 식용 효소 전달 매트릭스를 동물에게 투여하는 단계를 포함하는, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 보충제를 동물에게 전달하는 방법을 제공한다. 재조합 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소는 본 발명에 따른 폴리펩티드를 포함할 수 있다. 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소는 당화되어 펠릿화 조건에서 열안정성을 가질 수 있다. 상기 전달 매트릭스는 곡물 배아 및 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 포함하는 혼합물을 펠릿화함으로써 형성될 수 있다. 상기 펠릿화 조건은 증기 처리를 포함할 수 있다. 상기 펠릿화 조건은 약 5분 동안 약 80℃ 이상의 온도로 처리하는 것을 포함할 수 있으며, 이때 상기 효소는, 효소 1 mg당 적어도 350 내지 약 900 유닛의 비활성을 유지한다.

일부 실시태양에서, 본 발명은 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소, 또는 본 발명에 따른 핵산에 의해 코딩된 폴리펩티드를 포함하는 약제학적 조성물을 제공한다. 일부 실시태양에서, 본 약제학적 조성물은 소화 보조제로서 작용한다.

일부 실시태양에서, 탄소-탄소 결합 함유 화합물은 알돌라제 효소 활성, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 본 발명에 따른 폴리펩티드와 약 pH 3.0 내지 약 9.0, 약 3.0 내지 약 10.0, 약 3.0 내지 약 11.0 또는 그 이상의 범위에서 접촉하게 된다. 다른 실시태양에서, 탄소-탄소 결합 함유 화합물은 적어도 약 55℃, 60℃, 65℃, 70℃, 75℃, 80℃, 85℃, 90℃ 또는 그 이상의 온도에서 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소와 접촉하게 된다.

본 개시는 그중에서도 특히 모나틴, 모나틴 유도체, 및 그의 염을 생산하는 과정에서, 예를 들면, R-2-하이드록시 2-(인돌-3일메틸)-4-케토 글루타르산(또한 R-알파 케토산 모나틴, R-모나틴 전구체인 R-MP, 및 모나틴의 알파 케토 형태), 모나틴의 특정 입체이성체에 대한 전구체, 예로서, R,R 및 S,R 모나틴의 생산에서 반응을 촉진시키는데 유용한 폴리펩티드를 제공한다. 본 개시는 또한 본 발명의 하나 이상의 폴리펩티드를 사용하여 모나틴, 모나틴 유도체, 및 그의 염 및 내부 축합 산물을 제조하는 방법을 제공한다. R-MP, 모나틴의 입체이성체 및/또는 모나틴 유도체의 입체이성체를 합성하는 방법은 알돌라제 활성을 갖는, 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 66, 서열 번호: 68, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162, 서열 번호: 164, 서열 번호: 166, 서열 번호: 168, 서열 번호: 170, 서열 번호: 172, 서열 번호: 174, 서열 번호: 176, 서열 번호: 178, 서열 번호: 180, 서열 번호: 182, 서열 번호: 184, 서열 번호: 186, 서열 번호: 188, 서열 번호: 190, 서열 번호: 192, 서열 번호: 194, 서열 번호: 196, 서열 번호: 198, 서열 번호: 200, 서열 번호: 202, 서열 번호: 204, 서열 번호: 206, 서열 번호: 208, 서열 번호: 210, 서열 번호: 212, 서열 번호: 214, 서열 번호: 216, 서열 번호: 218, 서열 번호: 220, 서열 번호: 222, 서열 번호: 224, 서열 번호: 226, 서열 번호: 228, 서열 번호: 230, 서열 번호: 232, 서열 번호: 234, 서열 번호: 236, 서열 번호: 238, 서열 번호: 240, 서열 번호: 242, 서열 번호: 244, 서열 번호: 246, 서열 번호: 248, 서열 번호: 250, 서열 번호: 252, 서열 번호: 254, 서열 번호: 256, 서열 번호: 258, 서열 번호: 260, 서열 번호: 262, 서열 번호: 264, 서열 번호: 266, 서열 번호: 268, 서열 번호: 270, 서열 번호: 272, 서열 번호: 274, 서열 번호: 276, 서열 번호: 278, 서열 번호: 280, 서열 번호: 282, 서열 번호: 284, 서열 번호: 286, 서열 번호: 288, 서열 번호: 290, 서열 번호: 292, 서열 번호: 294, 서열 번호: 296, 서열 번호: 298, 서열 번호: 300, 서열 번호: 302, 서열 번호: 304, 서열 번호: 306, 서열 번호: 308, 서열 번호: 310, 서열 번호: 312, 서열 번호: 314, 서열 번호: 316, 서열 번호: 318, 서열 번호: 320, 서열 번호: 322, 서열 번호: 324, 서열 번호: 326, 서열 번호: 328, 서열 번호: 330, 서열 번호: 332, 및 서열 번호: 334 중 임의의 것의 하나 이상의 폴리펩티드, 및 그 효소 활성 단편을 사용하는 것을 포함한다.

또한, R-MP, 모나틴의 입체이성체 및/또는 모나틴 유도체의 입체이성체를 합성하는 방법은 적어도 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 75개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개, 650개, 700개, 750개, 800개, 850개, 900개, 950개, 1000개, 1050개, 1100개, 1150개, 1200개, 1250개, 1300개, 1350개, 1400개, 1450개, 1500개, 1550개, 1600개, 1650개, 1700개, 1750개, 1800개, 1850개, 1900개, 1950개, 2000개, 2050개, 2100개, 2200개, 2250개, 2300개, 2350개, 2400개, 2450개, 2500개 또는 그 이상 잔기로 이루어진 영역에 걸쳐서 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 67, 서열 번호: 69, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161, 서열 번호: 163, 서열 번호: 165, 서열 번호: 167, 서열 번호: 169, 서열 번호: 171, 서열 번호: 173, 서열 번호: 175, 서열 번호: 177, 서열 번호: 179, 서열 번호: 181, 서열 번호: 183, 서열 번호: 185, 서열 번호: 187, 서열 번호: 189, 서열 번호: 191, 서열 번호: 193, 서열 번호: 195, 서열 번호: 197, 서열 번호: 199, 서열 번호: 201, 서열 번호: 203, 서열 번호: 205, 서열 번호: 207, 서열 번호: 209, 서열 번호: 211, 서열 번호: 213, 서열 번호: 215, 서열 번호: 217, 서열 번호: 219, 서열 번호: 221, 서열 번호: 223, 서열 번호: 225, 서열 번호: 227, 서열 번호: 229, 서열 번호: 231, 서열 번호: 233, 서열 번호: 235, 서열 번호: 237, 서열 번호: 239, 서열 번호: 241, 서열 번호: 243, 서열 번호: 245, 서열 번호: 247, 서열 번호: 249, 서열 번호: 251, 서열 번호: 253, 서열 번호: 255, 서열 번호: 257, 서열 번호: 259, 서열 번호: 261, 서열 번호: 263, 서열 번호: 265, 서열 번호: 267, 서열 번호: 269, 서열 번호: 271, 서열 번호: 273, 서열 번호: 275, 서열 번호: 277, 서열 번호: 279, 서열 번호: 281, 서열 번호: 283, 서열 번호: 285, 서열 번호: 287, 서열 번호: 289, 서열 번호: 291, 서열 번호: 293, 서열 번호: 295, 서열 번호: 297, 서열 번호: 299, 서열 번호: 301, 서열 번호: 303, 서열 번호: 305, 서열 번호: 307, 서열 번호: 309, 서열 번호: 311, 서열 번호: 313, 서열 번호: 315, 서열 번호: 317, 서열 번호: 319, 서열 번호: 321, 서열 번호: 323, 서열 번호: 325, 서열 번호: 327, 서열 번호: 329, 서열 번호: 331, 서열 번호: 333, 서열 번호: 335, 서열 번호: 336, 서열 번호: 337, 및 서열 번호: 338을 비롯한 본 발명에 따른 핵산과 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의, 또는 완벽한(100%) 서열 동일성을 갖는 핵산 서열에 의해 코딩되는, 알돌라제 활성을 갖는 폴리펩티드를 사용하는 것을 포함할 수 있다.

더욱이, R-MP, 모나틴의 입체이성체 및/또는 모나틴 유도체의 입체이성체를 합성하는 방법은 엄격한 조건하에 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 67, 서열 번호: 69, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161, 서열 번호: 163, 서열 번호: 165, 서열 번호: 167, 서열 번호: 169, 서열 번호: 171, 서열 번호: 173, 서열 번호: 175, 서열 번호: 177, 서열 번호: 179, 서열 번호: 181, 서열 번호: 183, 서열 번호: 185, 서열 번호: 187, 서열 번호: 189, 서열 번호: 191, 서열 번호: 193, 서열 번호: 195, 서열 번호: 197, 서열 번호: 199, 서열 번호: 201, 서열 번호: 203, 서열 번호: 205, 서열 번호: 207, 서열 번호: 209, 서열 번호: 211, 서열 번호: 213, 서열 번호: 215, 서열 번호: 217, 서열 번호: 219, 서열 번호: 221, 서열 번호: 223, 서열 번호: 225, 서열 번호: 227, 서열 번호: 229, 서열 번호: 231, 서열 번호: 233, 서열 번호: 235, 서열 번호: 237, 서열 번호: 239, 서열 번호: 241, 서열 번호: 243, 서열 번호: 245, 서열 번호: 247, 서열 번호: 249, 서열 번호: 251, 서열 번호: 253, 서열 번호: 255, 서열 번호: 257, 서열 번호: 259, 서열 번호: 261, 서열 번호: 263, 서열 번호: 265, 서열 번호: 267, 서열 번호: 269, 서열 번호: 271, 서열 번호: 273, 서열 번호: 275, 서열 번호: 277, 서열 번호: 279, 서열 번호: 281, 서열 번호: 283, 서열 번호: 285, 서열 번호: 287, 서열 번호: 289, 서열 번호: 291, 서열 번호: 293, 서열 번호: 295, 서열 번호: 297, 서열 번호: 299, 서열 번호: 301, 서열 번호: 303, 서열 번호: 305, 서열 번호: 307, 서열 번호: 309, 서열 번호: 311, 서열 번호: 313, 서열 번호: 315, 서열 번호: 317, 서열 번호: 319, 서열 번호: 321, 서열 번호: 323, 서열 번호: 325, 서열 번호: 327, 서열 번호: 329, 서열 번호: 331, 서열 번호: 333, 서열 번호: 335, 서열 번호: 336, 서열 번호: 337, 및 서열 번호: 338의 핵산에 혼성화하는 핵산 서열에 의해 코딩되는, 알돌라제 활성을 갖는 폴리펩티드를 사용하는 것을 포함할 수 있다.

본 발명은 다단계 경로로 모나틴, 모나틴 유도체, 그의 염, 및 그의 조합으로부터 선택되는 산물을 생산하는 방법으로서, 여기서, 상기 경로 중 반응은 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 64, 서열 번호: 66, 서열 번호: 68, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162, 서열 번호: 164, 서열 번호: 166, 서열 번호: 168, 서열 번호: 170, 서열 번호: 172, 서열 번호: 174, 서열 번호: 176, 서열 번호: 178, 서열 번호: 180, 서열 번호: 182, 서열 번호: 184, 서열 번호: 186, 서열 번호: 188, 서열 번호: 190, 서열 번호: 192, 서열 번호: 194, 서열 번호: 196, 서열 번호: 198, 서열 번호: 200, 서열 번호: 204, 서열 번호: 206, 서열 번호: 208, 서열 번호: 210, 서열 번호: 212, 서열 번호: 214, 서열 번호: 216, 서열 번호: 218, 서열 번호: 220, 서열 번호: 222, 서열 번호: 224, 서열 번호: 226, 서열 번호: 228, 서열 번호: 230, 서열 번호: 232, 서열 번호: 234, 서열 번호: 236, 서열 번호: 238, 서열 번호: 240, 서열 번호: 242, 서열 번호: 244, 서열 번호: 246, 서열 번호: 248, 서열 번호: 250, 서열 번호: 252, 서열 번호: 254, 서열 번호: 256, 서열 번호: 258, 서열 번호: 260, 서열 번호: 262, 서열 번호: 264, 서열 번호: 266, 서열 번호: 268, 서열 번호: 270, 서열 번호: 272, 서열 번호: 274, 서열 번호: 276, 서열 번호: 278, 서열 번호: 282, 서열 번호: 284, 서열 번호: 286, 서열 번호: 288, 서열 번호: 290, 서열 번호: 292, 서열 번호: 294, 서열 번호: 296, 서열 번호: 298, 서열 번호: 300, 서열 번호: 302, 서열 번호: 304, 서열 번호: 306, 서열 번호: 308, 서열 번호: 310, 서열 번호: 312, 서열 번호: 314, 서열 번호: 316, 서열 번호: 318, 서열 번호: 320, 서열 번호: 322, 서열 번호: 324, 서열 번호: 326, 서열 번호: 328, 서열 번호: 330, 서열 번호: 332, 또는 서열 번호: 334의 아미노산 서열을 포함하는 단리된 폴리펩티드 또는 재조합 폴리펩티드로부터 선택되는 하나 이상의 폴리펩티드, 또는 알돌라제 활성을 갖는 그의 단편 또는 부분서열에 의해 촉진되는 것인 방법을 제공한다. 일부 실시태양에서, 그의 단편 또는 부분서열은 적어도 0.2mg MP/mg 단백질/hr의 알돌라제 활성을 갖는다. 다른 실시태양에서, 그의 단편 또는 부분서열은 적어도 0.1 mg MP/mg 단백질/hr의 알돌라제 활성을 갖는다. 일부 실시태양에서, 하나 이상의 본 발명에 따른 폴리펩티드에 의해 촉진되는 반응은 약 1.0 내지 약 10.0mM MgCl₂에서 실시된다. 다른 실시태양에서, 하나 이상의 본 발명에 따른 폴리펩티드에 의해 촉진되는 반응은 약 pH 7.0 내지 약 pH 11.5에서 실시된다. 추가의 다른 실시태양에서, 하나 이상의 본 발명에 따른 폴리펩티드에 의해 촉진되는 반응은 약 0.005% 내지 약 1% 폴리소르베이트 세제에서 실시된다.

일부 실시태양에서, 반응은 인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응이다. 일부 실시태양에서, 반응은 S-2-하이드록시-2-(인돌-3-일-메틸)-4-케토글루타르산보다는 우선적으로 R-2-하이드록시-2-(인돌-3-일-메틸)-4-케토글루타르산을 생산한다.

일부 실시태양에서, 다단계에 의해 제조된 산물은 모나틴, 그의 염 및 그의 조합이다.

다른 실시태양에서, R,R-모나틴, R-S 모나틴, 또는 그의 조합 중 적어도 하나는 다단계 경로에서 S,S-모나틴 또는 S,R-모나틴, 둘 중 어느 것보다도 더 큰 양으로 생산된다. 일부 실시태양에서, R,R 모나틴은 다단계 경로에서 R,S-모나틴, S,S-모나틴 및 S,R-모나틴보다 더 큰 양으로 생산된다.

본 발명은 다단계 경로로 모나틴, 모나틴 유도체, 그의 염, 및 그의 조합으로부터 선택되는 산물을 생산하며, 여기서, 상기 경로 중 반응이 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 67, 서열 번호: 69, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161, 서열 번호: 163, 서열 번호: 165, 서열 번호: 167, 서열 번호: 169, 서열 번호: 171, 서열 번호: 173, 서열 번호: 175, 서열 번호: 177, 서열 번호: 179, 서열 번호: 181, 서열 번호: 183, 서열 번호: 185, 서열 번호: 187, 서열 번호: 189, 서열 번호: 191, 서열 번호: 193, 서열 번호: 195, 서열 번호: 197, 서열 번호: 199, 서열 번호: 203, 서열 번호: 205, 서열 번호: 207, 서열 번호: 209, 서열 번호: 211, 서열 번호: 213, 서열 번호: 215, 서열 번호: 217, 서열 번호: 219, 서열 번호: 221, 서열 번호: 223, 서열 번호: 225, 서열 번호: 227, 서열 번호: 229, 서열 번호: 231, 서열 번호: 233, 서열 번호: 235, 서열 번호: 237, 서열 번호: 239, 서열 번호: 241, 서열 번호: 243, 서열 번호: 245, 서열 번호: 247, 서열 번호: 249, 서열 번호: 251, 서열 번호: 253, 서열 번호: 255, 서열 번호: 257, 서열 번호: 259, 서열 번호: 261, 서열 번호: 263, 서열 번호: 265, 서열 번호: 267, 서열 번호: 269, 서열 번호: 271, 서열 번호: 273, 서열 번호: 275, 서열 번호: 277, 서열 번호: 281, 서열 번호: 283, 서열 번호: 285, 서열 번호: 287, 서열 번호: 289, 서열 번호: 291, 서열 번호: 293, 서열 번호: 295, 서열 번호: 297, 서열 번호: 299, 서열 번호: 301, 서열 번호: 303, 서열 번호: 305, 서열 번호: 307, 서열 번호: 309, 서열 번호: 311, 서열 번호: 313, 서열 번호: 315, 서열 번호: 317, 서열 번호: 319, 서열 번호: 321, 서열 번호: 323, 서열 번호: 325, 서열 번호: 327, 서열 번호: 329, 서열 번호: 331, 서열 번호: 333, 서열 번호: 335, 서열 번호: 336, 서열 번호: 337, 또는 서열 번호: 338과 적어도 50%의 서열 동일성(%)을 갖는 서열을 포함하는 핵산 서열에 의해 코딩되는 적어도 하나의 폴리펩티드에 의해 촉진되는 것인 단계를 포함하는 방법을 제공한다. 일부 실시태양에서, 서열 동일성(%)은 적어도 95%이다. 다른 실시태양에서, 서열 동일성(%)은 100%이다.

본 발명은 S-2-하이드록시-2-(인돌-3-일-메틸)-4-케토글루타르산보다는 우선적으로 R-2-하이드록시-2-(인돌-3-일-메틸)-4-케토글루타르산을 생산하는 반응을 포함하며, 여기서, 서열 번호: 28, 서열 번호: 116, 서열 번호: 298, 서열 번호: 44, 서열 번호: 54, 서열 번호: 148, 서열 번호: 46, 서열 번호: 134, 서열 번호: 142, 서열 번호: 122, 서열 번호: 74, 서열 번호: 64, 서열 번호: 108, 서열 번호: 96, 서열 번호: 126, 서열 번호: 80, 서열 번호: 36, 서열 번호: 62, 서열 번호: 112, 서열 번호: 130, 서열 번호: 94, 서열 번호: 58, 서열 번호: 50, 서열 번호: 106, 서열 번호: 42, 서열 번호: 278, 서열 번호: 162, 서열 번호: 276, 서열 번호: 178, 서열 번호: 166, 서열 번호: 218, 서열 번호: 224, 서열 번호: 226, 서열 번호: 244, 서열 번호: 250, 서열 번호: 252, 서열 번호: 264, 서열 번호: 268, 서열 번호: 272, 서열 번호: 184, 서열 번호: 282, 서열 번호: 186, 서열 번호: 192, 서열 번호: 200, 서열 번호: 284, 서열 번호: 172, 서열 번호: 180, 서열 번호: 168, 서열 번호: 228, 서열 번호: 236, 서열 번호: 238, 서열 번호: 240, 및 서열 번호: 156과 적어도 95%의 서열 동일성을 갖는 서열을 포함하는 핵산 서열에 의해 코딩되는 적어도 하나의 폴리펩티드는 다단계 경로 중 하나의 반응을 촉진시키기 위해 사용되는 것인 것을 포함하는 방법을 제공한다.

본 발명은 다단계 경로로 모나틴, 모나틴 유도체, 그의 염, 및 그의 조합으로부터 선택되는 산물을 생산하며, 여기서, 상기 경로 중의 반응은 엄격한 조건하에 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 63, 서열 번호: 65, 서열 번호: 67, 서열 번호: 69, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161, 서열 번호: 163, 서열 번호: 165, 서열 번호: 167, 서열 번호: 169, 서열 번호: 171, 서열 번호: 173, 서열 번호: 175, 서열 번호: 177, 서열 번호: 179, 서열 번호: 181, 서열 번호: 183, 서열 번호: 185, 서열 번호: 187, 서열 번호: 189, 서열 번호: 191, 서열 번호: 193, 서열 번호: 195, 서열 번호: 197, 서열 번호: 199, 서열 번호: 203, 서열 번호: 205, 서열 번호: 207, 서열 번호: 209, 서열 번호: 211, 서열 번호: 213, 서열 번호: 215, 서열 번호: 217, 서열 번호: 219, 서열 번호: 221, 서열 번호: 223, 서열 번호: 225, 서열 번호: 227, 서열 번호: 229, 서열 번호: 231, 서열 번호: 233, 서열 번호: 235, 서열 번호: 237, 서열 번호: 239, 서열 번호: 241, 서열 번호: 243, 서열 번호: 245, 서열 번호: 247, 서열 번호: 249, 서열 번호: 251, 서열 번호: 253, 서열 번호: 255, 서열 번호: 257, 서열 번호: 259, 서열 번호: 261, 서열 번호: 263, 서열 번호: 265, 서열 번호: 267, 서열 번호: 269, 서열 번호: 271, 서열 번호: 273, 서열 번호: 275, 서열 번호: 277, 서열 번호: 281, 서열 번호: 283, 서열 번호: 285, 서열 번호: 287, 서열 번호: 289, 서열 번호: 291, 서열 번호: 293, 서열 번호: 295, 서열 번호: 297, 서열 번호: 299, 서열 번호: 301, 서열 번호: 303, 서열 번호: 305, 서열 번호: 307, 서열 번호: 309, 서열 번호: 311, 서열 번호: 313, 서열 번호: 315, 서열 번호: 317, 서열 번호: 319, 서열 번호: 321, 서열 번호: 323, 서열 번호: 325, 서열 번호: 327, 서열 번호: 329, 서열 번호: 331, 서열 번호: 333, 서열 번호: 335, 서열 번호: 336, 서열 번호: 337, 또는 서열 번호: 338의 핵산에 혼성화하는 서열을 포함하는 핵산 서열에 의해 코딩되는 적어도 하나의 폴리펩티드에 의해 촉진되는 것인 단계를 포함하는 방법을 제공한다.

본 발명은 또한 다단계 경로로 모나틴 전구체, 그의 염, 및 그의 조합으로부터 선택되는 산물을 생산하며, 여기서, 상기 경로 중의 반응은 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 64, 서열 번호: 66, 서열 번호: 68, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162, 서열 번호: 164, 서열 번호: 166, 서열 번호: 168, 서열 번호: 170, 서열 번호: 172, 서열 번호: 174, 서열 번호: 176, 서열 번호: 178, 서열 번호: 180, 서열 번호: 182, 서열 번호: 184, 서열 번호: 186, 서열 번호: 188, 서열 번호: 190, 서열 번호: 192, 서열 번호: 194, 서열 번호: 196, 서열 번호: 198, 서열 번호: 200, 서열 번호: 204, 서열 번호: 206, 서열 번호: 208, 서열 번호: 210, 서열 번호: 212, 서열 번호: 214, 서열 번호: 216, 서열 번호: 218, 서열 번호: 220, 서열 번호: 222, 서열 번호: 224, 서열 번호: 226, 서열 번호: 228, 서열 번호: 230, 서열 번호: 232, 서열 번호: 234, 서열 번호: 236, 서열 번호: 238, 서열 번호: 240, 서열 번호: 242, 서열 번호: 244, 서열 번호: 246, 서열 번호: 248, 서열 번호: 250, 서열 번호: 252, 서열 번호: 254, 서열 번호: 256, 서열 번호: 258, 서열 번호: 260, 서열 번호: 262, 서열 번호: 264, 서열 번호: 266, 서열 번호: 268, 서열 번호: 270, 서열 번호: 272, 서열 번호: 274, 서열 번호: 276, 서열 번호: 278, 서열 번호: 282, 서열 번호: 284, 서열 번호: 286, 서열 번호: 288, 서열 번호: 290, 서열 번호: 292, 서열 번호: 294, 서열 번호: 296, 서열 번호: 298, 서열 번호: 300, 서열 번호: 302, 서열 번호: 304, 서열 번호: 306, 서열 번호: 308, 서열 번호: 310, 서열 번호: 312, 서열 번호: 314, 서열 번호: 316, 서열 번호: 318, 서열 번호: 320, 서열 번호: 322, 서열 번호: 324, 서열 번호: 326, 서열 번호: 328, 서열 번호: 330, 서열 번호: 332, 또는 서열 번호: 334의 아미노산 서열을 포함하는 단리된 폴리펩티드 또는 재조합 폴리펩티드로부터 선택되는 하나 이상의 폴리펩티드, 또는 알돌라제 활성을 갖는 그의 단편 또는 부분서열에 의해 촉진되는 단계를 포함하며, 여기서, 상기 모나틴 전구체, 그의 염, 및 그의 조합은 단맛이 나는 것인 방법을 제공한다.

본 발명은 추가로 다단계 경로로 모나틴 전구체, 그의 염, 및 그의 조합으로부터 선택되는 산물을 생산하며, 여기서, 상기 경로 중의 반응은 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 63, 서열 번호: 65, 서열 번호: 67, 서열 번호: 69, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161, 서열 번호: 163, 서열 번호: 165, 서열 번호: 167, 서열 번호: 169, 서열 번호: 171, 서열 번호: 173, 서열 번호: 175, 서열 번호: 177, 서열 번호: 179, 서열 번호: 181, 서열 번호: 183, 서열 번호: 185, 서열 번호: 187, 서열 번호: 189, 서열 번호: 191, 서열 번호: 193, 서열 번호: 195, 서열 번호: 197, 서열 번호: 199, 서열 번호: 203, 서열 번호: 205, 서열 번호: 207, 서열 번호: 209, 서열 번호: 211, 서열 번호: 213, 서열 번호: 215, 서열 번호: 217, 서열 번호: 219, 서열 번호: 221, 서열 번호: 223, 서열 번호: 225, 서열 번호: 227, 서열 번호: 229, 서열 번호: 231, 서열 번호: 233, 서열 번호: 235, 서열 번호: 237, 서열 번호: 239, 서열 번호: 241, 서열 번호: 243, 서열 번호: 245, 서열 번호: 247, 서열 번호: 249, 서열 번호: 251, 서열 번호: 253, 서열 번호: 255, 서열 번호: 257, 서열 번호: 259, 서열 번호: 261, 서열 번호: 263, 서열 번호: 265, 서열 번호: 267, 서열 번호: 269, 서열 번호: 271, 서열 번호: 273, 서열 번호: 275, 서열 번호: 277, 서열 번호: 281, 서열 번호: 283, 서열 번호: 285, 서열 번호: 287, 서열 번호: 289, 서열 번호: 291, 서열 번호: 293, 서열 번호: 295, 서열 번호: 297, 서열 번호: 299, 서열 번호: 301, 서열 번호: 303, 서열 번호: 305, 서열 번호: 307, 서열 번호: 309, 서열 번호: 311, 서열 번호: 313, 서열 번호: 315, 서열 번호: 317, 서열 번호: 319, 서열 번호: 321, 서열 번호: 323, 서열 번호: 325, 서열 번호: 327, 서열 번호: 329, 서열 번호: 331, 서열 번호: 333, 서열 번호: 335, 서열 번호: 336, 서열 번호: 337, 또는 서열 번호: 338과 적어도 50%의 서열 동일성(%)을 갖는 서열을 포함하는 핵산 서열에 의해 코딩되는 적어도 하나의 폴리펩티드에 의해 촉진되는 단계를 포함하며, 여기서, 상기 모나틴 전구체, 그의 염, 및 그의 조합은 단맛이 나는 것인 방법을 제공한다.

본 발명은 추가로 다단계 경로로 모나틴 전구체, 그의 염, 및 그의 조합으로부터 선택되는 산물을 생산하며, 여기서, 상기 경로 중의 반응은 엄격한 조건하에 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 63, 서열 번호: 65, 서열 번호: 67, 서열 번호: 69, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161, 서열 번호: 163, 서열 번호: 165, 서열 번호: 167, 서열 번호: 169, 서열 번호: 171, 서열 번호: 173, 서열 번호: 175, 서열 번호: 177, 서열 번호: 179, 서열 번호: 181, 서열 번호: 183, 서열 번호: 185, 서열 번호: 187, 서열 번호: 189, 서열 번호: 191, 서열 번호: 193, 서열 번호: 195, 서열 번호: 197, 서열 번호: 199, 서열 번호: 203, 서열 번호: 205, 서열 번호: 207, 서열 번호: 209, 서열 번호: 211, 서열 번호: 213, 서열 번호: 215, 서열 번호: 217, 서열 번호: 219, 서열 번호: 221, 서열 번호: 223, 서열 번호: 225, 서열 번호: 227, 서열 번호: 229, 서열 번호: 231, 서열 번호: 233, 서열 번호: 235, 서열 번호: 237, 서열 번호: 239, 서열 번호: 241, 서열 번호: 243, 서열 번호: 245, 서열 번호: 247, 서열 번호: 249, 서열 번호: 251, 서열 번호: 253, 서열 번호: 255, 서열 번호: 257, 서열 번호: 259, 서열 번호: 261, 서열 번호: 263, 서열 번호: 265, 서열 번호: 267, 서열 번호: 269, 서열 번호: 271, 서열 번호: 273, 서열 번호: 275, 서열 번호: 277, 서열 번호: 281, 서열 번호: 283, 서열 번호: 285, 서열 번호: 287, 서열 번호: 289, 서열 번호: 291, 서열 번호: 293, 서열 번호: 295, 서열 번호: 297, 서열 번호: 299, 서열 번호: 301, 서열 번호: 303, 서열 번호: 305, 서열 번호: 307, 서열 번호: 309, 서열 번호: 311, 서열 번호: 313, 서열 번호: 315, 서열 번호: 317, 서열 번호: 319, 서열 번호: 321, 서열 번호: 323, 서열 번호: 325, 서열 번호: 327, 서열 번호: 329, 서열 번호: 331, 서열 번호: 333, 서열 번호: 335, 서열 번호: 336, 서열 번호: 337, 또는 서열 번호: 338의 핵산에 혼성화하는 서열을 포함하는 핵산 서열에 의해 코딩되는 적어도 하나의 폴리펩티드에 의해 촉진되는 단계를 포함하며, 여기서, 상기 모나틴 전구체, 그의 염, 및 그의 조합은 단맛이 나는 것인 방법을 제공한다.

간결하게 하기 위한 노력으로, 본 명세서 및 청구의 범위에서 중간체/산물이 형성된 것으로 동정되는 경우에는 언제나(예로서, 모나틴, 모나틴 전구체, 또는 모나틴 유도체(들)), 해당된다면 "및/또는 그의 염"이라는 용어가 포함된다는 것을 이해하여야 한다. 다시 말해, 예를 들면, "인돌-3-피루베이트가 MP로 전환"이라는 어구는 "인돌-3-피루브산이 MP 및/또는 그의 염으로 전환"으로 판독된다는 것을 이해하여야 한다. 사실상, 숙련인은 제시하는 반응 조건하에서 중간체/산물의 염이 실제 존재한다는 것을 이해할 것이다.

일부 실시태양에 따라, 본 방법은 조성물의 모나틴 또는 모나틴 유도체 성분이 오직 R,R 및 S,R 형태의 모나틴 또는 모나틴 유도체만을 포함하는 것인, 모나틴 또는 모나틴 유도체 조성물을 생산한다. 오직 특정 이성체만이 형성된다는 것을 명시하기 위하여 사용되는 경우 "오직 ~만"이라는 용어는 라세미화가 일어나지 않는다면 상기 경로는 오직 동정된 이성체만을 생산할 것이라는 것을 의미한다. 결과적으로, "오직 ~만"이라는 용어는 다른 이성체의 부재를 의미하는 것으로 이해되서는 안되며, 오히려 당업자는 일어날 수 있는 라세미화로 인하여 다른 이성체 형태가 상대적으로 소량 존재할 수 있다는 것으로 이해할 것이다. 일부 실시태양에 따라, 본 방법은 조성물의 모나틴 또는 모나틴 유도체 성분이 오직 R,R 형태의 모나틴 또는 모나틴 유도체만을 포함하는 것인 조성물을 생산한다(라세미화가 일어나 다른 이성체 형태가 생성된다는 것은 제외).

본원에서 사용되는 바, "모나틴 조성물"이라는 어구는 하나 이상의 모나틴 이성체를 포함하는 조성물을 의미하며; 상기 용어는 또한 오직 단일의 모나틴의 이성체 형태만을 의미한다.

본원에서 사용되는 바, "모나틴 유도체 조성물"이라는 어구는 하나 이상의 모나틴 유도체의 이성체를 포함하는 조성물을 의미하며; 상기 용어는 또한 오직 단일의 모나틴 유도체의 이성체 형태만을 의미한다.

본원에서 사용되는 바, "모나틴 유도체"라는 어구는 하기 화학 구조식(II)를 갖는다:

상기 식에서, R_a, R_b, R_c, R_d, 및 R_e 각각은 독립적으로 수소 원자, 하이드록실 기, C₁-C₃ 알킬기, C₁-C₃ 알콕시기, 아미노기, 또는 할로겐 원자, 예로서, 요오드 원자, 브롬 원자, 염소 원자, 또는 불소 원자로부터 선택되는 임의의 치환체를 나타낸다. 그러나, R_a, R_b, R_c, R_d, 및 R_e는 동시에 모두가 수소일 수는 없다. 별법으로, 각각의 R_b 및 R_c, 및/또는 R_d 및 R_e는 함께 C₁-C₄ 알킬렌기를 형성할 수 있다.

본원에서 사용되는 바, "치환된 인돌-3-피루베이트"는 인돌-3-피루베이트의 인돌 환 중의 하나 이상의 탄소 원자가 상기 정의된 것과 같은 하나 이상의 치환체기로 독립적으로 치환된 것을 의미한다. 그러나, R_a, R_b, R_c, R_d, 및 R_e는 동시에 모두가 수소일 수는 없다. 별법으로, 각각의 R_b 및 R_c, 및/또는 R_d 및 R_e는 함께 C₁-C₄ 알킬렌기를 형성할 수 있다.

본원에서 사용되는 바, "치환된 트립토판"은 트립토판의 인돌 환 중의 하나 이상의 탄소 원자가 상기 정의된 것과 같은 하나 이상의 치환체기로 독립적으로 치환된 것을 의미한다. 그러나, R_a, R_b, R_c, R_d, 및 R_e는 동시에 모두가 수소일 수는 없다. 별법으로, 각각의 R_b 및 R_c, 및/또는 R_d 및 R_e는 함께 C₁-C₄ 알킬렌기를 형성할 수 있다. 하나의 실시태양에서, 치환된 트립토판은 인돌 환 상에 최종 모나틴 유도체와 동일한 치환체기(들)을 함유한다.

더욱이, 본원에 기술된 모나틴을 생산하는 생합성 경로는 치환된 트립토판을 사용함으로써 단맛이 날 수 있는 모나틴 유도체를 생산할 수 있다. 일부 실시태양에서, 본원에 기술된 생합성 경로에서 사용하고자 하는 치환된 트립토판으로는 염소화된 트립토판 및 5-하이드록시트립토판을 포함한다.

예를 들면, R,R 모나틴과 구조적으로 유사한 염소화된 D-트립토판은 비영양성 감미료인 것으로 확인되었다(특히, 6-클로로-D-트립토판). 유사하게, 할로겐화 및 하이드록시 치환 형태의 모나틴은 단맛이 나는 것으로 밝혀졌다. 미국 공개 특허 출원 번호 제2005/0118317호. 할로겐 및 하이드록실기는 이후의 D- 또는 L-트립토판, 인돌-3-피루베이트, MP, 또는 모나틴로의 전환을 방해하지 않으면서, 수소, 특히, 트립토판의 인돌에서 벤젠 환의 1-4번 위치 상의 것을 대신하여 치환될 수 있다. 치환된 인돌이 PLP-효소에 대하여 적합한 기질인 것으로 문헌 상에 제시되어 있으며, 이를 통해 치환된 트립토판이 생산되었다[Fukuda, D. S., et al., "Production of Substituted L-Tryptophans by Fermentation," Appl . Environ . Microbiol., 21 :841-43 (1971)]. 할로겐이 트립토판 신타제 베타 하위유닛 촉매 기전을 입체적으로 방해하지 않는 것으로 보이면, 에난티오특이성 또한 온전한 것이었다.

본 발명의 일부 실시태양에서는 L-트립토판으로부터 인돌-3-피루베이트를 생산하고, 인돌-3-피루베이트로부터 2-하이드록시 2-(인돌-3일메틸)-4-케토 글루타르산("모나틴 전구체" 또는 "MP")을 생산하고, MP로부터 모나틴을 생산하는 것을 포함하는, 모나틴 조성물을 생산하는 방법을 제공한다. 인돌-3-피루베이트를 생산하는 L-트립토판의 반응은 R-MP, R,R 모나틴, 또는 둘 모두에 대해서보다는 L-트립토판에 대하여 특이성이 더욱 크거나, 활성이 더욱 크거나, 또는 둘 모두인 효소에 의해 촉진된다. 특정 실시태양에 따라, 인돌-3-피루베이트의 반응은 R-특이 알돌라제 활성을 갖는 효소에 의해 촉진되고, 이로써 R-MP를 생산한다. 특정 실시태양에 따라, 하나의 이성체 형태로부터 또다른 이성체 형태로의 트립토판 반응의 아미노산 부산물의 에피머화를 촉진시킬 수 있는 라세마제 효소가 제공된다.

본 발명에 따른 일부 실시태양에서, L-트립토판으로부터 인돌-3-피루베이트를 생산하고, 인돌-3-피루베이트로부터 2-하이드록시 2-(인돌-3일메틸)-4-케토 글루타르산("모나틴 전구체" 또는 "MP")을 생산하고, MP로부터 모나틴을 생산하는 것을 포함하는, 모나틴 조성물을 생산하는 방법을 제공한다. 인돌-3-피루베이트를 생산하는 L-트립토판의 반응은 R-MP, R,R 모나틴, 또는 둘 모두에 대해서보다는 L-트립토판에 대하여 특이성이 더욱 크거나, 활성이 더욱 크거나, 또는 둘 모두인 효소에 의해 촉진되고, 모나틴을 형성하는 MP 반응은 R-MP에 대하여 입체선택성인 효소에 의해 촉진된다. "입체선택성"이라는 용어는 효소가 또다른 것보다 하나의 이성체에 대하여 - R-MP 대 S-MP의 경우 - 특이성이 더욱 크거나, 활성이 더욱 크거나, 또는 둘 모두라는 것을 의미한다. 바람직한 실시태양에서, 입체선택성 효소는 또다른 것과 비교하여 하나의 이성체에 대하여 제한된 활성을 갖는다. "제한된" 활성은 예를 들면, 본원에서 제공되는 실험에 따라 측정된 바에 따르면 최소이거나 지각할 수 없을 정도의 활성을 의미한다.

예로서, 상기 문단들에서 언급한 일련의 반응을 참고할 경우, 본 발명에서 상기 각 반응이 명확하게 실시될 필요는 없고; 상기 단계들이 묵시적으로 실시될 수 있다는 것에 주목하여야 한다. 다시 말해, 예를 들면, L-트립토판으로부터 인돌-3-피루베이트를 생산하고, 인돌-3-피루베이트로부터 2-하이드록시 2-(인돌-3일메틸)-4-케토 글루타르산("모나틴 전구체" 또는 "MP")을 생산하고, MP로부터 모나틴을 생산하는 것을 포함하며, 여기서, 각 반응은 적절한 효소에 의해 촉진되는 것인, 모나틴 조성물을 생산하는 방법은 L-트립토판을 상기 효소와 조합하고, 열거된 반응이 발생할 수 있도록 하는 조건을 세팅함으로써 실시될 수 있다. 그러한 경우, L-트립토판은 반응하여 인돌-3-피루베이트를 생산할 수 있고, L-트립토판 반응으로부터 생산된 인돌-3-피루베이트는 반응하여 MP를 형성할 수 있고, 인돌-3-피루베이트 반응으로부터 생산된 MP는 반응하여 모나틴을 형성할 수 있다. 상기 방법은 또한 일례로 발생하는 L-트립토판 생산에 적합한 조건하에서 L-트립토판을 생산할 수 있는 화합물을 제공하고, 상기 화합물을 발생하는 상기 반응에 적합한 조건하에서 기재된 일련의 반응을 촉진시킬 수 있는 효소와 조합함으로써 실시될 수 있다. 추가의 또다른 일례로서, 상기 방법은 미생물을 유전공학 처리하여 기술된 경로에 따라 모나틴을 생산하고, 발생하는 발효 고정에 적절한 조건을 제공함으로써 실시될 수 있다. 예를 들면, 천연적으로 대량의 L-트립토판을 생산하는 미생물을 유전공학 처리하여 모나틴으로의 상기 경로에서 반응을 촉진시키는데 사용되는 하나 이상의 효소를 생산하거나 과생산시킬 수 있고, 그를 통해 미생물이 모나틴을 생산할 수 있도록 적절한 조건을 제공할 수 있다.

본 발명에 따른 다른 실시태양에서, L-트립토판이 인돌-3-피루베이트으로 전환될 때 기질이 L-아미노산을 형성하고, 인돌-3-피루베이트가 반응하여 MP(오직 R-MP만을 포함하거나, 지배적으로 R-MP만을 포함하는 것이 바람직하지만, R-MP 및 S-MP, 둘 모두를 포함할 수 있다)를 형성하고, R-MP가 R,R 모나틴으로 전환될 때 L-아미노산이 반응하여 기질을 재생("재순환"으로도 지칭됨)시키는 것인, 모나틴을 생산하는 방법이 제공된다. R,R 모나틴을 형성하는 R-MP 반응은 D-페닐글리신 아미노트랜스퍼라제 활성을 갖는 입체적 역전 아미노트랜스퍼라제, 예로서, D-메티오닌 아미노트랜스퍼라제(EC 2.6.1.41) 또는 효소에 의해 촉진된다.

본 발명에 따른 다른 실시태양에서, L-트립토판으로부터 D-트립토판을 생산하고, D-트립토판으로부터 인돌-3-피루베이트를 생산하고, 인돌-3-피루베이트로부터 R-MP를 생산하고, R-MP로부터 R,R 모나틴을 생산하는 것을 포함하는, 모나틴을 생산하는 방법이 제공된다. L-트립토판으로부터 D-트립토판을 생산하는 것은 트립토판 라세마제 및 그의 기능성 등가물에 의해 촉진된다. 특정의 추가 실시태양에서, 인돌-3-피루베이트를 형성하는 D-트립토판의 반응 및 모나틴을 형성하는 MP의 반응은 동일 효소에 의해 촉진된다. 추가의 다른 실시태양에서, 인돌-3-피루베이트의 반응은 R-특이 알돌라제 활성을 갖는 효소에 의해 촉진되며, 결과적으로 R-MP가 형성되고, 인돌-3-피루베이를 형성하는 D-트립토판의 반응 및 R,R 모나틴을 형성하는 R-MP의 반응은 동일 효소에 의해 촉진된다.

본 발명에 따른 일부 실시태양에서, 반응을 촉진시키는, R-특이 알돌라제 활성을 갖는 효소를 사용하여 치환된 인돌-3-피루베이트 및 피루베이트로부터 모나틴 유도체를 생산하는 것을 포함하는 모나틴 유도체를 생산하는 방법이 제공된다.

본 발명의 하나 이상의 실시태양에 관한 상세한 설명은 첨부 도면과 하기 설명에 기재되어 있다. 본 발명에 따른 다른 특성, 목적, 및 장점은 설명과 도면으로부터, 및 청구의 범위로부터 자명해질 것이다. 본원의 설명으로부터 인지하여야 하는 바, 본 발명은 모두가 본 발명의 정신 및 범주로부터 벗어나지 않고 다양한 실시태양으로 변형될 수 있다. 따라서, 도면 및 상세한 설명은 본래대로 예시적이며 비제한적인 것으로서 간주되어야 한다.

본원에서 인용된 모든 간행물, 특허, 특허 출원, 진뱅크(GenBank) 서열 및 ATCC 기탁물은 그에 의해 명백하게 모든 목적을 위해 참고로 인용된다.

하기 도면은 본 발명의 실시태양의 실례가 되는 것이며, 청구의 범위에 의해 포함되는 것과 같은 본 발명의 범주를 제한하고자 하는 것은 아니다.
도 1은 본 발명에 따라 L-트립토판으로부터 R,R 모나틴을 생산하는 효소 공정의 일례를 나타내는 흐름도이다. 이러한 일례에서, 공정은 L-트립토판의 반응에서 기질로서 R-MP보다는 L-트립토판에 대하여 더 큰 특이성 및/또는 선택성을 갖는 L-아미노트랜스퍼라제(그의 일례로 L-트립토판 아미노트랜스퍼라제, L-방향족 아미노트랜스퍼라제, L-아스파테이트 아미노트랜스퍼라제, 및 L-알라닌 아미노트랜스퍼라제를 포함한다)를 사용하는 것을 포함하고/거나, 본 공정은 기질로서 R,R 모나틴에 대한 제한된 활성 및/또는 특이성을 갖는 L-아미노산 옥시다제를 사용하는 것을 포함한다. 도 1에 도해된 특정 일례에서, L-아미노트랜스퍼라제 또는 L-아미노산 옥시다제는 L-트립토판을 인돌-3-피루베이트로 전환시키고, 인돌-3-피루베이트는 R-특이 알돌라제 및 피루베이트와 반응하여 R-알파-케토산 모나틴(R-MP)을 생산하고, R-MP는 D-아미노트랜스퍼라제 또는 D-아미노산 데하이드로게나제에 의해 R,R 모나틴으로 전환된다. 도 1에 나타낸 바와 같이, 반응은 가역성이지만, 본 발명의 목적을 위해서는 반응이 가역 방향으로 진행될 필요는 없다.
도 2는 본 발명에 따라 R,R 모나틴을 생산하는 또다른 공정의 일례를 나타내는 흐름도이다. 이러한 일례에서, 공정은 R-MP에 대하여 입체선택성인 효소를 사용하여 R-MP를 모나틴으로 전환시키는 것을 포함한다. 도 2에 도해된 특정 일례에서, 트립토판은 가역 반응에서 인돌-3-피루베이트로 전환되는 것으로 보인다. 인돌-3-피루베이트는 비입체특이성 알돌라제와 반응하여 가역적으로 알파-케토산 모나틴(R- 및 S-MP 둘 모두)을 형성할 수 있다. R-MP는 입체선택성 D-아미노트랜스퍼라제 또는 입체선택성 D-아미노산 데하이드로게나제에 의해 R,R 모나틴으로 가역적으로 전환된다. 입체선택성 D-아미노트랜스퍼라제 또는 D-아미노산 데하이드로게나제가 사용된다면 비입체특이성 알돌라제에 의해 형성된 임의의 S-MP는 다시 역으로 인돌-3-피루베이트로 전환될 수 있다. 본 발명의 목적을 위해서는 가역성인 것으로 제시된 반응이 가역 방향으로 진행될 필요는 없다.
도 3은 본 발명에 따라 L-트립토판으로부터 R,R 모나틴을 생산하는 추가의 또다른 공정의 일례를 나타내는 흐름도이다. 이러한 일례에서, 공정은 트립토판 라세마제를 사용하여 L-트립토판을 D-트립토판으로 전환시키는 것으로 포함하며, R,R 모나틴을 형성하는 반응과 커플링된 반응에서 기질인 인돌-3-피루베이트를 형성하는 반응과 커플링된 반응에서 D-아미노산 산물을 사용하는 것을 포함한다. 도 3에 도해된 특정 일례에서, L-트립토판은 가역 반응으로 트립토판 라세마제에 의해 D-트립토판으로 전환된다. D-트립토판은 알파-케토글루타레이트(α-KG) 및 광범위한 특이성을 갖는 D-아미노트랜스퍼라제와 반응하여 인돌-3-피루베이트 및 D-글루타메이트를 생산한다. 인돌-3-피루베이트은 피루베이트 및 R-특이 알돌라제와 반응하고, R-알파-케토산 모나틴(R-MP)으로 전환되고, R-MP는 광범위한 특이성을 갖는 D-아미노트랜스퍼라제 및 D-글루타메이트와 반응하여 R,R 모나틴 및 알파-케토글루타레이트(α-KG)를 형성한다. 도 3에 나타낸 바와 같이, 각 반응은 가역성이지만, 본 발명의 목적을 위해서는 반응이 가역 방향으로 진행될 필요는 없다.
도 4는 본 발명에 따라 L-트립토판으로부터 R,R 모나틴을 생산하는 추가의 또다른 공정의 일례를 나타내는 흐름도이다. 이러한 일례에서, 공정은 L-트립토판 반응과 커플링된 반응에서 형성된 L-아미노산을 D-아미노산으로 전환시키는 것으로 포함하며; 상기 D-아미노산은 R-MP를 R,R 모나틴으로 전환시키는 반응에서 아미노 공여체로서 작용한다. 도 4에 도해된 특정 일례에서, L-트립토판은 L-아미노트랜스퍼라제 및 알파-케토글루타레이트와 반응하여 인돌-3-피루베이트 및 L-글루타메이트를 생산한다. 인돌-3-피루베이트는 피루베이트 및 R-특이 알돌라제와 반응하여 R-알파-케토산 모나틴(R-MP)으로 전환되고, R-MP는 광범위한 특이성을 갖는 D-아미노트랜스퍼라제 및 D-글루타메이트와 반응하여 R,R 모나틴 및 알파-케토글루타레이트를 형성한다. 도 4에 나타낸 바와 같이, 각 반응은 가역성이지만, 본 발명의 목적을 위해서는 반응이 가역 방향으로 진행될 필요는 없다.
도 5는 본 발명에 따라 L-트립토판으로부터 R,R 모나틴을 생산하는 추가의 또다른 공정의 일례를 나타내는 흐름도이다. 이러한 일례에서, 공정은 L-트립토판 반응과 커플링된 반응에 의해 형성된 L-아미노산이 R-MP에서 R,R 모나틴으로의 반응과 커플링된 반응에 대한 기질로서 사용될 수 있도록 입체화 효소를 사용하여 R-MP를 R,R 모나틴으로 전환시키는 것을 효소적으로 촉진시키는 것을 포함한다. 도 5에 도해된 특정 일례에서, L-트립토판은 L-아미노트랜스퍼라제 및 옥살로아세테이트, 피루베이트 또는 알파-케토글루타레이트(α-KG)와 반응하여 인돌-3-피루베이트, 및 L-아스파테이트(옥살로아세테이트가 사용되는 경우), L-알라닌(피루베이트가 사용되는 경우) 또는 L-글루타메이트(α-KG가 사용되는 경우)를 생산한다. 인돌-3-피루베이트는 피루베이트 및 R-특이 알돌라제와 반응하고, R-알파-케토산 모나틴(R-MP)으로 전환되고, R-MP는 입체적 역전 아미노트랜스퍼라제 및 L-아스파테이트, L-알라닌 또는 L-글루타메이트와 반응하여 R,R 모나틴 및 옥살로아세테이트(L-아스파테이트가 사용되는 경우), 피루베이트(L-알라닌이 사용되는 경우) 또는 알파-케토글루타레이트(α-KG, L-글루타메이트가 사용되는 경우)를 형성한다. 도 5에 나타낸 바와 같이, 각 반응은 가역성이지만, 본 발명의 목적을 위해서는 반응이 가역 방향으로 진행될 필요는 없다.
도 6은 본 발명에 따라 R,R 모나틴을 생산하는 추가의 또다른 공정의 일례를 나타내는 흐름도이다. 이러한 일례에서, 공정은 일련의 전환 반응을 통해 인돌-3-피루베이트를 형성하는 반응에서 생산된 L-아미노산을, R,R 모나틴을 형성하는 반응에서 R-MP와의 반응물로서 사용되는 D-아미노산으로 재순환시키는 것을 포함한다. 도 6에 도해된 특정 일례에서, L-트립토판은 L-아미노트랜스퍼라제 및 옥살로아세테이트와 가역적으로 반응하여 인돌-3-피루베이트 및 L-아스파테이트를 생산한다. 인돌-3-피루베이트는 가역적인 방식으로 피루베이트 및 R-특이 알돌라제와 반응하고, 알파-케토산 모나틴(R-MP)으로 전환되고, R-MP는 D-아미노트랜스퍼라제 및 D-알라닌과 가역적으로 반응하여 R,R 모나틴 및 피루베이트를 형성한다. L-아스파테이트는 아스파테이트 4-데카르복실라제를 사용하여 L-알라닌 및 CO₂로 전환된다. L-알라닌은 알라닌 라세마제를 사용하여 D-알라닌으로 전환된다. 본 발명의 목적을 위해서는 가역성인 것으로 제시된 반응이 가역 방향으로 진행될 필요는 없다.
도 7은 본 발명에 따른 R,R 모나틴을 생산하는 추가의 또다른 공정에 대한 일례를 나타내는 흐름도이다. 이러한 일례에서, 공정은 본 반응의 L-아미노산 부산물을 또다른 산물로 전환시킴으로서 L-트립토판 반응을 촉진시키는 것(즉, 인돌-3-피루베이트를 생산하는 방향으로의 반응)을 추진시키는 것을 포함한다. 본 일례에서, L-아미노산 L-아스파테이트 부산물은 데카르복실라제를 사용하여 비가역적인 반응으로 L-알라닌으로 전환된다. 도 7에 도해된 특정 일례에서, L-트립토판은 가역적으로 L-아미노트랜스퍼라제와, 그리고 알파-케토글루타레이트(α-KG) 또는 옥살로아세테이트와 반응하여 인돌-3-피루베이트 및 L-글루타메이트(α-KG가 사용되는 경우) 또는 L-아스파테이트(옥살로아세테이트가 사용되는 경우)를 생산한다. 인돌-3-피루베이트는 가역적으로 피루베이트 및 R-특이 알돌라제와 반응하고, R-알파-케토산 모나틴(R-MP)으로 전환된다. R-MP는 가역적인 방식으로 D-아미노트랜스퍼라제 및 D-아미노산과 반응하여 R,R 모나틴, 및 옥살로아세테이트, 피루베이트 또는 α-KG 중 임의의 것을 형성한다. L-아미노트랜스퍼라제 반응의 산물이 L-글루타메이트 또는 L-아스파테이트는 글루탐산 또는 아스파테이트 데카르복실라제를 사용하여 4-아미노부타노에이트 및 CO₂(L-글루타메이트가 기질인 경우)로, 또는 β-알라닌 및 CO₂(L-아스파테이트가 기질인 경우)로 전환된다. 본 발명의 목적을 위해서는 가역성인 것으로 제시된 반응이 가역 방향으로 진행될 필요는 없다.
도 8은 본 발명에 따른 R,R 모나틴을 생산하는 추가의 또다른 공정에 대한 일례를 나타내는 흐름도이다. 이러한 일례에서, 공정은 일련의 전환 반응을 통해 L-트립토판 반응의 아미노산 부산물을 R-MP 반응의 아미노산 반응물로 재순환시키는 것을 포함한다. 도 8에 도해된 특정 일례에서, L-트립토판은 가역적으로 L-아미노트랜스퍼라제와, 그리고 알파-케토글루타레이트(α-KG)와 반응하여 인돌-3-피루베이트 및 L-글루타메이트를 생산한다. 인돌-3-피루베이트는 가역적으로 피루베이트 및 R-특이 알돌라제과 반응하고, R-알파-케토산 모나틴(R-MP)으로 전환된다. R-MP는 가역적인 방식으로 D-아미노트랜스퍼라제 및 D-알라닌과 반응하여 R,R 모나틴 및 피루베이트를 형성한다. 공동 산물로서 L-알라닌과 함께, L-아미노트랜스퍼라제 반응 산물인 L-글루타메이트를 다시 α-KG로 가역적으로 전환시키기 위해 L-알라닌 아미노트랜스퍼라제 및 피루베이트가 사용된다. 알라닌 라세마제는 가역적으로 L-알라닌을, 세번째 반응인 D-아미노트랜스퍼라제 반응에서 유용한 D-알라닌으로 전환시킨다. 본 발명의 목적을 위해서는 가역성인 것으로 제시된 반응이 가역 방향으로 진행될 필요는 없다.
도 9는 컴퓨터 시스템의 회로 구성도이다.
도 10은 신규의 뉴클레오티드 또는 단백질 서열과 서열 데이터베이스를 비교하여 신규 서열과 데이터베이스 중 서열 사이의 상동성 수준을 측정하는 공정에 관한 하나의 실시태양을 나타내는 흐름도이다.
도 11은 2개의 서열들이 상동성인지 여부를 결정하기 위한 컴퓨터 프로세스의 하나의 실시태양을 나타내는 흐름도이다.
도 12는 서열 내에 특징이 존재하는지 여부를 관찰하기 위한 식별자 프로세스(300)의 하나의 실시태양을 나타내는 흐름도이다.
도 13 및 14는 함께 LC/MS/MS에 의해 측정된, 모나틴 전구체(MP) 형성에 있어서 58개의 상이한 알돌라제(각각은 그의 구체적인 서열 번호로서 표시된다)의 활성을 도시한다.
도 15는 디티오트레이톨이 알돌라제 활성을 갖는, 서열 번호: 88의 폴리펩티드에 의한 모나틴 생산에 미치는 효과를 나타낸다.
다양한 도면에서 유사한 참조 부호들은 유사한 요소들을 나타낸다.

[상세한 설명]

다수의 실시태양이 상기에 기술되어 있고, 이는 하기에서 더욱 상세히 기술된다. 본 발명의 실시태양은 기술되는 측면들 중 하나 이상을 포함한다.

약어 및 용어

용어와 방법에 관한 하기 설명은 본 개시를 보다 잘 설명하기 위하여, 그리고 본 개시의 실시에 있어서 당업계의 숙련인을 가이드하기 위하여 제공되는 것이다. 본원에서 사용되는 바, "포함하는(including)"이라는 것은 "포함하는(comprising)"이라는 것을 의미한다. 또한, 단수 형태의 "하나(a)" 또는 "하나(an)" 또는 "그(the)"는 문맥상 명백하게 명시되지 않는 한, 복수에 대한 것도 언급하는 것으로 한다. 예를 들면, "하나의 단백질을 포함하는"이라고 언급하는 것은 하나 또는 다수의 상기 단백질을 포함하는 것이며, "그 세포를 포함하는"이라고 언급하는 것은 하나 이상의 세포들과 당업자에게 공지되어 있는 그의 등가물 등에 관해 언급하는 것을 포함하는 것이다. "약"이라는 용어는 임의 측정에서 발생되는 실험상의 오류 범위를 포함하는 것이다. 달리 언급하지 않는 한, "약"이라는 단어가 명확하게 사용되지 않는 경우라도 모든 측정 수치는 그 앞에서 "약"이라는 단어를 갖는 것으로 가정한다.

보존적 치환: 폴리펩티드의 활성에는 어떠한 영향도 거의 주지 않는, 폴리펩티드내 하나의 아미노산을 또다른 아미노산으로 하는 치환. 그러한 치환은 교환된 아미노산이 구조적으로 또는 기능적으로 유사한지 여부와는 상관없이 보존적인 것으로 간주된다. 예를 들면, 이상적으로, 하나 이상의 보존적 치환을 포함하는 트립토판 아미노트랜스퍼라제 폴리펩티드는 트립토판 아미노트랜스퍼라제 활성을 보유한다. 예를 들면, 표준 방법, 예로서, 위치 지정 돌연변이 유발법 또는 PCR, 또는 당업자에게 알려져 있는 기타 방법들을 사용하여 해당 폴리펩티드를 코딩하는 뉴클레오티드 서열을 조작함으로써 하나 이상의 보존적 치환을 함유하는 폴리펩티드를 생산할 수 있다.

단백질 중 원래의 아미노산을 대신하여 치환될 수 있고, 폴리펩티드의 활성에는 어떠한 영향도 거의 주지 않는다면 보존적 치환으로서 간주될 수 있는 아미노산에 관한 비제한적일 일례로는 ser 또는 thr로 치환된 Ala; gln, his, 또는 lys로 치환된 arg; glu, gln, lys, his, asp로 치환된 asn; asn, glu, 또는 gln으로 치환된 asp; ser 또는 ala로 치환된 cys; asn, glu, lys, his, asp, 또는 arg로 치환된 gln; asn, gln lys, 또는 asp로 치환된 glu; pro로 치환된 gly; asn, lys, gln, arg, tyr로 치환된 his; leu, met, val, phe로 치환된 ile; ile, met, val, phe로 치환된 leu; asn, glu, gln, his, arg로 치환된 lys; ile, leu, val, phe로 치환된 met; trp, tyr, met, ile, 또는 leu로 치환된 phe; thr, ala로 치환된 ser; ser 또는 ala로 치환된 thr; phe, tyr로 치환된 trp; his, phe, 또는 trp로 치환된 tyr; 및 met, ile, leu로 치환된 val을 포함한다.

보존적 치환에 대한 추가 정보는 특히 문헌 ([Ben-Bassat et al, (J. Bacteriol. 169:751-7, 1987)], [O'Regan et al, (Gene 77:237-51, 1989)], [Sahin-Toth et al, (Protein Sci . 3:240-7, 1994)], [Hochuli et al, (Bio/Technology 6:1321-5, 1988)]), WO 00/67796(Curd et al.) 및 유전학 및 분자 생물학의 표준 교재에서 찾아볼 수 있다.

유래된: 본 명세서 및 청구의 범위의 목적상, 하기 중 임의의 하나 이상이 사실일 경우 물질은 유기체 또는 공급원으로부터 "유래된" 것이다: 1) 물질이 유기체/공급원내 존재하거나; 2) 물질이 천연 숙주로부터 떼어낸 것이거나; 3) 물질이 천연 숙주로부터 떼어지고, 예를 들면, 돌연변이 유발법에 의해 진화된 것.

단리된: 본원에서 사용되는 바, "단리된"이라는 용어는 그의 천연 숙주로부터 떼어낸 임의 물질을 지칭하는 것이다: 상기 물질은 정제될 필요는 없다. 예를 들면 "단리된 핵산"은 그가 유래된 유기체의 천연적으로 발생된 게놈내 그가 바로 인접해 있는 서열 양쪽(하나는 5' 말단 및 하나는 3' 말단)과 바로 인접하고 있는 것이 아닌, 천연적으로 발생된 핵산을 지칭한다. 예를 들면, 단리된 핵산은, 제한없이 임의 길이의 재조합 DNA 분자일 수 있는데, 단, 보통 천연적으로 발생된 게놈내 상기 재조합 DNA 분자 바로 측면에 위치하는 것으로 발견되는 상기 핵산 서열 중 하나는 제거되거나 존재하지 않는다. 따라서, 단리된 핵산은 제한없이, 기타 서열과는 독립적으로 별개의 분자로서 존재하는 재조합 DNA(예로서, PCR 또는 제한 엔도뉴클레아제 처리에 의해서 생산되는 cDNA 또는 게놈 DNA 단편) 뿐만 아니라, 벡터, 자율 복제 플라스미드, 바이러스(예로서, 레트로바이러스, 아데노바이러스, 또는 허피스 바이러스) 내로 혼입되거나, 원핵 생물 또는 진핵 생물의 게놈 DNA로 혼입되는 재조합 DNA를 포함한다. 추가로, 단리된 핵산은 하이브리드 또는 융합 핵산 서열의 일부인 재조합 DNA 분자를 포함할 수 있다.

본원에서 사용되는 바, "단리된"이라는 용어는 물질이 그의 원래 환경(예로서, 천연적으로 발생된 경우라면 천연 환경)으로부터 제거된 것을 의미한다. 예를 들면, 살아있는 동물내 존재하는 천연적으로 발생된 폴리뉴클레오티드 또는 폴리펩티드는 단리된 것이 아니지만, 자연계에서 함께 존재하는 물질 중 일부 또는 그 모두로부터 분리된 것으로서 상기와 동일한 폴리뉴클레오티드 또는 폴리펩티드는 단리된 것이다. 그러한 폴리뉴클레오티드는 벡터의 일부일 수 있고/거나, 그러나 폴리뉴클레오티드 또는 폴리펩티드는 조성물의 일부일 수 있고, 상기 벡터 또는 조성물이 그의 천연 환경의 일부가 아니라는 점에서도 이는 단리된 것일 수 있다.

또한, 핵산과 관련하여 본원에서 사용되는 "단리된"이라는 용어는 임의의 비천연적으로 발생된 핵산을 포함하는데, 이는 비천연적으로 발생된 핵산 서열이 자연 상태에서는 발견되지 않으며, 천연적으로 발생된 게놈내 바로 인접해 있는 서열을 갖지 않기 때문이다. 예를 들면, 비천연적으로 발생된 핵산, 예로서, 조작된 핵산은 단리된 핵산으로서 간주된다. 조작된 핵산은 통상의 분자 클로닝 또는 화학적 핵산 합성 기법을 사용하여 제조될 수 있다. 단리된 비천연적으로 발생된 핵산은 기타 서열과 독립적일 수 있거나, 벡터, 자율 복제 플라스미드, 바이러스(예로서, 레트로바이러스, 아데노바이러스, 또는 허피스 바이러스), 또는 원핵 생물 또는 진핵 생물의 게놈 DNA로 혼입될 수 있다. 추가로, 비천연적으로 발생된 핵산은 하이브리드 또는 융합 핵산 서열의 일부인 핵산 분자를 포함할 수 있다.

정제된: 본원에서 사용되는 바, "정제된"이라는 용어는 절대 순수할 필요는 없지만, 이는 상대적인 의미를 의도한다. 따라서, 예를 들면, 정제된 폴리펩티드 또는 핵산 제제는 대상이 되는 폴리펩티드 또는 핵산이, 상기 폴리펩티드 또는 핵산이 유기체내 그의 천연 환경내 존재하는 농도보다 더 높은 농도로 존재하거나, 그것이 제거되어진 환경 내에서의 농도보다 더 높은 농도로 존재하는 것일 수 있다.

라이브러리로부터 얻은 개개의 핵산은 통상 전기영동 동질성으로 정제된 것이다. 이들 클론으로부터 얻은 서열은 라이브러리로부터, 또는 전체 인간 DNA로부터는 직접적으로 수득할 수 없다. 본 발명에 따른 정제된 핵산은 유기체내 게놈 DNA의 나머지 부분으로부터 적어도 10⁴-10⁶배까지 정제될 수 있다. 일부 실시태양에서, "정제된"이라는 용어는 게놈 DNA의 나머지 부분 또는 라이브러리 또는 기타 환경내 기타 서열로부터 적어도 10배, 예로서, 일부 실시태양에서, 10²배 또는 10³배, 또는 10⁴배 또는 10⁵배까지 정제된 핵산을 포함한다.

아미노산: 본원에서 사용되는 바, "아미노산" 또는 "아미노산 서열"은 올리고펩티드, 펩티드, 폴리펩티드 또는 단백질 서열이나, 이 중 임의의 것의 단편, 일부 또는 하위유닛, 그리고 천연적으로 발생된 분자 또는 합성 분자를 지칭한다. "아미노산" 또는 "아미노산 서열"로서는 올리고펩티드, 펩티드, 폴리펩티드 또는 단백질 서열, 또는 이 중 임의의 것의 단편, 일부 또는 하위유닛, 그리고 천연적으로 발생된 분자 또는 합성 분자를 포함한다. 본원에서 사용된 "폴리펩티드"란 용어는 펩티드 결합이나 변형된 펩티드 결합에 의해 서로 연결된 아미노산 즉, 펩티드 동배체를 지칭하고, 이는 20개 유전자 코딩된 아미노산 이외의 변형된 아미노산을 함유할 수 있다. 상기 폴리펩티드는 천연 공정, 예로서, 번역 후 공정 또는 당업계에 잘 알려져 있는 화학적 변형 기술에 의해 변형될 수 있다. 변형은 폴리펩티드 중 임의의 위치, 예로서, 펩티드 골격, 아미노산 측쇄 및 아미노 또는 카복실 말단에서 일어날 수 있다. 동일한 유형의 변형이 소정의 폴리펩티드 중 몇몇 위치에서 동일한 정도로 또는 다양하게 존재할 수 있음을 알 수 있을 것이다. 또한, 소정의 폴리펩티드에는 여러 가지 유형의 변형이 일어날 수도 있다. 변형의 예로서는 아세틸화, 아실화, ADP-리보실화, 아미드화, 플라빈의 공유 결합, 헴 부분의 공유 결합, 뉴클레오티드 또는 뉴클레오티드 유도체의 공유 결합, 지질 또는 지질 유도체의 공유 결합, 포스파티딜이노시톨의 공유 결합, 가교 폐환화, 이황화 결합 형성, 탈메틸화, 공유 가교 결합의 형성, 시스테인의 형성, 피로글루타메이트의 형성, 포르밀화, 감마-카복실화, 당화, GPI 앵커 형성, 하이드록실화, 요오드화, 메틸화, 미리스톨화, 산화, 페길화, 글루칸 하이드롤라제 가공, 인산화, 프레닐화, 라세미화, 셀레노일화, 황산화 및 운반-RNA를 매개로 하는, 아미노산의 단백질로의 첨가 반응, 예로서, 아르기닐화를 포함한다(문헌 [Creighton, T. E., Proteins- Structure and Molecular Properties 2nd Ed., W.H. Freeman and Company, New York (1993)]; [Posttranslational Covalent Modification of Proteins, B.C. Johnson, Ed., Academic Press, New York, pp. 1-12 (1983)]). 본 발명의 펩티드 및 폴리펩티드는 또한 이하에 더욱 상세히 설명되어 있는 모든 "모사체" 및 "펩티도모사체" 형태의 것을 포함한다.

알돌라제 활성을 갖는 폴리펩티드: "알돌라제 활성을 갖는 폴리펩티드"는 단독으로, 또는 하나 이상의 추가의 폴리펩티드(동일하거나 상이한 서열을 갖는 것)와 함께 알돌라제의 효소 활성을 갖는 단백질인 폴리펩티드를 의미한다.

재조합: "재조합" 폴리펩티드 또는 단백질은 재조합 DNA 기법에 의해 생산된 폴리펩티드 또는 단백질; 즉, 원하는 폴리펩티드 또는 단백질을 코딩하는 외인성 DNA 작제물에 의해 형질전환된 세포로부터 생산된 폴리펩티드 또는 단백질을 지칭하는 것이다. "합성" 폴리펩티드 또는 단백질은 화학적 합성법에 의해 제조된 것이다. 고상 화학적 펩티드 합성법은 또한 본 발명의 폴리펩티드 또는 단편을 합성하는데에 사용될 수도 있다. 이러한 방법은 1960년대 초부터 당업계에 공지되어 왔으며(문헌 [Merrifield, R. B., J. Am . Chem . Soc, 85:2149-2154, 1963], 및 [Stewart, J. M. and Young, J. D., Solid Phase Peptide Synthesis, 2nd Ed., Pierce Chemical Co., Rockford, Ill., pp. 11-12] 참조), 최근에는 시판중인 실험실용 펩티드의 디자인과 합성용 키트에 사용되고 있다(Cambridge Research Biochemicals). 이와 같은 시판중인 실험실용 키트는 일반적으로 (문헌 [H. M. Geysen et al, Proc . Natl . Acad . Sci ., USA, 81:3998 (1984)])에 교시된 사항을 활용한 것으로서, 그들 모두가 단일 플레이트에 연결되어 있는 다수의 "막대" 또는 "핀"의 끝 부분에서 펩티드를 합성할 수 있는 것이다.

실질적으로 동일한: 2개의 핵산 또는 폴리펩티드에 있어서 "실질적으로 동일한"이란 어구는, 공지의 서열 비교 알고리즘 중 하나 또는 시각적 조사를 통하여 측정하였을 경우, 2 이상의 서열을 최대 상응성에 대해 비교 및 정렬할 때 얻어지는 뉴클레오티드 또는 아미노산 잔기(서열)의 동일성이 예로서, 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상인 경우를 지칭한다. 다른 실시태양에서, 실질적 동일성은 적어도 약 100개 이상의 잔기로 이루어진 영역에 걸쳐서 존재하고, 가장 일반적으로 서열들은 적어도 약 150개 내지 200개 또는 그 이상의 잔기에 걸쳐 실질적으로 동일하다. 일부 실시태양에서, 서열은 코딩 부위 전체 길이에 걸쳐서 실질적으로 동일하다.

추가로, "실질적으로 동일한" 아미노산 서열은 하나 이상의 보존적 또는 비보존적 아미노산 치환, 결실 또는 삽입에 의해서 참고 서열과 상이한 서열이다. 일부 실시태양에서, 상기 치환은 분자의 활성 부위가 아닌 위치에서 일어나거나, 별법으로, 상기 치환은 분자의 활성 부위인 위치에서 일어나지만, 단, 이 폴리펩티드는 그의 기능상(효소적) 성질을 본질적으로 보유하고 있다. 예로서, 보존적 아미노산 치환은 하나의 아미노산을 동일한 부류에 속하는 다른 아미노산으로 치환한다(예로서, 하나의 소수성 아미노산, 예로서, 이소루신, 발린, 루신 또는 메티오닌을 다른 아미노산에 대해 치환하거나, 하나의 극성 아미노산을 다른 아미노산에 대해 치환하는데, 예로서, 아르기닌을 리신으로, 글루탐산을 아스파르트산으로, 또는 글루타민을 아스파라긴으로 치환함). 하나 이상의 아미노산은 예를 들면, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 폴리펩티드로부터 결실될 수 있으며, 그 결과, 이 폴리펩티드의 생물학적 활성을 유의적으로 변성시키지 않으면서 상기 폴리펩티드의 구조가 변형된다. 예를 들면, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소의 생물학적 활성에 필요하지 않은 아미노- 또는 카복실-말단 아미노산이 제거될 수 있다. 본 발명에 따른 변형된 폴리펩티드 서열은 임의의 다수 방법, 예를 들면, 변형된 폴리펩티드 서열과 기질을 접촉시키는 단계 및 변형된 폴리펩티드가 분석법에서 이의 특이적인 기질의 양을 감소시키는지 여부, 또는 기능성 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 폴리펩티드와 기질의 효소 반응에 따른 생체 산물의 양을 증가시키는지 여부를 결정하는 단계를 포함하는 방법에 의해, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 효소의 생물학적 활성에 대해 분석될 수 있다.

단편: 단백질 또는 폴리펩티드 또는 핵산과 관련하여 본원에서 사용된 "단편"은 각각 단백질, 폴리펩티드 또는 핵산의 일부이다. 단편은 단편이 유래된 보다 긴 단백질, 폴리펩티드 또는 핵산 서열과 동일하거나 또는 실질적으로 동일한 아미노산 또는 핵산 서열을 가질 수 있다. 보다 긴 단백질, 폴리펩티드 또는 핵산의 것과 비교하여 상이한 3차원적 구조를 갖는 단편 또한 포함된다. 이의 예로서는 절단되면 유의적으로 보다 높은 활성을 갖는 성숙한 효소를 생산하도록 변형될 수 있는 "프로-형(pro-form)" 분자, 예로서, 저 활성 프로단백질이 있다.

입체적 역전 아미노트랜스퍼라제: "입체적 역전 아미노트랜스퍼라제"는 아미노 공여체로서 반대 키랄성 기질을 사용하면서 우선적으로 또는 선택적으로 키랄 아미노산 산물(예로서, 모나틴)을 생산할 수 있는 폴리펩티드이다. 예를 들면, 입체적 역전 아미노트랜스퍼라제는 기질로서 우선적으로 또는 선택적으로 L-글루타메이트를 사용하여 R,R 모나틴을 생산하는 D-페닐글리신 아미노트랜스퍼라제(D-4-하이드록시페닐글리신 아미노트랜스퍼라제로도 명명됨)일 수 있다. 입체적 역전 아미노트랜스퍼라제의 비제한적인 일례로는 D-메티오닌 아미노트랜스퍼라제(EC 2.6.1.41) 및 D-페닐글리신 아미노트랜스퍼라제 활성 또는 D-4-하이드록시페닐글리신 아미노트랜스퍼라제 활성을 갖는 효소를 포함한다.

본 발명은 피루베이트 활성 예로서, 제한없이, HMG 및/또는 KHG 알돌라제 활성을 포함하는 알돌라제를 갖는 폴리펩티드, 그를 코딩하는 폴리뉴클레오티드, 및 이들 폴리뉴클레오티드 및 폴리펩티드를 제조 및 사용하는 방법을 제공한다. 일부 실시태양에서, 본 발명은 또한 알돌라제 효소, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소, 이들 효소를 코딩하는 폴리뉴클레오티드, 상기 폴리뉴클레오티드 및 폴리펩티드의 용도를 제공한다.

일부 실시태양에서, 본 발명은 변형되지 않았거나 진화되지 않은 알돌라제와 비교하여 각각의 비활성이 증가된, 변형된 또는 진화된 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제를 제공한다.

일부 실시태양에서, 3,4-치환 2-케토-글루타레이트의 생산을 촉진시키는 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, 제한없이 HMG 및/또는 KHG 알돌라제를 제공한다. 하나의 실시태양에서, 본 발명은 (a) 알돌라제 활성, 예로서, 피루베이트 알돌라제 활성, 예로서, 제한없이, HMG 알돌라제 및/또는 KMG 알돌라제 활성을 갖는 폴리펩티드를 제공하는 단계; (b) 공여체 및 수용체 화합물을 제공하는 단계; 및 (c) 알돌라제가 3,4-치환 2-케토-글루타레이트의 합성을 촉진하는 조건하에서 단계 (a)의 폴리펩티드를 단계 (b)의 화합물과 접촉시키는 단계를 포함하며, 여기서, 경우에 따라, 공여체 및 수용체는 피루베이트 또는 피루베이트 공여체 및 α-케토산 수용체, 케톤 및/또는 알데히드인, 3,4-치환 2-케토-글루타레이트를 제조하는 방법을 제공한다.

본 발명의 또다른 실시태양에서, 4-치환 D-글루탐산 또는 그의 유도체를 제조하기 위하여 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제는 D-아미노트랜스퍼라제와 함께 사용될 수 있다. 4-치환 D-글루탐산 및/또는 그의 유도체는 이들 화합물이 박테리아 글루타메이트 라세마제를 저해하는 것으로 밝혀진 바, 항생제로서 사용될 수 있다. 하나의 실시태양에서, 본 발명은 (a) 알돌라제 활성, 예로서, 피루베이트 알돌라제 활성, 예로서, 제한없이, HMG 알돌라제 및/또는 KMG 알돌라제 활성을 갖는 폴리펩티드를 제공하는 단계; (b) α-케토산 수용체 및 피루베이트 또는 피루베이트 공여체를 제공하는 단계; 및 (c) 알돌라제가 4-치환 D-글루탐산의 합성을 촉진하는 조건하에서 단계 (a)의 폴리펩티드를 단계 (b)의 화합물과 접촉시키는 단계를 포함하며, 여기서, 경우에 따라, 폴리펩티드는 피루베이트 알돌라제, HMG 알돌라제 및/또는 KHG 알돌라제 활성을 갖고, 여기서, 본 방법은 경우에 따라, D-아미노트랜스퍼라제 사용을 추가로 포함하는 것인, 4-치환 D-글루탐산을 제조하는 방법을 제공한다.

일부 실시태양에서, 본 발명은 본 발명에 따른 효소, 폴리펩티드 또는 폴리뉴클레오티드를 포함하는 조성물(예로서, 효소 제제, 식품 및 식품 첨가제, 사료 및 사료 첨가제, 음료 및 음료 첨가제, 약물 및 약물 첨가제, 및 식이 보충제)을 제공한다. 이러한 조성물은 예로서, 액제, 겔제, 환제, 정제, 분무제, 필름제, 미셀, 분제, 식품, 사료 펠릿, 또는 나노캡슐화된 형태를 비롯한 캡슐화된 형태와 같은 다양한 형태로 제형화될 수 있다.

피루베이트 활성 예로서, 제한없이, HMG 및/또는 KHG 알돌라제 활성을 비롯한 알돌라제 활성을 측정하는 분석법, 예로서, 폴리펩티드가 피루베이트 활성 예로서, 제한없이, HMG 및/또는 KHG 알돌라제 활성을 비롯한 알돌라제 활성을 갖는지 여부를 측정하는 분석법은 당업계에 잘 알려져 있고, 본 발명에 따른 범주 내에 있다; 문헌 ([E. E. Dekker & R.P. Kitson, J. Biol. Chem. 267, 10507-10514, 1992]; [Taha TS, Deits TL, Purification and characterization of 2-keto-3-deoxy-6-phosphogluconate aldolase from Azotobacter vinelandii: evidence that the enzyme is bifunctional towards 2-keto-4-hydroxy glutarate cleavage, Biochem Biophys Res Commun. 1994 Apr 15;200(1):459-66]; [Dekker EE, Kobes RD, Grady SR, 2-keto-4-hydroxyglutarate aldolase from bovine liver, Methods Enzymol. 1975;42:280-5]; [Dekker EE, Nishihara H, Grady SR, Methods Enzymol. 1975;42:285-90, 2-keto-4-hydroxyglutarate aldolase from Escherichia coli]; [Nishihara H, Dekker EE, Biochim Biophys Acta. 1969 Jul 8;185(1):255-7, A stereospecific 2-keto-4-hydroxyglutarate aldolase from Escherichia coli]). 폴리펩티드가 알돌라제 활성, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 활성을 갖는지 여부를 측정하는 적합한 분석법의 일례는 실시예 3에 기술되어 있다.

일부 실시태양에서, 본 발명의 알돌라제는 예를 들면, 약 3.0 내지 약 12.0 범위를 비롯한 다양한 pH 조건하에서 효과적으로 사용될 수 있다. 다른 실시태양에서, 본 발명의 알돌라제는 약 pH 3.0, 4.0, 4.5, 5.0, 5.5, 6.0, 6.5, 7.0, 7.5, 8.0, 8.5, 9.0, 9.5, 10.0, 10.5, 11.0, 11.5, 또는 12.0에서 사용될 수 있다. 산성 또는 알칼리성 조건하에서 수행되는 반응 조건은 또한 예로서, 본 발명에 따른 효소의 몇몇 산업적 또는 약제학적 적용에 있어서 이로울 수 있다.

본 발명은 다양한 형태 및 제형으로 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 폴리펩티드를 제공한다. 본 발명에 따른 방법에서, 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 폴리펩티드는 다양한 형태 및 제형으로 사용된다. 예를 들면, 정제된 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 폴리펩티드는 R-2-하이드록시 2-(인돌-3일메틸)-4-케토 글루타르산(R-MP) 및 특정 모나틴의 입체이성체, 예로서, R,R 및 S,R 모나틴, 및 그의 염 뿐만 아니라, 특정 모나틴 유도체의 입체이성체, 예로서, R,R 및 S,R 모나틴 유도체 배열, 및 그의 염의 생산에 사용되는 효소 제제로서, 또는 약제 또는 식이 보조제 적용에 있어서 사용될 수 있다. 별법으로, 본 발명에 따른 효소는 R-2-하이드록시 2-(인돌-3일메틸)-4-케토 글루타르산(R-MP) 및 특정 모나틴의 입체이성체, 예로서, R,R 및 S,R 모나틴, 및 그의 염 뿐만 아니라, 특정 모나틴 유도체의 입체이성체, 예로서, R,R 및 S,R 모나틴 유도체 배열, 및 그의 염을 생산하는 공정에, 식품, 액제 또는 사료 등을 처리하는 공정에 직접 사용될 수 있다.

일부 실시태양에서, 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 폴리펩티드는 당업계에 공지된 방법을 사용하여 미생물에서 발현될 수 있다. 일부 실시태양에서, 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 폴리펩티드는 본 발명에 따른 방법에 사용하기 이전에 고형 지지체 상에 고정될 수 있다. 고형 지지체 상에 효소를 고정시키는 방법은 당업계에 잘 알려져 있다(예를 들어, 문헌 [J. Mol. Cat. B: Enzymatic 6 (1999) 29-39; Chivata et al. Biocatalysis: Immobilized cells and enzymes], [J Mol. Cat. 37 (1986) 1-24: Sharma et al., Immobilized Biomaterials Techniques and Applications], [Angew. Chem. Int. Ed. Engl. 21 (1982) 837-54: Laskin (Ed.), Enzymes and Immobilized Cells in Biotechnology. Nucleic Acids, Probes and Inhibitory Molecules]).

핵산, 프로브 및 저해 분자

본 발명은 단리된 핵산 및 재조합 핵산(예로서, 서열 목록 참조); 본 발명에 따른 폴리뉴클레오티드 서열을 포함하는, 폴리펩티드를 코딩하는 핵산(예로서, 서열 목록 참조), 예로서, 본 발명에 따른 핵산을 포함하는 발현 카세트, 예로서, 발현 벡터 및 다양한 클로닝 비히클을 제공한다. 일부 실시태양에서, 본 발명은 또한 본 발명에 따른 핵산을 사용하여 신규의 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 폴리펩티드 서열을 발견, 동정 또는 단리하는 방법을 포함하기도 한다. 일부 실시태양에서, 본 발명은 또한 본 발명에 따른 핵산을 사용하여 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 코딩 유전자와 전사체의 발현을 저해하는 방법도 포함한다.

또한, 본 발명은 예로서, 합성 결찰 재조립법, 최적화된 유도 진화 시스템 및/또는 포화 돌연변이 유발법, 예로서, 유전자 위치 포화 돌연변이 유발법(GSSM)에 의해, 본 발명에 따른 핵산을 변형시키는 방법, 예로서, 본 발명에 따른 핵산 변이체를 제조하는 방법을 제공한다. "포화 돌연변이 유발법", 유전자 위치 포화 돌연변이 유발법 또는 "GSSM"이란 용어는 이하에 상세히 기술되어 있는 바와 같이, 축퇴성 올리고뉴클레오티드 프라이머를 사용하여 점 돌연변이를 폴리뉴클레오티드에 도입시키는 방법을 포함한다. "최적화 유도 진화 시스템" 또는 "최적화 유도 진화"란 용어는 이하에 상세히 기술되어 있는 바와 같이, 관련된 핵산 서열, 예로서, 관련된 유전자의 단편들을 재조립하는 방법을 포함한다. "합성 결찰 재조립법" 또는 "SLR"이란 용어는 이하에 상세히 기술되어 있는 바와 같이, 확률에 의하지 않는 방식으로 올리고뉴클레오티드 단편을 결찰시키는 방법을 포함한다. "변이체"란 용어는 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제의 생물학적 활성을 계속적으로 갖는 하나 이상의 염기쌍, 각각의 코돈, 인트론, 엑손, 또는 아미노산 잔기(각각)에서 변형이 일어난 본 발명에 따른 폴리뉴클레오티드 또는 폴리펩티드를 지칭하는 것이다. 변이체는 예로서, 오류 빈발 PCR, 셔플링, 올리고뉴클레오티드 지정 돌연변이 유발법, 조립 PCR, 유성 PCR 돌연변이 유발법, 생체내 돌연변이 유발법, 카세트 돌연변이 유발법, 반복적 앙상블 돌연변이 유발법, 지수적 앙상블 돌연변이 유발법, 위치 특이적 돌연변이 유발법, 유전자 재조립법, GSSM 및 그의 임의의 조합을 포함하는 다수의 수단에 의해 생산될 수 있다.

본 발명에 따른 핵산은 예로서, cDNA 라이브러리의 클로닝 및 발현, PCR에 의한 메세지 또는 게놈 DNA 증폭 등에 의해 제조, 단리 및/또는 조작될 수 있다. 예를 들면, 본 발명에 따른 서열은 처음에는 환경적 공급원으로부터 유래하였다. 따라서, 일부 실시태양에서, 본 발명은 바람직하게 일반 공급원, 예로서, 환경의 혼합 배양물 또는 박테리아 공급원으로부터 유래된, 알돌라제-, 예로서, 피루베이트 알돌라제-, 예로서, HMG 및/또는 KHG 알돌라제 효소 코딩 핵산, 및 이들 핵산에 의해 코딩된 폴리펩티드를 제공한다.

본 발명에 따른 방법을 실시함에 있어서, 상동성 유전자는 본원에 기술된 바와 같이, 주형 핵산을 조작함으로써 변형될 수 있다. 일부 실시태양에서, 본 발명은 당업계에 공지된 임의의 방법, 프로토콜 또는 장치(과학 논문과 특허 문헌에 자세히 기재되어 있음)와 함께 실시될 수 있다.

본원에 사용된 "핵산" 또는 "핵산 서열"이란 어구는, 올리고뉴클레오티드, 뉴클레오티드, 폴리뉴클레오티드, 또는 이들 중 임의의 것의 단편, 단일 가닥 또는 이중 가닥일 수 있으며 센스 또는 안티센스(상보성) 가닥일 수 있는 게놈 또는 합성 유래의 DNA 또는 RNA, 펩티드 핵산(PNA: Peptide nucleic acid), 또는 천연 또는 합성 유래의 임의의 DNA-유사 또는 RNA-유사 물질을 지칭하는 것이다. "핵산" 또는 "핵산 서열"이란 어구는, 올리고뉴클레오티드, 뉴클레오티드 또는 폴리뉴클레오티드, 또는 이들 중 임의의 것의 단편, 단일 가닥 또는 이중 가닥일 수 있으며 센스 또는 안티센스 가닥일 수 있는 게놈 또는 합성 유래의 DNA 또는 RNA(예를 들어, mRNA, rRNA, tRNA, iRNA), 펩티드 핵산(PNA), 또는 천연 또는 합성 유래의 임의의 DNA-유사 또는 RNA-유사 물질 예를 들어, iRNA 및 뉴클레오단백질(예를 들어, 이중 가닥 iRNA 예를 들어, iRNP)를 포함한다. 상기 용어는 천연 뉴클레오티드의 공지된 유사체를 함유하는 핵산, 즉, 올리고뉴클레오티드를 포함한다. 상기 용어는 또한 합성 골격을 갖는 핵산-유사 구조를 포함한다(예를 들어, 문헌 [Mata (1997) Toxicol. Appl. Pharmacol. 144:189-197]; [Strauss-Soukup (1997) Biochemistry 36:8692-8698]; [Samstag (1996) Antisense Nucleic Acid Drug Dev 6:153-156]) 참조). "올리고뉴클레오티드"는 화학적으로 합성될 수 있는 단일 가닥 폴리데옥시리보뉴클레오티드 또는 2개의 상보성 폴리데옥시뉴클레오티드 가닥을 포함한다. 이러한 합성 올리고뉴클레오티드는 5' 말단에 인산기를 갖지 않으므로, 키나제의 존재하에 ATP와 함께 포스페이트를 첨가하지 않고서도 다른 올리고뉴클레오티드에 결찰되지 않을 것이다. 합성 올리고뉴클레오티드는 탈인산화되지 않은 단편에 결찰될 수 있다.

특정 폴리펩티드 또는 단백질의 "코딩 서열" 또는 특정 폴리펩티드 또는 단백질"을 코딩하는 뉴클레오티드"란, 적당한 조절 서열의 제어하에 있을 때, 폴리펩티드 또는 단백질로 전사 및 번역될 수 있는 핵산 서열이다. "유전자"란 용어는 폴리펩티드 쇄를 생산하는데에 관여하는 DNA 세그먼트를 의미하는 것으로서; 이는 코딩 영역(리더 및 트레일러)의 앞뒤에 위치하는 영역들을 포함하고, 가능한 경우에는, 각각의 코딩 세그먼트들(엑손) 사이에 개입된 서열(인트론)도 포함한다. 프로모터에서 전사를 개시하는 RNA 중합효소가 코딩 서열을 mRNA로 전사할 때, 이 프로모터 서열은 코딩 서열에 "작동 가능하게 연결되어 있는" 상태라고 한다. 본원에 사용된 "작동 가능하게 연결되어 있는"이란, 2개 이상의 핵산(예를 들어, DNA) 세그먼트들 사이의 기능상의 관계를 의미하는 것이다. 이는 곧, 전사된 서열에 대한 전사 조절 서열의 기능상의 관계를 지칭하는 것일 수도 있다. 예를 들면, 만일 프로모터가 적당한 숙주 세포 또는 기타 발현 시스템 내에서 코딩 서열의 전사를 자극시키거나 조정한다면, 이 프로모터는 코딩 서열, 예로서, 본 발명에 따른 핵산에 작동 가능하게 연결되어 있는 것이다. 일반적으로, 전사된 서열에 작동 가능하게 연결되어 있는 프로모터 전사 조절 서열은 전사된 서열과 물리적으로 인접하여 있는 것으로서, 다시 말하면, 이 서열은 시스-작용 위치에 있는 것이다. 그러나, 일부 전사 조절 서열, 예로서, 인핸서는 이것이 증진시키고자 하는 전사와 관계된 코딩 서열과 물리적으로 인접하여 존재하거나 또는 이 코딩 서열에 매우 근접하여 위치하고 있을 필요는 없다.

본원에 사용된 "발현 카세트"라는 용어는 구조 유전자를 발현시킬 수 있는 뉴클레오티드 서열(즉, 본 발명에 따른 단백질 코딩 서열, 예로서, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소)과 적합성인 숙주에서 발현되는 뉴클레오티드 서열을 지칭한다. 발현 카세트는 적어도 폴리펩티드 코딩 서열과 작동 가능하게 연결되어 있는 프로모터를 포함하고; 경우에 따라, 기타 서열, 예로서, 전사 종결 신호와 작동 가능하게 연결되어 있는 프로모터를 포함하기도 한다. 발현시키는데 필요하거나 도움이 되는 부가 인자, 예를 들어, 인핸서 및 알파-인자도 사용될 수 있다. 따라서, 발현 카세트로서는 또한 플라스미드, 발현 벡터, 재조합 바이러스, 그리고 임의의 형태의 재조합 "나출 DNA" 벡터 등을 포함한다. "벡터"는 세포를 감염, 형질감염, 일시적으로 또는 영구적으로 형질 도입시킬 수 있는 핵산을 포함한다. 벡터는 나출 핵산, 또는 단백질이나 지질과 함께 복합체를 형성하는 핵산일 수 있음을 알 수 있을 것이다. 벡터는 경우에 따라, 바이러스 또는 박테리아 핵산 및/또는 단백질, 및/또는 막(예로서, 세포막, 바이러스 지질 외피 등)을 포함한다. 벡터로서는 DNA 단편이 결합하여 복제될 수 있는 레플리콘(예를 들어, RNA 레플리콘 및 박테리오파지)을 포함하나, 이에 한정되는 것은 아니다. 따라서, 벡터는 RNA, 자율 자가 복제 환형 또는 선형 DNA 또는 RNA(예를 들어, 플라스미드 및 바이러스 등, 미국 특허 번호 제5,217,879호 참조)를 포함하며, 또한 발현 및 비발현 플라스미드 둘 모두를 포함하나, 이에 한정되는 것은 아니다. 재조합 미생물 또는 세포 배양물이 "발현 벡터"를 수용하는 것으로서 기술되어 있을 경우, 이는 잉여 염색체성 환형 및 선형 DNA 및 숙주의 염색체(들)에 통합된 DNA 둘 모두를 포함하는 것이다. 벡터가 숙주 세포에 의해 유지되고 있는 경우, 벡터는 유사 분열하는 동안 자율 작제물로서 세포에 의해 안정하게 복제될 수 있거나, 숙주의 게놈 내에 통합된다.

본원에서 사용되는 바, "재조합체"란 용어는, 천연의 환경에서는 인접하여 존재하지 않던 "골격" 핵산에 인접하여 위치하는 핵산을 포함한다. 일부 실시태양에서, 핵산이 "증폭"되었다는 것은 핵산 골격 분자의 군집 중에 존재하는 핵산 인서트의 수가 약 5% 이상임을 의미할 것이다. 본 발명에 따른 골격 분자는 핵산, 예로서, 발현 벡터, 자가 복제 핵산, 바이러스, 통합 핵산 및 기타 벡터, 또는 관심의 대상이 되는 핵산 인서트를 유지하거나 조작하는데에 사용되는 핵산을 포함한다. 일부 실시태양에서, 증폭된 핵산이란, 재조합 골격 분자의 군집 중에 존재하는 핵산 인서트의 수가 약 15% 이상인 경우를 말한다. 일부 실시태양에서, 증폭된 핵산이란, 재조합 골격 분자의 군집 중에 존재하는 핵산 인서트의 수가 약 50% 이상인 경우를 말한다. 일부 실시태양에서, 증폭된 핵산이란, 재조합 골격 분자의 군집 중에 존재하는 핵산 인서트의 수가 약 90% 이상인 경우를 말한다.

본 발명의 하나의 실시태양은 본 발명에 따른 서열 중 하나를 포함하는 단리된 합성 또는 재조합 핵산, 또는 본 발명에 따른 핵산 중 적어도 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개, 150개, 200개, 300개, 400개 또는 500개 또는 그 이상의 연속된 염기를 포함하는 단편이다. 단리된 합성 또는 재조합 핵산은 cDNA, 게놈 DNA 및 합성 DNA를 비롯한, DNA를 포함할 수 있다. 상기 DNA는 이중 가닥 또는 단일 가닥일 수 있으며, 만일 단일 가닥일 경우에는 코딩 가닥 또는 비코딩(안티센스) 가닥일 수 있다. 별법으로, 단리된 합성 또는 재조합 핵산 RNA를 포함한다.

본 발명에 따른 단리된 합성 또는 재조합 핵산은 본 발명의 폴리펩티드 중 하나, 또는 본 발명의 폴리펩티드 중 하나의 연속된 아미노산을 적어도 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개, 또는 150개 또는 그 이상 포함하는 단편을 제조하는데에 사용될 수 있다. 그러므로, 본 발명의 또다른 실시태양은 본 발명의 폴리펩티드 중 하나, 또는 본 발명의 폴리펩티드 중 하나의 연속된 아미노산을 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개, 또는 150개 또는 그 이상 포함하는 단편을 코딩하는 단리된 합성 또는 재조합 핵산이다. 이러한 핵산의 코딩 서열은, 유전자 암호의 중복성 또는 축퇴성으로 인하여, 본 발명에 따른 핵산 중 하나의 코딩 서열 중 하나와 동일할 수 있거나, 본 발명에 따른 폴리펩티드 중 하나의 연속된 아미노산을 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개, 또는 150개 또는 그 이상 갖는 본 발명에 따른 것 중 하나를 코딩하는 상이한 코딩 서열일 수 있다. 유전자 암호는 당업자에게 잘 알려져 있으며, 예로서, 문헌 [B. Lewin, Genes VI, Oxford University Press, 1997, 214 페이지]에서 살펴볼 수 있다.

본 발명의 폴리펩티드 중 하나를 코딩하는 단리된 핵산, 및 그와 실질적으로 동일한 서열은 하기 것들을 포함하나, 이에 한정되는 것은 아니다: 본 발명에 따른 핵산의 코딩 서열 및 부가 코딩 서열, 예로서, 리더 서열 또는 프로-단백질 서열 및 비코딩 서열, 예로서, 인트론 또는 코딩 서열의 5' 및/또는 3' 말단에 존재하는 비코딩 서열. 따라서, 본원에 사용된 "폴리펩티드를 코딩하는 폴리뉴클레오티드"라는 용어는, 폴리펩티드에 대한 코딩 서열을 포함하는 폴리뉴클레오티드와, 부가 코딩 서열 및/또는 비코딩 서열을 포함하는 폴리뉴클레오티드를 포함한다.

별법으로, 본 발명에 따른 핵산 서열 및 그와 실질적으로 동일한 서열은 통상의 기법, 예로서, 위치 지정 돌연변이 유발법이나 당업자에게 익숙한 기타 기법을 사용하여 돌연변이화시켜 본 발명에 따른 폴리뉴클레오티드에 침묵 변이를 도입시킬수 있다. 본원에서 사용되는 바, "침묵 변이"란, 예를 들면, 폴리뉴클레오티드에 의해 코딩되는 아미노산 서열을 변형시키지 않는 변이를 포함한다. 이러한 변이는 숙주 유기체 내에서 자주 발생하는 코돈 또는 코돈 쌍의 도입에 의해 폴리펩티드를 코딩하는 벡터를 함유하는 숙주 세포에 의해 생산되는 폴리펩티드의 수준을 증가시키는데에 바람직할 수 있다.

본 발명은 또한 본 발명에 따른 폴리펩티드에 아미노산 치환, 부가, 결실, 융합 및 절단을 일으키는 뉴클레오티드 변이가 발생한 폴리뉴클레오티드에 관한 것이다. 이러한 뉴클레오티드 변이는 기법, 예로서, 위치 지정 돌연변이 유발법, 무작위 화학적 돌연변이 유발법, 엑소뉴클레아제 III 결실법 및 기타 재조합 DNA 기법을 사용하여 도입될 수 있다. 별법으로, 이러한 뉴클레오티드 변이는, 높은 엄격도, 중간 정도의 엄격도 또는 저 엄격도의 조건하에서, 본 발명에 따른 서열(또는 이에 상보성인 서열) 중 하나의 연속된 염기를 적어도 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개, 150개, 200개, 300개, 400개, 또는 500개 또는 그 이상 포함하는 프로브에 특이적으로 혼성화하는 핵산을 동정함으로써 단리되는 천연적으로 발생된 대립 형질 변이체일 수 있다.

일반적인 기술

본 발명을 실시하는데 사용되는 핵산은, 그것이 RNA, siRNA, miRNA, 안티센스 핵산, cDNA, 게놈 DNA, 벡터, 바이러스 또는 그의 하이브리드이든 아니든, 다양한 공급원으로부터 단리되어, 유전적으로 조작되고, 증폭 및/또는 재조합적으로 발현/생성될 수 있다. 이들 핵산들로부터 생성된 재조합 폴리펩티드(예로서, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소)는 각각 단리 또는 클로닝되고, 원하는 활성에 대해 시험될 수도 있다. 박테리아, 포유동물, 효모, 곤충 또는 식물 세포 발현 시스템을 비롯한, 임의의 재조합 발현 시스템이 사용될 수 있다.

별법으로, 이들 핵산은 잘 알려져 있는 화학적 합성 기법에 의해 시험관내에서 합성될 수 있다(예로서, 문헌 [Adams (1983) J. Am. Chem. Soc. 105:661]; [Belousov (1997) Nucleic Acids Res. 25:3440-3444]; [Frenkel (1995) Free Radic. Biol. Med. 19:373-380]; [Blommers (1994) Biochemistry 33:7886-7896; Narang (1979) Meth. Enzymol. 68:90; Brown (1979) Meth. Enzymol. 68:109]; [Beaucage (1981) Tetra. Lett. 22:1859]; 미국 특허 번호 제4,458,066호).

핵산을 조작하는 기법, 예를 들어, 서브클로닝, 프로브 표지화 (예를 들어, 클레노우 중합효소를 사용하는 무작위-프라이머 표지화, 닉 번역, 증폭), 서열 분석, 및 혼성화 등과 같은 기법은 과학 논문 및 특허 문헌에 자세히 기재되어 있다(예를 들어, 문헌 [Sambrook, ed., MOLECULAR CLONING: A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, (1989)]; [CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Ausubel, ed. John Wiley & Sons, Inc., New York (1997)]; [LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY: HYBRIDIZATION WITH NUCLEIC ACID PROBES, Part I. Theory and Nucleic Acid Preparation, Tijssen, ed. Elsevier, N.Y. (1993)] 참조).

본 발명에 따른 방법을 실시하는데에 사용되는 핵산의 제조 및 조작 방법으로서 유용한 기타 방법은 게놈 샘플로부터 클로닝하는 방법으로서, 원하는 경우에는 예로서, 게놈 클론 또는 cDNA 클론으로부터 단리 또는 증폭된 인서트를 스크리닝 및 재-클로닝하는 방법이 있다. 본 발명에 따른 방법에 사용되는 핵산의 공급원은, 예로서, 포유동물 인공 염색체(MAC)(미국 특허 번호 제5,721,118호; 제6,025,155호 참조); 인간 인공 염색체(예를 들어, 문헌 [Rosenfeld (1997) Nat. Genet. 15:333-335] 참조); 효모 인공 염색체(YAC); 박테리아 인공 염색체(BAC); P1 인공 염색체(예를 들어, 문헌 [Woon (1998) Genomics 50:306-316] 참조); P1-유래 벡터(PAC)(예를 들어, 문헌 [Kern (1997) Biotechniques 23:120-124]); 코스미드, 재조합 바이러스, 파지 또는 플라스미드에 포함되어 있는 게놈 라이브러리 또는 cDNA 라이브러리를 포함한다.

일부 실시태양에서, 본 발명에 따른 폴리펩티드를 코딩하는 핵산은 번역된 폴리펩티드 또는 그의 단편의 분비를 유도할 수 있는 리더 서열과 함께 적당한 단계에서 조립된다.

본 발명은 융합 단백질과 이를 코딩하는 핵산을 제공한다. 본 발명에 따른 폴리펩티드는 원하는 특성, 예로서, 강화된 안정성 또는 단순화된 정제 특성을 부여하는 이종 펩티드 또는 폴리펩티드, 예를 들어, N-말단 동정 펩티드에 융합될 수 있다. 본 발명에 따른 펩티드 또는 폴리펩티드는 또한 예를 들어, 면역원성이 더욱 큰 펩티드를 생산하거나, 재조합 합성된 펩티드를 더욱 용이하게 단리하거나, 항체 및 항체-발현 B 세포 등을 더욱 용이하게 동정 및 단리하기 위해서, 이 펩티드 또는 폴리펩티드에 연결되어 있는 하나 이상의 부가 도메인을 갖는 융합 단백질로서 합성 및 발현될 수도 있다. 검출 및 정제 촉진 도메인으로서는 예를 들어, 고정화된 금속상에서 정제될 수 있도록 만들어주는 금속 킬레이트화 펩티드, 예를 들어, 폴리히스티딘 구역 및 히스티딘-트립토판 모듈, 고정화된 면역글로불린상에서 정제될 수 있도록 만들어주는 단백질 A 도메인, 및 FLAGS 연장/친화성 정제 시스템(워싱턴주 시애틀에 소재하는 Immunex Corp.)에 사용되는 도메인을 포함한다. 절단 가능한 링커 서열, 예를 들어, 인자 Xa 또는 엔테로키나제(캘리포니아주 샌디에고에 소재 Invitrogen)를 정제용 도메인과 모티프-포함 펩티드 또는 폴리펩티드 사이에 포함시켜 정제를 촉진할 수 있다. 예를 들어, 발현 벡터는 6개의 히스티딘 잔기에 이어서 티오리독신 및 엔테로키나제 절단 위치에 연결되어 있는 에피토프 코딩 핵산 서열을 포함할 수 있다(예를 들어, 문헌 [Williams (1995) Biochemistry 34:1787-1797]; [Dobeli (1998) Protein Expr. Purif. 12:404-414] 참조). 히스티딘 잔기는 검출 및 정제를 촉진시키는 반면에, 엔테로키나제 절단 위치는 융합 단백질의 나머지 부분으로부터 에피토프를 정제하는 수단을 제공한다. 융합 단백질을 코딩하는 벡터와 관련된 기술 및 융합 단백질의 적용과 관련된 기술은 과학 논문 및 특허 문헌에 잘 기재되어 있다(예를 들어, 문헌 [Kroll (1993) DNA Cell. Biol., 12:441-53] 참조).

전사 및 번역 제어 서열

본 발명은 발현(예를 들어, 전사 또는 번역) 제어 서열(들), 예를 들어, 프로모터 또는 인핸서에 작동 가능하도록 연결되어 있어서, RNA 합성/발현을 유도 또는 조정하는 본 발명에 따른 핵산(예를 들어, DNA) 서열을 제공한다. 이러한 발현 제어 서열은 발현 벡터 내에 존재할 수 있다. 대표적인 박테리아 프로모터로서는 lacI, lacZ, T3, T7, gpt, 람다 PR, PL 및 trp를 포함한다. 대표적인 진핵 생물 프로모터로서는 CMV 즉시 초기 프로모터, HSV 티미딘 키나제 프로모터, 초기 및 후기 SV40 프로모터, 레트로바이러스의 LTR 프로모터 및 마우스의 메탈로티오네신 I 프로모터를 포함한다.

본원에 사용된 "프로모터"란 용어는, 세포, 예를 들어, 식물 또는 동물 세포 내에서 코딩 서열의 전사를 유도할 수 있는 모든 서열을 포함한다. 따라서, 본 발명에 따른 작제물에 사용되는 프로모터는 유전자의 전사 타이밍 및/또는 속도를 조절 또는 조정하는 것에 관여하는 시스-작용 전사 제어 요소 및 조절 서열을 포함한다. 예를 들어, 프로모터는, 전사 조절에 관여하는 시스-작용 전사 제어 요소, 예를 들어, 인핸서, 프로모터, 전사 종결 인자, 복제 기점, 염색체 통합 서열, 5' 및 3' 비번역 영역 또는 인트론 서열일 수 있다. 이러한 시스-작용 서열은 단백질 또는 기타 생체 분자와 상호 작용하여, 전사를 수행(작동 개시/작동 종료, 조절 또는 조정 등)할 수 있다. "구성적" 프로모터는 대부분의 환경적 조건과 발달 상태 또는 세포 분화시에 연속적으로 발현을 유도하는 프로모터이다. "유도 가능한" 또는 "조절 가능한" 프로모터는, 환경 조건 또는 발달 조건의 영향에 따라서 본 발명에 따른 핵산의 발현을 유도한다. 유도성 프로모터에 의해 전사를 진행할 수 있는 환경 조건의 예로서는, 혐기 조건, 고온, 건조 또는 빛의 존재 여부를 포함한다.

"조직 특이적" 프로모터는 예를 들어, 식물이나 동물의 특정 세포 또는 조직 또는 기관 내에서만 활성을 갖는 전사 제어 요소이다. 조직 특이적 조절은, 소정의 조직에 특이적인 단백질을 코딩하는 유전자가 발현되는지 여부를 확인할 수 있는 임의의 내인성 요인에 의해서 이루어질 수 있다. 이러한 요인은 포유동물 및 식물에 존재하여 특이 조직을 발달시킬 수 있는 것으로 알려져 있다.

박테리아 내에서 폴리펩티드를 발현시키는데에 적합한 프로모터로서는 E. 콜라이의 lac 또는 trp 프로모터, lacI 프로모터, lacZ 프로모터, T3 프로모터, T7 프로모터, gpt 프로모터, 람다 PR 프로모터, 람다 PL 프로모터, 해당 효소, 예로서, 3-포스포글리세레이트 키나제(PGK: 3-phosphoglycerate kinase)를 코딩하는 오페론으로부터 유래하는 프로모터, 및 산성 포스파타제 프로모터를 포함한다. 진핵 생물 프로모터로서는 CMV 즉시 초기 프로모터, HSV 티미딘 키나제 프로모터, 열 충격 프로모터, 초기 및 후기 SV40 프로모터, 레트로바이러스의 LTR 프로모터 및 마우스의 메탈로티오네신-I 프로모터를 포함한다. 원핵 생물 또는 진핵 생물 세포 또는 그의 바이러스 유전자의 발현을 제어하는 것으로 공지되어 있는 기타 프로모터 또한 사용될 수 있다. 박테리아 내에서 폴리펩티드 또는 그의 단편을 발현시키는데에 적합한 프로모터로서는 E. 콜라이의 lac 또는 trp 프로모터, lacI 프로모터, lacZ 프로모터, T3 프로모터, T7 프로모터, gpt 프로모터, 람다 PR 프로모터, 람다 PL 프로모터, 해당 효소, 예로서, 3-포스포글리세레이트 키나제(PGK)를 코딩하는 오페론으로부터 유래하는 프로모터, 및 산성 포스파타제 프로모터를 포함한다. 진균 프로모터로서는 α-인자 프로모터를 포함한다. 진핵 생물 프로모터로서는 CMV 즉시 초기 프로모터, HSV 티미딘 키나제 프로모터, 열 충격 프로모터, 초기 및 후기 SV40 프로모터, 레트로바이러스의 LTR 프로모터 및 마우스의 메탈로티오네신-I 프로모터를 포함한다. 원핵 생물 또는 진핵 생물 또는 그의 바이러스 내에서 유전자 발현을 제어하는 것으로 공지되어 있는 기타 프로모터 또한 사용될 수 있다.

조직-특이 식물 프로모터

본 발명은 조직 특이적 방식으로 발현될 수 있는, 예로서, 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 조직 특이적 방식으로 발현시킬 수 있는 발현 카세트를 제공한다. 일부 실시태양에서, 본 발명은 또한 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 조직 특이적 방식으로 발현시키는 식물 또는 종자를 제공한다. 상기 조직-특이성은 종자-특이적, 줄기-특이적, 잎-특이적, 뿌리-특이적, 열매-특이적 등의 것일 수 있다.

"식물"이란 용어는 전체 식물, 식물의 일부(예를 들어, 잎, 줄기, 꽃 또는 뿌리 등), 식물의 원형질체, 종자 및 식물의 세포와 그의 자손을 포함한다. 본 발명에 따른 방법에 사용될 수 있는 식물 부류는 일반적으로 형질전환 기법에 순응할 수 있는 고등 식물 부류, 예로서, 속씨 식물(외떡잎 식물 및 쌍떡잎 식물), 및 겉씨 식물과 같이 광범위하다. 이 식물 부류는 다양한 수준의 배수성, 예로서, 배수체, 이배체, 반수체 및 반접합체 상태의 식물을 포함한다. 본원에 사용된 "트랜스제닉 식물"이란, 이종 핵산 서열, 예로서, 본 발명에 따른 핵산 및 다양한 재조합 작제물(예를 들어, 발현 카세트)이 삽입된 식물 또는 식물 세포를 포함한다.

일부 실시태양에서, 구성적 프로모터, 예로서, CaMV35S 프로모터는 식물 또는 종자의 특정 부분 또는 전체 식물에서 발현하는데에 사용될 수 있다. 예를 들면, 과발현의 경우, 식물의 일부 조직 또는 전체 조직, 예로서, 재생산된 식물 내에서 핵산을 발현시킬 식물 프로모터 단편이 사용될 수 있다. 그러한 프로모터를 본원에서는 "구성적" 프로모터라 지칭하며, 이 프로모터는 대부분의 환경 조건과 발달 단계 또는 세포 분화 중에 활성을 갖는다. 구성적 프로모터의 예로서는, 꽃양배추 모자이크 바이러스(CaMV: cauliflower mosaic virus) 35S 전사 개시 부위, 아그로박테리움 튜메페이션스의 T-DNA로부터 유래하는 1'- 또는 2'-프로모터, 및 당업자에게 공지된 다양한 식물 유전자로부터 유래하는 기타 전사 개시 영역을 포함한다. 그러한 유전자로서는, 예로서, 아라비돕시스(Arabidopsis)의 ACT11(문헌 [Huang (1996) Plant Mol . Biol . 33:125-139]); 아라비돕시스의 Cat3(진뱅크 번호 U43147, 문헌 [Zhong (1996) Mol . Gen . Genet. 251:196-203]); 브라시카 나푸스(Brassica napus)의 스테아로일-아실 운반 단백질 불포화 효소를 코딩하는 유전자(진뱅크 번호 X74782, 문헌 [Solocombe (1994) Plant Physiol . 104:1167-1176]); 옥수수의 GPc1(진뱅크 번호 X15596; 문헌 [Martinez (1989) J. Mol . Biol . 208:551-565]); 옥수수의 Gpc2(진뱅크 번호 U45855, 문헌 [Manjunath (1997) Plant Mol. Biol . 33:97-112]); 미국 특허 번호 제4,962,028호; 제5,633,440호에 기술된 식물 프로모터를 포함한다.

본 발명은, 예로서, 토바모바이러스(tobamovirus) 하위 게놈 프로모터(문헌 [Kumagai (1995) Proc. Natl. Acad. Sci. USA 92:1679-1683]; 감염된 쌀 식물의 체관 세포에서만 복제하며, 강력한 체관-특이적 리포터 유전자 발현을 유도하는 프로모터를 갖는 쌀의 퉁그로 간상 바이러스(RTBV: rice tungro bacilliform virus); 유관속 세포, 잎의 잎살 세포 및 근단에서만 고도의 활성을 나타내는 카사바 베인 모자이크 바이러스(CVMV: cassava vein mosaic virus) 프로모터(문헌 [Verdaguer (1996) Plant Mol. Biol. 31:1129-1139])를 포함할 수 있는 바이러스로부터 유래하는 조직 특이적 또는 구성적 프로모터를 사용한다.

일부 실시태양에서, 식물 프로모터는 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소-발현 핵산을 특정 조직, 기관 또는 세포 유형 내에서 발현시키거나(즉, 조직 특이적 프로모터), 또는 더욱 정확한 환경에 따른 제어 또는 발달에 따른 제어하에 있을 수 있거나, 또는 유도성 프로모터의 제어하에 있을 수 있다. 전사시킬 수 있는 환경적 조건의 예로서는, 혐기성 조건, 고온, 빛의 존재 여부, 또는 화학 물질/호르몬이 분무되었는지 여부를 포함한다. 예를 들면, 본 발명은 옥수수의 건조-유도성 프로모터[Busk (1997) 상기 문헌]; 온도 하강, 건조 및 고농도 염에 따라서 작동이 유도되는 감자의 프로모터(문헌 [Kirch(1997) Plant Mol. Biol. 33:897 909])를 포함한다.

일부 실시태양에서, 조직 특이적 프로모터는 그 조직 내에서의 발달 단계의 주기 중 임의의 시기에만 전사를 촉진한다. 예로서, 아라비돕시스 LEAFY 유전자 프로모터를 특징화하는 문헌 [Blazquez (1998) Plant Cell 10:791-800]을 참조할 수 있다. 또한, A. 탈리아나(A. thaliana) 꽃 분열조직의 아이덴티티 유전자인 AP1의 프로모터 영역 내에 존재하는 보존적 서열 모티프를 인지하는 전사 인자인 SPL3에 관하여 기술하고 있는 문헌 [Cardon (1997) Plant J 12:367-77]; 및 분열 조직 프로모터인 eIF4에 관하여 기술하고 있는 문헌 [Mandel (1995) Plant Molecular Biology, Vol. 29, pp 995-1004]을 참조할 수 있다. 특정 조직의 생존 주기를 통하여 활성을 갖는 조직 특이적 프로모터를 사용할 수 있다. 일부 실시태양에서, 본 발명에 따른 핵산은 주로 면 섬유 세포에서만 활성을 갖는 프로모터에 작동 가능하게 연결되어 있다. 일부 실시태양에서, 문헌 [Rinehart (1996) 상기 문헌]에 기재되어 있는 바와 같아, 본 발명에 따른 핵산은 면 섬유 세포 연장 단계 동안 주로 활성을 갖는 프로모터에 작동 가능하게 연결되어 있다[Rinehart (1996) 상기 문헌]. 핵산은 우선적으로 면 섬유 세포(상기 문헌)에서 발현되는 Fbl2A 유전자 프로모터에 작동 가능하게 연결될 수 있다. 또한, 면 섬유-특이적 프로모터 및 트랜스제닉 목화 식물의 작제 방법에 관하여 기재되어 있는 (문헌 [John (1997) Proc. Natl. Acad. Sci. USA 89:5769-5773]; 미국 특허 번호 제 5,608,148호 및 제5,602,321호(John et al.))을 참조할 수 있다. 뿌리-특이적 프로모터 또한 본 발명에 따른 핵산을 발현하는데에도 사용될 수 있다. 뿌리-특이적 프로모터의 예로서는 알코올 데하이드로게나제 유전자로부터 유래하는 프로모터를 포함한다(문헌 [DeLisle (1990) Int. Rev. Cytol. 123:39-60]). 본 발명에 따른 핵산을 발현시키는데에 사용될 수 있는 기타 프로모터로서는 예로서, 난세포-특이적 프로모터, 배아-특이적 프로모터, 배젖-특이적 프로모터, 외피-특이적 프로모터, 종피-특이적 프로모터, 또는 그의 조합; 잎-특이적 프로모터(옥수수내 잎-특이적 프로모터에 관하여 기재하고 있는 문헌 [Busk (1997) Plant J. 11:1285 1295] 참조); 아그로박테리움 리조제네스(Agrobacterium rhizogenes)로부터 유래하는 ORF13 프로모터(뿌리에서 고도의 활성을 나타냄)(문헌 [Hansen (1997) 상기 문헌] 참조); 옥수수 화분 특이적 프로모터(문헌 [Guerrero (1990) Mol. Gen. Genet. 224:161 168] 참조); 과실 숙성기, 노화기 및 낙엽기 동안에 활성을 갖는 토마토 프로모터 외에도, 그 정도는 낮지만, 낙화기 동안에 활성을 갖는 프로모터도 사용될 수 있으며(문헌 [Blume (1997) Plant J. 12:731 746] 참조); 감자 SK2 유전자로부터 유래하는 암술-특이적 프로모터(문헌 [Ficker (1997) Plant Mol. Biol. 35:425 431] 참조); 트랜스제닉 알팔파의 휴면중인 어린 싹과 꽃의 어린 눈의 정점에 있는 표피 조직에서 활성을 나타내므로 외래 유전자를 왕성하게 성장하고 있는 어린 싹 또는 섬유의 표피층으로 발현시킬 수 있는 유용한 도구가 되는, 완두 유래 Blec4 유전자; 난세포-특이적 BEL1 유전자(문헌 [Reiser (1995) Cell 83:735-742] 참조, 진뱅크 번호 U39944); 및/또는, 식물 프로모터 영역은 분열 조직 및/또는 신속하게 분열중인 세포에서 높은 수준으로 전사를 진행시킬 수 있다고 기재하고 있는 미국 특허 번호 제5,589,583호(Klee)에 기재된 프로모터를 포함한다.

일부 실시태양에서, 식물 호르몬, 예로서, 옥신에 노출될 때 유도성이 되는 식물 프로모터는 본 발명에 따른 핵산을 발현시키는데에 사용된다. 예로서, 본 발명은 대두(글리신 맥스 L.(Glycine max L.))의 옥신-반응 요소 E1 프로모터 단편(AuxREs)(문헌 [Liu (1997) Plant Physiol. 115:397-407]); 옥신-반응성 아라비돕시스 GST6 프로모터(살리실산과 과산화수소에도 반응성임)(문헌 [Chen (1996) Plant J. 10: 955-966]); 담배로부터 유래하는 옥신-유도성 parC 프로모터(문헌 [Sakai (1996) 37:906-913]); 식물 비오틴 반응 요소(문헌 [Streit (1997) Mol. Plant Microbe Interact. 10:933-937]); 및 스트레스 호르몬인 앱사이신산에 반응성인 프로모터(문헌 [Sheen (1996) Science 274:1900-1902])을 사용할 수 있다.

본 발명에 따른 핵산은 또한 식물에 적용될 수 있는 화학 시약, 예로서, 제초제 또는 항생제에 노출될 때에 유도될 수 있는 식물 프로모터에 작동 가능하게 연결될 수도 있다. 예를 들면, 벤젠설폰아미드 제초제의 안정제에 의해 활성화되는 옥수수 In2-2 프로모터가 사용될 수 있으며(문헌 [De Veylder (1997) Plant Cell Physiol. 38:568-577]); 상이한 제초제의 안정제를 사용할 경우, 독특한 유전자 발현 패턴, 예로서, 뿌리, 배수 조직 및 어린 싹의 정점에 존재하는 분열 조직의 발현을 유도하게 된다. 코딩 서열은, 예로서, 테트라사이클린-유도성 프로모터, 예로서, 아베나 사티바 L.(Avena sativa L.)(귀리)의 아르기닌 데카르복실라제 유전자(문헌 [Masgrau (1997) Plant J. 11:465-473]); 또는 살리실산 반응성 요소(문헌 [Stange (1997) Plant J. 11:1315-1324])의 제어하에 있을 수 있다. 화학적으로 유도되는(예를 들어, 호르몬이나 살생물제로 유도되는) 프로모터, 즉, 목초지에 있는 트랜스제닉 식물에 적용될 수 있는 화학 물질에 반응성인 프로모터를 사용할 경우, 본 발명에 따른 폴리펩티드 발현은 식물 발달 단계 중 특정 단계에서 유도될 수 있다. 따라서, 본 발명은 또한 본 발명에 따른 폴리펩티드를 코딩하는 유도성 유전자를 함유하며, 곡물의 발달 단계 중 임의의 단계에서 유도될 수 있는 것으로서, 그의 숙주 범위는 표적 식물 종, 예로서, 옥수수, 쌀, 보리, 대두, 토마토, 밀, 감자 또는 기타 곡물에 한정되는 트랜스제닉 식물을 제공하기도 한다.

당업자는 조직 특이적 식물 프로모터가 표적 조직 이외의 조직 내에서 작동 가능하게 연결되어 있는 서열을 발현시킬 수 있음을 알게 될 것이다. 따라서, 일부 실시태양에서, 조직 특이적 프로모터는 표적 조직 또는 세포 유형 내에서 우선적으로 발현을 유도하지만, 기타 조직에서도 어느 정도 발현을 유도할 수 있는 프로모터이다.

본 발명에 따른 핵산은 또한 화학 시약에 노출될 때 유도성을 갖는 식물 프로모터에 작동 가능하게 연결될 수 있다. 이러한 시약들로서는, 예로서, 트랜스제닉 식물에 사용, 예로서, 분무될 수 있는 제초제, 합성 옥신 또는 항생제를 포함한다. 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소-생산 핵산의 유도성 발현을 통하여, 최적의 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소가 발현되고/거나, 이 효소의 활성을 갖는 식물을 선별할 수 있도록 이 식물은 더욱 성장하게 될 것이다. 따라서, 식물 일부의 발달은 제어될 수 있다. 이러한 방식으로, 본 발명은 식물과 식물 일부의 수확을 촉진시키는 수단을 제공한다. 예를 들면, 다양한 실시태양에서, 벤젠설폰아미드 제초제의 안정제에 의해 활성화되는 옥수수 In2-2 프로모터가 사용되며(문헌 [DeVeylder (1997) Plant Cell Physiol. 38:568-577]); 상이한 제초제의 안정제를 사용하면, 독특한 유전자 발현 패턴, 예로서, 뿌리, 배수 조직 및 어린 싹의 정점에 존재하는 분열 조직의 발현을 유도하게 된다. 본 발명에 따른 코딩 서열은, 예로서, 아베나 사티바 L.(귀리)의 아르기닌 데카르복실라제 유전자(문헌 [Masgrau (1997) Plant J. 11:465-473]); 또는 살리실산 반응성 요소(문헌 [Stange (1997) Plant J. 11:1315-1324])를 포함하는 트랜스제닉 담배 식물에 대하여 기술된 바와 같이, 테트라사이클린-유도성 프로모터의 제어하에 있을 수 있다.

일부 실시태양에서, 적당한 폴리펩티드 발현에는 코딩 영역의 3' 말단에 폴리아데닐화 영역을 필요로 할 수 있다. 폴리아데닐화 영역은 천연 유전자, 다양한 기타 식물(또는 동물 등) 유전자, 또는 아그로박테리아(Agrobacterial)의 T-DNA의 유전자로부터 유래될 수 있다.

발현 벡터 및 클로닝 비히클

본 발명은 본 발명에 따른 핵산, 예로서, 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 코딩하는 서열을 포함하는 발현 벡터 및 클로닝 비히클을 제공한다. 본 발명에 따른 발현 벡터 및 클로닝 비히클은 바이러스 입자, 바큘로바이러스, 파지, 플라스미드, 파지미드, 코스미드, 포스미드, 박테리아의 인공 염색체, 바이러스 DNA(예를 들어, 백시니아 바이러스, 아데노바이러스, 천연두 바이러스, 가성 광견병 바이러스 및 SV40의 유도체), P1-계 인공 염색체, 효모 플라스미드, 효모 인공 염색체, 및 관심의 대상이 되는 특정 숙주(예를 들어, 바실러스, 아스퍼질러스 및 효모)에 특이적인 기타 임의의 벡터를 포함할 수 있다. 본 발명에 따른 벡터로서는 염색체, 비-염색체 및 합성 DNA 서열을 포함할 수 있다. 다수의 적합한 벡터에 관하여는 당업자에게 공지되어 있으며, 또한 시판되고 있다. 대표적인 벡터로서는 하기 것들을 포함한다: 박테리아: pQE™ 벡터(캘리포니아주 발렌시아에 소재하는 Qiagen), pBLUESCRIPT™ 플라스미드, pNH 벡터, 람다-ZAP 벡터)(캘리포니아주 라호야에 소재하는 Stratagene); ptrc99a, pKK223-3, pDR540, pRIT2T(뉴저지주 피츠카타웨이에 소재하는 GE Healthcare), pET 벡터(위스콘신주 매디슨에 소재하는 Novagen); 진핵 생물: pXT1, pSG5(캘리포니아주 라호야에 소재하는 Stratagene), pSVK3, pBPV, pMSG, pSVLSV40(Pharmacia). 그러나, 이들 벡터가 숙주 내에서 복제 가능하고 생존 가능한 이상 임의의 기타 플라스미드 또는 기타 벡터가 사용될 수 있다. 낮은 카피수 또는 높은 카피수의 벡터가 본 발명에 사용될 수 있다. "플라스미드"는 시판되거나 제한 없이 공중이 사용할 수 있으며, 또는 공지된 방법에 따라서 입수 가능한 플라스미드로부터 작제될 수 있다. 본원에 기술된 것과 등가의 플라스미드는 당업계에 공지되어 있으며, 이는 당업자에게 자명할 것이다.

발현 벡터는 프로모터, 번역 개시를 위한 리보좀 결합 부위 및 전사 종결 인자를 포함할 수 있다. 벡터는 또한 증폭 발현에 적절한 서열을 포함할 수도 있다. 포유동물의 발현 벡터는 복제 기점, 임의의 필요한 리보좀 결합 부위, 폴리아데닐화 부위, 스플라이스 공여체 및 공여체 부위, 전사 종결 서열, 및 5' 측면에 위치하는 비전사 서열을 포함할 수 있다. 일부 실시태양에서, SV40의 스플라이스로부터 유래된 DNA 서열 및 폴리아데닐화 부위는 필요한 비전사 유전자 요소를 제공하는데에 사용될 수 있다.

일부 실시태양에서, 발현 벡터는 벡터를 함유하는 숙주 세포를 선별할 수 있도록 만드는 하나 이상의 선별가능한 마커 유전자를 포함한다. 그러한 선별가능한 마커로서는 디하이드로폴레이트 환원 효소를 코딩하는 유전자 또는 진핵 생물 세포 배양물에 네오마이신 내성을 부여하는 유전자, E. 콜라이에 테트라사이클린 또는 암피실린 내성을 부여하는 유전자, 및 S. 세레비지아에 TRP1 유전자를 포함한다. 프로모터 영역은 클로람페니콜 트랜스퍼라제(CAT: chloramphenicol transferase) 벡터 또는 기타 선별가능한 마커를 포함하는 벡터를 사용하여 임의의 바람직한 유전자로부터 선택될 수 있다.

일부 실시태양에서, 진핵 생물 세포 내에서 폴리펩티드 또는 그의 단편을 발현하기 위한 벡터는 발현 수준을 증가시키는 인핸서를 포함한다. 인핸서는 DNA의 시스-작용 요소로서, 그 길이가 약 10 내지 약 300bp일 수 있다. 상기 인핸서는 프로모터 상에서 작용하여 그의 전사량을 증가시킬 수 있다. 대표적인 인핸서로서는 복제 기점의 뒷부분에 존재하는, 100 내지 270bp의 SV40 인핸서, 거대 세포 바이러스의 초기 프로모터 인핸서, 복제 기점 뒷부분에 존재하는 폴리오마 인핸서, 및 아데노바이러스 인핸서를 포함한다.

핵산 서열은 다양한 방법에 의해 벡터에 삽입될 수 있다. 일반적으로, 서열은 인서트와 벡터를 적당한 제한 엔도뉴클레아제로 절단함으로써 벡터내 원하는 위치에 결찰시킨다. 별법으로, 인서트와 벡터 둘 모두에 존재하는 블런트 말단부(blunt end)를 결찰시킬 수 있다. 다양한 클로닝 기법이 당업계에 공지되어 있으며, 예로서는 문헌 ([Ausubel et al. Current Protocols in Molecular Biology, John Wiley & Sons, Inc. 1997] 및 [Sambrook et al, Molecular Cloning: A Laboratory Manual 2nd Ed., Cold Spring Harbor Laboratory Press (1989)])에 기재되어 있다. 그러한 방법과 기타 방법은 당업자의 기술 범주에 속하는 것으로 간주된다.

벡터는 플라스미드, 바이러스 입자 또는 파지의 형태일 수 있다. 기타 벡터로서는 염색체, 비-염색체 및 합성 DNA 서열, SV40의 유도체; 박테리아 플라스미드, 파지 DNA, 바큘로바이러스, 효모 플라스미드, 플라스미드와 파지 DNA의 조합체로부터 유래하는 벡터, 바이러스 DNA, 예로서, 백시니아 바이러스, 아데노바이러스, 천연두 바이러스 및 가성 광견변 바이러스의 DNA를 포함한다. 원핵 생물 및 진핵 생물 숙주와 함께 사용되는 다양한 클로닝 및 발현 벡터에 관하여는, 예로서, 문헌 [Sambrook]에 기술되어 있다.

사용될 수 있는 특정 박테리아 벡터로서는, 잘 알려져 있는 클로닝 벡터인 pBR322(ATCC 37017), pKK223-3(스웨덴 웁살라에 소재하는 Pharmacia Fine Chemicals), GEM1(미국 위스콘신주 매디슨에 소재하는 Promega Biotec) pQE70, pQE60, pQE-9(캘리포니아주 발렌시아에 소재하는 Qiagen), pD1O, psiX174 pBLUESCRIPT II KS, pNH8A, pNH16a, pNH18A, pNH46A(캘리포니아주 라호야에 소재하는 Stratagene), ptrc99a, pKK223-3, pKK233-3, DR540, pRIT5(Pharmacia), pKK232-8, pET(위스콘신주 매디슨에 소재하는 Novagen) 및 pCM7의 유전자 요소를 포함하는 시판 플라스미드를 포함한다. 특정 진핵 생물 벡터로서는 pSV2CAT, pOG44, pXT1, pSG(캘리포니아주 라호야에 소재하는 Stratagene), pSVK3, pBPV, pMSG 및 pSVL(Pharmacia)를 포함한다. 그러나, 기타 임의의 벡터는 그것이 숙주 세포 내에서 복제 가능하고 생존할 수 있는 한 사용될 수 있다.

본 발명에 따른 핵산은 발현 카세트, 벡터 또는 바이러스 내에서 발현될 수 있으며, 또한 식물 세포와 종자 내에서도 일시적으로나 안정적으로 발현될 수 있다. 하나의 대표적인 일시적 발현 시스템은 수퍼코일 DNA를 함유하는 에피좀 미니-염색체의 전사에 의해 핵 내에서 생성되는 에피좀 발현 시스템, 예로서, 꽃양배추 모자이크 바이러스(CaMV)의 바이러스 RNA를 사용한다(문헌 [Covey (1990) Proc. Natl. Acad. Sci. USA 87:1633-1637] 참조). 별법으로, 코딩 서열, 즉, 본 발명에 따른 서열 전부 또는 하위 단편들은 식물 숙주 세포 게놈 내에 삽입되어, 숙주 염색체 DNA의 통합 부분이 될 수 있다. 센스 또는 안티센스 전사체는 이러한 방식으로 발현될 수 있다. 본 발명에 따른 핵산으로부터 유래하는 서열(예로서, 프로모터 또는 코딩 영역)을 포함하는 벡터는 식물 세포 또는 종자에 선별가능한 표현형을 부여하는 마커 유전자를 포함할 수 있다. 예를 들면, 상기 마커는 살생물제 내성, 예로서, 항생제 내성, 예로서, 카나마이신, G418, 블레오마이신, 하이그로마이신에 대한 내성, 또는 제초제 내성, 예로서, 클로로설푸론 또는 바스타(Basta)에 대한 내성을 코딩할 수 있다.

식물 내에서 핵산과 단백질을 발현시킬 수 있는 발현 벡터는 당업계에 잘 알려져 있으면, 예로서, 아그로박테리움 종(Agrobacterium spp .), 감자 바이러스 X(문헌 [Angell (1997) EMBO J. 16:3675-3684] 참조), 담배 모자이크 바이러스(문헌 [Casper (1996) Gene 173:69-73] 참조), 토마토 부시 스턴트 바이러스(tomato bushy stunt virus)(문헌 [Hillman (1989) Virology 169:42-50] 참조), 담배 식각바이러스(문헌 [Dolja (1997) Virology 234:243-252] 참조), 콩 골든 모자이크 바이러스(문헌 [Morinaga (1993) Microbiol Immunol. 37:471-476] 참조), 꽃양배추 모자이크 바이러스(문헌 [Cecchini (1997) Mol. Plant Microbe Interact. 10:1094-1101] 참조), 옥수수 Ac/Ds 전위 인자(문헌 [Rubin (1997) Mol. Cell. Biol. 17:6294-6302]; [Kunze (1996) Curr. Top. Microbiol. Immunol. 204:161-194] 참조), 및 옥수수 억제제-돌연변이 인자(Spm) 전위 인자(문헌 [Schlappi (1996) Plant Mol. Biol. 32:717-725] 참조)로부터 유래하는 벡터; 및 그의 유도체를 포함할 수 있다.

일부 실시태양에서, 발현 벡터는 2개의 유기체 내에서 유지될 수 있도록 만들어주는 2개의 복제 시스템, 예를 들면, 포유동물 또는 곤충 세포에 있어서는 발현용 복제 시스템, 및 원핵 생물 숙주에 있어서는 클로닝 및 증폭용 복제 시스템을 가질 수 있다. 더욱이, 통합용 발현 벡터에 있어서, 발현 벡터는 숙주 세포 게놈과 상동성인 적어도 하나의 서열을 함유할 수 있다. 이는 발현 작제물 측면에 위치하는 2개의 상동성 서열을 함유할 수 있다. 통합 벡터는 벡터 내에 봉입하는데 적절한 상동성 서열을 선택함으로써 숙주 세포 내에 존재하는 특정 위치로 유도될 수 있다. 벡터를 통합시키기 위한 작제물은 당업계에 잘 알려져 있다.

본 발명에 따른 발현 벡터는 또한 형질전환된 박테리아 균주의 선별을 가능하게 만들어주는 선별가능한 마커 유전자, 예로서, 박테리아가 약물, 예로서, 암피실린, 클로람페니콜, 에리트로마이신, 카나마이신, 네오마이신 및 테트라사이클린에 대해 내성을 가지도록 만들어주는 유전자를 포함할 수도 있다. 선별가능한 마커는 또한 생합성 유전자, 예로서, 히스티딘, 트립토판 및 루신 생합성 경로에 관여하는 유전자를 포함할 수도 있다.

발현 벡터 내에 존재하는 DNA 서열은 RNA 합성을 유도하기 위해 적당한 발현 제어 서열(들)(프로모터)에 작동 가능하게 연결되어 있다. 특별히 명명된 박테리아 프로모터로서는 lacI, lacZ, T3, T7, gpt, 람다 P _R , P _L 및 trp을 포함한다. 진핵 생물의 프로모터로서는 CMV 즉시 초기 프로모터, HSV 티미딘 키나제 프로모터, 초기 및 후기 SV40 프로모터, 레트로바이러스의 LTR 프로모터 및 마우스의 메탈로티오네신-I 프로모터를 포함한다. 적당한 벡터 및 프로모터의 선별법은 당업자의 기술 수준 내에 충분히 존재한다. 발현 벡터는 또한 번역 개시를 담당하는 리보좀 결합 부위 및 전사 종결 인자를 함유하기도 한다. 상기 벡터는 또한 발현을 증폭시키는데 적당한 서열을 포함할 수도 있다. 프로모터 영역은 클로람페니콜 트랜스퍼라제(CAT) 벡터 또는 선별가능한 마커를 포함하는 기타 벡터를 사용하여 임의의 바람직한 유전자로부터 선별될 수 있다. 뿐만 아니라, 일부 실시태양에서, 발현 벡터는 형질전환된 숙주 세포 선별을 위한 표현 특성, 예로서, 진핵 생물 세포 배양물에 있어서는 디하이드로폴레이트 환원 효소 또는 네오마이신 내성, 또는 E. 콜라이의 경우에는 테트라사이클린이나 암피실린 내성을 제공하는 하나 이상의 선별가능한 마커 유전자를 함유한다.

포유동물 발현 벡터는 또한 복제 기점, 임의의 필수 리보좀 결합 부위, 폴리아데닐화 부위, 스플라이스 공여체 및 수용체 부위, 전사 종결 서열 및 5' 측면에 위치하는 비전사 서열을 포함한다. 일부 실시태양에서, SV40 스플라이스 및 폴리아데닐화 부위로부터 유래된 DNA 서열은 필요한 비전사 유전 요소를 제공하는데에 사용될 수 있다.

진핵 생물 세포 내에서 폴리펩티드 또는 그의 단편을 발현시키기 위한 벡터는 또한 발현 수준을 증가시키는 인핸서를 함유하기도 한다. 인핸서는 DNA의 시스-작용성 요소로서, 일반적으로 그 길이가 약 10 내지 약 300bp에 달하며, DNA의 전사를 증가시키는 프로모터에서 작용을 한다. 그 예로서는 복제 기점의 뒷부분에 존재하는, 100 내지 270bp의 SV40 인핸서, 거대 세포 바이러스의 초기 프로모터 인핸서, 복제 기점 뒷부분에 존재하는 폴리오마 인핸서, 및 아데노바이러스 인핸서를 포함한다.

또한, 발현 벡터는 벡터를 함유하는 숙주 세포를 선별할 수 있도록 만들어주는 하나 이상의 선별가능한 마커 유전자를 함유할 수 있다. 이러한 선별가능한 마커로서는 디하이드로폴레이트 환원 효소를 코딩하는 유전자 또는 진핵 생물 세포 배양물에 네오마이신 내성을 부여해주는 유전자, E. 콜라이 및 S. 세레비지아에 TRP1 유전자에 테트라사이클린 또는 암피실린 내성을 부여해주는 유전자를 포함한다.

일부 실시태양에서, 본 발명에 따른 폴리펩티드 중 하나를 코딩하는 핵산, 및 그와 실질적으로 동일한 서열, 또는 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개, 또는 150개 또는 그 이상의 연속된 아미노산을 포함하는 그의 단편은 적당한 단계에서 번역된 폴리펩티드 또는 그의 단편의 분비를 유도할 수 있는 리더 서열과 함께 조립된다. 일부 실시태양에서, 이 핵산은 본 발명에 따른 폴리펩티드 중 하나, 또는 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개 또는 150개 또는 그 이상의 연속된 아미노산을 포함하는 그의 단편이 이종 펩티드 또는 폴리펩티드, 예로서, 원하는 특성, 예로서, 안정성의 증가 및 정제의 간편함을 부여하는 N-말단 동정용 펩티드에 융합되어 있는 융합 폴리펩티드를 코딩할 수 있다.

적당한 DNA 서열은 다양한 방법에 의해 벡터 내에 삽입될 수 있다. 일반적으로, DNA 서열은 인서트와 벡터를 적당한 제한 엔도뉴클레아제로 분해함으로써, 벡터내 원하는 위치에 결찰시킨다. 별법으로, 상기 인서트 및 벡터, 둘 모두에 존재하는 블런트 말단부를 결찰시킬 수도 있다. 다양한 클로닝 기법은 문헌 ([Ausubel et al Current Protocols in Molecular Biology, John Wiley & Sons, Inc. 1997] 및 [Sambrook et al, Molecular Cloning: A Laboratory Manual 2nd Ed., Cold Spring Harbor Laboratory Press (1989)])에 개시되어 있다. 이러한 방법들 및 기타 방법들은 당업자의 기술 범주 내에 속하는 것으로 간주된다.

벡터는, 예를 들면, 플라스미드, 바이러스 입자 또는 파지의 형태일 수 있다. 기타 벡터로서는 염색체, 비-염색체 및 합성 DNA 서열, SV40의 유도체; 박테리아 플라스미드, 파지 DNA, 바큘로바이러스, 효모 플라스미드, 플라스미드와 파지 DNA의 조합체로부터 유래하는 벡터, 바이러스 DNA, 예로서, 백시니아 바이러스, 아데노바이러스, 천연두 바이러스 및 가성 광견병 바이러스 DNA를 포함한다. 원핵 생물 및 진핵 생물 숙주를 사용하는 다양한 클로닝 및 발현 벡터에 관하여는 문헌 [Sambrook, et al, Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor, N.Y., (1989)]에 개시되어 있다.

숙주 세포 및 형질전환된 세포

본 발명은 또한 본 발명에 따른 핵산 서열, 예로서, 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 코딩하는 서열 또는 본 발명의 벡터를 포함하는 형질전환된 세포를 제공한다. 숙주 세포는 당업자에게 익숙한 임의의 숙주 세포, 예로서, 원핵 생물 세포, 진핵 생물 세포, 예로서, 박테리아 세포, 진균 세포, 효모 세포, 포유동물 세포, 곤충 세포 또는 식물 세포일 수 있다. 대표적인 박테리아 세포로서는 E. 콜라이, 바실러스 섭틸리스(Bacillus subtilis), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 바실러스 세레우스(Bacillus cereus), 또는 살모넬라 타이피뮤리움(Salmonella typhimurium)을 비롯한, 스트렙토마이세스(Streptomyces), 스타필로코커스(Staphylococcus) 또는 바실러스 종 중 임의의 종을 포함한다. 대표적인 진균 세포로서는 아스퍼질러스 중 임의의 종을 포함한다. 대표적인 효모 세포로서는 피키아 파스토리스(Pichia pastoris), 사카로마이세스 세레비지아에(Saccharomyces cerevisiae), 또는 시조사카로미세스 폼베(Schizosaccharomyces pombe)를 비롯한, 피키아, 사카로마이세스, 시조사카로미세스 또는 쉬반니오마이세스(Schwanniomyces) 중 임의의 종을 포함한다. 대표적인 곤충 세포로서는 드로소필라(Drosophila) S2 및 스포도프테라(Spodoptera) Sf9를 비롯한, 스포도프테라(Spodoptera) 또는 드로소필라(Drosophila) 중 임의의 종을 포함한다. 대표적인 동물 세포로서는 CHO, COS 또는 바우어즈(Bowes) 흑색종 또는 임의의 마우스 또는 인간 세포주를 포함한다. 적당한 숙주 세포를 선택함은 당업자의 능력 범주 내에 있다. 매우 다양한 고등 식물 종을 형질전환시키는 기법에 관하여는 당업계에 잘 알려져 있으며, 기술 논문 및 과학 논문에 기재되어 있다. 문헌 [Weising (1988) Ann. Rev. Genet. 22:421-477]; 미국 특허 번호 제5,750,870호를 참조할 수 있다.

벡터는 형질전환, 형질감염, 형질 도입법, 바이러스 감염, 유전자 총 또는 Ti-매개 유전자 운반 기술을 비롯한 다양한 기법 중 임의의 기법을 사용하여 숙주 세포 내에 도입될 수 있다. 특정 방법으로서는 인산칼슘 형질감염법, DEAE-덱스트란 매개 형질감염법, 리포펙션 또는 전기 천공법을 포함한다(문헌 [Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology, (1986)]).

일부 실시태양에서, 본 발명에 따른 핵산 또는 벡터는 스크리닝을 위하여 세포에 도입되며, 그 결과 이 핵산은 핵산의 추후 발현에 적합한 방식으로 세포에 유입된다. 도입 방법은 대부분 표적화된 세포 유형에 의해 결정된다. 대표적인 방법으로서는 CaPO₄ 침전법, 리포좀 융합법, 리포펙션(예를 들어, LIPOFECTIN™), 전기 천공법 및 바이러스 감염법 등을 포함한다. 후보 핵산은 숙주 세포의 게놈에 안정적으로 통합될 수 있거나(예를 들면, 레트로바이러스 도입법에 의해), 또는 세포질 내에 일시적으로 또는 안정적으로 존재할 수 있다(즉, 통상의 플라스미드, 표준적인 조절 서열 및 선별가능한 마커 등을 사용). 다수의 약제학적으로 중요한 스크린에는 인간 또는 모델 포유동물 세포 표적이 필요하므로, 이러한 표적을 형질감염시킬 수 있는 레트로바이러스 벡터가 사용될 수 있다.

적당한 경우, 조작된 숙주 세포는 프로모터 활성화, 형질전환체 선별 또는 본 발명에 따른 유전자를 증폭시키는데에 적당하게 변형된 통상의 영양 배지 중에서 배양될 수 있다. 적합한 숙주 균주를 형질전환시키고, 이 숙주 균주를 적당한 세포 밀도가 되도록 생육시킨 후, 선별된 프로모터는 적당한 수단(예를 들어, 온도 변화 또는 화학적 유도)에 의해 유도될 수 있으며, 세포는 이 세포가 원하는 폴리펩티드 또는 그의 단편을 생산할 수 있게 되는 기간 동안 추가로 배양시킬 수 있다.

세포는 원심 분리에 의해 수거될 수 있으며, 또한 물리적 또는 화학적 수단에 의해 파괴될 수 있고, 결과로 생성된 미정제 추출물은 추가의 정제를 위해 보관하게 된다. 단백질 발현에 사용되는 미생물 세포는 임의의 편리한 방법, 예로서, 냉동-해동 순환법, 초음파 처리법, 기계적 파괴법 또는 세포 용해 제제를 사용하는 방법에 의해 파괴될 수 있다. 이러한 방법은 당업자에게 잘 알려져 있다. 발현된 폴리펩티드 또는 그의 단편은 황산암모늄 침전법이나 에탄올 침전법, 산 추출법, 음이온 또는 양이온 교환 크로마토그래피, 포스포셀룰로스 크로마토그래피, 소수성 상호작용 크로마토그래피, 친화성 크로마토그래피, 하이드록실아파타이트 크로마토그래피 및 렉틴 크로마토그래피를 비롯한 방법에 의해 재조합 세포 배양물로부터 회수 및 정제될 수 있다. 단백질 리폴딩 단계는, 필요에 따라서, 폴리펩티드의 배열 종결하였을 때에 진행될 수 있다. 원한다면, 고성능 액체 크로마토그래피(HPLC: high performance liquid chromatography)는 최종 정제 단계에 사용될 수 있다.

숙주 세포 내에 존재하는 작제물은 재조합 서열에 의해 코딩되는 유전자 산물을 생산하기 위한 통상의 방식으로 사용될 수 있다. 재조합체 생산 과정에 사용되는 숙주에 따라서, 벡터를 함유하는 숙주 세포에 의해 생산된 폴리펩티드는 당화될 수 있거나, 또는 당화되지 않을 수도 있다. 본 발명에 따른 폴리펩티드는 또한 개시 메티오닌 아미노산 잔기를 포함할 수 있거나 또는 포함하지 않을 수도 있다.

무세포 번역 시스템은 또한 본 발명에 따른 폴리펩티드를 생산하는데에 사용될 수도 있다. 무세포 번역 시스템은 폴리펩티드를 코딩하는 핵산 또는 그의 단편에 작동 가능하게 연결되어 있는 프로모터를 포함하는 DNA 작제물로부터 전사된 mRNA를 사용할 수 있다. 일부 실시태양에서, DNA 작제물은 선형화된 후, 시험관내 전사 반응을 수행할 수 있다. 이어서, 전사된 mRNA는 적당한 무세포 번역 추출물, 예로서, 토끼 적혈구 추출물과 함께 인큐베이션시킴으로써 원하는 폴리펩티드 또는 그의 단편을 생산하게 된다.

발현 벡터는 하나 이상의 선별가능한 마커를 함유하여, 형질전환된 숙주 세포의 선별을 위한 표현형 특성, 예로서, 진핵 생물 세포 배양물의 경우, 디하이드로폴레이트 환원 효소 또는 네오마이신 내성, 또는 E. 콜라이의 경우, 테트라사이클린 또는 암피실린 내성을 제공할 수 있다.

관심의 대상이 되는 폴리뉴클레오티드, 예로서, 본 발명에 따른 핵산을 함유하는 숙주 세포는 프로모터를 활성화하거나, 형질전환체를 선별하거나 또는 유전자를 증폭하기에 적당하게 변형된 통상의 영양 배지 중에서 배양될 수 있다. 배양 조건, 예로서, 온도 및 pH 등은 발현을 위해 선택된 숙주 세포에 대해 이미 적용되었던 것으로서, 당업자에게 자명할 것이다. 이어서, 특정의 효소 활성을 갖는 것으로 동정된 클론을 서열 분석하여 활성이 증진된 효소를 코딩하는 폴리뉴클레오티드 서열을 동정할 수 있다.

본 발명은 적어도 약 100개의 잔기로 이루어진 영역에 걸쳐서 본 발명에 따른 서열과 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 핵산 서열을 포함하는 핵산, 또는 엄격한 조건하에서 본 발명에 따른 핵산 서열에 혼성화하는 핵산, 또는 그의 부분서열을 포함하는 벡터를 발현시키는 단계를 포함하며, 여기서, 서열 동일성은 서열 비교 알고리즘을 사용하는 분석법 또는 시각적 조사에 의해 측정되는 것인 것을 포함하는, 세포에서 재조합 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 과발현시키는 방법을 제공한다. 과발현은 임의의 수단, 예로서, 고활성 프로모터 또는 이시스트론 벡터를 사용하거나, 또는 벡터의 유전자 증폭을 사용함으로써 이루어질 수 있다.

본 발명에 따른 핵산은 임의의 시험관내 또는 생체내 발현 시스템 내에서 발현 또는 과발현될 수 있다. 임의의 세포 배양 시스템은 박테리아, 곤충, 효모, 진균 또는 포유동물 배양물을 비롯한 재조합 단백질을 발현시키거나 또는 과발현시키는데에 사용될 수 있다. 과발현은 프로모터, 인핸서, 벡터(예로서, 레플리콘 벡터, 이시스트론 벡터(예를 들어, [Gurtu (1996) Biochem. Biophys. Res. Commun. 229:295-8] 사용)), 배지 및 배양 시스템 등을 적당히 선택함으로써 이루어질 수 있다. 일부 실시태양에서, 선별 마커, 예로서, 글루타민 신타제(예를 들어, 문헌 [Sanders (1987) Dev. Biol. Stand. 66:55-63])를 사용한 세포 시스템내 유전자 증폭법은 본 발명에 따른 폴리펩티드를 과발현시키는데에 사용된다.

이러한 접근법에 관한 추가의 상세한 설명은 공개 문헌에 기재되어 있고/거나 당업자에게 공지되어 있다. 하기 참고 문헌이 본 출원의 본 발명 효소에 관하여 교시하고 있지는 않지만, 특정의 비제한적인 일례로, 상기와 같이 공중이 사용할 수 있는 문헌으로는 EP 0659215(WO 9403612 A1)(Nevalainen et al); 문헌 ([Lapidot, A., Mechaly, A., Shoham, Y., "Overexpression and single-step purification of a thermostable xylanase from Bacillus stearothermophilus T-6," J. Biotechnol. Nov 51:259-64 (1996)]; [Luthi, E., Jasmat, N.B., Bergquist, P.L., "Xylanase from the extremely thermophilic bacterium Caldocellum saccharolyticum: overexpression of the gene in Escherichia coli and characterization of the gene product," Appl. Environ. Microbiol. Sep 56:2677-83 (1990)]; 및 [Sung, W.L., Luk, C.K., Zahab, D.M., Wakarchuk, W., "Overexpression of the Bacillus subtilis and circulans xylanases in Escherichia coli," Protein Expr. Purif. Jun 4:200-6 (1993)])를 포함한다.

숙주 세포는 당업자에게 익숙한 임의의 숙주 세포, 예로서, 원핵 생물 세포, 진핵 생물 세포, 예로서, 박테리아 세포, 진균 세포, 효모 세포, 포유동물 세포, 곤충 세포 또는 식물 세포일 수 있다. 적절한 숙주의 대표적인 일례로서 하기를 포함할 수 있다; 박테리아 세포, 예로서, E. 콜라이, 스트렙토마이세스, 바실러스 섭틸리스, 바실러스 세레우스(Bacillus cereus), 살모넬라 타이피뮤리움, 및 슈도모나스, 스트렙토마이세스 및 스타필로코커스 속에 속하는 다양한 종, 진균 세포, 예로서, 아스퍼질러스, 효모, 예로서, 피키아 파스토리스, 사카로마이세스 세레비지아에, 또는 시조사카로미세스 폼베를 비롯한, 피키아, 사카로마이세스, 시조사카로미세스 또는 쉬반니오마이세스 중 임의의 종, 곤충 세포, 예로서, 드로소필라 S2 및 스포도프테라 Sf9, 동물 세포, 예로서, CHO, COS 또는 바우어즈 흑색종 및 아데노바이러스. 적당한 숙주를 선택하는 것은 당업자의 기술 범주 내에 포함된다.

벡터는 형질전환, 형질감염, 형질 도입, 바이러스 감염, 유전자 총 또는 Ti-매개 유전자 운반 기술을 비롯한 다양한 기법 중 임의의 기법을 사용하여 숙주 세포내에 도입될 수 있다. 특정 방법으로서는 인산칼슘 형질감염, DEAE-덱스트란 매개 형질감염, 리포펙션 또는 전기 천공을 포함한다(문헌 [Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology, (1986)]).

세포는 원심 분리에 의해 수거될 수 있으며, 또한 물리적 또는 화학적 수단에 의해 파괴될 수 있고, 결과로 생성된 미정제 추출물은 추가의 정제를 위해 보관하게 된다. 단백질 발현에 사용되는 미생물 세포는 임의의 편리한 방법, 예로서, 냉동-해동 순환법, 초음파 처리법, 기계적 파괴법 또는 세포 용해 제제를 사용하는 방법에 의해 파괴될 수 있다. 이러한 방법은 당업자에게 잘 알려져 있다. 발현된 폴리펩티드 또는 그의 단편은 황산암모늄 침전법이나 에탄올 침전법, 산 추출법, 음이온 또는 양이온 교환 크로마토그래피, 포스포셀룰로스 크로마토그래피, 소수성 상호작용 크로마토그래피, 친화성 크로마토그래피, 하이드록실아파타이트 크로마토그래피 및 렉틴 크로마토그래피를 비롯한 방법에 의해 재조합 세포 배양물로부터 회수 및 정제될 수 있다. 단백질 리폴딩 단계는, 필요에 따라서, 폴리펩티드의 배열 종결하였을 때에 진행될 수 있다. 원한다면, 고성능 액체 크로마토그래피(HPLC)는 최종 정제 단계에 사용될 수 있다.

재조합 단백질을 발현시키는데에 다양한 포유동물 세포 배양 시스템이 사용될 수 있다. 포유동물 발현 시스템의 예로서는 원숭이 신장 섬유아세포의 COS-7 세포주(문헌 [Gluzman, Cell, 23:175, 1981]) 및 적합한 벡터로부터 단백질을 발현할 수 있는 기타 세포주, 예로서, C127, 3T3, CHO, HeLa 및 BHK 세포주를 포함한다.

숙주 세포 내에 존재하는 작제물은 재조합 서열에 의해 코딩되는 유전자 산물을 생산하기 위해 통상의 방식으로 사용될 수 있다. 재조합체 생산 방법에서 사용되는 숙주에 따라서, 벡터를 함유하는 숙주 세포에 의해 생산되는 폴리펩티드는 당화될 수 있거나 또는 당화될 수 없다. 본 발명의 폴리펩티드는 또한 개시 메티오닌 아미노산 잔기를 포함할 수 있거나 또는 포함하지 않을 수도 있다.

별법으로, 본 발명에 따른 폴리펩티드, 또는 적어도 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개, 또는 150개 또는 그 이상의 연속된 아미노산을 포함하는 그의 단편은, 예로서, 이하에 기술되어 있는 바와 같이, 통상적인 펩티드 합성기에 의해 합성적으로 생산될 수 있다. 다른 실시태양에서, 폴리펩티드 단편 또는 일부는 펩티드 합성에 의해 상응하는 전체 길이의 폴리펩티드를 생산하는데에 사용될 수 있으므로; 이 단편은 전체 길이의 폴리펩티드를 생산하기 위한 중간체로서 사용될 수 있다.

무세포 번역 시스템은 또한 폴리펩티드 또는 그의 단편을 코딩하는 핵산에 작동 가능하게 연결되어 있는 프로모터를 포함하는 DNA 작제물로부터 전사된 mRNA를 사용하여, 본 발명에 따른 폴리펩티드 중 하나, 또는 적어도 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개 또는 150개 또는 그 이상의 연속된 아미노산을 포함하는 그의 단편을 생산하는데에 사용될 수도 있다. 일부 실시태양에서, 상기 DNA 작제물은 선형화된 후 시험관내 전사 반응을 수행할 수 있다. 이어서, 전사된 mRNA는 적당한 무세포 번역 추출물, 예로서, 토끼 적혈구 추출물과 함께 인큐베이션시켜 원하는 폴리펩티드 또는 그의 단편을 생산한다.

핵산의 증폭

본 발명을 실시함에 있어서, 본 발명에 따른 핵산과 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 코딩하는 핵산, 또는 본 발명에 따른 변형된 핵산은 증폭 방법, 예로서, PCR에 의해 재생산될 수 있다. 증폭법은 또한 본 발명에 따른 핵산을 클로닝하거나 또는 변형시키는데에 사용될 수 있다. 따라서, 본 발명은 본 발명에 따른 핵산을 증폭시키기 위한 증폭용 프라이머 서열의 쌍을 제공한다. 당업자는 이러한 서열 중 임의의 부분 또는 전체 길이의 서열에 대한 증폭용 프라이머 서열 쌍을 디자인할 수 있다.

일부 실시태양에서, 본 발명은 본 발명에 따른 증폭용 프라이머 쌍, 예로서, 본 발명에 따른 핵산 중 처음의(5') 약 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개 또는 25개 또는 그 이상의 잔기에 의해 제시되는 프라이머 쌍과, 상보성 가닥 중 처음의(5') 약 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개 또는 25개 또는 그 이상의 잔기에 의해 제시되는 프라이머 쌍을 증폭시킴으로써 증폭되는 핵산을 제공한다. 일부 실시태양에서, 본 발명은 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 폴리펩티드를 코딩하는 핵산을 증폭시키기 위한 증폭용 프라이머 서열 쌍을 제공하는데, 여기서, 상기 프라이머 쌍은 본 발명에 따른 서열을 포함하는 핵산, 또는 그의 단편 또는 부분서열을 증폭시킬 수 있다. 증폭용 프라이머 서열 쌍 중 하나 또는 그의 각 구성원은 적어도 약 10 내지 50개 또는 그 이상의 연속된 염기 서열, 또는 적어도 약 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개 또는 25개 또는 그 이상의 연속된 염기 서열을 포함하는 올리고뉴클레오티드를 포함할 수 있다. 일부 실시태양에서, 본 발명은 증폭용 프라이머 쌍을 제공하는데, 여기서, 상기 프라이머 쌍은 본 발명에 따른 핵산 잔기 중 처음의(5') 약 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개 또는 25개 또는 그 이상의 잔기에 의해 제시되는 서열을 갖는 제1 구성원, 상기 제1 구성원의 상보성 가닥 중 처음의(5') 약 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개 또는 25개 또는 그 이상의 잔기에 의해 제시되는 서열을 갖는 제2 구성원을 포함한다.

본 발명은 본 발명에 따른 증폭용 프라이머 쌍을 사용하는 증폭 반응, 예로서, 중합효소 연쇄 반응(PCR)에 의해 생성되는, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 제공한다. 일부 실시태양에서, 본 발명은 본 발명에 따른 증폭용 프라이머 쌍을 사용하는 증폭 반응, 예로서, PCR에 의해 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 제조하는 방법을 제공한다. 일부 실시태양에서, 증폭용 프라이머 쌍은 라이브러리, 예로서, 유전자 라이브러리, 예로서, 환경 라이브러리로부터 핵산을 증폭시킨다.

증폭 반응은 또한 샘플내 핵산의 양(예를 들어, 세포 샘플 중의 메세지 양)을 정량하거나, 핵산을 표지화하거나(예로서, 이 핵산을 어레이 또는 블롯에 적용하기 위함), 핵산을 검출하거나 또는 샘플중 특정 핵산의 양을 정량하는데에 사용될 수도 있다. 본 발명의 일부 실시태양에서, 세포 또는 cDNA 라이브러리로부터 단리된 메세지는 증폭된다.

당업자는 적합한 올리고뉴클레오티드 증폭용 프라이머를 선택하여 디자인할 수 있다. 증폭 방법 또한 당업계에 잘 알려져 있으며, 그 예로서는 중합효소 연쇄 반응, PCR(문헌 [PCR PROTOCOLS, A GUIDE TO METHODS AND APPLICATIONS, ed. Innis, Academic Press, N. Y. (1990) and PCR STRATEGIES (1995), ed. Innis, Academic Press, Inc., N.Y.]), 리가제 연쇄 반응(LCR: ligase chain reaction)(문헌 ([Wu (1989) Genomics 4:560]; [Landegren (1988) Science 241:1077]; [Barringer (1990) Gene 89: 117]); 전사 증폭법(문헌 [Kwoh (1989) Proc. Natl. Acad. Sci. USA 86:1173]); 및 자기-지속적 서열 복제(문헌 [Guatelli (1990) Proc. Natl. Acad. Sci. USA 87:1874]; Q 베타 레플리카제 증폭법(문헌 [Smith (1997) J. Clin. Microbiol. 35:1477-1491]), 자동화 Q-베타 레플리카제 증폭 분석법(문헌 [Burg (1996) Mol. Cell. Probes 10:257-271]) 및 기타 RNA 중합효소 매개 기법(예로서, NASBA(온타리오주 미시소거 Cangene)); 문헌 ([Berger (1987) Methods Enzymol. 152:307-316]; [Ausubel et al. Current Protocols in Molecular Biology, John Wiley & Sons, Inc. 1997] 및 [Sambrook et al, Molecular Cloning: A Laboratory Manual 2nd Ed., Cold Spring Harbor Laboratory Press (1989).] 미국 특허 번호 제4,683,195호 및 제4,683,202호; [Sooknanan (1995) Biotechnology 13:563-564])을 포함한다.

핵산 및 폴리펩티드의 서열 동일성 측정

본 발명은 적어도 약 50개, 75개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개, 650개, 700개, 750개, 800개, 850개, 900개, 950개, 1000개, 1050개, 1100개, 1150개, 1200개, 1250개, 1300개, 1350개, 1400개, 1450개, 1500개, 1550개 또는 그 이상의 잔기로 이루어진 영역에 걸쳐서 본 발명에 따른 핵산(서열 목록 참조)과 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 또는 그 이상의, 또는 완벽한(100%) 서열 동일성을 갖는 서열을 포함하는 핵산을 제공한다. 일부 실시태양에서, 본 발명은 본 발명에 따른 폴리펩티드(서열 목록 참조)과 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의, 또는 완벽한(100%) 서열 동일성을 갖는 서열을 포함하는 폴리펩티드를 제공한다. 서열 동일성(상동성)의 정도는 임의의 컴퓨터 프로그램 및 관련 매개 변수, 예로서, 본원에 개시된 매개 변수, 예로서, BLAST 2.2.2. 또는 FASTA 버전 3.0t78(디폴트 매개 변수 포함)을 사용하여 측정될 수 있다.

본 발명에 따른 핵산 서열은 본 발명에 따른 서열 중 적어도 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개, 150개, 200개, 300개, 400개 또는 500개 또는 그 이상의 연속된 뉴클레오티드 및 그와 실질적으로 동일한 서열을 포함할 수 있다. 본 발명에 따른 핵산 서열과 상동성인 서열 및 그의 단편은 이들 서열과 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성(상동성)을 갖는 서열을 지칭할 수 있다. 상동성(서열 동일성)은 FASTA 버전 3.0t78(디폴트 매개 변수 포함)을 비롯하여, 본원에 개시된 컴퓨터 프로그램 및 매개 변수 중 임의의 것을 사용하여 측정될 수 있다. 상동성 서열은 또한 본 발명에 따른 핵산 서열 중 우리딘이 티미딘으로 치환된 RNA 서열을 포함한다. 상동성 서열은 본원에 개시된 방법들 중 임의의 방법을 사용하여 수득할 수 있거나, 서열 분석 오류를 수정함으로써 수득할 수 있다. 본 발명에 따른 핵산 서열은 통상의 단일 문자 방식으로 표시될 수 있거나(문헌 [Stryer, Lubert. Biochemistry, 3rd Ed., W. H Freeman & Co., New York]), 서열 내 뉴클레오티드의 상동성을 기록하는 기타 임의의 방식으로 표시될 수 있다.

일부 실시태양에서, 본원에서 기술하고 있는 서열 비교 프로그램은 본 발명에 따른 측면 즉, 핵산 또는 폴리펩티드 서열이 본 발명에 따른 범주 내에 포함되는지 여부를 결정하는데에 사용된다. 그러나, 단백질 및/또는 핵산 서열의 동일성(상동성)은 당업계에 공지된 임의의 서열 비교 알고리즘이나 프로그램을 이용하여 평가할 수 있다. 이러한 알고리즘 및 프로그램으로서는 TBLASTN, BLASTP, FASTA, TFASTA 및 CLUSTALW(문헌 ([Pearson and Lipman, Proc. Natl. Acad. Sci. USA 85(8):2444-2448, 1988]; [Altschul et al, J. Mol. Biol. 215(3):403-410, 1990; Thompson Nucleic Acids Res. 22(2):4673-4680, 1994]; [Higgins et al, Methods Enzymol. 266:383-402, 1996]; [Altschul et al, J. Mol. Biol. 215(3):403-410, 1990]; [Altschul et al, Nature Genetics 3:266-272, 1993])를 포함하나, 이에 한정되는 것은 아니다.

일부 실시태양에서, 상동성 또는 동일성은 서열 분석용 소프트웨어를 사용하여 측정된다(예로서, 위스콘신주 53705 매디슨 유니버시티 애비뉴 1710에 소재하는 제네틱스 컴퓨터 그룹(Genetics Computer Group)의 위스콘신 제네틱스 소프트웨어 팩키지(Wisconsin Genetics Software Package)). 이러한 소프트웨어는 다양한 형태의 결실, 치환 및 기타 변형에 상동성 등급을 부여함으로써 유사한 서열들을 매치시킨다. 일부 실시태양에서, 2개 이상의 핵산 또는 폴리펩티드 서열과 관련하여 "상동성" 및 "동일성"이란 용어는, 다수의 서열 비교 알고리즘 또는 수동적 정렬 및 시각적 조사에 의해 측정되는 지정된 영역 또는 비교 윈도우에 대하여 비교하고 최대로 상응하도록 정렬하였을 때, 아미노산 잔기가 동일하거나 특정 비율의 아미노산 잔기를 갖는 2개 이상의 서열 또는 부분서열, 또는 아미노산 잔기가 동일한 뉴클레오티드를 지칭한다. 일부 실시태양에서, 서열 비교에 있어서, 하나의 서열은 시험 서열의 비교 기준인 참고 서열로서의 역할을 갖는다. 서열 비교 알고리즘을 사용할 때, 시험 및 참고 서열은 컴퓨터에 입력되고, 부분서열의 좌표가 지정되며, 필요에 따라서 서열 알고리즘 프로그램 매개 변수가 지정되기도 한다. 디폴트 프로그램 매개 변수가 사용될 수 있으며, 또는 대안적 매개 변수가 지정될 수도 있다. 이어서, 서열 비교 알고리즘은 프로그램 매개 변수에 입각하여, 참고 서열에 대한 시험 서열의 서열 동일성(%)을 계산한다.

본원에 사용된 "비교 윈도우"는, 2개의 서열들이 최적으로 정렬된 이후, 서열이 인접하는 위치와 동일한 수의 위치로 이루어진 참고 서열과 비교될 수 있는 인접 위치 중 임의의 하나로 이루어진 세그먼트에 대한 참조 기준을 포함하는데, 여기서, 상기 인접 위치는 20 내지 600개, 일반적으로 약 50 내지 약 200개, 더욱 일반적으로는 약 100 내지 약 150개로 이루어진 군으로부터 선택된다. 비교를 위하여 서열을 정렬하는 방법에 관하여는 당업계에 잘 알려져 있다. 예로서, 국소 상동성 알고리즘(문헌 [Smith & Waterman, Adv. Appl. Math. 2:482, 1981]), 상동성 정렬 알고리즘(문헌 [Needleman & Wunsch, J. Mol. Biol 48:443, 1970]), 유사성 검색 방법(문헌 [person & Lipman, Proc. Nat'l. Acad. Sci. USA 85:2444, 1988]), 알고리즘의 컴퓨터에 의한 실행(위스콘신주 매디슨 사이언스 드라이브 575에 소재하는 제네틱스 컴퓨터 그룹(Genetics Computer Group)의 위스콘신 제네틱스 소프트웨어 팩키지(Wisconsin Genetics Software Package) 중 GAP, BESTFIT, FASTA 및 TFASTA), 또는 수동식 정렬법 및 시각에 의한 관찰에 의해 비교용 서열의 최적 정렬법이 수행될 수 있다. 상동성 또는 동일성을 측정하기 위한 기타 알고리즘으로서는, 예로서, BLAST 프로그램(Basic Local Alignment Search Tool at the National Center for Biological Information) 이외에도, ALIGN, AMAS(Analysis of Multiply Aligned Sequences), AMPS(Protein Multiple Sequence Alignment), ASSET(Aligned Segment Statistical Evaluation Tool), BANDS, BESTSCOR, BIOSCAN(Biological Sequence Comparative Analysis Node), BLIMPS(BLocks IMProved Searcher), FASTA, 인터벌스 & 포인트(Intervals & Points), BMB, CLUSTAL V, CLUSTAL W, CONSENSUS, LCONSENSUS, WCONSENSUS, 스미쓰-워터맨 알고리즘(Smith-Waterman algorithm), DARWIN, 라스베가스 알고리즘, FNAT(Forced Nucleotide Alignment Tool), 프레임얼라인(Framealign), 프레임서치(Framesearch), DYNAMIC, FILTER, FSAP(Fristensky Sequence Analysis Package), GAP(Global Alignment Program), GENAL, GIBBS, GenQuest, ISSC(Sensitive Sequence Comparison), LALIGN(Local Sequence Alignment), LCP(Local Content Program), MACAW(Multiple Alignment Construction & Analysis Workbench), MAP(Multiple Alignment Program), MBLKP, MBLKN, PIMA(Pattern-Induced Multi-sequence Alignment), SAGA(Sequence Alignment by Genetic Algorithm) 및 WHAT-IF를 포함한다. 이러한 정렬 프로그램은 또한 실질적으로 동일한 서열을 갖는 폴리뉴클레오티드 서열을 동정하기 위한 게놈 데이터베이스를 스크리닝하는데에도 사용될 수 있다. 다수의 게놈 데이터베이스를 입수할 수 있는데, 예를 들면, 인간 게놈의 상당부는 인간 게놈 서열 분석 프로젝트(Gibbs, 1995)의 일환으로서 얻을 수 있다. 21개 이상의 기타 게놈들, 예로서, M. 제니탈륨(M. genitalium)(문헌 [Fraser et al, 1995]), M. 재너쉬(M. jannaschii)(문헌 [Bult et al, 1996]), H. 인플루엔자에(H. influenzae)(문헌 [Fleischmann et al, 1995]), E. 콜라이(문헌 [Blattner et al, 1997]) 및 효모(S. 세레비지아에)(문헌 [Mewes et al, 1997]) 및 D. 멜라노개스터(D. melanogaster)(문헌 [Adams et al, 2000])의 게놈들은 이미 서열 분석되어 있다. 또한 모델 유기체 예를 들어, 마우스, C. 엘레간스(C. elegans) 및 아라비돕시스 종의 게놈을 서열 분석하는 방법은 상당히 진보되었다. 약간의 기능상 정보와 함께 게놈 정보를 포함하는 몇몇 데이터베이스는 상이한 조직에 의해 보존되고 있으며, 인터넷을 통하여도 입수할 수 있다.

일부 실시태양에서, 하나의 측면에서, BLAST 및 BLAST 2.0 알고리즘이 사용되는데, 이 알고리즘은 문헌 ([Altschul et al., Nuc. Acids Res. 25:3389-3402, 1977] 및 [Altschul et al., J. Mol. Biol. 215:403-410, 1990])에 각각 기재되어 있다. BLAST 분석 수행용 소프트웨어는 국립 생명 과학 정보 센터(National Center for Biotechnology Information)를 통해 공중이 입수할 수 있다. 이 알고리즘은 의문 서열 내 단어 길이 W인 짧은 단어 수를 확인함으로써 고 스코어링 서열 쌍(HSPs: high scoring sequence pairs)을 우선 동정하는 단계를 포함하며, 이때 이 서열 쌍은 데이터 베이스 서열 내의 동일한 길이를 갖는 단어와 정렬될 때, 몇몇 양의 값을 갖는 최소 스코어 T와 부합하거나 또는 이를 만족시킨다. T는 인접하여 존재하는 단어의 스코어 최소값을 의미한다(문헌 [Altschul et al., 상기 문헌]). 이와 같은 처음의 인접 단어 히트는 히트를 포함하는 더욱 긴 HSP를 찾아내기 위한 검색을 개시하기 위한 시드로서의 역할을 한다. 단어 히트는 누적 정렬 스코어가 증가함에 따라서 각 서열을 따라 양 방향으로 연장된다. 누적 스코어는 뉴클레오티드 서열, 매개 변수 M(매치되는 잔기의 쌍에 대한 보상 스코어로서, 항상 > 0임)을 사용하여 계산된다. 아미노산 서열에 있어서, 스코어링 매트릭스는 누적 스코어를 계산하는데에 사용된다. 이 단어 히트를 각 방향으로 연장하던 것을 다음과 같은 때에 중지시킨다: 즉, 누적 정렬 스코어가 최대로 도달하는 수치로부터 얻어지는 양 X만큼 줄어들 때; 하나 이상의 음의 스코어링 잔기 정렬이 축적됨에 따라서 누적 스코어가 0 이하에 도달할 때; 또는 양 서열 중 어느 하나의 서열 말단에 도달할 때. BLAST 알고리즘 매개 변수인 W, T 및 X는 정렬 민감도와 속도를 결정한다. BLASTN 프로그램(뉴클레오티드 서열에 대한 프로그램)은 디폴트값으로서 단어 길이(W) = 11, 기대치(E) = 10, M = 5, N = -4를 사용하고, 양 가닥을 비교하는 것이다. 아미노산 서열의 경우, BLASTP 프로그램은 디폴트값으로서 단어 길이 = 3, 기대치(E) = 10를 사용하고, BLOSUM62 스코어링 매트릭스(문헌 [Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915, 1989])는 정렬값(B) = 50, 기대치(E) = 10,M = 5, N = -4를 사용하고, 양 가닥을 비교하는 것이다.

BLAST 알고리즘은 또한 2개 서열 간 유사성을 통계학적으로 분석하는 것이다(문헌 [Karlin & Altschul, Proc. Natl. Acad. Sci. USA 90:5873, 1993] 참조). BLAST 알고리즘에 의해 유사성을 측정하는 한 가지 수단은 확률의 총합 중 가장 작은 값(P(N))으로서, 이는 2개의 뉴클레오티드 또는 아미노산 서열이 우연히 매치될 확률을 표시하는 방법이다. 예로서, 시험 핵산을 참고 서열과 비교하였을 때 최소 확률 총합이 약 0.2 미만일 경우, 일부 실시태양에서, 약 0.01 미만일 경우, 다른 실시태양에서, 약 0.001 미만일 경우, 그 핵산은 참고 서열과 유사한 것으로 간주된다.

일부 실시태양에서, 하나의 측면에서, 단백질 및 핵산 서열의 상동성은 기본 국소 정렬 검색 도구("BLAST": Basic Local Alignment Search Tool)를 사용하여 평가된다. 특히, 5개의 구체적인 BLAST 프로그램이 다음과 같은 기능을 수행하는데에 사용된다:

(1) BLASTP 및 BLAST3은 단백질 서열 데이터베이스에 대해 아미노산 의문 서열을 비교하는데 사용됨;

(2) BLASTN는 뉴클레오티드 서열 데이터베이스에 대해 뉴클레오티드 의문 서열을 비교하는데 사용됨;

(3) BLASTX는 단백질 서열 데이터베이스에 대해 의문 뉴클레오티드 서열(양쪽 가닥 모두)의 6-프레임 개념 번역 산물을 비교하는데 사용됨;

(4) TBLASTN는 6개의 리딩 프레임(양쪽 가닥 모두)내 번역된 뉴클레오티드 서열 데이터베이스에 대해 의문 단백질 서열을 비교하는데 사용됨; 및

(5) TBLASTX는 뉴클레오티드 서열 데이터베이스의 6-프레임 번역에 대해 뉴클레오티드 의문 서열의 6-프레임 번역 결과를 비교하는데 사용됨.

BLAST 프로그램은 의문 아미노산 서열 또는 핵산 서열과, 일부 실시태양에서, 단백질 또는 핵산 서열 데이터베이스로부터 얻은 시험 서열 사이의 유사한 세그먼트(본원에서는 "고-스코어링 세그먼트 쌍"이라 칭함)을 확인함에 따라서 상동성인 서열을 동정한다. 일부 실시태양에서, 고-스코어링 세그먼트 쌍은 당업계에 공지된 다수의 스코어링 매트릭스 수단에 의해 동정된다(즉, 정렬된다). 일부 실시태양에서, 사용된 스코어링 매트릭스는 BLOSUM62 매트릭스(문헌 ([Gonnet (1992) Science 256:1443-1445]; [Henikoff and Henikoff Proteins 17:49-61]))이다. 일부 실시태양에서, 소수의 경우이긴 하지만 PAM 또는 PAM250 매트릭스도 사용될 수 있다(문헌 [Schwartz and Dayhoff, eds., 1978, Matrices for Detecting Distance Relationships: Atlas of Protein Sequence and Structure, Washington: National 바이오medical Research Foundation] 참조). BLAST 프로그램은 미국 국립 의학 도서관에서 입수할 수 있다.

상기 알고리즘에서 사용된 매개 변수들은 서열의 길이와 연구된 상동성 정도에 따라서 적합화될 수 있다. 일부 실시태양에서, 상기 매개 변수는 사용자의 지시 없이도 알고리즘에 의해 사용되는 디폴트 매개 변수일 수 있다.

컴퓨터 시스템 및 컴퓨터 프로그램 제품

본 발명은 본 발명에 따른 핵산과 폴리펩티드 서열을 기록 또는 저장하고 있는 컴퓨터, 컴퓨터 시스템, 컴퓨터 판독가능한 매체 및 컴퓨터 프로그램 제품 등을 제공한다. 추가로, 예로서, 컴퓨터 내에서 서열 동일성을 측정 및 동정하기 위하여(핵산이 본 발명에 따른 범주에 속하는지 여부를 결정하기 위하여), 및 구조적 상동성 및 모티프를 측정 및 동정하기 위하여 본 발명의 방법을 실시함에 있어서, 본 발명에 따른 핵산 또는 폴리펩티드 서열은 컴퓨터에 의해 판독 및 접근할 수 있는 임의의 매체 상에 저장, 기록 및 조작될 수 있다.

본원에 사용된 "기록된" 및 "저장된"이란 용어는, 컴퓨터 매체 상에 정보를 저장한 방식을 지칭하는 것이다. 당업자는 컴퓨터 판독가능한 매체 상에 정보를 기록하여 본 발명에 따른 핵산 및/또는 폴리펩티드 서열 중 하나 이상을 포함하는 제품을 생산하는 임의의 공지된 방법을 용이하게 채택할 수 있다. 본원에 사용된 "컴퓨터," "컴퓨터 프로그램" 및 "프로세서"란 용어는, 광범위한 의미로 사용되는 것으로서, 이하 상세히 기술된 바와 같은 장치들을 모두 포함하는 의미이다. 특정 폴리펩티드 또는 단백질의 "코딩 서열" 또는 이를 "코딩하는 서열"이란, 적당한 조절 서열의 제어하에 폴리펩티드 또는 단백질로 전사 및 번역되는 핵산 서열이다.

본 발명에 따른 폴리펩티드는 본 발명에 따른 서열 및 그와 실질적으로 동일한 서열, 및 상기 서열 중 임의의 것의 부분서열 및 효소 활성 단편을 포함한다. 일부 실시태양에서, 실질적으로 동일하거나, 상동성인 폴리펩티드 서열이란, 본 발명에 따른 서열과 적어도 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상 또는 완벽한(100%) 서열 동일성(상동성)을 갖는 폴리펩티드 서열을 지칭한다.

상동성(서열 동일성)은 본원에 기술된 컴퓨터 프로그램 및 매개 변수 중 임의의 것을 사용하여 측정될 수 있다. 본 발명에 따른 핵산 및 폴리펩티드 서열은 컴퓨터에 의해 판독 및 접근할 수 있는 임의의 매체 상에 저장, 기록 및 조작될 수 있다. 본원에 사용된 "기록된" 및 "저장된"이란 용어는, 컴퓨터 매체 상에 정보를 저장하는 방식을 나타내는 것이다. 당업자는 컴퓨터 판독가능한 매체 상에 정보를 기록하여 본 발명에 따른 핵산 서열 중 하나 이상, 본 발명의 폴리펩티드 서열 중 하나 이상을 포함하는 제품을 생산하는 임의의 공지된 방법을 용이하게 채택할 수 있다. 본 발명의 또다른 실시태양은 본 발명에 따른 핵산 또는 폴리펩티드 서열이 2개, 5개, 10개, 15개 또는 20개 이상 기록되어 있는 컴퓨터 판독가능한 매체에 관한 것이다.

본 발명의 또다른 실시태양은 본 발명에 따른 핵산 서열 중 하나 이상이 기록되어 있는 컴퓨터 판독 가능 매체에 관한 것이다. 본 발명의 또다른 실시태양은 본 발명에 따른 폴리펩티드 서열 중 하나 이상이 기록되어 있는 컴퓨터 판독 가능 매체에 관한 것이다. 본 발명의 또다른 실시태양은 상기 제시한 핵산 또는 폴리펩티드 서열 중 2개, 5개, 10개, 15개 또는 20개 또는 그 이상이 기록되어 있는 컴퓨터 판독 가능 매체에 관한 것이다.

컴퓨터 판독가능한 매체는 자기적으로 판독가능한 매체, 광학적으로 판독가능한 매체, 전기적으로 판독가능한 매체 및 자기/광학 매체를 포함한다. 예를 들면, 컴퓨터 판독가능한 매체는 하드 디스크, 플로피 디스크, 자기 테이프, CD-ROM, 디지털 다목적 디스크(DVD), 무작위 엑세스 메모리(RAM: Randem Access Memory) 또는 읽기 전용 메모리(ROM: Read Only Memory), 및 당업자에게 공지된 기타 유형의 매체일 수 있다.

본 발명의 일부 실시태양은 본원에 개시된 서열 정보를 저장하고 조작하는 시스템(예를 들어, 인터넷 기반 시스템), 예로서, 컴퓨터 시스템을 포함한다. 컴퓨터 시스템(100)의 일례에 관하여는 도 9에 회로 구성도로서 나타내었다. 본원에 사용된 "컴퓨터 시스템"이란, 본 발명에 따른 핵산 서열의 뉴클레오티드 서열, 또는 본 발명에 따른 폴리펩티드 서열을 분석하는데에 사용되는 하드웨어 부품, 소프트웨어 부품 및 데이터 저장 부품을 지칭한다. 일부 실시태양에서, 컴퓨터 시스템(100)은 서열 데이터를 처리, 접근 및 조작하기 위한 프로세서를 포함한다. 이 프로세서(105)는 중앙 처리 장치, 예로서, 인텔 코포레이션(Intel Corporation)의 펜티엄 III, 또는 썬(Sun), 모토롤라(Motorola), 컴팩(Compaq), AMD 또는 인터내셔날 비지니스 머신(International Business Machines)사의 유사한 프로세서 중 널리 공지된 임의의 유형의 것일 수 있다.

일부 실시태양에서, 컴퓨터 시스템(100)은 프로세서(105)와 데이터 저장용인 하나 이상의 내부 데이터 저장 부품(110), 및 데이터 저장 부품에 저장되어 있는 데이터 검색용인 하나 이상의 데이터 검색 장치를 포함하는 일반적인 용도의 시스템이다. 당업자는 현재 시판중인 컴퓨터 시스템 중 임의의 것이 적합하다는 사실을 쉽게 알 수 있다.

하나의 실시태양에서, 컴퓨터 시스템(100)은 메인 메모리(115)(하나의 실시태양에서는, RAM)에 연결되어 있는 버스(bus)에 결합되어 있는 프로세서(105)와, 데이터가 기록되어 있는 하나 이상의 내부 데이터 저장 장치(110), 예를 들어, 하드 드라이브 및/또는 기타 컴퓨터 판독가능한 매체를 포함한다. 일부 실시태양에서, 상기 컴퓨터 시스템(100)은 추가로 내부 데이터 저장 장치(110)에 저장되어 있는 데이터를 판독하기 위한 하나 이상의 데이터 검색 장치(118)를 추가로 포함한다.

상기 데이터 검색 장치(118)로서는, 예를 들면, 플로피 디스크 드라이브, 컴팩트 디스크 드라이브, 자기 테이프 드라이브, 또는 원격 데이터 저장 시스템과 연결될 수 있는(예를 들어, 인터넷을 통하여) 모뎀이 있다. 일부 실시태양에서, 내부 데이터 저장 장치(110)는 제어 논리 및/또는 데이터가 기록되어 있는, 분리 가능한 컴퓨터 판독가능한 매체, 예로서, 플로피 디스크, 컴팩트 디스크, 자기 테이프 등이다. 컴퓨터 시스템(100)은 제어 논리 및/또는 데이터 검색 장치에 삽입된 데이터 저장 부품으로부터 유래하는 데이터를 판독하기 위하여, 적당한 소프트웨어에 의해 프로그래밍되거나, 또는 이 소프트웨어를 포함하는 것이 유리할 수 있다.

컴퓨터 시스템(100)은 컴퓨터 사용자에게 출력 결과를 보여주는데에 사용되는 디스플레이(120)를 포함한다. 또한, 상기 컴퓨터 시스템(100)은 다른 컴퓨터 시스템(125a∼c)과 네트워크로 연결되거나 또는 광역 네트워크로 연결되어 있어서, 이 컴퓨터 시스템(100)에 한꺼번에 접근할 수 있음을 알아야 할 것이다.

본 발명에 따른 핵산 서열의 뉴클레오티드 서열 및 그와 실질적으로 동일한 서열, 또는 본 발명의 폴리펩티드 서열 및 그와 실질적으로 동일한 서열에 접근하여 이를 처리하는 소프트웨어(예를 들어, 검색 도구, 비교 도구 및 모델링 도구 등)는 실행중 메인 메모리(115)에 담겨있을 수 있다.

일부 실시태양에서, 컴퓨터 시스템(100)은 추가로 컴퓨터 판독가능한 매체에 저장되어 있는 본 발명에 따른 핵산 서열의 뉴클레오티드 서열 및 그와 실질적으로 동일한 서열, 또는 본 발명의 폴리펩티드 서열 및 그와 실질적으로 동일한 서열을, 컴퓨터 판독가능한 매체에 저장되어 있던 참고 뉴클레오티드 또는 폴리펩티드 서열(들)과 비교하기 위한, 서열 비교 알고리즘을 포함할 수 있다. "서열 비교 알고리즘"이란, 데이터 저장 수단에 저장되어 있던 기타 뉴클레오티드 서열 및/또는 화합물과 뉴클레오티드 서열을 비교하기 위해 컴퓨터 시스템(100) 상에서 실행되는(국소적 또는 광역적으로 실행되는) 하나 이상의 프로그램을 지칭하는 것이다. 예를 들면, 서열 비교 알고리즘은, 컴퓨터 판독가능한 매체에 저장되어 있는 본 발명에 따른 핵산 서열의 뉴클레오티드 서열 및 그와 실질적으로 동일한 서열, 또는 본 발명의 폴리펩티드 서열 및 그와 실질적으로 동일한 서열을, 컴퓨터 판독가능한 매체에 저장되어 있던 참고 서열과 비교하여 상동성 또는 구조적 모티프를 확인할 수 있다.

도 10은 신규 서열과 데이터베이스에 있던 서열 사이의 상동성 수준을 측정하기 위하여, 신규 뉴클레오티드 또는 단백질 서열과 서열 데이터베이스를 비교하는 프로세스(200)의 한 실시태양을 도시하는 흐름도이다. 서열 데이터베이스는 컴퓨터 시스템(100) 내에 저장된 개인 데이터베이스일 수 있거나, 인터넷을 통하여 입수할 수 있는 진뱅크와 같은 공중 데이터베이스일 수 있다.

상기 공정(200)은 출발 단계(201)로부터 시작하여, 이후 단계(202) 즉, 비교될 신규 서열이 컴퓨터 시스템(100)내 메모리에 저장되는 단계로 이동한다. 전술한 바와 같이, 상기 메모리는 임의의 유형의 메모리 예를 들어, RAM 또는 내부 저장 장치일 수 있다.

이어서, 공정(200)은 단계(204) 즉, 서열 데이터베이스가 분석 및 비교를 위해 공개되는 단계로 진행된다. 이어서, 공정(200)은 단계(206) 즉, 데이터베이스에 저장되어 있던 제1 서열을 컴퓨터 상에서 메모리로 읽어내는 단계로 이동한다. 이어서, 단계(210)에서는 비교가 실행되는데, 그 결과 상기 제1 서열이 제2 서열과 동일한지 여부를 결정하게 된다. 이 단계는 신규 서열과 데이터베이스의 제1 서열을 정확히 비교하기 위한 목적으로만 행하여지는 것은 아님에 주목해야 할 것이다. 상기 서열들이 동일하지 않더라도 2개의 뉴클레오티드 또는 단백질 서열을 비교할 수 있는, 널리 공지된 방법이 당업자에게 공지되어 있다. 예를 들어, 2개의 시험 서열 사이 상동성 수준을 증가시키기 위해, 하나의 서열에 갭을 도입시킬 수 있다. 갭 또는 다른 특징이 비교중인 서열에 도입되었는지 여부를 제어하는 매개 변수는 일반적으로 컴퓨터 시스템의 사용자에 의해 입력된다.

일단, 2개 서열을 상기 단계(210)에서 비교하면, 이 2개의 서열이 동일한지 여부를 단계(210)에서 확실히 확인할 수 있게 된다. 물론, "동일하다 "는 용어는, 완전히 동일한 서열로 제한되는 것은 아니다. 사용자에 의해 입력된 상동성 매개 변수 내에 포함되는 서열은 공정(200)에서 "동일한" 것으로 마킹될 것이다.

만일 상기 2개의 서열이 동일하다고 판명되면, 공정(200)은 단계(214) 즉, 데이터베이스로부터 유래하는 서열의 이름을 사용자에게 알려주는 단계로 이동한다. 이 단계는 명명된 서열이 입력된 상동성을 사용자에게 알려준다. 일단, 저장된 서열의 명칭이 사용자에게 알려지면, 공정(200)은 결정 단계(218) 즉, 여전히 그 서열이 데이터베이스 내에 존재하는지 여부를 결정하는 단계로 이동하게 된다. 데이터베이스 내에 서열이 더 이상 존재하지 않으면, 공정(200)은 최종 단계(220)에서 종결된다. 그러나, 만일 여전히 그 서열이 데이터베이스 내에 존재하면, 공정(200)은 다시 단계(214) 즉, 화살표가 데이터베이스의 다음 서열로 이동하여, 신규 서열과 비교될 수 있는 단계로 이동하게 된다. 이러한 방식으로, 신규 서열은 정렬되고, 데이터베이스내 모든 서열과 비교된다.

만일, 서열들이 상동성을 갖지 않는 것으로 결정 단계(212)에서 측정된다면, 공정(200)은 즉시 결정 단계(218)로 이동하게 되고, 그 결과 기타 임의의 서열이 비교용 데이터베이스에서 얻을 수 있는지 여부를 결정할 수 있다.

그러므로, 본 발명의 하나의 실시태양은 프로세서, 본 발명에 따른 핵산 서열, 또는 본 발명에 따른 폴리펩티드 서열을 담고 있는 데이터 저장 장치, 본 발명에 따른 핵산 서열, 또는 본 발명에 따른 폴리펩티드 서열과 비교될 참조 뉴클레오티드 서열 또는 폴리펩티드 서열, 그리고 비교 실행용의 서열 비교자를 검색 가능하도록 담고 있는 데이터 저장 장치를 포함하는 컴퓨터 시스템에 관한 것이다. 상기 서열 비교자는 비교된 서열들간 상동성 수준을 알려줄 수 있거나, 또는 전술한 핵산 코드에 존재하는 구조적 모티프, 본 발명에 따른 핵산 서열, 또는 본 발명에 따른 폴리펩티드 서열을 확인시켜줄 수 있거나, 또는 이러한 핵산 코드와 폴리펩티드 코드를 비교하여주는 서열 내 구조적 모티프를 확인시켜줄 수 있다. 일부 실시태양에서, 데이터 저장 장치는 본 발명에 따른 핵산 서열 및 그와 실질적으로 동일한 서열, 또는 본 발명에 따른 폴리펩티드 서열 및 그와 실질적으로 동일한 서열 중 적어도 2개, 5개, 10개, 15개, 20개, 25개, 30개 또는 40개 또는 그 이상의 서열을 저장할 수 있다.

본 발명의 또다른 실시태양은 본 발명에 따른 핵산 서열 및 그와 실질적으로 동일한 서열, 또는 본 발명에 따른 폴리펩티드 서열 및 그와 실질적으로 동일한 서열 및 참조 서열 사이의 상동성 수준을 측정하는 방법이다. 본 방법은 상동성 수준을 측정하는 컴퓨터 프로그램을 이용함으로써, 핵산 코드 또는 폴리펩티드 코드와, 참조 뉴클레오티드 서열 또는 폴리펩티드 서열을 판독하는 단계; 및 컴퓨터 프로그램을 이용하여 이 핵산 코드 또는 폴리펩티드 코드와, 참조 뉴클레오티드 서열 또는 폴리펩티드 서열 사이의 상동성을 측정하는 단계를 포함한다. 상기 컴퓨터 프로그램은 상동성 수준을 측정하는 다수의 컴퓨터 프로그램 중 임의의 것 예를 들어, 본원에 특정하여 열거한 프로그램(예를 들어, 디폴트 매개 변수 또는 임의의 변형 매개 변수를 포함하는 BLAST2N) 일 수 있다. 본 방법은 전술한 컴퓨터 시스템을 사용하여 실시될 수 있다. 본 방법은 또한 컴퓨터 프로그램을 이용하여 전술한 본 발명에 따른 핵산 서열 및 그와 실질적으로 동일한 서열, 또는 본 발명에 따른 폴리펩티드 서열 및 그와 실질적으로 동일한 서열 중 적어도 2개, 5개, 10개, 15개, 20개, 25개, 30개 또는 40개 또는 그 이상을 판독한 후, 핵산 코드 또는 폴리펩티드 코드와 참조 뉴클레오티드 서열 또는 폴리펩티드 서열 사이의 상동성을 측정함으로써 실시될 수도 있다.

도 11은 2개 서열이 상동성인지 여부를 결정하기 위하여 컴퓨터 내에서 행하여지는 공정(250)의 하나의 실시태양을 나타내는 흐름도이다. 이 공정(250)은 출발 단계(252)에서 시작된 후, 단계(254) 즉, 비교될 제1 서열이 메모리에 저장되는 단계로 이동한다. 이어서, 비교될 제2 서열은 단계(256)에서 메모리에 저장된다. 이어서, 공정(250)은 단계(260) 즉, 제1 서열의 첫 번째 문자가 판독되는 단계로 이동한 다음, 단계(262) 즉, 제2 서열의 첫번째 문자가 판독되는 단계로 이동하게 된다. 만일 서열이 뉴클레오티드 서열이면, 그 문자는 일반적으로, A, T, C, G 또는 U 중의 어느 하나일 것임을 이해하여야 할 것이다. 만일 서열이 단백질 서열이면, 일부 실시태양에서 단일 문자 아미노산 코드로 제1 서열 및 제2 서열은 용이하게 비교될 수 있을 것이다.

이어서, 결정 단계(264) 에서는 상기 2개의 문자가 동일한지 여부에 대해 측정된다. 만일 상기 2개의 문자들이 동일하면, 공정(250)은 단계(268) 즉, 제 1 서열과 제2 서열의 다음 문자가 판독되는 단계로 이동하게 된다. 이어서, 상기 다음 문자가 동일한지 여부를 결정한다. 만일 상기 다음 문자가 동일하다면, 공정(250)은 2개의 문자가 동일하지 않을 때까지 이와 같은 주기를 계속해서 반복 수행하게 된다. 만일 상기 다음 문자가 동일하지 않다고 판명되면, 공정(250)은 결정 단계(274)로 이동하여, 그 결과 양 서열 중 어느 하나에 판독될 더 이상의 문자가 존재하는지 여부를 결정하게 된다.

만일 판독될 문자가 더 이상 존재하지 않는다면, 공정(250)은 단계(276) 즉, 제1 서열 및 제2 서열 간 상동성 수준을 사용자에게 알려주는 단계로 이동하게 된다. 상동성 수준은, 제 1 서열 내 서열의 총수와 동일한 수의 서열들 사이에 존재하는 문자의 비율을 계산함으로써 측정된다. 그러므로, 만일 처음 100개의 뉴클레오티드 서열에 존재하는 모든 문자가 제 2 서열에 존재하는 모든 문자와 함께 정렬되면, 상동성 수준은 100%가 될 것이다.

별법으로, 컴퓨터 프로그램은 본 발명에 제시된 핵산 서열의 뉴클레오티드 서열을 하나 이상의 참조 뉴클레오티드 서열과 비교하여, 본 발명에 따른 핵산 코드 및 실질적으로 그와 동일한 서열이 하나 이상의 위치에서 참조 핵산 서열과 상이한지 여부를 결정하는 컴퓨터 프로그램일 수 있다. 경우에 따라, 이러한 프로그램은 참조 폴리뉴클레오티드 서열 또는 본 발명에 따른 핵산 서열 및 실질적으로 그와 동일한 서열 중 어느 한 서열에 비해, 삽입, 결실 또는 치환된 뉴클레오티드의 길이 및 상동성을 기록한다. 일부 실시태양에서, 컴퓨터 프로그램은 참조 뉴클레오티드 서열에 비해, 본 발명에 따른 핵산 서열 및 실질적으로 그와 동일한 서열이 단일의 뉴클레오티드 다형성(SNP)을 갖는지 여부를 결정하는 프로그램이다.

그러므로, 본 발명의 또다른 실시태양은 본 발명에 따른 핵산 서열 및 실질적으로 그와 동일한 서열이 하나 이상의 뉴클레오티드에서 참조 뉴클레오티드 서열과 상이한지 여부를 결정하는 방법에 관한 것으로서, 이 방법은 핵산 서열 간 차이를 동정하는 컴퓨터 프로그램을 이용하여 참조 뉴클레오티드 서열과 핵산 코드를 판독하는 단계; 및 컴퓨터 프로그램을 이용하여 핵산 코드와 참조 뉴클레오티드 서열 간 차이를 동정하는 단계를 포함한다. 일부 실시태양에서, 상기 컴퓨터 프로그램은 단일 뉴클레오티드 다형성을 동정하는 프로그램이다. 이 방법은 전술한 컴퓨터 시스템과 도 11에 도시된 방법에 의해실시될수 있다. 이 방법은 또한 본 발명에 따른 핵산 서열 및 실질적으로 그와 동일한 서열 중 2개, 5개, 10개, 15개, 20개, 25개, 30개 또는 40개 또는 그 이상의 핵산 서열과 참조 뉴클레오티드 서열을 컴퓨터 프로그램을 이용하여 판독하는 단계; 및 핵산 코드와 참조 뉴클레오티드 서열 간 차이를 컴퓨터 프로그램을 이용하여 동정하는 단계에 의해 실시될 수도 있다.

다른 실시태양에서, 컴퓨터를 바탕으로 하는 시스템은 또한 본 발명에 따른 핵산 서열, 또는 본 발명에 따른 폴리펩티드 서열 및 실질적으로 그와 동일한 서열내에 존재하는 특징들을 동정하기 위한 식별자를 포함할 수도 있다. "식별자"란, 본 발명에 따른 핵산 서열, 또는 본 발명에 따른 폴리펩티드 서열 내에 존재하는 임의의 특징을 동정하는 하나 이상의 프로그램을 의미한다. 일부 실시태양에서, 상기 식별자는 본 발명에 따른 핵산 서열 및 실질적으로 그와 동일한 서열 내에 존재하는 오픈 리딩 프레임을 동정하는 프로그램을 포함할 수 있다.

도 12는 서열 내에 특징이 존재하는지 여부를 결정하기 위한 식별자 공정(300)의 하나의 실시태양을 나타내는 흐름도이다. 이 공정(300)은 출발 단계(302)에서 개시되고, 이후 단계(304) 즉, 특징을 가지고 있는지에 대해 체크될 제1 서열이 컴퓨터 시스템(100) 내에 존재하는 메모리(115)에 저장되는 단계로 이동하게 된다. 이어서, 상기 공정(300)은 단계(306) 즉, 서열 특징에 관한 데이터베이스가 공개되는 단계로 이동한다. 이러한 데이터베이스는 이 특징의 명칭과 함께 각 특징의 속성에 관한 목록을 포함할 것이다. 예를 들어, 특징의 명칭이 "개시 코돈"이며, 그 속성은 "ATG"가 될 것이다. 또다른 예로서는, 특징의 명칭이 "TAATAA 박스"이면, 이 특징의 속성은 "TAATAA"가 될 것이다. 이러한 데이터베이스의 예는 위스콘신 대학교 유전학 컴퓨터 그룹에 의해 개발되었다. 별법으로, 이 특징들은 폴리펩티드의 구조적 모티프 예를 들어, 알파 나선 구조, 베타 병풍 구조 또는 폴리펩티드의 기능상 모티프 예를 들어, 효소 활성 부위, 나선부-선회부-나선부 모티프 또는 당업자에게 공지된 기타 모티프 일 수 있다.

일단 이 특징들에 관한 데이터베이스가 단계(306)에서 공개되면, 공정(300)은 단계(308) 즉, 제1 특징이 데이터베이스로부터 판독되는 단계로 이동한다. 이후, 제1 특징의 속성과 제1 서열은 단계(310)에서 비교된다. 이후 결정 단계(316)에서는 이 특징의 속성이 제1 서열에서 발견되는지 여부를 결정하게 된다. 만일 속성이 발견되면, 공정(300)은 단계(318) 즉, 발견된 특징의 명칭을 사용자에게 알려주는 단계로 이동하게 된다.

이어서, 공정(300)은 결정 단계(320) 즉, 이동한 특징이 데이터베이스에 존재하는지 여부를 결정하는 단계로 이동한다. 만일 더 이상의 특징이 존재하지 않으면, 공정(300)은 최종 단계(324)에서 종결될 것이다. 그러나, 만일 아직도 그 특징이 데이터베이스에 존재한다면, 공정(300)은 단계(326)에서 다음 서열의 특징을 판독하고, 그 주기는 다시 단계(310) 즉, 다음 특징의 속성이 제1 서열과 비교되는 단계로 되돌아오게 된다. 만일 결정 단계(316)에서 그 특징의 속성이 제1 서열에서 발견되지 않으면, 공정(300)은 결정 단계(320)로 직접 이동되고, 데이터 베이스 내에 여전히 그 특징이 존재하는지 여부를 결정하게 되는 것이다.

그러므로, 본 발명의 또다른 실시태양은, 본 발명에 따른 핵산 서열 및 실질적으로 그와 동일한 서열 또는 본 발명에 따른 폴리펩티드 서열 및 실질적으로 그와 동일한 서열 내에 존재하는 특징을 동정하는 방법에 관한 것으로서, 이 방법은 핵산 코드(들) 또는 폴리펩티드 코드(들)에 있던 특징들을 동정하는 컴퓨터 프로그램을 이용하여, 이 핵산 코드(들) 또는 폴리펩티드 코드(들)를 해독하는 단계; 및 이 핵산 코드(들) 내에 존재하는 특징들을 컴퓨터 프로그램을 이용하여 동정하는 단계를 포함한다. 일부 실시태양에서, 컴퓨터 프로그램은 오픈 리딩 프레임을 동정하는 컴퓨터 프로그램을 포함한다. 이 방법은 컴퓨터 프로그램을 이용하여, 본 발명에 따른 단일 서열 또는 본 발명에 따른 핵산 서열 중 2개, 5개, 10개, 15개, 20개, 25개, 30개 또는 40개 또는 그 이상의 핵산 서열 및 실질적으로 그와 동일한 서열, 또는 본 발명에 따른 폴리펩티드 서열 및 실질적으로 그와 동일한 서열을 해독한 후, 컴퓨터 프로그램을 이용하여 핵산 코드 또는 폴리펩티드 코드내 특징들을 동정함으로써 실시될 수 있다.

본 발명의 핵산 서열 및 실질적으로 그와 동일한 서열, 또는 본 발명에 따른 폴리펩티드 서열 및 실질적으로 그와 동일한 서열은 다양한 포맷으로 다양한 데이터 프로세서 프로그램에 저장되어 조작될 수 있다. 예를 들어, 본 발명의 핵산 서열 및 실질적으로 그와 동일한 서열, 또는 본 발명에 따른 폴리펩티드 서열 및 실질적으로 그와 동일한 서열은 워드 프로세서 파일 예를 들어, 마이크로소프트 워드(Microsoft WORD)™ 또는 워드퍼펙트(WORDPERFECT)™에 텍스트로서 저장될 수 있거나, 또는 당업자에게 익숙한 다양한 데이터베이스 프로그램에 ASCII 파일 예를 들어, DB2™, 사이베이스(SYBASE)™ 또는 오라클(ORACLE)™로서 저장될 수 있다. 또한, 다수의 컴퓨터 프로그램들과 데이터베이스가 본 발명의 핵산 서열 및 실질적으로 그와 동일한 서열, 또는 본 발명에 따른 폴리펩티드 서열 및 실질적으로 그와 동일한 서열과 비교될 참조 뉴클레오티드 서열 또는 폴리펩티드 서열의 서열 비교 알고리즘, 식별자 또는 공급원으로서 사용될 수 있다. 다음과 같은 목록은 본 발명을 제한하고자 하는 것이 아니라, 본 발명의 핵산 서열 및 실질적으로 그와 동일한 서열, 또는 본 발명에 따른 폴리펩티드 서열 및 실질적으로 그와 동일한 서열에 유용한 프로그램 및 데이터베이스에는 어떠한 것들이 있는지를 알려주고자 하는 것이다.

사용 가능한 프로그램 및 데이터베이스로서는 다음의 것들을 포함하나, 이에 한정되는 것은 아니다: 맥패턴(MACPATTERN)™(EMBL), 디스커버리베이스(DISCOVERYBASE)™(Molecular Applications Group), 제네마인(GENEMINE)™(Molecular Applications Group), 룩(LOOK)™(Molecular Applications Group), 맥룩(MACLOOK)™(Molecular Applications Group), BLAST 및 BLAST2(NCBI), BLASTN 및 BLASTX(문헌 [Altschul et al, J. Mol. Biol. 215: 403, 1990]), FASTA (문헌 [Pearson and Lipman, Proc. Natl. Acad. Sci. USA, 85: 2444, 1988]), FASTDB (문헌 [Brutlag et al. Comp. App. Biosci. 6:237-245, 1990]), 카탈리스트™ (Molecular Simulation Inc.), 카탈리스트/셰이프(Catalyst/SHAPE)™(Molecular Simulations Inc.), 세리우스².DBAccess(Cerius².DBAccess)™(Molecular Simulations Inc.), 하이포젠(HYPOGEN)™(Molecular Simulations Inc.), 인사이트 II(INSIGHT II)™(Molecular Simulations Inc.), 디스커버(DISCOVER)™(Molecular Simulations Inc.), 챰(CHARMm)™ (Molecular Simulations Inc.), 펠릭스(FELIX)™(Molecular Simulations Inc.), 델피(DELPHI)™(Molecular Simulations Inc.), 퀀템(QuanteMM)™(Molecular Simulations Inc.), 호몰로지(Homology)(Molecular Simulations Inc.), 모델러(MODELER)™(Molecular Simulations Inc.), 아이시스(ISIS)™(Molecular Simulations Inc.), 퀀타/프로테인 디자인(Quanta/Protein Design)(Molecular Simulations Inc.), 웹랩(WebLab)(Molecular Simulations Inc.), 웹랩 다이버서티 엑스플로러(WebLab Diversity Explorer)(Molecular Simulations Inc.), 진 엑스플로러(Gene Explorer)(Molecular Simulations Inc.), SeqFold(Molecular Simulations Inc.), MDL 허용 화학 물질 디렉토리 데이터베이스(MDL Available Chemicals Directory database), MDL 약품 데이터 리포트 데이터베이스(MDL Drug Data Report data base), 종합 약품 화학 데이터베이스(Comprehensive Medicinal Chemistry database), 더웬트 세계 악품 인덱스 데이터베이스(Derwents's World Drug Index database), 바이오바이트마스터파일 데이터베이스(BioByteMasterFile database), 진뱅크 데이터베이스 및 Genseqn 데이터베이스. 본 발명에 개시된 다수의 기타 프로그램 및 데이터베이스는 당업자에게 익숙한 것일 것이다.

상기 프로그램을 이용하여 검출될 수 있는 모티프로서는 루신 지퍼 코딩 서열, 나선부-선회부-나선부 모티프, 당화 부위, 유비퀴틴화 위치, 알파 나선 구조 및 베타 병풍 구조, 코딩된 단백질의 분비를 유도하는 신호 펩티드 코딩 신호 서열, 전사 조절 관여 서열 예를 들어, 호메오박스, 산성 확장부, 효소 활성 부위, 기질 결합 부위 및 효소 절단 부위를 포함한다.

핵산의 혼성화

본 발명은 엄격한 조건하에서 본 발명에 따른 서열(예로서, 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 67, 서열 번호: 69, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161, 서열 번호: 163, 서열 번호: 165, 서열 번호: 167, 서열 번호: 169, 서열 번호: 171, 서열 번호: 173, 서열 번호: 175, 서열 번호: 177, 서열 번호: 179, 서열 번호: 181, 서열 번호: 183, 서열 번호: 185, 서열 번호: 187, 서열 번호: 189, 서열 번호: 191, 서열 번호: 193, 서열 번호: 195, 서열 번호: 197, 서열 번호: 199, 서열 번호: 201, 서열 번호: 203, 서열 번호: 205, 서열 번호: 207, 서열 번호: 209, 서열 번호: 211, 서열 번호: 213, 서열 번호: 215, 서열 번호: 217, 서열 번호: 219, 서열 번호: 221, 서열 번호: 223, 서열 번호: 225, 서열 번호: 227, 서열 번호: 229, 서열 번호: 231, 서열 번호: 233, 서열 번호: 235, 서열 번호: 237, 서열 번호: 239, 서열 번호: 241, 서열 번호: 243, 서열 번호: 245, 서열 번호: 247, 서열 번호: 249, 서열 번호: 251, 서열 번호: 253, 서열 번호: 255, 서열 번호: 257, 서열 번호: 259, 서열 번호: 261, 서열 번호: 263, 서열 번호: 265, 서열 번호: 267, 서열 번호: 269, 서열 번호: 271, 서열 번호: 273, 서열 번호: 275, 서열 번호: 277, 서열 번호: 279, 서열 번호: 281, 서열 번호: 283, 서열 번호: 285, 서열 번호: 287, 서열 번호: 289, 서열 번호: 291, 서열 번호: 293, 서열 번호: 295, 서열 번호: 297, 서열 번호: 299, 서열 번호: 301, 서열 번호: 303, 서열 번호: 305, 서열 번호: 307, 서열 번호: 309, 서열 번호: 311, 서열 번호: 313, 서열 번호: 315, 서열 번호: 317, 서열 번호: 319, 서열 번호: 321, 서열 번호: 323, 서열 번호: 325, 서열 번호: 327, 서열 번호: 329, 서열 번호: 331, 서열 번호: 333, 서열 번호: 335, 서열 번호: 336, 서열 번호: 337, 또는 서열 번호: 338)에 혼성화하는 단리된 합성 또는 재조합 핵산을 제공한다. 엄격한 조건이란, 매우 엄격한 조건, 중간 정도의 엄격한 조건 및/또는 낮은 정도의 엄격한 조건, 예를 들어, 본원에 기술된 바와 같이 엄격도의 조건이 높은 경우와 낮은 경우일 수 있다. 일부 실시태양에서, 이하에 논의되는 바와 같이, 핵산이 본 발명에 따른 범주 내에 포함되는지 여부를 결정하는 조건은 세척 조건의 엄격도가 어느 정도인지에 따라서 결정된다.

"혼성화"란, 염기쌍 형성 과정을 통하여 핵산 가닥이 상보성 가닥과 결합하는 과정을 의미한다. 혼성화 반응은 감수성이고 선택적이어서, 관심의 대상이 되는 특정 서열은 그것이 샘플 중에 낮은 농도로 존재할지라도 동정될 수 있다. 적당히 엄격한 조건이란, 예를 들면, 예비 혼성화 및 혼성화 용액 중 염 또는 포름아미드의 농도, 또는 혼성화 온도로써 정의될 수 있으며, 이에 관하여는 당업계에 잘 알려져 있다. 다른 실시태양에서, 엄격도는 염 농도의 감소, 포름아미드 농도의 증가, 또는 혼성화 온도의 상승에 의해 증가될 수 있다. 다른 실시태양에서, 본 발명에 따른 핵산 본원에 제시된 바와 같이, 다양한 엄격도의 조건(예를 들어, 고, 중 및 저) 하에서 혼성화할 수 있는 능력에 의해서 정의된다.

일부 실시태양에서, 높은 엄격도의 조건하에서 이루어지는 혼성화는 약 37℃ 내지 42℃에서 약 50%의 포름아미드를 포함한다. 일부 실시태양에서, 혼성화 조건은 약 30℃ 내지 35℃의 온도에서 약 35% 내지 25%의 포름아미드로써 이루어지는 낮아진 엄격도의 조건을 포함한다. 일부 실시태양에서, 혼성화 조건은 예로서, 42℃ 및 50% 포름아미드, 5x SSPE, 0.3% SDS 및 200㎍/ml의 전단 및 변성 연어 정자 DNA를 사용하는 높은 엄격도의 조건을 포함한다. 일부 실시태양에서, 혼성화 조건은 이와 같은 낮아진 엄격도의 조건을 포함하지만, 35℃로 감소된 온도 및 35%의 포름아미드 중에서 이루어진다. 특정 수준의 엄격도에 해당하는 온도 범위는 관심의 대상이 되는 핵산의 퓨린:피리미딘 비율을 계산하고, 이에 따라서 온도를 맞춤으로써 좁혀질 수 있다. 상기 범위 및 조건에 대한 변형예에 관하여는 당업계에 잘 알려져 있다.

다른 실시태양에서, 엄격한 조건하에서 혼성화할 수 있는 능력에 의해 정의되는 본 발명에 따른 핵산은 본 발명에 따른 핵산 중 약 5개의 잔기 내지 전체 길이의 핵산일 수 있는데; 예로서, 상기 핵산은 길이가 적어도 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 90개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개, 650개, 700개, 750개, 800개, 850개, 900개, 950개, 1000개 또는 그 이상의 잔기일 수 있다. 전체 길이의 핵산보다 길이가 짧은 핵산도 포함된다. 이와 같은 핵산은 예로서, 혼성화 프로브, 표지화 프로브, PCR용 올리고뉴클레오티드 프로브, siRNA 또는 miRNA(단일 가닥 또는 이중 가닥), 항체 결합 펩티드(에피토프)를 코딩하는 안티센스 또는 서열, 모티프 및 활성 부위 등으로서 유용할 수 있다.

일부 실시태양에서, 본 발명에 따른 핵산은 약 37℃ 내지 42℃ 및 약 50%의 포름아미드를 사용하는 고도로 엄격한 조건하에서 혼성화하는 능력에 의해 정의된다. 일부 실시태양에서, 본 발명에 따른 핵산은 약 30℃ 내지 35℃ 및 약 35% 내지 25%의 포름아미드를 사용하는 낮아진 엄격도의 조건하에서 혼성화하는 능력에 의해에 의해 정의된다.

별법으로, 본 발명에 따른 핵산은 약 42℃ 및 약 50%의 포름아미드, 5x SSPE, 0.3% SDS 및 반복적 서열 차단 핵산, 예로서, cot-1 또는 연어 정자 DNA(예로서, 200㎍/ml의 전단 및 변성 연어 정자 DNA)를 사용하는 고도로 엄격한 조건하에서 혼성화하는 능력에 의해 정의된다. 일부 실시태양에서, 본 발명에 따른 핵산은 35℃ 또는 42℃의 낮아진 온도에서 35% 또는 40%의 포름아미드를 사용하는 낮아진 엄격도의 조건하에서 혼성화하는 능력에 의해 정의된다.

핵산 혼성화 반응에 있어서, 특정 수준의 엄격도를 이루는데에 사용되는 조건은 혼성화할 핵산의 성질에 따라서 달라질 것이다. 예를 들면, 핵산의 혼성화 영역의 길이, 상보성 정도, 뉴클레오티드 서열 조성(예를 들어, GC 대 AT 함량) 및 핵산 유형(예로서, RNA 대 DNA)는 혼성화 조건을 선택함에 있어서 고려될 수 있는 사항들이다. 부가적인 고려 사항은 핵산 중 하나가 예를 들어, 필터상에 고정되는지 여부이다.

혼성화는 낮은 엄격도, 중간 정도의 엄격도 또는 높은 엄격도의 조건하에서 수행될 수 있다. 핵산 혼성화의 일례로서, 고정화된 변성 핵산을 함유하는 중합체 막은 우선, 0.9M NaCl, 50mM NaH₂PO₄, pH 7.0, 5.0mM Na₂EDTA, 0.5% SDS, 1Ox덴하르트 및 0.5mg/ml의 폴리리보아데닐산으로 구성된 용액 중 45℃에서 30분 동안 예비적으로 혼성화된다. 대략 2x10⁷cpm(비활성 = 4~9x10⁸cpm/㎍)의 ³²P 말단-표지화 올리고뉴클레오티드 프로브는 이후 상기 용액에 첨가된다. 12~16시간 동안 인큐베이션시킨 후, 상기 막을 실온에서 0.5% SDS를 함유하는 1xSET(150mM NaCl, 20mM 트리스 하이드로클로라이드(pH 7.8), 1mM Na₂EDTA) 중 실온에서 30분 동안 세척한 후, 올리고뉴클레오티드 프로브를 위해 신선한 1xSET 중 T_m-10℃에서 30분간 세척한다. 이어서, 상기 막을 방사능 사진 촬영 필름에 노출시켜, 혼성화 신호를 검출한다. 전술한 혼성화 조건 모두는 높은 엄격도의 조건인 것으로 간주된다.

혼성화 이어서, 필터를 세척하여 비특이적으로 결합되어 있던 임의의 검출 가능한 프로브를 제거할 수 있다. 이 필터를 세척할 때에 사용된 엄격도 또한 혼성화할 핵산의 성질, 혼성화할 핵산의 길이, 상보성 정도, 뉴클레오티드 서열 조성(예를 들어, GC 대 AT 함량) 및 핵산의 유형(예를 들어, RNA 대 DNA)에 따라서 달라질 수도 있다. 점차적으로 높아지는 엄격도의 조건하의 세척의 예는 하기와 같다: 2xSSC, 0.1% SDS, 실온에서 15분 동안(낮은 정도의 엄격도); 0.1xSSC, 0.5% SDS, 실온에서 30분 내지 1시간(중간 정도의 엄격도); 0.1xSSC, 0.5% SDS, 혼성화 온도 내지 68℃에서 15 내지 30분 동안(높은 엄격도); 그리고 0.15M NaCl, 72℃에서 15분 동안(매우 높은 엄격도). 최종의 낮은 엄격도에서의 세척은 실온 및 0.1xSSC 중에서 수행될 수 있다. 상기 예들은 단지 필터를 세척하는데에 사용될 수 있는 조건의 한 세트에 관하여 예를 든 것이다. 당업자는 상이한 엄격도의 세척에 대하여 다양한 방법이 존재한다는 것을 알 것이다. 기타 몇몇 예를 하기에 제시한다.

일부 실시태양에서, 혼성화 조건은 실온에서 30분 동안 1X150mM NaCl, 20mM 트리스 하이드로클로라이드(pH 7.8), 1mM Na₂EDTA, 0.5% SDS를 포함하는 용액 중에서 세척한 후, 새 용액 중에서 30분 동안 세척하는 것을 포함하는 세척 단계를 포함한다.

프로브에 혼성화하는 핵산은 방사능 사진 촬영 또는 기타 통상의 기법에 의해 동정된다.

프로브 서열에 대한 서열 동일성(상동성)의 수준이 감소한 핵산을 동정하도록 상기 과정은 변형될 수 있다. 예를 들어, 검출 가능한 프로브에 대한 서열 동일성(상동성)이 감소한 핵산을 수득하기 위해서는, 덜 엄격한 조건을 사용할 수 있다. 예를 들어, 혼성화 온도는 Na⁺농도가 대략 1M인 혼성화 완충액 중 68℃에서 42℃까지 5℃씩 낮아질 수 있다. 혼성화 이어서, 필터는 혼성화 온도에서 2xSSC 및 0.5% SDS를 사용하여 세척될 수 있다. 이러한 조건들에 있어서 50℃를 초과하는 경우에는 "중간 정도" 조건으로 간주하고, 50℃ 이하인 경우에는 "낮은" 조건으로 간주한다. "중간 정도의" 혼성화 조건의 구체예는 상기 혼성화가 55℃에서 진행될 때이다. "낮은 엄격도" 혼성화 조건의 구체예는 상기 혼성화가 45℃에서 진행될 때이다.

별법으로, 혼성화는 42℃의 온도에서 포름아미드를 함유하는 완충액, 예를 들어, 6xSSC 중에서 수행될 수 있다. 이러한 경우, 프로브에 대한 상동성 수준이 감소한 클론을 동정하기 위한 혼성화 완충액 중 포름아미드 농도는 50%에서 0%까지 5%씩 감소될 수 있다. 혼성화 이어서, 필터는 50℃에서 6xSSC 및 0.5% SDS로 세척될 수 있다. 이러한 조건에 있어서 포름아미드가 25%를 초과하는 경우 "중간 정도의" 조건으로 간주하고, 포름아미드가 25% 이하인 경우 "낮은" 조건으로 간주한다. "중간 정도의" 혼성화 조건에 관한 구체예는 상기 혼성화가 30%의 포름아미드에서 진행되는 경우이다. "낮은 엄격도" 혼성화 조건의 구체예는 상기 혼성화가 10% 포름아미드에서 진행되는 경우이다.

그러나, 혼성화 방식을 선별하는 것이 중요하지 않을 수 있다 - 핵산이 본 발명에 따른 범주 내에 포함되는지 여부를 결정하는 조건을 제시할 세척 조건의 엄격도의 경우가 바로 그러하다. 본 발명에 따른 범주 내에 포함되는 핵산을 동정하는데에 사용되는 세척 조건으로는 예로서: 염 농도 = 약 0.02 몰, pH = 7 및 온도 = 약 50℃ 이상 또는 약 55℃ 내지 약 60℃; 또는 염 농도 = 약 0.15M NaCl, 72℃에서 약 15분 동안; 또는 염 농도 = 약 0.2xSSC, 온도 = 약 50℃ 이상 또는 약 55℃ 내지 약 60℃에서 약 15 내지 약 20분; 또는 혼성화 복합체가 0.1% SDS를 함유하는 것으로 염 농도가 약 2xSSC인 용액으로 실온에서 15분 동안 2회에 걸쳐 세척된 후, 0.1% SDS를 함유하는 0.1xSSC에 의해 68℃에서 15분 동안 2회에 걸쳐 세척되는 경우; 또는 이와 등가의 조건. SSC 완충액 및 등가의 조건에 관해 문헌 ([Sambrook, ed., MOLECULAR CLONING: A LABORATORY MANUAL (2ND ED.), vols. 1-3, Cold Spring Harbor Laboratory, (1989)]; [CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Ausubel, ed. John Wiley & Sons, Inc., New York (1997)]; [LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY: HYBRIDIZATION WITH NUCLEIC ACID PROBES, Part I. Theory and Nucleic Acid Preparation, Tijssen, ed. Elsevier, N.Y. (1993)])를 참조한다.

본 방법은 본 발명에 따른 핵산 및 그와 실질적으로 동일한 서열을 단리 또는 동정하는데에 사용될 수 있다. 예를 들면, 상기 방법들은, 본 발명에 서열 및 그와 실질적으로 동일한 서열 중 하나, 또는 적어도 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개, 150개, 200개, 300개, 400개 또는 500개의 연속된 염기를 포함하는 그의 단편, 및 그와 상보성인 서열로 구성된 군으로부터 선택되는 핵산 서열과의 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성(상동성)을 갖는 서열을 갖는 핵산을 단리 또는 동정하는데에 사용될 수 있다. 서열 동일성(상동성)은 정렬 알고리즘을 사용하여 측정될 수 있다. 예를 들면, 상동성 폴리뉴클레오티드는 본원에 기술된 코딩 서열 중 어느 하나의 천연적으로 발생된 대립 형질 변이체인 코딩 서열을 가질 수 있다. 그러한 대립 형질 변이체는 본 발명에 따른 핵산과 비교하였을 때, 하나 이상의 뉴클레오티드가 치환, 결실 또는 부가되어 있을 수 있다. 추가로, 상기 방법들은, 서열 정렬 알고리즘(예를 들어, 디폴트 매개 변수를 갖는 FASTA 버전 3.0t78 알고리즘)을 사용하여 측정된 바, 본 발명에 따른 폴리펩티드, 또는 적어도 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개 또는 150개의 연속 아미노산을 포함하는 그의 단편과의 적어도 약 99%, 95%, 적어도 90%, 적어도 85%, 적어도 80%, 적어도 75%, 적어도 70%, 적어도 65%, 적어도 60%, 적어도 55%, 또는 적어도 50%의 서열 동일성(상동성)을 갖는 폴리펩티드를 코딩하는 핵산을 단리하는데에 사용될 수 있다.

올리고뉴클레오티드 프로브 및 그를 사용하는 방법

본 발명은 또한 예를 들면, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 폴리펩티드를 코딩하는 핵산 또는 그의 단편을 동정, 증폭 또는 단리하거나, 또는 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 유전자를 동정하는데에 사용될 수 있는 핵산 프로브를 제공한다. 일부 실시태양에서, 상기 프로브는 본 발명에 따른 핵산을 이루는 약 10개 이상의 연속된 염기들을 포함한다. 별법으로, 본 발명에 따른 프로브는 본 발명에 따른 핵산에 제시된 연속된 염기 서열 약 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 30개, 35개, 40개, 45개, 50개, 60개, 70개, 80개, 90개, 100개, 110개, 120개, 130개, 150개, 또는 약 10개 내지 50개, 약 20개 내지 60개, 또는 약 30개 내지 70개 또는 그 이상일 수 있다. 상기 프로브는 결합 및/또는 혼성화에 의해 핵산을 동정한다. 이 프로브는 본 발명의 어레이(이하 논의된 부분 참조), 예를 들어, 모세관형 어레이에 사용될 수 있다. 본 발명에 따른 프로브는 또한 기타 핵산 또는 폴리펩티드를 단리하는데에도 사용될 수 있다.

본 발명에 따른 단리된 합성 또는 재조합 핵산, 그와 상보성인 서열 또는 본 발명에 따른 서열 중 하나의 적어도 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개, 150개, 200개, 300개, 400개, 또는 500개 또는 그 이상의 연속된 염기를 포함하는 그의 단편, 또는 그에 상보성인 서열도, 생물학적 샘플, 예를 들어, 토양 샘플이 본 발명에 따른 핵산 서열을 갖는 유기체, 또는 이 핵산을 얻을 수 있는 유기체를 함유하는지 여부를 결정하기 위한 프로브로서 사용될 수 있다. 이러한 방법에 있어서, 상기 핵산이 단리될 유기체를 보유할 가능성이 있는 생물학적 샘플을 수득할 수 있으며, 그 핵산은 상기 샘플로부터 수득할 수 있다. 상기 핵산은 그 핵산에 존재하는 서열과 상보성인 임의의 서열에 특이적으로 혼성화할 수 있는 조건하에서 프로브와 접촉된다.

필요할 경우, 프로브를 상보성 서열에 특이적으로 혼성화시킬 수 있는 조건은, 이 프로브를 상보성 서열을 함유하는 것으로 공지된 샘플로부터 유래하는 상보성 서열 및 상보성 서열을 함유하지 않는 대조군 서열과 접촉시킴으로써 결정될 수 있다. 혼성화 조건, 예로서, 혼성화 완충액의 염 농도, 혼성화 완충액의 포름아미드 농도, 또는 혼성화 온도는 이 프로브를 상보성 핵산에 특이적으로 혼성화시킬 수 있는 조건을 확인하기 위해 달라질 수 있다.

만일 샘플이 핵산이 단리된 유기체를 함유하면, 이 프로브의 특이적 혼성화가 검출된다. 혼성화는 프로브를 검출 가능한 제제, 예를 들어, 방사성 동위 원소, 형광 염료 또는 검출 가능한 산물의 형성을 촉진시킬 수 있는 효소로 표지화함으로써 검출될 수 있다.

샘플 중에 상보성 핵산이 존재하는지 여부를 검출하기 위해 표지화된 프로브를 사용하는 다수의 방법들은 당업자에게 잘 알려져 있다. 이러한 방법으로서는 써던 블럿, 노던 블럿, 콜로니 혼성화 방법 및 도트 블럿을 포함한다. 이러한 방법들 각각에 대한 프로토콜은 문헌 ([Ausubel et al Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (1997)] 및 [Sambrook et al, Molecular Cloning: A Laboratory Manual 2nd Ed., Cold Spring Harbor Laboratory Press (1989)])에 제공되어 있다.

별법으로, 1 초과의 프로브(핵산 샘플중에 존재하는 임의의 상보성 서열에 특이적으로 혼성화할 수 있는 프로브 중 하나 이상)는 증폭 반응에 사용될 수 있으며, 그 결과 이 샘플이 본 발명에 따른 핵산 서열을 함유하는 유기체(예를 들어, 핵산이 단리된 유기체)를 함유하는지 여부를 결정할 수 있다. 일부 실시태양에서, 프로브는 올리고뉴클레오티드를 포함한다. 일부 실시태양에서, 증폭 반응은 PCR 반응을 포함할 수 있다. PCR 프로토콜에 관하여는 문헌 [Ausubel and Sambrook, 상기 문헌]에 기술되어 있다. 별법으로, 증폭 반응으로서는 리가제 연쇄 반응, 3SR 또는 가닥 치환 반응을 포함할 수 있다. (문헌 ([Barany, F., "The Ligase Chain Reaction in a PCR World", PCR Methods and Applications 1:5-16, 1991]; [E. Fahy et al, "Self-sustained Sequence Replication (3SR): An Isothermal Transcription-based Amplification System Alternative to PCR", PCR Methods and Applications 1:25-33, 1991]; 및 [Walker G.T. et al, "Strand Displacement Amplification-an Isothermal in vitro DNA Amplification Technique", Nucleic Acid Research 20:1691-1696, 1992]) 참조). 그러한 방법에서, 샘플 중의 핵산은 프로브와 접촉하고, 증폭 반응이 진행되며, 그 결과 증폭 산물이 검출된다. 증폭 산물은 반응 산물에 대해서 겔 전기영동을 수행하고, 이 겔을 개입 제제, 예를 들어, 브롬화에티듐으로 염색함으로써 검출될 수 있다. 별법으로, 상기 프로브 중 하나 이상은 방사성 동위 원소로 표지화될 수 있으며, 방사성 증폭 반응 산물의 존부는 겔 전기영동 이후 방사선 촬영법에 의해 검출될 수 있다.

본 발명에 따른 서열 말단부에 인접하여 존재하는 서열로부터 유래된 프로브는 또한 염색체 워킹법에 사용되어, 본 발명에 따른 서열에 인접하여 위치하고 있는 게놈 서열을 함유하는 클론을 동정할 수 있다. 이러한 방법을 통하여, 숙주 유기체로부터 추가의 단백질을 코딩하는 유전자를 단리할 수 있다.

일부 실시태양에서, 본 발명에 따른 단리된 합성 또는 재조합 핵산, 그에 상보성인 서열, 또는 본 발명에 따른 서열 중 하나의 적어도 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개, 150개, 200개, 300개, 400개, 또는 500개 또는 그 이상의 연속된 염기 서열을 포함하는 그의 단편, 또는 그에 상보성인 서열은 프로브로서 사용되어, 관련된 핵산을 동정 및 단리할 수 있다. 일부 실시태양에서, 관련된 핵산은 핵산이 단리된 유기체 이외의 유기체로부터 유래하는 cDNA 또는 게놈 DNA일 수 있다. 예를 들면, 기타 유기체는 관련된 유기체일 수 있다. 그러한 방법에서, 핵산 샘플은 프로브가 관련 서열과 특이적으로 혼성화할 수 있는 조건하에서 이 프로브와 접촉된다. 이어서, 이 프로브와 관련 유기체로부터 유래하는 핵산의 혼성화 여부는 전술한 방법들 중 임의의 방법을 사용하여 검출된다.

검출 가능한 프로브에 혼성화하는 핵산, 예로서, cDNA 또는 게놈 DNA를 동정하는데에 사용된 혼성화 조건의 엄격도를 변화시킴으로써, 프로브에 대한 상동성 수준이 상이한 핵산은 동정 및 단리될 수 있다. 엄격도는 프로브의 용융 온도 이하의 다양한 온도에서 혼성화를 진행시킴으로써 달라질 수 있다. 용융 온도 T_m이란, (특정 이온 세기 및 pH 하에서) 표적 서열 중 50%가 완전히 상보성인 프로브에 혼성화하는 온도이다. 매우 엄격한 조건은 특정 프로브에 대한 T_m과 동일하거나, 또는 이보다 약 5℃ 낮은 온도로서 선택된다. 프로브의 용융 온도는 하기 공식을 사용하여 계산될 수 있다:

길이 14 내지 70 뉴클레오티드인 프로브에 있어서, 용융 온도(T_m)는 하기 식을 사용하여 계산된다: T_m = 81.5+16.6(log[Na+])+0.41(G+C 비율)-(600/N)(여기서, N은 프로브 길이이다).

만일 혼성화가 포름아미드를 함유하는 용액 중에서 실행되면, 용융 온도는 하기 등식을 사용하여 계산될 수 있다: T_m = 81.5+16.6(log [Na+])+0.41(G+C 비율)-(0.63% 포름아미드)-(600/N)(여기서, N은 프로브 길이이다).

예비 혼성화는 6xSSC, 5x덴하르트 시약, 0.5% SDS, 100㎍/ml의 변성 단편화 연어 정자 DNA 또는 6xSSC, 5x덴하르트 시약, 0.5% SDS, 100㎍/ml의 변성 단편화 연어 정자 DNA, 50% 포름아미드 중에서 수행될 수 있다. SSC와 덴하르트 용액에 대한 공식은 문헌 [Sambrook et al, 상기 문헌]에 개시되어 있다.

일부 실시태양에서, 혼성화는 상기 열거된 예비 혼성화 용액에 검출 가능한 프로브를 첨가함으로써 수행된다. 프로브가 이중 가닥 DNA를 포함하는 경우, 이 DNA는 혼성화 용액에 첨가되기 이전에 변성된다. 일부 실시태양에서, 상기 필터는 이 프로브가 그것과 상보성인 서열 또는 그의 상동성 서열을 함유하는 cDNA 또는 게놈 DNA에 혼성화되기에 충분한 시간 동안, 혼성화 용액과 접촉시킨다. 길이 200 뉴클레오티드 이상인 프로브에 있어서, 혼성화는 T_m 보다 낮은 15 내지 25℃에서 수행될 수 있다. 더욱 짧은 프로브 예를 들어, 올리고뉴클레오티드 프로브에 있어서, 혼성화는 T_m 보다 낮은 5 내지 10℃에서 수행될 수 있다. 일부 실시태양에서, 6xSSC에서의 혼성화의 경우, 혼성화는 대략 68℃에서 수행된다. 일반적으로, 50% 포름아미드 함유 용액에서의 혼성화의 경우, 혼성화는 대략 42℃에서 수행된다.

알돌라제 효소의 발현 저해

본 발명은 본 발명에 따른 핵산, 예로서, 알돌라제 효소 코딩 핵산, 예로서, 안티센스, siRNA, miRNA, 리보자임을 포함하는 핵산에 상보성인(예로서, 그에 대해 안티센스 서열인) 핵산을 제공한다. 안티센스 서열을 포함하는 본 발명에 따른 핵산은 알돌라제 효소 코딩 유전자의 수송, 스플라이싱 또는 전사를 저해할 수 있다. 이러한 저해는 게놈 DNA 또는 메신저 RNA를 표적화함으로써 실현될 수 있다. 표적화된 핵산의 전사 또는 기능은 예를 들어, 혼성화 및/또는 절단에 의해 저해될 수 있다. 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소의 생산 또는 작용을 방지하거나 저해하는 경우 중 어느 하나의 경우에, 본 발명에 의해 제공되는 저해제의 대표적인 한 세트로서는 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 유전자 또는 메세지 중 어느 하나와 결합할 수 있는 올리고뉴클레오티드를 포함한다. 결합은 서열 특이적 혼성화를 통하여 이루어질 수 있다. 또다른 유용한 저해제 부류로서는 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 메세지를 불활성화시키거나 또는 절단할 수 있는 올리고뉴클레오티드를 포함한다. 상기 올리고뉴클레오티드는 이러한 절단을 유도하는 효소 활성, 예를 들어, 리보자임 효소 활성을 가질 수 있다. 상기 올리고뉴클레오티드는 상보성 핵산을 절단할 수 있는 조성물 또는 효소에 접합될 수 있거나 또는 화학적으로 변형될 수 있다. 다수의 상이한 올리고뉴클레오티드 풀은 원하는 활성을 갖는 올리고뉴클레오티드에 대해 스크리닝될 수 있다. 따라서, 본 발명은 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소의 발현을 핵산 및/또는 단백질 수준으로 저해하기 위한, 다양한 조성물, 예로서, 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 서열을 포함하는 안티센스, siRNA, miRNA 및 리보자임 및 본 발명에 따른 항-알돌라제, 예로서, 항-피루베이트 알돌라제, 예로서, 항-HMG 및/또는 항-KHG 알돌라제 항체를 제공한다.

알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 발현의 저해는 다양한 산업 분야에서 사용될 수 있다. 예를 들면, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 발현을 저해하면, 부패 속도를 늦추거나 또는 부패를 방지할 수 있다. 일부 실시태양에서, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소의 발현 및/또는 활성을 저해하는 본 발명의 조성물을 사용함에 있어서 예를 들어, 항체, 안티센스 올리고뉴클레오티드, 리보자임, siRNA 및 miRNA는 부패의 속도를 늦추거나 또는 부패를 방지하는데 사용된다. 따라서, 일부 실시태양에서, 본 발명은 식물 또는 식물의 산물(예를 들어, 시리얼, 알곡, 과실, 종자, 뿌리 및 잎 등)에 본 발명에 따른 항체, 안티센스 올리고뉴클레오티드, 리보자임, siRNA 및 miRNA를 가하여 부패의 속도를 늦추거나 또는 부패를 방지하는 단계를 포함하는 방법과, 본 발명에 따른 항체, 안티센스 올리고뉴클레오티드, 리보자임, siRNA 및 mRNA를 포함하는 부패 지연 또는 방지용 조성물을 제공한다. 이러한 조성물은 또한 식물(예를 들어, 트랜스제닉 식물) 또는 또다른 유기체(예를 들어, 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 유전자로 형질전환된 박테리아 또는 기타 미생물)에 의해 발현될 수 있다.

알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소의 발현을 저해하기 위한 본 발명에 따른 조성물(예를 들어, 안티센스, iRNA, 리보자임 및 항체)은 약제학적 조성물, 예로서, 항-병원체 제제로서 사용될 수 있거나, 또는 기타 치료법, 예를 들어, 살모넬라(Salmonella)에 대한 항-미생물 제제로서 사용될 수도 있다.

안티센스 올리고뉴클레오티드

본 발명은 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 메세지와 결합할 수 있는 안티센스 올리고뉴클레오티드를 제공하는데, 일부 실시태양에서, 이 올리고뉴클레오티드는 mRNA를 표적함으로써 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 저해할 수 있다. 안티센스 올리고뉴클레오티드를 디자인하는 전략법에 관하여는 과학 논문 및 특허 문헌에 잘 기재되어 있으며, 당업자는 본 발명에 따른 신규 시약을 사용하여 그러한 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 올리고뉴클레오티드를 디자인할 수 있다. 예를 들어, 유효한 안티센스 올리고뉴클레오티드에 대해 스크리닝하기 위한 유전자 워킹/RNA 지도화 프로토콜에 관하여는 당업계에 잘 알려져 있으며, 예를 들어, 유력한 안티센스 서열을 선택할 수 있는 용이하고도 신뢰성이 있는 방법을 제공하기 위해 표준 분자 기법을 바탕으로 하는, RNA 지도화 분석법에 관하여 기재되어 있는 문헌 [Ho (2000) Methods Enzymol. 314:168-183]을 참조한다. 또한 문헌 [Smith (2000) Eur. J. Pharm. Sci. 11 :191-198]도 참조한다.

천연적으로 발생된 핵산은 안티센스 올리고뉴클레오티드로서 사용된다. 안티센스 올리고뉴클레오티드는 임의의 길이를 가질 수 있는데; 예를 들어, 다른 실시태양에서, 상기 안티센스 올리고뉴클레오티드의 길이는 약 5 내지 100, 약 10 내지 80, 약 15 내지 60 및 약 18 내지 40 잔기일 수 있다. 최적의 길이는 통상의 스크리닝법에 의해 결정될 수 있다. 상기 안티센스 올리고뉴클레오티드는 임의의 농도로 존재할 수 있다. 최적 농도는 통상의 스크리닝법에 의해 결정될 수 있다. 이러한 잠재적인 문제점을 안고 있는 매우 다양한 합성, 비천연적으로 발생된 뉴클레오티드 및 핵산 유사체가 공지되어 있다. 예를 들어, 비-이온성 골격을 포함하는 펩티드 핵산(PNA) 예를 들어, N-(아미노에틸)글리신 단위가 사용될 수 있다. (WO 97/03211; WO 96/39154; 문헌 [Mata (1997) Toxicol Appl Pharmacol 144:189-197]; [Antisense Therapeutics, ed. Agrawal (Humana Press, Totowa, N.J., 1996])에 기재되어 있는 바와 같이, 포스포로티오에이트 결합을 갖는 안티센스 올리고뉴클레오티드도 사용될 수 있다. 본 발명에 의해 제공되는 합성 DNA 골격의 유사체를 갖는 안티센스 올리고뉴클레오티드는 또한, 상기 기술한 바와 같은 포스포로-디티오에이트, 메틸포스포네이트, 포스포라미데이트, 알킬 포스포트리에스테르, 설파메이트, 3'-티오아세탈, 메틸렌(메틸이미노), 3'-N-카바메이트 및 모르폴리노 카바메이트 핵산을 포함할 수도 있다.

임의의 표적, 예를 들어, 본 발명에 따른 센스 및 안티센스 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 서열에 대한 적절한 결합 친화성과 특이성을 갖는 특정 올리고뉴클레오티드에 대하여 신속하게 스크리닝할 수 있는 조합적인 화학적 방법을 사용하여 막대한 수의 올리고뉴클레오티드를 합성할 수 있다(문헌 [Gold (1995) J. of Biol. Chem. 270:13581-13584] 참조).

저해 리보자임

본 발명은 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 메세지와 결합할 수 있는 리보자임을 제공한다. 이들 리보자임은 예를 들어, mRNA를 표적화함으로써 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 저해할 수 있다. 리보자임을 디자인하고, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소-특이적 안티센스 표적화용 서열을 선별하는 전략법은 과학 논문 및 특허 문헌에 잘 알려져 있고, 당업자는 본 발명에 따른 신규 시약을 사용하여 그러한 리보자임을 디자인할 수 있다. 리보자임은 표적 RNA를 절단하는 RNA의 효소 부위에 매우 인접하게 존재하는 리보자임의 표적 RNA 결합 부분을 통하여, 표적 RNA와 결합함으로써 작용을 한다. 따라서, 리보자임은 상보성 염기 쌍 형성 과정을 통하여 표적 RNA를 인지하고 그에 결합하며, 일단 올바른 위치에 결합하면, 효소적으로 작용하여 상기 표적 RNA를 절단해서 이를 불활성화시킨다. 이러한 방식으로 표적 RNA를 절단하면, 코딩 서열이 절단될 경우 이 표적 RNA가 코딩된 단백질의 합성을 유도하는 능력이 파괴될 것이다. 리보자임이 그것의 RNA 표적에 결합하여 이를 절단한 후에는, 이 리보자임은 그 RNA로부터 유리되어 새로운 표적에 다시 결합하여 이를 절단할 수 있다.

몇몇 경우, 치료적 처치를 실시하는데에 필요한 리보자임의 유효 농도가 안티센스 올리고뉴클레오티드의 유효 농도보다 낮을 수 있는바, 리보자임의 효소적 성질은 다른 기술, 예로서, 안티센스 기술(핵산 분자를 단순히 핵산 표적에 결합시켜 그의 전사, 번역 또는 또다른 분자와의 결합을 차단시키는 것)에 비해 유리할 수 있다. 이러한 잠재적인 잇점은 효소적으로 작용할 수 있는 리보자임의 능력을 반영한다. 따라서, 단일의 리보자임 분자는 다수의 표적 RNA 분자들을 절단할 수 있다. 일부 실시태양에서, 리보자임은 매우 특이적인 저해제로서, 그의 저해 특이성은 염기 쌍 형성 결합 기작에 따라서 달라질 뿐만 아니라, 이 리보자임 분자와 결합하는 RNA의 발현을 저해하는 기작에 따라서도 달라진다. 즉, 저해는 RNA 표적을 절단함으로써 유발되므로, 특이성은 비-표적화된 RNA의 절단 속도에 대한 표적화된 RNA의 절단 속도의 비율로서 정의된다. 이러한 절단 기작은 염기 쌍 형성에 관여하는 인자 이외의 인자들에 따라 달라진다. 따라서, 리보자임의 작용 특이성은 동일한 RNA 부위에 안티센스 올리고뉴클레오티드가 결합하는 특이성보다 더욱 클 수 있다.

본 발명에 따른 리보자임 예를 들어, 효소적 리보자임 RNA 분자는 해머헤드 모티프(hammerhead motif), 헤어핀 모티프, 간염 델타 바이러스 모티프, 제I군 인트론 모티프 및/또는 RN아제P-유사 RNA의 형태로서, RNA 가이드 서열과 함께 생성될 수 있다. 해머헤드 모티프의 예는 예를 들어, 문헌 [Rossi (1992) Aids Research and Human Retroviruses 8:183]에 기재되어 있고; 헤어핀 모티프의 예는 예를 들어, 문헌 ([Hampel (1989) Biochemistry 28:4929], 및 [Hampel (1990) Nuc. Acids Res. 18:299])에 기재되어 있고; 간염 델타 바이러스 모티프의 예는 예를 들어, 문헌 [Perrotta (1992) Biochemistry 31:16]에 기재되어 있고; RN아제P 모티프의 예는 예를 들어, 문헌 [Guerrier-Takada (1983) Cell 35:849]에 기재되어 있으며; 제I군 인트론의 예는 예를 들어, 미국 특허 번호 제4,987,071호(Cech)에 기재되어 있다. 이러한 특정 모티프에 관한 열거는 제한하고자 하는 것은 아니다. 당업자는 본 발명에 따른 리보자임, 예를 들어, 본 발명의 효소적 RNA 분자는 표적 유전자 RNA 영역 중 하나 이상의 영역과 상보성인 특이적 기질 결합 부위를 가질 수 있다는것을 이해할 것이다. 본 발명에 따른 리보자임은 RNA 절단 활성을 사익 리보자임에 부여하는 기질 결합 부위 내에 또는 그의 주변에 존재하는 뉴클레오티드 서열을 가질 수 있다.

RNA 간섭(RNAi: RNA interference)

일부 실시태양에서, 본 발명은 RNA 저해 분자, 즉, 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 서열을 포함하는 "RNAi" 분자를 제공한다. 상기 RNAi 분자는 이중 가닥 RNA (dsRNA) 분자, 예를 들어, siRNA, miRNA 및/또는 짧은 헤어핀(shRNA: short hairpin RNA) 분자를 포함할 수 있다. 상기 RNAi 분자 예를 들어, siRNA(작은 저해 RNA: small inhibitory RNA) 및/또는 miRNA(마이크로 RNA)는 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 유전자의 발현을 저해할 수 있다. 일부 실시태양에서, 상기 RNAi 분자, 예를 들어, siRNA 및/또는 miRNA는 그 길이가 약 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개 또는 그 이상인 이중체 뉴클레오티드이다. 본 발명은 어떠한 특정 작용 기작에 의해서도 제한되지 않지만, 상기 RNAi는 세포에 도입되어, 유사하거나 동일한 서열 예를 들어, 내인성 mRNA의 단일 가닥 RNA(ssRNA: single-stranded RNA)의 분해를 유도할 수 있다. 세포가 이중 가닥 RNA (dsRNA)에 노출될 때, 상동성 유전자로부터 유래하는 mRNA는 RNA 간섭(RNAi)이라고 불리는 과정에 의해 선택적으로 분해된다. RNAi 뒤에 숨겨져 있을 수 있는 기본적인 기작은 특이적 유전자 서열과 매치되는 이중 가닥 RNA (dsRNA)를, 특정 유전자 서열과 매치되는 mRNA의 분해를 촉진시키는 짧은 간섭 RNA라 불리는 짧은 조각들로 분해하는 것이다. 일부 실시태양에서, 본 발명에 따른 RNAi는 유전자-침묵 치료제에 사용될 수 있다(문헌 [Shuey (2002) Drug Discov. Today 7: 1040-1046] 참조). 일부 실시태양에서, 본 발명은 본 발명에 따른 RNAi 분자, 예를 들어, siRNA 및/또는 miRNA를 사용하여 RNA를 선택적으로 분해하는 방법을 제공한다. 본 방법은 시험관내, 생체외 또는 생체내에서 실시될 수 있다. 일부 실시태양에서, 본 발명에 따른 RNAi 분자는 세포, 기관 또는 동물 내에서 기능 상실 돌연변이를 유발시키는데에 사용될 수 있다.

하나의 측면에서, RNAi의 세포내 도입은 흡착된 RNAi(예로서, 마이크로RNA)를 포함하는 RNA 결합 단백질에 결합된 표적 세포 특이 리간드의 내재화에 의해 이루어진다. 리간드는 독특한 표적 세포 표면 항원에 특이적이다. 리간드는 세포 표면 항원에 결합한 후 자발적으로 내재화될 수 있다. 독특한 표적 세포 표면 항원이 그의 리간드에 결합한 후에 천연적으로 내재화되지 않을 경우, 내재화는 아르기닌이 풍부한 펩티드, 또는 기타 막 투과성 펩티드를 리간드 또는 RNA 결합 단백질 구조 내로 혼입시키거나, 상기 펩티드를 리간드 또는 RNA 결합 단백질와 결합시킴으로써 촉진시킬 수 있다. 미국 특허 출원 공개 번호 제20060030003호; 제20060025361호; 제20060019286호; 제20060019258호를 참조한다. 하나의 측면에서, 본 발명은 RNAi 분자를 포함하는 핵산-지질 입자로서 본 발명에 따른 핵산을 세포로 전달, 예로서, 도입시키기 위한 지질-기재 제제를 제공한다(예로서, 미국 특허 출원 공개 번호 제20060008910호를 참조한다).

핵산의 변형 - 본 발명의 변이체 효소의 제조

본 발명은 본 발명에 따른 핵산 변이체, 예를 들어, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 코딩하는 핵산 변이체를 생산하는 방법을 제공한다. 이러한 방법은 주형 핵산에 의해 코딩되는, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소로부터 변경되었거나 그와 상이한 활성, 또는 그로부터 변경되었거나 그와 상이한 안정성을 갖는 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 생산하기 위하여, 반복 수행될 수 있거나, 또는 다양하게 조합되어 사용될 수 있다. 이러한 방법은 또한 예를 들어, 유전자/메세지 발현, 메세지 번역 또는 메세지 안정성을 변화시키기 위하여, 반복 수행될 수 있거나, 또는 다양하게 조합되어 사용될 수 있다. 다른 실시태양에서, 세포의 유전자 조성은 예를 들어, 상동성 유전자를 세포외에서 변형시킨 후, 이를 세포에 재삽입함으로써 변경될 수 있다.

본 발명에 따른 핵산은 임의의 수단에 의해 변경될 수 있다. 예를 들어, 무작위 방법 또는 확률에 의한 방법, 또는 확률에 의하지 않는 방법 또는 "유도 진화" 방법에 관하여는 예를 들어, 미국 특허 번호 제6,361,974호를 참조한다. 유전자를 무작위로 돌연변이시키는 방법은 당업계에 잘 알려져 있다(미국 특허 번호 제5,830,696호 참조). 예를 들어, 돌연변이원은 유전자를 무작위로 돌연변이시키는데에 사용될 수 있다. 돌연변이원으로서는 예를 들어, 자외 광선 또는 감마 복사선, 또는 화학적 돌연변이원, 예를 들어, 미토마이신, 아질산, 광활성화 소라렌을 포함하며, 이들 물질을 단독으로 투여하거나 또는 조합하여 투여함으로써 재조합에 의해 수복될 수 있는 DNA 파괴를 유도한다. 기타 화학적 돌연변이원으로서는 예를 들어, 중아황산나트륨, 아질산, 하이드록실아민, 히드라진 또는 포름산을 포함한다. 기타 돌연변이원으로서는 뉴클레오티드 전구체의 유사체 예를 들어, 니트로소구아니딘, 5-브로모우라실, 2-아미노퓨린 또는 아크리딘이 있다. 상기 제제는 뉴클레오티드 전구체 대신 PCR 반응에 첨가될 수 있으며, 이로써 서열을 돌연변이시킬 수 있게 된다. 개입제, 예를 들어, 프로플라빈, 아크리플라빈 및 퀴나크린 등도 사용될 수 있다.

분자 생물학 분야의 임의의 기법 예를 들어, 무작위 PCR 돌연변이 유발법(문헌 [Rice (1992) Proc. Natl. Acad. Sci. USA 89:5467-5471] 참조); 또는 조합형 다중 카세트 돌연변이 유발법(문헌 [Crameri (1995) Biotechniques 18:194-196] 참조)이 사용될 수 있다. 별법으로, 핵산 예를 들어, 유전자는 무작위, 또는 "확률에 의한" 단편화 이후에 재조립될 수 있다(미국 특허 번호 제6,291,242호; 제6,287,862호; 제6,287,861호; 제5,955,358호; 제5,830,721호; 제5,824,514호; 제5,811,238호; 제5,605,793호를 참조). 다른 실시태양에서, 변형, 부가 또는 결실은 오류 빈발 PCR, 셔플링, 올리고뉴클레오티드 지정 돌연변이 유발법, 조립 PCR, 유성 PCR 돌연변이 유발법, 생체내 돌연변이 유발법, 카세트 돌연변이 유발법, 반복적 앙상블 돌연변이 유발법, 지수적 앙상블 돌연변이 유발법, 위치 특이적 돌연변이 유발법, 유전자 재조립법(예로서, 진리어셈블리(GeneReassembly, 미국 특허 번호 제6,537,776호 참조), 유전자 위치 포화 돌연변이 유발법(GSSM), 합성 결찰 재조립법(SLR), 재조합법, 반복적 서열 재조합법, 포스포티오에이트 변형 DNA 돌연변이 유발법, 우라실 함유 주형 돌연변이 유발법, 갭 형성 이중체 돌연변이 유발법, 점 미스매치 수복 돌연변이 유발법, 수복 결함 숙주 균주 돌연변이 유발법, 화학적 돌연변이 유발법, 방사능에 의한 돌연변이 유발법, 결실 돌연변이 유발법, 제한 선별 돌연변이 유발법, 제한 정제 돌연변이 유발법, 인공 유전자 합성법, 앙상블 돌연변이 유발법, 키메라 핵산 다량체 생성법, 염색체 포화 돌연변이 유발법(CSM) 및/또는 이들 방법과 기타 방법의 조합법을 포함하는 방법에 의해 도입된다.

하기 문헌들에는 다양한 반복적 재조합법 및/또는 본 발명에 따른 방법에 도입될 수 있는 방법에 관하여 기술되어 있다: 문헌 [Minshull (1999) "Protein evolution by molecular breeding" Current Opinion in Chemical Biology 3:284-290]; [Christians (1999) "Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shuffling" Nature Biotechnology 17:259-264]; [Crameri (1998) "DNA shuffling of a family of genes from diverse species accelerates directed evolution" Nature 391:288-291]; [Crameri (1997) "Molecular evolution of an arsenate detoxification pathway by DNA shuffling," Nature Biotechnology 15:436-438]; [Zhang (1997) "Directed evolution of an effective fucosidase from a galactosidase by DNA shuffling and screening" Proc. Natl. Acad. Sci. USA 94:4504-4509]; [Patten et al. (1997) "Application of DNA Shuffling to Pharmaceuticals and Vaccines" Current Opinion in Biotechnology 8:724-733]; [Crameri et al. (1996) "Construction and evolution of antibody-phage libraries by DNA shuffling" Nature Medicine 2:100-103]; [Gates et al. (1996) "Affinity selective isolation of ligands from peptide libraries through display on a lac repressor "headpiece dimer" Journal of Molecular Biology 255:373-386]; [Stemmer (1996) "Sexual PCR and Assembly PCR" In: The Encyclopedia of Molecular Biology. VCH Publishers, New York, pp.447-457]; [Crameri and Stemmer (1995) "Combinatorial multiple cassette mutagenesis creates all the permutation of mutant and wildtype cassettes" BioTechniques 18:194-195]; [Stemmer et al. (1995) "Single-step assembly of a gene and entire plasmid form large numbers of Oligodeoxyribonucleotides" Gene, 164:49-53]; [Stemmer (1995) "The Evolution of Molecular Computation" Science 270: 1510]; [Stemmer (1995) "Searching Sequence Space" Bio/Technology 13:549-553]; [Stemmer (1994) "Rapid evolution of a protein in vitro by DNA shuffling" Nature 370:389-391]; 및 [Stemmer (1994) "DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution." Pioc. Natl. Acad. Sci. USA 91:10747-10751]) 참조).

다양성을 유발시키는 돌연변이 방법으로서는 예를 들어, 돌연변이 유발법(문헌 ([Ling et al. (1997) "Approaches to DNA mutagenesis: an overview" Anal Biochem. 254(2): 157-178]; [Dale et al. (1996) "Oligonucleotide-directed random mutagenesis using the phosphorothioate method" Methods Mol. Biol. 57:369-374]; [Smith (1985) "In vitro mutagenesis" Ann. Rev. Genet. 19:423-462]; [Botstein & Shortle (1985) "Strategies and Application of in vitro mutagenesis" Science 229:1193-1201]; [Carter (1986) "Site-directed mutagenesis" Biochem. J. 237:1-7]; 및 [Kunkel (1987) "The efficiency of Oligonucleotide directed mutagenesis" in Nucleic Acids & Molecular Biology (Eckstein, F. and Lilley, D. M. J. eds., Springer Verlag, Berlin)])); 우라실 함유 주형을 사용하는 돌연변이 유발법(문헌 ([[Kunkel (1985) "Rapid and efficient site-specific mutagenesis without phenotypic selection" Proc. Natl. Acad. Sci. USA 82:488-492]; [Kunkel et al. (1987) "Rapid and efficient site-specific mutagenesis without phenotypic selection" Methods in Enzymol. 154, 367-382]; 및 [Bass et al. (1988) "Mutant Trp repressors with new DNA-binding specificities" Science 242:240-245])); 올리고뉴클레오티드 지정 돌연변이 유발법(문헌 [Methods in Enzymol. 100: 468-500 (1983)]; [Methods in Enzymol. 154: 329-350 (1987)]; [Zoller (1982) "Oligonucleotide-directed mutagenesis using M13-derived vectors: an efficient and general procedure for the production of point mutation in any DNA fragment" Nucleic Acids Res. 10:6487-6500]; [Zoller & Smith (1983) "Oligonucleotide-directed mutagenesis of DNA fragments Cloned into M13 vectors" Methods in Enzymol. 100:468-500]; 및 [Zoller (1987) Oligonucleotide-directed mutagenesis: a simple method using two Oligonucleotide primers and single-stranded DNA template" Methods in Enzymol. 154:329-350)])); 포스포로티오에이트 변형 DNA 돌연변이 유발법(문헌 ([(Taylor (1985) "The use of phosphorothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA" Nucl. Acids Res. 13: 8749-8764]; [Taylor (1985) "The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA" Nucl. Acids Res. 13: 8765-8787 (1985)]; [Nakamaye (1986) "Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide-directed mutagenesis" Nucl. Acids Res. 14: 9679-9698]; [Sayers (1988) "Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis" Nucl. Acids Res. 16:791-802]; 및 [Sayers et al. (1988) "Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide" Nucl. Acids Res. 16: 803-814])); 갭 형성 이중체 DNA를 사용하는 돌연변이 유발법(문헌 ([Kramer et al. (1984) "The gapped duplex DNA approach to oligonucleotide-directed mutation construction" Nucl. Acids Res. 12: 9441-9456]; [Kramer & Fritz (1987) Methods in Enzymol. "Oligonucleotide-directed construction of mutations via gapped duplex DNA" 154:350-367]; [Kramer (1988) "Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction of mutations" Nucl. Acids Res. 16: 7207]; 및 [Fritz (1988) "Oligonucleotide-directed construction of mutations: a gapped duplex DNA procedure without enzymatic reactions in vitro" Nucl. Acids Res. 16: 6987-6999])을 포함한다.

본 발명을 실시하는데에 사용될 수 있는 부가적인 방법으로서는 점 미스매치 수복(문헌 [Kramer (1984) "Point Mismatch Repair" Cell 38:879-887]), 수복 결함 숙주 균주을 사용하는 돌연변이 유발법(문헌 ([Carter et al. (1985) "Improved oligonucleotide site-directed mutagenesis using M13 vectors" Nucl. Acids Res. 13: 4431-4443]; 및 [Carter (1987) "Improved oligonucleotide-directed mutagenesis using M13 vectors" Methods in Enzymol. 154: 382-403]), 결실 돌연변이 유발법(문헌 [Eghtedarzadeh (1986) "Use of oligonucleotides to generate large deletions" Nucl. Acids Res. 14: 5115]), 제한 선별법 및 제한 정제법(문헌 [Wells et al. (1986) "Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin" Phil. Trans. R. Soc. Lond. A 317: 415-423]), 전체 유전자 합성에 의한 돌연변이 유발법(문헌 ([Nambiar et al. (1984) "Total synthesis and cloning of a gene coding for the ribonuclease S protein" Science 223: 1299-1301]; [Sakamar and Khorana (1988) "Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein (transducin)" Nucl. Acids Res. 14: 6361-6372]; [Wells et al. (1985) "Cassette mutagenesis: an efficient method for generation of multiple mutations at defined sites" Gene 34:315-323]; 및 [Grundstrom et al. (1985) "Oligonucleotide-directed mutagenesis by microscale "shot-gun" gene synthesis" Nucl. Acids Res. 13: 3305-3316])), 이중 가닥 파괴 수복법(문헌 [Mandecki (1986); Arnold (1993) "Protein engineering for unusual environments" Current Opinion in Biotechnology 4:450-455. "Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli: a method for site-specific mutagenesis" Proc. Natl. Acad. Sci. USA, 83:7177-7181])을 포함한다. 전술한 방법에 관한 부가적인 설명은, 다양한 돌연변이 유발법에서 일어날 수 있는 문제점들을 해결하는 유용한 제어 방법에 관하여 기술되어 있는 문헌 [Methods in Enzymology Volume 154]에서 살펴볼 수 있다.

본 발명의 실시에 사용될 수 있는 프로토콜은 예로서, 미국 특허 번호 제5,605,793호(Stemmer)(1997년 2월 25일)("Methods for In Vitro Recombination"); 미국 특허 번호 제5,811,238호(Stemmer et al.)(1998년 9월 22일)("Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination"); 미국 특허 번호 제5,830,721호(Stemmer et al.)(1998년 11월 3일)("DNA Mutagenesis by Random Fragmentation and Reassembly"); 미국 특허 번호 제5,834,252호(Stemmer et al.)(1998년 11월 10일)("End-Complementary Polymerase Reaction"); 미국 특허 번호 제5,837,458호(Minshull, et al.)(1998년 11월 17일)("Methods and Compositions for Cellular and Metabolic Engineering"); WO 95/22625(Stemmer and Crameri)("Mutagenesis by Random Fragmentation and Reassembly"); WO 96/33207(Stemmer and Lipschutz)("End Complementary Polymerase Chain Reaction"); WO 97/20078( Stemmer and Crameri)("Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination"); WO 97/35966( Minshull and Stemmer)("Methods and Compositions for Cellular and Metabolic Engineering"); WO 99/41402(Punnonen et al.)("Targeting of Genetic Vaccine Vectors"); WO 99/41383(Punnonen et al.)("Antigen Library Immunization"); WO 99/41369(Punnonen et al.)("Genetic Vaccine Vector Engineering"); WO 99/41368(Punnonen et al.)("Optimization of Immunomodulatory Properties of Genetic Vaccines"); EP 752008(Stemmer and Crameri)("DNA Mutagenesis by Random Fragmentation and Reassembly"); EP 0932670(Stemmer)("Evolving Cellular DNA Uptake by Recursive Sequence Recombination"); WO 99/23107(Stemmer et al.)("Modification of Virus Tropism and Host Range by Viral Genome Shuffling"); WO 99/21979(Apt et al.,)("Human Papillomavirus Vectors"); WO 98/31837(del Cardayre et al.)("Evolution of Whole Cells and Organisms by Recursive Sequence Recombination"); WO 98/27230(Patten and Stemmer)("Methods and Compositions for Polypeptide Engineering"); WO 98/27230(Stemmer et al.)( "Methods for Optimization of Gene Therapy by Recursive Sequence Shuffling and Selection"), WO 00/00632("Methods for Generating Highly Diverse Libraries"), WO 00/09679("Methods for Obtaining in Vitro Recombined Polynucleotide Sequence Banks and Resulting Sequences") WO 98/42832(Arnold et al.)("Recombination of Polynucleotide Sequences Using Random or Defined Primers"), WO 99/29902(Arnold et al)("Method for Creating Polynucleotide and Polypeptide Sequences"),WO 98/41653(Vind)("An in Vitro Method for Construction of a DNA Library"), WO 98/41622(Borchert et al.)("Method for Constructing a Library Using DNA Shuffling") 및 WO 98/42727(Pati and Zarling)("Sequence Alterations using Homologous Recombination")에 기재되어 있다.

본 발명을 실시하는데 사용될 수 있는 방법(다수의 다양성 유발 방법에 관한 상세한 설명을 제공함)에 관하여는, 예로서, 1999년 9월 28일 출원된 미국 특허 출원 시리얼 번호 (USSN) 09/407,800(Patten et al.)("SHUFFLING OF CODON ALTERED GENES"); 미국 특허 출원 번호 제6,379,964호("EVOLUTION OF WHOLE CELLS AND ORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION"); 미국 특허 출원 번호 제6,319,714호; 제6,368,861호; 제6,376,246호; 제6,423,542호; 제6,426,224호 및 PCT/USOO/01203(Crameri et al.)("OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION"); 미국 특허 출원 번호 제6,436,675호(Welch et al.)("USE OF CODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETIC SHUFFLING"); 2000년 1월 18일 출원된 PCT/USOO/01202(Selifonov et al.)("METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS") 및 예로서, 2000년 1월 18일 출원된 미국 시리얼 번호 제09/618,579호(Selifonov et al.)("METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS"); 2000년 1월 18일 출원된 PCT/USOO/01138(Selifonov and Stemmer)("METHODS OF POPULATING DATA STRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS"); 및 2000년 9월 6일 출원된 미국 시리얼 번호 제09/656,549호(Affholter)("SINGLE-STRANDED NUCLEIC ACID TEMPLATE-MEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENT ISOLATION"); 및 미국 특허 번호 제6,177,263호; 제6,153,410호에 기재되어 있다.

"확률에 의하지 않는" 즉, "유도 진화" 방법으로서는 예를 들어, 포화 돌연변이 유발법 예를 들어, 유전자 위치 포화 돌연변이 유발법(GSSM), 합성 결찰 재조립법(SLR) 또는 이들 방법의 조합법을 포함하며, 상기 방법에 의해서 본 발명의 핵산을 변형시켜, 신규의 특성 또는 변형된 특성(예를 들어, 고도로 산성 또는 알칼리성인 조건하, 및 고온 또는 저온에서의 활성)을 갖는 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 생성한다. 변형된 핵산에 의해 코딩되는 폴리펩티드는, 탄소-탄소 결합 형성 또는 절단 또는 기타 활성에 대해 시험하기에 앞서서, 활성에 대해 스크리닝될 수 있다. 임의의 시험 방식 또는 방법은 예를 들어, 모세관 어레이 플랫폼을 사용하여 실시될 수 있다. 예를 들어, 미국 특허 제6,361,974호; 제6,280,926호; 및 제5,939,250호를 참조한다.

유전자 위치 포화 돌연변이 유발법, 또는 GSSM

본 발명은 또한 본원 및 미국 특허 번호 제6,171,820호 및 제6,579,258호에 기술된 바와 같이, 유전자 위치 포화 돌연변이 유발법 또는 GSSM을 사용하여 효소를 제조하는 방법을 제공한다. 일부 실시태양에서, 축퇴성 N,N,G/T 서열을 함유하는 코돈 프라이머는 점 돌연변이를 본 발명에 따른 폴리뉴클레오티드 예로서, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 또는 핵산에 도입하여, 단일 아미노산 치환부의 전체 영역이 각각의 아미노산 위치 예를 들어, 변형되도록 표적화된 리간드 결합 부위 또는 효소 활성 부위내 아미노산 잔기에 나타내어지는 한 세트의 자손 폴리펩티드를 생산하는데에 사용된다. 이러한 올리고뉴클레오티드는 연속적인 제1의 상동성 서열, 축퇴성 N,N,G/T 서열을 포함할 수 있으며, 경우에 따라, 제2의 상동성 서열을 포함할 수 있다. 이러한 올리고뉴클레오티드를 사용하여 생성된 하류의 자손 번역 산물은 폴리펩티드를 따라서 존재하는 각각의 아미노산 부위에 일어날 수 있는 모든 아미노산 변이를 포함하는데, 그 이유는 축퇴성 N,N,G/T 서열이 20개 아미노산 전부에 대한 코돈을 포함하기 때문일 것이다. 일부 실시태양에서, 이와 같이(예를 들어, 하나의 축퇴성 N,N,G/T 카세트로 구성된) 축퇴성 올리고뉴클레오티드 중 어느 하나는 모체 폴리뉴클레오티드 주형 중에 존재하는 각각의 원래의 코돈을 전 범위에 걸쳐 코돈 치환시키는데에 사용된다. 다른 실시태양에서, 2개 이상의 축퇴성 카세트를 사용하는데, 이때 상기 카세트 중 어느 하나는 동일한 올리고뉴클레오티드 또는 동일하지 않은 올리고뉴클레오티드 내에서 모체 폴리뉴클레오티드 주형 중 2개 이상의 원래의 코돈이 전 범위에 걸쳐 코돈 치환시키는데에 사용된다. 예를 들어, 1 초과의 N,N,G/T 서열은 하나의 올리고뉴클레오티드 중에 포함되며, 그 결과 1 초과의 부위에 아미노산 돌연변이를 도입할 수 있게 된다. 이와 같은 N,N,G/T 서열의 다수성은 직접적으로 연속되어 나타날 수 있거나, 또는 하나 이상의 추가의 뉴클레오티드 서열(들)에 의해 분리되어 나타날 수도 있다. 다른 실시태양에서, 부가 및 결실을 도입하는데에 유용한 올리고뉴클레오티드는 단독으로 사용될 수 있거나, 또는 N,N,G/T 서열을 포함하는 코돈과 함께 사용되어, 아미노산 부가, 결실 및/또는 치환을 경우에 따라, 조합하여 도입하거나 순열(permutation) 방식으로 도입할 수 있다.

일부 실시태양에서, 연속적인 N,N,G/T 삼중 코돈 즉, 축퇴성(N,N,G/T)n 서열을 함유하는 올리고뉴클레오티드를 사용하여 2개 이상의 연속된 아미노산 위치를 동시에 돌연변이시킨다. 다른 실시태양에서, N,N,G/T 서열보다 축퇴성이 떨어지는 축퇴성 카세트를 사용한다. 예를 들어, 몇몇 경우에 있어서(예를 들어, 올리고뉴클레오티드 내에서) N 하나만으로 구성된 축퇴성 삼중 코돈 서열을 사용하는 것이 바람직할 수 있는데, 이때 상기 N은 삼중 코돈의 첫번째, 두번째 또는 세번째 위치에 존재할 수 있다. 기타 염기들을 조합하여 포함하거거나 순열 방식으로 포함하는 기타 임의의 염기들은 삼중 코돈의 나머지 두 위치에 사용될 수 있다. 별법으로, 몇몇 경우에 있어서, (예를 들어, 올리고 내에서) 축퇴성 N,N,N 삼중 코돈 서열을 사용하는 것이 바람직할 수 있다.

일부 실시태양에서, 축퇴성 삼중 코돈(예를 들어, N,N,G/T 삼중 코돈)을 사용하면, 전 범위의 생성 가능한 천연 아미노산(전체 20개의 아미노산에 대함)을 폴리펩티드 내에 존재하는 각각의 모든 아미노산 위치로 체계적이고 용이하게 치환시킬 수 있다(다른 실시태양에서, 이러한 방법은 아미노산 잔기 또는 코돈 위치마다 일어날 수 있는 거의 모든 치환을 발생시킨다). 예를 들어, 100개의 아미노산 폴리펩티드에 있어서, 2000개의 별개 종(즉, 위치당 올 수 있는 20개의 아미노산 x 100개의 아미노산 위치)이 생성될 수 있다. 축퇴성 N,N,G/T 삼중 코돈을 함유하는 올리고뉴클레오티드 또는 올리고뉴클레오티드 세트를 사용할 경우에는, 32개의 개별 서열이 20개의 천연 아미노산 전부를 코딩할 수 있다. 따라서, 이와 같은 하나 이상의 올리고뉴클레오티드를 사용하여 모체 폴리뉴클레오티드 서열에 대해 포화 돌연변이 유발법이 진행되고 있는 반응 용기 중에서는, 20개의 개별 폴리펩티드를 코딩하는 32개의 개별 자손 폴리뉴클레오티드가 생성된다. 이와는 대조적으로, 위치 지정 돌연변이 유발법에서 비축퇴성 올리고뉴클레오티드를 사용하면, 반응 용기당 하나의 자손 폴리펩티드만이 생성된다. 비축퇴성 올리고뉴클레오티드는 경우에 따라, 개시된 축퇴성 프라이머와 함께 사용될 수 있는데; 예를 들어, 비축퇴성 올리고뉴클레오티드는 작용중인 폴리뉴클레오티드 내에서 특정의 점 돌연변이를 유발시키는데에 사용될 수 있다. 이로써, 특이적 침묵 점 돌연변이, 상응하는 아미노산에 변이를 일으키는 점 돌연변이, 그리고 종결 코돈을 생성하고 그에 따라서 폴리펩티드 단편의 발현이 생성되는 점 돌연변이를 유발하는 하나의 수단을 제공한다.

일부 실시태양에서, 각각의 포화 돌연변이 유발 반응 용기는 20개 이상의 자손 폴리펩티드(예로서, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소) 분자를 코딩하는 폴리뉴클레오티드를 포함하므로, 20개의 천연 아미노산 모두는 모체 폴리뉴클레오티드 내에서 돌연변이 유발된 코돈의 위치에 상응하는 하나의 특정 아미노산 위치에 존재하게 된다(다른 실시태양은 전부 20개 미만의 천연 아미노산 조합을 사용함). 각각의 포화 돌연변이 유발 반응 용기로부터 생성되는 32배 축퇴성인 자손 폴리펩티드는 클론 증폭될 수 있으며(예를 들어, 발현 벡터를 사용하여 적합한 숙주 예를 들어, E. 콜라이 숙주에 클로닝되어 증폭될 수 있으며), 또한 발현 스크리닝될 수도 있다. (알칼리성 또는 산성 조건하에서 증가하는 탄소-탄소 형성 또는 절단 활성을 모체 폴리펩티드에 대하여 비교하였을 때), 바람직한 변화를 적당히 나타내는 각각의 자손 폴리펩티드가 스크리닝에 의해 동정될 때, 상기 자손 폴리펩티드는 서열 분석되어, 이것에 포함된, 상응하는 바람직한 아미노산 치환을 동정할 수 있다.

일부 실시태양에서, 본원에 개시된 바와 같이, 포화 돌연변이 유발법을 사용하여 모체 폴리펩티드내 각각의 모든 아미노산 위치를 돌연변이시키면, 1 초과의 아미노산 위치에 바람직한 아미노산 변이가 일어남을 확인할 수 있다. 상기와 같은 바람직한 아미노산 치환 모두 또는 일부를 조합하여 포함하는, 하나 이상의 신규 자손 분자가 생성될 수 있다. 예를 들어, 만일 2개의 특이적인 바람직한 아미노산 변이가 폴리펩티드내 3개의 아미노산 위치에서 각각 동정되면, 순열에 의하면 각 위치(원래의 아미노산과 차이가 없는 위치, 그리고 2개의 바람직한 변화가 각각 발생한 위치)와 3개의 위치에서 치환이 일어날 가능성은 3가지가 된다. 따라서, 전체 가능성은 3x3x3 또는 27가지이며, 이들 중 7갖는 6개의 단일 점 돌연변이(즉, 3개의 위치에서 각각 2개씩)가 발생하고 그 이외의 위치에는 변이가 발생하지 않는 것으로 확인되었다.

추가의 또다른 실시태양에서, 위치-포화 돌연변이 유발법은 스크리닝함과 동시에, 셔플링, 키메라 형성, 재조합법 및 기타 돌연변이 유발 방법과 함께 사용될 수 있다. 본 발명은 포화 돌연변이 유발법과 같은 임의의 돌연변이 유발 방법(들)을 반복적으로 사용한다. 하나의 구체예에서, 임의의 돌연변이 유발 방법(들)은 스크리닝과 함께 반복적으로 실시된다.

본 발명은 또한 독점적 코돈 프라이머(축퇴성 N,N,N 서열 함유)를 사용하여 점 돌연변이를 폴리뉴클레오티드에 도입시켜, 전 범위의 단일 아미노산 치환부가 각각의 아미노산 위치에 제시되는 한 세트의 자손 폴리펩티드를 생성시키는 방법을 제공한다(유전자 위치 포화 돌연변이 유발법(GSSM)). 사용된 올리고는 제1의 상동성 서열, 축퇴성 N,N,N 서열을 연속적으로 포함하고, 일부 실시태양에서는(반드시 그러한 것은 아니지만), 제2의 상동성 서열을 포함하기도 한다. 이와 같은 올리고를 사용하여 얻어진 하류의 자손 번역 산물은 폴리펩티드를 따라서 존재하는 각각의 아미노산 위치에 일어날 수 있는 아미노산 변이를 모두 포함하는데, 그 이유는 N,N,N 서열의 축퇴성이 20개 아미노산 전부에 대한 코돈을 포함하기 때문일 것이다.

일부 실시태양에서, 이러한 축퇴성 올리고(하나의 축퇴성 N,N,N 카세트로 구성된) 중 하나는 모체 폴리뉴클레오티드 주형내 원래의 코돈 각각을 전 범위 코돈 치환시키는데에 사용된다. 다른 실시태양에서, 동일한 올리고 또는 그렇지 않은 경우, 모체 폴리뉴클레오티드 주형 내에 존재하는 2개 이상의 원래의 코돈을 전 범위 코돈 치환시키기 위해, 2개 이상의 축퇴성 N,N,N 카세트가 사용된다. 따라서, 1 초과의 부위에 아미노산 돌연변이를 도입하기 위해서, 1 초과의 N,N,N 서열은 하나의 올리고머 내에 포함될 수 있는 것이다. 이와 같은 N,N,N 서열의 다수성은 직접적으로 연속되어 나타날 수 있거나, 또는 하나 이상의 부가 뉴클레오티드 서열(들)에 의해 분리되어 나타날 수도 있다. 다른 실시태양에서, 부가 및 결실을 도입하는데에 유용한 올리고는 단독으로 사용될 수 있거나, N,N,N 서열을 포함하는 코돈과 함께 사용되어, 아미노산 부가, 결실 및/또는 치환을 경우에 따라, 조합하여 도입하거나 순열 방식으로 도입할 수 있다.

일부 실시태양에서, 연속된 N,N,N 삼중 코돈 즉, 축퇴성 (N,N,N)n 서열을 함유하는 올리고를 사용하여 2개 이상의 연속된 아미노산 위치들을 동시에 돌연변이시킬 수 있다. 다른 실시태양에서, 본 발명은 이 N,N,N 서열보다 축퇴성이 떨어지는 축퇴성 카세트를 사용한다. 예를 들어, 몇몇 경우에 (예를 들어, 올리고 내에서) N 하나만으로 이루어진 축퇴성 삼중 코돈 서열을 사용하는 것이 바람직할 수 있는데, 이때 상기 N은 삼중 코돈의 첫번째, 두번째 또는 세번째 위치에 존재할 수 있다. 기타 염기들을 조합하여 포함하거거나 순열 방식으로 포함하는 기타 임의의 염기들은 삼중 코돈의 나머지 두 위치에 사용될 수 있다. 별법으로, 몇몇 경우에 있어서, (예를 들어, 올리고 내에서) 축퇴성 N,N,N 삼중 코돈 서열, N,N,G/T 또는N,N,G/C 삼중 코돈 서열을 사용하는 것이 바람직할 수 있다.

일부 실시태양에서, 축퇴성 삼중 코돈(예를 들어, N,N,G/T 삼중 코돈 또는 N, N, G/C 삼중 코돈 서열)을 사용하면 몇 가지 이유에서 유리하다. 일부 실시태양에서, 본 발명은, 전 범위에 생성 가능한 천연 아미노산(전체 20개의 아미노산에 대함)을 폴리펩티드 내에 존재하는 각각의 모든 아미노산 위치로 체계적이고 용이하게 치환시킬 수 있다. 따라서, 100개의 아미노산 폴리펩티드에 있어서, 2000개의 별개 종(즉, 위치당 올 수 있는 20개의 아미노산 x 100개의 아미노산 위치)이 생성될 수 있다. 축퇴성 N,N,G/T 삼중 코돈 또는 N,N,G/C 삼중 코돈 서열을 함유하는 올리고를 사용할 경우에는, 32개의 개별 서열이 20개의 아미노산을 코딩할 수 있음을 알 수 있다. 따라서, 이와 같은 하나의 올리고를 사용하여 모체 폴리뉴클레오티드 서열에 대해 포화 돌연변이 유발법이 진행되고 있는 반응 용기 중에서는, 20개의 개별 폴리펩티드를 코딩하는 32개의 개별 자손 폴리뉴클레오티드가 생성된다. 이와는 대조적으로, 위치 지정 돌연변이 유발법에서 비축퇴성 올리고머를 사용하면, 반응 용기당 하나의 자손 폴리펩티드 산물만이 생성된다.

본 발명은 또한 본원에 개시된 축퇴성 프라이머와 함께 사용될 수도 있는 비축퇴성 올리고를 사용한다. 몇몇 경우, 비축퇴성 올리고는 작용중인 폴리뉴클레오티드 내에서 특정의 점 돌연변이를 유발시키는데에 사용될 수 있음을 알 수 있다. 이로써, 특이적 침묵 점 돌연변이, 상응하는 아미노산에 변이를 일으키는 점 돌연변이, 그리고 종결 코돈을 생성하고 그에 상응하는 폴리펩티드 단편의 발현이 결성되는 점 돌연변이를 유발하는 하나의 수단을 제공한다.

따라서, 본 발명의 일부 실시태양에서, 각각의 포화 돌연변이 유발 반응 용기는 20개 이상의 자손 폴리펩티드 분자를 코딩하는 폴리뉴클레오티드를 포함하므로, 20개의 아미노산 모두는 모체 폴리뉴클레오티드 내에서 돌연변이 유발된 코돈의 위치에 해당하는 하나의 특정 아미노산 위치에 존재하게 된다. 각각의 포화 돌연변이 유발 반응 용기로부터 생성되는 32배 축퇴성인 자손 폴리펩티드는 클론 증폭될 수 있으며(예를 들어, 발현 벡터를 사용하여 적합한 숙주 예를 들어, E. 콜라이 숙주에 클로닝되어 증폭될 수 있으며), 또한 발현 스크리닝될 수도 있다. (모체 폴리펩티드의 경우와 비교하였을 때), 바람직한 변화를 적당히 나타내는 각각의 자 폴리펩티드가 스크리닝에 의해 동정될 때, 상기 자손 폴리펩티드는 서열 분석되어, 이것에 포함된, 상응하는 바람직한 아미노산 치환을 동정하도록 서열 분석될 수 있다.

일부 실시태양에서, 본원에 개시된 바와 같이, 포화 돌연변이 유발법을 사용하여 모체 폴리펩티드내 각각의 아미노산 위치를 모두 돌연변이시키면, 1 초과의 아미노산 위치에 바람직한 아미노산 변이가 일어남을 확인할 수 있다. 상기와 같은 바람직한 아미노산 치환 모두 또는 일부를 조합하여 포함하는, 하나 이상의 신규 자손 분자가 생성될 수 있다. 예를 들어, 만일 2개의 특이적인 아미노산의 바람직한 변화가 폴리펩티드내 3개의 아미노산 위치에서 각각 동정되면, 순열에 의하면 각 위치(원래의 아미노산과 차이가 없는 위치, 그리고 2개의 바람직한 변화가 각각 발생한 위치)와 3개의 위치에서 치환이 일어날 가능성은 3가지가 된다. 그러므로, 전체 가능성은 3x3x3 또는 27가지이며, 이들 중 7가지는 6개의 단일 점 돌연변이(즉, 3개의 위치에서 각각 2개씩)가 발생하고 그 이외의 위치에는 변이가 발생하지 않는 것으로 확인되었다.

본 발명은 예를 들어, 2개 이상의 관련 폴리뉴클레오티드가 적합한 숙주 세포에 도입되어, 하이브리드 폴리뉴클레오티드가 재조합법 및 반복적 재분류법에 의해 생산되는, 부가적인 돌연변이 유발 방법과 함께 실시되는 포화 돌연변이 유발법의 사용에 관해 제공한다.

유전자 전 서열에 걸쳐서 돌연변이 유발법을 실시하는 것 이외에, 본 발명은 폴리뉴클레오티드 서열 내에 존재하는 임의의 수의 염기 각각을 대체하는데에 사용될 수 있는 돌연변이 유발법을 제공하며, 일부 실시태양에서, 이러한 돌연변이 유발법에서 돌연변이될 염기의 수는 15 내지 100,000의 모든 정수이다. 따라서, 분자에 전체적으로 존재하는 모든 위치들을 돌연변이시키는 대신에, 모든 염기 또는 일정 수의 염기(일부 실시태양에서, 총 15 내지 100,000개의 하위 세트)를 돌연변이시킬 수 있다. 일부 실시태양에서, 개별 뉴클레오티드는 폴리뉴클레오티드 서열에 걸쳐 존재하는 각각의 위치 또는 위치 군들을 돌연변이시키는데에 사용된다. 돌연변이될 3개 위치 군은 코돈일 수 있다. 돌연변이는 돌연변이 유발 카세트로도 지칭되는 이종 카세트를 함유하는 돌연변이 유발 프라이머를 사용하여 도입될 수 있다. 대표적 카세트는 1개 내지 500개의 염기를 가질 수 있다. 이러한 이종 카세트 내에 존재하는 각각의 뉴클레오티드 위치는 N, A, C, G, T, A/C, A/G, A/T, C/G, C/T, G/T, C/G/T, A/G/T, A/C/T, A/C/G 또는 E이며, 여기서, E는 A, C, G 또는 T 이외의 임의의 염기이다(E는 디자이너 올리고라 지칭할 수 있다).

일부 실시태양에서, 포화 돌연변이 유발법은 돌연변이될 한정된 폴리뉴클레오티드 서열(여기서, 이 돌연변이될 서열은 일부 실시태양에서 길이 약 1개 내지 100,000개의 염기임)내 돌연변이 유발 카세트(여기서, 각각의 카세트는 일부 실시태양에서 길이 약 1개 내지 500개 염기임)의 완전한 세트를 돌연변이 유발시키는 과정을 포함한다. 따라서, 돌연변이 군(1개 내지 100개의 돌연변이 군)은 돌연변이가 유발될 각 카세트에 도입된다. 하나의 카세트에 도입될 돌연변이 군은, 포화 돌연변이 유발 과정 중 1회 순환 진행시 제2 카세트에 도입될 돌연변이의 제2 군과 상이하거나 또는 이와 동일할 수 있다. 이러한 군들은 특정 코돈의 결실, 부가, 분류 및 특정 뉴클레오티드 카세트의 분류에 의해 구체화된다.

일부 실시태양에서, 돌연변이가 유발될 특정 서열은 전체 유전자, 경로, cDNA, 전체 오픈 리딩 프레임(ORF: open reading frame) 및 전체 프로모터, 인핸서, 억제제/트랜스 활성화제, 복제 기점, 인트론, 오퍼레이터 또는 임의의 폴리뉴클레오티드 작용 군을 포함한다. 일반적으로, 이러한 목적으로 사용될 "특정 서열"은 15개의 염기-폴리뉴클레오티드 서열과, 길이가 15개 내지 15,000개의 염기인 폴리뉴클레오티드 서열과 같은 임의의 폴리뉴클레오티드일 수 있다(본 발명은 상기와 같은 수들 사이에 존재하는 모든 정수를 구체적으로 지명함). 코돈 분류시 고려될 수 있는 사항으로서는 축퇴성 돌연변이 유발 카세트에 의해 코딩되는 아미노산 유형들을 포함한다.

일부 실시태양에서, 돌연변이 유발 카세트에 도입될 수 있는 돌연변이들을 분류함에 있어서, 본 발명은 구체적으로 각 위치에서 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19 및 20개의 아미노산을 코딩하는 축퇴성 코돈 치환부(축퇴성 올리고 사용)와, 이에 의해 코딩되는 폴리펩티드 라이브러리를 제공한다.

합성 결찰 재조립법( SLR )

본 발명은, 신규의 특성 또는 변형된 특성을 갖는 본 발명에 따른 폴리펩티드, 예로서, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 또는 항체를 생산하기 위하여 확률에 의하지 않는, 합성 결찰 재조립법," 또는 간단히 "SLR," "유도 진화법"으로도 지칭되는, 유전자 변형 시스템)을 제공한다.

SLR은 올리고뉴클레오티드 단편들을 확률에 의하지 않고 서로 결찰시키는 방법이다. 본 방법은 핵산 구성 블록이 무작위로 셔플링되거나, 연결되거나 또는 키메라화되지 않고, 확률에 의하지않고 조립된다는 점에서, 확률에 의한 올리고뉴클레오티드 셔플링과는 다르다. 예를 들어, 미국 특허 번호 제6,773,900호; 제6,740,506호; 제6,713,282호; 제6,635,449호; 제6,605,449호; 및 제6,537,776호를 참조한다. 일부 실시태양에서, SLR은 하기 단계들을 포함한다: (a) 상동성 유전자를 코딩하는 서열을 포함하는 주형 폴리뉴클레오티드를 제공하는 단계; (b) 다수의 구성 블록 폴리뉴클레오티드를 제공하는 단계로서, 여기서 상기 구성 블록 폴리뉴클레오티드는 소정의 서열에서 주형 폴리뉴클레오티드와 교차하여 재조립되도록 디자인될 뿐만 아니라, 이 구성 블록 폴리뉴클레오티드는 상동성 유전자의 변이체인 서열과 이 변이체 서열 측면에 위치하는 주형 폴리뉴클레오티드에 상동성인 서열을 포함하는 것인 단계; 및 (c) 구성 블록 폴리뉴클레오티드와 주형 폴리뉴클레오티드를 결합시켜, 이 구성 블록 폴리뉴클레오티드가 주형 폴리뉴클레오티드와 교차 재조립되어, 상동성 유전자 서열 변이가 일어난 폴리뉴클레오티드를 생성하는 단계.

SLR은 재배열될 폴리뉴클레오티드 사이의 상동성 수준이 높은지 여부에 의존하지 않는다. 따라서, 본 방법은 10¹⁰⁰개 이상의 상이한 키메라로 이루어진 자손 분자의 라이브러리(또는 세트)를 확률에 의하지 않고 생산하는데에 사용될 수 있다. SLR은 10¹⁰⁰⁰개 이상의 상이한 자손 키메라로 이루어진 라이브러리를 제조하는데에 사용될 수 있다. 따라서, 본 발명의 실시태양들은 디자인에 의해 선택된 전체 조립 순서를 단축시켜 완성된 키메라 핵산 분자 세트를 생산하는, 확률에 의하지 않는 방법을 포함한다. 본 방법은, 유용한 상호 결찰이 가능한 말단부를 갖는 특정 핵산 구성 블록 다수 개를 디자인하는 단계와, 이러한 핵산 구성 블록을 조립하여 조립 순서를 전체적으로 디자인할 수 있는 단계를 포함한다.

만일, 조립될 핵산 구성 블록의 상호 적합한 결찰 가능 말단부가 이 구성 블록을 소정의 순서로 커플링시킬수 있을 경우, 말단부는 순서가 정해진 형태의 조립체에 대하여 "유용한"것으로서 간주된다. 따라서, 핵산 구성 블록이 커플링될 수 있는 조립체의 전체적인 순서는 결찰 가능한 말단부를 디자인함으로써 정해진다. 1 초과의 조립 단계가 사용되면, 상기와 같은 핵산 구성 블록이 커플링될 수 있는 조립의 전체적인 순서 또한 순차적인 순서의 조립 단계(들)에 지정되기도 한다. 일부 실시태양에서, 어닐링된 구성 블록 조각들은 효소 예를 들어, 리가제(예를 들어, T4 DNA 리가제)로 처리되어, 구성 조각들을 공유적으로 결합시킬 수 있게 된다.

일부 실시태양에서, 올리고뉴클레오티드 구성 블록은 완성된 키메라 폴리뉴클레오티드의 자손 세트를 생산하기 위한 기초로서 사용되는 선조 핵산 서열 주형 세트를 분석함으로써 디자인된다. 따라서, 이와 같은 모체 올리고뉴클레오티드 주형은 돌연변이 예를 들어, 키메라 형성 또는 셔플링될 핵산 구성 블록을 디자인하는 것을 도와주는 서열 정보의 공급원으로서 사용된다. 이러한 방법의 일부 실시태양에서, 다수의 모체 핵산 주형의 서열은 하나 이상의 분계점을 선택하도록 정렬된다. 상기 분계점은 상동성인 구역에 존재할 수 있으며, 또한 하나 이상의 뉴클레오티드로 이루어져 있다. 일부 실시태양에서, 이와 같은 분계점들은 선조 주형들 중 2개 이상에 의해 공유된다. 그러므로, 상기 분계점은 모체 폴리뉴클레오티드를 재배열하기 위하여, 생성될 올리고뉴클레오티드 구성 블록의 경계를 유추하는데에 사용될 수 있다. 이와 같이 선조 분자 내에서 확인 및 선택된 분계점은 최종 키메라 자손 분자의 조립에 있어서 유력한 키메라 형성 지점으로 사용된다. 분계점은 2개 이상의 모체 폴리뉴클레오티드 서열에 의해 공유되는 상동성 구역(하나 이상의 상동성 뉴클레오티드 염기로 이루어짐)일 수 있다. 별법으로, 분계점은 적어도 모체 폴리뉴클레오티드 서열의 절반에 의해 공유되는 상동성 구역일 수 있거나, 또는 모체 폴리뉴클레오티드 서열 중 3분의 2 이상에 의해 공유되는 상동성 구역일 수 있다. 일부 실시태양에서, 유용한 분계점은 모체 폴리뉴클레오티드 서열 중 4분의 3 이상에 의해 공유되는 상동성 구역이거나 모체 폴리뉴클레오티드 서열의 대부분에 의해 공유될 수 있다. 일부 실시태양에서, 분계점은 모체 폴리뉴클레오티드 서열의 전부에 의해 공유되는 상동성 구역이다.

일부 실시태양에서, 결찰 재조립법은 자손 키메라 폴리뉴클레오티드의 소모적 라이브러리를 제조하기 위하여 철저하게 실시된다. 다시 말하면, 핵산 구성 블록을 모든 가능한 순서로 조합한 결과가 완성된 키메라 핵산 분자 세트에 제시된다는 것이다. 이와 동시에, 다른 실시태양에서, 각 조합체에 있어서의 조립 순서(즉, 각 구성 블록을 각 완성된 키메라 핵산 서열의 5'→3'로 조립할 때의 순서)는 전술한 바와 같이 디자인(또는 확률에 의하지 않고 생산)된다. 본 발명이 확률에 의하지 않는다는 특징으로 인하여, 원치 않는 부산물이 생성될 가능성은 상당히 줄어든다.

다른 실시태양에서, 결찰 재조립 방법은 체계적으로 실시된다. 예를 들어, 본 방법은 예를 들어, 하나씩 체계적으로 스크리닝될 수 있는 구획들에 의해 체계적으로 구분된 자손 분자의 라이브러리를 제조하기 위해 진행된다. 다시 말해서, 본 발명은 순차적인 단계의 조립 반응을 선택적이고 적절하게 사용하는 것과 함께, 특정의 핵산 구성 블록을 선택적이고 적절하게 사용함으로써, 자손 산물의 특정 세트가 몇몇 반응 용기 내에서 각각 생산되도록 이 세트를 디자인할 수 있다. 이로써, 관찰 및 스크리닝 방법이 체계적으로 수행될 수 있다. 따라서, 본 방법은 다수의 자손 분자를, 더욱 작은 규모의 군에서 체계적으로 관찰할 수 있도록 만들어 준다. 특히 선조 분자 간 상동성 수준이 낮을 때, 본 방법을 통하여 매우 융통성 있고, 철저하며, 체계적이기까지 한 방식으로 키메라를 만들 수 있기 때문에, 이러한 방법은 다수의 자손 분자로 이루어진 라이브러리(또는 세트)를 생산해 낼 수 있다. 본 발명의 결찰 재조립법이 확률에 의하지 않는다는 특성으로 인하여, 일부 실시태양에서 생성된 자손 분자는 디자인에 따라서 선택되는 전체적인 조립 순서를 갖는 완성된 키메라 핵산 분자 라이브러리를 포함한다. 포화 돌연변이 유발법 및 최적화 유도 진화법은 또한 상이한 자손 분자 종을 만드는데에 사용될 수도 있다. 본 발명은 분계점 선택에 관한 한 선택권 및 제어능, 핵산 구성 블록의 크기 및 수, 그리고 커플링 규모 및 디자인을 제공함을 알 수 있다는 점을 이해할 것이다. 또한, 분자간 상동성은 본 발명을 실시하는데 그다지 필요하지 않다. 사실, 분계점은 분자간 상동성이 거의 없거나 전혀 없는 구역에서 선택될 수도 있는 것이다. 예를 들어, 코돈의 느슨함(codon wobble) 즉, 코돈의 축퇴성으로 인하여, 뉴클레오티드 치환은 이 뉴클레오티드에 상응하는 선조 주형 내에서 원래부터 코딩되던 아미노산을 변형시키지 않고서도 핵산 구성 블록에 도입될 수 있다. 별법으로, 코돈은 원래 아미노산의 변형을 지시하도록 변경될 수 있다. 본 발명에 의하면, 이러한 치환은 핵산 구성 블록에 도입되어, 분자간 상동성 분계점의 출현 빈도를 더욱 늘릴 수 있으며, 그 결과 구성 블록 간에 보다 많은 수의 커플링이 형성될 수 있게 되어, 더욱 많은 수의 자손 키메라 분자가 생성될 수 있게 되는 것이다.

합성 유전자 재조립법

일부 실시태양에서, 본 발명은 합성 유전자 재조립법이라고 하는 확률에 의하지 않는 방법 즉, 어느 정도는 확률에 의한 셔플링과 관련되어 있지만, 핵산 구성 블록이 무작위로 셔플링되거나 또는 결합되거나 또는 키메라 형성되지 않고, 오히려 확률에 의존하지 않고서 조립되는 방법을 제공한다. 예를 들어, 미국 특허 번호 제 6,537,776호를 참조한다.

합성 유전자 재조립 방법은 셔플링될 폴리뉴클레오티드 간 상동성 수준이 높은지 여부에 의존하지는 않는다. 본 발명은 10¹⁰⁰개 이상의 상이한 키메라로 이루어진 자손 분자 라이브러리(또는 세트)를 확률에 의하지 않는 방식으로 생산하는데에 사용될 수 있다. 상상컨대, 합성 유전자 재조립법은 10¹⁰⁰⁰개 이상의 상이한 자손 키메라로 이루어진 라이브러리를 제조하는 경우에도 사용될 수 있을 것이다.

따라서, 일부 실시태양에서, 본 발명은 확률에 의하지 않고 완성된 키메라 핵산 분자 세트를 생산하는 방법을 제공하는데, 여기서, 상기 키메라 핵산 분자의 전체적인 조립 순서는 디자인에 의해 선택되며, 본 방법은 유용한 상호 결찰 가능 말단부를 갖는 특정 핵산 구성 블록 다수 개를 디자인하는 단계와, 이러한 핵산 구성 블록을 조립하여 전체적인 조립 순서를 디자인할 수 있는 단계를 포함한다.

조립될 핵산 구성 블록의 상호 적합한 결찰 가능 말단부가 구성 블록을 소정의 순서로 커플링 시킬 수 있을 경우, 말단부는 순서가 정해진 형태의 조립체에 대하여 "유용한" 것으로서 간주된다. 따라서, 일부 실시태양에서, 핵산 구성 블록이 커플링될 수 있는 조립체의 전체적인 순서는 결찰 가능 말단부를 디자인함으로써 정해지며, 만일 1 초과의 조립 단계가 진행되면, 상기와 같은 핵산 구성 블록이 커플링될 수 있는 전체적인 조립 순서는 또한 조립 단계(들) 의 순차적인 순서의 조립 단계(들)에 의해 지정되기도 한다. 본 발명의 일부 실시태양에서, 어닐링된 구성 블록 조각들은 효소 예를 들어, 리가제(예를 들어, T4 DNA 리가제)로 처리되어, 구성 블록 조각들을 공유적으로 결합시킬 수 있게 된다.

또다른 실시태양에서, 핵산 구성 블록은 완성된 키메라 핵산 분자의 자손 세트를 생산하기 위한 기초로서 사용되는 선조 핵산 주형 세트 서열을 분석함으로써 디자인된다. 이와 같은 선조 핵산 주형은 돌연변이 즉, 키메라 형성 또는 셔플링될 핵산 구성 블록을 디자인하는 것을 도와주는 서열 정보의 공급원으로서 사용된다.

하나의 구체예에서, 본 발명은 관련 유전자 군과, 이로 인하여 코딩되는 관련 산물 군의 키메라를 형성한다. 특정 구체예에서, 코딩되는 산물은 효소이다. 본 발명의 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소는 본원에 개시된 방법에 따라서 돌연변이 유발될 수 있다.

그러므로, 본 발명의 하나의 실시태양에 따라, 다수의 선조 핵산 주형의 서열(예를 들어, 본 발명에 따른 폴리뉴클레오티드 서열)은 하나 이상의 분계점을 선택하기 위하여 정렬되며, 이때 상기 분계점은 상동성이 있는 구역에 존재한다. 상기 분계점은 생성될 핵산 구성 블록의 경계를 유추하는데에 사용될 수 있다. 그러므로, 선조 분자에서 확인 및 선택된 분계점은 자손 분자의 조립에 있어서 유력한 키메라 형성 지점으로 사용될 수 있다.

일부 실시태양에서, 유용한 분계점은 2개 이상의 선조 주형에 의해 공유되는 상동성 구역(하나 이상의 상동성 뉴클레오티드 염기로 이루어짐)이지만, 이 분계점은 적어도 모체 주형의 절반에 의해 공유되는 상동성 구역일 수 있거나, 또는 모체 주형 중 3분의 2 이상에 의해 공유되는 상동성 구역일 수 있거나, 또는 모체 주형의 4분의 3 이상에 의해 공유되는 상동성 구역일 수 있으며, 일부 실시태양에서, 선조 주형의 대부분에 의해 공유되는 상동성 구역일 수 있다. 일부 실시태양에서, 보다 유용한 분계점은 모체 주형의 전부에 의해 공유되는 상동성 구역이다.

하나의 실시태양에서, 유전자 재조립 방법은 소모적 라이브러리를 제조하기 위하여 철저하게 수행된다. 다시 말하면, 핵산 구성 블록을 모든 가능한 순서로 조합한 결과가 최종 키메라 핵산 분자 세트에 제시된다는 것이다. 이와 동시에, 각 조합체에 있어서의 조립 순서(즉, 각 구성 블록을 각 완성된 생성 키메라 핵산 서열의 5'→3'로 조립할 때의 순서)는 디자인(또는 확률에 의하지 않고 생산)된다. 본 발명의 방법이 확률에 의하지 않는다는 특징으로 인하여, 원치 않는 부산물이 생성될 가능성은 상당히 줄어든다.

다른 실시태양에서, 본 방법은 예를 들어, 하나씩 체계적으로 스크리닝될 수 있는 구획들에 의해 체계적으로 구분된 라이브러리를 제조하기 위해 진행된다. 다시 말해서, 본 발명은 순차적인 단계의 조립 반응을 선택적이고 적절하게 사용하는 것과 함께, 특정의 핵산 구성 블록을 선택적이고 적절하게 사용함으로써, 자손 산물의 특정 세트가 몇몇 반응 용기 내에서 각각 생산되도록 이 세트를 디자인할 수 있다. 이로써, 관찰 및 스크리닝 방법이 체계적으로 수행될 수 있다. 따라서, 본 방법은 다수의 자손 분자를, 더욱 작은 규모의 군에서 체계적으로 관찰할 수 있도록 만들어 준다.

특히 선조 분자간 상동성 수준이 낮을 때, 본 방법을 통하여 매우 융통성 있고, 철저하며, 체계적이기까지 한 방식으로 키메라를 만들 수 있기 때문에, 본 발명의 방법은 다수의 자손 분자로 이루어진 라이브러리(또는 세트)를 생산해 낼 수 있다. 본 발명의 유전자 재조립법의 확률에 의하지 않는다는 성질로 인하여, 일부 실시태양에서 생성된 자손 분자는 디자인에 따라서 선택되는 전체적인 조립 순서를 갖는 완성된 키메라 핵산 분자 라이브러리를 포함한다. 일부 실시태양에서, 이와 같이 생산된 라이브러리는 10³개 초과 내지 10¹⁰⁰⁰개 초과의 상이한 자손 분자 종으로 이루어져 있다.

일부 실시태양에서, 전술한 바와 같이 생산된 완성 키메라 핵산 분자는 폴리펩티드를 코딩하는 폴리뉴클레오티드로 이루어져 있다. 하나의 실시태양에서, 이러한 폴리뉴클레오티드는 인공적인 유전자일 수 있는 유전자이다. 또다른 실시태양에서, 이러한 폴리뉴클레오티드는 인공적인 유전자 경로일 수 있는 유전자 경로이다. 일부 실시태양에서. 본 발명은 본 발명에 의해 형성된 하나 이상의 인공적인 유전자를 인공적 유전자 경로 예를 들어, 진핵 생물 유기체(식물 포함) 내에서 작동 가능한 경로에 도입할 수 있다.

또다른 구체예에서, 구성 블록이 생성되는 단계의 합성 성질로 인하여, 추후에 시험관내 방법(예를 들어, 돌연변이 유발법) 또는 생체내 방법(예를 들어, 숙주 유기체의 유전자 스플라이싱 능력을 사용하는 방법)에서 경우에 따라, 제거될 수도 있는, 뉴클레오티드(예를 들어, 코돈, 인트론 또는 조절 서열일 수 있는 하나 이상의 뉴클레오티드)를 디자인 및 도입시킬 수 있는 것이다. 다수의 경우, 이와 같은 뉴클레오티드를 도입시키면, 유용한 분계점을 생성시킬 수 있다는 효능이 있는 이점 이외에도, 기타 다수의 이유로 인하여 바람직할 수도 있다.

따라서, 일부 실시태양에서, 본 발명은 인트론을 도입시키는데에 사용될 수 있는 핵산 구성 블록을 제공한다. 따라서, 본 발명은 본 발명에 따른 인공적 유전자에 도입될 수 있는 기능적 인트론을 제공한다. 일부 실시태양에서, 본 발명은 또한 본 발명에 따른 인공적 유전자 경로를 도입시킬 수 있는 기능적 인트론을 제공한다. 그러므로, 본 발명은 인공적으로 도입된 하나(또는 그 이상)의 인트론(들)을 함유하는 인공적 유전자인 키메라 폴리뉴클레오티드의 생산한다.

본 발명은 또한 인공적으로 도입된 하나(또는 그 이상)의 인트론(들)을 함유하는 인공적 유전자 경로인 키메라 폴리뉴클레오티드의 생산 방법을 제공한다. 일부 실시태양에서, 인공적으로 도입된 인트론(들)은 하나 이상의 숙주 세포 내에서, 주로 천연적으로 발생된 인트론이 유전자 스플라이싱에서 기능적으로 사용되는 방식으로 유전자 스플라이싱을 수행한다. 일부 실시태양에서, 본 발명은 또한 재조합 및/또는 스플라이싱을 위해 숙주 유기체에 도입될 인공적 인트론 함유 폴리뉴클레오티드를 생산하는 방법을 제공한다.

본 발명을 사용하여 생산되는 인공적 유전자는 또한 또다른 핵산과의 재조합에 있어서의 기질로서 사용될 수도 있다. 이와 유사하게, 본 발명을 사용하여 형성된 인공적 유전자 경로는 또한 또다른 핵산과의 재조합에 대한 기질로서 사용될 수도 있다. 일부 실시태양에서, 재조합법은 인공적, 인트론 함유 유전자와 핵산 사이의 상동성 구역에 의해 촉진되거나 또는 여기에서 발생하며, 여기서, 상기 상동성 구역은 재조합 파트너로서 사용된다. 일부 실시태양에서, 재조합 파트너는 또한 본 발명에 의해 생산되는 핵산 예를 들어, 인공적 유전자 또는 인공적 유전자 경로일 수도 있다. 재조합법은 인공적 유전자 내에 존재하는 하나의(또는 그 이상의) 인공적으로 도입된 인트론(들)에 존재하는 상동성 구역에 의해 촉진되거나 또는 여기에서 발생할 수 있다.

일부 실시태양에서, 본 발명에 따른 합성 유전자 재조립 방법은 다수의 핵산 구성 블록을 사용하는데, 일부 실시태양에서, 이들 블록은 각각 2개의 결찰 가능한 말단부를 갖는다. 각 핵산 구성 블록 상에 존재하는 상기 2개의 결찰 가능한 말단부는 2개의 블런트 말단부로 존재할 수 있거나(즉, 오버행 말단부를 갖지 않을 수 있거나), 또는 일부 실시태양에서는, 하나의 블런트 말단부와 하나의 오버행 말단부로 존재할 수 있거나, 추가의 일부 실시태양에서는 2개의 오버행 말단부로 존재할 수 있다. 일부 실시태양에서, 이러한 용도로서 유용한 오버행 말단부는 3'-오버행 말단부 또는 5'-오버행 말단부일 수 있다. 따라서, 핵산 구성 블록은 3'-오버행 말단부이거나, 별법으로, 5'-오버행 말단부이거나, 별법으로 2개의 3'-오버행 말단부이거나, 별법으로 2개의 5'-오버행 말단부를 보유할 수 있다. 핵산 구성 블록이 조립되어 완성된 키메라 핵산 분자를 형성하는 과정의 전체적인 순서는 의도에 따른 실험 디자인에 의해 결정되는 것이지, 무작위로 결정되는 것은 아니다.

일부 실시태양에서, 핵산 구성 블록은 2개의 단일 가닥 핵산(단일 가닥 올리고라고도 칭함)을 화학적으로 합성하고, 이 핵산들을 접촉시켜, 서로 어닐링되어 이중 가닥 핵산 구성 블록을 형성하게 만듦으로써 생산된다. 이중 가닥 핵산 구성 블록은 다양한 크기를 가질 수 있다. 이러한 구성 블록의 크기는 작거나 클 수 있다. 구성 블록의 대표적인 크기는 1 염기쌍(어떠한 오버행 부분도 포함하지 않음)에서부터 100,000 염기쌍(어떠한 오버행 부분도 포함하지 않음)까지로 다양하다. 기타 대표적인 크기는, 최소 한계치 1bp 내지 10,000bp(이 사이의 모든 정수값)이고, 최고 한계치 2bp 내지 100,000bp(이 사이의 모든 정수값)이다.

본 발명에 유용한 이중 가닥 핵산 구성 블록을 생산할 수 있는 다수의 방법이 존재하며; 이러한 방법에 관하여는 당업계에 공지되어 있고, 당업자에 의해 용이하게 실시될 수 있다. 일부 실시태양에서, 이중 가닥 핵산 구성 블록은, 먼저 2개의 단일 가닥 핵산을 생성시킨 후, 이 핵산을 어닐링시켜 이중 가닥 핵산 구성 블록을 형성함으로써 생산된다. 이중 가닥 구성 블록 중 2개의 가닥은 오버행 부분을 형성하는 임의의 것으로부터 떨어져 존재하는 모든 뉴클레오티드에서 상보성일 수 있으므로; 임의의 오버행 부분으로부터 떨어져 존재하는 뉴클레오티드에는 미스매치가 발생하지 않는다. 또다른 실시태양에서, 이중 가닥 핵산 구성 블록을 이루는 2개의 가닥은 오버행 부분을 형성하는 임의의 부위로부터 떨어져 존재하는 모든 뉴클레오티드보다 상동성 정도가 더욱 낮다. 따라서, 이러한 실시태양에 따라, 이중 가닥 핵산 구성 블록은 코돈 축퇴성을 도입하는데에 사용될 수 있다. 일부 실시태양에서, 코돈 축퇴성은 본원에 기술된 위치-포화 돌연변이 유발법을 사용하거나, 하나 이상의 N, N, G/T 카세트를 사용하거나, 별법으로 하나 이상의 N, N, N 카세트를 사용하여 도입된다.

본 발명에 따른 생체내 재조합법은 특정 폴리뉴클레오티드 또는 서열의 미지의 하이브리드 또는 대립 형질 풀에 대하여 맹검 방식으로 실시될 수 있다. 그러나, 특정 폴리뉴클레오티드의 실제 DNA 또는 RNA 서열이 무엇인지는 알 필요는 없다. 혼합된 유전자 군집 내에서의 재조합법을 사용하는 접근법은 임의의 유용한 단백질 예를 들어, 본 발명에 따른 알돌라제 또는 그의 변이체를 생산하는데에 유용할 수 있다. 이러한 접근법은 변경된 특이성이나 활성을 갖는 단백질을 생산하는데에 사용될 수 있다. 이 접근법은 또한 하이브리드 핵산 서열 예를 들어, 유전자의 프로모터 부위, 인트론, 엑손, 인핸서 서열, 3' 비번역 부위 또는 5' 비번역 부위를 생산하는데에도 유용할 수 있다. 따라서, 이 접근법은 발현율이 증가한 유전자를 생산하는데에 사용될 수 있다. 상기 접근법은 또한 반복적 DNA 서열을 연구하는데에도 유용할 수 있다. 마지막으로, 상기 접근법은 본 발명에 따른 리보자임이나 앱타머를 제조하는데에 유용할 수 있다.

일부 실시태양에서, 본원에 기술된 본 발명은 매우 복잡한 선형 서열 예를 들어, DNA, RNA 또는 단백질을 재조합을 통하여 배향 분자 진화시킬 수 있도록 환원적 재분류법, 재조합법 및 선별법을 반복 수행하는 것에 관한 것이다.

최적화된 유도 진화 시스템

본 발명은 신규 특성 또는 변경된 특성을 갖는, 본 발명에 따른 폴리펩티드, 예로서, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 또는 항체를 생산하기 위한 유전자 변형 시스템 즉, 확률에 의하지 않는 유전자 변형 시스템, 소위 "최적화된 유도 진화 시스템"을 제공한다. 일부 실시태양에서, 최적화된 유도 진화는 재조합 과정을 통하여 핵산을 배향 분자 진화시킬 수 있도록 환원적 재분류법, 재조합법 및 선별법을 반복 수행하는 것에 관한 것이다.

최적화된 유도 진화를 통하여 진화된 키메라 서열의 다수의 군집을 생산할 수 있는데, 이때 생산된 군집에는 소정의 횟수만큼 교차 현상이 일어난 서열이 상당수 존재한다. 교차 현상은 서열 변이가 하나의 모체 변이체로부터 또다른 모체 변이체로 발생한 키메라 서열 중 한 지점에서 일어난다. 이러한 지점은 보통 2개의 모체 변이체로부터 유래하는 올리고뉴클레오티드가 함께 결찰되어 단일 서열을 형성하는 분기점에 존재한다. 본 방법은 올리고뉴클레오티드 서열의 정확한 농도를 계산할 수 있게 하여, 최종 키메라 서열 군집에 원하는 횟수만큼 교차 현상이 일어날 수 있도록 만든다. 이로써 교차 현상이 소정의 횟수만큼 일어난 키메라 변이체를 더욱 잘 선택할 수 있다.

추가로, 본 방법은 다른 시스템과는 달리, 다량의 생산 가능한 단백질 변이체 공간을 찾아내는 편리한 수단이 되기도 한다. 이미 기술한 바와 같이, 예를 들어, 반응을 통해 10¹³개의 키메라 분자가 생산되면, 이와 같이 다수의 키메라 변이체를 특정 활성에 대하여 시험하는 것이 매우 어려워진다. 더욱이, 자손 군집의 상당 부분에서는 특정 활성을 높은 수준으로 나타낼 것 같지 않은 단백질을 생산하는 교차 현상이 다수 일어날 것이다. 본 방법을 사용함으로써, 키메라 분자의 군집에는 교차 현상이 특정 횟수만큼 일어난 변이체가 다량 생산될 수 있다. 따라서, 반응을 통해 여전히 10¹³개의 키메라 분자가 생산될 수 있다고 하더라도, 추가의 분석을 위해 선택된 각 분자에서는 대부분 예를 들어, 3회의 교차 현상만이 일어날 것이다. 결과로 생성된 자손 군집은 교차 현상이 소정 횟수만큼만 일어나도록 편향될 수 있기 때문에, 키메라 분자간의 기능상 다양성에 대한 경계는 줄어든다. 이로써, 원래의 모체 폴리뉴클레오티드로부터 유래하는 올리고뉴클레오티드 중 어느 올리고뉴클레오티드가 특정 성질에 기여할 수 있는지를 알아낼 때에 사용될 다수의 변수들을 제공할 수 있게 되는 것이다.

키메라 자손 폴리뉴클레오티드 서열을 생산하는 한 가지 방법은 각 모체 서열의 단편이나 일부에 상응하는 올리고뉴클레오티드를 생산하는 것이다. 일부 실시태양에서, 각 올리고뉴클레오티드는 독특한 중첩 영역을 포함하는데, 그 결과, 올리고뉴클레오티드는 서로 혼합되어 각 올리고뉴클레오티드 단편이 올바른 순서로 조립된 신규 변이체가 생성된다. 별법으로, 본 발명의 방법을 실시하는 프로토콜에 관하여는 미국 특허 번호 제6,773,900호; 제6,740,506호; 제6,713,282호; 제6,635,449호; 제6,605,449호; 제6,537,776호; 및 제6,361,974호에서 찾아볼 수 있다.

각각의 모체 변이체에 대해 생산된 올리고뉴클레오티드의 수는 최종적으로 생산된 키메라 분자에서 일어난 교차 반응의 총 수와 관련이 있다. 예를 들어, 고온에서 보다 큰 활성을 나타내는 키메라 변이체를 찾기 위해서는 3개의 모체 뉴클레오티드 서열 변이체가 결찰 반응을 진행하도록 제공될 수 있을 것이다. 일례로서, 각 모체 변이체를 이루는 각 부분에 상응하는 50개의 올리고뉴클레오티드 서열로 이루어진 세트가 생산될 수 있다. 그러므로, 결찰 재조립 과정 중, 각각의 키메라 서열 내에는 50회 이하의 교차 현상이 일어날 수 있는 것이다. 생산된 키메라 폴리뉴클레오티드 각각이 순서가 뒤바뀐 각각의 모체 변이체로부터 유래하는 올리고뉴클레오티드를 함유하게 될 확률은 매우 낮다. 만일, 각각의 올리고뉴클레오티드 단편이 동 몰량으로 결찰 반응에 존재하게 되면, 동일한 모체 폴리뉴클레오티드로부터 유래하는 올리고뉴클레오티드내 위치 중 일부는 그 다음 위치에서 결찰될 것이므로, 교차 현상은 일어나지 않을 것이다. 만일 각각의 모체 폴리뉴클레오티드로부터 유래하는 각각의 올리고뉴클레오티드 농도가 이러한 예에서의 임의의 결찰 단계 동안 일정하게 유지되면, 동일한 모체 변이체로부터 유래하는 올리고뉴클레오티드가 키메라 서열 내에서 결찰되어 교차가 일어나지 않게 될 확률은(모체 변이체가 3개일 경우) 3분의 1로 줄어든다.

그러므로, 확률 밀도 함수(PDF: probability density function)는 결찰 반응을 구성하는 각 단계 중 각 변이체의 농도, 각 변이체에 상응하는 올리고뉴클레오티드 수, 모체 변이체의 세트 수가 주어졌을 때, 결찰 반응을 구성하는 각 단계가 진행되는 동안에 발생할 수 있는 교차 현상이 일어날 군집을 예측하도록 측정될 수 있다. 이 PDF를 측정하는 저변에 깔려있는 통계학과 수학에 관하여는 이하 기술되어 있다. 본 방법을 사용함으로써, 확률 밀도 함수를 계산할 수 있으며, 그 결과 특정 결찰 반응으로 인한 소정 수의 교차 현상이 일어나는 키메라 자손 군집은 증가하게 된다. 또한, 교차 현상이 일어나는 횟수가 미리 결정될 수 있으며, 이후 결찰 반응을 구성하는 각 단계가 진행되는 동안 각각의 모체 올리고뉴클레오티드의 출발 양을 계산하도록 프로그래밍된 시스템을 통하여, 교차 현상이 일어나는 소정의 횟수에 중점을 둔 확률 밀도 함수를 구할 수 있게 되는 것이다. 이러한 방법은 재조합을 통하여 폴리펩티드를 코딩하는 핵산의 배향 분자 진화를 가능하도록 하는 환원적 재분류법, 재조합법 및 선별법을 반복적으로 수행하는 것에 원리를 두고 있다. 이 시스템을 통하여, 다수의 진화된 키메라 서열 군집을 생산할 수 있는데, 여기서, 생산된 군집에는 소정 횟수의 교차 현상이 발생한 서열이 상당량 존재한다. 교차 현상은 서열 변이가 하나의 모체 변이체에서 다른 모체 변이체로 발생한 키메라 서열의 한 지점에서 일어난다. 이러한 지점은 보통 2개의 모체 변이체에서 유래하는 올리고뉴클레오티드가 함께 결찰되어 단일의 서열을 형성하는 분기점에 존재한다. 본 방법은 올리고뉴클레오티드 서열의 정확한 농도를 계산할 수 있게 하여, 최종 키메라 서열 군집에 원하는 횟수만큼 교차 현상이 일어날 수 있도록 만든다. 이로써 교차 현상이 소정의 횟수만큼 일어난 키메라 변이체를 더욱 잘 선택할 수 있게 된다.

또한, 본 방법은 다른 시스템과는 달리, 다량의 생산 가능한 단백질 변이체 공간을 찾아내는 편리한 수단이 되기도 한다. 본원에 기술된 방법을 사용함으로써, 키메라 분자의 군집에는 교차 현상을 특정 횟수만큼 나타내는 변이체가 다량 생산될 수 있다. 따라서, 반응을 통해 여전히 10¹³개의 키메라 분자가 생산될 수 있다고 하더라도, 추가의 분석을 위해 선택된 각 분자에는 대부분 예를 들어, 3회의 교차 현상만이 일어날 것이다. 결과로 생성된 자손 군집은 교차 현상이 소정 횟수만큼만 일어나도록 편향될 수 있기 때문에, 키메라 분자 간의 기능상 다양성에 대한 경계는 줄어든다. 이로써, 원래의 모체 폴리뉴클레오티드로부터 유래하는 올리고뉴클레오티드 중 어느 올리고 뉴클레오티드가 특정 성질에 기여할 수 있는지를 알아낼 때에 사용될 다수의 변수들을 제공할 수 있게 되는 것이다.

일부 실시태양에서, 키메라 자손 폴리뉴클레오티드 서열을 생산하는 한 가지 방법은 각 모체 서열의 단편이나 일부에 상응하는 올리고뉴클레오티드를 생산하는 것이다. 일부 실시태양에서, 각 올리고뉴클레오티드는 독특한 중첩 영역을 포함하는데, 그 결과, 올리고뉴클레오티드는 서로 혼합되어 각 올리고뉴클레오티드 단편이 올바른 순서로 조립된 신규 변이체가 생성된다. 예를 들어, 미국 특허 번호 제6,773,900호; 제6,740,506호; 제6,713,282호; 제6,635,449호; 제6,605,449호; 제6,537,776호; 및 제6,361,974호를 참조한다.

교차 현상의 측정

본 발명의 하나의 실시태양은, 원하는 교차 확률 밀도 함수(PDF), 재조립될 모체 유전자의 수, 그리고 재조립된 단편의 수를 입력하는 시스템 및 소포트웨어를 포함한다. 이 프로그램의 출력 결과는, 재조립된 유전자를 생산하는 레시피와 이 유전자의 측정 교차 PDF를 측정할 수 있는 "단편 PDF "이다. 일부 실시태양에서, 본원에 기술된 방법은 MATLAB™(매사추세츠주 나틱에 소재하는 The Mathworks) 프로그래밍 언어 및 기술에 의한 계산 방법과 관련된 개발 환경에서 실시된다.

반복적 방법

본 발명에 따른 임의의 절차는 반복적으로 진행될 수 있는데, 예를 들어, 변형되었거나 신규 알돌라제 표현형 예를 들어, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 코딩하는 본 발명에 따른 핵산은 동정, 재단리, 재변형 및 (활성에 대하여) 재시험될 수 있다. 이러한 방법은 원하는 표현형으로 조작될 때까지 반복적으로 진행될 수 있다. 예를 들어, 전체적인 생화학적 동화 경로 또는 이화 경로 예로서, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성은 세포 내로 조작되어 도입될 수 있다.

이와 유사하게, 만일 특정 올리고뉴클레오티드가 원하는 특성(예를 들어, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 표현형) 에 전혀 영향을 미치지 못하는 것으로 확인되면, 이는 제거될 서열을 포함하는 더욱 큰 모체 올리고뉴클레오티드를 합성함으로써 가변 요인으로서 제거될 수 있다. 상기 서열을 더욱 큰 서열 내에 통합하면 임의의 교차 현상이 일어나는 것을 방지할 수 있게 되므로, 자손 폴리뉴클레오티드 내에 존재하는 서열에서는 더 이상 어떠한 변이도 일어나지 않을 것이다. 어느 올리고뉴클레오티드가 원하는 특성과 가장 관련성이 많은지, 그리고 어느 올리고뉴클레오티드가 관련성이 없는지 여부를 결정하는 반복적 방법을 통하여, 특정 성질 또는 활성을 제공할 수 있는 가능한 단백질 변이체 모두를 보다 효과적으로 찾을 수 있다.

생체내 셔플링

다양한 실시태양에서, 분자의 생체내 셔플링은, 본 발명에 따른 폴리펩티드 변이체 예를 들어, 본 발명에 따른 항체 또는 본 발명의 알돌라제 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 등을 제공하는 본 발명의 방법에 사용된다. 생체내 셔플링은 다량체를 재조합하게 될 세포의 원래 성질을 사용하여 실시될 수 있다. 생체내 재조합법이 분자의 다양성에 대한 원래의 주요 접근 방법을 제공하였던 반면에, 유전자 재조합법은 1) 상동성의 인지; 2) 재조합 키아스마를 형성시키는 가닥 절단, 가닥 침입 및 대사 단계; 및 마지막으로 3) 키아스마를 개별 재조합 분자로 분배하는 것을 포함하는, 비교적 복잡한 과정을 포함한다. 키아스마 형성에는 상동성 서열을 인지하는 과정이 필요하다.

다른 실시태양에서, 본 발명은 적어도 제1 폴리뉴클레오티드와 제2 폴리뉴클레오티드로부터 하이브리드 폴리뉴클레오티드를 생산하는 방법을 포함한다. 일부 실시태양에서, 본 발명은 부분적으로 서열 동일성인 하나 이상의 영역을 공유하는 적어도 제1 폴리뉴클레오티드 및 제2 폴리뉴클레오티드(예를 들어, 이들 폴리뉴클레오티드 중 하나 또는 둘 모두, 예를 들어, 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 코딩 서열)를 적당한 숙주 세포에 도입함으로써 하이브리드 폴리뉴클레오티드를 생산하는데에 사용될 수 있다. 부분적으로 서열 동일성을 갖는 영역은 하이브리드 폴리뉴클레오티드를 생산하는 서열 재조직을 유도하는 방법을 촉진한다. 본원에 사용된 "하이브리드 폴리뉴클레오티드"란 용어는, 본 발명의 방법에 의해 생산된 것으로서, 2개 이상의 원래의 폴리뉴클레오티드 서열로부터 유래하는 서열을 함유하는 임의의 뉴클레오티드 서열을 의미하는 것이다. 이러한 하이브리드 폴리뉴클레오티드는 DNA 분자간 서열 통합을 촉진시키는 분자간 재조합 현상으로부터 유래할 수 있다. 또한, 이러한 하이브리드 폴리뉴클레오티드는 DNA 분자내 뉴클레오티드 서열을 변경시키기 위해서 반복 서열을 사용하는 분자내 환원적 재분류법으로부터 유래할 수도 있다.

일부 실시태양에서, 생체내 재분류법은 "분자간" 방법(총칭, "재조합법"이라 칭함)에 중점을 두는 방법으로서, 박테리아의 경우에는, 일반적으로 "RecA-의존성" 현상으로서 간주된다. 일부 실시태양에서, 본 발명은 서열을 재조합 및 재분류하기 위한 숙주 세포의 재조합 방법, 또는 세포가 환원적 방법을 매개하여 결실에 의해 세포 내에서 준-반복 서열의 복잡성을 감소시키는 능력에 의존할 수 있다. 이와 같은 "환원적 재분류" 방법은 "분자 내", RecA-독립적 과정에 의해 진행된다.

본 발명의 다른 실시태양에서, 신규의 폴리뉴클레오티드는 환원적 재분류법에 의해 생산될 수 있다. 본 방법은 연속된 서열(원래의 코딩 서열)을 함유하는 작제물을 생산하는 단계, 이 연속된 서열을 적절한 벡터에 삽입하는 단계와 이 벡터를 적절한 숙주 세포에 도입시키는 단계를 포함한다. 각각의 분자 아이덴티티를 재분류하는 방법은 상동성인 영역을 갖는 작제물내 연속된 서열 사이, 또는 준-반복 단위 사이에서 이루어지는 조합적 방법에 의해 일어난다. 재분류 방법은 반복 서열의 복잡성과 그 정도를 재조합 및/또는 감소시켜, 신규의 분자 종을 생산해낸다. 다양한 처리 방법을 적용하여 재분류율을 증가시킬 수 있다. 이러한 처리법으로서는 자외선, DNA 손상 화학 물질 및/또는 "유전자 불안정성" 수준이 증가한 숙주 세포주를 사용하는 방법을 포함한다. 따라서, 재분류 방법은 준-반복 서열을 상동성 재조합시키거나, 또는 이의 천연 특성을 사용하여 이 서열 나름대로의 진화를 유도하는 단계를 포함할 수 있다.

반복 서열 또는 "준-반복" 서열은 유전자 불안정성의 한 요인이 된다. 일부 실시태양에서, "준-반복부"는 서열의 원래의 단위 구조에 제한되지 않는 반복부이다. 준-반복 단위는 작제물 중 서열 어레이 즉, 유사한 서열의 연속된 단위로서 제공될 수 있다. 일단 결찰되면, 연속된 서열들 간 접합부는 근복적으로 눈에 띄지 않게 되며, 결과로 형성된 작제물의 준-반복적 성질은 분자적 수준에서 연속적으로 된다. 세포 내에서의 결실 과정은 준-반복 서열간에서 작용하는 작제물의 복잡성을 감소시킨다. 이러한 준-반복 단위는 서열 간 차이를 나타낼 수 있는, 주형의 실질적으로 무제한적인 레퍼토리를 제공한다. 따라서, 일부 실시태양에서, 상기 준-반복부를 함유하는 작제물은 결실(및 잠재적으로는 삽입) 현상이 준-반복 단위내 임의의 위치에서 실제로 일어날 수 있도록 분자의 융통성을 충분히 제공한다.

준-반복 서열이 모두 동일한 방향으로 결찰될 때(예를 들어, 두부→미부 또는 그 반대), 세포는 각각의 단위들을 구별할 수 없다. 결과적으로, 환원적 과정이 서열 전체에 걸쳐 진행될 수 있다. 이와는 반대로, 예를 들어, 이 단위들이 두부→미부보다는 두부→두부 방향으로 제공될 때, 이러한 역전 현상은 인접 단위가 끝나는 부분을 추론할 수 있도록 만들어 주며, 그 결과 결실부가 형성됨으로써 개별 단위의 손실이 촉진될 것이다. 따라서, 본 발명에 있어서는 상기 서열이 동일한 방향으로 존재하는 것이 바람직하다. 준-반복 서열의 무작위 배향은 재분류 효율을 상실시킬 것이지만, 이 서열의 일관성 있는 배향은 그 효율을 최고로 만들어줄 것이다. 그러나, 동일한 방향으로 존재하는 연속된 서열이 소수로 존재할 경우에는, 신규 분자를 효율적으로 회수하는데에 있어서 충분한 융통성이 발휘될 수 있을 것이다. 작제물은 준-반복 서열을 동일한 방향으로 배열시켜 그 효율을 더욱 높임으로써 제조될 수 있다.

서열은 다음의 사항들을 포함하는 다양한 방법 중 임의의 방법을 사용하여 두부→미부 방향으로 배향시켜 조립될 수 있다:

a) 단일 가닥로 제조될 때 배향을 결정할 폴리-A 두부 및 폴리-T 미부를 포함하는 프라이머의 사용. 이는 처음 몇몇 프라이머 염기가 RNA로부터 생성되고, 그 결과 RN아제H로 용이하게 제거됨으로써 이루어짐.

b) 독특한 제한 절단 위치를 포함하는 프라이머의 사용. 다수의 부위, 독특한 서열 배터리 및 반복 합성 단계 및 결찰 단계가 필요함.

c) 티올화되며, 엑소뉴클레아제를 사용하여 적절히 미부를 형성한 분자를 생산할 수 있는 내부의 몇몇 프라이머 염기들.

일부 실시태양에서, 상기 재분류된 서열의 회수 방법은 반복 지수(RI: repetitive index)가 감소된 클로닝 벡터를 동정하는 것과 관련되어 있다. 이어서, 상기 재분류된 코딩 서열은 증폭법에 의해 회수될 수 있다. 산물은 다시 클로닝되어 발현된다. RI가 감소된 클로닝 벡터를 회수하는 방법은 하기에 의해 영향받을 수 있다:

1) 작제물의 복잡성이 감소하였을 때에만 안정하게 유지되는 벡터의 사용.

2) 물리적 방법에 의해 단축된 벡터의 물리적 회수 방법. 이 경우, 클로닝 벡터는 표준적인 절차에 의한 아가로스 겔 또는 저 분자량 컷-오프를 사용하는 컬럼 상에서 크기별 분확화에 의하거나 또는 표준적인 플라스미드 분리법에 의해 회수될 것이다.

3) 인서트의 크기가 작아졌을 때 선택될 수 있는 방해 유전자를 함유하는 벡터의 회수.

4) 발현 벡터 및 적절한 선별법을 사용하는 직접 선별 기술의 사용.

관련된 유기체로부터 유래하는 코딩 서열(예를 들어, 유전자)은 고도의 상동성을 나타내며, 상당히 다양한 단백질 산물을 코딩할 수 있다. 이러한 유형의 서열은 준-반복부로서 본 발명에 특히 유용하다. 그러나, 이하에 기술된 예들은 거의 동일한 원래의 코딩 서열(준-반복부)의 재분류법에 관하여 기술하고 있는데, 본 방법은 거의 동일한 반복부를 사용하는 것에 한정되는 것은 아니다.

이하의 예는 본 발명에 따른 예시적 방법을 기술하는 것이다. 3개의 독특한 종으로부터 유래하는 핵산 서열(준-반복부)의 코딩에 관하여 기술되어 있다. 각각의 서열은 독특한 한 세트의 특성을 갖는 단백질을 코딩한다. 각각의 서열은 서열 내 독특한 위치에 존재하는 단일 염기쌍 또는 소수의 염기쌍에 의해 차이가 난다. 준-반복부 서열은 개별적으로 또는 총체적으로 증폭되어 무작위 조립체에 결찰되며, 그 결과, 결찰된 분자의 군집에는 가능한 모든 순열과 조합이 적용될 수 있다. 준-반복 단위의 수는 조립 조건에 의해 조절될 수 있다. 작제물내 준-반복 단위의 평균 수를 반복 지수(RI)라 정의한다.

일단 형성되면, 작제물은 공지된 프로토콜에 따라서 아가로스 겔 상에서 크기별로 분별화되고, 클로닝 벡터에 삽입되며, 적당한 숙주 세포내에 형질감염될 수 있거나 또는 될 수 없다. 이어서, 상기 세포들은 증식하게 되며, 이에 따라서 "환원적 재분류법"이 진행된다. 환원적 재분류법의 효율은 원하는 경우 DNA 손상을 도입함으로써 촉진될 수 있다. "분자내" 기작에 의해 반복 서열 간에 결실이 발생함으로 인하여 RI가 감소되는지 여부, 또는 "분자간" 기작을 통한 재조합-유사 현상에 의해 RI가 감소되는지 여부는 중요하지 않다. 최종 결과물은 생성가능한 모든 조합체에 분자를 재분류시킨 결과물이다.

경우에 따라, 방법은 소정의 거대 분자 예를 들어, 단백질성 수용체, 올리고당, 비리온 또는 기타 소정의 화합물 또는 구조물을 사용하여 셔플링된 풀의 라이브러리 구성원을 스크리닝함으로써, 특정 반응물(예를 들어, 효소의 촉매 도메인)에 결합하거나 상호작용하거나, 또는 특정 반응을 촉진시키는 능력을 갖는 각각의 셔플링된 라이브러리 구성원을 동정하는 단계를 추가로 포함한다.

이러한 라이브러리로부터 동정되는 폴리펩티드는 치료용, 진단용, 연구용 그리고 관련 목적(예를 들어, 촉매, 수용액 등의 삼투압을 증가시키기 위한 용질)으로 사용될 수 있고/거나, 하나 이상의 셔플링 및/또는 선별의 반복 과정을 추가로 진행시킬 수 있다.

다른 실시태양에서, 재조합 또는 재분류를 수행하기 이전에 또는 이를 수행하는 동안, 본 발명에 따른 방법에 의해 생산된 폴리뉴클레오티드는 돌연변이를 원래의 폴리뉴클레오티드에 도입시키는 것을 촉진시키는 제제 또는 방법으로 처리될 수 있다. 이러한 돌연변이의 도입을 통하여, 결과로 생성된 하이브리드 폴리뉴클레오티드와 이로부터 코딩되는 폴리펩티드의 다양성을 증가시킬 것이다. 돌연변이 유발을 촉진시키는 제제 또는 방법으로서는 (+)-CC-1065, 또는 합성 유사체 예를 들어, (+)-CC-1065-(N3-아데닌)(문헌 [Sun and Hurley, (1992)] 참조); DNA 합성을 억제할 수 있는 N-아세틸화 또는 탈아세틸화 4'-플루로-4-아미노비페닐 부가물(예를 들어, 문헌 [van de Poll et al., (1992)] 참조); 또는 DNA 합성을 억제할 수 있는 N-아세틸화 또는 탈아세틸화 4-아미노비페닐 부산물(예를 들어, 문헌 [van de Poll et al., (1992), pp. 751-758] 참조); DNA 복제를 저해할 수 있는 3가 크롬, 3가 크롬염, 다환형 방향족 탄화수소(PAH) DNA 부산물 예를 들어, 7-브로모메틸-벤즈[α]안트라센("BMA"), 트리스(2,3-디브로모프로필)포스페이트("트리스-BP"), 1,2-디브로모-3-클로로프로판("DBCP"), 2-브로모아크롤레인(2BA), 벤조[α]피렌-7,8-디하이드로디올-9-10-에폭시드("BPDE"), 백금(II) 할로겐 염, N-하이드록시-2-아미노-3-메틸이미다조[4,5f]-퀴놀린("N-하이드록시-IQ") 및 N-하이드록시-2-아미노-1-메틸-6-페닐이미다조[4,5-f]-피리딘("N-하이드록시-PhIP"). PCR 증폭 반응을 늦추거나 또는 정지시키는 대표적인 수단으로서는 UV 광선 (+)-CC-1065 및 (+)-CC-1065-(N3-아데닌)을 포함한다. 특히, 추가의 공정을 수행하기 이전에 폴리뉴클레오티드를 포함하는 용액을 가열하는 단계를 포함하는 방법에 의해 방출되거나 또는 제거될 수 있는, 폴리뉴클레오티드 또는 폴리뉴클레오티드 풀로부터 유래하는 DNA 부산물을 포함하는 폴리뉴클레오티드 또는 DNA 부산물도 포함된다.

다른 실시태양에서, 본 발명은 하이브리드 또는 재-분류된 폴리뉴클레오티드를 생산하는 본 발명에 의한 조건하에서, 야생형 단백질을 코딩하는 이중 가닥 주형 폴리뉴클레오티드를 포함하는 샘플을 처리함으로써 생물 활성을 갖는 재조합 단백질을 생산하는 방법에 관한 것이다.

서열 변이체의 생산

본 발명은 또한 본 발명에 따른 핵산 서열(예를 들어, 예로서, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소)의 서열 변이체를 생산하는 추가의 방법을 제공한다. 일부 실시태양에서, 본 발명은 또한 본 발명에 따른 핵산과 폴리펩티드를 사용하여 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 단리하는 추가의 방법을 제공하기도 한다. 일부 실시태양에서, 본 발명은 전술한 바와 같이, 임의의 수단, 예를 들어, 무작위 방법 또는 확률에 의하는 방법, 또는 확률에 의하지 않는 방법 즉, "유도 진화" 방법에 의해 변경될 수 있는, 본 발명의 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 코딩 서열(예를 들어, 유전자, cDNA 또는 메세지)의 변이체를 제공한다.

단리된 변이체는 천연적으로 발생될 수 있다. 변이체는 또한 시험관내에서 생산될 수도 있다. 변이체는 유전자 조작 기법 예를 들어, 위치 지정 돌연변이 유발법, 무작위 화학적 돌연변이 유발법, 엑소뉴클레아제 III 결실법과 표준적인 클로닝 기술을 사용하여 생산될 수 있다. 별법으로, 이러한 변이체, 단편, 유사체 또는 유도체들은 화학적 합성법이나 변형 방법을 사용하여 생산될 수 있다. 변이체를 생산하는 기타의 방법도 당업자에게 공지되어 있다. 이러한 방법으로서는 천연 단리물로부터 얻은 핵산 서열이 변형되어 산업 분야 또는 실험실에서의 사용 가치를 높인 폴리펩티드를 코딩하는 핵산을 생산하는 방법을 포함한다. 이러한 방법에 있어서, 천연 단리물로부터 얻어지는 서열과 상이한 뉴클레오티드를 하나 이상 갖는 다수의 변이체 서열이 생산되고 특징화된다. 이러한 뉴클레오티드 간 차이점은 천연 단리물로부터 유래하는 핵산에 의해 코딩되는 폴리펩티드에 비해 아미노산에 차이가 있을 수 있다.

예를 들어, 변이체는 오류 유발 PCR을 사용하여 생산될 수 있다. 오류 유발 PCR에 관한 일부 실시태양에서, PCR은 DNA 폴리머라제의 복사체 생성 신뢰도가 낮은 조건하에서 실시되며, 그 결과 PCR 산물의 전체 길이를 따라서 점 돌연변이가 높은 비율로 발생하게 된다. 오류 유발 PCR에 관하여는 예로서, 문헌 ([Leung (1989) Technique 1:11-15] 및 [Caldwell (1992) PCR Methods Applic. 2:28-33])에 개시되어 있다. 간단히 말해서, 이러한 방법에 있어서, 돌연변이될 핵산은 PCR 프라이머, 반응 완충액, MgCl₂, MnCl₂, Taq 폴리머라제, 그리고 적당한 농도의 dNTP와 혼합되어, PCR 생산물의 전체 길이를 따라서 점 돌연변이가 높은 비율로 발생하게 되는 것이다. 예를 들어, 반응은 돌연변이될 핵산 20fmoles, 30pmole의 각 PCR 프라이머, 5OmM KCl, 1OmM 트리스 HCl(pH 8.3) 및 0.01% 젤라틴, 7mM MgCl₂, 0.5mM MnCl₂, 5 유닛의 Taq 폴리머라제, 0.2mM dGTP, 0.2mM dATP, 1mM dCTP, 및 1mM dTTP를 포함하는 반응 완충액을 사용하여 수행될 수 있다. PCR은 94℃에서 1분 동안, 45℃에서 1분 동안, 그리고 72℃에서 1분 동안의 과정을 거치는 주기를 30회 수행함으로써 진행될 수 있다. 그러나, 이와 같은 매개 변수들은 적당히 바뀔 수도 있음을 이해할 것이다. 돌연변이 유발된 핵산은 적당한 벡터에 클로닝되고, 이 돌연변이 유발된 핵산에 의해 코딩되는 폴리펩티드의 활성이 평가된다.

일부 실시태양에서, 변이체는 올리고뉴클레오티드 배향 돌연변이 유발법을 사용하여 관심의 대상이 되는 임의의 클로닝된 DNA 내에 위치 특이적 돌연변이를 발생시킴으로써 생산된다. 올리고뉴클레오티드 돌연변이 유발법에 관하여는 예를 들어, 문헌 [Reidhaar-Olson (1988) Science 241:53-57]에 기재되어 있다. 간단히 말해서, 이러한 방법에 있어서는, 클로닝될 DNA에 도입될 하나 이상의 돌연변이를 보유하고 있는 다수의 이중 가닥 올리고뉴클레오티드가 합성된 후, 돌연변이를 유발시키기 위해 클로닝된 DNA에 삽입된다. 일부 실시태양에서, 돌연변이 유발된 DNA를 함유하는 클론은 회수 및 발현되고, 이 DNA에 의해 코딩되는 폴리펩티드의 활성이 평가된다.

변이체를 생산하는 또다른 방법으로서는 조립 PCR이 있다. 어셈블리 PCR은 작은 DNA 단편의 혼합물로부터 PCR 생산물을 조립하는 과정을 포함한다. 다수의 상이한 PCR 반응은 동일한 바이알 내에서 동시에 발생하는데, 이때 하나의 반응에서 생성된 산물은 다른 반응의 생산물을 프라이밍한다. 조립 PCR에 관하여는 예를 들어, 미국 특허 번호 제5,965,408호에 개시되어 있다.

일부 실시태양에서, 유성 PCR 돌연변이 유발법은 본 발명에 따른 변이체를 생산하는 대표적인 방법이다. 일부 실시태양에서, 유성 PCR 돌연변이 유발법 유도 상동성 재조합법은, 서열 동일성을 바탕으로 하는 DNA 분자의 무작위 단편화 이어서, PCR 반응에서의 프라이머 신장에 따른 교차 반응에 관한 고정의 결과로서, 상이하나 관련성이 매우 많은 DNA 서열의 DNA 분자간에 일어난다(시험관내). 유성 PCR 돌연변이 유발법에 관하여는 예를 들어, 문헌 [Stemmer (1994) Proc. Natl. Acad. Sci. USA 91:10747-10751]에 기술되어 있다. 간단히 말해서, 이러한 방법에 있어서, 재조합될 다수의 핵산은 DN아제로 분해되어, 평균 크기가 50-200 뉴클레오티드인 단편이 생산된다. 원하는 평균 크기를 갖는 단편을 정제하고, 이를 PCR 혼합물 중에 재현탁시킨다. PCR은 핵산 단편들간 재조합을 촉진하는 조건하에서 수행된다. 예를 들어, PCR은 농도 10-30ng/㎕의 정제된 단편들을, 각각의 dNTP 0.2mM, 2.2mM MgCl₂, 5OmM KCl, 1OmM 트리스 HCl(pH 9.0) 및 0.1% 트리톤 X-100으로 이루어진 용액 중에 재현탁함으로써 실시될 수 있다. 100㎕의 반응 혼합물당 2.5 유닛의 Taq 폴리머라제를 첨가하고, 다음과 같은 방식으로 PCR을 수행한다: 94℃에서 60초, 94℃에서 30초, 50-55℃에서 30초, 72℃에서 30초(30-45회), 그리고 72℃에서 5분. 그러나, 이러한 매개 변수들은 적당히 변형될 수 있음을 이해할 것이다. 일부 실시태양에서, 올리고뉴클레오티드는 PCR 반응에 포함될 수 있다. 다른 실시태양에서, DNA 중합 효소 I의 클레노우 단편은 PCR 반응의 제1 세트에 사용될 수 있으며, Taq 폴리머라제는 PCR 반응의 후속 세트에서 사용될 수 있다. 재조합 서열은 단리되고, 이 서열들이 코딩하는 폴리펩티드의 활성이 평가된다.

일부 실시태양에서, 변이체는 생체내 돌연변이 유발법에 의해 생산된다. 몇몇 측면에서, 관심의 대상이 되는 서열 내 무작위 돌연변이는 관심의 대상이 서열을, DNA 수복 경로 중 하나 이상의 과정에 돌연변이가 발생한 박테리아 균주 예를 들어, E. 콜라이 균주에서 증식시킴으로써 생산된다. 이와 같은 "돌연변이 유발자(mutator)" 균주는 야생형인 모체보다 무작위 돌연변이 발생률이 더 높다. 이러한 균주들 중 하나에서 DNA를 증식시킴으로써 DNA 내에 무작위 돌연변이를 영구적으로 발생시킬 수 있다. 생체내 돌연변이 유발법에 사용하기에 적당한 돌연변이 유발자 균주에 관하여는 PCT 공보 WO 91/16427(1991년 10월 31일 발행, 발명의 명칭: "Methods for Phenotype Creation from Multiple Gene Populations")에 개시되어 있다.

변이체는 또한 카세트 돌연변이 유발법을 사용하여 생산될 수도 있다. 카세트 돌연변이 유발법에 있어서, 이중 가닥 DNA 분자 중 작은 영역은 천연 서열과 상이한 합성 올리고뉴클레오티드 "카세트"로 대체된다. 상기 올리고뉴클레오티드는 종종 완전하고/거나 부분적으로 무작화된 천연 서열을 함유한다.

반복적 앙상블 돌연변이 유발법 또한 변이체를 생산하는데에 사용될 수 있다. 반복적 앙상블 돌연변이 유발법은, 돌연변이체의 구성원들이 아미노산 서열에 있어서 차이가 나는, 표현형이 관련된 돌연변이체의 다양한 군집을 생산하기 위해 개발된 단백질 조작용(단백질 돌연변이 유발용) 알고리즘이다. 본 방법은 조합 카세트 돌연변이 유발법의 연속적 라운드를 제어하는 피드백 기작을 사용한다. 반복적 앙상블 돌연변이 유발법에 관하여는 예를 들어, 문헌 [Arkin (1992) Proc. Natl. Acad. Sci. USA 89:7811-7815]에 개시되어 있다.

몇몇 측면에서, 변이체는 지수적 앙상블 돌연변이 유발법을 사용하여 생산된다. 지수적 앙상블 돌연변이 유발법은 독특하고 기능을 갖는 돌연변이체를 다수 갖는 조합형 라이브러리를 제조하는 방법으로서, 여기서, 잔기의 소 그룹은 동시에 무작위화되어, 각각의 변형된 위치에 있는 아미노산을 동정하며, 이때 상기 아미노산은 기능성 단백질을 합성한다. 지수적 앙상블 돌연변이 유발법에 관하여는 예를 들어, 문헌 [Delegrave (1993) Biotechnology Res. 11:1548-1552]에 개시되어 있다. 무작위 및 위치 지정 돌연변이 유발법에 관하여는 예를 들어, 문헌 [Arnold (1993) Current Opinion in Biotechnology 4:450-455]에 개시되어 있다.

일부 실시태양에서, 변이체는 별도의 폴리펩티드를 코딩하는 다수의 핵산 중 일부가 융합되어 키메라 폴리펩티드를 코딩하는 키메라 핵산 서열을 생산하는 셔플링 방법에 의해 생산된다[미국 특허 번호 제5,965,408호, 1996년 7월 9일 출원, 발명의 명칭: "Method of DNA Reassembly by Interrupting Synthesis" 및 미국 특허 번호 제5,939,250호, 1996년 5월 22일 출원, 발명의 명칭: "Production of Enzymes Having Desired Activities by Mutagenesis"].

본 발명에 따른 폴리펩티드의 변이체는, 본 발명에 다른 서열의 폴리펩티드를 이루는 아미노산 잔기들 중 하나 이상이 보존 또는 비보존 아미노산 잔기(일부 실시태양에서, 보존된 아미노산 잔기)로 치환되고, 이와 같이 치환된 아미노산 잔기는 유전자 코드에 의해 코딩되는 것일 수 있거나 또는 아닐 수 있는 변이체일 수 있다.

일부 실시태양에서, 보존적 치환은 폴리펩티드내 소정의 아미노산이 유사한 특성을 갖는 다른 아미노산으로 치환되는 경우이다. 일부 실시태양에서, 본 발명에 보존적 치환은 하기 치환들을 포함한다: 지방족 아미노산 예를 들어, 알라닌, 발린, 루신 및 이소루신의 다른 지방족 아미노산으로의 대체; 세린의 트레오닌으로의 대체 또는 그 반대; 산성 잔기 예를 들어, 아스파르트산 및 글루탐산의 또다른 산성 잔기로의 대체; 아미드기를 갖는 잔기 예를 들어, 아스파라긴 및 글루타민의 다른 잔기(아미드기를 갖는 잔기)로의 대체; 염기성 잔기 예를 들어, 리신 및 아르기닌의 다른 염기성 잔기로의 대체; 그리고 방향족 잔기 예를 들어, 페닐알라닌, 티로신의 다른 방향족 잔기로의 대체.

기타 변이체로서는 본 발명에 따른 폴리펩티드를 이루는 아미노산 잔기 중 하나 이상이 치환기를 포함하는 변이체가 있다. 일부 실시태양에서, 기타 변이체로서는 폴리펩티드가 다른 화합물 예를 들어, 폴리펩티드의 반감기를 증가시키는 화합물(예를 들어, 폴리에틸렌 글리콜)과 결합되어 있는 변이체가 있다. 추가의 변이체로서는 추가의 아미노산이 폴리펩티드 예를 들어, 리더 서열, 분비 서열, 프로 단백질 서열, 또는 폴리펩티드의 정제, 증폭 또는 안정화를 촉진시키는 서열에 융합되어 있는 변이체가 있다.

일부 실시태양에서, 단편, 유도체 및 유사체는 본 발명에 따른 폴리펩티드와 동일한 생물학적 기능 또는 활성을 보유한다. 다른 실시태양에서, 단편, 유도체 또는 유사체는 프로 단백질을 포함하므로, 이 단편, 유도체 또는 유사체는 이 프로 단백질의 일부를 절단하여 활성인 폴리펩티드를 생산함으로써 활성화될 수 있다.

숙주 세포 내에서 단백질 발현 수준을 높이기 위한 코돈의 최적화

본 발명은 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 코딩 핵산을 변형시켜 코돈 선호도를 변형시키는(예를 들어, 최적화시키는) 방법을 제공한다. 일부 실시태양에서, 본 발명은 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 코딩하는 핵산 내 코돈을 변형시켜 이 코돈의 숙주 세포에서의 발현을 증가 또는 감소시키는 방법을 제공한다. 일부 실시태양에서, 본 발명은 또한 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 코딩하는 핵산의 숙주 세포에서의 발현율을 증가시키도록 변형된, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 코딩하는 핵산, 이와 같이 변형된 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소, 그리고 이와 같이 변형된 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 제조하는 방법을 제공한다. 이러한 방법은 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 코딩 핵산 내 "비선호" 또는 "저선호" 코돈을 확인하는 단계와, 이와 같은 비선호 또는 저선호 코돈 중 하나 이상을 치환될 코돈에 의해 생성되는 아미노산과 동일한 아미노산을 코딩하는 "선호 코돈 "으로 치환하는 과정을 포함하며, 이때 핵산내에 존재하는 하나 이상의 비선호 코돈이나 저선호 코돈은 동일한 아미노산을 코딩하는 선호 코돈으로 치환된다. 선호 코돈은 숙주 세포내 유전자의 코딩 서열에 과출현하는 코돈이고, 비선호 또는 저선호 코돈은 숙주 세포내 유전자의 코딩 서열에 적게 출현하는 코돈이다.

본 발명에 따른 핵산, 발현 카세트 및 벡터를 발현시키는 숙주 세포로서는 박테리아, 효모, 진균, 식물 세포, 곤충 세포 및 포유동물 세포를 포함한다(상기 참조). 따라서, 본 발명은 이러한 세포들 모두에서의 코돈 선호도, 코돈-변경된 핵산 및 이 코돈-변경된 핵산에 의해 생산되는 폴리펩티드를 최적화하는 방법을 제공한다. 대표적인 숙주 세포로서는 그람 음성 박테리아 예를 들어, 에스케리키아 콜라이(Escherichia coli); 그람 양성 박테리아, 예를 들어, 스트렙토마이세스 종, 락토바실러스 가세리(Lactobacillus gasseri), 락토코커스 락티스(Lactococcus lactis), 락토코커스 크레모리스(Lactococcus cremoris), 바실러스 섭틸리스, 바실러스 세레우스를 포함한다. 대표적인 숙주 세포로서는 또한 진핵 생물 유기체 예를 들어, 다양한 효모 예를 들어, 사카로마이세스 종(Saccharomyces sp .) 예를 들어, 사카로마이세스 세레비지아에, 시조사카로미세스 폼베, 피치아 파스토리스 및 클루이베로미세스 락티스(Kluyveromyces lactis), 한세눌라 폴리모르파(Hansenula polymorpha), 아스퍼질러스 나이저(Aspergillus niger), 및 포유동물 세포 및 세포주, 그리고 곤충 세포 및 세포주를 포함한다. 따라서, 본 발명은 이러한 유기체와 종 내에서 발현에 최적화된 핵산 및 폴리펩티드를 포함한다.

예를 들어, 박테리아 세포로부터 단리된 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 코딩하는 핵산 코돈은 핵산이 상기 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소가 유래된 박테리아와 상이한 박테리아 세포, 효모, 진균, 식물 세포, 곤충 세포 및 포유동물 세포 내에서 최적으로 발현되도록 변형된다. 코돈을 최적화하는 방법은 당업계에 널리 공지되어 있다(미국 특허 번호 제5,795,737호; [Baca (2000) Int. J. Parasitol. 30:113-118]; [Hale (1998) Protein Expr. Purif. 12:185-188]; [Narum (2001) Infect. Immun. 69:7250-7253] 참조). 또한, 마우스 시스템내 코돈을 최적화하는 것에 관하여 기술하는 문헌 [Narum (2001) Infect. Immun. 69:7250-7253]; 효모내 코돈을 최적화하는 것에 관하여 기술하는 문헌 [Outchkourov (2002) Protein Expr. Purif. 24:18-24]; E. 콜라이내 코돈을 최적화하는 것에 관하여 기술하는 문헌 [Feng (2000) Biochemistry 39:15399-15409]; E. 콜라이 내에서의 분비에 영향을 미치는 코돈 선호도를 최적화하는 것에 관하여 기술하는 문헌 [Humphreys (2000) Protein Expr. Purif. 20:252-264]을 참조한다.

트랜스제닉 비인간 동물

본 발명은 본 발명에 따른 핵산, 폴리펩티드(예를 들어, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소), 발현 카세트 또는 벡터, 또는 형질감염 또는 형질전환된 세포를 포함하는 트랜스제닉 비인간 동물을 제공한다. 일부 실시태양에서, 본 발명은 또한 이러한 트랜스제닉 비인간 동물을 제조 및 사용하는 방법을 제공한다.

트랜스제닉 비인간 동물은 본 발명에 따른 핵산을 포함하는 것으로서, 예를 들면, 개, 염소, 토끼, 양, 돼지(예를 들어, 모든 돼지, 식용 돼지 및 관련 동물), 소, 래트 및 마우스일 수 있다. 이러한 동물들은 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 연구하기 위한 생체내 모델이나, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 생체내에서 변화시키는 제제에 대한 스크리닝 모델로서 사용될 수 있다. 트랜스제닉 비인간 동물 내에서 발현되는 폴리펩티드의 코딩 서열은 구성적으로 디자인될 수 있거나, 아니면 조직 특이적, 발달-특이적 또는 유도성 전사 조절 인자의 제어 하에 있도록 디자인될 수 있다.

트랜스제닉 비인간 동물은 당업계에 공지된 임의의 방법을 사용하여 디자인 및 생산될 수 있으며; 예를 들어, 형질전환된 세포 및 난자, 그리고 트랜스제닉 마우스, 래트, 토끼, 양, 돼지 및 소를 제조 및 사용하는 것에 관하여 기술하고 있는미국 특허 번호 제6,211,428호; 제6,187,992호; 제6,156,952호; 제6,118,044호; 제6,111,166호; 제6,107,541호; 제5,959,171호; 제5,922,854호; 제5,892,070호; 제5,880,327호; 제5,891,698호; 제5,639,940호; 제5,573,933호; 제5,387,742호; 제5,087,571호를 참조한다. 또한, 예로서, 트랜스제닉 낙농 동물의 밀크 중에 재조합 단백질을 생성하는 것에 관하여 기술하는 문헌 [Pollock (1999) J. Immunol. Methods 231:147-157]; 트랜스제닉 염소의 생산에 관하여 기술하는 문헌 [Baguisi (1999) Nat. Biotechnol. 17:456-461]을 참조한다. 미국 특허 번호 제6,211,428호에는, 뇌에서 DNA 서열을 포함하는 핵산 작제물을 발현하는 트랜스제닉 비인간 포유동물의 제조 및 사용 방법에 관하여 기술되어 있다. 미국 특허 번호 제5,387,742호에는, 클로닝된 재조합 또는 합성 DNA 서열을 수정된 마우스 난자에 주입하고, 이 주입된 난자를 가임신 암컷 마우스에 착상시킨 다음, 이 트랜스제닉 마우스를 생육하는 것에 관하여 기술되어 있다. 미국 특허 번호 제6,187,992호에는 트랜스제닉 마우스의 제조 및 사용에 관하여 기술되어 있다.

"넉아웃 동물"도 본 발명에 따른 방법을 실시하는데에 사용될 수 있다. 예를 들어, 일부 실시태양에서, 본 발명에 따른 트랜스제닉 동물 또는 변형 동물로서는, 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소, 또는 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 포함하는 융합 단백질을 발현하는 유전자로 치환된 내인성 유전자를 발현시키기 않도록 조작된 "넉아웃 동물 " 예를 들어, "넉아웃 마우스"를 포함한다.

트랜스제닉 식물 및 종자

본 발명은 본 발명에 따른 핵산, 폴리펩티드(알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소), 발현 카세트 또는 벡터, 또는 형질감염되었거나 형질전환된 세포를 포함하는 트랜스제닉 식물 및 종자를 제공한다. 본 발명은 또한 본 발명에 따른 핵산 폴리펩티드가 식물, 식물의 일부, 종자 등과 이종성인, 본 발명에 따른 핵산 및/또는 폴리펩티드(예를 들어, 자일라나제)를 포함하는 식물의 산물 또는 부산물, 예를 들어, 임의의 식물의 일부를 비롯한, 과실, 오일, 종자, 잎 및 추출물 등을 제공한다. 트랜스제닉 식물(식물의 일부, 과실, 종자 등 포함)은 쌍떡잎 식물(복엽) 또는 외떡잎 식물(단엽)일 수 있다. 일부 실시태양에서, 본 발명은 또한 이와 같은 트랜스제닉 식물 및 종자를 생산 및 사용하는 방법을 제공한다. 본 발명에 따른 폴리펩티드를 발현하는 트랜스제닉 식물 또는 식물 세포는 당업계에 공지된 임의의 방법에 의해 작제될 수 있다. 예를 들어, 미국 특허 제6,309,872호를 참조한다.

본 발명에 따른 핵산 및 발현 작제물은 임의의 수단을 통하여 식물 세포 내에 도입될 수 있다. 예를 들어, 핵산 또는 발현 작제물은 원하는 식물 숙주 게놈에 도입될 수 있거나, 또는 핵산 또는 발현 작제물은 에피좀일 수 있다. 원하는 식물 게놈으로의 도입은, 숙주의 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 생산이 내인성 전사 또는 번역 제어 요소에 의해 조절되도록 수행될 수 있다. 일부 실시태양에서, 본 발명은 또한 예를 들어, 상동성 재조합법에 의한 유전자 서열의 삽입에 의해 내인성 유전자의 발현이 파괴된 "넉아웃 식물"을 제공한다. "넉아웃" 식물을 생산하는 방법에 관하여는 당업계에 널리 공지되어 있다(문헌 ([Strepp (1998) Proc Natl. Acad. Sci. USA 95:4368-4373]; [Miao (1995) Plant J 7:359-365])를 참조). 이하, 트랜스제닉 식물에 관한 논의를 참조한다.

본 발명에 따른 핵산은 본질적으로 임의의 식물 예를 들어, 전분-생산 식물 예를 들어, 감자, 토마토, 대두, 비트, 옥수수, 밀, 쌀 및 보리 등에 원하는 특성을 부여하는데에 사용될 수 있다. 본 발명에 따른 핵산은 식물의 대사 경로를 조작하여 숙주의 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 발현을 최적화하거나 변경시키는데에 사용될 수 있다. 본 발명에 따른 핵산은 식물 내에서 천연적으로 생산된 화합물 또는 효소의 발현 또는 활성 수준을 변화시킬 수 있거나, 그의 특징을 변경시킬 수 있다. 별법으로, 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소는 상기 식물에 의해 천연적으로 생산되지 않는 화합물을 생산할 트랜스제닉 식물을 생산하는데에 사용될 수 있다. 이로써, 신규 산물 생산시 드는 비용을 절감할 수 있다.

일부 실시태양에서, 트랜스제닉 식물을 생산하는 제1 단계는 식물 세포 내에서 발현되는 발현 작제물을 제조하는 것을 포함한다. 이러한 기법은 당업계에 널리 공지되어 있다. 이러한 기술은 프로모터 즉, 리보좀이 mRNA에 효율적으로 결합하는 것을 촉진시키는 코딩 서열을 선별 및 클로닝하는 단계와, 적당한 유전자 종결 인자 서열을 선별하는 단계를 포함할 수 있다. 하나의 예시적인 구성 프로모터는 일반적으로 식물 내에서 높은 수준으로 발현되는, 꽃양배추 모자이크 바이러스로부터 유래하는 CaMV35S이다. 기타 프로모터로서는 식물의 내부 또는 외부 환경에 보다 특이적으로 반응하는 것이 있다. 대표적인 광-유도성 프로모터로서는 주요 엽록소 a/b 결합 단백질을 코딩하는 cab 유전자로부터 유래하는 프로모터가 있다.

일부 실시태양에서, 핵산은 식물 세포 내에서 더욱 다량으로 발현되도록 변형된다. 예를 들어, 본 발명에 따른 서열은 식물에서 살펴볼 수 있는 A-T 뉴클레오티드 쌍에 비해 더 높은 비율의 A-T 뉴클레오티드 쌍을 가질 것이며, 이들 중 일부는 G-C 뉴클레오티드 쌍을 더 선호한다. 그러므로, 코딩 서열 내에 존재하는 A-T 뉴클레오티드는 식물 세포 내에서 유전자 생산물의 생산을 증가시키는 아미노산 서열을 거의 변이시키지 않고서도 G-C 뉴클레오티드와 치환될 수 있다.

선별 가능한 마커 유전자는 트랜스진이 성공적으로 통합화된 식물 세포 또는 조직을 동정하기 위해 유전자 작제물에 가하여질 수 있다. 식물 세포에 유전자를 통합하여 이를 발현시키는 과정은 희귀한 현상으로서 표적화 조직 또는 세포 내에서 적은 비율로 발생하는 현상이기 때문에, 이는 필수적인 절차이다. 선별 가능한 마커 유전자는 보통 식물에 독성인 제제 예를 들어, 항생제나 제초제에 대한 내성을 제공하는 단백질을 코딩한다. 적당한 항생제 또는 제초제를 함유하는 배지에서 배양시켰을 때 선별 가능한 마커 유전자가 통합된 식물 세포만이 생존할 것이다. 기타 삽입된 유전자에 있어서, 마커 유전자는 또한 적절한 기능을 수행하기 위해서 프로모터와 종결 서열을 필요로 하기도 한다.

일부 실시태양에서, 트랜스제닉 식물 또는 종자를 제조하는데에는 프로모터와 종결 인자 서열을 배치함과 아울러, 본 발명에 따른 서열을 통합하는 과정을 포함하며, 경우에 따라는 마커 유전자를 표적 발현 구조물(예를 들어, 플라스미드)에 통합하는 과정을 포함하기도 한다. 이는 적합한 방법을 통하여 변형된 유전자를 식물로 운반하는 과정을 포함할 수 있다. 예를 들면, 작제물은 기법, 예를 들어, 식물 세포의 원형질체를 전기천공법 및 미세주입법을 사용하여 식물 세포의 게놈 DNA에 직접 도입될 수 있거나, 작제물은 탄도학적 방법 예를 들어, DNA 입자 분사법을 사용하여 식물 조직에 직접 도입될 수 있다. 예를 들어, 소맥에 트랜스진을 도입하기 위해 입자 분사법을 사용하는 것에 관하여 논의하고 있는 문헌 ([Christou (1997) Plant Mol. Biol. 35:197-203]; [Pawlowski (1996) Mol. Biotechnol. 6:17-30]; [Klein (1987) Nature 327:70-73]; [Takumi (1997) Genes Genet. Syst. 72:63-69])과, YAC를 식물 세포에 도입하는데에 입자 분사법을 사용하는 것에 관하여 논의하고 있는 문헌 [Adam (1997), 상기 문헌]을 참조한다. 예를 들어, 문헌 [Rinehart (1997), 상기 문헌]에는 트랜스제닉 목화 식물을 생산하기 위하여 입자 분사법을 사용하는 것에 관하여 논의되어 있다. 입자를 가속화하는 장치에 관하여는 미국 특허 번호 제5,015,580호에 기술되어 있으며; 또한, 바이오래드(BioRad)(Biolistics) PDS-2000 입자 가속 장치가 시판되고 있고; 또한, 미국 특허 번호 제5,608,148호(John); 및 겉씨 식물의 입자매개 형질전환에 관하여 기술하는 미국 특허 제5,681,730호(Ellis)도 참조한다.

일부 실시태양에서, 원형질체는 핵산 예를 들어, 발현 작제물과 함께 고정화되고 주입될 수 있다. 원형질체로부터 식물이 재생되는 것은 쉽지 않지만, 식물 재생은 원형질체 유도 캘러스로부터의 체성 배아 발생법을 사용하는 콩과 식물 재생법을 통해 이루어질 수 있다. 조직화된 조직은 유전자 총 기법을 사용하여 나출 DNA로 형질전환될 수 있는데, 여기서, DNA는, 세포 크기의 100분의 1에 해당하는 발포체로서 DNA를 세포와 기관의 심부까지 운반하는 텅스텐 미립 추진체(microprojectile) 상에 코팅되어 있다. 이어서, 형질전환된 조직은 일반적으로 체성 배아 발생법에 의해 재생이 유도된다. 이러한 기법은 옥수수 및 쌀을 포함하는 몇몇 시리얼 종 내에서 성공적으로 진행된다.

핵산 예를 들어, 발현 작제물은 또한 재조합 바이러스를 사용하여 식물 세포에 도입될 수도 있다. 식물 세포는 바이러스 벡터 예를 들어, 담배 모자이크 바이러스 유래 벡터를 사용하여 형질전환될 수 있다(문헌 [Rouwendal (1997) Plant Mol. Biol. 33:989-999]), 및 [Porta (1996) "Use of viral replicons for the expression of genes in plants," Mol. Biotechnol. 5:209-221] 참조).

별법으로, 핵산 예를 들어, 발현 작제물은 적합한 T-DNA 측면에 위치하는 영역과 결합하여 통상의 아그로박테리움 튜메페이션스 숙주 벡터 내로 도입될 수 있다. 아그로박테리움 튜메페이션스 숙주의 병독성 작용은 세포가 박테리아에 의해 감염될 때, 작제물과 인접한 마커를 식물 세포 DNA에 삽입시킬 것이다. 아그로박테리움 튜메페이션스-매개 형질전환 기법, 예를 들어, 이원성 벡터를 사용하여 무력화시키는 기법은 과학 논문에 상세히 기술되어 있다. 예를 들어, 문헌 ([Horsch (1984) Science 233:496-498]; [Fraley (1983) Proc . Natl . Acad . Sci . USA 80:4803 (1983)]; [Gene Transfer to Plants, Potrykus, ed. (Springer-Verlag, Berlin 1995)])을 참조한다. A. 튜메페이션스 세포의 DNA는 박테리아 염색체와 Ti(종양-유도성) 플라스미드라고 알려진 다른 구조물에 포함된다. 상기 Ti 플라스미드는 감염 과정에서 식물 세포로 전달되는 T-DNA(길이 ~20kb)라고 불리는 DNA 확장부와, 감염 과정을 유도하는 일련의 vir(병독성) 유전자를 포함한다. A. 튜메페이션스는 식물의 상처를 통하여서만 감염될 수 있으며: 식물 뿌리나 줄기에 상처가 나면, 임의의 화학 신호를 내보내게 되고, 이에 반응하여, A. 튜메페이션스의 vir 유전자는 활성화되어, Ti 플라스미드로부터 식물의 염색체로 T-DNA를 전달하는데에 필요한 일련의 현상들을 유도한다. 이어서, 상기 T-DNA는 상처를 통해 식물 세포로 유입된다. 하나의 가설로서는 식물 DNA가 복제 또는 전사될 때까지 T-DNA는 대기하고 있다가, 노출된 식물 DNA에 이 T-DNA가 삽입된다는 설이 있다. A. 튜메페이션스를 트랜스진 벡터로 사용하기 위해서는, T-DNA의 종양-유도 구획은 제거되어야 하며, 이때 T-DNA 경계 영역과 vir 유전자는 유지되어야 한다. 이어서, 상기 트랜스진은 T-DNA 경계 영역 즉, 식물 세포로 운반되어 식물의 염색체 내에 통합되는 영역 사이에 삽입된다.

본 발명은 본 발명에 따른 핵산을 사용하여 외떡잎 식물 예를 들어, 중요한 시리얼을 형질전환시키는 방법을 제공한다(문헌 [Hiei (1997) Plant Mol. Biol. 35:205-218] 참조). 또한 T-DNA의 게놈 DNA로의 통합에 관하여 논의하고 있는 문헌 ([Horsch, Science (1984) 233:496]; [Fraley (1983) Proc. Natl. Acad. Sci USA 80:4803]; [Thykjaer (1997) 상기 문헌]; [Park (1996) Plant Mol. Biol. 32: 1135-1148])을 참조한다. 또한, 시리얼 또는 기타 외떡잎 식물의 세포 내에서 기능을 갖는 유전자를 포함하는 DNA의 안정한 통합화 방법에 관하여 논의하고 있는 미국 특허 번호 제5,712,135호(D'Halluin)를 참조한다.

세번째 단계는 통합된 표적 유전자를 다음 세대에 전달할 수 있는 전체 식물을 선별 및 재생하는 단계를 포함한다. 이러한 재생 기법은 조직 배양 성장 배지 중에서 임의의 식물성 호르몬을 조작하는 원리를 사용할 수 있다. 일부 실시태양에서, 본 방법은 원하는 뉴클레오티드 서열과 함께 도입된 살생물제 및/또는 제초제 마커를 사용한다. 배양된 원형질체로부터 식물을 재생시키는 것에 관하여는 문헌 ([Evans et al., Protoplasts Isolation and Culture , Handbook of Plant Cell Culture, pp. 124-176, MacMillilan Publishing Company, New York, 1983]; 및 [Binding, Regeneration of Plants , Plant Protoplasts, pp. 21-73, CRC Press, Boca Raton, 1985])에 기술되어 있다. 재생은 또한 식물 캘러스, 외식편, 기관 또는 이의 일부로써 이루어질 수도 있다. 이러한 재생 기법에 관하여는 문헌 [Klee (1987) Ann. Rev. of Plant Phys. 38:467-486]에 개시되어 있다. 트랜스제닉 조직 예를 들어, 미성숙 배아로부터 전체 식물을 얻기 위해서는, 이 조직들은 영양분과 호르몬을 함유하는 연속 배지와 같은 제어 환경 조건하에서 배양될 수 있는데, 이 과정을 조직 배양이라고 한다. 일단 전체 식물이 생산되어 종자를 생산하게 되면, 자손의 평가가 시작된다.

일부 실시태양에서, 발현 카세트가 트랜스제닉 식물에 안정하게 통합화된 후, 이 발현 카세트는 유성 교잡에 의해 다른 식물에도 도입될 수 있다. 교잡될 종에 따라서 다수의 표준적 육종 기술 중 임의의 기술이 사용될 수 있다. 본 발명에 따른 핵산의 트랜스제닉 발현으로 인해 표현형에 변화가 올 수 있기 때문에, 본 발명에 따른 재조합 핵산을 포함하는 식물은 제2의 식물과 유성 교잡될 수 있으며, 그 결과 최종 산물을 얻을 수 있다. 따라서, 본 발명에 따른 종자는 본 발명에 따른 2개의 트랜스제닉 식물 사이의 교잡, 또는 본 발명에 따른 식물과 다른 식물 사이의 교잡으로부터 유래될 수 있다. 양쪽 모체 식물이 본 발명에 따른 폴리펩티드(예를 들어, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소)를 발현시킬 때, 바람직한 효과(예를 들어, 본 발명에 따른 폴리펩티드를 발현시켜, 개화 양식이 바뀐 식물이 생산되는 효과)는 강화될 수 있다. 원하는 효과는 표준적인 증식 방법에 의해 다음 식물 세대에 전달될 수 있다.

일부 실시태양에서, 본 발명에 따른 핵산 및 폴리펩티드는 임의의 식물 또는 종자에서 발현되거나 또는 여기에 삽입될 수 있다. 본 발명에 따른 트랜스제닉 식물은 쌍떡잎 식물이거나 또는 외떡잎 식물일 수 있다. 본 발명에 따른 외떡잎 트랜스제닉 식물로서는 목초 예를 들어, 방목용 목초(블루 그래스, 포아(Poa)), 마소의 먹사용인 목초 예를 들어, 김의털(festuca), 쥐보리(lolium), 북방형 목초 예를 들어, 아그로티스(Agrostis), 및 곡류 예를 들어, 밀, 귀리, 호밀, 보리, 쌀, 사탕수수 및 옥수수(강냉이)가 있다. 본 발명의 쌍떡잎 트랜스제닉 식물의 예로서는 담배, 콩과 식물 예를 들어, 루핀(lupin), 감자, 사탕 무우, 완두콩, 콩 및 대두와, 십자화과 식물(브라시카세아애(Brassicaceae)과 식물) 예를 들어, 꽃양배추, 유채씨, 및 매우 밀접하게 관련된 모델 유기체인 아라비돕시스 탈리아나(Arabidopsis thaliana)가 있다. 그러므로, 본 발명의 트랜스제닉 식물 및 종자로서는 광범위한 식물 예를 들어, 아나카르디움(Anacardium), 아라키스(Arachis), 아스파라거스(Asparagus), 아트로파(Atropa), 아베나(Avena), 브라시카(Brassica), 사이트러스(Citrus), 사이트룰러스(Citrullus), 캡시큠(Capsicum), 카타머스(Carthamus), 코코스(Cocos), 커피아(Coffea), 큐커미스(Cucumis), 큐커비타(Cucurbita), 다우커스(Daucus), 엘라에이스(Elaeis), 프래가리아(Fragaria), 글리신(Glycine), 가시피움(Gossypium), 헬리안투스(Helianthus), 헤테로캘리스(Heterocallis), 호르데움(Hordeum), 하이오스시아머스(Hyoscyamus), 락투카(Lactuca), 리늄(Linum), 롤륨(Lolium), 루피너스(Lupinus), 리코페르시콘(Lycopersicon), 말루스(Malus), 마니호트(Manihot), 마조라나(Majorana), 메디카고(Medicago), 니코티아나(Nicotiana), 올레아(Olea), 오라이자(Oryza), 패니움(Panieum), 패니세튬(Pannisetum), 페르세아(Persea), 파세올러스(Phaseolus), 피스타치아(Pistachia), 피섬(Pisum), 파이러스(Pyrus), 프루너스(Prunus), 라파누스(Raphanus), 리시누스(Ricinus), 세케일(Secale), 세네시오(Senecio), 시내피스(Sinapis), 솔라넘(Solanum), 소르검(Sorghum), 테오브로머스(Theobromus), 트리고넬라(Trigonella), 트리티쿰(Triticum), 비시아(Vicia), 비티스(Vitis), 비그나(Vigna) 및 지아(Zea) 속에 속하는 종을 포함하나, 이에 한정되는 것은 아니다.

대체 실시태양에서, 본 발명에 따른 핵산은 섬유 세포를 함유하는 식물 예를 들어, 목화, 판야 나무(카포크(Kapok), 세이바 펜탄듀라(Ceiba pentandura)), 사막 버드나무(desert willow), 크레어소트 덩굴(creosote bush), 윈터 팻(winterfat), 발사(balsa), 모시, 양마, 삼, 로젤, 주트, 사이잘 섬유 및 아마를 포함하는 식물 내에서 발현된다. 대체 실시태양에서, 본 발명에 따른 트랜스제닉 식물은 가시피움 속의 구성원 예를 들어, 가시피움 종들 예를 들어, G. 아르보레움(G. arboreum); G. 허바세움(G. herbaceum), G. 바바덴스(G. barbadense) 및 G. 허수텀(G. hirsutum)의 구성원들일 수 있다.

본 발명은 또한 본 발명에 따른 폴리펩티드(예를 들어, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 또는 항체)를 다량으로 생산하는데에 사용되는 트랜스제닉 식물을 제공한다. 예를 들어, 문헌 ([Palmgren (1997) Trends Genet. 13:348]; [Chong (1997) Transgenic Res. 6:289296])(아그로박테리움 튜메페이션스-매개 잎 절편 형질전환 방법을 통해, 옥신-유도성인 2방향 만노핀 신타제(mas 1',2') 프로모터를 사용하여 트랜스제닉 감자 식물 내에서 인간의 모유 단백질인 베타-카세인을 생산하는 방법)을 참조한다.

공지의 방법을 사용하였을 때, 당업자는 트랜스제닉 식물 내에서 트랜스진 mRNA 또는 단백질의 증가 또는 감소 여부를 확인함으로써 본 발명의 식물에 대해 스크리닝할 수 있다. mRNA 또는 단백질을 검출 및 정량하는 방법에 관하여는 당업계에 널리 공지되어 있다.

폴리펩티드 및 펩티드

일부 실시태양에서, 본 발명은 본 발명에 따른 서열, 예로서, 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 66, 서열 번호: 68, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162, 서열 번호: 164, 서열 번호: 166, 서열 번호: 168, 서열 번호: 170, 서열 번호: 172, 서열 번호: 174, 서열 번호: 176, 서열 번호: 178, 서열 번호: 180, 서열 번호: 182, 서열 번호: 184, 서열 번호: 186, 서열 번호: 188, 서열 번호: 190, 서열 번호: 192, 서열 번호: 194, 서열 번호: 196, 서열 번호: 198, 서열 번호: 200, 서열 번호: 202, 서열 번호: 204, 서열 번호: 206, 서열 번호: 208, 서열 번호: 210, 서열 번호: 212, 서열 번호: 214, 서열 번호: 216, 서열 번호: 218, 서열 번호: 220, 서열 번호: 222, 서열 번호: 224, 서열 번호: 226, 서열 번호: 228, 서열 번호: 230, 서열 번호: 232, 서열 번호: 234, 서열 번호: 236, 서열 번호: 238, 서열 번호: 240, 서열 번호: 242, 서열 번호: 244, 서열 번호: 246, 서열 번호: 248, 서열 번호: 250, 서열 번호: 252, 서열 번호: 254, 서열 번호: 256, 서열 번호: 258, 서열 번호: 260, 서열 번호: 262, 서열 번호: 264, 서열 번호: 266, 서열 번호: 268, 서열 번호: 270, 서열 번호: 272, 서열 번호: 274, 서열 번호: 276, 서열 번호: 278, 서열 번호: 280, 서열 번호: 282, 서열 번호: 284, 서열 번호: 286, 서열 번호: 288, 서열 번호: 290, 서열 번호: 292, 서열 번호: 294, 서열 번호: 296, 서열 번호: 298, 서열 번호: 300, 서열 번호: 302, 서열 번호: 304, 서열 번호: 306, 서열 번호: 308, 서열 번호: 310, 서열 번호: 312, 서열 번호: 314, 서열 번호: 316, 서열 번호: 318, 서열 번호: 320, 서열 번호: 322, 서열 번호: 324, 서열 번호: 326, 서열 번호: 328, 서열 번호: 330, 서열 번호: 332, 또는 서열 번호: 334에 제시된 서열을 갖는 단백질 및 그 효소 활성 단편과 서열 동일성(예로서, 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의, 또는 완벽한(100%) 서열 동일성 또는 상동성)을 갖는 단리된 합성 또는 재조합 폴리펩티드를 제공한다. 서열 동일성(%)는 전체 길이의 폴리펩티드에 걸쳐 존재할 수 있거나, 상기 동일성은 적어도 약 50개, 60개, 70개, 80개, 90개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개, 650개, 700개 또는 그 이상의 잔기의 영역에 걸쳐 존재할 수 있다.

본 발명의 몇몇 실시태양에 따른 폴리펩티드는 또한 전체 길이의 폴리펩티드보다 길이가 더욱 짧을 수 있다. 다른 실시태양에서, 본 발명은 크기 범위가 약 5 내지 전체 길이의 폴리펩티드인 폴리펩티드(펩티드, 단편), 예로서, 효소, 예로서, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 제공하며; 대표적인 크기는 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 중 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 100개, 125개, 150개, 175개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개, 650개, 700개 또는 그 이상의 잔기, 예로서, 연속된 잔기이다. 본 발명에 따른 펩티드(예로서, 본 발명에 따른 폴리펩티드의 부분서열)은 표지화 프로브, 항원(면역원), 저항원, 모티프, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성 부위(예로서, "촉매 도메인"), 신호 서열 및/또는 프리프로 도메인으로서 유용할 수 있다.

다른 실시태양에서, 알돌라제 활성, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 활성을 갖는 본 발명에 따른 폴리펩티드는 예를 들어, 피루베이트 활성 예로서, 제한없이, HMG 및/또는 KHG 알돌라제 활성을 비롯한 알돌라제 활성과 상관 있는 아미노산 잔기들 즉, 특정 구조적 요소를 공유하는 폴리펩티드 속에 해당하는 구성원이다. 이와 같이 공유하는 구조적 요소는 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 변이체를 통상적으로 생산하는데에 사용될 수 있다. 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소의 공유적 구조 요소들은, 본 발명에 따른 폴리펩티드 속 범주에 속하는 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 변이체를 통상적으로 생산함에 있어서 가이드로서 사용될 수 있다.

본원에서 사용되는 바, "알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제"란 용어는, 알돌 첨가 반응 또는 레트로-알돌 반응을 촉진시킬 수 있는 임의의 폴리펩티드 또는 효소(예로서, 본 발명에 따른 폴리펩티드, 표 1 및 하기의 실시예 4, 5 및 6도 참조), 또는 예로서, R-2-하이드록시 2-(인돌-3일메틸)-4-케토 글루타르산(R-MP) 및 특정 모나틴의 입체이성체, 예로서, R,R 및 S,R 모나틴, 및 그의 염의 생산에서 탄소-탄소 결합 함유 물질의 임의 변형을 촉진시킬 수 있는 임의의 폴리펩티드 또는 효소를 포함한다.

본 발명의 일부 실시태양에 따른 폴리펩티드는 알돌 반응에서 탄소-탄소 결합 형성을 촉진시키고, 하기 일반 도식에 나타낸 바와 같이 4-하이드록시-2-케토부티레이트 프레임워크 합성에서 친핵성 성분으로서 피루베이트 또는 포스포에놀피루베이트를 사용할 수 있는 능력을 갖고 있다.

이론으로 제한하지 않고, 모든 피루베이트 알돌라제-촉진 축합에서 제조된 보존적인 4-탄소 단편은 조밀하면서도 차별적으로 작용화된다고 여겨진다. 또한, 각 부가물에서 4개의 연속된 탄소에는 4개의 상이한 산화 상태의 탄소가 포함된다. 따라서, 하기 도식에 나타낸 바와 같이, 피루베이트 알돌라제에 의해 제조된 프레임워크를 통해 α-아미노-γ-하이드록시카복실산, β-하이드록시카복실산, α,γ-디하이드록시카복실산, 및 2-데옥시알돌라제 당이 제조될 수 있다.

그러므로, 본 발명의 실시태양에 따른 피루베이트 알돌라제는 다방면으로 합성될 수 있다. 동물 사료용, 인간 식품용, 산업 공정용 및 약제용의 광범위한 세품의 제조에 사용될 수 있다(예를 들면, 문헌 [Gijsen, H.J.M. et al., Recent Advances in the Chemoenzymatic Synthesis of Carbohydrates and Carbohydrate Mimetics, Chem. Rev. 1996, 96, 443-473]; [Henderson, D.P. et al. J. Org. Chem., Stereospecific Preparation of the N-Terminal Amino Acid Moiety of Nikkomycins KX and KZ via a Multiple Enzyme Synthesis, 1997, 62, 7910-7911]; [Wymer, N. & Toone, EJ. Enzyme-catalyzed Synthesis of Carbohydrates. Current Opin. Chemical Biology, 2000, 4, 110-119]) 참조).

본 발명의 일부 실시태양에 따른 폴리펩티드는 효소 활성, 특히, 알돌라제 활성 및 추가의 활성, 예를 들면, 하기 표 1에 제시된 것과 같은 활성 중 1 초과 유형의 것을 가질 수 있다. 예를 들면, 본 발명에 따른 폴리펩티드는 알돌라제 활성, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 활성을 가질 수 있다. 추가로, 폴리펩티드는 그의 EC 분류법에 기초하여 추가의 효소 활성을 가질 수 있거나, 갖는다고 판단될 수 있다. 표 1은 "예측되는 EC 번호"라 기재된 칸을 포함한다. EC 번호는 국제 생화학 및 분자 생물학 연맹(IUBMB: International Union of Biochemistry and Molecular Biology) 효소 협회의 명명 위원회에 의해 개발된 표준 효소 명명법 체계에 따라 효소 유형에 지정된 그의 번호이다. "예측되는 EC 번호"라 기재된 칸에 있는 결과는 Kegg(Kyoto Encyclopedia of Genes and Genomes) 데이타베이스에 대한 BLAST 검색으로 측정된 것이다. 탑 BLAST 매치(소위 "히트"로도 명명됨)가 e^-6이거나, e^-6 값 미만의 이밸류(Evalue)를 갖는다면, 탑 매치에 지정된 EC 번호가 표로 입력된다. 탑 히트의 EC 번호는 본 발명의 서열의 EC 번호가 무엇인지를 알려줄 수 있는 가이드로서 사용된다. 단지 일부의 EC 번호만이 제공된 경우, 탑 히트에 기초하여 광범위한 부류만이 지정될 수 있다. 예를 들면, 제1열의 서열 번호: 1에 의해 코딩되는 서열 번호: 2의 경우, 예측되는 EC번호는 "2..."로 열거된다. 그러므로, 지정된 분류법상 이는 광범위하게 트랜스퍼라제이다. 서열 번호: 25에 의해 코딩되는 서열 번호: 26의 경우, 탑 히트에 기초하여 지정될 수 잇는 가장 구체적인 분류법상 이는 알데히드-리아제이다.

[표 1]

본 발명에 따른 폴리펩티드 및 펩티드는 천연 공급원으로부터 분리될 수 있거나, 합성될 수 있거나, 또는 재조합적으로 생산될 수 있는 폴리펩티드이다. 펩티드 및 단백질은 시험관내 또는 생체내에서 재조합적으로 발현될 수 있다. 본 발명에 따른 펩티드 및 폴리펩티드는 당업계에 공지된 임의의 방법을 사용하여 제조 및 단리될 수 있다. 본 발명에 따른 폴리펩티드 및 펩티드는 또한 당업계에 널리 공지된 화학적 방법을 사용하여 전체적 또는 부분적으로 합성될 수도 있다. 예를 들어, 문헌 ([Caruthers (1980) Nucleic Acids Res. Symp. Ser. 215-223]; [Horn (1980) Nucleic Acids Res. Symp. Ser. 225-232]; [Banga, A.K., Therapeutic Peptides and Proteins, Formulation, Processing and Delivery Systems (1995) Technomic Publishing Co., Lancaster, PA])을 참조한다. 예를 들어, 펩티드 합성법은 다양한 고상 기법(예를 들어, 문헌 [Robert(1995) Science 269:202; Merrifield(1997) Methods Enzymol.289:3-13] 참조)을 사용하여 수행될 수 있으며, 자동화된 합성법은 제조자에 의해 제공되는 설명서에 따라서 예를 들어, ABI 431A 펩티드 합성기(Perkin Elmer)를 사용하여 진행될 수 있다.

본 발명에 따른 펩티드 및 폴리펩티드는 또한 당화될 수도 있다. 당화는 번역 후에 화학적 기작 또는 세포내 생합성 기작에 의해서 이루어질 수 있는데, 여기서, 상기 세포내 생합성 기작은 공지의 당화 모티프를 사용하며, 상기 모티프는 서열에 원래 존재하고 있는 것이거나 펩티드로서 첨가될 수 있거나, 또는 핵산 코딩 서열에 첨가될 수 있는 것이다. 당화는 O-결합 또는 N-결합될 수 있다.

일부 실시태양에서, 명시될 때, 본 발명에 따른 펩티드 및 폴리펩티드는 모든 "모사체 " 및 "펩티도모사체 " 형태의 것을 포함한다. "모사체" 또는 "펩티도모사체"란 용어는, 본 발명에 따른 폴리펩티드와 실질적으로 동일한 구조적 특징 및/또는 기능상의 특징을 갖는 합성 화학 화합물을 의미하는 것이다. 모사체는 합성 아미노산, 아미노산의 비천연 유사체로만으로 이루어질 수 있거나, 또는 일부는 천연 펩티드 아미노산으로, 일부는 아미노산의 비천연 유사체로 이루어진 키메라 분자일 수 있다. 보존적 치환이 모사체 구조 및/또는 활성을 실질적으로 변경시키지 않는 한, 상기 모사체는 임의의 양의 천연 아미노산의 보존적 치환을 포함할 수도 있다. 본 발명에 따른 폴리펩티드의 보존적 변이체 또는 이 폴리펩티드 속의 구성원인 본 발명에 따른 폴리펩티드(본 발명에 따른 서열과의 서열 동일성이 약 50% 이상인 폴리펩티드)를 사용하여 통상의 실험을 할 경우, 이 모사체가 본 발명에 따른 범주내 속하는지 여부 즉, 이 모사체의 구조 및/또는 기능이 실질적으로 변경되었는지 여부를 결정할 수 있다. 따라서, 일부 실시태양에서, 모사체 조성물이 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 가지면 이 모사체 조성물은 본 발명의 범주내 속하는 것이다.

본 발명에 따른 폴리펩티드 모사체 조성물은 비천연 구조 성분의 임의 조합물을 함유할 수 있다. 대안적 실시태양에서, 본 발명에 따른 모사체 조성물은 하기와 같은 3가지 구조의 기 중 하나 또는 전부를 포함한다: a) 천연 아미드 결합("펩티드 결합") 이외의 잔기 결합기; b) 천연적으로 발생된 아미노산 잔기를 대신하는 비천연 잔기; 또는 c) 2차 구조를 모의시키는 잔기 즉, 2차 구조, 예를 들어, 베타 선회부, 감마 선회부, 베타 병풍 구조, 알파 나선 구조 등을 유도 또는 안정화시키는 잔기. 예를 들어, 본 발명에 따른 폴리펩티드는 그 잔기 전부 또는 일부가 천연 펩티드 결합 이외의 화학적 수단에 의해 결합될 때 모사체로서 특징화될 수 있다. 각각의 펩티도모사체 잔기는 펩티드 결합, 기타 화학 결합 또는 커플링 수단 예를 들어, 글루타르알데히드, N-하이드록시숙신이미드 에스테르, 이작용성 말레이미드, N,N'-디사이클로헥실카르보디이미드(DCC: dicyclohexylcarbodiimide) 또는 N,N'-디이소프로필카르보디이미드(DIC: N,N'-diisopropylcarbodiimide)에 의해 결합될 수 있다. 통상의 아미드 결합("펩티드 결합")에 대안적일 수 있는 결합기로서는 예를 들어, 케토메틸렌(예를 들어,-C(=O)-NH-에 대한 -C(=O)-CH₂-), 아미노메틸렌(CH₂-NH), 에틸렌, 올레핀(CH=CH), 에테르(CH₂-O), 티오에테르(CH₂-S), 테트라졸(CN₄-), 티아졸, 레트로아미드, 티오아미드 또는 에스테르(문헌 [Spatola (1983), Chemistry and Biochemistry of Amino Acids, Peptides and Proteins, Vol. 7, pp 267-357, "Peptide Backbone Modifications," Marcell Dekker, NY] 참조)를 포함한다.

본 발명에 따른 폴리펩티드는 또한 천연적으로 발생된 아미노산 잔기 대신에 비천연 잔기 전부 또는 일부를 함유함으로써 모사체로서 특징화될 수 있다. 비천연 잔기는 과학 및 특허 문헌에 널리 기술되어 있으며; 천연 아미노산 잔기의 모사체로서 유용한 소수의 대표적인 비천연 조성물과 이에 대한 가이드라인은 하기에 기술한다. 방향족 아미노산의 모사체는 예를 들어, D- 또는 L-나필알라닌; D- 또는 L-페닐글리신; D- 또는 L-2 티에닐알라닌; D- 또는 L-1, -2, 3-, 또는 4-피레네일알라닌; D- 또는 L-3 티에네일알라닌; D- 또는 L-(2-피리디닐)-알라닌; D- 또는 L-(3-피리디닐)-알라닌; D- 또는 L-(2-피라지닐)-알라닌; D- 또는 L-(4-이소프로필)-페닐글리신; D-(트리플루오로메틸)-페닐글리신;D-(트리플루오로메틸)-페닐알라닌; D-p-플루오로-페닐알라닌; D- 또는 L-p-비페닐 페닐알라닌; D- 또는 L-p-메톡시-비페닐페닐알라닌; D- 또는 L-2-인돌(알킬)알라닌; 및, D- 또는 L-알킬아이닌(여기서, 알킬은 치환되거나 비치환된 메틸, 에틸, 프로필, 헥실, 부틸, 펜틸, 이소프로필, 이소-부틸, sec-이소틸, 이소-펜틸 또는 비-산성 아미노산일 수 있다)에 의해 대체됨으로써 생성될 수 있다. 비천연 아미노산의 방향족 환으로서는 예를 들어, 티아졸릴, 티오페닐, 피라졸릴, 벤즈이마다졸릴, 나프틸, 푸라닐, 피롤릴 및 피리딜 방향족 환을 포함한다.

산성 아미노산의 모사체는 예를 들어, 음 전하를 유지하는 비-카복실레이트 아미노산; (포스포노)알라닌; 황산화 트레오닌에 의해 생성될 수 있다. 카복실 측기(예를 들어, 아스파르틸 또는 글루타밀)는 또한 카르보디이미드(R'-N-C-N-R'), 예를 들어, 1-사이클로헥실-3(2-모폴리닐-(4-에틸)카르보디이미드 또는 1-에틸-3(4-아조니아-4,4-디메톨펜틸)카르보디이미드와 반응함으로써 선택적으로 변형될 수도 있다. 아스파틸 또는 글루타밀은 또한 암모늄 이온과의 반응에 의해서 아스파라기닐 및 글루타미닐 잔기로 전환될 수도 있다. 염기성 아미노산 모사체는 예를 들어, (리신 및 아르기닌 이외에) 아미노산인 오르니틴, 시트룰린 또는 (구아니디노)-아세트산 또는 (구아니디노)알킬-아세트산(여기서, 알킬은 상기 정의한 바와 같다)과의 치환에 의해 생성될 수 있다. 니트릴 유도체(예를 들어, COOH 대신 CN-부분 함유)는 아스파라긴 또는 글루타민에 대해 치환될 수 있다. 아스파라기닐 및 글루타미닐 잔기는 상응하는 아스파틸 또는 글루타밀 잔기로 탈아민화될 수 있다. 일부 실시태양에서, 알칼리성 조건하에서 아르기닌 잔기 모사체는 아르기닐과 예를 들어, 페닐글리옥살, 2,3-부탄디온, 1,2-사이클로-헥산디온 또는 닌히드린을 비롯한 하나 이상의 통상적인 시약을 반응시킴으로써 생성될 수 있다. 티로신 잔기 모사체는 티로실을 예를 들어, 방향족 디아조늄 화합물 또는 테트라니트로메탄과 반응시킴으로써 생성될 수 있다. N-아세틸이미디졸 및 테트라니트로메탄이 사용하여 O-아세틸 티로실 종과 3-니트로 유도체가 각각 생성될 수 있다. 시스테인 잔기 모사체는 시스테이닐 잔기와 예를 들어, 알파-할로아세테이트 예를 들어, 2-클로로아세트산 또는 클로로아세트아미드 및 상응하는 아민을 반응시킴으로써 생성될 수 있으며; 그 결과, 카복시메틸 또는 카복시아미도메틸 유도체가 생성된다. 시스테인 잔기 모사체는 또한 시스테이닐 잔기를 예를 들어, 브로모-트리플루오로아세톤, 알파-브로모-베타-(5-이미도조일)프로피온산; 인산클로로아세틸, N-알킬말레이미드, 이황화 3-니트로-2-피리딜; 이황화 메틸 2-피리딜; p-클로로머큐리벤조에이트; 2-클로로머큐리-4-니트로페놀; 또는 클로로-7-니트로벤조-옥사-1,3-디아졸과 반응시킴으로써 생성될 수도 있다. 리신 모사체는 리시닐과 예를 들어, 숙신산 또는 기타 카복시산 무수물을 반응시킴으로써 생성될 수 있다(그리고, 아미노 말단 잔기는 상기와 같이 반응하여 변형될 수 있다. 리신 및 기타 알파-아미노-함유 잔기 모사체는 또한 이미도에스테르 예를 들어, 메틸 피콜리니미데이트, 인산피리독살, 피리독살, 클로로보로하이드라이드, 트리니트로벤젠설폰산, O-메틸이소우레아, 2,4-펜탄디온과의 반응, 그리고 글리옥실레이트와의 트랜스아미다제-촉매 반응에 의해 생성될 수도 있다. 메티오닌의 모사체는 예를 들어, 설폭시화메티오닌과의 반응에 의해 생성될 수 있다. 프롤린 모사체로서는 예를 들어, 피페콜산, 티아졸리딘 카복시산, 3-또는 4-하이드록시 프롤린, 데하이드로프롤린, 3-또는 4-메틸프롤린 또는 3,3-디메틸프롤린을 포함한다. 히스티딘 잔기 모사체는 히스티딜을 예를 들어, 디에틸프로카보네이트 또는 브롬화 파라-브로모페나실과 반응시킴으로써 생성될 수 있다. 기타 모사체로서는 예를 들어, 프롤린과 리신의 히드록실화에 의해 생성된 것들; 세릴 또는 트레오닐 잔기의 하이드록실 기의 인산화에 의해 생성된 것들; 리신, 아르기닌 및 히스티딘의 알파-아미노기의 메틸화에 의해 생성된 것들; N-말단 아민의 아세틸화에 의해 생성된 것들; 주쇄 아미드 잔기의 메틸화 또는 N-메틸 아미노산과의 치환에 의해 생성된 것들; 또는 C-말단 카복실기의 아미드화에 의해 생성된 것들을 포함한다.

일부 실시태양에서, 본 발명에 따른 폴리펩티드의 잔기 예를 들어, 아미노산은 또한 반대의 키랄성을 갖는 아미노산(또는 펩티도모사체 잔기)에 의해 대체될 수도 있다. 일부 실시태양에서, L-배열(이는 또한 화학 실체의 구조에 따라서 R-형 또는 S-형이라고도 칭함)로 천연적으로 발생되는 임의의 아미노산은 동일하되, 반대의 키랄성을 갖는, D-아미노산으로 지칭될 뿐만 아니라, R-형 또는 S-형으로도 지칭되는 화학 구조형 또는 펩티도모사체인 아미노산으로 대체될 수 있다.

본 발명은 또한 천연의 가공, 예를 들어, 번역 후 가공(예를 들어, 인산화, 아실화 등), 또는 화학적 변형 기법에 의해 본 발명에 따른 폴리펩티드를 변형시키는 방법과, 그 결과 생성된 변형 폴리펩티드를 제공한다. 변형은 폴리펩티드 어느 위치에서나, 예를 들어, 펩티드 골격, 아미노산 측쇄 및 아미노 또는 카복실 말단부에서 일어날 수 있다. 동일한 유형의 변형이 소정의 폴리펩티드 중 몇몇 위치에서 동일한 정도로 또는 다양하게 존재할 수 있음을 알 수 있을 것이다. 또한, 소정의 폴리펩티드에는 여러 가지 유형의 변형이 일어날 수도 있다. 일부 실시태양에서, 변형의 예로서는 아세틸화, 아실화, ADP-리보실화, 아미드화, 플라빈의 공유 결합, 헴 부분의 공유 결합, 뉴클레오티드 또는 뉴클레오티드 유도체의 공유 결합, 지질 또는 지질 유도체의 공유 결합, 포스파티딜이노시톨의 공유 결합, 가교 결합 폐환화, 이황화 결합 형성, 탈메틸화, 공유 가교 결합의 형성, 시스테인의 형성, 피로글루타메이트의 형성, 포르밀화, 감마-카복실화, 글리코실화, GPI 앵커 형성, 하이드록실화, 요오드화, 메틸화, 미리스톨화, 산화, 페길화, 단백 분해 가공, 인산화, 프레닐화, 라세미화, 셀레노일화, 황산화 및 운반-RNA를 매개로 하는 아미노산의 단백질로의 첨가 반응, 예를 들어, 아르기닐화를 포함한다(예를 들어, 문헌 [Creighton, T.E., Proteins-Structure and Molecular Properties 2nd Ed., W.H. Freeman and Company, New York (1993)]; [Posttranslational Covalent Modification of Proteins, B.C. Johnson, Ed., Academic Press, New York, pp. 1-12 (1983)]) 참조).

고상 화학적 펩티드 합성법은 또한 본 발명에 따른 폴리펩티드 또는 단편을 합성하는데에 사용될 수도 있다. 그러한 방법은 1960년대 초부터 당업계에 공지되어 왔으며(문헌 [Merrifield, R. B., J. Am. Chem. Soc, 85:2149-2154, 1963])(문헌 [Stewart, J. M. and Young, J. D., Solid Phase Peptide Synthesis, 2nd Ed., Pierce Chemical Co., Rockford, Ill., pp. 11-12)]도 참조한다), 최근에는 시판중인 실험실용 펩티드의 디자인과 합성용 키트(Cambridge Research Biochemicals)에 사용되고 있다. 이와 같은 시판중인 실험실용 키트는 일반적으로 문헌 [H. M. Geysen et al, Proc. Natl. Acad. ScL, USA, 81 :3998 (1984)]에 교시된 사항을 활용한 것으로서, 단일 플레이트에 연결되어 있는 다수의 "막대" 또는 "핀"의 끝 부분에서 펩티드를 합성할 수 있는 것이다. 그러한 시스템이 사용될 경우, 막대 또는 핀이 존재하는 플레이트는 거꾸로 뒤집혀 상응하는 웰 또는 저장소의 제2 플레이트에 삽입되는데, 이때 상기 웰 또는 저장소에는 적당한 아미노산을 핀이나 막대의 끝 부분에 부착시키거나 고정하기 위한 용액이 담겨져 있다. 이러한 공정에 따른 단계를 반복함으로써, 즉, 상기 막대 및 핀의 끝 부분을 거꾸로 하여 적당한 용액에 담그는 과정을 반복함으로써, 아미노산은 원하는 펩티드로 구성된다. 뿐만 아니라, 다수의 사용가능한 FMOC 펩티드 합성 시스템이 사용가능하다. 예를 들어, 폴리펩티드 또는 단편의 조립은 어플라이드 바이오시스템즈 인크(Applied Biosystems, Inc.)의 모델 431 A(Model 431 A)™ 자동화 펩티드 합성기를 사용하여 고상 지지체상에서 수행될 수 있다. 이러한 장치는 기타 공지의 기법을 사용하여 커플링될 수 있는 일련의 단편을 합성하거나 또는 펩티드를 직접 합성하여 본 발명에 따른 펩티드를 용이하게 구할 수 있게 해준다.

본 발명에 따른 폴리펩티드로서는 활성 형태 또는 비활성 형태인 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 포함한다. 예를 들어, 본 발명에 따른 폴리펩티드는 예를 들어, "활성" 성숙 단백질을 생성하는 프로 단백질-가공 효소, 예를 들어, 프로단백질 전환 효소에 의해 프리프로 서열을 "성숙"시키기 전 또는 가공하기 전의 프로 단백질을 포함한다. 본 발명에 따른 폴리펩티드로서는 기타의 이유, 예를 들어, 번역 후 가공 예를 들어, 엔도-또는 엑소-펩티다제 또는 펩티다제의 작용, 인산화 현상, 아미드화, 당화 또는 황산화, 이합체화 등에 의해 "활성화"되기 이전이기 때문에 비활성인 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 포함한다. 본 발명에 따른 폴리펩티드는 효소의 모든 활성 형태의 것 예를 들어, 활성 부분서열 예를 들어, 효소의 촉매 도메인 또는 활성 부위를 포함한다.

본 발명은 고정화된 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소, 항-알돌라제, 예로서, 항-피루베이트 알돌라제, 예로서, 항-HMG 및/또는 항-KHG 알돌라제 항체 및 그의 단편을 포함한다. 일부 실시태양에서, 본 발명은 예를 들어, 본 발명에 따른 우성의 음성 돌연변이체 또는 항-알돌라제, 예로서, 항-피루베이트 알돌라제, 예로서, 항-HMG 및/또는 항-KHG 알돌라제 항체를 사용하여, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 저해시키는 방법을 제공한다. 일부 실시태양에서, 본 발명은 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 포함하는 이종복합체, 예를 들어, 융합 단백질 및 이종이합체 등을 포함한다.

일부 실시태양에서, 본 발명에 따른 폴리펩티드는 다양한 조건, 예를 들어, 극한의 pH 및/또는 온도와 산화제가 존재하는 등의 조건하에서, 또는 일부 실시태양에서는 산화제의 존재하에서 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 가질 수 있다. 일부 실시태양에서, 본 발명은 상이한 촉매 효능과 예를 들어, 온도, 산화제 및 세척 조건 교환시에 안정성을 갖는 대안적인 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 제제를 생산하는 방법을 제공한다. 일부 실시태양에서, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 변이체는 위치 지정 돌연변이 유발법 및/또는 무작위 돌연변이 유발법과 같은 기법을 사용하여 생산될 수 있다. 일부 실시태양에서, 유도 진화는 대안적인 특이성과 안정성을 갖는 다양한 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 변이체를 생산하는데에 사용될 수 있다.

본 발명에 따른 단백질은 또한 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소의 조정제, 예를 들어, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성의 활성화제 또는 저해제를 동정하는 연구용 시약으로서 유용하다. 간단히 말해서, 시험 샘플(화합물, 브로쓰 및 추출물 등)을, 효소가 기질 분해를 저해할 수 있는 능력을 측정하는 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 분석법에 첨가된다. 이러한 방식으로 동정된 저해제는 원치않는 단백 분해를 감소 또는 방지하기 위한 연구 및 산업 분야에 사용될 수 있다. 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 사용할 때, 저해제는 이에 결합하여 활성 범위를 증가시킬 수 있다.

본 발명에 따른 효소는 또한 단백질을 분해하거나 또는 단백질의 서열을 분석하는데 있어서 연구용 시약으로서도 유용하다. 예를 들어, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소는 이 폴리펩티드를 보다 작은 단편들로 분해하는데에 사용될 수 있으며, 그 결과, 예를 들어, 자동화 서열 분석기를 사용하여 서열을 분석할 수 있게 된다.

본 발명은 또한 본 발명에 따른 핵산, 폴리펩티드 및 항체를 사용하여 신규의 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 발견하는 방법도 제공한다. 일부 실시태양에서, 파지미드 라이브러리는 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소의 발현 여부를 바탕으로 하여 스크리닝된다. 다른 실시태양에서, 람다 파지 라이브러리는 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소의 발현 여부를 바탕으로 하여 스크리닝된다. 파지 또는 파지미드 라이브러리의 스크리닝을 통하여, 독성인 클론을 검출할 수 있고; 기질로의 접근 방식을 개선시킬 수 있으며; 라이브러리를 다량으로 분해함으로 인해 발생할 수 있는 오차의 발생 가능성을 없앰으로써 숙주를 조작할 필요성을 감소시킬 수 있고; 또한 클론의 밀도가 낮을 경우 이 클론을 더 신속하게 성장시킬 수도 있다. 파지 또는 파지미드 라이브러리의 스크리닝은 액상 또는 고상에서 진행될 수 있다. 일부 실시태양에서, 본 발명은 액상 스크리닝법을 제공한다. 이로써 분석 조건을 보다 융통성 있게 설정할 수 있으며; 기질도 더욱 융통성있게 선택할 수 있고; 약한클론에 대한 선택성을 한층 더 높일 수 있으며; 또한 고상 스크리닝에 대한 자동화를 용이하게 만들 수 있다.

본 발명은 본 발명에 따른 단백질 및 핵산과 수천개의 생체 촉매 반응을 실행할 수 있는 로봇 자동화 시스템을 사용하는 스크리닝 방법과, 단기간 예를 들어, 하루 동안 진행되는 스크리닝 분석법, 그리고 정확성과 재연 가능성의 수준을 높일 수 있는 스크리닝 방법을 제공한다(이하, 어레이에 관한 논의 참조). 그 결과, 유도체 화합물 라이브러리는 몇 주만 지나면 얻을 수 있게 된다. 분자 예를 들어, 소분자의 변형에 관한 추가의 교시에 관하여는 PCT/US94/09174 및 미국 특허 번호 제6,245,547호를 참조한다.

일부 실시태양에서, 본 발명에 따른 폴리펩티드 또는 단편은 생화학적 증폭 방법 또는 정제 방법을 통하여 얻어진다. 잠재적으로 상동성일 수 있는 폴리펩티드 서열 또는 단편은, 알돌라제 예를 들어, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 분석법(예를 들어, 이하, 실시예 3, 4 및 5 참조), 겔 전기영동 및/또는 미세서열 분석법에 의해 결정될 수 있다. 본 발명에 따른 각 폴리펩티드 서열 또는 단편은 전술한 프로그램 중 임의의 것을 사용하여, 본 발명에 따른 폴리펩티드, 또는 예를 들어, 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개, 또는 150개 또는 그 이상의 연속된 아미노산을 포함하는 단편과 비교될 수 있다.

본 발명의 또다른 실시태양은 본 발명에 따른 폴리펩티드의 효소적 기능을 갖는 본 발명에 따른 단편 또는 변이체를 동정하는 분석법에 관한 것이다. 예를 들어, 상기 폴리펩티드의 단편 또는 변이체는 생화학 반응을 촉진시키는데에 사용될 수 있는데, 이는 상기 단편 또는 변이체가 본 발명에 따른 폴리펩티드의 효소적 활성을 보유한다는 것을 시사하는 것이다. 변이체 단편이 본 발명에 따른 폴리펩티드의 효소적 활성을 갖는지 여부를 결정하기 위한 대표적인 분석법은 하기 단계들을 포함한다: 폴리펩티드 단편 또는 변이체가 기능을 할 수 있는 조건하에서 이 폴리펩티드 단편 또는 변이체를 기질 분자와 접촉시키는 단계, 및 기질 수준의 감소 또는 폴리펩티드와 기질 사이의 반응을 통한 특정 반응 산물 수준의 증가를 검출하는 단계.

본 발명은 효소의 독특한 촉매적 특성을 찾아낸다. 생체 촉매(즉, 정제된 효소 또는 미정제 효소, 죽은 세포 또는 살아 있는 세포)를 화학적 형질전환법에서 사용할 경우에는 보통 특정의 출발 화합물과 반응하는 특정의 생체 촉매를 동정하는 과정이 필요하지만, 본 발명은 다수의 출발 화합물, 예를 들어, 소분자에 존재하는 작용기에 특이적인 반응 조건 및 선택된 생체 촉매를 사용한다. 각각의 생체 촉매는 하나의 작용기 또는 몇몇 관련된 작용기에 특이적인 것으로서, 이러한 작용기를 함유하는 다수의 출발 화합물과 반응할 수 있다.

일부 실시태양에서, 생체 촉매 반응은 단일의 출발 화합물로부터 유도체 군집을 생산한다. 이러한 유도체는 생체 촉매 반응의 다른 경로에 사용되어, 유도체 화합물의 제2 군집을 생산할 수 있다. 원래의 소분자 또는 화합물에 일어나는 수천 가지의 변이는 각각의 생체 촉매 유도체화의 반복을 통해 일어날 수 있다.

효소는 이와 같은 분자의 나머지 과정, 즉, 통상의 화학적 방법을 통해서는 이루기 매우 어려운 과정에 영향을 미치지 않고서 출발 화합물의 특정 위치에서 반응한다. 고도한 생체 촉매 특이성은 라이브러리 내에 존재하는 단일의 활성 화합물을 동정하는 수단을 제공한다. 이 라이브러리는 이것을 생산하는데에 사용되는 일련의 생체 촉매 반응, 소위 "생합성 과정"이라는 것을 특징으로 한다. 생물학적 활성에 대해 라이브러리를 스크리닝하고, 생합성 과정을 추적함으로써, 활성 화합물을 생산하는 특이적인 반응의 순서를 확인할 수 있다. 반응 순서는 반복되고, 합성된 화합물의 구조는 측정된다. 이러한 방식의 확인법은 기타 합성법 및 스크리닝 방법과는 달리, 고정화 기술을 필요로 하지 않으며, 화합물은 실질적으로 임의의 유형의 스크리닝 분석법을 이용하여 용액 중에서 자유롭게 합성된 후 시험될 수 있다. 작용기 상에서의 효소 반응 특이성 정도가 높으면 생체 촉매 반응에 의해 생산된 라이브러리를 이루는 특정 효소 반응을 "이끌어"낼 수 있다는 점에 주목하는 것이 중요하다.

일부 실시태양에서, 공정에 따른 단계는 수천 가지의 생체 촉매 반응 및/또는 스크리닝 분석법을 하루 만에 수행할 수 있고, 정확도와 재연 가능성 수준을 높일 수 있는 로봇 자동화법을 사용하여 진행된다. 로봇 자동화법은 또한 폴리펩티드가 본 발명의 범주 내에 포함되는지 여부를 결정하기 위해 알돌라제 활성에 대해 스크리닝하는데에 사용될 수도 있다. 그 결과, 일부 실시태양에서, 유도체 화합물의 라이브러리는 "통상의" 화학적 또는 효소적 스크리닝 방법을 사용하여 생산할 경우에는 수년이 걸릴 수 있는 유도체 화합물을 수주일 이내에 생산할 수 있도록 만들어준다.

하나의 실시태양에서, 본 발명은 본원에 기술된 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드 또는 그 효소 활성 단편을 소분자와 접촉시켜 변형된 소분자를 생산하는 단계를 포함하는, 소분자를 변형시키는 방법을 제공한다. 변형된 소분자 라이브러리는, 원하는 활성을 나타내는 변형된 소분자가 라이브러리 내에 존재하는지 여부를 확인하기 위해 시험된다. 원하는 활성을 갖는 변형된 소분자를 생산하는 특이적 생체 촉매 반응은 라이브러리의 일부를 생산하는데에 사용되는 생체 촉매 반응을 각각 체계적으로 생략한 후, 라이브러리의 일부에서 생산되는 소분자를, 원하는 활성을 갖는 변형된 소분자가 존재하는지 아니면 존재하지 않는지 여부에 대해 시험함으로써 확인된다. 원하는 활성을 갖는 변형된 소분자를 생산하는 특이적 생체 촉매 반응은 임의적으로 반복 수행되기도 한다. 생체 촉매 반응은 소분자의 구조 내에서 발견되는 뚜렷한 구조적 부분과 반응하는 생체 촉매 군과 함께 진행되며, 여기서, 각각의 생체 촉매는 하나의 구조적 부분 또는 관련 구조 부분의 군에 특이적이고; 각각의 생체 촉매는 뚜렷한 구조적 부분을 함유하는 다수의 상이한 소분자와 반응한다.

알돌라제 , 예로서, 피루베이트 알돌라제 , 예로서, HMG 및/또는 KHG 알돌라제 효소 신호 서열, 프리프로 도메인 및 촉매 도메인

본 발명은 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 신호 서열(예로서, 신호 펩티드(SP)), 프리프로 도메인 및 촉매 도메인(CD)을 제공한다. 상기 본 발명에 따른 SP, 프리프로 도메인 및/또는 CD는 단리된 펩티드 또는 재조합 펩티드일 수 있거나, 또는 예를 들어, 융합 단백질의 일부, 예를 들어, 키메라 단백질내 이종 도메인일 수 있다. 일부 실시태양에서, 본 발명 이러한 촉매 도메인(CD), 프리프로 도메인 및 신호 서열(SP, 예를 들어, 본 발명에 따른 폴리펩티드의 아미노 말단 잔기를 포함하거나/이로 구성된 서열을 갖는 펩티드)을 코딩하는 핵산을 제공한다.

본 발명은 본 발명에 따른 폴리펩티드 예를 들어, 본 발명에 따른 폴리펩티드의 1번 내지 14번, 1번 내지 15번, 1번 내지 16번, 1번 내지 17번, 1번 내지 18번, 1번 내지 19번, 1번 내지 20번, 1번 내지 21번, 1번 내지 22번, 1번 내지 23번, 1번 내지 24번, 1번 내지 25번, 1번 내지 26번, 1번 내지 27번, 1번 내지 28번, 1번 내지 29번, 1번 내지 30번, 1번 내지 31번, 1번 내지 32번, 1번 내지 33번, 1번 내지 34번, 1번 내지 35번, 1번 내지 36번, 1번 내지 37번, 1번 내지 38번, 1번 내지 40번, 1번 내지 41번, 1번 내지 42번, 1번 내지 43번, 1번 내지 44번, 1번 내지 45번, 1번 내지 46번, 또는 1번 내지 47번 잔기 또는 그 이상에 제시된 바와 같은 서열로 구성되거나, 이 서열을 포함하는 단리된 합성 또는 재조합 신호 서열(예를 들어, 신호 펩티드)을 제공한다(이하, 표 1, 실시예 4, 5, 및 6, 및 서열 목록 참조). 예를 들어, 상기 표 1에는 본 발명에 따른 대표적인 신호(리더) 서열이 제시되어 있는데, 예를 들어, 서열 번호: 66에 제시된 서열을 갖는 폴리펩티드 예를 들어, 서열 번호: 65에 의해 코딩되는 폴리펩티드는 아미노 말단에 있는 27개의 잔기, 또는 서열 번호: 66의 처음 27개의 아미노산에 상응하는 MSIVVTKIERAGAAAVAALRTSGVATV(서열 번호: 407)를 포함하는(또는 이로써 구성된) 신호 서열을 갖는다.

일부 실시태양에서, 본 발명은 본 발명에 따른 폴리펩티드 중 처음 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개, 45개, 46개, 47개, 48개, 49개, 50개, 51개, 52개, 53개, 54개, 55개, 56개, 57개, 58개, 59개, 60개, 61개, 62개, 63개, 64개, 65개, 66개, 67개, 68개, 69개, 70개 또는 그 이상의 아미노 말단 잔기를 포함하는 신호 서열을 제공한다.

본 발명은 신호 서열 및/또는 프리프로 서열을 갖거나 또는 갖지 않는 폴리펩티드를 포함한다. 일부 실시태양에서,본 발명은 이종 신호 서열 및/또는 프리프로 서열을 갖는 폴리펩티드를 포함한다. 상기 프리프로 서열(이종 프리프로 도메인으로 사용되는 본 발명에 따른 서열 포함)은 단백질의 아미노 말단 또는 카복시 말단 종단에 위치할 수 있다. 일부 실시태양에서, 본 발명은 또한 본 발명에 따른 서열을 포함하는 단리된 합성 또는 재조합 신호 서열, 프리프로 서열 및 촉매 도메인(예를 들어, "활성 부위")을 포함한다. 본 발명에 따른 신호 서열을 포함하는 폴리펩티드는 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소일 수 있거나, 또는 또다른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소일 수 있거나, 또는 다른 효소나 다른 폴리펩티드일 수 있다. "프리프로 " 도메인 서열 및 신호 서열을 동정하는 방법에 관하여는 당업계에 널리 공지되어 있다(문헌 [Van de Ven (1993) Crit. Rev. Oncog. 4(2): 115-136] 참조). 예를 들어, 프리프로 서열을 동정하기 위해서, 단백질은 세포외 공간으로부터 정제되고, N-말단 단백질 서열은 결정되어 가공되지 않은 형태의 것과 비교된다.

본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 신호 서열(SP) 및/또는 프리프로 서열은 단리된 합성 또는 재조합 펩티드일 수 있거나, 또는 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 또는 비-알돌라제, 예로서, 비-피루베이트 알돌라제, 예컨대, 비-HMG 및/또는 비-KHG 알돌라제 폴리펩티드, 예로서, 융합(키메라) 단백질일 수 있다. 일부 실시태양에서, 본 발명은 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 신호 서열을 포함하는 폴리펩티드를 제공한다. 일부 실시태양에서, 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG및/또는 KHG 알돌라제 효소 신호 서열인 SP 및/또는 프리프로 서열을 포함하는 폴리펩티드는 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소에 이종성인 서열을 포함한다(예를 들어, 본 발명에 따른 SP 및/또는 프리프로 서열, 및 또다른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소로부터 유래하는 서열이나, 비-알돌라제, 예로서, 비-피루베이트 알돌라제, 예컨대, 비-HMG 및/또는 비-KHG 알돌라제 단백질로부터 유래하는 서열을 포함하는 융합 단백질). 일부 실시태양에서, 본 발명은 이종 SP 및/또는 프리프로 서열 예를 들어, 효모의 신호 서열을 갖는 서열을 포함하는 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 제공한다. 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소는 벡터, 예를 들어, pPIC 시리즈 벡터(캘리포니아주 칼스배드에 소재하는 Invitrogen) 내에 이종 SP 및/또는 프리프로 서열을 포함할 수 있다.

일부 실시태양에서, 본 발명에 따른 SP 및/또는 프리프로 서열은 하기와 같이 신규의 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 폴리펩티드를 동정함으로써 확인된다. 단백질이 분류되고 적당한 세포내 위치로 이동되는 경로를 종종 단백질 표적화 경로라고 부른다. 이와 같이 표적화 시스템 전부에 있어서 가장 중요한 요소 중 하나는 신호 서열이라고 불리는, 새로 합성된 폴리펩티드의 아미노 말단에 있는 짧은 아미노산 서열이다. 이러한 신호 서열은 단백질을 세포내 적당한 위치로 유도하고, 이동 중 제거되거나, 또는 단백질이 그의 최종 목적지에 도달할 때에 제거된다. 대부분의 리소좀, 막, 또는 분비형 단백질은 이를 세포질내 망상 조직 강으로 이동시키는 아미노-말단 신호 서열을 갖는다. 신호 서열은 길이 약 10 내지 65 이상의 아미노산 잔기로서 다양할 수 있다. 신호 서열을 인지하는 다양한 방법에 관하여는 당업자에게 공지되어 있다. 예를 들어, 일부 실시태양에서, 신규한 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 신호 펩티드는 시그날P(SignalP)라고 불리는 방법에 의해 동정된다. 시그날P는 신호 펩티드 및 그의 절단 위치를 모두 인지하는 통합된 신경망을 사용한다(문헌 [Nielsen (1997) "Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites." Protein Engineering 10:1-6]).

일부 실시태양에서, 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소는 SP 및/또는 프리프로 서열 또는 "도메인"을 갖지 않는다. 일부 실시태양에서, 본 발명은 SP 및/또는 프리프로 도메인의 전부 또는 일부가 결여된 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 제공한다. 일부 실시태양에서, 본 발명은 상이한 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소의 핵산 서열에 작동 가능하게 연결되어 있는, 하나의 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소로부터 유래하는 신호 서열(SP) 및/또는 프리프로 서열을 코딩하는 핵산 서열을 제공하며, 또는 경우에 따라, 비-알돌라제, 예로서, 비-피루베이트 알돌라제, 예컨대, 비-HMG 및/또는 비-KHG 알돌라제 단백질로부터 유래하는 신호 서열(SP) 및/또는 프리프로 도메인을 코딩하는 핵산 서열이 바람직할 수 있다.

본 발명은 또한 본 발명에 따른 신호 서열(SP), 프리프로 도메인 및/또는 촉매 도메인(CD)과 이종 서열을 포함하는 단리된 합성 또는 재조합 폴리펩티드를 제공한다. 상기 이종 서열은 천연적으로는(예를 들어, 효소에) SP, 프리프로 도메인 및/또는 CD와 결합되어 있지 않은 서열이다. 천연적으로는 SP, 프리프로 도메인 및/또는 CD와 결합하지 않는 서열은 SP, 프리프로 도메인 및/또는 CD의 아미노 말단 종단, 카복시 말단 종단, 및/또는 SP 및/또는 CD 둘 모두의 말단부 상에 존재할 수 있다. 일부 실시태양에서, 본 발명은 본 발명에 따른 신호 서열(SP), 프리프로 도메인 및/또는 촉매 도메인(CD)을 포함하는 폴리펩티드를 포함하는(또는 그로 구성된) 단리된 합성 또는 재조합 폴리펩티드를 제공하는데, 단, 이 폴리펩티드는 천연적으로 결합되는 임의의 서열(예를 들어, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 서열)과 결합되어 있지 않다. 이와 유사하게, 일부 실시태양에서, 본 발명은 이러한 폴리펩티드를 코딩하는 단리된 합성 또는 재조합 핵산을 제공한다. 따라서, 일부 실시태양에서, 본 발명에 따른 단리된 합성 또는 재조합 핵산은 본 발명에 따른 신호 서열(SP), 프리프로 도메인 및/또는 촉매 도메인(CD)에 대한 코딩 서열, 및 이종 서열(즉, 천연적으로 본 발명에 따른 신호 서열(SP), 프리프로 도메인 및/또는 촉매 도메인(CD)과 결합되어 있지 않는 서열)을 포함한다. 이종 서열은 SP, 프리프로 도메인 및/또는 CD 코딩 서열의 3' 말단 종단, 5' 말단 종단 및/또는 양 말단에 존재할 수 있다.

하이브리드 ( 키메라 ) 알돌라제 , 예로서, 피루베이트 알돌라제 , 예로서, HMG 및/또는 KHG 알돌라제 효소 및 펩티드 라이브러리

일부 실시태양에서, 본 발명은 본 발명에 따른 서열을 포함하는 하이브리드 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 및 융합 단백질 예를 들어, 펩티드 라이브러리를 제공한다. 본 발명에 따른 펩티드 라이브러리는 표적, 예로서, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 기질, 수용체 및 효소의 펩티드 조절제(예를 들어, 활성화제 또는 저해제)를 단리하는데에 사용될 수 있다. 본 발명에 따른 펩티드 라이브러리는 표적의 형태상 결합 파트너, 예를 들어, 리간드 예를 들어, 사이토카인 및 호르몬 등을 동정하는데에 사용될 수 있다. 일부 실시태양에서, 본 발명은 본 발명에 따른 신호 서열(SP), 프리프로 도메인 및/또는 촉매 도메인(CD)이나, 상기의 것들의 조합체와 이종 서열을 포함하는 키메라 단백질을 제공한다(상기 참조).

일부 실시태양에서, 본 발명에 따른 융합 단백질(예를 들어, 펩티드 부분)은 (선형 펩티드에 비해) 형태적으로 안정화되어 표적에 대한 결합 친화도가 더욱 높을 수 있다. 일부 실시태양에서, 본 발명은 본 발명에 따른알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소와 기타 펩티드 예를 들어, 공지의 펩티드 및 무작위 펩티드로 이루어진 융합체를 제공한다. 이 융합체를 구성하는 요소들은 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소의 구조를 유의적으로 교란시키지 않는 방식으로 융합될 수 있으며, 펩티드는 대사적으로 또는 구조적으로 형태학상 안정화된다. 이로써, 세포 내에 융합체가 존재하는지 여부와 이 융합체의 양을 용이하게 모니터할 수 있는 펩티드 라이브러리를 제조할 수 있다.

본 발명에 따른 아미노산 서열 변이체는 예정된 변이 특징 즉, 이 변이체를 천연적으로 발생된 형태와 동떨어지게 만드는 특징 예를 들어, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 서열의 대립 형질 또는 종간 변이에 따른 특성을 특징으로 할 수 있다. 일부 실시태양에서, 본 발명에 따른 변이체는 천연적으로 발생된 유사체와 동일한 성질의 생물학적 활성을 나타낸다. 별법으로, 상기 변이체는 변형된 특징을 갖는지 여부에 대하여 선택될 수 있다. 일부 실시태양에서, 아미노산 서열 변이를 도입시키기 위한 위치나 부위가 예정될 경우, 돌연변이 자체는 예정되어 있을 필요가 없다. 예를 들어, 정해진 위치에서의 돌연변이를 최적으로 수행하기 위해서는, 표적 코돈이나 영역에서 무작위 돌연변이 유발법이 수행될 수 있는 것이며, 발현된 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 변이체는 원하는 활성을 최적으로 조합한 활성을 갖는지 여부에 대하여 스크리닝될 수 있다. 본원에 기술된 바와 같이, 공지의 서열을 갖는 DNA내 예정된 위치에 치환 돌연변이를 일으키는 기술은 널리 공지되어 있으며, 그 예로서는 M13 프라이머 돌연변이 유발법 및 PCR 돌연변이 유발법이 있다. 돌연변이체를 스크리닝하는 방법은 예로서, 탄소-탄소 결합 형성 또는 절단 분석법을 이용하여 수행될 수 있다. 다른 실시태양에서, 아미노산 치환은 단일 잔기에서 일어날 수 있으며; 삽입은 약 1개 내지 20개의 아미노산에서 일어날 수 있는데, 다만, 더욱 큰 부분이 삽입될 수도 있다. 결실은 약 1개 내지 20개, 30개, 40개, 50개, 60개 또는 70개 또는 그 이상의 잔기 범위에서 일어날 수 있다. 최적의 특성을 갖는 최종 유도체를 얻기 위해서는, 치환, 결실, 삽입 또는 그의 조합을 사용할 수 있다. 일반적으로, 이러한 변화들은 분자가 최소한으로 변형된 소수의 아미노산에서 발생된다. 그러나, 더욱 큰 변화는 임의의 환경에서 관용될 수 있다.

본 발명은 폴리펩티드 골격 구조, 2차 또는 3차 구조 예를 들어, 알파-나선 구조 또는 베타-병풍 구조가 변형된, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 제공한다. 일부 실시태양에서, 이러한 변화 또는 소수성은 변형될 수 있다. 일부 실시태양에서, 측쇄 벌크는 변형된다. 기능 또는 면역원성 아이덴티티에 일어난 실질적인 변화는 덜 보존적인 치환부를 선택함으로써 일어나게 된다. 예를 들어, 변형이 일어난 구역에 존재하는 폴리펩티드 골격의 구조 예를 들어, 알파-나선 구조 또는 베타-병풍구조; 활성 위치에 있을 수 있는 분자의 전하 또는 소수성 위치; 또는 측쇄에 더욱 많은 영향을 미치는 치환이 일어날 수 있다. 일부 실시태양에서, 본 발명은 (a) 소수성 잔기 예를 들어, 세릴 또는 트레오닐이 소수성 잔기 예를 들어, 류실, 이소류실, 페닐알라닐, 발릴 또는 알라닐에 대해(또는 ∼에 의해) 치환되는 경우; (b) 시스테인 또는 프롤린이 임의의 기타 잔기에 대해(또는 ∼에 의해) 치환되는 경우; (c) 양전기성을 띠는 측쇄를 갖는 잔기 예를 들어, 리실, 아르기닐 또는 히스티딜이 음전기성을 띠는 잔기 예를 들어, 글루타밀 또는 아스파틸에 대해(또는 ∼에 의해) 치환되는 경우; 또는 (d) 벌크한 측쇄를 갖는 잔기 예를 들어, 페닐알라닌이 측쇄를 갖지 않는 아미노산 예를 들어, 글리신에 대해(또는 ∼에 의해) 치환될 경우의 본 발명에 따른 폴리펩티드에서의 치환을 제공한다. 변이체는 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소의 특성이 필요에 따라서 변형되도록 선택될 수 있지만, 이 변이체는 동일한 특징의 생물학적 활성(즉, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성)을 나타낼 수 있다.

일부 실시태양에서, 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소는 에피토프 또는 정제용 태그, 신호 서열 또는 기타 융합 서열 등을 포함한다. 일부 실시태양에서, 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소는 무작위 펩티드에 융합되어 융합 폴리펩티드를 형성할 수 있다. 본원에 있어서, "융합된" 또는 "작동 가능하게 연결된"이란, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 구조의 안정성이 파괴되는 것을 최소화하도록, 예를 들어, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 보유하도록, 무작위 펩티드 및 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소가 함께 연결되어 있음을 의미하는 것이다. 상기 융합 폴리펩티드(또는 이 융합 폴리펩티드를 코딩하는 융합 폴리뉴클레오티드)는 추가의 성분 예를 들어, 다수의 루프에 존재하는 다수의 펩티드를 포함할 수도 있다.

일부 실시태양에서, 펩티드와 이 펩티드를 코딩하는 핵산은 완전히 무작위 방식으로, 또는 예를 들어, 일반적으로는 뉴클레오티드/잔기가 출현할 때마다 즉, 이것이 존재하는 위치마다 무작위화가 편중되어 이루어지는 방식으로 무작위화된다. "무작위화된"이란, 각각의 핵산 및 펩티드가 각각 본질적으로 무작위한 뉴클레오티드 및 아미노산으로 이루어져 있음을 의미하는 것이다. 일부 실시태양에서, 펩티드를 합성하는 핵산은 화학적으로 합성될 수 있으므로, 임의의 위치에 임의의 뉴클레오티드를 통합할 수 있다. 따라서, 핵산이 발현되어 펩티드를 형성할 때, 임의의 아미노산 잔기는 임의의 위치에 통합될 수 있다. 합성 과정은 무작위화된 핵산을 생성하고, 일정 길이의 핵산에 걸쳐서 생성될 수 있는 핵산들의 조합 모두 또는 대부분을 형성하여, 무작위화된 핵산으로 이루어진 라이브러리를 생성할 수 있도록 디자인될 수 있다. 상기 라이브러리는 무작위화된 발현 산물의 구조적으로 매우 다양한 군집을 형성하여, 확률적으로 충분한 범위의 세포 반응에 영향을 미쳐 원하는 반응을 나타내는 하나 이상의 세포를 제공할 수 있다. 따라서, 본 발명은 충분히 큰 상호 작용 라이브러리를 제공하므로, 라이브러리 구성원 중 하나 이상은 몇몇 분자, 단백질 또는 기타 인자에 대한 친화성을 가지도록 만드는 구조를 갖게 될 것이다.

일부 실시태양에서, 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소는 신호 펩티드, 탄수화물 결합 모듈, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 촉매 도메인, 링커 및/또는 또다른 촉매 도메인을 포함하는 다중도메인 효소이다.

본 발명은 생물학적으로 활성인 하이브리드 폴리펩티드(예를 들어, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소)를 코딩할 수 있는 키메라 폴리펩티드를 생성하는 방법 및 서열을 제공한다. 일부 실시태양에서, 원래의 폴리뉴클레오티드(예를 들어, 본 발명에 따른 핵산)는 생물학적으로 활성인 폴리펩티드를 코딩한다. 일부 실시태양에서, 본 발명에 따른 방법은 원래의 폴리뉴클레오티드 서열을 통합하여, 결과로 생성된 하이브리드 폴리뉴클레오티드가 생물학적으로 활성인 원래의 폴리펩티드(예를 들어, 본 발명에 따른 알돌라제 또는 항체)로부터 유래하지만 상이한 활성을 나타내는 폴리펩티드를 코딩하도록 만드는, 세포 과정을 사용함으로써 신규의 하이브리드 폴리펩티드를 생산한다. 예를 들어, 원래의 폴리뉴클레오티드는 상이한 미생물로부터 유래하거나 또는 이 미생물에서 관찰되는 특정 효소(예를 들어, 알돌라제)를 코딩할 수 있다. 하나의 유기체로부터 유래하는 제1 폴리뉴클레오티드 또는 그의 변이체에 의해 코딩되는 효소는 예를 들어, 특정 환경 조건 예를 들어, 고 염도하에서 효율적으로 작용할 수 있다. 상이한 유기체로부터 유래하는 제2 폴리뉴클레오티드 또는 그의 변이체에 의해 코딩되는 효소는 상이한 환경 조건, 예를 들어, 초고온하에서 효율적으로 작용할 수 있다. 상기 제1 및 제2 원래의 폴리뉴클레오티드로부터 유래하는 서열들을 함유하는 하이브리드 폴리뉴클레오티드는 원래의 폴리뉴클레오티드들에 의해 코딩되는 두 가지 효소들의 특장을 모두 나타내는 효소를 코딩할 수 있다. 따라서, 본 발명에 따른 하이브리드 폴리뉴클레오티드에 의해 코딩되는 효소는 상기 제1 및 제2 폴리뉴클레오티드에 의해 코딩되는 각각의 효소가 공유하는 환경 조건 예를 들어, 고 염도 및 초고온 하에서 효율적으로 작용할 수 있다.

일부 실시태양에서, 본 발명에 따른 방법에 의해 생산되는 하이브리드 폴리펩티드는 원래의 효소에서는 살펴볼 수 없는 특화된 효소 활성을 나타낼 수 있다. 예를 들어, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 코딩하는 폴리뉴클레오티드의 재조합법 및/또는 환원적 재분류법 수행 후, 하이브리드 폴리뉴클레오티드에 의해 코딩되는 생성된 하이브리드 폴리펩티드는, 원래의 효소 각각으로부터 유래하는 특화된 비-알돌라제, 예로서, 비-피루베이트 알돌라제, 예로서, 비-HMG 및/또는 비-KHG-알돌라제 효소 활성 예를 들어, 가수분해 효소, 펩티다제, 포스포릴라제 등과 같은 활성에 대해 스크리닝될 수 있다. 일부 실시태양에서, 하이브리드 폴리펩티드는 원래의 모체 폴리펩티드와 하이브리드 폴리펩티드를 구별할 수 있는 화학적 작용, 예를 들어, 하이브리드 폴리펩티드가 작용을 하는 온도, pH 또는 염 농도에서 작용을 하는지 여부를 확인하기 위해 스크리닝된다.

일부 실시태양에서, 본 발명은

1) 작동 가능하게 연결되어 있는 적어도 제1 폴리뉴클레오티드와 작동 가능하게 연결되어 있는 제2 폴리뉴클레오티드를 적합한 숙주 세포에 도입시키며, 여기서, 적어도 상기 제1 폴리뉴클레오티드 및 제2 폴리뉴클레오티드는 부분적인 서열 상동성을 갖는 적어도 하나의 영역을 공유하는 것인 단계;

2) 서열의 재조직을 촉진하여 작동 가능하게 연결된 하이브리드 폴리뉴클레오티드를 생성하는 조건하에서 숙주 세포를 배양하는 단계;

3) 하이브리드 폴리뉴클레오티드에 의해 코딩되는 하이브리드 폴리펩티드를 발현시키는 단계;

4) 강화된 생물학적 활성의 확인을 촉진하는 조건하에서 하이브리드 폴리펩티드를 스크리닝하는 단계; 및

5) 하이브리드 폴리펩티드를 코딩하는 폴리뉴클레오티드를 분리하는 단계에 의해, 생물학적으로 활성인 하이브리드 폴리펩티드를 생산하는 방법 및 이러한 폴리펩티드가 강화된 활성을 나타내는지 여부를 스크리닝하는 방법에 관한 것이다.

알돌라제 효소의 단리 및 발견

본 발명은 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소와, 이 효소를 코딩하는 핵산을 단리 및 발견하는 방법을 제공한다. 폴리뉴클레오티드 또는 효소는 각각의 유기체("단리물"), 한정 배지 중에서 배양된 유기체 수집물("농축 배양물") 또는 배양되지 않은 유기체("환경 샘플")로부터 단리될 수 있다. 유기체는 예를 들어, 생체내 바이오패닝에 의해 분리될 수 있다(이하 참조). 환경 샘플로부터 신규의 생체활성을 코딩하는 폴리펩티드를 얻기 위해 배양물-독립적 접근법을 사용하는 방법을 통하여 생물 다양성을 갖는 미개발 자원에 접근할 수 있기 때문에, 본 방법이 가장 바람직하다. 폴리뉴클레오티드 또는 효소는 또한 다수의 유기체 중 임의의 하나 예를 들어, 박테리아로부터 단리될 수도 있다. 전체 세포 이외에도, 폴리뉴클레오티드 또는 효소는 또한 이러한 유기체 예를 들어, 박테리아 배양물로부터 유래하는 미정제 효소 제제로부터 단리될 수도 있다.

"환경 라이브러리"란, 환경 샘플로부터 생산되는 것으로서, 적합한 원핵 생물 숙주 내에서 증식될 수 있는 클로닝 벡터 내에 존재하는, 천연적으로 발생된 유기체 게놈의 집합체를 나타낸다. 클로닝된 DNA는 처음에 환경 샘플로부터 직접 추출되기 때문에, 라이브러리는 순수한 배양물 중에서 배양될 수 있는 소량의 원핵 생물의 것으로 한정되지 않는다. 추가로, 이러한 샘플 중에 존재하는 환경적 DNA 를 정규화시킴으로써, 원래의 샘플 중에 존재하는 모든 종으로부터 유래하는 DNA 와 더욱 동일하게 만들 수 있다. 이로써 우세한 종에 비해 몇 배나 더 적게 생성되는 소량의 샘플 구성 성분으로부터 원하는 유전자를 찾아내는 효율을 더 높일 수 있다.

일부 실시태양에서, 하나 이상의 미배양 미생물로부터 생산되는 유전자 라이브러리는 관심의 대상이 되는 활성을 갖는지 여부에 대해 스크리닝된다. 관심의 대상이 되는 생체활성 분자를 코딩하는 유력한 경로는 유전자 발현 라이브러리 형태로 원핵 생물 세포 내에서 먼저 포착된다. 일부 실시태양에서, 관심의 대상이 되는 활성을 코딩하는 폴리뉴클레오티드는 이러한 라이브러리로부터 단리되어 숙주 세포에 도입된다. 숙주 세포는 신규하거나 강화된 활성을 갖는, 잠재적으로 활성인 생체분자를 생산하는 환원적 재분류법 및/또는 재조합법을 촉진하는 조건하에서 배양된다.

생체내 바이오패닝법은 FACS 계 기구 및 비-광학계(예를 들어, 자기계) 기구를 사용하여 실시될 수 있다. 일부 실시태양에서, 복합 유전자 라이브러리는 전사된 RNA 를 안정화시키는 요소를 함유하는 벡터와 함께 작제된다. 예를 들어, RNA의 전사된 영역 측면에 위치하도록 디자인된 2차 구조, 예를 들어, 헤어핀 구조를 이루는 서열을 포함시키면, 벡터의 안정성을 증가시킬 수 있고, 따라서 이 벡터의 세포내 반감기도 증가시킬 수 있게 된다. 바이오패닝 방법에 사용되는 프로브 분자는 프로브가 표적 분자에 결합할 때에만 형광성을 나타내는 리포터 분자로 표지화된 올리고뉴클레오티드로 구성된다. 이와 같은 프로브는 몇몇 형질전환 방법 중 어느 하나를 사용하여 라이브러리로부터 재조합 세포 내에 도입된다. 상기 프로브 분자는 전사된 표적 mRNA 에 결합하여, DNA/RNA 이종 이중체 분자를 형성한다. 프로브를 표적에 결합시키면, 스크리닝 방법 중 FACS 기계에 의해 검출 및 분류되는 형광 신호를 나타내게 될 것이다.

일부 실시태양에서, 서브클로닝은 관심의 대상이 되는 서열을 추가로 단리하기 위해 수행된다. 서브클로닝에 있어서, DNA의 일부는 증폭되거나, 일반적으로는 제한 효소에 의해 분해되어, 원하는 서열을 절단하고, 원하는 서열은 수용 벡터에 결찰되어 증폭된다. 서브클로닝의 각 단계에서, 구조 단백질을 코딩하는 DNA가 제거되지 않았음을 확인하기 위해서, 그 일부를 관심의 대상이 되는 활성을 갖는지 여부에 대해 관찰한다. 인서트는 서브클로닝의 임의의 단계에서 예를 들어, 겔 전기영동법을 수행한 후 벡터에 결찰시킴으로써 정제될 수 있거나, 또는 수용 벡터를 함유하는 세포 및 수용 벡터를 함유하지 않는 세포가 예를 들어, 수용 벡터를 함유하지 않는 세포를 사멸시킬 항생제를 함유하는 선택 배지 중에 있을 경우에 정제될 수 있다. cDNA 인서트를 벡터에 서브클로닝시키는 구체적인 방법은 당업계에 널리 공지되어 있다(문헌 [Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press (1989)]). 다른 실시태양에서, 본 발명에 따른 효소는 하위클론이다. 이러한 하위클론은 예를 들어, 길이, 돌연변이, 태그 또는 표지가 존재하는지에 있어서 모체 클론과 상이할 수 있다.

폴리뉴클레오티드가 발견, 단리 또는 제조될 수 있는 미생물로서는 원핵 미생물, 예를 들어, 진정세균과 고세균, 그리고 하등 진핵 미생물, 예를 들어, 진균, 일부 조류 및 원생 동물을 포함한다. 폴리뉴클레오티드는 환경 샘플로부터 발견, 단리 또는 생산될 수 있는데, 이러한 경우, 핵산은 유기체를 배양하지 않고서도 회수될 수 있거나, 또는 하나 이상의 배양 유기체로부터 회수될 수 있다. 일부 실시태양에서, 이러한 미생물은 극한 미생물, 예를 들어, 호극고온성 미생물, 호냉성 미생물, 내냉성 미생물, 호염성 미생물, 고압성 미생물 및 호산성 미생물일 수 있다. 극한 미생물로부터 단리된 효소를 코딩하는 폴리뉴클레오티드를 사용할 수 있다. 본 발명에 따른 효소는 100℃ 초과의 온도에서 작용할 수 있는데, 그 예로서는, 지상 온천 및 심해 열수구에서 발견되는 것, 또는 0℃ 미만의 온도에서 작용할 수 있는 것, 예를 들어, 북극의 바다에서 발견되는 것, 포화염 환경에서작용할 수 있는것, 예를 들어, 사해에서 발견되는 것, pH 약 0에서 작용할 수 있는 것, 예를 들어, 석탄 침적물 및 지열 황이 풍부한 온천에서 발견되는 것, 또는 pH 11 초과의 pH에서 작용할 수 있는 것, 예를 들어, 하수 슬러지에서 발견되는 것이 있다. 일부 실시태양에서, 본 발명에 따른 효소는 광범위한 온도 및 pH에서 활성이 높다.

전술한 바와 같이 선별 및 단리된 폴리뉴클레오티드는 적합한 숙주 세포내로 도입된다. 적합한 숙주 세포는 재조합법 및/또는 환원적 재분류법을 촉진시킬 수 있는 임의의 세포이다. 일부 실시태양에서, 이와 같이 선별된 폴리뉴클레오티드는 적당한 제어 서열을 포함하는 벡터 내에 존재한다. 숙주 세포는 고등 진핵 생물 세포 예를 들어, 포유동물 세포이거나 하등 진핵 생물 세포 예를 들어, 효모 세포일 수 있거나, 또는 일부 실시태양에서, 숙주 세포는 원핵 생물 세포 예를 들어, 박테리아 세포일 수 있다. 작제물을 숙주 세포에 도입하는 방법은 인산칼슘 형질감염법, DEAE-덱스트란 매개 형질감염법 또는 전기 천공법에 의해 수행될 수 있다.

대표적인 숙주로서는 전술한 바와 같이, 박테리아 세포, 예를 들어, E. 콜라이, 스트렙토마이세스, 살모넬라 타이피뮤리움; 진균 세포, 예를 들어, 효모; 곤충 세포, 예를 들어, 드로소필라 S2 및 스포도프테라 Sf9; 동물 세포, 예를 들어, CHO, COS 또는 바우어즈 흑색종; 아데노바이러스; 및 식물 세포를 포함한다(상기 논의 내용을 참조). 본원에 교시하는 바에 따르면, 적절한 숙주를 선별하는 방법도 당업자의 기술 범주에 속할 것이다.

재조합 단백질을 발현하는데에 다양한 포유동물 세포 배양 시스템이 사용될 수 있으며; 포유동물 발현 시스템의 예로서는 문헌 [SV40-transformed simian cells support the replication of early SV40 mutants" (Gluzman, 1981)]에 기재된 원숭이 신장 섬유아세포의 COS-7 세포주와, 적합한 벡터를 발현할 수 있는 기타 세포주, 예를 들어, C127, 3T3, CHO, HeLa 및 BHK 세포주를 포함한다. 포유동물 발현 벡터는 복제 기점, 적합한 프로모터 및 인핸서를 포함할 수 있으며, 또한 임의의 필요한 리보좀 결합 부위, 폴리아데닐화 부위, 스플라이싱 공여 부위 및 수용 부위, 전사 종결 서열 및 5' 측면에 위치하는 비전사 서열을 포함할 수 있다. SV40 스플라이스 및 폴리아데닐화 부위로부터 유래된 DNA 서열은 필요한 비전사 유전 요소를 제공하는데에 사용될 수 있다.

다른 실시태양에서, 본 발명에 따른 핵산, 폴리펩티드 및 방법은 생화학적 경로에 사용되거나, 또는 하나 이상의 오페론 또는 유전자 클러스터 또는 이의 일부로부터 생화학적 경로를 코딩하는 신규의 폴리뉴클레오티드를 생산하는데에 사용된다. 예를 들어, 박테리아 및 다수의 진핵생물은 유전자 산물이 서로 관련된 과정에 관여하는, 유전자 조절 합작 기구를 갖는다. 유전자는 단일 염색체상에 존재하는 "유전자 클러스터"라고 불리는 구조에 모여 있으며, 또한 전체 클러스터의 전사를 개시하는 단일의 조절 서열, 예를 들어, 단일 프로모터의 제어하에 함께 전사된다. 따라서, 유전자 클러스터는 일반적으로 기능이 동일하거나 또는 관련된 인접 유전자들의 군이다(유전자 클러스터에 의해 코딩되는 생화학적 경로의 예로서는 폴리케타이드가 있다).

일부 실시태양에서, 유전자 클러스터 DNA는 상이한 유기체로부터 분리되어 벡터, 예를 들어, 결찰된 유전자 클러스터로부터 검출 가능한 단백질 또는 단백질-관련 어레이 활성의 생산을 제어 및 조절할 수 있는 발현 조절 서열을 함유하는 벡터에 결찰된다. 외인성 DNA 도입 능력이 매우 큰 벡터는 이러한 유전자 클러스터와 함께 사용하면 적절할 수 있고, E. 콜라이의 f-인자(즉, 수정 인자)를 포함하는 것으로 본원에 기술되어 있다. E. 콜라이의 f-인자는 접합시 그 인자를 높은 빈도수로 이동시키는 플라스미드로서, 큰 DNA 절편, 예를 들어, 혼합 미생물 샘플로부터 유래하는 유전자 클러스터를 안정적으로 증식시키는데에 이상적이다. 하나의 실시태양에서, "포스미드"로도 지칭되는 클로닝 벡터 또는 박테리아 인공 염색체(BAC) 벡터가 사용된다. 이 벡터는 게놈 DNA의 큰 세그먼트를 안정적으로 통합시킬 수 있는 E. 콜라이 f-인자로부터 유래된다. 혼합 미배양 환경 샘플로부터 유래하는 DNA와 통합될 때, 이러한 통합 과정은 큰 게놈 단편을 안정한 "환경적 DNA 라이브러리"의 형태로 만들 수 있다. 본 발명에 사용되는 또다른 유형의 벡터로서는 코스미드 벡터가 있다. 코스미드 벡터는 원래 게놈 DNA의 큰 세그먼트를 클로닝하고 증식시키도록 디자인된 것이었다. 코스미드 벡터에 클로닝하는 방법에 관하여는 문헌 [Sambrook et at., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press (1989)]에 상세히 기술되어 있다. 일단 적당한 벡터에 결찰되면, 상이한 폴리케타이드 신타제 유전자 클러스터를 함유하는 2개 이상의 벡터는 적합한 숙주 세포에 도입될 수 있다. 유전자 클러스터에 의해 공유되는 부분적 서열 상동성 영역은 서열을 재조직화하여 하이브리드 유전자 클러스터를 만드는 과정을 촉진할 것이다. 이어서, 신규의 하이브리드 유전자 클러스터는 원래의 유전자 클러스터에서는 살펴볼 수 없는 활성이 강화되었는지 여부에 대해 스크리닝될 수 있다.

다양한 효소 활성에 대해 스크리닝하는 방법은 당업자에게 널리 공지되어 있으며, 본 명세서를 통하여서도 논의되고 있다(실시예 1, 2 및 3 참조). 이러한 방법은 본 발명에 따른 폴리펩티드 및 폴리뉴클레오티드를 단리할 때에 사용될 수 있다.

일부 실시태양에서, 본 발명은 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소의 활성을 변형시키기 위해서 전 세포 접근 법을 사용하여 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 또는 화합물을 발견 및 분리하는 방법을 제공한다(이하 참조). 게놈 DNA 라이브러리로부터 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제를 코딩하는 추정 클론을 스크리닝할 수 있다.

스크리닝 방법 및 "온-라인" 모니터링 장치

예를 들어, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성에 대해 폴리펩티드를 스크리닝하거나, 유력한 조절제, 예를 들어, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성의 활성화제 또는 저해제로서의 화합물을 본 발명에 따른 폴리펩티드에 결합하는 항체 또는 본 발명에 따른 핵산과 혼성화하는 핵산에 대해 스크리닝하거나, 본 발명에 따른 폴리펩티드를 발현하는 세포에 대해 스크리닝하기 위한, 본 발명의 방법을 실시함에 있어서, 본 발명에 따른 폴리펩티드 및 핵산과 함께 다양한 장치와 방법들이 사용될 수 있다. 이하에 상세히 기술되어 있는 샘플 스크리닝용 어레이 포맷 이외에, 본 발명에 따른 방법을 실시하는데에 대안적인 포맷 또한 사용될 수 있다. 이러한 포맷으로서는 예를 들어, 질량 분광 분석법, 크로마토그래피 예를 들어, 고 처리량 HPLC 및 기타 액체 크로마토그래피 형태, 및 더욱 작은 규모의 포맷, 예를 들어, 1536-웰 플레이트, 384-웰 플레이트 등을 포함한다. 고 처리량 스크리닝 장치는 본 발명에 따른 방법을 실시할 수 있도록 적합화시켜 사용할 수 있다(미국 특허 출원 번호 제20020001809호 및 제20050272044호 참조).

모세관 어레이

본 발명에 따른 핵산 또는 폴리펩티드는 어레이에 고정화되거나 적용될 수 있다. 어레이는 조성물(예를 들어, 소분자, 항체 및 핵산 등)의 라이브러리가 본 발명에 따른 핵산 또는 폴리펩티드에 결합하거나 또는 그의 활성을 조정하는 능력을 갖는지 여부를 스크리닝하거나 모니터하는데에 사용될 수 있다. 모세관 어레이 예를 들어, 기가매트릭스(GIGAMATRIX)™(캘리포니아주 샌디에고에 소재하는 Diversa Corporation); 및 예를 들어, 미국 특허 출원 번호 제20020080350호 A1; WO 0231203 A; WO 0244336 A에 개시된 어레이는 샘플을 수용하고 스크리닝하는 대안적인 장치를 제공한다. 일부 실시태양에서, 모세관 어레이는 인접 모세관 어레이로 형성된 다수의 모세관을 포함하는데, 여기서, 각각의 모세관은 샘플을 수용하기 위한 루멘을 한정하는 적어도 하나의 벽을 포함한다. 상기 루멘은 그 벽이 액체 또는 샘플을 수용하기 위한 루멘을 형성하도록 원통형, 사각형, 육각형 또는 임의의 기타 기하학적 형태를 가질 수 있다. 모세관 어레이를 이루는 모세관들은 서로 인접하여 존재함으로써, 평면 구조를 이룬다. 모세관은 융합되어 나란히 결합될 수 있거나(예를 들어, 모세관이 유리로 만들어진 경우), 접착제, 본드 또는 집게로 나란히 결합될 수 있다. 추가로, 모세관 어레이는 어레이내 인접하는 모세관 사이에 배치되어 있는 틈새 간 물질을 포함하여, 다수의 관통형 구멍을 포함하는 고체 평면 장치를 이룰 수 있다.

모세관 어레이는 임의의 수, 예를 들어, 100개 내지 4,000,000개 범위의 개별 모세관들로 이루어져 있다. 추가로, 약 100,000개 이상의 개별 모세관을 갖는 모세관 어레이는 표준 크기로 성형되어, 표준 실험실용 장치에 딱 들어맞는 마이크로타이어(Microtiter)® 플레이트의 형태를 가질 수 있다. 루멘은 모세관 작용 또는 가느다란 바늘을 사용하는 미세 입법을 사용하여 수동 또는 자동으로 충진된다. 이어서, 관심의 대상이 되는 샘플은 개별 모세관으로부터 제거되어 추가의 분석 또는 특징화에 사용된다. 예를 들어, 가느다란 침상의 프로브는 루멘에 물질을 가하거나 또는 빼내기 위해 선택된 모세관과 유체 소통이 가능하도록 배치된다.

단일-팟 스크리닝 분석법에서, 분석 성분은 모세관 어레이에 삽입되기 이전에 혼합되어 관심의 대상이 되는 용액으로 만들어진다. 어레이의 적어도 일부가 관심의 대상이 되는 용액에 침지될 때, 이 루멘은 모세관 작용에 의해 충진된다. 각 모세관에서의 화학 반응 또는 생물 반응 및/또는 활성은 검출 가능한 현상에 대해 모니터링된다. 검출 가능한 현상을 종종 "히트"라 지칭하며, 이는 일반적으로 광학적 검출법에 의해 "비-히트" 생성 모세관과 구별될 수 있다. 따라서, 모세관 어레이를 통하여 "히트"를 다량으로 동시에 검출할 수 있는 것이다.

다중-팟 스크리닝 분석법"에 있어서, 폴리펩티드 또는 핵산, 예를 들어, 리간드는 제1 성분, 즉, 모세관 어레이를 이루는 모세관의 적어도 부분에 도입되는 성분에 첨가될 수 있다. 이어서, 제1 성분 첨가 후, 기포가 모세관에 도입될 수 있다. 이어서, 제2 성분이 모세관에 도입될 수 있는데, 이 경우 상기 제2 성분은 기포에 의해 제1 성분과 분리된다. 이어서, 상기 제1 성분 및 제2 성분은 정수압을 모세관 어레이의 양쪽 면에 가하여 기포를 파괴시킴으로써 혼합될 수 있다. 이어서, 모세관 어레이는 2개의 성분이 반응하였는지 또는 반응하지 않았는지 여부를 나타내는 검출 가능한 현상에 대해 모니터링된다.

결합 스크리닝 분석법에 있어서, 관심의 대상이 되는 샘플은 검출 가능한 입자로 표지화된 제1 액체로서 모세관 어레이의 모세관에 도입될 수 있는데, 이때, 모세관의 루멘은 이 루멘에 검출 가능한 입자를 결합시키기 위한 결합 물질로 코팅되어 있다. 이어서, 제1 액체는 모세관으로부터 제거될 수 있는데, 이 경우, 결합되어 있던 검출 가능한 입자는 모세관 내에 남아있게 되고, 제2 액체는 모세관에 도입될 수 있다. 이어서, 상기 모세관은 입자가 제2 액체와 반응하였는지 또는 반응하지 않았는지 여부를 나타내는 검출 가능한 현상에 대해 모니터링된다.

어레이 또는 "바이오칩"

본 발명에 따른 핵산 또는 폴리펩티드는 어레이에 고정화되거나 또는 적용될 수 있다. 어레이는 조성물(예를 들어, 소 분자, 항체 및 핵산 등)이 본 발명에 따른 핵산 또는 폴리펩티드와 결합하거나, 그의 활성을 조정할 수 있는 능력을 갖는지 여부에 대해 스크리닝하거나 또는 이 조성물 라이브러리를 모니터링하는데에 사용될 수 있다. 예를 들어, 본 발명의 일부 실시태양에서, 모니터링될 매개 변수는 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 유전자의 전사체 발현 여부이다. 하나 이상의, 또는 모든 세포의 전사체는 이 세포의 전사체를 포함하는 샘플, 또는 세포의 전사체를 대표하는 핵산 또는 이에 상보성인 핵산을 혼성화하거나, 어레이 또는 "바이오칩"상에 고정화된 핵산에 혼성화함으로써 측정될 수 있다. 마이크로칩상에 존재하는 핵산의 "어레이"를 사용함으로써, 세포의 전사체 중 일부 또는 전부는 동시에 정량될 수 있다. 별법으로, 게놈 핵산을 포함하는 어레이는 또한 본 발명의 방법에 의해 만들어진, 새로 조작된 균주의 유전자형을 측정하는데에 사용될 수도 있다. "폴리펩티드 어레이"는 또한 다수의 단백질을 동시에 정량하는데에도 사용될 수 있다. 본 발명은 "마이크로어레이" 또는 "핵산 어레이" 또는 "폴리펩티드 어레이" 또는 "항체 어레이" 또는 "바이오칩"으로도 지칭되는, 임의의 공지 "어레이" 또는 그의 변이체를 사용하여 실시될 수 있다. 어레이는 일반적으로 다수의 "스팟" 또는 "표적 요소"인데, 각각의 표적 요소는 하나 이상의 생물 분자, 예를 들어, 올리고뉴클레오티드를 일정량만큼 포함하고, 샘플 분자 예를 들어, mRNA 전사체와 특이적으로 결합하는 기질 표면의 한정된 구역 상에 고정화되어 있다.

본원에 사용된 "어레이" 또는 "마이크로어레이" 또는 "바이오칩" 또는 "칩"이란 용어는, 다수의 표적 요소를 의미하는데, 각 표적 요소는 하나 이상의 폴리펩티드(항체 포함) 또는 핵산을 일정량만큼 포함하고, 기질 표면의 특정 구역 상에 고정화되어 있다(이하, 보다 상세히 설명함).

본 발명에 따른 방법을 실시함에 있어서는, 임의의 공지 어레이 및/또는 어레이를 제조 및 사용하는 방법의 전부 또는 일부, 또는 그의 변법은 예를 들어, 미국 특허 번호 제6,277,628호; 제6,277,489호; 제6,261,776호; 제6,258,606호; 제6,054,270호; 제6,048,695호; 제6,045,996호; 제6,022,963호; 제6,013,440호; 제5,965,452호; 제5,959,098호; 제5,856,174호; 제5,830,645호; 제5,770,456호; 제5,632,957호; 제5,556,752호; 제5,143,854호; 제5,807,522호; 제5,800,992호; 제5,744,305호; 제5,700,637호; 제5,556,752호; 제5,434,049호에 기재되어 있고; 예를 들면, WO 99/51773; WO 99/09217; WO 97/46313; WO 96/17958을 참조할 수 있고; 예로서, 문헌 ([[Johnston (1998) Curr. Biol. 8:R171-R174]; [Schummer (1997) Biotechniques 23:1087-1092]; [Kern (1997) Biotechniques 23:120-124]; [Solinas-Toldo (1997) Genes, Chromosomes & Cancer 20:399-407]; [Bowtell (1999) Nature Genetics Supp. 21:25-32])를 참조한다. 또한, 공개된 미국 특허 출원 번호 제20010018642호; 제20010019827호; 제20010016322호; 제20010014449호; 제20010014448호; 제20010012537호; 제20010008765호를 참조한다.

항체 및 항체-기반 스크리닝 방법

본 발명은 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소에 특이적으로 결합하는 단리된 합성 또는 재조합 항체를 제공한다. 이러한 항체는 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 또는 관련 폴리펩티드를 단리, 동정 또는 정량하는데에 사용될 수 있다. 이러한 항체는 본 발명의 범위 내에 포함되는 기타 폴리펩티드 또는 기타 관련 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 분리하는데에 사용될 수 있다. 항체는 알돌라제 예를 들어, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소의 활성 부위에 결합하도록 디자인될 수 있다. 따라서, 본 발명은 본 발명에 따른 항체를 사용하여 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 저해하는 방법을 제공한다(본 발명에 따른 항-알돌라제, 예로서, 항-피루베이트 알돌라제, 예로서, 항-HMG 및/또는 항-KHG 알돌라제 효소 조성물을 사용하는 것에 관하여 전술한 사항 참조).

"항체"란 용어는 면역글로불린 유전자 또는 면역글로불린 유전자들 또는 그의 단편으로부터 유래하거나, 이를 모델링하거나 또는 실질적으로 이것에 의해 코딩되는 펩티드 또는 폴리펩티드로서, 항원이나 에피토프에 특이적으로 결합할 수 있는 펩티드 또는 폴리펩티드를 포함한다(문헌 [Fundamental Immunology, Third Edition, W.E. Paul, ed., Raven Press, N. Y. (1993)]; [Wilson (1994) J. Immunol. Methods 175:267-273]; [Yarmush (1992) J. Biochem. Biophys. Methods 25:85-97]). 항체라는 용어는 항원에 결합하는 능력을 갖는 항원 결합부, 즉, "항원 결합 부위"(예를 들어, 단편, 부분서열, 상보성 결정 영역(CDR: complementarity determining region))를 포함하며, 그 예로서는 (i) Fab 단편, 즉, VL, VH, CL 및 CH1 도메인으로 이루어진 1가 단편; (ii) F(ab')2 단편, 즉, 2개의 Fab 단편이 힌지부에서 이황화 결합에 의해 결합되어 있는 2가 단편; (iii) VH 및 CH1 도메인으로 이루어진 Fd 단편; (iv) 항체의 단일 팔을 이루는 VL 및 VH 도메인으로 이루어진 Fv 단편; (v) VH 도메인으로 이루어진 dAb 단편(문헌 [Ward et al., (1989) Nature 341 :544-546]); 및 (vi) 단리된 상보성 결정 부위(CDR)를 포함한다. 단일 쇄 항체도 "항체 "라는 용어에 포함된다.

본 발명은 본 발명에 따른 폴리펩티드의 면역원성 단편(예를 들어, 부분서열)을 포함하는 본 발명에 따른 효소(예를 들어, 펩티드)의 단편을 제공한다. 일부 실시태양에서, 본 발명은 본 발명에 따른 폴리펩티드 또는 펩티드와 애쥬반트 또는 담체를 포함하는 조성물을 제공한다.

항체는 면역 침전법, 염색, 면역친화성 컬럼 등에서 사용될 수 있다. 원한다면, 특정 항원을 코딩하는 핵산 서열은 면역화 이어서, 폴리펩티드 또는 핵산을 단리하고, 폴리펩티드를 증폭 또는 클로닝하여 본 발명의 어레이상에 고정화시킴으로써 생산될 수 있다. 별법으로, 본 발명에 따른 방법은 변형될 세포에 의해 생산된 항체의 구조를 변형시키는데에 사용될 수 있는데, 이 경우 예를 들어, 항체의 친화성은 증가하거나 또는 감소할 수 있다. 더욱이, 항체를 생산 또는 변형시키는 능력은 본 발명에 따른 방법에 의해 세포 내에 조작되어 도입된 표현형일 수 있다.

면역화, 항체(폴리클로날 항체 및 모노크롤날 항체)의 생산 및 단리 방법에 관하여는 당업자에게 공지되어 있으며, 과학 및 특허 문헌에 개시되어 있다(문헌 ([Coligan, CURRENT PROTOCOLS IN IMMUNOLOGY, Wiley/Greene, NY (1991)]; [Stites (eds.) BASIC AND CLINICAL IMMUNOLOGY (7th ed.) Lange Medical Publications, Los Altos, CA("Stites")]; [Goding, MONOCLONAL ANTIBODIES: PRINCIPLES AND PRACTICE (2d ed.) Academic Press, New York, NY (1986)]; [Kohler (1975) Nature 256:495; Harlow (1988) ANTIBODIES, A LABORATORY MANUAL, Cold Spring Harbor Publications, New York])을 참조한다). 항체는 또한 동물을 사용하는 통상의 생체내 방법 이외에도 예를 들어, 파지 디스플레이 라이브러리를 발현하는 재조합 항체 결합 부위를 사용하여 시험관내에서 생산될 수도 있다. 예를 들어, 문헌 [Hoogenboom (1997) Trends Biotechnol. 15:62-70; Katz (1997) Annu. Rev. Biophys. Biomol. Struct. 26:27-45]을 참조한다.

본 발명에 따른 폴리펩티드 또는 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개, 또는 150개 또는 그 이상의 연속된 아미노산을 포함하는 그의 단편은 또한 폴리펩티드 또는 단편에 특이적으로 결합하는 항체를 생산하는데에도 사용될 수 있다. 생성된 항체는 폴리펩티드를 단리 또는 정제하거나, 또는 이 폴리펩티드가 생물 샘플 중에 존재하는지 여부를 결정하기 위한 면역친화성 크로마토그래피 방법에서 사용될 수 있다. 이러한 방법에 있어서, 단백질 제제, 예를 들어, 추출물, 또는 생물 샘플은 본 발명에 따른 폴리펩티드 중 하나, 또는 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개, 또는 150개 또는 그 이상의 연속된 아미노산을 포함하는 그의 단편과 특이적으로 결합할 수 있는 항체와 접촉된다.

면역친화성 방법에 있어서, 항체는 고형 지지체 예를 들어, 비드 또는 기타 컬럼 매트릭스 상에 부착된다. 단백질 제제는 항체가 본 발명에 따른 폴리펩티드 중 하나 또는 그의 단편과 특이적으로 결합하는 조건하에서 항체와 접촉하게 된다. 세척하여 비-특이적으로 결합된 단백질을 제거한 후, 특이적으로 결합한 폴리펩티드를 용리시킨다.

생물 샘플 중 단백질이 항체와 결합하는 능력은 당업자에게 익숙한 다양한 방법들 중 임의의 방법을 사용하여 측정될수 있다. 예를 들어, 결합은 검출 가능한 표지, 예를 들어, 형광성 제제, 효소 표지 또는 방사성동위원소로 항체를 표지화함으로써 측정될 수 있다. 별법으로, 항체가 샘플과 결합하였는지 여부는 검출 가능한 표지가 결합되어 있는 2차 항체를 사용하여 검출될 수 있다. 구체적인 분석법으로서는 ELISA 분석법, 샌드위치 분석법, 방사성 면역 분석법 및 웨스턴 블롯을 포함한다.

본 발명에 따른 폴리펩티드 또는 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개, 또는 150개 또는 그 이상의 연속된 아미노산을 포함하는 그의 단편에 대하여 생산되는 폴리클로날 항체는 폴리펩티드를 동물에 직접 주사하거나 또는 폴리펩티드를 동물 예를 들어, 인간 이외의 동물에 투여함으로써 얻어진다. 이처럼 얻어진 항체는 폴리펩티드 자체와 결합할 수 있다. 이러한 방식으로, 폴리펩티드의 단편만을 코딩하는 서열 조차도 천연 폴리펩티드 전체에 결합할 수 있는 항체를 생산하는데에 사용될 수 있다. 이어서, 이러한 항체는 이 폴리펩티드를 발현하는 세포로부터 폴리펩티드를 단리하는데에 사용될 수 있다.

모노클로날 항체를 제조함에 있어서, 연속적 세포주 배양물에 의해 생산되는 항체를 제공하는 임의의 기법이 사용될 수 있다. 이러한 기술의 예로서는 하이브리도마 기법(문헌 [Kohler and Milstein, Nature, 256:495-497, 1975]), 트리오마(trioma) 기법, 인간 B-세포 하이브리도마 기법(문헌 [Kozbor et ah, Immunology Today 4:72, 1983]) 및 EBV-하이브리도마 기법(문헌 [Cole, et al, 1985, Monoclonal Antibodies and Cancer Therapy, Alan R. Liss, Inc., pp. 77-96])을 포함한다.

단일 쇄 항체를 생산하는 기법(미국 특허 번호 제4,946,778호)을 적합화시켜 본 발명의 폴리펩티드, 또는 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개, 또는 150개 또는 그 이상의 연속된 아미노산을 포함하는 그의 단편에 대한 단일 쇄 항체를 생산할 수 있다. 별법으로, 트랜스제닉 마우스를 사용하여 상기 폴리펩티드 또는 그의 단편에 대하여 인간화된 항체를 발현시킬 수 있다.

본 발명에 따른 폴리펩티드, 또는 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개, 또는 150개 또는 그 이상의 연속된 아미노산을 포함하는 이의 단편에 대하여 생성된 항체는 기타 유기체 및 샘플로부터 유래하는 유사한 폴리펩티드들에 대해 스크리닝하는데에 사용될 수 있다. 이러한 기법에 있어서, 유기체로부터 유래하는 폴리펩티드는 항체와 접촉하게 되고, 이 항체에 특이적으로 결합하는 폴리펩티드가 검출된다. 전술한 방법 중 임의의 방법을 사용하여 항체 결합을 검출할 수 있다. 이러한 스크리닝 분석법 중 하나에 관하여는 문헌 [Shulman H, Eberhard A, Eberhard C, Ulitzur S, Keinan E, Bioorg Med Chem Lett. 2000 Oct 16;10(20):2353-6, Highly sensitive and rapid detection of antibody catalysis by luminescent bacteria]에 기재되어 있다.

키트

본 발명은 본 발명에 따른 조성물 예를 들어, 핵산, 발현 카세트, 벡터, 세포, 트랜스제닉 종자 또는 식물 또는 식물의 일부, 폴리펩티드(예를 들어, 알돌라제 효소) 및/또는 항체를 포함하는 키트를 제공한다. 이 키트는 또한 본원에 기술된 바, 본 발명에 따른 방법과 산업적 용도, 의학적 용도 그리고 섭생시 사용 방법에 관하여 교시하고 있는 설명 자료를 포함할 수 있다.

전 세포 조작 및 대사 매개 변수의 측정

본 발명에 따른 방법은 신규의 표현형 예를 들어, 신규하거나 또는 변형된 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 신규 세포 변종를 개발하기 위하여, 세포의 유전자 조성을 변형시킴으로써 세포 즉, 전 세포를 진화시키거나 또는 조작하는 방법을 제공한다. 미국 특허 출원 제20040033975호를 참조한다.

유전자 조성은 본 발명에 따른 핵산 예를 들어, 본 발명에 따른 효소에 대한 코딩 서열이 존재하는 세포를 첨가함으로써 변형될 수 있다. 예를 들어, WO 0229032 및 WO 0196551을 참조한다.

신규 표현형을 검출하기 위해서는, 변형된 세포의 적어도 하나의 대사 매개 변수를 세포 내에서 "실시간" 또는 "온-라인" 시간의 틀로 모니터링한다. 일부 실시태양에서, 다수의 세포 예를 들어, 세포 배양물은 "실시간" 또는 "온-라인"으로 모니터링된다. 일부 실시태양에서, 다수의 대사 매개 변수는 "실시간" 또는 "온-라인"으로 모니터링된다. 대사 매개 변수는 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소를 사용하여 모니터링될 수 있다.

대사 흐름 분석법(MFA: Metabolic flux analysis)은 공지의 생화학적 원리를 바탕으로 하는 방법이다. 선형 독립 대사 매트릭스는 세포내 대사 물질에 대한 질량 보존의 법칙과 의사-정상 상태 가설(PSSH: pseudo-steady state hypothesis)을 바탕으로 하여 구성된다. 본 발명에 따른 방법을 실시함에 있어서, 대사 네트워크는 다음의 사항들을 고려하면서 구축된다:

· 모든 경로의 기질, 산물 및 중간 대사 물질의 동일성

· 경로의 대사 물질을 상호 전환시키는 모든 화학 반응의 동일성, 경로 반응의 화학 양론

· 반응을 촉진시키는 모든 효소의 동일성, 효소 반응 역학

· 경로를 구성하는 성분들 사이의 조절 상호 작용 예를 들어, 알로스테릭 상호 작용, 효소-효소 상호 작용 등

· 효소의 세포내 구획화 또는 효소의 기타 초분자학적 조직화, 및

· 대사 물질, 효소 또는 효과기 분자의 임의의 농도 구배 또는 이들의 이동에 대한 확산 장벽의 존재.

일단 소정의 변종에 대해 대사 네트워크가 구축되면, 매트릭스 개념에 의한 수학적 제시가 도입되어, 온-라인 대사 데이터를 얻을 수 있을 경우, 세포내 대사 흐름을 측정할 수 있게 된다. 대사 표현형은 세포내 전체 대사 네트워크의 변화에 달려있다. 대사 표현형은 환경 조건, 유전자 조절, 발달 단계 및 유전자형 등에 관한 경로 활용 변화에 달려있다. 본 발명에 따른 방법에 관한 일부 실시태양에서, 온-라인 MFA 계산 이어서, 세포, 이 세포의 표현형 그리고 기타 특성의 동적인 행동 양식은 경로 사용률을 조사함으로써 분석된다. 예를 들어, 만일 효모 발효시 글루코스 공급량이 증가하고 산소 공급량이 감소하면, 호흡 경로 활용도는 감소하고/거나 정지할 것이고, 발효 경로의 활용도는 우위할 것이다. 세포 배양물의 생리적 상태는 경로 분석 이후에 제어 가능하게 될 것이다. 본 발명에 따른 방법은 바람직한 방향으로 세포의 생리적 단계가 진행되도록 제어하기 위해 기질 공급량, 온도, 유도 물질의 활용 방식 등을 변화시키는 방법을 결정함으로써 발효를 조작하는 방법을 결정하는데 도움을 줄 수 있다. 본 발명에 따른 방법을 실시함에 있어서, MFA 결과 또한 전사체 및 프로테옴 데이터와 비교하여 대사 조작 또는 유전자 셔플링 등에 대한 실험 및 프로토콜을 디자인할 수 있다.

본 발명에 따른 방법을 실시함에 있어서, 세포 내에서의 신규하거나 개선된 특징들을 포함하는 임의의 변형된 표현형 또는 신규 표현형이 부여되어 검출될 수 있다. 대사 또는 성장에 관한 임의의 측면이 모니터링될 수 있다.

mRNA 전사체 발현의 모니터링

본 발명의 일부 실시태양에서, 조작된 표현형으로서는 mRNA 전사체(예를 들어, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 메세지)의 발현이 증가 또는 감소되는 경우, 또는 세포 내에서 신규한 전사체(예를 들어, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소)를 생산하는 경우를 포함한다. 이와 같이 발현량의 증가 또는 감소는 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소가 존재하는지 여부에 대해 시험하거나, 또는 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소 활성 분석법에 의해 추적될 수 있다. mRNA 전사체 또는 메세지는 또한 당업계에 공지된 임의의 방법 예를 들어, 노던 블럿, 정량적 증폭 반응, 어레이와의 혼성화 등에 의해 검출 및 정량될 수 있다. 정량적 증폭 반응으로서는 예를 들어, 정량적 PCR 예를 들어, 정량적 역전사 중합효소 연쇄 반응, 또는 RT-PCR; 정량적 실시간 RT-PCR, 또는 "실시간 역학적 RT-PCR"을 포함한다(문헌 [Rreuzer (2001) Br. J. Haematol. 114:313-318; Xia (2001) Transplantation 72:907-914] 참조).

본 발명의 일부 실시태양에서, 조작된 표현형은 상동성 유전자의 발현을 넉아웃시킴으로써 나타나게 된다. 유전자의 코딩 서열 또는 하나 이상의 전사 제어 요소, 예를 들어, 프로모터 또는 인핸서는 넉아웃될 수 있다. 따라서, 전사체의 발현은 완전히 억제되거나 단지 감소될 수 있다.

본 발명의 일부 실시태양에서, 조작된 표현형은 상동성 유전자의 발현량이 증가된 경우를 포함한다. 이는 시스-작용 또는 트랜스-작용 음성 제어 요소 예를 들어, 전사 조절 요소를 넉아웃시키거나, 또는 양성 제어 요소를 돌연변이시킴으로써 이루어질 수 있다. 세포의 하나 이상의 전사체 또는 모든 전사체는 세포의 전사체, 또는 세포의 전사체를 대표하거나 이에 상응하는 핵산을 포함하는 샘플을 혼성화함으로써, 또는 어레이 상에 고정화된 핵산에 혼성화함으로써 측정될 수 있다.

폴리펩티드, 펩티드 및 아미노산 발현의 모니터링

본 발명의 일부 실시태양에서, 조작된 표현형으로서는 폴리펩티드(예를 들어, 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소)의 발현이 증가 또는 감소되는 경우, 또는 세포 내에서 신규 폴리펩티드가 생산되는 경우를 포함한다. 이와 같은 발현량의 증가 또는 감소는 본 발명의 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소의 양을 측정하거나, 또는 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성 분석법에 의해 추적될 수 있다. 폴리펩티드, 펩티드 및 아미노산은 또한 당업계에 공지된 임의의 방법 예를 들어, 핵 자기 공명법(NMR: nuclear magnetic resonance), 분광법, 방사선 사진술(단백질 방사능 표지화), 전기영동, 모세관 전기영동, 고성능 액체 크로마토그래피(HPLC), 박층 크로마토그래피(TLC: thin layer chromatography), 초확산 크로마토그래피, 다양한 면역학적 방법, 예를 들어, 면역 침전법, 면역 확산법, 면역-전기영동법, 방사성 면역 분석법(RIA: radioimmunoassay), 효소-결합 면역 흡착 분석법(ELISA: enzyme-linked immunosorbent assay), 면역-형광 분석법, 겔 전기영동법(예를 들어, SDS-PAGE), 항체를 사용한 염색법, 형광 활성화 세포 분류기(FACS: fluorescent activated cell sorter), 열분해 질량 분광법, 푸리에-변형 적외선 분광법, 라만 분광법, GC-MS 및 LC-전기 방사법 및 캡-LC-직렬-전기 방사 질량 분광법 등에 의해 검출 및 정량될 수 있다. 신규의 생체활성은 또한 미국 특허 번호 제6,057,103호에 기재된 방법 또는 그의 변법을 사용하여 스크리닝될 수도 있다. 더욱이, 이하 더욱 상세히 논의되어 있는 바와 같이, 세포 폴리펩티드 중 하나 이상 또는 전부는 단백질 어레이를 사용하여 측정될 수 있다.

산업적 용도, 약제학적 용도 및 기타 용도

본 발명에 따른 폴리펩티드(예를 들어, 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제를 갖는 폴리펩티드)는 탄소-탄소 결합의 형성 또는 분해를 촉진할 수 있다. 본 발명에 따른 효소는 매우 선택적인 촉매일 수 있다. 일부 실시태양에서, 본 발명은 에로서, 약제학적 산업 또는 영양(다이어트) 보충제 산업에서, 식품 및 사료 산업에서, 예로서, 식품 및 사료 제품 및 식품 및 사료 첨가제 제조 방법에 있어서 본 발명에 따른 효소를 사용하는 산업 공정을 제공한다. 일부 실시태양에서, 본 발명은 예로서, 약제, 또는 식이 보조제 또는 보충제 또는 식품 보충제 및 첨가제의 제조를 위한 의약 산업에서 본 발명에 따른 효소를 사용하는 방법을 제공한다.

바이오매스 전환 및 청정 바이오 연료의 생산

본 발명은 바이오매스 또는 임의의 리그노셀룰로스 물질(예컨대, 셀룰로스, 헤미셀룰로스 및 리그닌을 포함하는 임의의 조성물)을 연료(예컨대, 바이오에탄올, 바이오부탄올, 바이오프로판올, 바이오메탄올, 바이오디젤)로 전환시키는 효소, 예로서, 피루베이트 알돌라제 예로서, 제한없이, HMG 및/또는 KHG 알돌라제를 비롯한 알돌라제(상기 효소의 혼합물, 또는 "칵테일" 포함), 및 사료, 식품 및 화학 물질이외에도 본 발명의 효소를 사용하여 상기와 같이 전환시키는 방법을 제공한다. 따라서, 본 발명의 조성물 및 방법은 바이오에탄올 및 가솔린의 혼합물과 같은, 석유계 제품에 대한 효율적이고 지속적인 대체물 또는 부속물을 제공한다. 본 발명은 천연 바이오매스 전환과 관련된 화학적 순환 과정에 참여하는 본 발명의 효소를 발현시키는 유기체를 제공한다. 하나의 실시태양에서, 전환용 효소 및 전환 방법은 셀룰로스계 및 헤미셀룰로스계 중합체를 대사 가능한 탄소 부분으로 효율적으로 탈중합체화시키기 위한 효소 앙상블에서 사용된다, 본 발명은 중요한 신규의 "바이오매스 전환 " 및 대체 에너지 산업 공정을 가능하게 하는 가장 효율적인 효소를 발견하고 이를 활용하는 방법을 제공한다.

본 발명의 방법은 또한 전환된 리그노셀룰로스 물질(본 발명의 효소에 의해 공정처리된)을 채취하고, 그를 발효 및/또는 화학적 합성에 의해 연료(예컨대, 바이오에탄올, 바이오부탄올, 바이오프로판올, 바이오메탄올, 바이오디젤)로 제조하는 것을 포함한다. 하나의 실시태양에서, 생산된 당은 발효되고/거나, 비발효성 산물은 기화된다.

본 발명의 효소(예를 들면, 유기체, 예로서, 미생물, 예컨대, 진균, 효모 또는 박테리아가 제조하고, 일부 실시태양에서는 분비하는 본 발명의 재조합 효소)는 임의의 바이오매스 전환 공정 중 임의 단계, 예컨대, 임의의 한 단계, 여러 단계에서 사용되거나, 그에 포함/통합될 수 있거나, 모든 단계에, 또는 하기의 모든 바이오매스 전환 공정 방법에, 또는 이들 바이오연료 대체물 모두에 포함될 수 있다:

· 직접 연소: 직접 가열하여 물질을 태우는 것으로서 이는 가장 간단한 바이오매스 기술이며; 이는 바이오매스 공급원이 가까이에 있다면 매우 경제적일 수 잇다.

· 열분해: 이는 산소 부재하의 열에 의한 바이오매스의 열적 분해이다. 하나의 실시태양에서, 바이오매스를 화씨 약 800 내지 1400도 사이의 온도로 가열하지만, 연소를 돕도록 하는 산소는 도입시키지 않음으로써 기체, 연료 오일 및 목탄을 수득한다.

· 기화: 바이오매스을 사용하여 가열 또는 혐기성 분해를 통해 메탄을 생산할 수 있다. 일산화탄소와 수소의 혼합물인 혼합 가스는 바이오매스로부터 유래될 수 있다.

· 매립 가스: 이는 매립지에 매장된 쓰레기의 부패(혐기성 분해)에 의해 생성된다. 유기 폐기물이 분해될 때, 이는 대략 50%의 메탄으로 구성된 기체를 생성하게 되는데, 그의 주 성분은 천연 가스이다.

· 혐기성 소화: 이는 유기 물질을 메탄 혼합물로 전환시키는데, 그의 주 성분은 천연 가스, 및 이산화탄소이다. 하나의 실시태양에서, 바이오매스 예로서, 폐수(하수), 퇴비, 또는 식품 공정 폐기물을 물과 혼합하고, 공기를 포함하지 않는 소화조에 공급한다.

· 발효

· 알코올 발효: 연료 알코올은 전분을 당으로 전환시키고, 당을 알코올로 발효시킨 후, 알코올수 혼합물을 증류에 의해 분리함으로써 생산된다. 예로서, 소맥, 보리, 감자 및 폐지, 당, 전분, 또는 셀룰로스를 함유하는 톱밥, 및 짚과 같은 공급 원료는 효소를 사용한 발효에 의해 알코올로 전환될 수 있다.

· 에스테르교환: 오일을 바이오디젤로 전환시키는 대표적인 반응을 에스테르교환이라고 명명한다. 에스테르교환 공정은 알코올(예로서, 메탄올)을, 식물성 오일, 동물성 지방, 또는 재생 그리스에 함유되어 있는 트리글리세리드 오일과 반응시켜 지방산 알킬 에스테르(바이오디젤) 및 글리세린을 형성한다. 상기 반응은 열 및 강염기 촉매, 예로서, 수산화나트륨 또는 수산화칼륨을 필요로 한다.

· 바이오디젤: 바이오디젤은 식물성 오일, 동물성 지방, 또는 재생 그리스로부터 제조된 지방산 알킬 에스테르의 혼합물이다. 바이오디젤의 순수한 형태는 차량용 연료로서 사용될 수 있지만, 바이오디젤은 보통 디젤 사용 차량으로부터 생성된 미립자, 일산화탄소, 탄화수소 및 독성 기체의 수준을 감소시켜 주는 석유 디젤 첨가제로서 사용된다.

· 가수분해: 이는 본 발명의 효소에 의해 촉진된 화합물, 예컨대, 바이오매스, 예로서, 리그노셀룰로스 물질의 가수분해를 포함한다.

· 동시발생: 이는 단일 연료 및 설비를 사용하여 1 초과 형태의 에너지를 동시에 생산하는 것이다. 하나의 실시태양에서, 바이오매스 동시발생은 동시발생이 열과 전기, 둘 모두를 생산하지 때문에 바이오매스 발생보다 더욱 큰 발전 가능성을 갖고 있다.

하나의 실시태양에서, 본 발명의 폴리펩티드는 피루베이트 알돌라제 활성, 예로서, 제한없이, HMG 및/또는 KHG 알돌라제 활성을 비롯한 알돌라제 활성, 또는 유기 물질, 예컨대, 바이오매스, 예로서, 임의의 농작물 또는 기타 재생 공급 원료, 농업 잔류물 또는 동물 배설물을 비롯한 식물 및 동물 유래의 조성물, 또는 시립 폐기물 및 산업 폐기물의 유기 성분들, 또는 미생물, 예로서, 조류 또는 효모로부터 바이오디젤, 바이오에탄올, 바이오부탄올, 바이오프로판올, 또는 바이오메탄올을 생성하는 기타 효소 활성을 갖는다. 하나의 실시태양에서, 본 발명의 폴리펩티드는 리그노셀룰로스 바이오매스를 에탄올, 부탄올, 프로판올, 메탄올로 전환시키는 공정에 사용되거나, 다르게는, 바이오물질을 가수분해하거나 분해시켜 이들을 바이오연료(바이오에탄올, 바이오부탄올, 바이오프로판올, 바이오메탄올, 또는 바이오디젤)로서 사용될 수 있도록 하는 공정에 사용되거나, 바이오매스가 연료로 보다 용이하게 처리될 수 있도록 하는 공정에 사용된다. 대체 실시태양에서, 본 발명의 폴리펩티드는 알코올(에로서, 메탄올)과, 식물성 오일, 동물성 지방 또는 재생 그리스에 함유되어 있는 트리글리세리드 오일과 반응시켜 지방산 알킬 에스테르(바이오디젤) 및 글리세린을 형성하는 에스테르교환 공정에 사용된다. 하나의 실시태양에서, 바이오디젤은 대두유 또는 재생 쿠킹 오일로부터 제조된다. 동물성 지방, 기타 식물성 오일, 및 기타 재생 오일 또한 그의 가격과 이용가능성에 따라 바이오디젤을 생산하는 데 사용될 수 있다. 또다른 실시태양에서, 모든 종류의 지방과 오일 혼화물이 본 발명의 바이오디젤 연료를 생산하는 데 사용될 수 있다.

본 발명의 효소는 또한 글리세린 정제공정에도 사용될 수 있다. 글리세린 부산물은 미반응 촉매와 산에 의해 중화되는 비누를 함유한다. 물 및 알코올이 제거되면 50% 내지 80%의 조 글리세린이 생산된다. 남은 오염 물질은 미반응 지방 및 오일이 포함되어 있고, 이는 본 발명의 폴리펩티드를 사용함으로써 공정처리될 수 있다. 본 발명의 바이오디젤 대규모 공장에서 글리세린은 약제 및 화장품 산업용으로서 추가로 99% 이상의 고순도로 정제될 수 있다.

본 발명의 폴리펩티드를 사용하여 제조된 바이오에탄올, 바이오부탄올, 바이오프로판올, 바이오메탄올, 및/또는 바이오디젤은 연소 특징을 개선시키기 위하여 연료 옥시게네이트와 함께 사용될 수 있다. 산소를 첨가하면 더 완전하게 연소되어, 방출되는 일산화탄소는 감소하게 된다. 이것이 석유 연료를 바이오연료(예컨대, 본 발명의 연료)로 대체함으로써 얻게 되는 환경상의 또다른 잇점이다. 본 발명의 조성물 및/또는 방법을 사용하여 제조된 바이오에탄올, 바이오부탄올, 바이오프로판올, 바이오메탄올, 및/또는 바이오디젤은 가솔린과 함께 혼화되어 E10 혼화물(약 5% 내지 10%의 에탄올 및 약 90% 내지 95% 가솔린)을 형성할 수 있지만, 이는 이보다 고농도, E85로 사용될 수 있거나, 그의 순수한 형태로 사용될 수 있다. B100(순수한 바이오디젤) 이하로 다른 혼화 수준이 사용될 수 있기는 하지만, 본 발명의 조성물 및/또는 방법을 사용하여 제조된 바이오에탄올, 바이오부탄올, 바이오프로판올, 바이오메탄올, 및/또는 바이오디젤은 석유 디젤과 함께 혼화되어 B20 혼화물(20% 바이오디젤 및 80% 석유 디젤)을 형성할 수 있다.

본 발명은 또한 리그노셀룰로스 바이오매스를 포함하는 조성물로부터 에탄올("바이오에탄올"), 부탄올("바이오부탄올"), 프로판올("바이오프로판올"), 메탄올("바이오메탄올"), 및/또는 디젤("바이오디젤")을 제조하는 방법을 제공한다. 리그노셀룰로스 바이오매스 물질은 농업 작물로부터, 식품 또는 사료 생산시의 부산물로서, 또는 리그노셀룰로스계 폐기물 예를 들어, 식물 잔류물 및 폐지로서 얻을 수 있다. 본 발명에 따른 폴리펩티드로 처리하는데에 적합한 식물 공급원 또는 식물 잔류물의 예로서는, 켈프, 조류, 곡류, 종자, 줄기, 잎, 외피, 껍질 및 옥수수 속, 옥수수대, 짚, 풀(예컨대, 인디안 풀, 예로서, 소르카스트럼 누탄스(Sorghastrum nutans); 또는 스위치풀, 예컨대, 패니컴 종(Panicum species), 예로서, 패니컴 비르게텀(Panicum virgatum)) 등 뿐만 아니라, 목재, 목재 칩, 목재 펄프 및 톱밥을 포함한다. 본 발명에 따른 폴리펩티드로 처리하는데에 적합한 폐지의 일례로는 버려지는 복사 용지, 컴퓨터 인쇄 용지, 공책 종이, 메모지 및 타자 용지 등과, 신문, 잡지, 판지 그리고 제지 포장재를 포함한다.

하나의 실시태양에서, 본 발명의 효소 및 방법은 바이오매스로부터 에탄올, 메탄올, 부탄올, 프로판올 및/또는 디젤을 생산하는 보다 "통상적인" 방법, 예를 들어, 반응기 내에서 건조된 리그노셀룰로스 물질에 강산의 희석 용액과 금속 염으로 구성된 촉매로 처리하여 리그노셀룰로스 물질을 가수분해하는 단계를 포함하는 방법과 함께 사용될 수 있으며; 이로써, 셀룰로스를 가수분해하는데에 있어서 활성화 에너지 또는 반응 온도를 낮추어, 수율이 높은 당을 얻을 수 있다; 예를 들어, 미국 특허 번호 제6,660,506호 및 제6,423,145호를 참조한다.

본 발명의 효소를 사용하는 단계를 통합한 또다른 실시태양은 셀룰로스를 글루코스로 거의 탈중합화시키지 않으면서, 헤미셀룰로스를 주로 탈중합화시키도록 선택된 온도 및 압력에서, 헤미셀룰로스, 셀룰로스 및 리그닌을 함유하는 리그노셀룰로스 물질을 사용하여 수성 매질 중에서 가수분해의 첫번째 단계를 진행시킴으로써, 이 헤미셀룰로스, 셀룰로스 및 리그닌을 함유하는 리그노셀룰로스 물질을 가수분해시키는 단계를 포함한다. 이 단계를 통하여, 헤미셀룰로스와, 셀룰로스 및 리그닌을 함유하는 고상을 탈중합화시켜 수득한 용해된 단당류를 액체 수성상이 함유하고 있는 슬러리를 얻을 수 있다. 가수분해의 두번째 단계는 적어도 대부분의 셀룰로스가 탈중합화되는 조건을 포함할 수 있는데, 여기서, 상기 단계를 통하여 셀룰로스의 용해된 분해 산물/가용성 탈중합화 산물을 함유하는 액체 수성상을 얻을 수 있다. 예를 들어, 미국 특허 번호 제5,536,325호를 참조한다. 본 발명의 효소는 이러한 대표적인 공정 중의 임의의 단계에 첨가될 수 있다.

본 발명의 효소를 사용하는 단계를 통합한 또다른 실시태양은 약 0.4% 내지 2%의 강산을 사용하는 묽은 산 가수 분해 방법 중 하나 이상의 단계에 의해 리그노셀룰로스 함유 바이오매스 물질을 가공하는 단계; 및 산으로 가수 분해된 바이오매스 물질의 미반응 고체 리그노셀룰로스 성분을 알칼리성 탈 리그닌 처리법으로 처리하여, 생분해 열 가소성 물질 및 유도체에 대한 전구체를 수득하는 단계를 포함한다. 예를 들어, 미국 특허 번호 제6,409,841호를 참조한다. 본 발명의 효소는 이러한 대표적인 공정 중 임의의 단계에 첨가될 수 있다.

본 발명의 효소를 사용하는 단계를 통합한 또다른 실시태양은 예비 가수분해 반응기 내에서 리그노셀룰로스 물질을 예비 가수분해시키는 단계; 산성 액체를 고체 리그노셀룰로스 물질에 첨가하여 혼합물을 제조하는 단계; 이 혼합물을 반응 온도로 가열하는 단계; 리그노셀룰로스 물질이, 리그노셀룰로스 물질로부터 유래한 리그닌을 약 20% 이상 함유하는 용해된 부분과 셀룰로스를 함유하는 고체 분획으로 분별되기에 충분한 시간 동안 반응 온도를 유지시키는 단계; 반응 온도 또는 이에 가까운 온도에 있을 때 고체 분획으로부터 용해된 부분을 제거하는 단계(여기서, 고체 분획 중 셀룰로스는 효소 분해가 더욱 잘 이루어지게 만들어짐); 및 용해된 부분을 회수하는 단계를 포함한다. 예를 들어, 미국 특허 번호 제5,705,369호를 참조한다. 본 발명의 효소는 이러한 대표적인 공정의 임의의 단계에 첨가될 수 있다.

본 발명은 본 발명의 효소 또는 방법을 사용하여 제조된 연료 등급의 알코올과 혼화된 액체 탄화수소를 주성분으로 하는 모터 연료 조성물(예를 들어, 스파크 점화 모터용 연료 조성물)을 제공한다. 하나의 실시태양에서, 본 발명의 효소를 사용하여 제조된 연료로서는 예를 들어, 석탄 가스 액체- 또는 천연 가스 액체-에탄올, 메탄올, 부탄올, 프로판올 및/또는 디젤 혼화물을 포함한다. 하나의 실시태양에서, 보조 용매는 바이오매스-유래 2-메틸테트라하이드로푸란(MTHF: methyltetrahydrofuran)이다. 예를 들어, 미국 특허 번호 제6,712,866호를 참조한다.

하나의 실시태양에서, 본 발명에 있어서 리그노셀룰로스를 효소적으로 분해하는 방법, 예컨대, 리그노셀룰로스 물질로부터 에탄올을 생산하는 방법은 또한 바이오매스 물질은 초음파 처리하는 단계를 포함할 수 있다. 예를 들어, 미국 특허 번호 제6,333,181호를 참조한다.

또다른 실시태양에서, 셀룰로스 기질로부터 바이오에탄올, 바이오부탄올, 바이오프로판올, 바이오메탄올, 및/또는 바이오디젤을 생산하는 본 발명의 방법은 (예컨대, 반응 용기, 예로서, 반연속 고체 공급 생체반응기내) 셀룰로스 기질, 본 발며의 효소 및 발효제를 포함하는 슬러리 형태로 반응 혼합물을 제공하는 단계를 포함하고, 반응 혼합물은 발효 반응을 개시하고 유지시키는데 충분한 조건하에서 반응한다(미국 특허 출원 번호 제20060014260호에 기재). 하나의 실시태양에서, 실험상 또는 이론상의 계산을 통해 최적의 공급 빔도를 결정할 수 있다. 하나의 실시태양에서, 최적화된 공급 빈도에 따라 틈틈이 반응 용기에 추가량의 셀룰로스 기질 및 효소를 제공한다.

본 발명의 바이오연료(예로서, 바이오에탄올, 바이오부탄올, 바이오프로판올, 바이오메탄올, 및/또는 바이오디젤)를 생산하는 하나의 대표적인 방법은 미국 특허 출원 공개 번호 제20050069998호; 제20020164730호에 기재되어 있고; 하나의 실시태양은 리그노셀룰로스 바이오매스를 분쇄(예컨대, 15-30mm의 크기로)하는 단계; 수득한 산물을 반응기에서 1분 내지 10분 사이의 기간 동안 증가 노출 전처리(예컨대, 190℃ 내지 230℃의 온도에서)하는 단계; 사이클론에서 전처리된 물질 또는 제조 관련 산물을 수집하는 단계; 및 필터 프레스에서 여과하여 액체 및 고체 분획을 분리하여 발효 침전물에 고체 분획을 도입시키고, 본 발명의 하나 이상의 효소, 예컨대, 셀룰로스 및/또는 베타-글루코시다제 효소를 가하는(예컨대, 시트르산 염 완충액(pH 4.8)에 용해시키는) 단계를 포함한다.

본 발명의 효소를 사용하는 것을 포함하는 것으로서, 본 발명의 바이오연료(예로서, 바이오에탄올, 바이오부탄올, 바이오프로판올, 바이오메탄올, 및/또는 바이오디젤)를 생산하는 기타 대표적인 방법은, 적어도 헤미셀룰로스 및 셀룰로스를 포함하는 리그노셀룰로스 공급 원료를 함유하는 출발 물질을 전 처리하는 단계를 포함한다. 하나의 실시태양에서, 상기 출발 물질로서는 감자, 대두(유채씨), 보리, 호밀, 옥수수, 귀리, 소맥, 비트 또는 사탕수수 또는 기타 성분 또는 폐기물 또는 식품 또는 사료 생산에 따른 부산물을 포함한다. 출발 물질("공급 원료")은 식물의 섬유 구조를 파괴하여 헤미셀룰로스 및 셀룰로스를 적어도 부분적으로 가수분해하는 조건에서 반응한다. 파괴 조건으로서는 예를 들어, 출발 물질을 약 5초 내지 60분 동안 평균 온도 180℃ 내지 270℃ 및 pH 0.5 내지 2.5에 두거나; 또는 약 5초 내지 120초 동안 온도 220℃ 내지 270℃ 및 pH 0.5 내지 2.5에 두는 경우 또는 등가의 경우를 포함할 수 있다. 이로써, 본 발명의 효소 예를 들어, 알돌라제 효소에 의해 분해될 수 있는 순응성이 증가한 공급 원료를 얻게 된다. 미국 특허 번호 제6,090,595호를 참조한다.

리그노셀룰로스 물질의 가수분해를 위한 조건으로서 대표적인 조건은 온도 약 30℃ 내지 48℃ 및/또는 pH 약 4.0 내지 6.0에서의 반응을 포함한다. 기타 대표적인 조건으로서는 온도 약 30℃ 내지 60℃ 및 pH 약 4.0 내지 8.0인 경우를 포함한다.

본 발명에 따른 효소는 적절한 입체 선택성, 위치 선택성 및 화학적 선택성을 갖는 반응을 촉진시킬 수 있다. 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소는 다양한 용매에서 작용하고, 극한 pH(예를 들면, 고 pH 및 저 pH), 극한 온도(예를 들면, 고온 및 저온), 극한 염분 수준(예를 들면, 고염 및 저염)에서 작동하고, 구조상 그의 성질, 생리학적 기질과는 상관없는 화합물과의 반응을 촉진시킬 수 있도록 조작될 수 있다.

사료 및 식품, 또는 사료 및 식품 첨가제

식이 보조제 또는 보충제, 또는 식품 보충제 및 첨가제를 제공하는 것 이외에도, 본 발명은 또한 본 발명에 따른 알돌라제 활성, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성을 갖는 본 발명에 따른 폴리펩티드 예를 들어, 단백질, 및/또는 본 발명의 항체를 사용하여, 인간 및 동물 사료 및 식품 및 식품 또는 사료 첨가제를 처리하는 조성물 및 방법도 제공한다. 일부 실시태양에서, 본 발명은 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 및/또는 본 발명에 따른 항체를 포함하는 동물 사료, 식품, 및 첨가제를 제공한다. 이 동물은 임의의 가축 동물 또는 임의의 동물일 수 있다.

본 발명에 따른 동물 사료 첨가제는 사료 성분들과 용이하게 혼합될 수 있는 과립화된 효소 제품일 수 있다. 별법으로, 본 발명에 따른 사료 첨가제는 프리-믹스 성분을 형성할 수 있다. 본 발명에 따른 과립화된 효소 제품은 코팅되거나 또는 코팅되지 않을 수 있다. 효소 과립의 입도는 사료와 프리-믹스 성분의 입도에 따라서 조정될 수 있다. 이로써, 효소를 사료에 혼합하는 안전하고도 편리한 수단을 제공한다. 별법으로, 본 발명에 따른 동물 사료 첨가제는 안정화된 액체형 조성물일 수 있다. 이는 수성 또는 유성 슬러리일 수 있다. 예를 들어, 미국 특허 제 6,245,546호를 참조한다.

사료 또는 식품의 개질에 있어서, 본 발명의 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소는 시험관내에서(사료 또는 식품의 성분들을 개질시킴으로써) 또는 생체내에서 식품 또는 사료를 가공할 수 있다. 본 발명에 따른 폴리펩티드는 동물 사료 또는 식품 조성물에 첨가될 수 있다.

일부 실시태양에서, 본 발명에 따른 효소는 또다른 효소, 예로서, 베타-갈락토시다제, 카탈라제, 락카제, 알돌라제, 기타 알돌라제, 엔도글리코시다제, 엔도-베타-1,4-락카제, 아밀로글루코시다제, 글루코시다제, 글루코스 이소머라제, 글리코실트랜스퍼라제, 리파제, 포스포리파제, 리포옥시게나제, 베타-락카제, 엔도-베타-1,3(4)-락카제, 큐티나제, 퍼옥시다제, 아밀라제, 피타제, 글루코아밀라제, 펙티나제, 리덕타제, 옥시다제, 데카르복실라제, 페놀옥시다제, 리그니나제, 풀루라나제, 아라비나나제, 헤미알돌라제, 만난아제, 크실로락카제, 크실라나제, 펙틴 아세틸 에스터라제, 람노갈락투로난 아세틸 에스터라제, 프로테아제, 펩티다제, 프로테이나제, 폴리갈락투로나제, 람노갈락투로나제, 갈락타나제, 펙틴 라이아제, 트랜스글루타미나제, 펙틴 메틸에스터라제, 셀로바이오하이드롤라제 및/또는 트랜스글루타미나제와 함께 첨가된다. 이러한 효소의 분해 산물은 동물에 의해 더욱 분해되기 쉽다. 따라서, 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소는 사료 또는 식품의 가용 에너지를 내거나, 또는 셀룰로스로 분해함으로써 식품 또는 사료를 분해할 수 있는 능력을 부여하는데에 기여한다.

본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소는 트랜스제닉 사료용 곡물(예를 들어, 트랜스제닉 식물 및 종자 등) 예를 들어, 알곡, 곡류, 옥수수, 대두, 유채씨 및 루핀 등에서 직접적으로 효소를 발현시켜 공급될 수 있다. 상기 논의된 바와 같이, 본 발명은 본 발명에 따른 폴리펩티드를 코딩하는 핵산 서열을 포함하는 트랜스제닉 식물, 식물 일부 및 식물 세포를 제공한다. 일부 실시태양에서, 상기 핵산은 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소가 회수될 수 있는 양만큼 발현된다. 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소는 임의의 식물 또는 식물의 일부로부터 회수될 수 있다. 별법으로, 재조합 폴리펩티드를 함유하는 식물 또는 식물의 일부는 식품 또는 사료의 품질을 개선시킬 목적으로 예를 들어, 영양적 가치 및 기호성 등을 개선시킬 목적으로 사용될 수 있다.

일부 실시태양에서, 본 발명에 따른 효소 전달 매트릭스는 다수의 개별 입자, 펠릿 또는 과립 형태이다. "과립"이란, 예를 들어, 펠릿화, 압출 또는 유사한 조밀화 기술을 통하여 매트릭스로부터 수분을 제거한, 압착되었거나 또는 조밀한 입자를 의미한다. 이와 같이 입자의 압착 또는 조밀화를 통하여 입자들이 내부에서 서로 뭉치는 것을 촉진할 수도 있다. 예를 들어, 과립은 펠릿 밀에서 주로 알갱이로 이루어진 기질을 펠릿화함으로써 제조될 수 있다. 이렇게 제조된 펠릿은 동물 사료에 있어서 애주반트로서 사용하기에 적합한 과립 크기로 분쇄되거나 또는 붕괴된다. 매트릭스 자체가 동물 사료에 사용하도록 승인을 받았으므로, 이 매트릭스는 동물 사료 내에 효소를 전달하기 위한 희석제로서 사용될 수 있다.

일부 실시태양에서, 본 발명의 효소 전달용 매트릭스 및 본 발명의 방법에 포함되는 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소는 본원에 기술된 바와 같이, 열안정성 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소이므로, 고온 및/또는 증기가 펠릿화된 효소 전달 매트릭스를 제조하는데에 적용될 수 있는 제조 과정 중 알돌라제, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소가 불활성화되는 것을 막을 수 있다. 본 발명의 효소 전달 매트릭스를 함유하는 사료를 분해하는 동안, 수성의 소화액은 활성 효소를 방출시킬 것이다. 다른 유형의 열안정성 효소 및 열안정성인 영양 보충제 또한 임의 유형의 수성 조건하에서의 방출을 위해 전달 매트릭스 내에 혼입될 수 있다.

일부 실시태양에서, 다수의 상이한 목적 예를 들어, 동물 사료에 풍미 또는 영양 보충제를 첨가하거나, 동물 사료 보조제와 효소가 위내 환경에 방출되는 것을 늦추는 등의 목적으로 효소 매트릭스 입자에 코팅이 이루어진다. 일부 실시태양에서, 코팅은 기능상의 목적을 위한 경우 예를 들어, 매트릭스 입자로부터 효소가 방출되는 것을 늦추거나, 또는 효소가 방출될 조건을 제어하는 것이 바람직할 경우에는 언제든지 이루어진다. 코팅 물질 조성물은 그것에 민감한 제제(예를 들어, 열, 산 또는 염기, 효소 또는 기타 화학 물질)에 의해 선택적으로 분해될 수 있다. 별법으로, 상기와 같은 상이한 분해 제제들에 민감한 2개 이상의 코팅이 매트릭스 입자에 연속적으로 가하여질 수 있다.

본 발명은 또한 효소-방출 매트릭스를 제조하기 위한 방법에 관한 것이기도 하다. 본 발명에 따르면, 상기 방법은 효소-방출 매트릭스로서 사용하기에 적합한 입도를 갖는, 주로 알갱이로 이루어진 기질의 별도 입자들을 다수 제공하는 단계를 포함하는데, 이때, 상기 입자는 본 발명에 따른 아미노산 서열에 의해 코딩되는 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 포함한다. 일부 실시태양에서, 상기 방법은 효소-방출 매트릭스 입자를 과립으로 조밀화 또는 압착시키는 단계를 포함하는데, 일부 실시태양에서, 이러한 과정은 대부분 펠릿화에 의해 이루어진다. 곰팡이 저해제 및 점착제가 사용될 경우, 이들은 임의의 적합한 시간에 첨가될 수 있으며, 일부 실시태양에서, 이들은 주로 알갱이로 이루어진 기질을 펠릿화하기 전에, 상기 알갱이로 이루어진 기질과 바람직한 비율로 혼합된다. 일부 실시태양에서, 펠릿 밀 사료내 수분 함량은 최종 산물내 수분 함량에 관하여 전술한 바와 같은 범위 내에 있으며, 일부 실시태양에서, 약 14∼15%이다. 일부 실시태양에서, 수분은 효소의 수성 제제 형태의 공급 원료에 첨가되어, 공급 사료가 수분 함량에 포함되도록 한다. 일부 실시태양에서, 펠릿 밀 하는 동안의 온도는 증기에 의해 약 82℃까지 올라간다. 상기 펠릿 밀은 공급 원료를 충분히 작업하여 펠릿으로 만드는 임의의 조건하에서 실행될 수 있다. 펠릿 공정은 효소-함유 조성물로부터 수분을 제거하는데에 있어 비용면에서 효율적인 공정이다.

본 발명에 따른 조성물 및 방법은 프리바이오틱스(prebiotics) 즉, 고 분자량의 당 예를 들어, 프록토-올리고당(FOS: fructo-oligosaccharide); 갈락토-올리고당(GOS: galacto-oligosaccharide), GRAS(일반적으로 안전하다고 승인된; Generally Recognized As Safe) 물질을 투여하여 실시될 수 있다. 이러한 프리바이오틱스는 몇몇 프로바이오틱 락트산 박테리아(LAB: lactic acid bacteria)에 의해 대사화될 수 있다. 이 프리바이오틱스는 다수의 장내 미생물에 의해서는 분해되지 않는다.

식품의 처리 및 식품 가공

본 발명은 본 발명에 따른 효소들을 포함하는 식품 및 사료와, 이 식품과 사료를 가공할 때 본 발명에 따른 효소를 사용하는 방법을 제공한다. 본 발명에 따른 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소는 식품 가공 산업에 있어서 여러가지 용도로 사용된다. 일부 실시태양에서, 본 발명은 셀룰로스-포함 조성물 예를 들어, 식물 세포, 박테리아 세포, 효모 세포, 곤충 세포, 또는 동물 세포, 또는 임의의 식물 또는 식물의 일부, 또는 임의의 식품 또는 사료, 폐기물 등을 가수분해하는 방법을 제공한다.

예를 들어, 본 발명은 본 발명의 알돌라제, 예로서, 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 효소를 포함하는 사료 또는 식품 예를 들어, 사료, 액체 예를 들어, 음료(예를 들어, 과일 쥬스 또는 맥주), 빵 또는 가루 반죽 또는 빵 제품, 또는 마실 것(예를 들어, 맥주) 또는 음료의 전구물질(예를 들어, 맥아즙)을 제공한다.

본 발명에 따른 식품 처리 공정은 또한 기타 효소, 예로서, 트립토파나제 또는 티로신 데카르복실라제, 락카제, 카탈라제, 락카제, 기타 알돌라제, 알돌라제, 엔도글리코시다제, 엔도-베타-1,4-락카제, 아밀로글루코시다제, 글루코시다제, 글루코스 이소머라제, 글리코실트랜스퍼라제, 리파제, 포스포리파제, 리포옥시게나제, 베타-락카제, 엔도-베타-1,3(4)-락카제, 큐티나제, 퍼옥시다제, 아밀라제, 피타제, 글루코아밀라제, 펙티나제, 리덕타제, 옥시다제, 데카르복실라제, 페놀옥시다제, 리그니나제, 풀루라나제, 아라비나나제, 헤미알돌라제, 만난아제, 크실로락카제, 크실라나제, 펙틴 아세틸 에스터라제, 람노갈락투로난 아세틸 에스터라제, 프로테아제, 펩티다제, 프로테이나제, 폴리갈락투로나제, 람노갈락투로나제, 갈락타나제, 펙틴 라이아제, 트랜스글루타미나제, 펙틴 메틸에스터라제, 셀로바이오하이드롤라제 및/또는 트랜스글루타미나제의 임의 조합물을 사용하는 것을 포함할 수 있다.

약제학적 조성물 및 식이 보충제

본 발명은 또한 본 발명에 따른 알돌라제를 포함하는 약제학적 조성물 및 식이 보충제(예로서, 식이 보조제)를 제공한다. 알돌라제 활성은 피루베이트 알돌라제, HMG 및/또는 KHG 알돌라제 활성을 포함한다. 일부 실시태양에서, 약제학적 조성물 및 식이 보충제(예로서, 식이 보조제)는 경구 섭취용으로 제형화된다.

치주 질환 치료용 화합물은 본 발명에 따른 효소, 예를 들어, 미국 특허 번호 제6,776,979호에 개시되어 있는 바와 같은 효소를 포함할 수 있다. 산성 대장 증후군을 치료 또는 예방하는 조성물 및 방법은 본 발명의 효소 예를 들어, 미국 특허 제6,468,964호에 개시되어 있는 효소를 포함할 수 있다.

다른 실시태양에서, 상처 드레싱 및 임플란트 등은 항균성 효소(예를 들어, 항생제 작용성 효소), 예를 들어, 본 발명에 따른 효소(예를 들어, 본 발명에 따른 서열 포함)를 포함한다. 본 발명에 따른 효소는 또한 알기네이트 드레싱, 항균 막 드레싱, 화상 환자 드레싱, 압박 붕대, 진단 도구, 겔 드레싱, 하이드로-선택성 드레싱, 하이드로셀(소포) 드레싱, 하이드로콜로이드 드레싱, I.V. 드레싱, 절개 드레이프, 저 접착성 드레싱, 악취 흡수 드레싱, 페이스트 붕대, 수술 후 드레싱, 상처 관리, 피부 보호, 투명 필름 드레싱 및/또는 상처 봉합 시에 사용될 수도 있다. 본 발명에 따른 효소는 압박 궤사, 다리의 궤양, 회상, 당뇨병에 의한 족부 궤양, 상처, IV 고정, 수술 상처 및 소소한 상처를 치료하기 위한 환부 소독 및 환부 침상 준비에 사용될 수 있다. 본 발명에 따른 효소는 살균 효소 창상 세정용 조성물 예를 들어, 연고에 사용될 수 있다. 다양한 측면에서, 알돌라제는 정제, 겔, 환약, 임플란트, 액체, 스프레이, 필름, 미셀, 분말, 식품, 사료 펠릿 또는 캡슐화된 제형으로 제형화된다.

본 발명에 따른 약제학적 조성물 및 식이 보충제는 또한 기타 효소, 예로서, 베타-갈락토시다제, 카탈라제, 락카제, 알돌라제, 기타 알돌라제, 엔도글리코시다제, 엔도-베타-1,4-락카제, 아밀로글루코시다제, 글루코시다제, 글루코스 이소머라제, 글리코실트랜스퍼라제, 리파제, 포스포리파제, 리포옥시게나제, 베타-락카제, 엔도-베타-1,3(4)-락카제, 큐티나제, 퍼옥시다제, 아밀라제, 피타제, 글루코아밀라제, 펙티나제, 리덕타제, 옥시다제, 데카르복실라제, 페놀옥시다제, 리그니나제, 풀루라나제, 아라비나나제, 헤미알돌라제, 만난아제, 크실로락카제, 크실라나제, 펙틴 아세틸 에스터라제, 람노갈락투로난 아세틸 에스터라제, 프로테아제, 펩티다제, 프로테이나제, 폴리갈락투로나제, 람노갈락투로나제, 갈락타나제, 펙틴 라이아제, 트랜스글루타미나제, 펙틴 메틸에스터라제, 셀로바이오하이드롤라제 및/또는 트랜스글루타미나제의 임의 조합물을 사용하는 것을 포함할 수 있다.

모나틴의 R,R 및 다른 입체이성체를 생산하는 생합성 경로

특히, WO 03/091396 A2(도 1-3 및 11-13 참조)에 기재된 바와 같이, 모나틴은 생물학적 전환(즉, 폴리펩티드를 사용하여 기질을 반응시켜 산물을 얻는 것을 촉진시키는 것)을 포함하는 다단계 경로를 통해 트립토판으로부터 생산될 수 있다. 기술된 경로는 트립토판을 인돌-3-피루베이트로 생물학적으로 전환시키고, 인돌-3-피루베이트를 2-하이드록시 2-(인돌-3-일메틸)-4-케토 글루타르산("MP")로 생물학적으로 전환시키고, MP를 모나틴으로 생물학적으로 전환시키는 것을 포함한다. 일부 실시태양에서, 본 발명의 폴리펩티드를 사용하여 인돌-3-피루베이트의 반응을 촉진시킴으로서 MP를 형성할 수 있다. 일부 실시태양에서, 본 발명의 폴리펩티드를 사용하여 R-MP의 생산을 우선적으로 촉진시킬 수 있다.

일부 실시태양에서, 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 66, 서열 번호: 68, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162, 서열 번호: 164, 서열 번호: 166, 서열 번호: 168, 서열 번호: 170, 서열 번호: 172, 서열 번호: 174, 서열 번호: 176, 서열 번호: 178, 서열 번호: 180, 서열 번호: 182, 서열 번호: 184, 서열 번호: 186, 서열 번호: 188, 서열 번호: 190, 서열 번호: 192, 서열 번호: 194, 서열 번호: 196, 서열 번호: 198, 서열 번호: 200, 서열 번호: 202, 서열 번호: 204, 서열 번호: 206, 서열 번호: 208, 서열 번호: 210, 서열 번호: 212, 서열 번호: 214, 서열 번호: 216, 서열 번호: 218, 서열 번호: 220, 서열 번호: 222, 서열 번호: 224, 서열 번호: 226, 서열 번호: 228, 서열 번호: 230, 서열 번호: 232, 서열 번호: 234, 서열 번호: 236, 서열 번호: 238, 서열 번호: 240, 서열 번호: 242, 서열 번호: 244, 서열 번호: 246, 서열 번호: 248, 서열 번호: 250, 서열 번호: 252, 서열 번호: 254, 서열 번호: 256, 서열 번호: 258, 서열 번호: 260, 서열 번호: 262, 서열 번호: 264, 서열 번호: 266, 서열 번호: 268, 서열 번호: 270, 서열 번호: 272, 서열 번호: 274, 서열 번호: 276, 서열 번호: 278, 서열 번호: 280, 서열 번호: 282, 서열 번호: 284, 서열 번호: 286, 서열 번호: 288, 서열 번호: 290, 서열 번호: 292, 서열 번호: 294, 서열 번호: 296, 서열 번호: 298, 서열 번호: 300, 서열 번호: 302, 서열 번호: 304, 서열 번호: 306, 서열 번호: 308, 서열 번호: 310, 서열 번호: 312, 서열 번호: 314, 서열 번호: 316, 서열 번호: 318, 서열 번호: 320, 서열 번호: 322, 서열 번호: 324, 서열 번호: 326, 서열 번호: 328, 서열 번호: 330, 서열 번호: 332, 또는 서열 번호: 334의 단리된 또는 재조합 폴리펩티드로부터 선택되는 하나 이상의 폴리펩티드, 또는 알돌라제 활성을 갖는 그의 단편 또는 부분서열은 모나틴, 모나틴 유도체, 그의 염 및 그의 조합으로부터 선택되는 산물을 생산하는 다단계 경로내의 반응을 촉진시키는데 유용할 수 있다. 하나의 실시태양에서, 알돌라제 활성을 갖는 폴리펩티드는 모나틴, 모나틴 유도체, 그의 염 및 그의 조합으로부터 선택되는 산물을 생산하는 다단계 경로내의 하나의 단계로서 인돌-3-피루베이트를 MP로 전환시키는 반응을 촉진시키는데 유용할 수 있다.

또다른 실시태양에서, 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 66, 서열 번호: 68, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162, 서열 번호: 164, 서열 번호: 166, 서열 번호: 168, 서열 번호: 170, 서열 번호: 172, 서열 번호: 174, 서열 번호: 176, 서열 번호: 178, 서열 번호: 180, 서열 번호: 182, 서열 번호: 184, 서열 번호: 186, 서열 번호: 188, 서열 번호: 190, 서열 번호: 192, 서열 번호: 194, 서열 번호: 196, 서열 번호: 198, 서열 번호: 200, 서열 번호: 202, 서열 번호: 204, 서열 번호: 206, 서열 번호: 208, 서열 번호: 210, 서열 번호: 212, 서열 번호: 214, 서열 번호: 216, 서열 번호: 218, 서열 번호: 220, 서열 번호: 222, 서열 번호: 224, 서열 번호: 226, 서열 번호: 228, 서열 번호: 230, 서열 번호: 232, 서열 번호: 234, 서열 번호: 236, 서열 번호: 238, 서열 번호: 240, 서열 번호: 242, 서열 번호: 244, 서열 번호: 246, 서열 번호: 248, 서열 번호: 250, 서열 번호: 252, 서열 번호: 254, 서열 번호: 256, 서열 번호: 258, 서열 번호: 260, 서열 번호: 262, 서열 번호: 264, 서열 번호: 266, 서열 번호: 268, 서열 번호: 270, 서열 번호: 272, 서열 번호: 274, 서열 번호: 276, 서열 번호: 278, 서열 번호: 280, 서열 번호: 282, 서열 번호: 284, 서열 번호: 286, 서열 번호: 288, 서열 번호: 290, 서열 번호: 292, 서열 번호: 294, 서열 번호: 296, 서열 번호: 298, 서열 번호: 300, 서열 번호: 302, 서열 번호: 304중 임의의 것인, HMG 알돌라제 활성을 갖는 단리된 또는 재조합 폴리펩티드로부터 선택되는 하나 이상의 폴리펩티드 또는 알돌라제 활성을 갖는 그의 단편 또는 부분서열은 모나틴, 모나틴 유도체, 그의 염 및 그의 조합으로부터 선택되는 산물을 생산하는 다단계 경로내의 하나의 단계로서 인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응을 촉진시키는데 유용할 수 있다. 하나의 실시태양에서, HMG 알돌라제 활성을 갖는 폴리펩티드는 모나틴, 모나틴 유도체, 그의 염 및 그의 조합으로부터 선택되는 산물을 생산하는 다단계 경로내의 하나의 단계로서 인돌-3-피루베이트를 MP로 전환시키는 반응을 촉진시키는데 유용할 수 있다.

추가의 또다른 실시태양에서, 서열 번호: 306, 서열 번호: 308, 서열 번호: 310, 서열 번호: 312, 서열 번호: 314, 서열 번호: 316, 서열 번호: 318, 서열 번호: 320, 서열 번호: 322, 서열 번호: 324, 서열 번호: 326, 서열 번호: 328, 서열 번호: 330, 서열 번호: 332, 또는 서열 번호: 334중 임의의 것인, KHG 알돌라제 활성을 갖는 단리된 또는 재조합 폴리펩티드로부터 선택되는 하나 이상의 폴리펩티드 또는 알돌라제 활성을 갖는 그의 단편 또는 부분서열은 모나틴, 모나틴 유도체, 그의 염 및 그의 조합으로부터 선택되는 산물을 생산하는 다단계 경로내의 하나의 단계로서 인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응을 촉진시키는데 유용할 수 있다. 하나의 실시태양에서, KHG 알돌라제 활성을 갖는 폴리펩티드는 모나틴, 모나틴 유도체, 그의 염 및 그의 조합으로부터 선택되는 산물을 생산하는 다단계 경로내의 하나의 단계로서 인돌-3-피루베이트를 MP로 전환시키는 반응을 촉진시키는데 유용할 수 있다.

추가로, 본 발명은 적어도 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 75개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개, 650개, 700개, 750개, 800개, 850개, 900개, 950개, 1000개, 1050개, 1100개, 1150개, 1200개, 1250개, 1300개, 1350개, 1400개, 1450개, 1500개, 1550개, 1600개, 1650개, 1700개, 1750개, 1800개, 1850개, 1900개, 1950개, 2000개, 2050개, 2100개, 2200개, 2250개, 2300개, 2350개, 2400개, 2450개, 2500개 또는 그 이상의 잔기로 이루어진 영역에 걸쳐서 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 67, 서열 번호: 69, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161, 서열 번호: 163, 서열 번호: 165, 서열 번호: 167, 서열 번호: 169, 서열 번호: 171, 서열 번호: 173, 서열 번호: 175, 서열 번호: 177, 서열 번호: 179, 서열 번호: 181, 서열 번호: 183, 서열 번호: 185, 서열 번호: 187, 서열 번호: 189, 서열 번호: 191, 서열 번호: 193, 서열 번호: 195, 서열 번호: 197, 서열 번호: 199, 서열 번호: 201, 서열 번호: 203, 서열 번호: 205, 서열 번호: 207, 서열 번호: 209, 서열 번호: 211, 서열 번호: 213, 서열 번호: 215, 서열 번호: 217, 서열 번호: 219, 서열 번호: 221, 서열 번호: 223, 서열 번호: 225, 서열 번호: 227, 서열 번호: 229, 서열 번호: 231, 서열 번호: 233, 서열 번호: 235, 서열 번호: 237, 서열 번호: 239, 서열 번호: 241, 서열 번호: 243, 서열 번호: 245, 서열 번호: 247, 서열 번호: 249, 서열 번호: 251, 서열 번호: 253, 서열 번호: 255, 서열 번호: 257, 서열 번호: 259, 서열 번호: 261, 서열 번호: 263, 서열 번호: 265, 서열 번호: 267, 서열 번호: 269, 서열 번호: 271, 서열 번호: 273, 서열 번호: 275, 서열 번호: 277, 서열 번호: 279, 서열 번호: 281, 서열 번호: 283, 서열 번호: 285, 서열 번호: 287, 서열 번호: 289, 서열 번호: 291, 서열 번호: 293, 서열 번호: 295, 서열 번호: 297, 서열 번호: 299, 서열 번호: 301, 서열 번호: 303, 서열 번호: 305, 서열 번호: 307, 서열 번호: 309, 서열 번호: 311, 서열 번호: 313, 서열 번호: 315, 서열 번호: 317, 서열 번호: 319, 서열 번호: 321, 서열 번호: 323, 서열 번호: 325, 서열 번호: 327, 서열 번호: 329, 서열 번호: 331, 서열 번호: 333, 서열 번호: 335, 서열 번호: 336, 서열 번호: 337, 및 서열 번호: 338을 비롯한, 본 발명에 따른 핵산과 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의, 또는 완벽한(100%) 서열 동일성을 갖는 하나 이상의 핵산 서열에 의해 코딩되는 하나 이상의 폴리펩티드는 모나틴, 모나틴 유도체, 그의 염 및 그의 조합으로부터 선택되는 산물을 생산하는 다단계 경로내의 하나의 단계로서 인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응을 촉진시키는데 유용할 수 있다. 하나의 실시태양에서, 알돌라제 활성을 갖는 하나 이상의 폴리펩티드, 또는 그의 단편 또는 부분서열은 모나틴, 모나틴 유도체, 그의 염 및 그의 조합으로부터 선택되는 산물을 생산하는 다단계 경로내의 하나의 단계로서 인돌-3-피루베이트를 MP로 전환시키는 반응을 촉진시키는데 유용할 수 있다.

본 발명의 또다른 실시태양에서, 본 발명은 적어도 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 75개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개, 650개, 700개, 750개, 800개, 850개, 900개, 950개, 1000개, 1050개, 1100개, 1150개, 1200개, 1250개, 1300개, 1350개, 1400개, 1450개, 1500개, 1550개, 1600개, 1650개, 1700개, 1750개, 1800개, 1850개, 1900개, 1950개, 2000개, 2050개, 2100개, 2200개, 2250개, 2300개, 2350개, 2400개, 2450개, 2500개 또는 그 이상의 잔기로 이루어진 영역에 걸쳐서 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 67, 서열 번호: 69, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161, 서열 번호: 163, 서열 번호: 165, 서열 번호: 167, 서열 번호: 169, 서열 번호: 171, 서열 번호: 173, 서열 번호: 175, 서열 번호: 177, 서열 번호: 179, 서열 번호: 181, 서열 번호: 183, 서열 번호: 185, 서열 번호: 187, 서열 번호: 189, 서열 번호: 191, 서열 번호: 193, 서열 번호: 195, 서열 번호: 197, 서열 번호: 199, 서열 번호: 201, 서열 번호: 203, 서열 번호: 205, 서열 번호: 207, 서열 번호: 209, 서열 번호: 211, 서열 번호: 213, 서열 번호: 215, 서열 번호: 217, 서열 번호: 219, 서열 번호: 221, 서열 번호: 223, 서열 번호: 225, 서열 번호: 227, 서열 번호: 229, 서열 번호: 231, 서열 번호: 233, 서열 번호: 235, 서열 번호: 237, 서열 번호: 239, 서열 번호: 241, 서열 번호: 243, 서열 번호: 245, 서열 번호: 247, 서열 번호: 249, 서열 번호: 251, 서열 번호: 253, 서열 번호: 255, 서열 번호: 257, 서열 번호: 259, 서열 번호: 261, 서열 번호: 263, 서열 번호: 265, 서열 번호: 267, 서열 번호: 269, 서열 번호: 271, 서열 번호: 273, 서열 번호: 275, 서열 번호: 277, 서열 번호: 279, 서열 번호: 281, 서열 번호: 283, 서열 번호: 285, 서열 번호: 287, 서열 번호: 289, 서열 번호: 291, 서열 번호: 293, 서열 번호: 295, 서열 번호: 297, 서열 번호: 299, 서열 번호: 301, 서열 번호: 303, 서열 번호: 305를 비롯한, 본 발명에 따른 핵산과 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의, 또는 완벽한(100%) 서열 동일성을 갖는 핵산 서열에 의해 코딩되는, HMG 알돌라제 활성을 갖는 하나 이상의 폴리펩티드는 모나틴, 모나틴 유도체, 그의 염 및 그의 조합으로부터 선택되는 산물을 생산하는 다단계 경로내의 하나의 단계로서 인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응을 촉진시키는데 유용할 수 있다. 하나의 실시태양에서, HMG 알돌라제 활성을 갖는 하나 이상의 폴리펩티드는 모나틴, 모나틴 유도체, 그의 염 및 그의 조합으로부터 선택되는 산물을 생산하는 다단계 경로내의 하나의 단계로서 인돌-3-피루베이트를 MP로 전환시키는 반응을 촉진시키는데 유용할 수 있다.

추가의 또다른 실시태양에서, 적어도 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 75개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개, 650개, 700개, 750개, 800개, 850개, 900개, 950개, 1000개, 1050개, 1100개, 1150개, 1200개, 1250개, 1300개, 1350개, 1400개, 1450개, 1500개, 1550개, 1600개, 1650개, 1700개, 1750개, 1800개, 1850개, 1900개, 1950개, 2000개, 2050개, 2100개, 2200개, 2250개, 2300개, 2350개, 2400개, 2450개, 2500개 또는 그 이상의 잔기로 이루어진 영역에 걸쳐서 서열 번호: 307, 서열 번호: 309, 서열 번호: 311, 서열 번호: 313, 서열 번호: 315, 서열 번호: 317, 서열 번호: 319, 서열 번호: 321, 서열 번호: 323, 서열 번호: 325, 서열 번호: 327, 서열 번호: 329, 서열 번호: 331, 서열 번호: 333, 서열 번호: 335, 서열 번호: 336, 서열 번호: 337, 및 서열 번호: 338을 비롯한, 본 발명에 따른 핵산과 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의, 또는 완벽한(100%) 서열 동일성을 갖는 핵산 서열에 의해 코딩되는, KHG 알돌라제 활성을 갖는 하나 이상의 폴리펩티드는 모나틴, 모나틴 유도체, 그의 염 및 그의 조합으로부터 선택되는 산물을 생산하는 다단계 경로내의 하나의 단계로서 인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응을 촉진시키는데 유용할 수 있다. 하나의 실시태양에서, KHG 알돌라제 활성을 갖는 하나 이상의 폴리펩티드는 모나틴, 모나틴 유도체, 그의 염 및 그의 조합으로부터 선택되는 산물을 생산하는 다단계 경로내의 하나의 단계로서 인돌-3-피루베이트를 MP로 전환시키는 반응을 촉진시키는데 유용할 수 있다.

더욱이, 엄격한 조건하에서 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 67, 서열 번호: 69, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161, 서열 번호: 163, 서열 번호: 165, 서열 번호: 167, 서열 번호: 169, 서열 번호: 171, 서열 번호: 173, 서열 번호: 175, 서열 번호: 177, 서열 번호: 179, 서열 번호: 181, 서열 번호: 183, 서열 번호: 185, 서열 번호: 187, 서열 번호: 189, 서열 번호: 191, 서열 번호: 193, 서열 번호: 195, 서열 번호: 197, 서열 번호: 199, 서열 번호: 201, 서열 번호: 203, 서열 번호: 205, 서열 번호: 207, 서열 번호: 209, 서열 번호: 211, 서열 번호: 213, 서열 번호: 215, 서열 번호: 217, 서열 번호: 219, 서열 번호: 221, 서열 번호: 223, 서열 번호: 225, 서열 번호: 227, 서열 번호: 229, 서열 번호: 231, 서열 번호: 233, 서열 번호: 235, 서열 번호: 237, 서열 번호: 239, 서열 번호: 241, 서열 번호: 243, 서열 번호: 245, 서열 번호: 247, 서열 번호: 249, 서열 번호: 251, 서열 번호: 253, 서열 번호: 255, 서열 번호: 257, 서열 번호: 259, 서열 번호: 261, 서열 번호: 263, 서열 번호: 265, 서열 번호: 267, 서열 번호: 269, 서열 번호: 271, 서열 번호: 273, 서열 번호: 275, 서열 번호: 277, 서열 번호: 279, 서열 번호: 281, 서열 번호: 283, 서열 번호: 285, 서열 번호: 287, 서열 번호: 289, 서열 번호: 291, 서열 번호: 293, 서열 번호: 295, 서열 번호: 297, 서열 번호: 299, 서열 번호: 301, 서열 번호: 303, 서열 번호: 305, 서열 번호: 307, 서열 번호: 309, 서열 번호: 311, 서열 번호: 313, 서열 번호: 315, 서열 번호: 317, 서열 번호: 319, 서열 번호: 321, 서열 번호: 323, 서열 번호: 325, 서열 번호: 327, 서열 번호: 329, 서열 번호: 331, 서열 번호: 333, 서열 번호: 335, 서열 번호: 336, 서열 번호: 337, 및 서열 번호: 338의 핵산에 혼성화하는 핵산에 의해 코딩되는, 알돌라제 활성을 갖는 하나 이상의 폴리펩티드는 모나틴, 모나틴 유도체, 그의 염 및 그의 조합으로부터 선택되는 산물을 생산하는 다단계 경로내의 하나의 단계로서 인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응을 촉진시키는데 유용할 수 있다. 하나의 실시태양에서, 알돌라제 활성을 갖는 하나 이상의 폴리펩티드는 모나틴, 모나틴 유도체, 그의 염 및 그의 조합으로부터 선택되는 산물을 생산하는 다단계 경로내의 하나의 단계로서 인돌-3-피루베이트를 MP로 전환시키는 반응을 촉진시키는데 유용할 수 있다.

본 발명의 또다른 실시태양에서, 엄격한 조건하에서 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 67, 서열 번호: 69, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161, 서열 번호: 163, 서열 번호: 165, 서열 번호: 167, 서열 번호: 169, 서열 번호: 171, 서열 번호: 173, 서열 번호: 175, 서열 번호: 177, 서열 번호: 179, 서열 번호: 181, 서열 번호: 183, 서열 번호: 185, 서열 번호: 187, 서열 번호: 189, 서열 번호: 191, 서열 번호: 193, 서열 번호: 195, 서열 번호: 197, 서열 번호: 199, 서열 번호: 201, 서열 번호: 203, 서열 번호: 205, 서열 번호: 207, 서열 번호: 209, 서열 번호: 211, 서열 번호: 213, 서열 번호: 215, 서열 번호: 217, 서열 번호: 219, 서열 번호: 221, 서열 번호: 223, 서열 번호: 225, 서열 번호: 227, 서열 번호: 229, 서열 번호: 231, 서열 번호: 233, 서열 번호: 235, 서열 번호: 237, 서열 번호: 239, 서열 번호: 241, 서열 번호: 243, 서열 번호: 245, 서열 번호: 247, 서열 번호: 249, 서열 번호: 251, 서열 번호: 253, 서열 번호: 255, 서열 번호: 257, 서열 번호: 259, 서열 번호: 261, 서열 번호: 263, 서열 번호: 265, 서열 번호: 267, 서열 번호: 269, 서열 번호: 271, 서열 번호: 273, 서열 번호: 275, 서열 번호: 277, 서열 번호: 279, 서열 번호: 281, 서열 번호: 283, 서열 번호: 285, 서열 번호: 287, 서열 번호: 289, 서열 번호: 291, 서열 번호: 293, 서열 번호: 295, 서열 번호: 297, 서열 번호: 299, 서열 번호: 301, 서열 번호: 303, 서열 번호: 305의 핵산에 혼성화하는 핵산에 의해 코딩되는, HMG 알돌라제 활성을 갖는 하나 이상의 폴리펩티드는 모나틴, 모나틴 유도체, 그의 염 및 그의 조합으로부터 선택되는 산물을 생산하는 다단계 경로내의 하나의 단계로서 인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응을 촉진시키는데 유용할 수 있다. 하나의 실시태양에서, HMG 알돌라제 활성을 갖는 하나 이상의 폴리펩티드는 모나틴, 모나틴 유도체, 그의 염 및 그의 조합으로부터 선택되는 산물을 생산하는 다단계 경로내의 하나의 단계로서 인돌-3-피루베이트를 MP로 전환시키는 반응을 촉진시키는데 유용할 수 있다.

본 발명의 추가의 또다른 실시태양에서, 엄격한 조건하에서 서열 번호: 307, 서열 번호: 309, 서열 번호: 311, 서열 번호: 313, 서열 번호: 315, 서열 번호: 317, 서열 번호: 319, 서열 번호: 321, 서열 번호: 323, 서열 번호: 325, 서열 번호: 327, 서열 번호: 329, 서열 번호: 331, 서열 번호: 333, 서열 번호: 335, 서열 번호: 336, 서열 번호: 337, 및 서열 번호: 338의 핵산에 혼성화하는 핵산에 의해 코딩되는, KHG 알돌라제 활성을 갖는 하나 이상의 폴리펩티드는 모나틴, 모나틴 유도체, 그의 염 및 그의 조합으로부터 선택되는 산물을 생산하는 다단계 경로내의 하나의 단계로서 인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응을 촉진시키는데 유용할 수 있다. 하나의 실시태양에서, KHG 알돌라제 활성을 갖는 하나 이상의 폴리펩티드는 모나틴, 모나틴 유도체, 그의 염 및 그의 조합으로부터 선택되는 산물을 생산하는 다단계 경로내의 하나의 단계로서 인돌-3-피루베이트를 MP로 전환시키는 반응을 촉진시키는데 유용할 수 있다.

본원에 기술된 알돌라제 활성을 갖는 폴리펩티드는 인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응을 촉진시키는데 유용할 수 있다. C3 탄소 공급원은 옥살로아세테이트, 피루베이트 또는 피루베이트 유도체, 예로서, 포스포에놀피루베이트를 포함하는, 이에 한정되는 것은 아니다. 하나의 실시태양에서, C3 탄소 공급원은 피루베이트이다.

인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응 산물을 모나틴으로 전환시키는데 유용한 예시적인 효소로서 하기 효소 부류의 구성원들을 포함한다: 트립토판 아미노트랜스퍼라제(2.6.1.27), 트립토판 데하이드로게나제(1.4.1.19), D-아미노산 데하이드로게나제(1.4.99.1), 글루타메이트 데하이드로게나제(1.4.1.2-4), 페닐알라닌 데하이드로게나제(EC 1.4.1.20), 트립토판-페닐피루베이트 트랜스아미나제(2.6.1.28), 또는 아미노트랜스퍼라제 계열(2.6.1.-)의 보다 일반적인 구성원들, 예로서, 아스파테이트 아미노트랜스퍼라제(EC 2.6.1.1), 티로신(방향족) 아미노트랜스퍼라제(2.6.1.5), D-트립토판 아미노트랜스퍼라제, 또는 D-알라닌(2.6.1.21) 아미노트랜스퍼라제(WO 03/091396 A2의 도 2 참조). 이러한 반응은 또한 화학적 반응을 사용하여 실시될 수 있다. 케토산(MP)의 아민화는 암모니아 및 나트륨 시아노보로하이드라이드를 사용한 환원적 아민화에 의해 실시된다. WO 03/091396 A2의 도 11-13은 MP를 모나틴으로 전환시키는데 사용될 수 있을 뿐만 아니라, 인돌-3-피루베이트 또는 트립토판으로부터의 모나틴의 수율을 증가시키는 추가의 폴리펩티드를 제시한다. 하나의 실시태양에서, 이러한 효소는 인돌-3-피루베이트와 피루베이트의 반응 산물인 MP를 모나틴으로 전환하는 것을 촉진시키는데 사용된다.

모나틴 조성물의 미감 프로파일은 조성물 내다양한 모나틴의 입체이성체의 상대량을 조절함으로써 변경될 수 잇다. 본 개시는 R,R 모나틴 및/또는 S,R 모나틴을 원하는 비율로 포함하는 모나틴 조성물을 생산하기 위한 경로 및 물질을 제공한다.

개시된 경로에 의해 생산된 모나틴 화합물의 키랄성은 pH 및 생물학적 전환에 사용되는 폴리펩티드, 둘 모두에 의해 영향을 받을 수 있다. 본원에 개시된 알돌라제 활성을 갖는 폴리펩티드는 인돌-3-피루베이트가 MP로 전환되는 반응에서 모나틴 탄소-2(상기 화학식(I) 참조)의 키랄성을 조절하는데 사용될 수 있다.

일단 인돌-3-피루베이트 및 C3 탄소 공급원 사이 반응의 반응 산물이 생산되면, 아미노기가 입체특이적으로 첨가될 수 있다. 탄소-4(상기 화학식(I) 참조)의 R 또는 S 배열은 D- 또는 L-방향족 산 아미노트랜스퍼라제가 사용되는지 여부에 따라 생성될 수 있다. 다수의 아미노트랜스퍼라제는 L-이성체에 대하여 특이적이지만, D-트립토판 아미노트랜스퍼라제는 특정 식물에만 존재한다(문헌 [Kohiba and Mito, Proceedings of the 8th International Symposium on Vitamin B6 and Carbonyl Catalysis, Osaka, Japan 1990]). 또한, D-알라닌 아미노트랜스퍼라제(2.6.1.21), D-메티오닌-피루베이트 아미노트랜스퍼라제(2.6.1.41) 및 (R)-3-아미노-2-메틸프로파노에이트 아미노트랜스퍼라제(2.6.1.61), (S)-3-아미노-2-메틸프로파노에이트 아미노트랜스퍼라제(2.6.1.22) 둘 모두, 및 D-페닐글리신 아미노트랜스퍼라제가 동정되었다. 특정 아미노트랜스퍼라제는 C2 탄소에서 특정 배열을 갖는 상기 반응을 위한 기질을 단지 허용만 할 수 있다. 그러므로, 인돌-3-피루베이트 및 C3 탄소 공급원 사이의 반응산물로의 전환이 입체특이적이 아닐지라도, 최종 산물의 입체화학성은 아미노트랜스퍼라제의 적절한 선별을 통해 조절될 수 있다. 반응은 가역적이기 때문에 비반응 반응 산물(원치않는 이성체)은 다시 그의 성분들로 재순환될 수 있고, 반응 산물의 라세미 혼합물이 재형성될 수 있다.

아미노기를 인돌-3-피루베이트 및 C3 탄소 공급원 사이 반응의 반응 산물에 첨가하는데 적합한 아미노 공여체의 일례로 아미노산, 예로서, 알라닌, 아스파테이트, 리신, 글루타메이트, 글리신, 및 트립토판을 포함하나, 이에 한정되는 것은 아니다.

이에 도면을 참고로 하여 하기에 주목하여야 한다. 흐름도는 모나틴을 생산하는 경로를 확인시켜 주지만, 상기 경로를 실시하는 임의의 특정 방법으로 제한되는 것은 아니다. 예를 들면, 경로는 생체내, 시험관내, 또는 그의 조합을 통해 실시될 수 있다.

더욱이, 상기 경로를 실시함에 있어서, 충분한 성분들, 또는 성분의 공급원, 및 반응 조건이 상기 경로가 잠재적으로 진행될 수 있도록 제공되는 한, 각각의 동정된 성분들(예로서, 반응물 및 효소)은 명백하게 전문가에 의해 제공될 필요는 없다. 다시 말해, 예를 들면, L-트립토판으로부터 인돌-3-피루베이트를 생산하고, 인돌-3-피루베이트로부터 2-하이드록시 2-(인돌-3일메틸)-4-케토 글루타르산("모나틴 전구체" 또는 "MP")을 생산하고, MP로부터 모나틴을 생산하며, 각 반응은 적절한 효소에 의해 촉진되는 것을 포함하는, 모나틴 조성물을 생산하는 공정을 도면에 도시한 경우, 상기 경로를 실시하는 것은 L-트립토판을 α-케토글루타레이트 및 확인된 반응을 촉진시키기 위해 주시되는 효소와 조합하는 것, 및 명백하게 인돌-3-피루베이트 또는 MP를 제공하지 않고도 발생할 수 있는 각 반응에 적합한 조건을 포함하는 것이 주시된다. 이러한 경우, L-트립토판은 α-케토글루타레이트와 반응하여 인돌-3-피루베이트를 생산할 수 있다. 세트 조건과 제공된 효소로 인하여, L-트립토판 반응으로부터 생산된 인돌-3-피루베이트는 반응하여 MP를 형성할 수 있고, 세트 조건과 제공된 효소로 인하여 인돌-3-피루베이트로부터 생산된 MP는 반응하여 모나틴을 형성할 수 있다.

도시된 경로를 실시함에 있어 전문가는 확인된 출발 물질 또는 효소를 명백하게 제공할 필요는 없다는 것에도 주목하여야 한다. 다시 말해, 출발 물질로서 L-트립토판을 확인한 임의의 경로를 실시하는 것은 발생하는 L-트립토판 생산에 적합한 조건하에서 L-트립토판을 생산할 수 있는 화합물을 제공하고, 발생하는 상기 반응에 적합한 조건하에서 기재된 일련의 반응을 촉진시킬 수 있는 효쇼와 상기 화합물을 조합시키는 것을 포함할 것이라는 것이 주시된다. 또다른 일례로서, 확인된 경로를 실시하는 것은 기술된 경로를 따라 모나틴을 생산하기 위하여 유전공학 처리된 미생물을 제공하고, 발효 공정이 발생할 수 있도록 적절한 조건을 제공하는 것을 포함할 것이다. 예를 들면, 천연적으로 다량의 L-트립토판을 생산하는 미생물은 유전공학 처리되어 모나틴에 대한 경로에서 반응을 촉진시키는데 사용되는 하나 이상의 효소를 생산 또는 과생산할 수 있고, 미생물이 적절한 조건에 의해 모나틴을 생산할 수 있도록 적절한 조건이 제공될 수 있다.

도 1은 R-특이 알돌라제가 인돌-3-피루베이트와 피루베이트의 반응을 촉진시켜 R-MP를 형성하는 특정 실시태양을 밝힌다. 도 1의 흐름도는 R,R 모나틴을 비롯한 모나틴 조성물을 제조하는 본 발명에 다른 방법을 개략적으로 도시한다. 도 1에 나타낸 바와 같이, 전반적인 경로는 인돌-3-피루베이트를 형성하는 트립토판 반응, MP를 생산하는 인돌-3-피루베이트 반응, 및 R,R 모나틴을 비롯한 모나틴을 생산하는 MP 반응을 포함한다.

도 1은 추가로 S,S,R,S 및 S,R 형태의 모나틴를 사용하여 R,R 형태의 모나틴 생산을 증가시키도록 디자인된, 상기의 전반적인 경로에 관한 특정의 변경을 도시한다. 특히, 도 1은 L-트립토판 반응에서 사용된 아미노트랜스퍼라제 효소는 MP 반응과 비교하여 L-트립토판 반응에 대하여 더욱 큰 활성 및/또는 특이성을 갖고; 4S 모나틴 또는 옥시다제는 4R 모나틴보다 L-트립토판에 대하여 더욱 큰 활성 및/또는 특이성을 갖고; 인돌-3-피루베이트의 반응을 촉진시키는 효소는 본원에 개시된 알돌라제 활성을 갖는 폴리펩티드이며, MP 반응을 촉진시키는 효소는 바람직하게는 MP의 R 이성체와 더욱 효율적으로 작용하도록 진화된 것으로서, 광범위한 특이성을 갖는 D-효소인, 실시태양을 도시한다.

도 1은 또한 R,R 모나틴을 보다 경제적으로 생산할 수 있도록 디자인된 특정의 변경을 도시한다. 예를 들면, 도 1에서, D-트립토판과 대립되는 것 또는 L- 및 D-트립토판의 조합물인 L-트립토판이 출발 물질로서 확인된다. 특정 형태의 트립토판을 선택하는 것이 모나틴 조성물 중 최종 모나틴 화합물의 키랄성에는 영향을 미치지 못하지만(이는 트립토판이 어떤 키랄성도 갖지 않는 인돌-3-피루베이트를 형성하기 때문이다), 일부는 출발 물질로서 L-트립토판을 사용하는 것을 선호할 수 있는데, 이는 적어도 L-트립토판이 현재는 D-트립토판보다 비용면에서 더 저렴하고, 보다 손쉽게 입수할 수 있기 때문이다.

도 1에 나타낸 제1 반응에 초점을 맞추어 보면, 트립토판이 트립토판로 전환될 때, 알파-케토글루타레이트, 옥살로아세테이트, 및 피루베이트 중 어느 하나 이상의 것은 반응하여 아미노산을 형성한다(각각 글루타메이트, 아스파테이트, 및 알라닌). 도 1은 트립토판 출발 물질이 L-트립토판이고, 알파-케토글루타레이트, 옥살로아세테이트 및/또는 피루베이트가 L-이성체 형태의 아미노산(예로서, 각각 L-글루타메이트, L-아스파테이트, 및/또는 L-알라닌)을 생산하는 실시태양을 도시한다.

도 1에 나타낸 바와 같이, R,R 모나틴의 생산을 증가시키는 접근법은 MP 또는 모나틴에 비하여 트립토판에 대하여 더욱 큰 특이성, 더욱 큰 활성, 또는 둘 모두를 갖는 효소와 L-트립토판의 반응을 촉진시키는 것, 및 MP와 D-효소의 반응을 촉진시키는 것을 포함한다. WO 03/091396 A2에 개시된 바와 같이, 특정 효소는 인돌-3-피루베이트를 생산하는 트립토판의 반응을 촉진시킬 수 있을 뿐만 아니라, 모나틴을 생산하는 MP의 아민화 반응도 촉진시킬 수 있다. 아민화 반응에서 L-아미노트랜스퍼라제를 사용할 경우, 모나틴 C-4 위치에 S 키랄 중심이 형성되는 반면, D-효소를 사용할 경우, 모나틴 C-4 위치에 D 키랄 중심이 형성된다. 따라서, 트립토판 반응을 촉진시키는 L-아미노트랜스퍼라제 또한 MP 반응에서 활성인 경우, 존재하는 MP의 형태에 따라 R,S 및 S,S 모나틴이 형성될 수 있다. 또한, 특정의 기타 효소-L-아미노산 옥시다제는 인돌-3-피루베이트로의 트립토판 반응을 촉진시킬 수 있을 뿐만 아니라, R,R 모나틴의 분해에 대한 부활성도 가질 수 있다. 일부 실시태양에 따라, 상기 4R 부활성은 최소화되거나 소거된다. 4S 형태의 모나틴에 대한 옥시다제 부활성은 최종 산물로부터의 4S 형태의 모나틴을 감소시키거나 최소화시킬 것이며, 이는 원하는 최조 조성물에 따라 바람직할 수 있다. 결과적으로, MP 또는 모나틴과 비교하여 트립토판에 대한 선택된 L-효소의 특이성 및/또는 활성이 크면 클수록 S,S 및 R,S 모나틴과 비교하여 R,R 및 S,R의 생산량은 더욱 많아진다.

도 1에 도시된 실시태양에 따른 트립토판 반응에 적합한 효소르는 인돌-3-피루베이트를 형성하는 L-트립토판 반응을 촉진시킬 수 있으며, 모나틴의 4S 이성체를 형성하는 R-MP 반응보다는 L-트립토판 반응에 대하여 더욱 큰 특이성을 갖는 L-아미노트랜스퍼라제, 및 인돌-3-피루베이트를 형성하는 L-트립토판 반응을 촉진시킬 수 있으며, MP를 형성하는 모나틴의 4R 이성체의 반응보다는 L-트립토판 반응에 대하여 더욱 큰 특이성 및/또는 활성을 갖는 L-아미노산 옥시다제, 및 상기 중 임의의 것이 기능적 등가물을 포함한다. 더욱 특히, 적합한 효소의 비제한적인 일례는 L-트립토판 아미노트랜스퍼라제(E. C. 2.6.1.27) 및 티로신(방향족) 아미노트랜스퍼라제(EC 2.6.1.5) 및 L-아미노산 옥시다제(EC 1.4.3.2), 및 아스파테이트 아미노트랜스퍼라제 활성을 갖는 효소로부터 유래된 돌연변이체로부터 선택될 수 있다.

실시예 16은 특정 효소인, 인돌-3-피루베이트 및 각 L-글루타메이트, L-아스파테이트, 및 L-알라닌을 형성하는 L-트립토판과 α-KG, 옥살로아세테이트, 피루베이트, 또는 그의 조합의 반응을 촉진시키는데 유용한, Pro 9→Tyr 치환 및 Arg 122→Gly 치환을 포함하는 돌연변이체 HEXaspC 폴리펩티드를 동정한다. "제한된 활성"을 갖는 또다른 특정 효소는 S. 멜리로티(S. meliloti)로부터의 L-트립토판 아미노트랜스퍼라제인 TatA이다. 도 1에 나타낸 경로의 바람직한 실시태양에 따른 트립토판 반응에 적합한 기타 효소로는 하기 특징들을 갖는 것을 포함한다: 실시예 16에서와 같이 L-트립토판의 속도의 1/10로 또는 그 속도보다 느리게 MP의 아미노산 전이를 일으키는 효소, 또는 실시예 18에서와 같이, 라세마제와 함께 사용될 때, 모나틴의 4R 이성체를 90% 초과로 생산하는 효소를 포함한다.

MP에서 모나틴으로의 전환과 비교하여 L-트립토판에서 인돌-3-피루베이트로의 전환에 대하여 보다 큰 특이성을 갖지 못하는 효소의 일례로는 HEXAspC(실시예 16), 리슈마니아 메이저(Leishmania major)로부터 유래된 광범위한 특이성을 갖는 아미노트랜스퍼라제(WO 03/091396 A2), 돼지 아미노트랜스퍼라제(WO 03/091396 A2) 및 로도박터 스페로이데스(Rhodobacter sphaeroides) TatA(실시예 18)를 포함한다. 그러나, 이들 효소는 예를 들면, 돌연변이 유발법을 통해 트립토판과 비교하여 R-MP 및/또는 R,R 모나틴에 대하여 제한된 활성을 갖도록 진화될 수 있다.

도 1에 나타낸 제2 반응에 초점을 맞추어 보면, 인돌-3-피루베이트에서 MP로의 반응을 촉진시키는 효소를 선택하는 것은 S,R 모나틴 생산량과 비교하여 R,R 모나틴의 상대적인 생산량에 영향을 준다. 일반적으로, S-MP 생산량과 비교하여 R-MP의 상대적인 생산량이 많을수록, S,R 모나틴 생산량과 비교하여 R,R 모나틴의 상대적인 생산량이 더 많아진다(D-효소가 MP에서 모나틴으로의 반응을 촉진시킬 때). 모나틴 조성물의 유일한 모나틴 성분으로서 R,R 형태의 모나틴을 갖는 모나틴 조성물이 바람직한 경우, S-MP에 비하여 선택적으로 R-MP를 생산하는 효소("R-특이 효소")가 사용되어야 한다. 본원에 기술된, 알돌라제 활성을 갖는 폴리펩티드가 S-MP에 비하여 선택적으로 R-MP를 생산하는데 유용하다. 고도로 R-특이성인 알돌라제 효소의 몇몇 일례가 상기 표 1과 하기 실시예 4, 5, 및 6, 및 서열 목록에서 입증된다.

도 1에 나타낸 경로 중 마지막 단계에 초점을 맞추어 보면, R,R 모나틴을 형성하는 R-MP의 반응은 광범위한 특이성을 갖는 D-아미노트랜스퍼라제, 예를 들면 D-알라닌 아미노트랜스퍼라제(E. C. 2.6.1.21, D-아미노산 아미노트랜스퍼라제 또는 D-아스파테이트 아미노트랜스퍼라제로도 공지됨) 또는 D-아미노산 데하이드로게나제에 의해 촉진되는 것으로 보인다. 상기에서 논의된 바와 같이, MP에서 모나틴으로의 전환은 아민화 반응인데, 이는 모나틴 C-4 탄소에 키랄 중심을 형성한다. C-4 위치에 R-키랄 형태가 바람직할 경우, 아미노산에서 "R" 키랄 중심을 생산하는 효소가 사용되어야 한다.

일부 실시태양에 따라, D-아미노트랜스퍼라제는 인돌-3-피루베이트보다 R-MP에 대하여 더욱 큰 특이성, 더욱 큰 활성, 또는 둘 모두를 갖는다. 일부 실시태양에 따라, D-아미노트랜스퍼라제는 인돌-3-피루베이트에 대하여 제한된 활성을 갖는다. 그러한 특징을 갖는 효소는 예를 들면, 실시예 16에 나타낸 바와 같이 현 효소로부터 진화될 수 있거나 돌연변이화될 수 있다.

실시예 9 내지 12는 D-트립토판으로부터 R,R-모나틴을 생산하는 것을 예시한다.

도 2는 R,R 모나틴 및 S,R 모나틴을 생산하는 방법을 도시한다. 도 1의 실시태양에서는 R-MP를 형성하는 인돌-3-피루베이트의 반응에 사용되는 알돌라제가 형성된 R,R:S,R의 비에 영향을 주었지만, 도 2의 실시태양에서는 MP에서 모나틴으로의 전환을 촉진시키는 D-효소가 형성된 R,R:S,R의 비에 영향을 준다. 도 2의 경로에 따라, 인돌-3-피루베이트에서 MP로의 전환을 촉진시키기 위해 비입체특이성 효소가 사용되면, 이때 S-MP 및 R-MP, 둘 모두가 형성될 수 있다. 인돌-3-피루베이트에서 MP로의 전환을 촉진시키기 위해 비입체선택성 알돌라제가 사용되면, 이때는 MP를 R,R 모나틴이나 S,R 모나틴으로 전환시키기 위해서는 입체선택성 트랜스아미나제가 요구된다. 도 2에 나타낸 바와 같이, R-MP에 대하여 입체특이성인 D-아미노트랜스퍼라제 또는 D-아미노산 데하이드로게나제를 사용하면 R,R 모나틴이 생산된다.

도 3은 R,R 모나틴을 생산을 표적화하는 또다른 대체 경로를 도시한다. 도 3의 경로는 인돌-3-피루베이트가 L-트립토판으로부터 직접적이기 보다는 간접적으로 생산되는, 도 1의 변형이다. 더욱 특히, L-트립토판은 D-트립토판으로 전환되고, D-트립토판은 이어서 인돌-3-피루베이트로 전환된다.

L-트립토판에서 D-트립토판으로의 전환은 트립토판 라세마제 또는 그의 기능적 등가물에 의해 촉진될 수 있다. 실시예 15는 트립토판 라세마제의 유력한 공급원과, 상기 효소를 동정하는 스크리닝 방법을 제공한다. 트립토판 라세마제는 성능 향상을 위해 현 아미노산 라제마제로부터(예로서, 돌연변이 유발법 또는 재조합 조작법을 통해) 진화될 수 있다는 것 또한 주시된다.

트립토판 라세마제의 비제한적인 일례로는 아미노산 라세마제(EC 5.1.1.-)의 상동체 또는 돌연변이체, 예를 들면, 세린 라세마제를 포함하는데, 여기서, 상동체 또는 돌연변이체는 L-트립토판을 D-트립토판으로 전환시킬 수 있는 것이다. 아미노산 라세마제가 유래될 수 있는 공급원에 관한 비제한적인 일례로는 미생물, 예로서, 살모넬라 타이피뮤리움, 에스케리키아 콜라이, 바실러스 섭틸리스, 슈도모나스 애루지노사(Pseudomonas aeruginosa), 비브리오 콜레라에(Vibrio cholerae), 시조사카로미세스 폼베, 바실러스 세레우스, 엔테로코쿠스 갈리나룸, 페디오코커스 펜토사세우(Pediococcus pentosaceus)스, 바실러스 푸밀루스(Bacillus pumilus), 락토바실러스 퍼멘티(Lactobacillus fermenti), 락토바실러스 브레비스(Lactobacillus brevis), 아퀴펙스 파이로필러스(Aquifex pyrophilus), 락토바실리 스트렙토코쿠스, 아나베나 종(Anabaena sp .), 슈도모나스 스트리아타(Pseudomonas striata), 렌티누스 에도데스(Lentinus edodes), 스카파르카 브로우토니이 디설프로코쿠스 종, 써모코쿠스 종, 및 슈도모나스 스트리아타를 포함한다. 아미노산 라세마제가 유래될 수 있는 공급원에 관한 추가의 비제한적인 일례로는 누에, 래트 뇌, 또는 마우스 뇌를 포함한다.

적합한 트립토판 라세마제가 유래될 수 있는 유력한 공급원에 관한 비제한적인 일례로는 미생물, 예로서, 슈도모나스, 예를 들면 슈도모나스 클로로라피스(Pseudomonas chlororaphis)(슈도모나스 아우레레오파시엔스(Pseudomonas aurereofaciens))(ATCC 15926), 및 버홀더리아 피롤시나(ATCC15958)를 포함한다. 적합한 트립토판 라세마제가 유래될 수 있는 유력한 공급원에 관한 추가의 비제한적인 일례로는 식물, 예를 들면 담배 식물, 예로서, 니코티아 나타바쿰(Nicotiana tabacum), 소맥 식물, 예로서, 트리티쿰 아에스티붐(Triticum aestivum), 비트, 토마토, 및 스클레로치톤 일리시폴리우스(Sclerochiton ilicifolius)를 포함한다.

도 3에 나타낸 경로는 R,R 모나틴이 바람직한 산물인 경우에도, 모나틴을 생산하는 반응을 위한 것과 동일한 효소를 인돌-3-피루베이트를 생산하는 반응을 위해 사용할 수 있다는 것을 비롯한, 특정 잇점을 갖는다. 즉, 도 1에 도시한 경로에서, L-아미노트랜스퍼라제(또는 적합한 L-효소)는 인돌-3-피루베이트를 생산하는 반응을 촉진시키지만, D-아미노트랜스퍼라제는 모나틴을 생산하는 반응을 촉진시킨다. 대조적으로 도 3의 경로에서는, 인돌-3-피루베이트를 생산하는 반응을 촉진시키는 특정 D-아미노트랜스퍼라제가 또한 모나틴을 생산하는 반응도 촉진시킬 수 있다. 결과적으로 도 3에 따른 경로에서, 광범위한 특이성을 갖는 D-아미노트랜스퍼라제는, 모나틴을 형성하는 반응을 위한 것과 동일한 효소를 인돌-3-피루베이트를 형성하는 반응을 위해 사용하고자 할 경우에 바람직할 수 있다. 대조적으로, 도 1, 2, 4, 6, 7, 및 8에 따른 경로에서, R-MP와 비교하여 인돌-3-피루베이트에 대하여 제한된 활성 및/또는 특이성을 갖는 D-아미노트랜스퍼라제를 선택하였을 때 모나틴 생산은 더욱 효율적이게 앞으로 진행될 수 있다.

도 3에 개략적으로 나타낸 경로의 또다른 잇점은, 인돌-3-피루베이트를 생산하는 반응과 커플링된 반응의 아미노산 산물은 이제 모나틴을 생산하는 반응과 커플링된 반응에서 출발 물질로서 사용될 수 있다는 점이다. 즉, 도 1에 도시한 경로에서, L-트립토판은 반응하여 인돌-3-피루베이트를 생산하고, 동시에, 옥살로아세테이트, 알파-케토글루타레이트 및/또는 피루베이트는 반응하여 L-아미노산을 생산한다. 모나틴을 형성하는 R-MP 반응은 기질로서 D-아미노산을 사용하는 반응과 커플을 이루기 때문에 제시한 조건하에서 인돌-3-피루베이트를 형성하는 반응의 L-아미노산은 R-MP 반응과 커플링된 반응에서 사용될 수 있도록 재순환하지 못한다. 대조적으로, 도 3에 도시한 경로에서, 인돌-3-피루베이트를 형성하는 D-트립토판의 반응은 D-아미노산 산물을 형성하는 반응과 커플을 이루는데, D-아미노산은 R-MP 반응과 커플링된 반응에서 사용될 수 있도록 재순환될 수 있다. 이를 통해 1 단계에서 비화학량론적인 양으로 아미노 수용체를 사용할 수 있다. 본 발명의 일부 실시태양에서, D-아미노산은 D-알라닌이다.

도 4 및 5는 도 1에 나타낸 경로에 대한 추가 변형을 도시하는데, 상기 변형은 L-트립토판 반응과 커플링된 반응에 의해 형성된 아미노산 산물을 MP에서 모나틴으로의 반응과 커플링된 반응의 아미노산 반응로 재순환시키는 것에 관한 것이다.

도 4로 돌아가서, 재순환은, L-아미노산에서 D-아미노산으로의 전환 및 그 반대의 것을 촉진시킬 수 있는 효소를 제공함으로서 달성된다. 더욱 특히, 도 4에 나타낸 바와 같이, L-트립토판이 반응하여 인돌-3-피루베이트를 형성할 때, α-KG가 L-글루타메이트를 형성하는 경우, L-글루타메이트에서 D-글루타메이트로의 전환 및 그 반대의 것을 촉진시킬 수 있는 글루타메이트 라세마제(EC 5.1.1.3) 또는 기능적 등가물이 제공될 수 있다. 이러한 경우, 인돌-3-피루베이트 생산과 함께 형성된 L-글루타메이트는 그의 D-글루타메이트로의 전환에 의해 제거되고, 이어서, L-글루타메이트의 전환으로부터 형성된 D-글루타메이트는 MP에서 모나틴으로의 반응과 커플링된 반응에 대한 기질로서 사용가능하다. 유사하게, D-글루타메이트의 반응에서 형성된 α-KG는 L-트립토판에서 인돌-3-피루베이트로의 반응과 커플링된 반응에 대한 기질로서 사용가능하다.

글루타메이트 라세마제가 유래될 수 있는 유력한 공급원의 비제한적인 일례로는 페디오코커스 펜토사세우스, 바실러스 푸밀루스, 락토바실러스 퍼멘티, 락토바실러스 브레비스, E. 콜라이, 아퀴펙스 파이로필러스, 및 바실러스 섭틸리스를 포함한다. 더욱 특히(또는 비제한적으로), 글루타메이트 라세마제는 핵산, 예로서, 페디오코쿠스 펜토사세우스 murI 유전자(진뱅크 수탁 번호 L22789), 또는 락토바실러스 브레비스 글루타메이트 라세마제로부터 발현될 수 있다.

L-트립토판이 반응하여 인돌-3-피루베이트를 형성할 때, 옥살로아세테이트가 반응하여 L-아스파테이트를 형성하는 경우, L-아스파테이트를 D-아스파테이트로 전환시키기 위하여 아스파테이트 라세마제(EC 5.1.1.13) 또는 기능적 등가물이 제공될 수 있다. 이러한 경우, 인돌-3-피루베이트의 생산과 함께 L-아스파테이트는 그의 D-아스파테이트로의 전환에 의해 제거되고, 이어서, L-아스파테이트의 전환으로부터 형성된 D-아스파테이트는 MP에서 모나틴으로의 반응과 커플링된 반응에 대한 기질로서 사용가능하다. 유사하게, D-아스파테이트의 반응에서 형성된 옥살로아세테이트는 L-트립토판에서 인돌-3-피루베이트로의 반응과 커플링된 반응에 대한 기질로서 작용하는데 사용가능하다.

아스파테이트 라세마제 활성을 갖는 적합한 효소의 비제한적인 일례로는 ASPR-101(캘리포니아주 패서디나에 소재하는 BioCatalytics) 및 L-아스파테이트에서 D-아스파테이트로의 전환을 촉진시킬 수 있는 아미노산 라세마제(EC 5.1.1.-)의 상동체 또는 돌연변이체를 포함한다.

아스파테이트 라세마제가 유래될 수 있는 유력한 공급원에 관한 비제한적인 일례로는 디설프로코쿠스, 써모코쿠스, 쌍각류 연체동물인 스카파르카 브로우토니이(Scapharca brouhtonii), 아시네토박터(Acinetobacter), 아그로박테리움(Agrobacterium), 아키오글루부스(Archaeoglobus), 바실러스, 보르데텔라(Bordetella), 브래디리조비움(Bradyrhizobium), 브레비박테리움(Brevibacterium), 버홀더리아( Burkholderia ), 캠필로박터( Campylobacter ), 칸디다(Candida), 카울로박터(Caulobacter), 클로스트리디움(Clostridium), 디술피토박테리움(Desulfitobacterium), 디술포탈레아(Desulfotalea), 엔테로코쿠스룸(Enterococcus), 에르위니아(Erwinia), 에스케리키아(Escherichia), 페로플라즈마(Ferroplasma), 헬리코박터(Helicobacter), 클레브시엘라(Klebsiella), 락토바실러스, 만헤이미아(Mannheimia), 메디카고(Medicago), 메조리조비움(Mesorhizobium), 메타노코쿠스(Methanococcus), 메타노사르시나(Methanosarcina), 오션바실루스(Oceanobacillus), 오에노코쿠스(Oenococcus), 페디오코쿠스(Pediococcus), 폴라리박터(Polaribacter), 슈도모나스, 피로코쿠스(Pyrococcus), 랄소니아(Ralsonia), 시겔라(Shigella), 시노리조비움(Sinorhizobium), 살모넬라, 스핑고모나스(Sphingomonas), 스트렙토코쿠스, 써모언에어로박터(Thermoanaerobacter), 비브리오(Vibrio), 울리넬라(Wolinella), 크산토모나스(Xanthomonas), 크산토박터(Xanthobacter), 예르시니아(Yersinia) 및 자이모모나스(Zymomonas)를 포함한다.

L-트립토판이 반응하여 인돌-3-피루베이트가 형성될 때 피루베이트가 반응하여 L-알라닌을 형성하는 경우, L-알라닌을 D-알라닌으로 전환시키기 위하여 알라닌 라세마제 또는 기능적 등가물이 제공될 수 있다. 이러한 경우, 인돌-3-피루베이트 생산과 함께 형성되는 L-알라닌은 그의 D-알라닌으로의 전환에 의해 제거되고, 이어서, L-알라닌의 전환에 의해 형성된 D-알라닌은 MP에서 모나틴으로의 반응과 커플링된 반응에 대한 기질로서 사용가능하다. 유사하게, D-알라닌의 반응에서 형성된 피루베이트는 L-트립토판에서 인돌-3-피루베이트로의 반응과 커플링된 반응에 대한 기질로서 작용하는데 사용가능하다.

적합한 알라닌 라세마제의 비제한적인 일례로는 A8936(미주리주 세인트루이스에 소재하는 Sigma-Aldrich)을 포함한다.

알라닌 라세마제가 유래될 수 있는 유력한 공급원에 관한 비제한적인 일례로는 브루셀라 어보투스(Brucella abortus), 스트렙토코쿠스 패칼리스, 살모넬라 티피뮤리움(Salmonella typhimurium), 에스케리키아 콜라이, 바실러스 섭틸리스, 바실러스 스테아로서모필러스(Bacillus stearothermophilus), 슈도모나스 애루지노사, 비브리오 콜레라에, 시조사카로미세스 폼베, 바실러스 세레우스 및 렌티누스 에도데스를 포함한다.

실시예 18 및 21은 상기 라세마제의 용도, 원하는 모나틴 산물의 비율을 증가시키는데 미치는 그의 영향, 및 라세마제 효소를 위해 제공된 유력한 공급원을 예시한다.

도 5로 돌아가서, 입체적 역전 아미노트랜스퍼라제를 사용하여 R-MP에서 모나틴으로의 반응을 촉진시킨다. 전형적으로 R,R 모나틴(또는 S,R 모나틴)을 형성하는 R-MP(또는 S-MP) 반응이 D-아미노산의 반응과 커플을 이루지만, 입체적 역전 아미노트랜스퍼라제는 L-아미노산을 사용하여 R,R 모나틴(또는 S,R 모나틴)을 형성하는 커플링된 R-MP(또는 S-MP) 반응을 촉진시킬 수 있다. 이 경우, L-트립토판 아미노트랜스퍼라제 반응의 L-아미노산 산물은 MP에서 모나틴으로의 아미노전이에 대한 기질로서 사용될 수 있고, MP에서 모나틴으로의 반응와 커플링된 반응의 산물(즉, 옥살로아세테이트, 피루베이트, 및/또는 α-KG)은 L-트립토판에서 인돌-3-피루베이트로의 반응과 커플링된 반응에 대한 출발 물질로서 사용될 수 있다. 사용될 수 있는 입체적 역전 아미노트랜스퍼라제의 비제한적인 일례로는 D-페닐글리신 아미노트랜스퍼라제(EC 2.6.1.72, D-4-하이드록시페닐글리신 아미노트랜스퍼라제로도 공지됨) 및 D-메티오닌 아미노트랜스퍼라제(EC 2.6.1.41, D-met-아미노트랜스퍼라제 및 D-메티오닌-피루베이트 아미노트랜스퍼라제로도 공지됨)를 포함한다. D-페닐글리신 아미노트랜스퍼라제가 유래될 수 있는 유력한 공급원에 관한 비제한적인 일례로는 슈도모나스, 예로서, 슈도모나스 퓨티다(Pseudomonas putida) LW-4 및 슈도모나스 스투제리 ST-201을 포함한다. D-메티오닌 아미노트랜스퍼라제가 유래될 수 있는 유력한 공급원에 관한 비제한적인 일례로는 꽃양배추 및 땅콩을 포함한다.

실시예 19와 20은 함께 입체적 역전 효소의 유력한 공급원, 및 상기 효소를 제조하는 방법을 제공한다. 상기 실시예는 또한 상기 효소를 동정하는 스크리닝 방법을 제공한다. 이는 또한 상기 효소가 천연 상태에서 공지되어 있거나 발견되는 입체적 역전 효소로부터 진화될 수 있다는 것도 주시된다. 비제한적인 일례로서, 입체적 역전 아미노트랜스퍼라제는 D-아미노산 아미노트랜스퍼라제의 상동체 또는 돌연변이체, 또는 아미노산 라세마제(EC 5.1.1.-)의 상동체 또는 돌연변이체일 수 있다.

도 6-8은 또한 도 1의 경로의 변형을 도시한다. 도 6-8에 도시한 경로는 트립토판 반응의 부산물을 제거하고, 일부 경우에는 MP에 대한 기질을 제공함으로써 평형 반응을 촉진시키는 방법을 제공한다.

도 6으로 돌아가서, 제시한 경로는 L-아미노산 산물을 상이한 L-아미노산으로 전환시키고, 새롭게 형성된 L-아미노산을 D-아미노산으로 전환시켜 MP 반응과 커플링된 반응에 대한 기질을 제공함으로써 L-아미노산 산물과 커플링된 반응의 L-아미노산 산물을 제거한다. 특히, L-트립토판은 옥살로아세테이트와 함께 반응하여 인돌-3-피루베이트 및 L-아스파테이트를 형성하는 것으로 보인다. L-아스파테이트를 L-알라닌과 이산화탄소로 전환시키는 것을 촉진시키기 위하여 아스파테이트 4-데카르복실라제(EC 4.1.1.12) 또는 기능적 등가물이 사용되고, 알라닌 라세마제 활성을 갖는 효소는 L-알라닌을 D-알라닌으로 전환시키는 것을 촉진시키기 위하여 사용되며, D-알라닌은 R-MP에서 모나틴으로의 전환에 대한 아미노 공여체로서 작용할 수 있다.

도 7로 돌아가서, 제시한 경로는 트립토판 반응과 커플링된 반응의 L-아미노산 산물을 제거하는 추가의 방법을 도시한다. 도에 제시한 실시태양은 예를 들면, 휘발성(예로서, 이산화탄소)으로 인하여, 또는 비반응성 최종 산물로의 자발적인 전환에 의해 가역 방향의 반응에 사용될 수 없는 부산물(들)을 생산한다. 그러한 접근법의 일례로는 α-KG가 L-트립토판과 함께 반응하여 L-글루타메이트를 생산하는 경우, L-글루타메이트를 4-아미노부타노에이트(부산물로서 이산화탄소와 함께)로 전환시키는 것을 촉진시키기 위하여 글루타메이트 데카르복실라제(EC 4.1.1.15) 또는 기능적 등가물이 제공될 수 있는 것을 포함한다. L-글루타메이트 데카르복실라제가 유래될 수 있는 유력한 공급원의 비제한적인 일례로는 클로스트리디움 퍼프린겐스(Clostridium perfringens), C. 웰치(C. welchii), 또는 E. 콜라이를 포함한다.

트립토판 반응을 앞으로 진행시키는 상기 접근법의 또다른 일례로는 옥살로아세테이트가 L-트립토판과 함께 반응하는 경우, L-아스파테이트를 β-알라닌(부산물로서 이산화탄소와 함께)로 전환시키는 것을 촉진시키기 위하여 아스파테이트 데카르복실라제(EC 4.1.1.11) 또는 기능적 등가물이 제공될 수 있는 것을 포함한다.

도 8로 돌아가서, 제시한 경로는 트립토판 반응과 커플링된 반응의 L-아미노산 산물을 제거하는 다른 추가의 방법을 도시한다. 특히, α-KG가 L-트립토판과 함께 반응하여 L-글루타메이트를 생산하는 경우, L-알라닌 아미노트랜스퍼라제 활성을 갖는 효소와 피루베이트가 제공될 수 있는데, 여기서, L-알라닌 아미노트랜스퍼라제 효소는 L-알라닌을 형성하는 피루베이트 및 L-글루타메이트의 반응을 촉진시킨다. 알라닌 라세마제 또는 기능적 등가물은 또한 L-알라닌을 D-알라닌으로 전환시키는 것을 촉진시키기 위하여 제공될 수 있는데, 여기서, D-알라닌은 모나틴 및 피루베이트를 형성하는 기질로서 MP와 함께 사용될 수 있다.

모나틴 유도체의 R,R 및 다른 입체이성체를 생산하는 생화학적 경로

기술된 본 발명의 방법은 치환된 인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응을 촉진시키기 위하여 사용될 수 있는, 본원에 기술된 알돌라제 활성을 갖는 폴리펩티드를 사용하는 것을 포함한다.

치환된 인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응을 촉진시키는데 유용한 효소로는 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 66, 서열 번호: 68, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162, 서열 번호: 164, 서열 번호: 166, 서열 번호: 168, 서열 번호: 170, 서열 번호: 172, 서열 번호: 174, 서열 번호: 176, 서열 번호: 178, 서열 번호: 180, 서열 번호: 182, 서열 번호: 184, 서열 번호: 186, 서열 번호: 188, 서열 번호: 190, 서열 번호: 192, 서열 번호: 194, 서열 번호: 196, 서열 번호: 198, 서열 번호: 200, 서열 번호: 202, 서열 번호: 204, 서열 번호: 206, 서열 번호: 208, 서열 번호: 210, 서열 번호: 212, 서열 번호: 214, 서열 번호: 216, 서열 번호: 218, 서열 번호: 220, 서열 번호: 222, 서열 번호: 224, 서열 번호: 226, 서열 번호: 228, 서열 번호: 230, 서열 번호: 232, 서열 번호: 234, 서열 번호: 236, 서열 번호: 238, 서열 번호: 240, 서열 번호: 242, 서열 번호: 244, 서열 번호: 246, 서열 번호: 248, 서열 번호: 250, 서열 번호: 252, 서열 번호: 254, 서열 번호: 256, 서열 번호: 258, 서열 번호: 260, 서열 번호: 262, 서열 번호: 264, 서열 번호: 266, 서열 번호: 268, 서열 번호: 270, 서열 번호: 272, 서열 번호: 274, 서열 번호: 276, 서열 번호: 278, 서열 번호: 280, 서열 번호: 282, 서열 번호: 284, 서열 번호: 286, 서열 번호: 288, 서열 번호: 290, 서열 번호: 292, 서열 번호: 294, 서열 번호: 296, 서열 번호: 298, 서열 번호: 300, 서열 번호: 302, 서열 번호: 304, 서열 번호: 306, 서열 번호: 308, 서열 번호: 310, 서열 번호: 312, 서열 번호: 314, 서열 번호: 316, 서열 번호: 318, 서열 번호: 320, 서열 번호: 322, 서열 번호: 324, 서열 번호: 326, 서열 번호: 328, 서열 번호: 330, 서열 번호: 332, 또는 서열 번호: 334 중 임의의 것의, 알돌라제 활성을 갖는 하나 이상의 폴리펩티드, 또는 알돌라제 활성을 갖는 그의 단편 또는 부분서열을 포함한다.

하나의 실시태양에서, 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 66, 서열 번호: 68, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162, 서열 번호: 164, 서열 번호: 166, 서열 번호: 168, 서열 번호: 170, 서열 번호: 172, 서열 번호: 174, 서열 번호: 176, 서열 번호: 178, 서열 번호: 180, 서열 번호: 182, 서열 번호: 184, 서열 번호: 186, 서열 번호: 188, 서열 번호: 190, 서열 번호: 192, 서열 번호: 194, 서열 번호: 196, 서열 번호: 198, 서열 번호: 200, 서열 번호: 202, 서열 번호: 204, 서열 번호: 206, 서열 번호: 208, 서열 번호: 210, 서열 번호: 212, 서열 번호: 214, 서열 번호: 216, 서열 번호: 218, 서열 번호: 220, 서열 번호: 222, 서열 번호: 224, 서열 번호: 226, 서열 번호: 228, 서열 번호: 230, 서열 번호: 232, 서열 번호: 234, 서열 번호: 236, 서열 번호: 238, 서열 번호: 240, 서열 번호: 242, 서열 번호: 244, 서열 번호: 246, 서열 번호: 248, 서열 번호: 250, 서열 번호: 252, 서열 번호: 254, 서열 번호: 256, 서열 번호: 258, 서열 번호: 260, 서열 번호: 262, 서열 번호: 264, 서열 번호: 266, 서열 번호: 268, 서열 번호: 270, 서열 번호: 272, 서열 번호: 274, 서열 번호: 276, 서열 번호: 278, 서열 번호: 280, 서열 번호: 282, 서열 번호: 284, 서열 번호: 286, 서열 번호: 288, 서열 번호: 290, 서열 번호: 292, 서열 번호: 294, 서열 번호: 296, 서열 번호: 298, 서열 번호: 300, 서열 번호: 302, 서열 번호: 304 중 임의의 것의, HMG 알돌라제 활성을 갖는 하나 이상의 폴리펩티드, 또는 알돌라제 활성을 갖는 그의 단편 또는 부분서열은 치환된 인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응을 촉진시키는 데 유용할 수 있다.

또다른 실시태양에서, 서열 번호: 306, 서열 번호: 308, 서열 번호: 310, 서열 번호: 312, 서열 번호: 314, 서열 번호: 316, 서열 번호: 318, 서열 번호: 320, 서열 번호: 322, 서열 번호: 324, 서열 번호: 326, 서열 번호: 328, 서열 번호: 330, 서열 번호: 332, 또는 서열 번호: 334 중 임의의 것의, KHG 알돌라제 활성을 갖는 하나 이상의 폴리펩티드, 또는 알돌라제 활성을 갖는 그의 단편 또는 부분서열은 치환된 인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응을 촉진시키는 데 유용할 수 있다.

별법으로, 적어도 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 75개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개, 650개, 700개, 750개, 800개, 850개, 900개, 950개, 1000개, 1050개, 1100개, 1150개, 1200개, 1250개, 1300개, 1350개, 1400개, 1450개, 1500개, 1550개, 1600개, 1650개, 1700개, 1750개, 1800개, 1850개, 1900개, 1950개, 2000개, 2050개, 2100개, 2200개, 2250개, 2300개, 2350개, 2400개, 2450개, 2500개 또는 그 이상의 잔기로 이루어진 영역에 걸쳐서 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 67, 서열 번호: 69, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161, 서열 번호: 163, 서열 번호: 165, 서열 번호: 167, 서열 번호: 169, 서열 번호: 171, 서열 번호: 173, 서열 번호: 175, 서열 번호: 177, 서열 번호: 179, 서열 번호: 181, 서열 번호: 183, 서열 번호: 185, 서열 번호: 187, 서열 번호: 189, 서열 번호: 191, 서열 번호: 193, 서열 번호: 195, 서열 번호: 197, 서열 번호: 199, 서열 번호: 201, 서열 번호: 203, 서열 번호: 205, 서열 번호: 207, 서열 번호: 209, 서열 번호: 211, 서열 번호: 213, 서열 번호: 215, 서열 번호: 217, 서열 번호: 219, 서열 번호: 221, 서열 번호: 223, 서열 번호: 225, 서열 번호: 227, 서열 번호: 229, 서열 번호: 231, 서열 번호: 233, 서열 번호: 235, 서열 번호: 237, 서열 번호: 239, 서열 번호: 241, 서열 번호: 243, 서열 번호: 245, 서열 번호: 247, 서열 번호: 249, 서열 번호: 251, 서열 번호: 253, 서열 번호: 255, 서열 번호: 257, 서열 번호: 259, 서열 번호: 261, 서열 번호: 263, 서열 번호: 265, 서열 번호: 267, 서열 번호: 269, 서열 번호: 271, 서열 번호: 273, 서열 번호: 275, 서열 번호: 277, 서열 번호: 279, 서열 번호: 281, 서열 번호: 283, 서열 번호: 285, 서열 번호: 287, 서열 번호: 289, 서열 번호: 291, 서열 번호: 293, 서열 번호: 295, 서열 번호: 297, 서열 번호: 299, 서열 번호: 301, 서열 번호: 303, 서열 번호: 305, 서열 번호: 307, 서열 번호: 309, 서열 번호: 311, 서열 번호: 313, 서열 번호: 315, 서열 번호: 317, 서열 번호: 319, 서열 번호: 321, 서열 번호: 323, 서열 번호: 325, 서열 번호: 327, 서열 번호: 329, 서열 번호: 331, 서열 번호: 333, 서열 번호: 335, 서열 번호: 336, 서열 번호: 337, 및 서열 번호: 338을 비롯한, 본 발명에 따른 핵산과 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의, 또는 완벽한(100%) 서열 동일성을 갖는 핵산에 의해 코딩된, 알돌라제 활성을 갖는 하나 이상의 폴리펩티드는 치환된 인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응을 촉진시키는 데 유용할 수 있다.

본 발명의 하나의 실시태양에서, 적어도 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 75개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개, 650개, 700개, 750개, 800개, 850개, 900개, 950개, 1000개, 1050개, 1100개, 1150개, 1200개, 1250개, 1300개, 1350개, 1400개, 1450개, 1500개, 1550개, 1600개, 1650개, 1700개, 1750개, 1800개, 1850개, 1900개, 1950개, 2000개, 2050개, 2100개, 2200개, 2250개, 2300개, 2350개, 2400개, 2450개, 2500개 또는 그 이상의 잔기로 이루어진 영역에 걸쳐서 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 67, 서열 번호: 69, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161, 서열 번호: 163, 서열 번호: 165, 서열 번호: 167, 서열 번호: 169, 서열 번호: 171, 서열 번호: 173, 서열 번호: 175, 서열 번호: 177, 서열 번호: 179, 서열 번호: 181, 서열 번호: 183, 서열 번호: 185, 서열 번호: 187, 서열 번호: 189, 서열 번호: 191, 서열 번호: 193, 서열 번호: 195, 서열 번호: 197, 서열 번호: 199, 서열 번호: 201, 서열 번호: 203, 서열 번호: 205, 서열 번호: 207, 서열 번호: 209, 서열 번호: 211, 서열 번호: 213, 서열 번호: 215, 서열 번호: 217, 서열 번호: 219, 서열 번호: 221, 서열 번호: 223, 서열 번호: 225, 서열 번호: 227, 서열 번호: 229, 서열 번호: 231, 서열 번호: 233, 서열 번호: 235, 서열 번호: 237, 서열 번호: 239, 서열 번호: 241, 서열 번호: 243, 서열 번호: 245, 서열 번호: 247, 서열 번호: 249, 서열 번호: 251, 서열 번호: 253, 서열 번호: 255, 서열 번호: 257, 서열 번호: 259, 서열 번호: 261, 서열 번호: 263, 서열 번호: 265, 서열 번호: 267, 서열 번호: 269, 서열 번호: 271, 서열 번호: 273, 서열 번호: 275, 서열 번호: 277, 서열 번호: 279, 서열 번호: 281, 서열 번호: 283, 서열 번호: 285, 서열 번호: 287, 서열 번호: 289, 서열 번호: 291, 서열 번호: 293, 서열 번호: 295, 서열 번호: 297, 서열 번호: 299, 서열 번호: 301, 서열 번호: 303, 서열 번호: 305를 비롯한, 본 발명에 따른 핵산과 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의, 또는 완벽한(100%) 서열 동일성을 갖는 핵산에 의해 코딩된, HMG 알돌라제 활성을 갖는 하나 이상의 폴리펩티드는 치환된 인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응을 촉진시키는 데 유용할 수 있다.

본 발명의 또다른 실시태양에서, 적어도 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 75개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개, 650개, 700개, 750개, 800개, 850개, 900개, 950개, 1000개, 1050개, 1100개, 1150개, 1200개, 1250개, 1300개, 1350개, 1400개, 1450개, 1500개, 1550개, 1600개, 1650개, 1700개, 1750개, 1800개, 1850개, 1900개, 1950개, 2000개, 2050개, 2100개, 2200개, 2250개, 2300개, 2350개, 2400개, 2450개, 2500개 또는 그 이상의 잔기로 이루어진 영역에 걸쳐서 서열 번호: 307, 서열 번호: 309, 서열 번호: 311, 서열 번호: 313, 서열 번호: 315, 서열 번호: 317, 서열 번호: 319, 서열 번호: 321, 서열 번호: 323, 서열 번호: 325, 서열 번호: 327, 서열 번호: 329, 서열 번호: 331, 서열 번호: 333, 서열 번호: 335, 서열 번호: 336, 서열 번호: 337, 및 서열 번호: 338을 비롯한, 본 발명에 따른 핵산과 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의, 또는 완벽한(100%) 서열 동일성을 갖는 핵산에 의해 코딩된, KHG 알돌라제 활성을 갖는 하나 이상의 폴리펩티드는 치환된 인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응을 촉진시키는 데 유용할 수 있다.

엄격한 조건하에서 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 67, 서열 번호: 69, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161, 서열 번호: 163, 서열 번호: 165, 서열 번호: 167, 서열 번호: 169, 서열 번호: 171, 서열 번호: 173, 서열 번호: 175, 서열 번호: 177, 서열 번호: 179, 서열 번호: 181, 서열 번호: 183, 서열 번호: 185, 서열 번호: 187, 서열 번호: 189, 서열 번호: 191, 서열 번호: 193, 서열 번호: 195, 서열 번호: 197, 서열 번호: 199, 서열 번호: 201, 서열 번호: 203, 서열 번호: 205, 서열 번호: 207, 서열 번호: 209, 서열 번호: 211, 서열 번호: 213, 서열 번호: 215, 서열 번호: 217, 서열 번호: 219, 서열 번호: 221, 서열 번호: 223, 서열 번호: 225, 서열 번호: 227, 서열 번호: 229, 서열 번호: 231, 서열 번호: 233, 서열 번호: 235, 서열 번호: 237, 서열 번호: 239, 서열 번호: 241, 서열 번호: 243, 서열 번호: 245, 서열 번호: 247, 서열 번호: 249, 서열 번호: 251, 서열 번호: 253, 서열 번호: 255, 서열 번호: 257, 서열 번호: 259, 서열 번호: 261, 서열 번호: 263, 서열 번호: 265, 서열 번호: 267, 서열 번호: 269, 서열 번호: 271, 서열 번호: 273, 서열 번호: 275, 서열 번호: 277, 서열 번호: 279, 서열 번호: 281, 서열 번호: 283, 서열 번호: 285, 서열 번호: 287, 서열 번호: 289, 서열 번호: 291, 서열 번호: 293, 서열 번호: 295, 서열 번호: 297, 서열 번호: 299, 서열 번호: 301, 서열 번호: 303, 서열 번호: 305, 서열 번호: 307, 서열 번호: 309, 서열 번호: 311, 서열 번호: 313, 서열 번호: 315, 서열 번호: 317, 서열 번호: 319, 서열 번호: 321, 서열 번호: 323, 서열 번호: 325, 서열 번호: 327, 서열 번호: 329, 서열 번호: 331, 서열 번호: 333, 서열 번호: 335, 서열 번호: 336, 서열 번호: 337, 및 서열 번호: 338의 핵산에 혼성화하는 핵산 서열에 의해 코딩되는, 알돌라제 활성을 갖는 하나 이상의 폴리펩티드는 치환된 인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응을 촉진시키는 데 유용할 수 있다.

본 발명의 하나의 실시태양에서, 엄격한 조건하에서 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 67, 서열 번호: 69, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161, 서열 번호: 163, 서열 번호: 165, 서열 번호: 167, 서열 번호: 169, 서열 번호: 171, 서열 번호: 173, 서열 번호: 175, 서열 번호: 177, 서열 번호: 179, 서열 번호: 181, 서열 번호: 183, 서열 번호: 185, 서열 번호: 187, 서열 번호: 189, 서열 번호: 191, 서열 번호: 193, 서열 번호: 195, 서열 번호: 197, 서열 번호: 199, 서열 번호: 201, 서열 번호: 203, 서열 번호: 205, 서열 번호: 207, 서열 번호: 209, 서열 번호: 211, 서열 번호: 213, 서열 번호: 215, 서열 번호: 217, 서열 번호: 219, 서열 번호: 221, 서열 번호: 223, 서열 번호: 225, 서열 번호: 227, 서열 번호: 229, 서열 번호: 231, 서열 번호: 233, 서열 번호: 235, 서열 번호: 237, 서열 번호: 239, 서열 번호: 241, 서열 번호: 243, 서열 번호: 245, 서열 번호: 247, 서열 번호: 249, 서열 번호: 251, 서열 번호: 253, 서열 번호: 255, 서열 번호: 257, 서열 번호: 259, 서열 번호: 261, 서열 번호: 263, 서열 번호: 265, 서열 번호: 267, 서열 번호: 269, 서열 번호: 271, 서열 번호: 273, 서열 번호: 275, 서열 번호: 277, 서열 번호: 279, 서열 번호: 281, 서열 번호: 283, 서열 번호: 285, 서열 번호: 287, 서열 번호: 289, 서열 번호: 291, 서열 번호: 293, 서열 번호: 295, 서열 번호: 297, 서열 번호: 299, 서열 번호: 301, 서열 번호: 303, 서열 번호: 305의 핵산에 혼성화하는 핵산 서열에 의해 코딩되는, HMG 알돌라제 활성을 갖는 하나 이상의 폴리펩티드는 치환된 인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응을 촉진시키는 데 유용할 수 있다.

본 발명의 또다른 실시태양에서, 서열 번호: 307, 서열 번호: 309, 서열 번호: 311, 서열 번호: 313, 서열 번호: 315, 서열 번호: 317, 서열 번호: 319, 서열 번호: 321, 서열 번호: 323, 서열 번호: 325, 서열 번호: 327, 서열 번호: 329, 서열 번호: 331, 서열 번호: 333, 서열 번호: 335, 서열 번호: 336, 서열 번호: 337, 및 서열 번호: 338의 핵산에 혼성화하는 핵산 서열에 의해 코딩되는, KHG 알돌라제 활성을 갖는 하나 이상의 폴리펩티드는 치환된 인돌-3-피루베이트와 C3 탄소 공급원 사이의 반응을 촉진시키는 데 유용할 수 있다.

하나의 실시태양에서, 치환된 인돌-3-피루베이트의 치환기는 인돌 환의 임의의 탄소 원자에 부착된 할로겐 원자이다. 또다른 실시태양에서, 상기 치환기는 인돌 환의 임의의 탄소 원자에 부착된 염소 원자이다. 추가의 또다른 실시태양에서, 모나틴 유도체는 4-하이드록시-4-(6-메틸인돌-3-일메틸)글루탐산이다.

알돌라제 활성을 갖는 것으로서, 본 발명의 일부 실시태양에 따른 폴리펩티드는 하나 이상의 단계가 화학적 합성 반응인 다단계 경로로 사용될 수 있다. 예를 들면, 일부 실시태양에서, 알돌라제 활성을 갖는 하나 이상의 폴리펩티드는 피루베이트와 인돌-3-피루베이트 사이의 반응을 촉진시켜 모나틴 전구체를 생산한다. 이어서, 모나틴 전구체를 정제할 수 있다. 이어서, 모나틴 전구체의 환원적 아민화 반응을 사용하여 모나틴을 수득할 수 있다.

알돌라제 활성을 갖는 것으로서, 본 발명의 일부 실시태양에 따른 폴리펩티드 뿐만 아니라, 모나틴 및 모나틴 유도체를 생산하는 공정에 사용되는 따른 효소는 순수한 형태, 조 형태, 단리된 형태, 황산암모늄 현탁액 형태로 사용될 수 있다.

알돌라제 활성을 갖는 것으로서, 본 발명의 일부 실시태양에 따른 폴리펩티드는 디티오트레이톨("DTT") 및 β-머캅토에탄올을 비롯한 안정화제를 사용함으로써 최적화될 수 있다.

본원에 개시된 하나 이상의 폴리펩티드를 사용하여 생산된 모나틴 또는 모나틴 유도체는 일반적으로 생산된 총 모나틴 또는 모나틴 유도체에 의해 적어도 약 50중량% 내지 약 99중량% R,R-모나틴 또는 R,R-모나틴 유도체이다. 다른 실시태양에서, 본원에 개시된 하나 이상의 폴리펩티드를 사용하여 생산된 모나틴 또는 모나틴 유도체는 생산된 총 모나틴에 의해 60중량% 초과의 R,R-모나틴 또는 R,R-모나틴 유도체이다; 예를 들면, R,R-모나틴 또는 R,R-모나틴 유도체는 생산된 총 모나틴 또는 모나틴 유도체의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%이다. 별법으로, 다양한 양의, 2개 이상의 모나틴 또는 모나틴 유도체 제제를 조합하여 원하는 비율로 R,R-모나틴 또는 R,R-모나틴 유도체가 존재하는 제제를 수득할 수 있다. 예를 들면, 60% R,R-모나틴인 모나틴 제제를 90% R,R-모나틴인 모나틴 제제와 조합할 수 있으며, 동량의 60% 및 90% R,R-모나틴 제제를 조합할 경우, 생성되는 모나틴 제제는 5% R,R-모나틴일 것이다.

본원에 개시된 하나 이상의 폴리펩티드를 사용하여 생산된 모나틴 또는 모나틴 유도체, 또는 중간체(모나틴 전구체 포함)는 반응 성분으로부터 정제될 수 있다. 하나의 실시태양에서, 모나틴, 모나틴 유도체 또는 중간체, 예로서, 모나틴 전구체는 간단하게 이것이 합성된 효소 제제로부터 정제시키고자 하는 물질을 제거함으로써 정제될 수 있다.

다른 실시태양에서, 중간체, 모나틴 전구체, 모나틴 또는 모나틴 유도체는 생성된 "정제된" 조성물 또는 제제는 총 유기 화합물의 적어도 약 5중량%-60중량% 모나틴이 되도록 그가 합성된 제제로부터 정제된다. 또다른 실시태양에서, 모나틴, 모나틴 유도체 또는 중간체, 예로서, 모나틴 전구체는 총 유기 화합물의 적어도 약 70중량%, 80중량%, 90중량%, 95중량% 또는 99중량%의 순도로 정제될 수 있다. 본원에 개시된 하나 이상의 폴리펩티드를 사용하여 생산된 모나틴, 모나틴 유도체 또는 중간체(모나틴 전구체 포함)는 당업자에게 공지되어 있는 임의 방법에 의해 반응 성분으로부터 정제될 수 있다. 최적으로, 정제된 모나틴 또는 중간체는 원하는 순도를 달성할 때까지 반복적으로 재결정화될 수 있다.

하기 실시예는 예시를 위해 제시된 것으로서 청구된 발명을 제한하는 것이 아니다.

[실시예]

실시예 1

모나틴 , 모나틴 전구체, 트립토판, 알라닌, 아스파테이트 , 및 글루타메이트 의 검출

본 실시예는 모나틴, 모나틴 전구체("MP"), 트립토판, 아스파테이트, 알라닌, 및 글루타메이트의 존재를 검출하는데 사용되는 방법을 기술한다. 이는 또한 4개의 모나틴의 입체이성체를 분리하고 검출하는 방법을 기술한다.

모나틴 및 트립토판의 LC / MS / MS 다반응 모니터링(" MRM ": Multiple Reaction Monitoring) 분석

크로마토그래프와 마이크로매스 콰트로 울티마(Micromass Quattro Ultima) 삼단계 사중극자형 질량분석계 사이에 직렬로 배치된 워터스(Waters) 996 광다이오드 어레이(PDA: Photo-Diode Array) 흡광도 모니터와 함께 워터스 2795 액체 크로마토그래프를 포함하는 워터스/마이크로매스 액체 크로마토그래피-직렬 질량 분광법(LC/MS/MS) 장치를 사용하여 시험관내 또는 생체내 생화학적 반응으로부터 유래된 모나틴 및 트립토판에 대한 혼합물 분석을 실시하였다. 40℃에서 엑스테라(Xterra) MS C₈ 역상 크로마토그래피 칼럼(2.1mm x 250mm)을 사용하여 LC 분리를 수행하였다. LC 유동상은 A) (i) 0.05%(v/v) 트리플루오르아세트산 또는 (ii) 0.3% 포름산 및 10mM 포름산암모늄 중 하나를 함유하는 물, 및 B) (i) 0.05%(v/v) 트리플루오르아세트산 또는 (ii) 0.3% 포름산 및 10mM 포름산암모늄 중 하나를 함유하는 메탄올로 구성되었다.

LC 유동상이 A) 0.05%(v/v) 트리플루오르아세트산을 함유하는 물, 및 B) 0.05%(v/v) 트리플루오르아세트산을 함유하는 메탄올로 구성된 경우, 구배 용리는5% B 내지 35% B(0-4분)에서 선형이고, 35% B 내지 60% B(4-6.5분)에서 선형이고, 60% B 내지 90% B(6.5-7분)에서 선형이고, 90% B(7-11분)에서 등용매이고, 90% B 내지 95% B(11-12분)에서 선형이고, 95% B 내지 5% B(12-13분)에서 선형이고, 흐름 사이에 2분째는 재평형 기간이었다. 유속은 0.25mL/분이고, PDA 흡광도를 200nm 내지 400nm에서 모니터하였다. 관심의 대상이 되는 분석물의 양성자화된 분자 이온([M + H]+) 생성과, 특징적인 단편 이온 생산에 기초하여 ESI-MS에 대한 모든 매개 변수를 최적화시키고, 선택하였다. 모나틴 및 트립토판의 LC/MS/MS 다반응 모니터링(MRM) 분석을 위해 하기와 같은 기기 매개 변수를 사용하였다: 모세관: 3.5kV; 콘: 40V; 헥스 1: 20V; 개구부: 0V; 헥스 2: 0V; 공급 온도: 100℃; 탈용매 온도: 350℃; 탈용매 기체: 500L/h; 콘 기체: 50L/h; 저 질량 분해능(Q1): 12.0; 고 질량 분해능(Q1): 12.0; 이온 에너지: 0.2; 입구: -5V; 충돌 에너지: 8; 출구: 1V; 저 질량 분해능(Q2): 15; 고 질량 분해능(Q2): 15; 이온 에너지(Q2): 3.5; 배율기: 650. 5개의 모나틴-특이 모체로부터 딸로의 MRM 전이를 사용하여 시험관내 및 생체내 반응에서 모니틴을 특이적으로 검출한다. 모니터링된 전이는 293.1에서 158.3, 293.1에서 168.2, 293.1에서 211.2, 293.1에서 230.2, 및 293.1에서 257.2이다. MRM 전이 204.7에서 146.4인 것으로 트립토판은 모니터링된다. 모나틴 및 트립토판의 내부 표준 정량의 경우, 4개의 상이한 비로 각 분석물 대 d5-트립토판 및 d5-모나틴를 함유하는 4개의 보정 표준을 분석한다. 이들 데이타를 선형 최소 제곱 분석법으로 분석하여 모나틴과 트립토판에 대한 보정 곡선을 작성한다. 일정량의 d5-트립토판 및 d5-모나틴(WO03/091396 A2의 방법에 따라 d5-트립토판으로부터 d5-모나틴을 합성하였다)을 각 샘플에 가하고, 혼합물내 각 분석물의 양을 계산하기 위하여 상기 기술된 보정 곡선과 함께 반응비(모나틴/d5-모나틴; 트립토판/d5-트립토판)를 사용한다.

LC 유동상이 A) 0.3% 포름산 및 10mM 포름산암모늄을 함유하는 물, 및 B) 0.3% 포름산 및 10mM 포름산암모늄을 함유하는 메탄올로 구성된 경우, 구배 용리는 5% B 내지 45% B(0-8.5분)에서 선형이고, 45% B 내지 90% B(8.5-9분)에서 선형이고, 90% B 내지 90% B(9-12.5분)에서 등용매이고, 95% B 내지 5% B(12.5-13분)에서 선형이고, 흐름 사이에 4분째는 재평형 기간이었다. 유속은 0.27mL/분이고, PDA 흡광도를 210nm 내지 400nm에서 모니터하였다. 관심의 대상이 되는 분석물의 양성자화된 분자 이온([M + H]+) 생성과, 특징적인 단편 이온 생산에 기초하여 ESI-MS에 대한 모든 매개 변수를 최적화시키고, 선택하였다. 상기 제2 유동상에 사용된 기기 매개 변수는 상기와 동일하다. 5개의 모나틴-특이 모체로부터 딸로의 MRM 전이 및 1개의 트립토판 -특이 모체로부터 딸로의 전이를 사용하여 시험관내 및 생체내 반응에서 모니틴 및 트립토판을 특이적으로 검출한다. 모니터링된 전이는 293.1에서 158.0, 293.1에서 168.0, 293.1에서 211.5, 및 293.1에서 257.0이다. MRM 전이 205.2에서 146.1인 것으로 트립토판은 모니터링된다. 모나틴 및 트립토판의 내부 표준 정량의 경우, 4개의 상이한 비로 각 분석물 대 d5-트립토판 및 d5-모나틴를 함유하는 4개의 보정 표준을 분석한다. 이들 데이타를 선형 최소 제곱 분석법으로 분석하여 모나틴과 트립토판에 대한 보정 곡선을 작성한다. 일정량의 d5-트립토판 및 d5-모나틴(WO03/091396 A2의 방법에 따라 d5-트립토판으로부터 d5-모나틴을 합성하였다)을 각 샘플에 가하고, 혼합물내 각 분석물의 양을 계산하기 위하여 상기 기술된 보정 곡선과 함께 반응비(모나틴/d5-모나틴; 트립토판/d5-트립토판)를 사용한다. d5-트립토판 및 d5-모나틴에 대한 모니터링된 모체로부터 딸로의 질량 전이는 각각 210.2에서 151.1, 및 298.1 에서 172.0이다.

모나틴의 정확한 질량 측정

어플라이드 바이오시스템-퍼킨 엘머 Q-스타(Applied Biosystems-Perkin Elmer Q-Star) 하이브리드 사중극자형/비행 시간형 질량분석계를 사용하여 고해상 MS 분석을 수행하였다. 양성자화된 모나틴에 대하여 측정된 질량은 내부 질량 보정 표준으로서 트립토판을 사용하였다. 원자 조성물 C₁₄H₁₇N₂O₅에 기초하여 계산된 양성자화된 모나틴의 질량은 293.1137이다. 실시예 2 및 3에 기술된 생체 촉매 공정을 사용하여 생산된 모나틴의 질량 측정치는 293.1144로 나타났다. 2("ppm": parts per million(100만분의 1)) 미만의 질량 측정 오류이며, 이는 효소적으로 생산된 모나틴의 원자 조성물의 결정적 증거를 제공한다.

모나틴의 키랄 LC/MS/MS("MRM") 측정

시험관내 및 생체내 반응에서 모나틴의 입체이성체 분포를 측정하는 것은 1-플루오로-2-4-디니트로페닐-5-L-알라닌 아미드("FDAA")로 유도체화한 후, 역상 LC/MS/MS MRM 측정함으로써 수행되었다.

FDAA를 사용한 모나틴의 유도체화

50㎕의 샘플 또는 표준 및 10㎕의 내부 표준에 아세톤중 100㎕ 또는 200㎕의 1% FDAA 용액을 가하였다. 20㎕ 또는 40㎕의 1.0M 중탄산나트륨을 각각 가하고, 혼합물은 가끔식 혼합해 주면서 40℃에서 1시간 동안 인큐베이션시켰다. 샘플을 제거하고, 냉각시키고, 20㎕의 2.0M HCl로 중화시켰다(완충처리된 생물학적 혼합물을 중화시키는데 더 많은 HCl이 필요할 수도 있다). 가스 제거를 완료한 후, 샘플은 LC/MS/MS으로 분석하기 위해 준비되었다.

시험관내 및 생체내 반응에서 모나틴의 입체이성체 분포를 측정하기 위한 LC/MS/MS 다반응 모니터링

상기 기술된 바와 같이 LC/MS/MS 사용법으로 사용하여 분석을 실시하였다. 4개의 모나틴의 입체이성체 모두(특히 FDAA-모나틴)를 분리할 수 있는 LC 분리는 40℃에서 페노메넥스 루나(Phenomenex Luna) 2.0 x 250mm(3μM) C18 (2) 역상 크로마토그래피 칼럼 상에서 실시하였다. LC 유동상은 A) 0.05%(질량/ 부피) 아세트산암모늄을 함유하는 물 및 B) 아세토니트릴로 구성되었다. 용리는 B(0-2분)에서 등용매이고, 13% B 내지 30% B(2-15분)에서 선형이고, 30% B 내지 80% B(15-16분)에서 선형이고, 80% B(16-21분)에서 등용매이고, 80% B 내지 13% B(21-22분)에서 선형이며, 흐름 사이에 8분째는 재평형 기간이었다. 유속은 0.23mL/분이고, PDA 흡광도를 200nm 내지 400nm에서 모니터하였다. FDAA-모나틴의 탈양성자화된 분자 이온([M - H]-) 생성과, 특징적인 단편 이온 생산에 기초하여 ESI-MS에 대한 모든 매개 변수를 최적화시키고, 선택하였다.

음이온 ESI/MS 모드로 모나틴을 LC/MS 분석하기 위해 하기와 같은 기기 매개 변수를 사용하였다: 모세관: 2.0kV; 콘: 25V; 헥스 1: 10V; 개구부: 0V; 헥스 2: 0V; 공급 온도: 100℃; 탈용매 온도: 350℃; 탈용매 기체: 500L/h; 콘 기체: 50L/h; 저 질량 분해능(Q1): 12.0; 고 질량 분해능(Q1): 12.0; 이온 에너지: 0.2; 입구: -5V; 충돌 에너지: 20; 출구: 1V; 저 질량 분해능(Q2): 12; 고 질량 분해능(Q2): 12; 이온 에너지(Q2): 3.0; 배율기: 650. 3개의 FDAA-모나틴-특이 모체로부터 딸로의 MRM 전이를 사용하여 시험관내 및 생체내 반응에서 FDAA-모나틴을 특이적으로 검출한다. 모나틴에 대해 모니터링된 전이는 543.2에서 268.1, 543.2에서 499.3, 및 543.2에서 525.3이다. 모니터링된 모나틴 내부 표준 유도체 질량 전이는 548.2에서 530.3이었다. FDAA-모나틴 입체이성체의 확인은 정제된 합성 모나틴 입체이성체, 및 질량 스펙트럼 데이타와 비교하여 크로마토그래피 체류 시간에 기초한다. 내부 표준을 사용하여 반응 진행과 S,S 입체이성체의 체류 시간 확인을 위해 모니터링한다.

글루타메이트 및 알라닌을 포함하는 아미노산의 액체 크로마토그래피-포스트 칼럼 형광 검출

시험관내 및 생체내 반응에서 글루타메이트 및 알라닌을 측정하기 위한 액체 크로마토그래피와 포스트-칼럼 형광 검출(LC/OPA)은 워터스 474 스캐닝 형광 검출기, 및 워터스 포스트-칼럼 반응 모듈과 조합된 워터스 2690 LC 시스템 또는 장비상에서 실시하였다. 모나틴 및 트립토판의 반정량적 분석 또한 이러한 방법을 사용하여 실시하였다. LC 분리는 6O℃의 상호작용-나트륨 로딩된 이온 교환 칼럼 상에서 실시하였다. 유동상 A는 피커링(Pickering)Na 328 완충액(캘리포니아주 마운틴 뷰에 소재하는 Pickering Laboratories, Inc.)이었다. 유동상 B는 피커링 Na 740 완충액이었다. 구배 용리는 0% B 내지 100% B(0-20분), 100% B(20-36분)에서 등용매이고, 100% B 내지 0% B(36-37분)에서 선형이고, 샘플 메트릭스에 따라 흐름 사이에 적어도 5분째는 재평형 기간이었다. 유동상에 대한 유속은 0.5mL/분이었다. OPA 포스트-칼럼 유도체화 용액에 대한 유속은 0.5mL/분이었다. 형광 검출기 셋팅은 EX 338-340nm 및 Em 420-425nm이었다. 노르루신을 분석을 위한 내부 표준으로서 사용하였다. 아미노산의 동정은 정제된 표준에 대한 크로마토그래피 체류 시간 데이타에 기초하였다.

LC/MS/MS에 의한 L- 및 D-아미노산 검출

생화학적 반응 실험으로부터 L- 및 D-아미노산, 예로서, 리신, 알라닌, 메티오닌, 티로신, 루신, 페닐알라닌, 트립토판, 글루타메이트, 및 아스파테이트의 혼합물을 함유하는 샘플을 먼저 포름산으로 처리하여 단백질을 변성시켰다. 이어서, 샘플을 원심분리하고, LC/MS/MS 분석에 앞서 0.45μM 나일론 주사기 필터를 통해 여과하였다. L- 및 D-아미노산 동정은 체류 시간 및 질량 선택적 검출에 기초하였다. LC 분리는 칼럼 온도가 45℃로 세팅된 ASTEC 2.1mm x 250mm 키로바이오틱(Chirobiotic) TAG 크로마토그래피 칼럼과 워터스 2690 액체 크로마토그래피 시스템을 사용함으로써 수행하였다. LC 유동상 A 및 B는 각각 0.25% 아세트산 및 메탄올중 0.25% 아세트산이었다. L 및 D 이성체를 분리하는 모든 방법에 동용매 용리를 사용하였다. 80% 유동상 A, 및 20% B를 사용하여 리신을 용리시켰다. 글루타메이트, 알라닌, 및 메티오닌은 60% 유동상 A 및 40% B로 용리시키고, 유속은 0.25 mL/분으로 하여 분리시켰다. 아스파테이트, 트립토판, 티로신, 루신, 및 페닐알라닌은 30% 유동상 A 및 70% B 동용매로 하여, 페닐알라닌을 제외한 모두의 유속은 0.3mL/분을 하고, 페닐알라닌은 유속을 0.25mL/분으로 하여 이동시킴으로서 분리하였다.

L- 및 D-아미노산 분석용 검출 시스템은 워터스 996 광다이오드 어레이(PDA) 검출기 및 마이크로매스 콰트로 울티마 삼단계 사중극자형 질량분석계를 포함하였다. 195 내지 350nm에서 스캐닝하는 PDA를 크로마토그래피 시스템과 질량분석계 사이에 직렬로 배치하였다. 양 전기분무 이온화 모드(+ESI)로 작동하는 마이크로매스 콰트로 울티마 삼단계 사중극자형 질량분석계에 대한 매개 변수는 하기와 같이 세팅하였다: 모세관: 3.0kV; 콘: 20V; 헥스 1 : 15V; 개구부: 1V; 헥스 2: 0V; 공급 온도: 100℃; 탈용매 온도: 350℃; 탈용매 기체: 530L/h; 콘 기체: 30L/h; 저 질량 Q1 분해능: 12.5; 고 질량 Q1 분해능: 12.5; 이온 에너지 1 : 0.2; 입구: -5; 충돌: 8; 출구 1: 10; 저 질량 Q2 분해능: 12.5; 고 질량 Q2 분해능: 12.5; 이온 에너지 2: 0.5; 배율기: 650 V. 글루타메이트의 경우, 147.8에서 84.2 및 147.8에서 102.1, 아스파테이트의 경우, 134.00에서 74.30, 및 134.00에서 88.2, 리신의 경우, 147.3에서 85.0, 메티오닌의 경우, 150.3에서 104.8, 티로신의 경우, 182.3에서 137.0, 루신의 경우, 182.3에서 137.0, 및 페닐알라닌의 경우, 166.3에서 121.0인 반응 전이를 선택적으로 모니터하기 위해 다반응 모니터링(MRM) 모드를 갖는 MS/MS 실험을 설정하였다. 두개의 전이를 열거할 경우, 후자의 전이는 정량을 위해 사용되었다. 트립토판의 경우, 다반응 모니터링(MRM) 모드를 사용하는 MS/MS 실험은 205.2에서 118.2, 205.2에서 146.1, 및 205.2에서 188.2의 반응 반응 전이, 및 d8-DL 트립토판의 경우, 212.1에서 151.1로부터의 전이를 선택적으로 모니터하기 위해 설정하였다. 205.2에서 146.1로의 전이의 분석물 반응 대 내부 표준, d8-D,L 트립토판의 것의 비를 측정하여 트립토판을 정량하였다. 별법으로, 트립토판, 글루타메이트, 및 아스파르트산을 정량하는 것은 각각 m/z=146.5, m/z=102.1, 및 m/z=88.2의 신호 반응에 기초하였다.

표준 및 분석을 위한 모나틴 및 모나틴 전구체("MP") 생산

모나틴 생산

R,R 및 S,S 모나틴의 라세미 혼합물은 미국 특허 번호 제5,128,482호에 기재된 바와 같이 합성적으로 생산하였다.

R,R 및 S,S 모나틴은 유도체화 및 가수분해 단계에 의해 분리하였다. 간단히 말해서, 모나틴 라세미 혼합물을 에스테르화하고, 유리 아미노기를 Cbz로 차단하고, 락톤을 형성하고, S,S 락톤은 고정된 프로테아제 효소를 사용하여 선택적으로 가수분해하였다. [Bassoli, A. et al, Eur. J. Org. Chem., 8:1652-1658, (2005)]에 기재된 바와 같이 모니틴 또한 분리할 수 있다.

MP 생산

아미노 수용체로서 피루브산나트륨을 사용하고, 0.1M 인산칼륨 완충액중 AT-103의 광범위한 D-아미노트랜스퍼라제(캘리포니아주 패서디나에 소재하는 BioCatalytics)를 사용하여 R,R 모나틴의 아미노전이에 의해 R-MP를 생산하였다. 아미노 수용체로서 피루브산나트륨을 사용하고, 0.1M 인산칼륨 완충액중 AT-102 L-아미노트랜스퍼라제(캘리포니아주 패서디나에 소재하는 BioCatalytics)를 사용하여 S,S 모나틴의 아미노전이에 의해 S-MP를 생산하였다. 두 반응은 모두 대략 20시간 동안 대략 pH 8.0-8.3에서 30℃하에 수행하였다. 두개의 화합물 모두 물에서 용리시키면서, 롬 앤 하스(Rohm and Haas)(펜실베이니아주 필라델피아에 소재) 소수성 수지(XADTM 1600)를 사용하여 분취용 규모의 HPLC를 사용함으로써 정제하였다. 순도가 90% 초과인 모나틴 전구체를 함유하는 샘플을 수집하고, 냉동 건조시켰다.

실시예 2

모나틴 전구체 검출

본 실시예는 모나틴 전구체의 2개의 에난티오머를 분리 및 검출하는데 사용되는 방법을 기술한다.

모나틴 전구체 검출을 위한 비- 키랄성 방법

CTCPaI 자동-샘플러(노스 캐롤라이나주 카보로에 소재하는 LEAP Technologies)를 사용하여 에질런트 조르박스(Agilent Zorbax) RX-C18, 3.5um, 3.0 x 150mm 칼럼으로 96-웰 플레이트로부터의 반응 샘플을 주입하였다. 하기와 같은 H₂O/ACN(0.1% 포름산) 구배를 사용하여 산물을 분리하였다:

시간: 0.00분 5% B

시간: 4.00분 100% B

시간: 5.00분 100% B

시간: 5.10분 5% B

시간: 6.50분 5% B

0.8mL/분으로 LC-10ADvp 펌프(일본 교토에 소재하는 Shimadzu)에 의해 구배를 제공하였다. API4000 터볼론-스프레이(API4000 Turbolon-Spray) 삼단계 사중극자형 질량분석계(캘리포니아주 포스터 시티에 소재하는 Applied Biosystems)를 사용하여 산물을 검출하였다. 음이온 모드로 관심의 대상이 되는 분석물에 대한 이온 분무 및 다중 이온 모니터링을 실시하였는데, 여기서 각 분석은 6.5분씩 지속되었다.

피루베이트 = 87.1 [M - H+]-

인돌-3-피루베이트 = 202.1 [M - H+]-

산물 = 290.0 [M - H+]-

R & S 모나틴 전구체의 키랄 CE 분석

P/ACE™ MDQ 모세관 전기영동 장치(캘리포니아주 풀러턴에 소재하는 Beckman Coulter)를 사용하였다. 키랄 발생 키트를 사용하고, 소량의 여러 키랄 선별기, 필요한 완충액 및 2개의 모세관(캘리포니아주 풀러턴에 소재하는 Beckman Coulter)을 포함한다. 별법으로, MP 분석만을 위해서는 하기 시약과 기타 공급물은 벡크만 쿨터(Beckman Coulter)(캘리포니아주 풀러턴에 소재) 또는 다른 곳으로부터 별도로 입수할 수 있다:

코팅된 모세관 N-CHO; 50um ID, 전체 길이 65cm 또는 융합된 실리카 모세관.

25mM 포스페이트 완충액(pH 5)

25mg 하이드록시프로필-β-사이클로덱스트린

모세관 보존액, 10mL(별법으로, 0.5% 폴리에틸렌 옥시드 용액, Mw 600,000 또는 300,000 달톤을 사용할 수 있다).

모세관 전기영동(" CE : Capillary Electrophoresis ") 분석

중성 코팅된 모세관(50um ID, 60cm(검출시 50cm) 또는 30(20)cm)을 214nm에서 DAD 검출(또는 단일 UV)과 함께 사용하였다. 자동 온도 조절 장치로 분리 모세관 온도를 15℃로 조절하고, 샘플은 4℃로 조절하였다. 분리 완충액은 20mM 하이드록시프로필-β-사이클로덱스트린, 25mM 포스페이트(pH 5)였다. 전형적으로 샘플을 0.5psi, 5초로 주사하였다. 500 V/cm, 반전된 극성(30cm 모세관의 경우, 15kV, 60cm의 경우, 30kV)으로 분리하였다. 분리시 사용된 전형적인 전류는 -28㎂였다. MP ㅍ크에 대한 전형적인 흐름 시간은 약 3.5분(유효 길이 20cm) 또는 8분(50cm)이었다.

샘플 흐름 이전에 임의의 모세관 세정/세척/보존 단계는 H₂O 4분, 0.1M HCl 1분, H₂O 1.5분, 모세관 보존액 4분, H₂O 1분, 분리 완충액 4분을 사용하였다.

흐름 방법에 관해서는 하기에 요약한다: 1-2분간 분리 완충액으로 세정, 0.5psi로 5초간 샘플 주입, 모세관 길이에 따라 반전된 전압 극성 15 또는 30kV로 5-10분간 분리.

실시예 3

피루베이트 알돌라제에 관한 일반 분석법

상이한 피루베이트 알돌라제 활성을 측정하는 대표적인 방법은 일반 기질, 4-카복시-4-하이드록시-2-옥소아디페이트(CHA: 4-Carboxy-4-hydroxy-2-oxoadipate)를 사용한다. CHA 분석법은 문헌 분석법으로 적합화시켰다(예컨대, 문헌 [E.E. Dekker & R.P. Kitson, J. Biol. Chem. 267, 10507-10514, 1992] 참조). 전형적인 분석법은 50mM 인산나트륨(pH 7.5), 1mM MgCl₂, 1mM CHA, 락토바실러스 레크마니로부터의 10㎍/ml D-젖산 데하이드로게나제(미주리주 세인트루이스에 소재하는 Sigma-Aldrich), 0.5mM NADH를 포함하였다. 효소(전형적으로 1 내지 5㎕)를 첨가함으로써 분석을 개시하였다. NAD⁺ 형성과 커플링된 피루베이트의 유리를 340nm에서 분광광도계로 연속하여 모니터하였다.

문헌 [Tack, B. F. Chapman, P.J., and S. Dagley. J. Biol. Chem. 247 6438-6443 (1972)]에 기재된 방법에 따라 CHA를 합성하였다.

효소 활성, 예로서, 피루베이트 알돌라제, 예로서, HMG 및/또는 KHG 알돌라제 효소 활성의 유닛은 340nm에서의 흡광도를 1분당 1OD 만큼 저하시키는데 충분할 만큼 피루베이트를 유리시키는 양으로서 정의된다.

실시예 4

다이버사 ( Diversa ) 환경 라이브러리로부터 신규한 케토 - 하이드록시 -글루타레이트( KHG : Keto - hydroxy - glutarate ) 및 하이드록시 - 메틸 - 케토 -글루타레이트( HMG : Hydroxy-methyl-keto-glutarate) 알돌라제의 발견

다이버사 DNA 라이브러리를 스크리닝하여 150개 초과의 독특한 HMG 알돌라제 및 15개의 KHG 알돌라제를 발견하였다. 이러한 알돌라제 유전자를 서열 분석하고, 적합한 발현 벡터 내로 서브클로닝하였다. 이어서 상기 벡터를 적합한 발현 숙주 내로 형질전환시켜 효소 특징화를 위해 충분한 양의 알돌라제를 생산하였다. 선별된 알돌라제 세트를 CHA에 대한 활성과, 모나틴 전구체(MP)의 활성에 대하여 시험하였다. 본 특허에서 발견되고 기술된 모든 효소는 하기 일반 반응식에 예시된 바와 같은 알파-케토산 수용체 및 피루베이트 또는 피루베이트 유도체 공여체 사이의 기타 탄소-탄소 결합 형성 반응에서 사용될 수 있는 잠재능을 갖는다.

실시예 5

선별된 알돌라제의 특징화

하기 도식에 나타낸 바와 같이, 인돌-3-피루베이트 및 피루베이트를 모나틴 전구체(MP)로 전환시키는 것을 촉진시킬 수 있는 능력과 관련하여 선별된 알돌라제를 특징화하였다:

도 13 및 14는 LC/MS/MS에 의해 측정된, MP의 형성에 있어서 58개의 상이한 알돌라제 활성을 나타낸다.

20mM 인돌-3-피루베이트("BP"), 50mM 피루베이트, 100mM 인산나트륨(pH 7), 1mM MgCl₂, 100㎍/mL 알돌라제를 사용하여 알돌 반응을 실시하였다. 실온하의 암실에서 반응물을 인큐베이션시켰다. 분취량(30㎕)을 다양한 시점에 제거하고, 얼음상에 샘플을 저장함으로써 반응을 종결시켰다. 각 분취량중 일부를 CE 분석에 사용하고, 남은 부분은 50% 아세토니트릴중에서 1:1000으로 희석시키고 LC/MS 분석에 사용하였다.

[표 2]

R-MP에 대한 선택성이 98+%인 것은 S-MP가 검출되지 않았다는 것을 지시한다는 것에 주목한다. CE 분석법의 감수성을 고려하면, 본 결과는 형성된 MP중 98% 이상이 R-에난티오머라는 것을 지시한다. 따라서, 98+%인 것으로서 열거된 효소는 R-MP에 대하여 98% 이상 선택성이며, 100%까지의 선택성을 나타낼 수 있다.

표 2는 또한 일반 알돌라제 기질인 CHA에 대한 효소의 활성 뿐만 아니라, SDS-PAGE에 의해 측정된 각 효소의 상대 발현에 대하여 나타낸다. 수개의 효소는 CHA에 대하여 검출 가능한 활성을 나타내지 못했지만, MP 제조에 대한 활성을 나타냈다는 점에 주목한다.

요약컨대, 알돌라제는 광범위한 활성, 발현 및 선택성을 나타낸다. 또한, R-MP에 대하여 매우 높은 선택성(98% 이상)을 나타내는 알돌라제가 다수 존재한다.

실시예 6

식물 피루베이트 알돌라제의 발견

축퇴성 PCR 프라이머(하기 참조)를 디자인하고, 스클레로치톤 일리시폴리우스로부터 제조된 cDNA로부터 알돌라제 유전자를 추출하였다. 유전자의 5' 및 3' 말단을 회수하고, 이어서, 전체 길이의 유전자를 PCR로 증폭시켰다.

실시예 7

바실러스 스파에리쿠스 ( Bacillus sphaericus ) D-아미노산 아미노트랜스퍼라 제의 클로닝

B. 스파에리쿠스 D-아미노산 아미노트랜스퍼라제(EC 2.6.1.21, D-알라닌 아미노트랜스퍼라제 또는 D-아스파테이트 아미노트랜스퍼라제로도 공지됨)는 다양한 알돌라제와 함께 커플링된 분석법에 사용하기 위해 재조합법으로 생산하였다. 이러한 효소는 모나틴 생산을 위해 앞서 기술된 D-아미노트랜스퍼라제와 상동성이다(미국 공개 번호 제20040063175호 및 미국 공개 번호 제20050282260호).

균주

B. 스파에리쿠스(ATCC 번호 10208)를 30℃에서 밤새도록 영양 아가에서 배양하였다. 콜로니 군을 100㎕의 멸균수에 놓고, 95℃에서 5분간 가열하여 세포를 파괴시켰다. 3㎕를 추후 중합효소 연쇄 반응(PCR) 증폭에 사용하였다.

중합효소 연쇄 반응 프로토콜

NcoI 및 BamHI 부위를 사용하여 pET 28b 및 pET 30a 벡터(위스콘신주 매디슨에 소재하는 Novagen) 내로 클로닝하기 위한 프라이머를 디자인하였다. pET 30 작제물은 N-말단 His-태그 및 S-태그를 함유하는 반면, pET 28 작제물은 태깅되지 않았다.

바실러스 스파에리쿠스 dat 프라이머:

N 말단: 5'-GATATACCATGGCATACTCATTATGGAATG-3' (서열 번호:383) 및

C 말단: 5'-GTTATCGGATCCTTAGGCATTAATTGAAATTG-3' (서열 번호: 384).

하기 PCR 프로토콜을 사용하여 코딩 영역을 증폭시켰다: 50㎕의 반응물중, 3㎕의 주형, 1.6μM의 각 프라이머, 0.25mM의 각 dNTP, 3.5U 익스팬드 하이 피델러티(Expand High Fidelity) 폴리머라제(인디아나주 인디애나폴리스에 소재하는 Roche), 및 Mg를 함유하는 1X 익스팬드(Expand)™ 완충액을 사용하였다. 사용된 열순환기 프로그램은 3분 동안 94℃에서 가열 개시, 하기 단계로 8회 반복: 30초 동안 94℃, 30초 동안 52℃ 및 2분 동안 72℃. 이어서 22회에 걸쳐 58℃ 온도에서 어닐링하였다. 30회 반복한 후에, 샘플을 7분 동안 72℃에서 유지시키고, 4℃에서 저장하였다. 올바른 크기를 갖는 세정된 PCR 산물을 수득하였다(dat 유전자에 대하여 대략 850bp).

클로닝

PCR 산물은 퀴아젠 퀴아퀵(Qiagen QIAquick) PCR 정제 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 정제하고, BamHI 완충액(매사추세츠주 입스위치에 소재하는 New England Biolabs)에서 BamHI 및 NcoI로 분해하였다.

분해된 벡터 및 인서트는 퀴아젠 퀴아퀵 겔 추출 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 정제하였다. 로슈 래피드™ DNA 결찰 키트(Roche Rapid DNA Ligation Kit)(인디아나주 인디애나폴리스에 소재하는 Roche)를 사용하여 결찰시키고, 퀴아퀵 PCR 정제 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 정제하였다. 바이오-래드 전기천공법 매뉴얼(캘리포니아주 허큘리스에 소재하는 Bio-Rad)에 기술된 바이오-래드 진 펄사르 II 시스템(Bio-Rad Gene Pulser II system) 및 0.2cm 큐베트를 사용하여 에스케리키아 콜라이 DH10B로 결찰물을 형질전환시켰다. 225rpm으로 37℃에서 30분 동안 900㎕의 SOC 배지에 세포를 회수시켰다. 카나마이신(25㎍/mL)를 함유하는 LB-아가 플레이트상에 세포를 플레이팅시켰다.

플라스미드 DNA는 퀴아젠 스핀 미니프렙 키트(Qiagen spin miniprep kit)(캘리포아주 발렌시아에 소재하는 Qiagen)를 사용하여 정제하고, BamHI 및 NcoI를 사용하는 제한 분해에 의한 올바른 인서트에 대해 스크리닝하였다. 올바른 인서트를 갖는 것으로 보이는 플라스미드 서열을 에이젠코트 바이오사이언스 코오포레이션(Agencourt BIOScience Corporation)(매사추세츠주 비벌리에 소재)에서 디데옥시 쇄 종결 DNA 서열 분석에 의해 확인하였다. 서열 분석을 통해 NCBI 수탁번호 AF081278 영역: 134..985(gi: 3513754)에서 발견된 코딩 서열을 확인하였는데, 이는 수탁번호 AAC33964(gi: 3513755)로서 열거된 아미노산 서열을 갖는 단백질을 생산하는 것이다.

유전자 발현 및 분석법

플라스미드 DNA를 E. 콜라이 발현 숙주 BL21(DE3)(위스콘신주 매디슨에 소재하는 Novagen) 내로 서브클로닝하였다. 배양물을 배양하고, 퀴아젠 미니프렙 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 플라스미드를 단리하고, 제한 분해에 의해 분석하여 아이덴터티를 확인하였다. 전형적으로 카나마이신(50㎍/mL)을 함유하는 LB 배지에서 유도를 실시하였다. 세포를 0.4-0.8의 OD₆₀₀까지 배양하고, 0.1mM IPTG(이소프로필 갈락카토시드)로 유도되고, 유도 이후 4시간째에 샘플링하였다. 노바젠 벅버스터(Novagen BugBuster)™ 시약(위스콘신주 매디슨에 소재하는 Novagen)(첨가된 벤조나제 뉴클레아제 및 로슈(Roche) 완전 프로테아제 저해제 칵테일(인디아나주 인디애나폴리스에 소재하는 Roche) 포함)을 수반하는 프로토콜에 따라 세포 추출물을 제조하였다. SDS-PAGE에 의해 판정된 바, 예측되는 분자량으로 매우 높은 수준의 가용성 단백질을 수득하였다. 몇몇 반응의 경우, pET 30 유전자 산물을 제조사(위스콘신주 매디슨에 소재하는 Novagen)의 프로토콜에 따라 His-Bind 카트리지를 사용하여 정제하였다. 용리제 분획은 PD-10(뉴저지주 피츠카타웨이에 소재하는 GE Healthcare) 칼럼에서 탈염시키고, 25-100mM 인산칼륨 완충액(pH 7.5)중에서 용리시켰다.

하기 프로토콜을 사용하여 피루베이트 및 D-트립토판으로부터 알라닌 생산에 따른 D-아미노트랜스퍼라제 활성에 대하여 세포 추출물을 분석하였다. 100mM 인산칼륨 완충액(pH 7.5), 50μM 피리독살 포스페이트, 25mM 피루브산나트륨, 및 50mM D-트립토판중에서 1mL 반응을 수행하였다. 무세포 추출물 또는 정제된 효소를 가하여 반응을 개시하고, 약하게 진탕시키면서 3O℃에서 15분 내지 밤새도록 인큐베이션시켰다. 최종 농도 2%까지 포름산을 가하여 반응을 종결시키고 침전된 단백질은 원심분리하여 제거하였다. 단백질이 첨가되지 않은 대조군 반응 또한 실시하였다. 0 시점 또한 음성 대조군으로서 사용하였다. 알라닌은 실시예 1에 기술된 바와 같이 OPA 유도체화를 사용하여 검출하였다.

실시예 8

서열 번호: 8, 서열 번호: 4, 서열 번호: 12, 및 서열 번호: 28, 및 C. 테스토스테로니( C. testosteroni ) ProA 의, 알돌라제 활성을 갖는 폴리펩티드에 대한 총 모나틴 생산 및 이성체 분포 비교

AT-103 트랜스아미나제(광범위한 특이성을 갖는 D-아미노트랜스퍼라제)를 바이오카탈리틱스(바이오Catalytics)(캘리포니아주 패서디나 소재)로부터 구입하고, 상기 효소 또는 실시예 7에서 생산된 재조합 효소를 HMG 알돌라제와의 커플링 반응에 사용하여 미국 공개 출원 번호 제20050282260호에 기재된 바와 같이 D-트립토판 및 피루베이트로부터 모나틴을 생산하였다. C. 테스토스테로니로부터의 ProA 알돌라제는 비교 목적으로 기준 알돌라제로서 사용하고, 이는 미국 공개 출원 번호 제20040063175호 및 WO 03091396 A2에 기재된 바와 같이 제조하였다. 시험하는 알돌라제를 단리하고, 상기 실시예 4에 기술된 바와 같이 형질전환시켰다.

각 알돌라제를 시험 용량으로 생산하기 위하여 50mL 배양물을, 암피실린(100㎍/mL)을 함유하는 LB 배지에서 OD₆₀₀가 대략 0.5가 될 때까지 배양하였다. 서열 번호: 7, 서열 번호: 3, 및 서열 번호: 11 작제물을 함유하는 균주를 100μM의 IPTG로 유도하였다. 서열 번호: 27 작제물을 함유하는 균주를 200㎍/L의 안하이드로세트라사이클린으로 유도하였다. 세포를 유도후 5시간 동안 배양하고, 제조사(위스콘신주 매디슨에 소재하는 Novagen, Bugbuster reagent)의 프로토콜에 따라 세포 추출물을 제조하였다. 벤조뉴클레아제 및 프로테아제 저해제 또한 가하였다. 세포 추출물내 가용성 단백질을 바이오-래드 라보라토리즈 엑스페리온 자동화 전기영동 스테이션(Bio-Rad Laboratories Experion Automated Electrophoresis Station)(캘리포니아주 허큘리스에 소재하는 Bio-Rad) 상에서 분리하고, 엑스페리온 소프트웨어버전 1.1.98.0을 사용하여 농도 및 발현율(%)에 대하여 분석하였다.

반응 혼합물 1mL당 하기를 첨가하였다: 대략 50㎍의 알돌라제(달리 언급하지 않는 한, 세포 추출물로 공급됨), 4mM MgCl₂, 50mM D-트립토판, 0.5mg 정제된 B. 스파에리쿠스 D-아미노트랜스퍼라제, 200mM 피루브산나트륨, 100mM 인산칼륨 완충액(pH 7.5), 및 0.05mM PLP. 실험을 2회 실시하였는데, 음성 대조군에는 어떤 알돌라제도 첨가하지 않았다. 샘플을 약하게 진탕시키면서 30℃에서 1시간, 2시간, 및 밤새도록(17-20시간) 인큐베이션시켰다. 마그네슘 및 포스페이트에 의해 촉진된 비-효소 반응에 기인하여 알돌라제없이 밤새도록 진행된 반응에서는 소량의 모나틴(< 0.5ppm)이 생산된다. 상기 값을 하기 나타낸 수로부터 감산하여 평균적인 결과 값을 나타낸다. 이들 방법을 사용하여 모나틴을 생산하였을 때 검출된 유일한 입체이성체는 R,R 및 S,R이다. R,R(%)을 하기에 열거하는데, 이는 역상 LC 피크 면적에 의해 측정되었다.

[표 3]

18시간된 서열 번호: 28을 또한 실시예 1에 열거된 FDAA 유도체화 방법에 의해 입체이성체 분포에 대하여 분석하였는데, 94.9% R,R 및 5.1% S,R 모나틴의 결과를 수득하였다.

출발 기질로서 L-트립토판을 사용하고, 미국 공개 출원 번호 제20050282260호에 기재된 바와 같이 생산되고 정제된 HexAspC 광범위한 특이성을 갖는 L-아미노트랜스퍼라제와 커플링시킴으로써 협력하여 동일한 실험을 수행하였다. 이들 반응을 통해서는 주로 S,S 모나틴 및 R,S 모나틴을 수득하여야 한다. L-트립토판 아미노전이를 위해 아미노 수용체로서 10mM 알파-케토글루타레이트 또한 반응물에 보충하였다. 또한, 하기와 같이 총 모나틴의 2개의 결과에 대한 평균을 구하고(알돌라제가 존재하지 않는 배경 수준을 감산한다), S,S 모나틴(%)은 역상 LC 피크 면적에 기초하여 나타낸다. 몇몇 경우, 알돌라제가 매우 R-특이적이고, 총 모나틴은 거의 생산되지 않기 때문에 입체이성체 분포의 역 추정치는 S,S/R,R 모나틴 피크와 함께 용리될 수 있는 트립토판 피크의 몇몇 테일링으로 인하여 정확성이 더 낮다. 이러한 경향은 알돌라제의 R-특이성을 비교하는데 있어 여전히 유익하다. 수개 샘플에 대한 FDAA 유도체화 방법을 사용한 추가 분석으로부터 얻은 결과는 괄호 안에 표시하는데, 이는 보다 정확하다. 대략 400ppm 초과의 총 모나틴 수는 결과를 정량화하는데 사용된 선형 범위의 표준 크기보다 더욱 높은 바, 이는 정성적 결과이다. 미국 공개 출원 번호 제20050282260호에 제시한 바와 같이, C. 테스토스테로니 ProA 알돌라제는 전형적으로 95-100%의 S,S 모나틴을 생산한다.

[표 4]

서열 번호: 28의, 알돌라제 활성을 갖는 폴리펩티드의 R-특이성은 기준 Pro A 효소와 비교하여 매우 높고, 이는 또한 상기 반응에서 S-MP에 대한 HexAspC 아미노트랜스퍼라제의 특이성은 높을지라도 낮은 비율로 생산되는 S,S 모나틴(%)이 반영된다는 것을 이해할 수 있다. S,S 모나틴 생산 대 R,R 모나틴 생산을 비교하였을 때 총 모나틴 수가 알돌라제 활성을 나타내지는 못한다. D-아미노트랜스퍼라제는 특히, 이들 반응에 존재하는 MP의 농도에서 HexAspC보다 활성이 작다.

서열 번호: 28의, 알돌라제 활성을 갖는 폴리펩티드와 C. 테스토스테로니로부터의 ProA 효소를 추가로 비교하기 위하여 D-트립토판으로부터 출발하는 반응에 다양한 비율의 D-아미노트랜스퍼라제 대 알돌라제를 사용하였다(이 실험에 대한 이중 샘플은 없다). 상기와 같이 반응을 수행하였다. 알돌라제 농도가 일정하게 유지되는 반응의 경우, 대략 50㎍이 사용되었다. D-아미노트랜스퍼라제가 일정하게 유지되는 반응의 경우, 0.5mg이 사용되었다. 2 및 10mg/mL 농도의 D-아미노트랜스퍼라제의 경우, 냉동건조된 효소를 사용하였다. 2개의 가장 높은 농도의 D-아미노트랜스퍼라제에 대해서는 2회에 걸쳐 실시하였다.

[표 5]

모나틴 수준이 400ppm 초과인 경우, 결과는 표준 곡선의 선형 범위내 존재하지 않고, 이는 단지 대략적인 값이다. 적절히 희석되었을 때, R,R 모나틴의 최대 생산량은 1100ppm이었다. 10mg/mL D-아미노트랜스퍼라제 샘플을 사용하여 서열 번호: 28의, 알돌라제 활성을 갖는 폴리펩티드에 대한 FDAA 입체이성체 분석을 수행하였다. 2시간째에 샘플은 98.5% R,R 모나틴을 함유하였다. 17시간째에 샘플은 95.9% R,R 모나틴을 함유하였다. 서열 번호: 28의, 알돌라제 활성을 갖는 폴리펩티드는 장시간 동안 인큐베이션된 후에도, 다량의 아미노트랜스퍼라제를 사용한 경우에도 높은 비율로 R,R 모나틴을 생산하였다. 적합한 D-아미노트랜스퍼라제가 공급될 경우, 서열 번호: 28의, 알돌라제 활성을 갖는 폴리펩티드는 C. 테스토스테로니 ProA 알돌라제 만큼 다량의 총 모나틴을 생산하며, 이는 유사한 비활성을 나타낸다.

[표 6]

알돌라제 농도를 달리할 때, 총 모나틴의 증가는 없었다. R,R(%)는 시간에 따라, 그리고 알돌라제 농도에 따라, 특히 D-아미노트랜스퍼라제가 제한적일 때 감소한다.

시험된 알돌라제의 R-특이성을 추가로 조사하기 위하여, L-트립토판, 및 미국 공개 출원 번호 제20050282260호에 기재되어 있는 바와 같이 생산되고 정제된 HexAspC 아미노트랜스퍼라제로부터 출발하는 실험을 수행하였다. HexAspC는 S-MP 대 R-MP의 아미노산전이에 대하여 강력한 선택성을 나타내며, 따라서, 50% 초과의 R,S 모나틴(%)이 고도로 입체특이성인 알돌라제를 지시한다. 10mM 알파-케토글루타레이트가 아미노 수용체로서 공급되었지만; 고농도의 피루베이트 또한 L-아미노트랜스퍼라제에 의해 사용된다. 이들 반응에서, 전형적으로는 FDAA 유도체화 프로토콜의 검출 한도 내에서 오직 S,S 및 R,S 모나틴만이 생산된다.

[표 7]

[표 8]

고도로 R-특이성인 알돌라제, 예로서, 서열 번호: 28의, 알돌라제 활성을 갖는 폴리펩티드의 경우, 총 모나틴의 생산량은 더 적고, 알돌라제의 양을 증가시킴에 따라 총 모나틴(또한 S,S(%)도)은 증가한다. 이들 알돌라제는 사용되는 L-아미노트랜스퍼라제에 대하여 바람직한 기질인 S-MP 기질을 더 적은량으로 생산한다. R-특이성이 더 작은 효소, 예로서, ProA의 경우, 알돌라제를 증가시키는 것이 알돌라제를 유의적으로 개선시키지는 않는다. L-아미노트랜스퍼라제의 첨가량을 증가시킴에 따라 생산되는 S,S 모나틴(%)은 감소한다. 상기 분석에 기초하여, 서열 번호: 8의, 알돌라제 활성을 갖는 폴리펩티드는 R-특이성에 있어서 ProA와 서열 번호: 28의, 알돌라제 활성을 갖는 폴리펩티드 사이에 존재하며, 이는 R-MP(%)이 알돌 단계에 대해서만 단독으로 측정된 경우인 상기 데이타와 일치한다.

서열 번호: 27의 서브클로닝

하기 프라이머를 사용하여 알돌라제 유전자를 PCR 증폭시켰다: 5'-gaggagctcgagtcagacgtatttcagtcctttttc-3'(서열 번호: 385) 및 5'-agaagacatatgatttatcagccggggac-3'(서열 번호: 386). 알돌라제 유전자 서열 번호: 27은 서열 번호: 28의, 알돌라제 활성을 갖는 폴리펩티드를 코딩한다. 생성된 PCR 산물은 XhoI 및 NdeI를 사용하여 분해함으로써 프라이머 내로 조작된 상기 부위를 절단하였다. 단편을 겔 정제하고(QIAquick Gel extraction Kit(캘리포니아주 발렌시아에 소재하는 Qiagen)), XhoI 및 NdeI로 분해된 pET28b와 결찰시키고(T4 DNA 리가제 사용), 겔 정제하였다. 결찰물을 TOP10F' 화학적 적격 세포로 형질전환시켰다. 플레이트 상에서 배양된 콜로니를 인서트에 대하여 스크리닝하고, 인서트를 포함하는 수개의 단리물은 DNA 서열 분석(매사추세츠주 비벌리에 소재하는 Agencourt)에 사용하였다.

서열 번호: 28의, 알돌라제 활성을 갖는 폴리펩티드의 정제

확인된 알돌라제 클론을 BL21 DE3 또는 BL21 DE3 pLysS 내로 형질전환시켰다. 적절한 항생제와 함께 밤새도록 배양시킨 배양물을 새로운 배지로 희석시키고(전형적으로 1:100), 37℃ 통기하에 ~0.6의 OD₆₀₀까지 배양하였다. 이어서, 배양물을 1mM IPTG로 배양하고, 30℃(통기하에)로 이동시키고, 밤새도록 연속하여 인큐베이션시켰다. 원심분리하여 세포를 수거하였다. 세포 펠릿은 전형적으로 냉동 해동 순환을 1회에 걸쳐 실시하여 세포 용해에 도움을 주었다. (제조사의 프로토콜에 따라) 벅버스터 및 벤조나제(위스콘신주 매디슨에 소재하는 Novagen)에서 세포 펠릿을 용해시켰다. 원심분리에 의해 세포 파편을 제거하였다. 제조사의 프로토콜에 따라 제조된 HisBind 칼럼(위스콘신주 매디슨에 소재하는 Novagen)에 조 단백질 추출물을 가하였다. 칼럼을 세척하고, 단백질은 제조사의 프로토콜에 따라 용리시켰다. PD-10 칼럼(G25 Sephadex, 뉴저지주 피츠카타웨이에 소재하는 GE Healthcare)을 사용하여 정제된 단백질을 탈염시켰다. 교환에 사용된 완충액은 50mM 인산칼륨(pH 7.5), 100mM NaCl, 4mM MgCl₂이었다. 정제된 단백질은 아미콘(Amicon) 원심분리 농축기(매사추세츠주 빌레리카에 소재하는 Millipore)로 농축시켰다.

실시예 9

서열 번호: 40, 서열 번호: 298, 서열 번호: 36, 서열 번호: 62, 서열 번호: 64, 서열 번호: 96, 서열 번호: 54, 서열 번호: 122, 서열 번호: 142, 서열 번호: 42, 서열 번호: 130, 서열 번호: 112, 서열 번호: 108, 서열 번호: 94, 서열 번호: 80, 및 서열 번호: 28의, 알돌라제 활성을 갖는 폴리펩티드에 대한 총 모나틴 생산 및 이성체 분포 비교

AT-103 트랜스아미나제(광범위한 특이성을 갖는 D-아미노트랜스퍼라제)를 바이오카탈리틱스(캘리포니아주 패서디나 소재)로부터 구입하고, 상기 효소 또는 실시예 7에서 생산된 재조합 효소를 HMG 알돌라제와의 커플링 반응에 사용하여 미국 공개 출원 번호 제20050282260호에 기재된 바와 같이 D-트립토판 및 피루베이트로부터 모나틴을 생산하였다. 서열 번호: 28의, 알돌라제 활성을 갖는 폴리펩티드(his-태깅됨)를 비교 목적으로 기준 알돌라제로서 사용하고, 실시예 8의 말단에 기술된 바와 같이 생산하고 정제하였다. 시험하는 기타 알돌라제를 단리하고, 상기 실시예 4에 기술된 바와 같이 형질전환시켰다.

각 알돌라제를 시험 용량으로 생산하기 위하여 25mL 배양물을, 암피실린(100㎍/mL)을 함유하는 LB 배지에서 OD₆₀₀가 대략 0.5가 될 때까지 배양하였다. 균주를 100μM의 IPTG로 유도하였다. 세포를 유도후 4시간 동안 배양하고, 벤조뉴클레아제를 사용하여 제조사(위스콘신주 매디슨에 소재하는 Novagen, Bugbuster reagent)의 프로토콜에 따라 세포 추출물을 제조하였다. 세포 추출물내 가용성 단백질을 바이오-래드 라보라토리즈 엑스페리온 자동화 전기영동 스테이션(캘리포니아주 허큘리스에 소재하는 Bio-Rad) 상에서 분리하고, 엑스페리온 소프트웨어버전 1.1.98.0을 사용하여 농도 및 발현율(%)에 대하여 분석하였다.

반응 혼합물 1mL당 하기를 첨가하였다: 대략 50㎍ 알돌라제(달리 언급하지 않는 한, 세포 추출물로 공급됨), 4mM MgCl₂, 50mg/mL D-트립토판, 2mg AT-103(캘리포니아주 패서디나에 소재하는 BioCatalytics), 200mM 피루브산나트륨, 100mM 인산칼륨 완충액(pH 7.5), 및 0.05mM PLP. D-트립토판은 상기 고농도에서 가용성은 아니지만, 이를 사용하여 포화량의 D-트립토판에서 반응을 일정하게 유지시킬 수 있었다. 실험을 2회 실시하였는데, 음성 대조군에는 어떤 알돌라제도 첨가하지 않았다. 샘플을 약하게 진탕시키면서 30℃에서 2시간, 및 밤새도록(17-20시간) 인큐베이션시켰다. 마그네슘 및 포스페이트에 의해 촉진된 비-효소 반응에 기인하여 알돌라제없이 밤새도록 진행된 경우, 소량의 모나틴이 생산된다. 이들 샘플의 경우, R,R 모나틴(%)에 대한 전형적인 값은 50%이다. 음성 대조군 값을 하기 나타낸 수로부터 감산하여 평균적인 결과 값을 나타낸다. 이들 방법을 사용하여 모나틴을 생산하였을 때 검출된 유일한 입체이성체는 R,R 및 S,R이다. R,R(%)을 하기에 열거하는데, 이는 역상 LC 피크 면적에 의해 측정되었다. 세포 추출물 및 정제된 서열 번호: 28의, 알돌라제 활성을 갖는 폴리펩티드를 2개월 동안 -20℃에서 저장한 후, 동일한 실험을 수행하였으며, 이때 실시예 8과 같이 50mM D-트립토판이 사용되었다. 다시 대략 50㎍이 사용된 서열 번호: 28의, 알돌라제 활성을 갖는 폴리펩티드를 제외하고, 알돌라제의 양을 2배로 하여 가하였다. 이들 결과는 표 9 우측에 나타낸다. 이성체 분포에 대한 FDAA 유도체화 결과는 괄호 안에 표시한다.

[표 9]

활성 비율에 기초하여, 특정 효소가 다른 알돌라제보다 저장시에 더욱 안정성이라는 것을 이해할 수 있다. 아마도 4-하이드록시-4-메틸 글루타메이트인 2차 산물 또한 이들 반응시에 형성될 수 있다. 상기 효소의 피크 면적 대 부산물을 비교하여 모나틴 생산에 대한 그의 특이성에 관하여 상기 효소의 순위를 결정하였다. 결과는 서열 번호: 122 > 서열 번호: 42 > 서열 번호: 80 > 서열 번호: 108 > 서열 번호: 96 > 서열 번호: 112 > 서열 번호: 130 > 서열 번호: 36 > 서열 번호: 94 > 서열 번호: 298 > 서열 번호: 40 > 서열 번호: 142 > 서열 번호: 54 > 서열 번호: 64 > 서열 번호: 28 > 서열 번호: 62의 알돌라제 활성을 갖는 폴리펩티드 순이었다.

초기 실험에 기초하여, 서열 번호: 298, 서열 번호: 54, 및 서열 번호: 42의, 알돌라제 활성을 갖는 폴리펩티드가 활성 수준과 생산된 R,R 모나틴(%)에 있어서 가장 유망한 것으로 보였다. his-태그를 포함하는 pET 발현 벡터 및 포함하지 않는 pET 발현 벡터 내로 상기 효소를 서브클로닝하였다.

서열 번호: 297, 서열 번호: 53, 및 서열 번호: 41의 클로닝.

클로닝에 사용된 프라이머:

[표 10]

서열 번호: 297, 서열 번호: 53, 및 서열 번호: 41을 PCR에 의해 증폭시키고, 적절한 효소(서열 번호: 297 및 서열 번호: 53을 함유하는 PCR 산물의 경우, NdeI 및 BamHI, 서열 번호: 41을 함유하는 PCR 산물의 경우, NcoI 및 BamHI)로 분해하고, 겔 정제하였다(QIAquick 겔 추출 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)). NdeI 및 BamHI로 분해된 pET28로 서열 번호: 297 및 서열 번호: 53을 개별적으로 결찰시키고, 겔 정제하였다. 서열 번호: 41은 NcoI 및 BamHI로 분해된 pET30에 결찰시키고, 겔 정제하였다. 결찰물을 TOP10 내로 형질전환시켰다. 콜로니를 인서트에 대하여 스크리닝하였다. 인서트를 포함하는 단리물은 DNA 서열 분석(매사추세츠주 비벌리에 소재하는 Agencourt)에 사용하였다.

알돌라제 정제

확인된 알돌라제 클론을 BL21 DE3 또는 BL21 DE3 pLysS 내로 형질전환시켰다. 적절한 항생제와 함께 밤새도록 배양시킨 배양물을 새로운 배지로 희석시키고(전형적으로 1:100), 37℃ 통기하에 ~0.6의 OD₆₀₀까지 배양하였다. 이어서, 배양물을 1mM IPTG로 배양하고, 30℃(통기하에)로 이동시키고, 밤새도록 연속하여 인큐베이션시켰다. 원심분리하여 세포를 수거하였다. 세포 펠릿은 전형적으로 냉동 해동 순환을 1회에 걸쳐 실시하여 세포 용해에 도움을 주었다. (제조사의 프로토콜에 따라) 벅버스터 및 벤조나제(위스콘신주 매디슨에 소재하는 Novagen)에서 세포 펠릿을 용해시켰다. 원심분리에 의해 세포 파편을 제거하였다. 제조사의 프로토콜에 따라 제조된 HisBind 칼럼(위스콘신주 매디슨에 소재하는 Novagen)에 조 단백질 추출물을 가하였다. 칼럼을 세척하고, 단백질은 제조사의 프로토콜에 따라 용리시켰다. PD-10 칼럼(뉴저지주 피츠카타웨이에 소재하는 GE Healthcare)을 사용하여 정제된 단백질을 탈염시켰다. 교환에 사용된 완충액은 50mM 인산칼륨(pH 7.5), 100mM NaCl, 4mM MgCl₂이었다. 정제된 단백질은 아미콘 원심분리 농축기(매사추세츠주 빌레리카에 소재하는 Millipore)로 농축시켰다.

정제된 알돌라제 시험

D-트립토판으로부터 R,R 모나틴을 생산할 수 있는 능력에 대하여 정제된 알돌라제를 시험하였다. 반응 혼합물 1mL당 하기를 첨가하였다: 대략 50㎍ 정제된 알돌라제, 4mM MgCl₂, 50mM D-트립토판, 0.5mg 정제된 B. 스파에리쿠스 D-아미노트랜스퍼라제, 200mM 피루브산나트륨, 100mM 인산칼륨 완충액(pH 7.5), 및 0.05mM PLP. 2시간째 및 밤새 배양된 것에서 샘플을 채취하였다. 결과를 표 11에 나타낸다.

[표 11]

출발 기질로서 L-트립토판을 사용하고, 미국 공개 출원 번호 제20050282260호에 기재된 바와 같이 생산되고 정제된 HexAspC 광범위한 특이성을 갖는 L-아미노트랜스퍼라제(0.5mg의 정제된 단백질)와 커플링시킴으로써 동일한 실험을 수행하였다. 총 모나틴 생산에 대한 결과를 하기 표 12에 나타내고(알돌라제가 존재하지 않는 배경 수준을 감산한다), S,S 모나틴(%)은 역상 LC 피크 면적에 기초하여 나타낸다. 400ppm를 넘는 수는 표준 곡선의 선형 범위 바깥쪽에 위치하고, 이는 대략적인 것이다.

[표 12]

이 데이타 및 상기의 R,R 모나틴 데이타는, 알돌라제 활성을 갖는 폴리펩티드가 하기 순서로 R-MP 특이성을 갖는다는 것을 나타낸다: 서열 번호: 28 > 서열 번호: 54 > 서열 번호: 298 > 서열 번호: 42.

실시예 10

서열 번호: 116, 서열 번호: 76, 서열 번호: 44, 서열 번호: 148, 서열 번호: 46, 서열 번호: 134, 서열 번호: 74, 서열 번호: 126, 서열 번호: 102, 서열 번호: 58, 서열 번호: 88, 서열 번호: 50, 서열 번호: 106, 서열 번호: 304, 서열 번호: 300, 및 서열 번호: 28의, 알돌라제 활성을 갖는 폴리펩티드에 대한 총 모나틴 생산 및 이성체 분포 비교

미국 공개 출원 번호 제20050282260호에 기술된 바와 같이 실시예 7에서 생산된 재조합 효소를 HMG 알돌라제와의 커플링 반응에 사용하여 D-트립토판 및 피루베이트로부터 모나틴을 생산하였다. 서열 번호: 28의, 알돌라제 활성을 갖는 폴리펩티드를 본 분석법에서 기준으로 사용하고, 실시예 8에 기술된 바와 같이 정제하였다.

각 알돌라제를 시험량으로 생산하기 위하여 25mL 배양물을 암피실린(100㎍/mL)을 함유하는 LB 배지에서 OD₆₀₀가 대략 0.5가 될 때까지 배양하였다. 배양물을 1mM의 IPTG로 유도하였다. 세포를 30℃로 이동시키고, 밤새도록 배양하였다. 세포 추출물은 제조사(위스콘신주 매디슨에 소재하는 Novagen)의 프로토콜에 따라 제조하였다(위스콘신주 매디슨에 소재하는 Novagen, Bugbuster Reagent). 벤조뉴클레아제 또한 첨가하였다. 세포 추출물내 가용성 단백질을 바이오-래드 라보라토리즈 엑스페리온 자동화 전기영동 스테이션(캘리포니아주 허큘리스에 소재하는 Bio-Rad) 상에서 분리하고, 엑스페리온 소프트웨어버전 1.1.98.0을 사용하여 농도 및 발현율(%)에 대하여 분석하였다.

반응 혼합물 1mL당 하기를 첨가하였다: 대략 50㎍ 알돌라제(달리 언급하지 않는 한, 세포 추출물로 공급됨), 4mM MgCl₂, 50mM D-트립토판, 0.5mg 정제된 B. 스파에리쿠스 D-아미노트랜스퍼라제, 200mM 피루브산나트륨, 100mM 인산칼륨 완충액(pH 7.5), 및 0.05mM PLP. 하기 언급하는 샘플에 디티오트레이톨("DTT")을 가하였다(최종 농도 2mM). 실험을 2회 실시하고. 샘플을 약하게 진탕시키면서 30℃에서 2시간 및 밤새도록(20시간) 인큐베이션시켰다. 평균적인 결과는 하기에 나타낸다. 이들 방법을 사용하여 모나틴을 생산하였을 때 검출되는 유일한 입체이성체는 R,R 및 S,R이다. R,R(%)은 하기에 열거하고, 이는 역상 LC 피크 면적에 의해 측정되었다.

[표 13]

총 모나틴 생산수는 1ppm 내지 200ppm 초과의 범위였고, R,R(%)는 0% 내지 99% 범위였다. 아미노트랜스퍼라제는 모든 알돌라제에 대하여 동일하였기 때문에, 알돌라제를 바꾸는 것이 모나틴 생산량과 생산된 모나틴의 입체이성체 분포, 둘 모두에 유의적인 영향을 미칠 수 있다. DTT(하기 샘플 내의 것으로서)가 총 모나틴 생산량을 증가시키는 것으로 보였다.

출발 기질로서 L-트립토판을 사용하고, 부분적으로 정제된 HexAspC 광범위한 특이성을 갖는 L-아미노트랜스퍼라제(0.5mg의 HexAspC)와 커플링시킴으로써 상기와 동일한 실험을 수행하였다. 총 모나틴에 대한 (2개의) 평균값을 하기 표 14에 나타내고(알돌라제가 존재하지 않는 배경 수준을 감산한다), S,S 모나틴(%)은 역상 LC 피크 면적에 기초하여 나타낸다. 400ppm 초과의 갯수는 표준 곡선의 선형 범위 바깥쪽에 위치하고, 이는 대략적인 것이다. 서열 번호: 28의 알돌라제 활성을 갖는 정제된 폴리펩티드를 기준으로서 사용하였다. 서열 번호: 304 및 서열 번호: 300의 알돌라제 활성을 갖는 정제된 폴리펩티드(식물로부터 유래)를 2mM DTT와 함께, 및 2mM DTT없이 사용하였다. 문헌 ((Shannon and Marcus)[The Journal of Biological Chemistry 237: 3342-3347, 1962])는 땅콩 HMG 알돌라제의 원래의 정제에서 환원제로서 머캅토에탄올을 사용하였다.

[표 14]

실시예 11

디티오트레이톨(DTT)이 모나틴 생산에 미치는 효과

추가 연구를 위해 실시예 10에서 수개의 효소를 선택하였다. 식물로부터 유래된 알돌라제는 환원제로서 DTT를 첨가하였을 때 개선된 것으로 나타났다. 환경 샘플로부터의 미생물로부터 유래된 알돌라제는 또한 높은 비율로 시스테인 잔기를 함유한다는 것에 주목하였다. 그러므로, DTT가 비-식물성 알돌라제에 대한 모나틴 생산도 증가시키는지 여부를 알아보기 위하여 추가 실험을 수행하였다.

반응 혼합물 1mL당 하기를 첨가하였다: 대략 50㎍ 알돌라제(달리 언급하지 않는 한, 세포 추출물로 공급됨), 4mM MgCl₂, 50mM D-트립토판, 2mg AT-103, 200mM 피루브산나트륨, 100mM 인산칼륨 완충액(pH 7.5), 및 0.05mM PLP. 하기 언급하는 샘플에 디티오트레이톨을 가하였다(최종 농도 2mM). 실험을 2회 실시하고. 샘플을 약하게 진탕시키면서 30℃에서 2시간 동안 인큐베이션시켰다. LC/MS/MS에 의해 측정된 총 모나틴에 대한 평균적인 결과는 하기에 나타내는데, 모나틴의 생산에 관한 배경(알돌라제를 함유하지 않는 대조군)을 감산하였다.

[표 15]

알돌라제를 함유하지 않는 대조군은 DTT를 포함한 경우 및 포함하지 않는 경우에서 10ppm의 총 모나틴을 생산하였는데, 이는 DTT가 부산물 환원에 의해 전반적인 반응에는 어떤 영향도 미치지 않으며, D-아미노트랜스퍼라제 활성에도 어떤 영향도 미치지 않는다는 것을 지시한다. 서열 번호: 46, 서열 번호: 58, 및 서열 번호: 28의, 알돌라제 활성을 갖는 폴리펩티드 모두 DTT 첨가시 유익한 것으로 나타났다. 서열 번호: 46의, 알돌라제 활성을 갖는 폴리펩티드가 가장 유익한 것으로 나타났는데, 2mM DTT로 활성이 대략 1.8배 높게 나타났다. 알돌라제 활성을 갖는 2개의 폴리펩티드는 DTT에 의해 저해되는 것으로 보인 반면(서열 번호: 116 및 서열 번호: 50), 서열 번호: 44의, 알돌라제 활성을 갖는 폴리펩티드의 경우, 실험상의 오류 이내에서는 어떤 효과가 관찰되지 않았다. 그러나, 사용된 각각의 알돌라제에 있어서 환원제를 제공함으로써 발생하는 잇점을 검출하기 위한 최적의 DTT 농도는 존재할 수 있다.

DTT 농도가 모나틴 생산에 미치는 효과를 연구하기 위하여 서열 번호: 88의, 알돌라제 활성을 갖는 폴리펩티드를 선택하였다. 상기와 같이 커플링 반응을 수행하였다. 결과를 도 15에 플롯팅한다. 본 분석법에서 최적의 DTT 농도는 첨가된 알돌라제의 양에 대하여 2.5 내지 5mM 사이였다. 흥미롭게도, DTT를 첨가하지 않은 경우, 모나틴 생산량은 거의 2.5mM DTT의 경우 만큼 높았지만, 차선적 양(0.5-1 mM)으로 DTT를 첨가하는 것 뿐만 아니라, 너무 많은 양의 DTT(20mM)를 첨가하는 것은 실제로는 저해성인 것으로 보인다.

실시예 12

서열 번호: 278, 서열 번호: 162, 서열 번호: 276, 서열 번호: 178, 서열 번호: 202, 서열 번호: 166, 서열 번호: 218, 서열 번호: 224, 서열 번호: 226, 서열 번호: 244, 서열 번호: 250, 서열 번호: 252, 서열 번호: 264, 서열 번호: 268, 서열 번호: 272, 서열 번호: 184, 서열 번호: 282, 서열 번호: 186, 서열 번호: 192, 서열 번호: 200, 서열 번호: 280, 서열 번호: 284, 서열 번호: 172, 서열 번호: 180, 서열 번호: 168, 서열 번호: 228, 서열 번호: 236, 서열 번호: 238, 서열 번호: 240, 서열 번호: 270, 서열 번호: 156, 및 서열 번호: 28의, 알돌라제 활성을 갖는 폴리펩티드에 대한 총 모나틴 생산 및 이성체 분포 비교

각 알돌라제를 시험량으로 생산하기 위하여 25mL 배양물을 암피실린(100㎍/mL)을 함유하는 LB 배지에서 OD₆₀₀가 대략 0.5가 될 때까지 배양하였다. 배양물을 1mM의 IPTG로 유도하였다. 세포를 30℃로 이동시키고, 밤새도록 배양하였다. 세포 추출물은 제조사(위스콘신주 매디슨에 소재하는 Novagen)의 프로토콜에 따라 벅버스터 시약을 사용하여 제조하였다. 벤조뉴클레아제 또한 첨가하였다. 세포 추출물내 가용성 단백질을 바이오-래드 라보라토리즈 엑스페리온 자동화 전기영동 스테이션(캘리포니아주 허큘리스에 소재하는 Bio-Rad) 상에서 분리하고, 엑스페리온 소프트웨어버전 1.1.98.0을 사용하여 농도 및 발현율(%)에 대하여 분석하였다.

반응 혼합물 1mL당 하기를 첨가하였다: 대략 200㎍의 서열 번호: 278, 서열 번호: 162, 서열 번호: 276, 서열 번호: 178, 서열 번호: 202, 서열 번호: 166, 서열 번호: 218, 서열 번호: 224, 서열 번호: 226, 서열 번호: 244, 서열 번호: 250, 서열 번호: 252, 서열 번호: 264, 서열 번호: 268, 서열 번호: 272, 서열 번호: 184, 서열 번호: 282, 서열 번호: 186, 서열 번호: 192, 및 서열 번호: 200의, 알돌라제 활성을 갖는 폴리펩티드 또는 50㎍의, 서열 번호: 280, 서열 번호: 284, 서열 번호: 172, 서열 번호: 180, 서열 번호: 168, 서열 번호: 228, 서열 번호: 236, 서열 번호: 238, 서열 번호: 240, 서열 번호: 270, 및 서열 번호: 156의, 알돌라제 활성을 갖는 폴리펩티드(달리 언급되지 않는 한 세포 추출물로서 공급), 4mM MgCl₂, 50mM D-트립토판, 0.5mg 정제된 B. 스파에리쿠스 D-아미노트랜스퍼라제, 200mM 피루브산나트륨, 100mM 인산칼륨 완충액(pH 7.5), 및 0.05mM PLP. 실험을 2회 실시하였다. 샘플을 약하게 진탕시키면서 30℃에서 2시간 및 밤새도록(20시간) 인큐베이션시켰다. 평균적인 결과는 하기에 나타낸다. 이들 방법을 사용하여 모나틴을 생산하였을 때 검출되는 유일한 입체이성체는 R,R 및 S,R이다. R,R(%)은 하기에 열거하고, 이는 역상 LC 피크 면적에 의해 측정되었다.

[표 16]

총 모나틴 생산수는 검출불가능한 것에서부터 600ppm를 넘는 범위였고, R,R(%) 범위는 61% 내지 100%였다. 아미노트랜스퍼라제가 알돌라제 모두와 동일하였기 때문에 알돌라제를 변화시키는 것이 생산된 모나틴의 양과, 생산된 모나틴의 입체이성체 분포, 둘 모두에 유의적인 영향을 미칠 수 있다.

출발 기질로서 L-트립토판을 사용하고, 미국 공개 출원 번호 제20050282260호에 기재된 바와 같이 생산되고 정제된 HexAspC 광범위한 특이성을 갖는 L-아미노트랜스퍼라제(0.5mg의 정제된 단백질)와 알돌라제(세포 추출물로서 공급됨)를 커플링시킴으로써 상기와 같은 실험을 수행하였다. 총 모나틴 생산에 대한 결과를 하기 표 17에 나타내고(알돌라제가 존재하지 않는 배경 수준을 감산한다), S,S 모나틴(%)은 역상 LC 피크 면적에 기초하여 나타낸다. 400ppm 초과의 갯수는 표준 곡선의 선형 범위 바깥쪽에 위치하고, 이는 대략적인 것이다. 표 12는 기준 R-특이 효소, 서열 번호: 28의 알돌라제 활성을 갖는 폴리펩티드에 대한 결과를 나타내며, 이는 동시에 분석되었다.

[표 17]

실시예 13

D-아미노 트랜스퍼라제를 사용한 인돌-3- 피루베이트로부터의 모나틴 생산

AT-103 트랜스아미나제는 바이오카탈리틱스(캘리포니아주 패서디나 소재)로부터 구입한 트랜스아미나제 라이브러리 중의 일부분이었고, 상기 효소는 C. 테스토스테로니로부터의 ProA 알돌라제를 사용하는 커플링 반응에서 모나틴을 생산하는 것에 대하여 시험하였다. 알돌라제는 WO 03/091396 A2에 기재되어 있는 바와 같이 제조하였다. AT-103은 아미노산 공여체로서 D-아미노산(예로서, D-글루타메이트, D-아스파테이트, 또는 D-알라닌)을 필요로 하는 것으로서, 바실러스 종으로부터 유래된 광범위한 특이성을 갖는 D-트랜스아미나제(E. C. 2.6.1.21)이다. 100mM 인산칼륨 완충액(pH 7.5, 100mM 아미노 공여체, 및 0.1mM PLP를 함유하는 키트에서 제공된 반응 완충액에 상기 효소와 추가의 성분/기질을 직접 첨가하였다. 1mL의 반응 완충액에 4mg 인돌-3-피루베이트, 20mg 피루베이트, 세포 추출물중의 것으로 제공되는 대략 50㎍의 ProA, 1㎕의 2M MgCl₂, 및 2mg의 아미노트랜스퍼라제 효소를 가하였다. 반응을 2회 실시하였다. 반응물을 약하게 진탕시키면서(100 rpm) 30℃에서 밤새도록 인큐베이션시켰다. 샘플을 여과하고, 실시예 1에 기술된 바와 같이 역상 LC/MS/MS 분석에 사용하였다. 본 결과는 AT-103 효소를 사용함으로써 대략 370㎍/mL 모나틴이 생산되었다는 것을 나타내었다. 추가로, 크로마토그래피 분리시 분해되는 2개의 입체이성체 풀의 피크 면적에 기초하여 S,R/R,S 대 R,R/S,S 모나틴의 비를 측정하기 위하여 본 결과를 분석하였다. AT-103에 의해 생산된 총 모나틴 중, 혼합된 이성체와 비교하여 69%가 R,R/S,S 모나틴이었다. 이러한 효소는, D-아미노산에 대하여 광범위한 특이성을 갖는 것으로 알려져 있는 WO 03/091396 A2에 기술된 바실러스 섭틸리스 DAT 효소와 상동성이다. 실시예 1에 기술된 바와 같은 FDAA 방법을 사용하여 키랄 분석을 실시하고, 이를 통해 D-아미노트랜스퍼라제는 예측된 바와 같이, 지배적으로는 R,R 모나틴과, 약간의 S,R 모나틴을 제조하였다는 것을 확인하였다. 기질로서 S,S 모나틴 또는 R,R 모나틴 또는 α-케토글루타레이트를 사용한 추가의 아미노산전이 실험을 통해 예측된 바와 같이 바이오카탈리틱스 효소가 4번 탄소의 D-배열에 대해 고도로 선택적이었다는 것을 확인하였다. 이들 실험에서, 기질로서 S,S 모나틴 및 α-케토글루타레이트를 사용한 반응에서는 어떤 글루타메이트도 검출되지 않았다.

AT-103(광범위한 D-트랜스아미나제) 및 ProA 알돌라제를 사용한 커플링 반응에서 부산물로서 생산되는 S,S 모나틴 또는 R,S 모나틴의 양을 감소시키기 위하여 제조사(위스콘신주 매디슨에 소재하는 Novagen)의 프로토콜에 따라 His-Bind 카트리지를 사용하여 알돌라제를 정제하였다. 정제된 효소는 바람직하게 세포 추출물에 존재할수 있는 야생형 L-아미노트랜스퍼라제 활성(예로서, 천연 E. 콜라이 AspC 또는 TyrB 활성)을 함유하지 않아야 한다. PD-10 칼럼(G25 Sephadex, 뉴저지주 피츠카타웨이에 소재하는 GE Healthcare)을 사용하여 이미다졸을 제거하기 위해 His-Bind 용리제를 탈염시키고, 50mM Tris-Cl(pH 7)에서 용리시켰다. 실험은 1mL 용량으로 2회에 걸쳐 수행하고, 이는 100mM 트리스-Cl 완충액(pH 7.8), 50㎍ ProA 알돌라제, 4mg 인돌-3-피루베이트, 1 또는 2mg D-아미노트랜스퍼라제, 200mM 피루브산나트륨, 2mM MgCl₂, 3mM 인산칼륨, 0.1mM PLP, 및 14.7mg의 D-글루타메이트를 함유하였다. 관을 약하게 진탕시키면서 30℃에서 인큐베이션시켰다. 2시간째의 시점에서 취하고, -20℃에서 즉시 냉동시켰다. 2시간째에 NaOH를 사용하여 5 내지 7-8로 pH를 조절하고, 분석물을 밤새도록 인큐베이션시켰다. 샘플을 여과하고, 실시예 1에 기술된 바와 같이 모나틴에 대하여 분석하였다. 2시간째의 샘플은 검출 가능한 양의 모나틴을 갖지 못했는데, 이는 아마도 pH가 낮았기 때문이다. 1 mg의 D-아미노트랜스퍼라제를 사용하였을 때, 밤새된 샘플은 대략 190ng/mL 모나틴을 함유하였는데, 대략 84%는 R,R 모나틴이고, 16%는 S,R 모나틴이었다. 2mg의 D-아미노트랜스퍼라제를 사용하였을 때, 540ng/mL 모나틴이 생산되었고, 대략 71%이 R,R 모나틴이었다.

100mM 인산칼륨(pH 7.5), 0.1mM PLP, 및 100mM D-글루타메이트를 함유하는, 바이오카탈리틱스 아미노트랜스퍼라제 완충액(캘리포니아주 패서디나에 소재하는 BioCatalytics)을 사용하여 유사한 실험을 수행하였다. 상기와 같이 고체 인돌-3-피루베이트 및 D-아미노트랜스퍼라제를 가하였다. ProA 알돌라제(50㎍), MgCl₂, 및 50mM 피루베이트를 스톡 용액으로부터 가하였다. 이러한 경우에는 어떤 pH 조정도 필요하지 않지만, 상기와 같이 분석물을 처리하였다. 음성 대조군은 단지 바이오카탈리틱스에서 공급받은 효소와 완충액만을 사용하여 수행하고, 이는 모나틴을 함유하지 않았다. 실험 결과는 하기 표 18에 나타낸다.

[표 18]

포스페이트 완충액에서의 모나틴 생산이 트리스 완충처리된 시스템에서의 생산보다 분명히 더 높다.

WO 03/091396 A2로부터의 클로닝된 B. 섭틸리스 DAT 활성과 바이오카탈리틱스 효소(AT-103)(캘리포니아주 패서디나에 소재하는 BioCatalytics)를 비교하기 위하여 추가의 분석을 실시하였다. 또한, B. 섭틸리스 dat 유전자를 pET30a 내로 서브클로닝시켜 His-6 태그를 제거하였다. WO 03/091396 A2에 기재된 바와 같이, 태깅되지 않은 효소 및 태깅된 효소를 BL21(DE3)에서 생산하였다. 세포 추출물을 제조하고, 총 단백질의 분석법을 실시하여 앞서 기술된 바와 같이 단백질 농도를 예측하였다. 500㎍ D-아미노트랜스퍼라제, 50㎍ ProA 알돌라제, 100mM 인산칼륨(pH 7.5), 3mM MgCl₂, 4mg 인돌-3-피루베이트, 200mM 피루브산나트륨, 7.35mg(50 mM) D-글루타메이트, 및 0.1mM PLP를 함유하는 2개의 1mL 반응을 수행하였다. 샘플을 1시간, 2시간, 및 밤새도록 30℃에서 인큐베이션시키고, LC/MS/MS 분석에 대하여 여과하였다. 실시예 1에 기술된 FDAA 유도체화 프로토콜에 의해 측정된 바, 샘플은 S,R 및 R,R 모나틴의 입체이성체만을 함유하였다. 본 결과는 하기 표 19에 요약한다. RR(%)은 역상 크로마토그래피에 의해 분리된 피크 면적에 의해 측정하였다.

[표 19]

HIS-6 태그를 제거하는 것이 B. 섭틸리스 D-아미노트랜스퍼라제의 활성을 향상시키는 것으로 보인다; 그러나, 바이오카탈리틱스 D-아미노트랜스퍼라제 상동체가 뚜렷하게 가장 높은 활성을 가졌다. 바이오카탈리틱스 D-아미노트랜스퍼라제 상동체는 또한 R-모나틴 전구체에 대해 보다 큰 기질 특이성을 나타내었다. 인큐베이션시간을 증가시키는 것이 생산되는 에난티오머 과량의 R,R 모나틴을 감소시키는 것으로 보인다.

바실러스 D-아미노트랜스퍼라제 효소는 아미노 수용체로서 피루베이트를, 아미노 공여체로서 D-알라닌을 선호하기 때문에, MP를 모나틴으로 전환시키기 위해서 D-알라닌을 아미노 공여체로서 사용할 수 있고, 이는 유사하거나 그보다 우수한 결과를 초래할 것으로 예측된다. 500㎍ D-아미노트랜스퍼라제, 50㎍ 정제된 ProA 알돌라제, 100mM 인산칼륨(pH 7.5), 3mM MgCl₂, 4mg 인돌-3-피루베이트, 100mM 피루브산나트륨, 25mM D-글루타메이트 또는 D-알라닌, 및 0.1mM PLP를 함유하는 2개의 1mL 반응을 수행하였다. 샘플을 2시간 동안 인큐베이션시키고, 분석하기 전에 상기와 같이 처리하였다. D-알라닌을 아미노 공여체로서 사용하였을 때, 예측된 바와 같이 약간 더 높은 수준의 모나틴이 생산되었다(23 대 21ppm). 추가로, 고농도의 피루베이트가 아미노전이 단계를 저해할 수 있고, 따라서, 시간이 경과함에 따라 보다 소량의 피루베이트를 투여하는 것이 전반적인 모나틴 생산 속도를 향상시킬 수 있을 것으로 예측된다. ½의 피루베이트를 사용한 경우에도, 이 경우에는 상기 표와 비교할 때 유의적으로 더 많은 모나틴이 생산되었다는 것을 상기 데이타로부터 이해할 수 있다. AT-103은 S-MP에 대한 제한된 활성을 갖는 효소의 일례이다. 본 연구에서 사용된 ProA 알돌라제는 90-95% 초과의 S-MP를 제조하지만, AT-103은 92% 이상의 R,R 모나틴을 제조한다.

실시예 14

D-트립토판으로부터의 R,R 모나틴 생산

반응 혼합물 1mL당 하기를 가하였다: 대략 60㎍ C. 테스토스테로니 ProA 알돌라제(세포 추출물중의 것으로 제공됨, WO 03/091396 A2에 기재되어 있는 바와 같음), 4mM MgCl₂, 50mM D-트립토판, 0.5mg 바이오카탈리틱스 D-아미노트랜스퍼라제(AT-103)(캘리포니아주 패서디나에 소재하는 BioCatalytics), 100mM 피루브산나트륨, 100mM 인산칼륨 완충액(pH 7.5) 또는 100mM 아세트산나트륨 완충액(pH 8), 0.05mM PLP, 3mM 인산칼륨(오직 아세테이트 반응에만), 및 10mM α-케토글루타레이트. 실험을 2회 실시하였는데, 음성 대조군에는 어떤 알돌라제도 첨가하지 않았다. 샘플을 약하게 진탕시키면서 30℃에서 밤새도록(20시간) 인큐베이션시켰다. 아세트산나트륨 샘플의 실제 pH는 대략 5인 반면, 포스페이트 완충처리된 샘플의 최종 pH는 대략 7이었다. pH 5에서는 어떤 알돌라제도 유의적인 활성을 갖지 못한 것으로 보였고, ProA 알돌라제를 함유하는 샘플은 음성 대조군보다는 약간 높았지만, 가능하게는 실험상의 오류보다는 높지 않았다. 인산칼륨에서, ProA 알돌라제는 1의 .7:1 R,R:S,R의 비율로 73.4ppm 모나틴을 생산하였다(D-트립토판으로부터 ~63%).

바실러스 D-아미노트랜스퍼라제 효소는 아미노 수용체로서 피루베이트를, 아미노 공여체로서 D-알라닌을 선호하기 때문에, D-트립토판으로부터 R,R 또는 S,R 모나틴을 생산할 때 알파-케토글루타레이트를 첨가할 필요는 없는 것으로 예측된다. 정제된 ProA 알돌라제(50-60㎍)를 사용하고, 인큐베이션 시간을 2.5시간으로 하여 상기 실험을 반복하였다(100mM 인산칼륨 완충액에서). 알파-케토글루타레이트를 포함하는 것과 포함하지 않는 것으로 하여 이중으로 실험을 실시하였다. 10mM 알파-케토글루타레이트를 첨가한 경우, D-트립토판으로부터 56.1ppm 모나틴이 형성되었다(79.5% R,R, 20.5% S,R). 알파-케토글루타레이트를 포함하지 않을 경우, 102.5ppm 모나틴이 형성되었다(79% R,R, 21% S,R).

실시예 15

트립토판 라세마제

출발 물질로서 D-트립토판을 사용하였을 때, D-아미노트랜스퍼라제 및 알돌라제의 사용으로 R,R-모나틴이 생산되었다(실시예 14). 그럼에도 불구하고 L-트립토판은 몇가지 이유에서 바람직한 출발 물질이 될 수 있다. 예를 들면, L-트립토판은 가격이 저렴하고, D-트립토판보다 더 손쉽게 사용할 수 있다. 본 개시는 활성 판 라세마제를 수득하기 위한 수개의 방법을 기술한다. R,R 모나틴의 수율은, R-특이 알돌라제, 즉, R-MP를 우선적으로 또는 선택적으로 생산하는 알돌라제를 사용함으로써 개선된다. 도 3은 트립토판 라세마제, D-아미노트랜스퍼라제 및 R 특이 알돌라제를 사용하여 L-트립토판으로부터 입체이성체적으로 증폭된 R,R 모나틴을 생산하는 방법을 도시한다.

트립토판 라세마제의 선별은 성장을 위해 활성 라세마제를 필요로 하는 균주를 작제함으로써 이루어진다. 트립토판 영양 요구성 균주는 최소 배지에서 배양될 때 L-트립토판 공급원을 필요로 한다. 배지에 D-트립토판을 보충해 주는 것이 D-트립토판을 L-트립토판으로 전환시키는 라세마제를 선별하는 한가지 방법이다. 트립토판 영양 요구성 균주를 D-트립토판으로 보충된 최소 배지상에서의 성장에 대해 시험하였다. 콜라이 제네틱 스톡 센터(Coli Genetic Stock Center)로부터 입수한 균주 CAG 18455 및 CAG 18579 및 NRRL12264(또한, lipA ^- , λDE3용원화되고, 그의 플라스미드로 치유된 것)는 D-트립토판이 보충되었을 때에는 성장하지 못했지만, L-트립토판이 보충되었을 때에는 성장하였다. E. 콜라이가 숙주 유기체로서 사용될 수 있지만, 기타 숙주 유기체, 예로서, 효소, 기타 박테리아, 또는 다른 진핵 유기체들이 사용될 수 있다. 트립토판 영양 요구성 균주(구체적으로, NRRL 12264(또한, lipA ^- , λDE3용원화되고, 그의 플라스미드로 치유된 것))는 D-아미노트랜스퍼라제로 형질전환되었을 때에는 D-트립토판 상에서 성장할 것이다. 이는 D-트립토판을 세포 내로 수송할 수 있는 E. 콜라이의 능력을 확인시켜 준다.

(Salcher 및 Lingens)는 슈도모나스 아우레레오파시엔스(ATCC 15926)내 트립토판 라세마제가 존재한다고 기술하였다. 트립토판 라세마제는 또한 담배, 비트, 토마토, 및 소맥을 비롯한 수개의 식물에 있는 것으로 기술된 바 있으며, 상기 효소는 삼투압 또는 가뭄이라는 조건에 의해 유도되는 것으로 보인다. 트립토판 라세마제는 스클레로치톤 일리시폴리우스(Sclerochiton ilicifolius)의 천연 모나틴 생산 경로에서 중요한 역할을 할 수 있다. 이러한 라세마제 활성을 분리시키기 위하여, 발현 라이브러리를 ATCC 15926(또는 트립토판 라세마제 활성을 갖는 또다른 유기체)로부터 작제하고, 라이브러리를 트립토판 영양 요구성 균주 내로 형질전환시킨다. 트립토판 공급원으로서 D-트립토판을 사용하여 성장하는 균주에 대하여 선별한다. 유사한 방법을 사용하여 D-트립토판에서 활성을 갖는 라세마제를 찾기 위해 공지된 라세마제를 사용하여 다수의 균주를 스크리닝한다. 일례로 알라닌, 세린 및 글루타메이트 라세마제를 포함한다(문헌 [T. Yoshimura and N. Esaki, "Amino Acid Racemases: Functions and Mechanisms." Journal of Bioscience and Bioengineering, Vol. 96, No. 2, 103-109, 2003]). 알라닌 라세마제는 PLP 의존성이며, 살모넬라 티피뮤리움으로부터 클로닝된다(dadB 유전자). 다른 공급원은 에스케리키아 콜라이, 바실러스 섭틸리스, 슈도모나스 애루지노사, 비브리오 콜레라에, 시조사카로미세스 폼베, 및 바실러스 세레우스이다. 담자균 버섯인 렌티누스 에도데스 또한 광범위한 활성을 갖는 알라닌 라세마제를 함유한다. 세린 라세마제 또한 PLP 의존성이며, 진핵생물(예로서, 누에, 래트 뇌, 마우스 뇌 cDNA) 뿐만 아니라, 박테리아(엔테로코쿠스 갈리나룸(Enterococcus gallinarum))에서 발견된다. 글루타메이트 라세마제는 PLP 의존성이며, 페디오코커스 펜토사세우스(Pediococcus pentosaceus), 바실러스 푸밀루스, 락토바실러스 퍼멘티, 락토바실러스 브레비스, E. 콜라이, 아퀴펙스 파이로필러스, 및 바실러스 섭틸리스로부터 클로닝되었다. 글루타메이트 라세마제는 매우 특이적이며, 그 결과 구조상 유사한 아미노산인 아스파테이트, 아스파라긴, 및 글루타민도 상기 효소에 대한 기질은 되지 못한다. 아스파테이트 라세마제 또한 존재하며, PLP 비의존성이다. 이들 효소는 락토바실리(Lactobacilli), 스트렙토코쿠스(Streptococcus) 균주, 및 몇몇 원시박테리아 예로서, 디설프로코쿠스(Desulfurococcus) 및 써모코쿠스 균주에서 발견된다. 쌍각류 연체동물인 스카파르카 브로우토니이(Scapharca brouhtonii) 또한 아스파테이트 라세마제를 함유한다. 문헌상에 찾아볼 수 있는 다른 라세마제로는 아나베나 종 및 슈도모나스 스트리아타로부터의 아미노산 라세마제(EC 5.1.1.10), 프롤린 라세마제, 다기능성 페닐알라닌 라세마제를 포함한다. 관련 에피머라제 또는 라세마제 또한 시험한다. 잠재적인 라세마제를 시험하여 그들이 D-트립토판 아미노트랜스퍼라제가 아니라는 것을 확인한다. 이러한 스크리닝은 서열 분석 및/또는 효소 분석법에 의해 수행한다.

라세마제로서 시험을 통과한 효소를 실시예 17에 기술된 바와 같이 모나틴에 대한 활성에 관하여 스크리닝한다. 트립토판에 대해서는 매우 특이성이며, 모나틴에 대해서는 라세마제 활성을 거의 갖지 않거나 전혀 갖지 않는 효소를 수득하는 것이 이상적이다.

트립토판 라세마제는 또한 현존하는 라세마제, 트랜스아미나제, 또는 에피머라제로부터 진화 및/또는 개선될 수 있다(돌연변이 유발법 또는 재조합 조작을 통해). 추가로, 알라닌 아미노트랜스퍼라제에 대한 결정 구조는 공지되어 있기 때문에 이를 추론적인, 구조에 기초한 돌연변이 유발법에 대한 기초로서 사용할 수 있다. 상기 기술된 공정을 트립토판 라세마제 활성의 초기 선별법으로서, 및 향상된 활성에 대한 스크린으로서 사용한다.

트립토판 라세마제 라이브러리

라이브러리 작제 :

버홀더리아 피롤시나(Burkholderia pyrrocina)(ATCC15958) 및 슈도모나스 클로로라피스(Pseudomonas chlororaphis)(ATCC 15926)를 아메리칸 타입 컬쳐 컬랙숀(American Type Culture Collection)으로부터 입수하였다. 이는 ATCC에 의해 권고된 바와 같이 배양하고, 게놈 DNA를 문헌 [Mekalanos JJ. (Duplication 및mplification of toxin genes in Vibrio cholerae. Cell. 1983. 35:253-63)] 방법에 따라 제조하였다. Sau3AI 제한 효소를 사용하여 게놈 DNA를 부분적으로 분해하였다. 1-3Kbp 단편을 퀴아젠 퀴아퀵 겔 추출 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 겔 정제하였다. BamHI로 분해된 pTrc99a(뉴저지주 피츠카타웨이에 소재하는 Amersham) 내로 정제된 DNA를 결찰시키고, 상기와 같이 정제하였다. 인서트 대 벡터의 몰비를 3:1로 하여 실온에서 밤새도록 인큐베이션시켜 결찰을 수행하였다. 결찰된 라이브러리를 TOP10F' 화학적 적격 세포(캘리포니아주 칼스배드에 소재하는 Invitrogen)로 형질전환시키고, 100㎍/ml 암피실린을 함유하는 LB 배지에 플레이팅하였다. 형질전환 플레이트를 밤새도록 인큐베이션시킨 후, 액체 LB 배지로 세척된 플레이트로부터 콜로니를 탈거시키고, 적절한 크기의 세포 펠릿은 퀴아젠 퀴아퀵 미니프렙 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 소규모로 준비하였다. 대략 30,000개의 콜로니를 풀링하고, 소규모로 준비하였다.

풀링된 플라스미드를 CAG18455(trpC83::Tn10, rph -1) 또는 CAG18579(trpC:Tn10kan, rph -1) 내로 형질전환시켰다. 두개의 균주 모두 트립토판 영양 요구성 균주이기 때문에 M9 최소 배지(Difco)를 트립토판으로 보충하지 않을 경우, 상기 배지에서 성장하지 못할 것이다. 형질전환체를 트립토판으로 보충된 M9 최소 배지상에 플레이팅하였다. 이를 통해 D-트립토판을 L-트립토판으로 전환시킬 수 있는 균주를 선별한다.

라이브러리의 형질전환 이전에, L- 또는 D-트립토판을 함유하는 최소 배지에서의 성장에 대하여 균주를 시험하였다. D-트립토판으로 보충된 최소 배지에서의 성장에 대하여 균주를 시험하였는데, 어떤 성장도 관찰되지 않았다. D-트립토판 대신 L-트립토판으로 보충된 상기와 동일한 배지 상에서 두개의 균주 모두 성장하였다. 추가로, NRRL 12264의 유도체(기타 염색체 코딩 돌연변이(serB, Δ trpED, tnaA2, aroP)이외에도 트립토판 오페론 플라스미드로 치유되고, λDE3로 용원화되고, lipA에 대해 결실된 균주)(이러한 균주는 D-트립토판으로 보충된 최소 배지 상에서는 성장할 수 없지만, D-트립토판 대신 L-트립토판으로 보충된 상기와 동일한 배지 상에서는 성장하였다)를 L-트립토판으로 보충된 상기와 동일한 배지 상에서로부터의 D 특이 아미노트랜스퍼라제로 형질전환시켰다(WO 03/091396). D-아미노트랜스퍼라제의 발현은 T7 프로모터에 의해 유도되었다. 형질전환된 균주는 D-트립토판으로 보충된 M9 최소 배지 상에서 성장할 수 있었다.

D-트립토판 배지 상에서 성장하는 콜로니를 스크리닝한다. 플라스미드를 단리하고, 모체 균주(CAG1 8455 또는 CAG18579) 내로 재형질전환시켜 D-트립토판 배지 상에서의 성장이 플라스미드에 의존하는 것이지, 숙주 돌연변이에 의존하는 것이 아니라는 것을 확인한다. 트립토판 영양 요구성 균주에 상보적인 플라스미드의 뉴클레오티드 서열을 분석한다. 트립토판 라세마제 유전자를 함유하는 것으로 결정된 클론을 추가 분석한다.

기타 조직 공급원으로부터의 트립토판 라세마제를 유사한 방식으로 단리한다. 두개의 담배 조직 배양 세포(니코티아 나타바쿰 L. 변종(Nicotiana tabacum L. var.) 위스콘신 38(Wisconsin 38))(문헌 [Miura, G.A. and Mills, S.E. The conversion of D-tryptophan to L-tryptophan in cell cultures of tobacco. Plant Physiol. 1971. 47:483-487]) 및 소맥(트리티쿰 아에스티붐)의 조 단백질 추출물(문헌 [Rekoslavskaya, N. L, Yur'eve, O.V., Shibanova, L.A., and Salyaev, R.K. Synthesis and physiological function of D-tryptophan during wheat germination. Russian J. Plant Physiol. 1997. 44:196-203]), 모두에서의 트립토판 라세마제 활성에 대하여 보고된 문헌이 존재한다. cDNA 발현 라이브러리를 문헌에 기재되어 있는 바와 같이 조직으로부터 제조하고, 발현 라이브러리를 사용하여 상기 기술된 바와 같이 트립토판 영양 요구성 균주를 형질전환시킨다.

트립토판 라세마제 분석법

재조합 단백질 발현을 위해 통상 사용되는 E. 콜라이 균주, 예로서, BL21 내로 잠재적으로 트립토판 라세마제를 갖는 동정된 클론을 형질전환시킨다. 600nm에서의 광학 밀도가 0.4-0.6이 되도록 LB 브로쓰에서 세포를 배양한다. 라세마제 발현을 유도하는 프로모터를 IPTG(0.1mM 최종 농도)로 유도한다. 유도한 후, 세포가 37℃에서 1-3시간 동안(통기하에) 단백질을 발현할 수 있도록 한다. 세포를 수거하고, 프렌치 프레스(French press), 초음파 처리에 의해, 또는 화학적 수단(예로서, 벅버스터(위스콘신주 매디슨에 소재하는 Novagen))에 의해 용해시킨다. 용해된 세포를 원심분리하여 세포 파편을 제거한다. 정화된 추출물을 분석법에 직접 사용한다.

다양한 용량의 추출물을 용액에 가하여 최종 농도가 50mM 인산칼륨(pH 7.0) 및 2mM L-트립토판이 되도록 한다. 피리독살-5'-포스페이트를 최종 농도 10μM으로 가한다. 샘플을 인큐베이션시키고, LC/MS에 의해 분석한다. 기질로서 L-트립토판만을 사용한 경우, D-트립토판 피크가 존재하는 것은 양성 결과를 지시한다. D-트립토판 농도는 평형에 도달할 때까지 시간이 증가함에 따라 증가하여야 하고, 효소의 농도는 효소가 더이상 기질로 포화되지 못할 정도로 충분히 높을 때까지 단백질 농도가 증가함에 따라 속도 또한 증가하여야 한다. D-트립토판은 또한 상기와 같이 L-트립토판으로 전환될 수 있다.

보완 유전자는 D-아미노트랜스퍼라제를 코딩할 수 있다. "보완 유전자"는 발현되었을 때, 유기체에서 돌연변이를 무력화시키는 유전자이다. 예를 들면, 트립토판 합성을 위해 세포가 필요로 하는 유전자들 중 하나에 무효화 돌연변이를 유기체가 갖는다면, 보완 유전자는 발현되었을 때, 균주가 최소 배지(즉, 트립토판 무함유) 상에서 성장할 수 있도록 해주는 것일 수 있다. 이러한 반응은 아미노 수용체로서 알파-케토산 예로서, α-케토글루타레이트, 옥살로아세테이트, 또는 피루베이트를 필요로 한다. 이들 화합물은 세포 추출물내 (소량으로) 존재할 가능성이 있다. 이들 화합물은 PD-10 탈염 칼럼(뉴저지주 피츠카타웨이에 소재하는 GE Healthcare)을 사용하여 제거될 수 있고, 분석법은 조 추출물에서도 실시될 수 있다. 통상의 칼럼 크로마토그래피를 사용하여 트립토판 라세마제 활성을 정제한다.최종적으로, 잠재적인 트립토판 라세마제로서 동정된 오픈 리딩 프레임을 친화성 태그를 포함하는 발현 벡터 내로 클로닝시킨다. 이어서, 잠재적인 트립토판 라세마제를 친화성 크로마토그래피에 의해 정제한다. 어느 경우든, 정제된 단백질을 본질적으로 상기 기술된 바와 같이 효소 분석법에 사용한다.

트립토판 라세마제의 가역적 유전자 조작

황산암모늄 분별, 및 통상의 칼럼 크로마토그래피를 비롯한 통상의 단백질 정제 기법에 의해 식물 또는 미생물 공급원으로부터 트립토판 라세마제를 정제할 수 있다. 일단 스팟이 2-D 겔 상에서 단리될 수 있도록 단백질이 정제되었으면, 펩티드 미세서열 분석 기법 또는 통상의 에드만(Edman)형 아미노산 서열 분석을 사용한다(이러한 유형의 시험에 사용된 프로토콜 및 장비에 대한 설명은 golgi.harvard.edu/microchem/를 참조한다). 그러나, 몇몇 경우에 있어서, 유기체의 게놈 서열은 아직 확정된 것이 아니기 때문에 단백질 정제를 위한 단백질 공급원으로서 사용될 수 있다. 이러한 상황하에서, 제1 세트의 축퇴성 프라이머는 단백질 공급원과 가장 가까운 관계에 있는 것으로 알려져 있는 것으로부터 사용가능한 서열에 기초하여 디자인할 수 있다. 이어서, 확립된 프로토콜에 따라 축퇴성 PCR 및 게놈 워킹을 실시하여 트립토판 라세마제 코딩 서열을 분리한다.

트립토판 라세마제 모나틴 생산

반응 혼합물 1mL당 하기를 가하였다: 대략 60㎍ C. 테스토스테로니 ProA 알돌라제(세포 추출물중의 것으로 제공됨, WO 03/091396 A2에 기재되어 있는 바와 같음), 100㎕/mL 트립토판 라세마제 세포 추출물 또는 1 mg/mL 정제된 트립토판 라세마제, 4mM MgCl₂, 50mM L-트립토판, 0.5mg 바이오카탈리틱스 D-아미노트랜스퍼라제(AT-103)(캘리포니아주 패서디나에 소재하는 BioCatalytics), 100mM 피루브산나트륨, 100mM 인산칼륨 완충액(pH 7.5), 0.05mM PLP, 및 10mM α-케토글루타레이트. 피루베이트가 광범위한 특이성을 갖는 D-아미노트랜스퍼라제에 대하여 허용가능한 아미노 수용체가기 때문에 α-케토글루타레이트는 임의적이다. 실험을 2회 실시하였는데, 음성 대조군은 어떤 알돌라제도 첨가되지 않았거나, 어떤 트립토판 라세마제도 첨가되지 않았다. 샘플을 약하게 진탕시키면서 30℃에서 ~1시간 동안 또는 밤새도록(20시간) 인큐베이션시킨다.

트립토판 라세마제를 모나틴에 대한 활성에 대하여 시험한다. 실시예 17의 것과 유사한 분석법을 이용하는데, 기질로서는 모나틴을 사용하고, 이를 트립토판에 대한 효소 활성과 비교한다. 이상적인 효소는 트립토판에 대하여 활성을 갖지만, 기타 아미노산, 특히 글루타메이트 및 모나틴에 대해서는 활성을 거의 갖지 않거나 전혀 갖지 않는다. 효소가 모나틴에 대하여 유의적인 활성을 가질 경우, 상기 효소는 트립토판 활성을 변하지 않도록 유지시키거나 트립토판 활성을 효소가 모나틴 생산에 유용할 정도로 충분히 높은 수준으로 유지되도록 하면서 글루타메이트 및/또는 모나틴에 대한 활성을 감소시키기 위하여 돌연변이될 수 있다. 돌연변이 유발법에 사용될 수 있는 기법은 오류 빈발 PCR, 위치 지정 돌연변이 유발법, 위치 지정 돌연변이 유발 표적(기질 결합에 관여할 수 있는 부위)를 동정하는 모델링, 계대 돌연변이 유발성 균주, 및 DNA 셔플링을 포함하나, 이에 한정되는 것은 아니다.

돌연변이화된 라세마제를 상기 기술된 바와 같이 플리에트 분석법을 이용하여 트립토판 활성에 대하여 스크리닝할 수 있다. 이어서, 트립토판 활성을 갖는 클론을 모나틴에 대한 활성 손실에 대하여 스크리닝한다.

실시예 16

HEXaspC 의 위치 지정 돌연변이 유발법

실험 개관

WO 03/091396 A2의 실시예 6에 기재된 바와 같이 S,S 모나틴 생산에 대하여 AspC와 비교하였을 때 E. 콜라이 AspC의 헥사돌연변이체(HEXaspC)가 더 우수한 활성을 갖고 있는 것으로 밝혀졌다. HEX(수탁번호:/AHFA gi: 127190)는 AspC로부터 하기 돌연변이를 함유한다(E. 콜라이 번호 매김): V35L, K37Y, T43I, N64L, T104S, 및 N285S. 구조상의 분석과 문헌 보고(문헌 ([S. Rothman and J. Kirsch, J. Mol. Biol. (2003), 327, 593-608]; [S. Rothman et al, Protein Science (2004), 13: 763-772]))에 기초하여, 모나틴 생산 경로에서 사용되는 기질: L-트립토판, S-MP, 또는 둘 모두에 대한 역학적 활성을 증가시키는 것으로 예측되는 5개 초과의 돌연변이체를 형성하였다. 상기 돌연변이체들 중 2개가 트립토판 및 S,S 모나틴, 둘 모두에 대한 아미노산 전이 속도를 증가시켰다. 상기 돌연변이체들 중 2개가 S,S 모나틴 형성에 대하여 입체선택성이 증가된 것으로 나타난 반면, 하나는 입체선택성이 더 작았다. 이에 기초하여, 유사한 돌연변이를 갖는, 바실러스 종으로부터의 광범위한 특이성을 갖는 D-아미노트랜스퍼라제가 도 3에 나타내고, 실시예 15에 기술된 것과 같은 R,R 모나틴 경로에서 D-아미노트랜스퍼라제로서 유용할 것으로 예측된다. 돌연변이체 중 하나(HEXaspCP9T/R122G)는 L-트립토판 아미노전이에 대하여 활성이 증가되었지만, S,S 모나틴 생산 또는 S,S 모나틴 아미노전이에서의 활성은 현저히 감소하였다. 따라서, 이러한 효소는 도 1, 2, 4, 5, 6, 7, 및 8에 나타내고, 실시예 18 및 19에 기술된 것과 같은 R,R 모나틴 생산 경로의 제1 단계에서 유용할 것으로 예측된다. 일반적으로, L-트립토판에 대하여 AspC와 유사한 활성을 갖고, R-MP 및 S-MP에 대하여 제한된 활성을 갖는 아미노트랜스퍼라제가 도 1, 2, 4, 5, 6, 7, 및 8에 도시한 과정에 유용할 것이다.

방법 및 재료

pUC19에서 클로닝된 HEX 유전자는 (J. F. Kirsch) 교수(캘리포니아주 버클리에 소재하는 캘리포니아 대학(버클리) 분자 및 세포 생물학과, CA 94720-3206)로부터 제공받고, pET23a 내로 유전자를 클로닝하기 위한 주형으로서 사용하였다. 문헌 [James J. Onuffer and Jack F. Kirsch, Redesign of the substrate specificity of Escherichia coli aspartate aminotransferase to that of Escherichia coli tyrosine aminotransferase by homology modeling and site-directed mutagenesis, Protein Science, 4: 1750-1757 (1995)]을 참조한다. 또한, NCBI 수탁번호 1AHF_A GI:1127190(HEX 아미노산 서열)을 참조한다. HEX 유전자를 pET23a 벡터(위스콘신주 매디슨에 소재하는 Novagen) 내로 클로닝하기 위하여 하기 프라이머를 디자인하였다:

HEXaspC 프라이머:

N 말단: 5 '-GCGGAACATATGTTTGAGAACATTACCGCC-3'(서열 번호: 393);

C 말단: 5 '-ATAACCGGATCCTTACAGCACTGCCACAATCG-3'(서열 번호: 394)

유전자 증폭을 위해 하기 PCR 프로토콜을 사용하였다: 100㎕의 반응물중, 50ng DNA 주형, 1.0μM의 각 프라이머, 0.2mM의 각 dNTP, 1U Pfu Turbo 폴리머라제(캘리포니아주 라호야에 소재하는 Stratagene), 및 1X 클로닝된 Pfu 완충액을 가하였다. 사용된 열순환기 프로그램은 5분 동안 94℃에서 가열 개시한 후; 94℃(30초)에서 변성 단계, 55℃(1분)에서 어닐링 단계, 및 72℃(2분)에서 신장 단계, 및 최종적으로 72℃(7분)에서 종결 단계인 것을 25회 반복. 표준 분자 생물학 기법을 사용함으로써 NdeI 및 BamHI 제한 부위를 사용하여 PCR 산물을 pET23a 내로 클로닝하였다.

130번 위치의 트립토판 잔기는 피리독실 환과의 적층 상호작용에 중요한 것으로 간주될 뿐만 아니라, 단백질 모델링 관찰에 기초하여, S-모나틴 전구체(MP) 기질과의 입체 장애의 원인이 되는 것으로 보인다. 그러므로, 트립토판을 대체하기 위해서 보다 작은 소수성 측쇄(페닐알라닌)를 갖는 아미노산을 사용하였다. 바람직한 돌연변이의 새로운 조합이 이루어질 수 있지만, 나머지 돌연변이는 문헌상의 역학 데이타에 기초를 두었다. 제조사의 설명서에 따라 스트라테이진 멀티-체인지 키트(Stratagene Multi-Change Kit)(캘리포니아주 라호야에 소재하는 Stratagene)를 사용하여 W130F를 제외한, HEXaspC에 대한 모든 돌연변이를 제조하였다. W130F 돌연변이는 PCR 반응의 신장 온도를 66℃로 감소시켰다는 것만을 예외로 하여, 제조사의 설명서에 따라 스트라테이진 퀵체인지 키트(캘리포니아주 라호야에 소재하는 Stratagene)를 사용하여 제조하였다. W130F 단일 돌연변이 프라이머를 제외한 멀티-체인지 키트용 프라이머는 <www.stratagene.com> 상의 퀵체인지 멀티-키트 프라이머 디자인 도구를 사용하여 디자인하였다.

프라이머 서열을 하기 표 20에 열거한다.

[표 20]

HEXaspC 돌연변이체 유전자의 발현 및 효소 활성 분석

노바젠 오버나이트 익스프레스™ 오토인덕션 시스템 2(Novagen Overnight Express™ Autoinduction System 2)(카탈로그 번호 71366-3; 용액 1-6)(위스콘신주 매디슨에 소재하는 Novagen)의 액체 배양물(5mL)을 새 플레이트 또는 하기 균주들의 냉동 글리세롤 스톡으로부터 접종하였다:

E. 콜라이 BL21(DE3)::HEXaspCpET23a

E. 콜라이 BL21(DE3)::HEXaspCW130FpET23a

E. 콜라이 BL21(DE3)::HEXaspCT156ApET23a

E. 콜라이 BL21(DE3)::HEXaspCP9T/T156ApET23a

E. 콜라이 BL21(DE3)::HEXaspCP9T/R122GpET23a

E. 콜라이 BL21(DE3)::HEXaspCR122G/T156ApET23a.

배양물을 6-8시간 동안 230rpm으로 37℃하에 인큐베이션시켰다. 각 배양물의 OD₆₀₀을 측정하고, 25mL중 0.03-0.05의 OD₆₀₀을 수득하는데 필요한 배양물의 용량을 계산하였다. 계산된 용량의 각 액체 배양물을 25mL의 동일한 배지를 함유하는 플라스크로 옮겨 놓았다. 오버나이트 익스프레스™ 오토인덕션 시스템 2는 락토스를 유도제로서 사용하고, 세포 성장을 모니터하는 것을 필요로 하지 않는 IPTG-유도성 발현 시스템을 포함하는, 고수준의 발현을 위한 완전 합성 배지(complete, chemically defined medium)이다. 오버나이트 익스프레스 배양물을 18시간 동안 230rpm으로 진탕시키면서 3O℃하에 인큐베이션시켰다. 원심분리하여 세포를 수거하고, 냉 50mM MOPS(pH 7.0)으로 1회 세척하였다. 이어서, 노바젠에 의해 권고된 프로토콜에 따라 1㎕/mL 벤조나제 뉴클레아제(Novagen 카탈로그 번호 70746-3)(위스콘신주 매디슨에 소재하는 Novagen), 5㎕/mL 프로테아제 저해제 칵테일 세트 II(Novagen 카탈로그 번호539132)(위스콘신주 매디슨에 소재하는 Novagen) 및 0.33㎕/10mL r-리소자임(Novagen 카탈로그 번호 71110-3)(위스콘신주 매디슨에 소재하는 Novagen)을 함유하는 벅버스터™(1차 아민 무함유)(Novagen 카탈로그 번호 70923-3)(위스콘신주 매디슨에 소재하는 Novagen)을 사용하여 세포를 용해시켰다. 약하게 진탕시키면서 15분 동안 25℃에서 인큐베이션시킨 후, 4℃에서 15분 동안 21,00Oxg로 원심분리하여 각 현탁액으로부터의 세포 파면을 펠릿화하였다. 주의해서 상등액을 따라내고, 무세포 추출물로서 분석하였다. 30% 벅버스터™(1차 아민 무함유) 추출 시약에 세포 파편 분획을 현탁시키고, 10분 동안 21,000xg로 원심분리하고; 원심분리된 펠릿을 10% 벅버스터™(1차 아민 무함유) 추출 시약에 현탁시키고, 다시 원심분리하여 세척된 펠릿을 분리함으로써 봉입체 분획을 단리하였다. 4-15% 구배 겔상의 SDS-PAGE(BioRad 번호 161-1104, 캘리포니아주 허큘리스 소재)에 의해 무세포 추출물 및 봉입체 분획을 단백질 발현에 대하여 분석하였다. 세포 추출물 샘플에 대하여 20㎍의 가용성 단백질을 (1X 단백질 로딩 완충액과 프리믹스되고 5분 동안 95℃에서 가열된) 각각의 겔 레인에 로딩하였다. 봉입체 분획을 1X 단백질 로딩 완충액(0.2mL)에 용해시키고, 10분 동안 95℃에서 가열하고, 5㎕의 각 용액을 각 겔 레인에 대하여 로딩하였다. 각 레인으로 로딩된 총 가용성 단백질과 비교한 각 HEX 돌연변이체의 양을 랩워크 바이오이매징(Labworks BioImaging) 1D-겔 도구(캘리포니아주 업랜드에 소재하는 UVP, Inc.)를 사용하여 밴드 강도 분석에 의해 계산하였고, 이를 하기에 기록한다:

[표 21]

겔 분석을 통해 HEXaspCR122A/T156A 돌연변이체가 봉입체로서 상당량으로 발견된 유일한 단백질이었다는 것이 나타났다. HEXaspCP9T/T156A 단백질은 가장 높은 수준의 발현을 제공하는데, HEXaspC 단백질과 비교하여 대략 90% 더 우수하였다. 대조적으로, W130F, T156A 및 P9T/R122G 단백질은 HEXaspC 단백질보다 낮은 수준으로 발현하였다.

S,S-모나틴의 생산에 대한 HEXaspC 돌연변이체 단백질의 활성은 하기 반응 조건을 사용하여 측정하였다: 각 1mL 반응물은 50mM TAPS(pH 8.2), 4mM MgCl₂, 3mM 인산나트륨(pH 8.0), 200mM 피루브산나트륨(pH 8로 조절), 5mM α-케토글루타레이트(pH 8로 조절), 50mM 트립토판, 0.05mM 피리독살 3-포스페이트, 50㎍/mL Pro A 알돌라제(무세포 추출물로서 첨가) 및 다양한 농도(대략 50 내지 500㎍/mL)의 아미노트랜스퍼라제(무세포 추출물로서 첨가)를 함유하였다. 탈기수를 사용하여 스톡 용액을 제조하고, 반응 혼합물의 용량을 1.0mL로 조정하였다. 효소를 첨가하기 직전에 피리독살 포스페이트를 가하였다. 반응물을 함유하는 관을 4시간 동안 약하게 진탕시키면서 3O℃에서 인큐베이션시켰다. 효소를 첨가한 후, 1시간, 2시간, 및 4시간째에 샘플(0.01mL)을 회수하고, 여과하고, 실시예 1에 기술된 바와 같이 LC/MS/MS에 의해 분석하였다. 반응물에 존재하는 아미노트랜스퍼라제의 양에 기초하여 모나틴 생산을 정규화하였다. 이들 분석 조건하에서 HEXaspC 및 HEXaspCT156A는 아미노트랜스퍼라제 1 mg당 가장 많은 총 모나틴을 생산한 반면, P9T/R122G 단백질은 가장 적은 양을 생산하였고, 그 다음은 HEXaspCW130F였다. HEXaspCW130F 및 P9T/R122G 효소는 고농도(300㎍/mL 초과)로 효소가 사용된 경우에도 S-MP에 대하여 가장 큰 입체선택성을 나타내었다(98% 초과의 S,S-모나틴). S,S-모나틴 산물(%)은 고농도로 P9T/T156A 효소를 함유하는 효소 반응에서 90% 미만으로 감소하였다. 기타 돌연변이체는 원래의 HEXaspC 돌연변이체와 매우 유사한 산물 입체선택성을 나타내었다(대략 95% S,S-모나틴). 실시예 1에 기술된 FDAA 유도체화 시약을 사용하여 HEXaspC 효소를 함유하는 반응 산물을 분석한 결과 두번째로 형성된 입체이성체는 R,S-모나틴인 것으로 나타났다.

트립토판 및 모나틴 아미노트랜스퍼라제 활성 분석

기질로서 S,S 모나틴 및 L-트립토판을 사용하여 돌연변이체를 아미노전이 활성에 대하여 시험하였다. 실시예 1에 기술된 바와 같이 OPA-포스트-칼럼 유도체화와 함께 HPLC에 의해 반응의 공-산물인 글루타메니트의 형성을 따라 아미노트랜스퍼라제 활성을 측정하였다. 1.0mL 반응 혼합물내 100mM HEPPS 완충액(pH 8.0), 20mM 알파-케토글루타레이트, 0.08mM 피리독살 포스페이트, 25mM 트립토판 또는 S,S 모나틴, 및 효소(세포 추출물중 2.5mg의 단백질로서 공급됨)를 함유하였다. 효소를 제외한 모든 성분들을 함께 혼합하고, 효소를 가하고 반응을 개시하고 반응 용액을 90분 동안 3O℃에서 (약하게 진탕시키면서) 인큐베이션시켰다. 2회에 걸쳐 반응을 수행하고, 음성 대조군에는 어떤 효소도 첨가하지 않았다. 10% 포름산(최종 농도)을 가하여 반응을 종결시키고, 혼합물을 21,000rpm으로 원심분리하고, 주의하여 상등액을 제거하고, 여과하였다. 데이타를 글루타메이트의 배경 수준에 대해, 그리고 단백질을 침전시키기 위하여 산을 첨가한 것으로부터의 희석액에 대해 보정한 후, 첨가한 돌연변이체 아미노트랜스퍼라제의 양에 의해 정규화시켰다. 기질로서 트립토판을 사용한 경우, HEXaspC는 시간당 1 mg의 아미노트랜스퍼라제에 대하여 13.0mM 글루타메이트를 생산하였다. 돌연변이체의 상대 활성은 백분율로 표시하면 하기와 같다: HEXaspCW130F(156%), HEXaspCT156A(151%), HEXaspCP9T/T156A(63.7%), HEXaspCP9T/R122G(116%), 및 HEXaspCR122G/T156A(107%). 기질로서 S,S 모나틴을 사용한 경우, HEXaspC는 시간당 1 mg의 아미노트랜스퍼라제에 대하여 7.43mM 글루타메이트를 생산하였다. 돌연변이체의 상대 활성은 백분율로 표시하면 하기와 같다: HEXaspCW130F(113%), HEXaspCT156A(87.7%), HEXaspCP9T/T156A(67.3%), HEXaspCP9T/R122G(11.2%), 및 HEXaspCR122G/T156A(114%).

HEXaspCP9T/R122G 돌연변이체는 트립토판을 인돌-3-피루베이트로 전환시키는 활성은 증가시켰지만, S,S 모나틴 아미노전이에 대한 활성은 감소시켰다. HEXaspC에 대한 비인 1.75와 비교하여 트립토판 대 모나틴 활성의 비는 18.2였는 바, 이로써, 예를 들면, 실시예 18 및 19에 기술된 경로와 같이 L-아미노트랜스퍼라제를 필요로 하는 경로를 사용하여 R,R 모나틴의 생산을 위한 바람직한 후보가 된다. 그 자체로서, HEXaspCP9T/R122G는 S,S 모나틴(및 MP)에 대하여 제한된 활성을 갖는 아미노트랜스퍼라제의 일례이다.

대부분의 돌연변이는 L-트립토판 활성을 향상시켰지만, 오직 2개의 돌연변이체만은 L-트립토판 및 S,S 모나틴, 둘 모두에 대하여 활성을 증가시켰다(HEXaspC W130F 및 HEXaspCR122G/T156A). 25mM의 기질을 본 분석법에서 사용하였기 때문에 효소는 대부분이 포화될 수 있었고, 상기 활성은 효소의 k_cat를 반영한다. 그러나, S,S 모나틴 생산에 대한 분석법을 실시하는 조건하에서(상기)는 S-MP의 농도가 효소를 포화시키기에 충분할 것 같지는 않으며, 이로써 k_cat의 증가가 반영되지 못한다. 유사한 기질에 대하여 몇몇 돌연변이는 k_cat를 증가시킬 뿐만 아니라, 아미노산 기질에 대한 겉보기 K_m을 증가시킨다고 보고되었다. 기질의 농도를 증가시키면서 사용하였을 때, 이러한 2개의 돌연변이체는 S,S 모나틴의 생산 속도에 있어 HEXaspC와 비교하여 잇점을 제공할 것으로 예측된다. HEXaspCT156A 돌연변이는 상기와 같은 S,S 모나틴 생산 조건하에서 MP 아미노전이 속도에 대한 어떤 유의적인 영향도 미치지 않으면서 트립토판 아미노전이 속도를 증가시킨 것으로 보인다.

HEXaspC 및 바실러스 종 D-아미노트랜스퍼라제 효소 중 하나의 구조들을 비교함으로써(예를 들면, 문헌 [S. Sugio, G.A. Petsko, J.M. Manning, K. Soda, and D. Ringe, Biochemistry 34 (1995) pp. 9661-9669]), AspC의 W130F, R122G, T156A, 및 HEX 돌연변이를 D-아미노트랜스퍼라제 구조내 상응하는 잔기에 지도화할 수 있었다. 광범위한 특이성을 갖는 D-아미노트랜스퍼라제내의 유사한 돌연변이가 실시예 14에 기술된 바와 같이 R,R 모나틴 생산을 전반적으로 향상시킬 것으로 예측된다. 예를 들면, AspC 중 트립토판 130에 의해 제공되는 관능성은 세린 179-181과 글루타메이트 166(YM-1 번호 매김 체계)의 측쇄 사이의 수소 결합에 의해 바실러스 D-아미노트랜스퍼라제에서 대체된다. 입체 장애를 줄이기 위하여 글루타메이트를 아스파테이트 잔기로 돌연변이화시킬 수 있다. 몇몇 D-아미노트랜스퍼라제는 179번 위치에 트레오닌 잔기를 갖는데, 이는 입체 장애를 증가시킬 것이며, 이는 피해야 한다. B. 스페아리쿠스(B. sphearicus) 효소는 181번 위치에 세린을 대신하여 알라닌을 갖는데, 이 또한 입체 장애를 감소시킬 수 있다.

아스파테이트 아미노트랜스퍼라제 연구로부터 얻은 추가 정보를 D-아미노트랜스퍼라제에도 적용시킬 수 있다. AspC 효소는 활성 부위내 디카복실레이트 기질의 측쇄와 상호작용하는 아르기닌을 갖는 반면, D-아미노트랜스퍼라제는 Ser240 내지 Ser243의 루프를 갖는다. Ser240, Thr242, 및 Ser243의 측쇄는 같은 방향으로 향해 있고, Ser180의 하이드록실 기와 포켓을 형성함으로써 비극성 및 극성 기질, 둘 모두가 접할 수 있는 표면을 제공한다. Ser180는 PLP 결합에 관여하지만; D-아미노트랜스퍼라제의 R-MP와의 활성을 향상시키기 위해서는 더 큰 기질을 수용할 수 있도록, 또는 음전하를 띤 기질을 우위에 둘 수 있도록 Ser240, Thr242, 또는 Ser243 잔기를 변형시킬 수 있다. 예를 들면, Thr242를 Ser로 돌연변이시켜 측쇄 길이를 길이를 단축시킬 수 있다. 잔기 중 하나를 리신, 또는 아르기닌, 예로서, Ser243으로 돌연변이시킬 수 있다. 잔기(YM-1 번호 매김) Va130-Va136은 D-아미노트랜스퍼라제의 활성 부위를 가로지르는 베타 가닥에 위치하고, 이는 또한 활성에도 중요하다. Tyr31, Val33, Glu32, 및 Lys35는 활성 부위에 직면한다고 간주된다. Tyr31, Glu32, 및 Va133은 모든 바실러스 상동체에서 변하지 않는 것이다. (Ro et al.)(문헌 [(FEBS Lett 398 (1996) pp. 141-145))는 Va133을 Ala로 돌연변이화시키고, 알파-케토글루타레이트 아미노전이에 대하여 촉매 효율이 조금 증가하였고, 보다 더 큰 기질(입체 장애가 작은)에 대하여 촉매 효율이 조금 향상된 것이 발견되었다. 몇몇 상동체에서 Lys35가 Arg로 대체되지만, 입체 장애가 문제가 된다면, Lys 잔기가 바람직할 수 있다. 또한, 큰 분자, 예로서, MP에 대한 입체 장애가 더 작기 때문에 34번 및 36번의 발린 또한 보존적 치환, 예로서, 이소루신보다 더 바람직할 수 있다.

실시예 17

글루타메이트 및 아스파테이트 라세마제의 클로닝 , 발현 및 시험

본 실시예는 아미노산 라세마제 효소를 클로닝하고 시험하는데 사용된 방법을 기술하는데, 이를 사용하여 L-글루타메이트와 D-글루타메이트(또는 L- 및 D-아스파테이트 또는 L- 및 D-알라닌) 사이를 상호전환시킬 수 있다. R,R 모나틴을 생산하는 생합성 경로 중 하나의 단계에서는 L-아미노산(예로서, L-글루타메이트, L-아스파테이트, 또는 L-알라닌)이 생산되고, 상기 경로 중 또다른 단계에서는 D-아미노산(예로서, D-글루타메이트, D-아스파테이트, 또는 D-알라닌)이 소비될 때, 글루타메이트, 아스파테이트, 또는 알라닌 라세마제는 상기 경로에서 유용하다. 도 4는 L-트립토판-특이 아미노트랜스퍼라제, R-특이 알돌라제, D-아미노트랜스퍼라제 및 글루타메이트(또는 아스파테이트 또는 알라닌) 라세마제를 사용하여 L-트립토판으로부터 R,R 모나틴을 생산하는 생합성 경로를 도시한다.

유전자를 pET28 및 pET30 벡터 내로 클로닝하여 태깅되지 않은 단백질과 절단 가능한 N-말단 HIS₆-태그/T7-태그를 갖는 융합 단백질을 생성하였다. 생성된 단백질은 고정 금속 친화성 크로마토그래피를 사용하여 정제하였다.

실험 개관

락토바실러스 브레비스(진뱅크 수탁 번호 D29627, 핵산 서열), 및 페디오코커스 펜토사세우스(murI 유전자)(진뱅크 수탁 번호 L22789)로부터의 글루타메이트 라세마제(EC 5.1.1.3)를 코딩하는 유전자를 클로닝하고, E. 콜라이에서 발현시켰다. L-글루타메이트를 D-글루타메이트로, 및 D-글루타메이트를 L-글루타메이트로 전환시키는 활성에 대하여 추출물을 시험하였다. 바이오카탈리틱스 아스파테이트 라세마제 효소(EC 5.1.1.13)(캘리포니아주 패서디나에 소재하는 BioCatalytics)를 L- 및 D-아스파테이트 사이의 상호전환에 대해서도 시험하였다.

클로닝시키기 위한 게놈 DNA 의 분리

L. 브레비스 게놈 DNA(ATCC 8287D)를 아메리칸 타입 컬쳐 컬랙숀으로부터 입수하였다. P. 펜토사세우스(ATCC 25745)를 락토바실리 MRS 브로쓰에서 37℃하에 배양하고, 2ml는 문헌 [Mekalanos JJ. Duplication 및 Amplification of toxin genes in Vibrio cholerae. Cell. 1983. 35:253-63]의 방법을 사용한 게놈 DNA 분리에 사용하였다.

중합효소 연쇄 반응 프로토콜

pET 28 및 pET30 벡터(위스콘신주 매디슨에 소재하는 Novagen) 내로 클로닝시키기 위해 5' 제한 부위와 오버행을 포함하는 프라이머를 디자인하였다.

L. 브레비스 글루타메이트 라세마제 프라이머:

N 말단: 5'-GCGGCGCCATGGAAAATGATCCGATTGGTCTAATG-3' (서열 번호: 401), 및

C 말단: 5'-GCGGCGGTCGACGCAATTACAATTGTGTTTGTC-3' (서열 번호: 402).

P. 펜토사세우스 글루타메이트 라세마제 프라이머:

N 말단: 5'-GCGGCGCCATGGATGTATGT AT AATTTT ATTT AG-3' (서열 번호: 403), 및

C 말단: 5'-GCGGCGGTCGACAAATTTCATTATTCATTCTAATTT-3' (서열 번호: 404).

L. 브레비스로부터 유래된 유전자는 하기 PCR 프로토콜을 사용하여 증폭시켰다. 50㎕의 반응물중, 0.150㎍ 주형, 1.6μM의 각 프라이머, 0.4mM의 각 dNTP, 2.8 U 익스팬드 하이 피델러티™ 폴리머라제(인디아나주 인디애나폴리스에 소재하는 Roche), 0.5U Pfu 폴리머라제(캘리포니아주 라호야에 소재하는 Stratagene) 및 Mg를 함유하는 1X 익스팬드™ 완충액을 사용하였다. 사용된 열순환기 프로그램은 3분 동안 96℃에서 가열 개시, 하기 단계로 8회 반복: 30초 동안 94℃, 45초 동안 52℃ 및 2분 동안 72℃, 이어서 하기 단계로 22회 반복: 30초 동안 94℃, 45초 동안 60℃, 및 2분 동안 72℃. 22회 반복한 후에, 샘플을 7분 동안 72℃에서 유지시키고, 4℃에서 저장하였다. 상기 PCR 프로토콜을 통해 DNA 크기 마커와의 비교를 통해 판정된 ~830bp의 산물을 생산하였다.

P. 펜토사세우스로부터 유래된 유전자는 하기 PCR 프로토콜을 사용하여 증폭시켰다. 50㎕의 반응물중, 0.15㎍ 주형, 1.6μM의 각 프라이머, 0.4mM의 각 dNTP, 2.8U 익스팬드 하이 피델러티™ 폴리머라제, 0.5U Pfu 폴리머라제 및 Mg를 함유하는 1X 익스팬드™ 완충액을 첨가하였다. 사용된 열순환기 프로그램은 3분 동안 96℃에서 가열 개시, 하기 단계로 8회 반복: 30초 동안 94℃, 45초 동안 37℃ 및 2분 동안 72℃, 이어서 하기 단계로 22회 반복: 30초 동안 94℃, 45초 동안 45℃, 및 2분 동안 72℃, 이어서 하기 단계로 14회 반복: 30초 동안 94℃, 45초 동안 55℃, 및 2분 동안 72℃. 14회 반복한 후에, 샘플을 7분 동안 72℃에서 유지시키고, 4℃에서 저장하였다. 상기 PCR 프로토콜을 통해 DNA 크기 마커와의 비교를 통해 판정된 ~840bp의 산물을 생산하였다.

클로닝

퀴아젠(Qiagen) 겔 추출 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 0.8% TAE-아가로스 겔로부터 PCR 산물을 겔 정제하였다. PCR 산물은 스마트스펙 3000(SmartSpec 3000)™ 분광광도계를 사용하여 정량하였다. 제조사(매사추세츠주 비벌리에 소재하는 New England Biolabs)의 권고된 프로토콜에 따라 제한 효소 NcoI 및 SalI를 사용하여 산물를 분해하고, 퀴아젠겔 추출 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 0.8% TAE-아가로스 겔로부터 겔 정제하였다. 제한 효소 NcoI 및 SalI를 사용하여 분해한 후, 새우 알칼리성 포스파타제로 처리하고, 퀴아젠겔 추출 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 0.8% TAE-아가로스 겔로부터 겔 정제하여 벡터 pET 28 및 pET 30을 제조하였다.

분해된 벡터 및 인서트를 래피드™ DNA 결찰 키트(인디아나주 인디애나폴리스에 소재하는 Roche)를 사용하여 결찰시켰다. 대략 50ng의 처리된 인서트, 100ng의 처리된 벡터(인서트 대 벡터의 몰비는 3:1), 5U의 T4 DNA 리가제, 및 1X 결찰 완충액을 실온에서 5분 동안 인큐베이션시켰다. 결찰 반응물은 고순도 PCR 산물 정제 키트(인디아나주 인디애나폴리스에 소재하는 Roche)를 사용하여 정제하고, 이를 사용하여 E. 콜라이 DH10B 전기 적격 세포(캘리포니아주 칼스배드에 소재하는 Invitrogen)로 형질전환시켰다. 10㎕의 각 결찰 반응물을 40㎕의 DH1OB에 가하고, 이는 하기 조건: 0.2cm 큐베트중 2.5kV, 25 μF, 200ohm하에서 바이오래드 진 펄사르 II(캘리포니아주 허큘리스에 소재하는 Bio-Rad)를 사용하여 전기천공법에 의해 형질전환되었다. 225rpm으로 진탕시키면서 1시간 동안 37℃에서 1mL의 실온의 SOC에 세포가 회수될 수 있도록 하였다. 카나마이신(50㎍/mL)을 함유하는 LB 플레이트 상에 세포를 플레이팅하였다.

퀴아젠 스핀 미니프렙 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 생성된 형질전환체로부터 플라스미드 DNA를 정제하고, NcoI 및 SalI를 사용하는 제한 분해에 의한 올바른 인서트에 대해 스크리닝하였다. 올바른 인서트를 갖는 것으로 보이는 플라스미드 서열은 디데옥시 쇄 종결 DNA 서열 분석을 통해 확인하였다.

유전자 발현 및 분석법

플라스미드 DNA를 E. 콜라이 발현 숙주 BL21(DE3)(위스콘신주 매디슨에 소재하는 Novagen) 내로 서브클로닝하였다. 배양물을 배양하였다. 퀴아젠 미니프렙 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 플라스미드를 단리하고, 제한 분해에 의해 분석하여 아이덴터티를 확인하였다.

BL21(DE3)에서의 유도는 먼저 pET28(태깅되지 않음) 및 pET 30(히스티딘으로 태깅됨) 벡터, 둘 모두에서 L. 브레비스 및 P. 펜토사세우스 글루타메이트 라세마제를 사용하여 실시하였다. 시간 경과에 따른 연구는, 카나마이신(50mg/L)을 함유하는 250mL LB에서 0.5-0.6의 OD₆₀₀까지 배양하고, 100mM IPTG(이소프로필 갈락카토시드)로 유도하고, 유도 이후 0 및 3시간째에 샘플링된 배양물을 사용하여 실시하였다. 600㎕(0시간) 및 275㎕(3시간)로부터의 세포를, 2-머캅토에탄올을 함유하는 1X 도데실 황산나트륨 완충액 40㎕에 재현탁시키고, 10분 동안 95℃에서 가열하고 냉각시켰다. 총 세포 단백질 샘플의 분취량은 4-15% 구배 겔을 사용하여 SDS-PAGE에 의해 분석하였다.

또한, 약하게 진탕시키면서 20분 동안 실온에서 0.625㎕의 벤조나제 뉴클레아제 및 3㎕의 프로테아제 저해제 칵테일 세트 #3(캘리포니아주 샌디에고에 소재하는 CalBiochem-NovaBiochem Corp.)을 함유하는 0.625mL 노바젠 벅버스터™ 시약(위스콘신주 매디슨에 소재하는 Novagen)중 5mL의 배양물로부터 세포 펠릿을 현탁시켜 3시간된 배양물로부터 세포 추출물을 제조하고, 16,000 x g로 원심분리하여 세포 파편을 제거하였다. 세포 가용성 단백질의 분석을 위해 상등액(세포 추출물)을 4-15% 구배 겔 상에 로딩하였다.

클로닝된 L. 브레비스 글루타메이트 라세마제 및 P. 펜토사세우스 글루타메이트 라세마제로부터의 3시간된 샘플은 올바른 크기(대략 31kDa)에 상응하는 총 단백질 및 가용성 단백질, 둘 모두를 나타내었다. L. 브레비스 pET30(히스티딘으로 태깅됨) 유전자 산물은 L. 브레비스 pET 28(태깅되지 않음) 유전자 산물 뿐만 아니라, 두 벡터의 P. 펜토사세우스 유전자 산물보다 더 높은 수준으로 과발현되었고, 또한 더 가용성(가용성 단백질이 20% 초과)이었다. P. 펜토사세우스 유전자 산물은 pET28 및 pET30 벡터에서 동등한 과발현 및 가용성을 나타내었고, 이는 L. 브레비스 pET30 유전자 산물에 대하여 관찰된 것보다 유의적으로 더 적었다.

유도된 배양물(250mL)로부터의 세포를 원심분리하고, 0.85% NaCl로 1회 세척하였다. 세포 펠릿을, 5㎕/mL 프로테아제 저해제 칵테일 세트 #3(캘리포니아주 샌디에고에 소재하는 CalBiochem-NovaBiochem Corp.) 및 1㎕/mL 벤조나제 뉴클레아제를 함유하는 5mL/g(습식 세포 중량)의 벅버스터(위스콘신주 매디슨에 소재하는 Novagen) 시약에 재현탁시켰다. 샘플을 궤도 진탕기 상에서 20분 동안 실온하에서 인큐베이션시켰다. 4℃에서 20분 동안 16,000Xg으로 원심분리하여 불용성 세포 파편을 제거하였다.

하기 프로토콜을 사용하여 글루타메이트 라세마제 활성에 대하여 세포 추출물을 분석하였다. 10mM 인산칼륨(pH 8.0), 0.2mM DTT, 및 10mM L-글루타메이트 또는 D-글루타메이트에서 400㎕의 반응을 수행하였다. 20-100㎕의 무세포 추출물을 첨가하고, 실온에서 인큐베이션시켜 반응을 개시하였다. 1분, 5분, 10분, 20분 및 1시간의 시간 경과에 따라 샘플 분취량을 채취하였다(0분째의 샘플이 대조군 반응으로서 작용하였다). 2M 포름산(25㎕)을 각 400㎕의 샘플 분취량에 가하여 반응을 종결시키고, 침전된 단백질은 원심분리하여 제거하였다. 상등액을 제거하고, LC/MS/MS에 의해 분석할 때까지 -80℃에서 냉동시켰다.

100mM IPTG(3시간)를 사용한 pET30 유도로부터의 세포 추출물에서 얻은 분석 결과는 L. 브레비스(진뱅크 수탁 번호 BAA06106.1 GL468450) 및 P. 펜토사세우스(진뱅크 수탁 번호 AAA16761.1 GL349029) 효소가 글루타메이트 이성체 둘 모두에 대하여 유의적인 수준의 라세마제 활성을 갖는다는 것을 입증한다. P. 펜토사세우스 라세마제(20㎕의 세포 추출물)는 어떤 기질을 사용하여 출발한 경우에도 10-20분 경과후에 L- 및 D-글루타메이트 사이에서 평형에 도달하였다. L. 브레비스 효소 (20㎕의 세포 추출물) 또한 대략 20분 경과 후에 평형에 도달하였다.

바이오카탈리틱스 인크.(BioCatalytics, Inc.)(캘리포니아주 패서디나 소재)로부터 구입한, 부분적으로 정제된 아스파테이트 라세마제 효소(카탈로그 번호 ASPR-101)를 상기의 것과 유사한 프로토콜을 사용하여 L-아스파테이트 및 D-아스파테이트에 대한 활성에 대하여 분석하였다. 시판용 효소는 두 이성체 모두에 대하여 라세마제 활성을 나타내었다. 0.5-1 mg의 효소를 사용하였을 때, 20-60분 경과 후에 평형에 도달하였다.

3개의 라세마제(L. 브레비스 글루타메이트 라세마제, P. 펜토사세우스 글루타메이트 라세마제 및 바이오카탈리틱스 아스파테이트 라세마제) 모두를 또한 하기 프로토콜을 사용하여 S,S 모나틴에 대한 활성에 대하여 분석하였다. 10mM 인산칼륨(pH 8.0), 0.2mM DTT, 및 10mM S,S 모나틴에서 400㎕의 반응을 수행하였다. 무세포 추출물(L. 브레비스 및 P. 펜토사세우스) 또는 정제된 효소(바이오카탈리틱스 아스파테이트 라세마제를을 첨가하고, 실온에서 인큐베이션시켜 반응을 개시하였다. 1분, 5분, 10분, 20분 및 1시간의 시간 경과에 따라 샘플 분취량을 채취하였다(0분째의 샘플이 대조군 반응 및 효소를 포함하지 않는 샘플로서 작용하였다). 2M 포름산(25㎕)을 각 400㎕의 샘플 분취량에 가하여 반응을 종결시키고, 침전된 단백질은 원심분리하여 제거하였다. 상등액을 제거하고, LC/MS/MS에 의해 분석(실시예 1)할 때까지 -80℃에서 냉동시켰다. 시간이 경과함에 따라 S,S 모나틴 농도는 감소하지 않았거나, S,R 모나틴(심지어 효소를 포함하지 않는 대조군에서도 초기에는 <5%의 오염 부산물로서 존재하였다)도 증가하지 않았다. 그러므로, 분석된 라세마제 중 어떤 것도 모나틴에 대해서는 활성을 나타내지 않았다.

실시예 18

글루타메이트 또는 아스파테이트라세마제를 사용하여 L-트립토판으로부터 R,R 모나틴 생산

본 실시예는 L-트립토판(1-티로신, 또는 방향족) 아미노트랜스퍼라제, ProA 알돌라제, 글루타메이트 또는 아스파테이트 라세마제, 및 광범위한 특이성을 갖는 D-아미노산 아미노트랜스퍼라제를 사용하여 L-트립토판으로부터 입체이성체적으로 증폭된 R,R 모나틴을 생산하는 방법을 기술한다. 도 5는 상기 경로를 도시한 도식이다. 입체이성체적으로 증폭된 R,R 모나틴을 생산하는 이러한 접근법은 모나틴 전구체(MP)로부터 모나틴을 생산함에 있어서 활성이 낮은 효소를 단계 1에서 필요로 한다. 종전의 결과에 기초하여, 본 발명자들은 WO 03/091396 A2의 실시예 1에 기재된 시노리조븀 멜릴로티(Sinorhrizobium meliloti) 및 로도박터 스페로이데스 tatA 유전자 산물을 사용하였다.

재료 및 방법

L. 브레비스 및 P. 펜토사세우스로부터의 글루타메이트 라세마제는 실시예 17에 기술된 바와 같이 E. 콜라이에서 생산하였다. 몇몇 경우에, 제조사(위스콘신주 매디슨에 소재하는 Novagen)의 프로토콜에 따라 His-Bind 900 카트리지를 사용하여 이들 효소들의 His₆-태깅된 버전을 정제하고, PD-10 칼럼(G25 Sephadex, 뉴저지주 피츠카타웨이에 소재하는 GE Healthcare)을 사용하여 이미다졸을 제거하기 위해 탈염시킨다. 효소를 25mM 인산칼륨(pH 8.0)에서 용리시켰다. 아스파테이트 라세마제(ASPR-101) 및 D-아미노트랜스퍼라제(AT-103)를 바이오카탈리틱스 인크.(캘리포니아주 패서디나 소재)로부터 구입하였다. S. 멜리로티 및 R. 스파에로이데스(R. sphaeroides) 티로신 (방향족) 아미노트랜스퍼라제는 WO 03/091396 A2의 실시예 1에 기술된 바와 같이 제조하였다. 코마모나스 테스토스테로니(Comamonas testosteroni) ProA 알돌라제는 WO 03/091396 A2의 실시예 4에 기술된 바와 같이 제조하였다. 제조사(캘리포니아주 허큘리스 소재)의 프로토콜에 따라 바이오-래드 단백질 분석법을 이용하여 총 단백질의 분석법을 수행하였다.

라세마제를 사용하여 생산된 S,S 모나틴의 양을 감소시킴

반응 혼합물(1mL 용량, 2회 실시)은 100mM 인산칼륨 완충액(pH 8), 2mM MgCl₂, 0.05mM 피리독살 5'-포스페이트(PLP), 200mM 피루브산나트륨, 5mM 나트륨 α-케토글루타레이트 또는 옥살로아세테이트, 세포 추출물로 공급된 대략 280㎍/mL의 S. 멜리로티 TatA, 1 mg/mL 바이오카탈리틱스 D-아미노트랜스퍼라제(AT-103)(캘리포니아주 패서디나에 소재하는 BioCatalytics), 100㎕/mL의 글루타메이트 라세마제 세포 추출물 또는 1 mg/mL 아스파테이트 라세마제, 및 세포 추출물로서 제공된 대략 100㎍/mL의 ProA 알돌라제를 함유하였다. 고체 트립토판을 10.2mg/ml의 농도로 가하였다. 음성 대조군은 라세마제를 포함하지 않았다. 샘플을 1시간, 2시간 동안 또는 밤새도록 (250rpm으로 진탕시키면서) 30℃에서 인큐베이션시켰다. 샘플을 원심분리하여 침전물을 제거하고, 주사기로 여과하고, 실시예 1에 기술된 LC/MS/MS 방법을 사용하여 모나틴을 분석하기 이전에 -80℃에서 저장하였다. 세포 추출물내 존재하는 천연 L-아미노트랜스퍼라제의 양에 기인하여 대부분의 샘플은 >95% S,S 모나틴을 함유하였다. 그러한, 라세마제를 함유한 샘플은 MP의 아미노전이에 대한 L-글루타메이트의 사용가능성을 감소시키면서, 라세마제 효소의 결과로서 총 모나틴의 양을 감소시켰다. 라세마제를 포함하지 않는 경우, 시간이 경과함에 따라 1545-2355ppm 모나틴(지배적으로 S,S)이 생산되었다. 라세마제가 존재하는 경우에는, 단지 340-879ppm(L. 브레비스 효소), 444-531ppm(P. 펜토사세우스 효소), 및 506-1460ppm 모나틴(아스파테이트 라세마제)만이 생산되었다. 이러한 데이타는 라세마제가 모나틴 생산에 필요한 반응 조건하에서 활성이라는 것을 지시한다. 세포 추출물 효소, 예로서, 아스파테이트 아미노트랜스퍼라제로부터 S,S 모나틴이 형성되는 것을 최소화하기 위하여, 정제된 효소를 사용하고, D-아미노트랜스퍼라제 대 L-아미노트랜스퍼라제 효소의 비를 더 높게 하여 추가 실험을 수행하였다.

L-트립토판의, 모나틴의 4-R을 함유하는 이성체로의 전환

대략 54㎍의 정제된 L- 아미노트랜스퍼라제(S. 멜리로티 또는 R. 스파에로이데스 TatA), 1 mg 아스파테이트 아미노트랜스퍼라제(캘리포니아주 패서디나에 소재하는 BioCatalytics), 1 mg D-아미노트랜스퍼라제, 아미노 수용체로서 옥살로아세테이트, 및 75㎍ 정제된 알돌라제를 사용하여 상기 실험을 반복하였다. 2시간의 샘플링 시간 및 밤새도록 인큐베이션시킨 인큐베이션 시간을 사용하여 반응을 2회 실시하였다. S. 멜리로티 L-아미노트랜스퍼라제는 포함하지만, 라세마제는 포함하지 않는 음성 대조군을 실시하였다. R,R/S,S 정량과, 역상 크로마토그래피에 기초한 S,R/R,S 모나틴 피크 정량 이외에도, 실시예 1에 기술된 FDAA 유도체화 기법을 사용하여 각 입체이성체(%)를 측정하였다. 결과는 하기와 같다:

[표 22]

명확하게, 라세마제가 존재하는 것은 S. 멜리로티 TatA가 L-트립토판 아미노전이에 대한 효소로서 사용되었을 때, 생산된 모나틴의 총량을 증가시켰다. 모나틴 수준이 2시간 분석법에서는 평균 6.4ppm에서 16.5ppm으로 증가하였고, 밤새도록 진행된 분석법에서는 41ppm에서 73ppm으로 증가하였다. 추가로, 라세마제 효소를 사용함으로써 형성된 R,R(%)은 약 1%로부터 58% 이하만큼 증가하였다. 또다른 유력한 감미제인 모나틴의 S,R 입체이성체는 음성 대조군에서 0에 가까운 값으로부터 31%로 증가시키는 다른 주요 성분이었다. 명확하게, R. 스파에로이데스 TatA는 S. 멜리로티 L-트랜스아미나제보다 S-MP에 대한 더욱 큰 활성을 가졌고, 이는 모나틴의 4-R 이성체가 원하는 산물이 될 때 MP와 비교하여 L-트립토판에 대하여 고도한 기질 특이성을 갖는 효소를 갖는 것이 중요하다는 것을 입증한다. 2시간 시점에서 총 모나틴 중 약 10%는 4S였고, S. 멜리로티 TatA는 MP는 제한된 활성을 갖는 것으로 간주할 수 있다.

정제된 S. 멜리로티 TatA(54㎍) 및 L. 브레비스 글루타메이트 라세마제를 사용하여 실험을 반복하였다. 정제된 글루타메이트 라세마제를 사용하였을 때 반응물 1mL당 대략 64㎍이 사용되었다. 글루타메이트 라세마제를 함유하는 세포 추출물 또한 시험하였고, 1.4mg의 가용성 단백질을 사용하였다. 또한 음성 대조군에는 어떤 라세마제도 사용되지 않았고, 모든 샘플은 2회에 걸쳐 실시되었다. 결과를 하기에 나타낸다.

[표 23]

또한, 라세마제를 첨가하는 것이 L-트립토판으로부터 생산되는 총 모나틴을 증가시킬 뿐만 아니라, S,S 모나틴과 비교하여 모나틴의 4R-함유 이성체의 상대적인 양을 증가시켰다는 것은 분명하다. 정제된 알돌라제, 라세마제, 및 L-아미노트랜스퍼라제를 사용하는 것은 원하는 입체입성체 형성을 제어할 수 있는 능력을 현저하게 향상시킨다. L 대 D 아미노트랜스퍼라제의 비는 또한 최종 산물의 입체화학을 조작할 수 있는 방법이다.

상기 조건과 유사한 반응 조건을 사용하여 얻은 결과와 실시예 13의 표 18 및 19에 나타낸 결과를 비교할 때, 대략 7-29ppm의 모나틴이 인돌-3-피루베이트로부터 형성되었고, 형성된 R,R 모나틴(%)은 대략 51-90%였다는 것을 알 수 있다. 아스파테이트 라세마제를 사용할 경우, 생산된 모나틴의 총량을 16-78ppm 모나틴으로 증가시켰고, R,R(%)은 대략 40-58%로 증가시켰다. 추가로, 안정성은 더욱 크고 더 저렴한 원료인 L-트립토판을 사용하였다. 실시예 14에서, R,R:S,R의 비가 대략 1.7:1일 때 D-트립토판으로부터 대략 73ppm 모나틴이 생산되었다. 4R 이성체의 총량은 총 모나틴의 >80%였다. R,R-모나틴 및 S,R-모나틴, 둘 모두 유력한 감미제이기 때문에(수크로스보다 >1000배 더 달다), 값비싼 D-아미노산 기질을 필요로 하지 않으면서 상기의 이성체들을 풍부하게 할 수 있는 능력이 중요하다.

실시예 13 및 14에 기술된 바와 같이, D-알라닌은 MP를 모나틴으로 아미노전이시키는데 있어서 아미노 공여체로서 작용할 수 있다. 다수의 L-아미노트랜스퍼라제는 어느 정도는 아미노 수용체로서 피루베이트를 사용할 수 있는 능력을 갖고 있고, L-알라닌을 생산하다. 상기 언급한 반응은 고농도의 피루베이트를 사용하기 때문에, 일부의 피루베이트가 L-알라닌으로 전환될 가능성이 있다. 예를 들면, L-트립토판의 아미노전이시, 실시예 16에 기술된 HexAspC 효소는 알파-케토글루타레이트가 존재하지 않을 경우, 2시간 경과 후 10-18%의 피루베이트(50-200mM 초기 농도)를 L-알라닌으로 전환시키는 것으로 밝혀졌다. 상기 효소는 두개의 아미노산 모두가 고농도(>50mM)로 존재할 때 알파-케토글루타레이트를 10배 더 선호하는 것으로 나타났다. AspC(WO 03/091396 A2에 기재되어 있음) 또한 피루베이트로부터 일부 L-알라닌을 생산하였다. 그러므로, 상기 반응에서 알파-케토글루타레이트 또는 옥살로아세테이트를 첨가하는 것을 생락할 수 있고, 글루타메이트 또는 아스파테이트 라세마제 대신 알라닌 라세마제(EC 5.1.1.1)를 사용할 수 있을 것으로 예측된다. 알라닌 라세마제 효소가 브루셀라 어보투스(Brucella abortus)와 스트렙토코쿠스 패칼리스에서 최초로 동정되었다(문헌 [Marr, A. G. and Wilson, P.W. Arch. Biochem. Biophys., 49 (1954) 424-433] 및 [Wood, W.A. and Gunsalus, LC. J. Biol. Chem., 190 (1951) 403-416]). 살모넬라 타이피뮤리움의 dadB 유전자가 알라닌 라세마제 활성의 공급원으로서 동정되었고, 수백개의 상동체는 게놈 데이타베이스에 찾아볼 수 있다. 알라닌 라세마제 활성에 대한 공지된 또다른 공급원은 에스케리키아 콜라이, 바실러스 섭틸리스, 슈도모나스 애루지노사, 비브리오 콜레라에, 시조사카로미세스 폼베, 및 바실러스 세레우스이다. 담자균 버섯인 렌티누스 에도데스 또한 광범위한 활성을 갖는 알라닌 라세마제를 함유한다. 바실러스 스테아로써모필러스로부터의 열안정성 상동체는 시그마-알드리치(카탈로그 번호 A8936)(미주리주 세인트루이스에 소재하는 Sigma-Aldrich)로부터 구입할 수 있고, 시판용으로 고정되어 있다(문헌 [Inagaki, K., Biochemistry, 25: 3268 1986]). 알라닌 라세마제는 무작위 방법, 예로서, 돌연변이 유발성 PCR, 계대 돌연변이 유발성 균주, 또는 당업계에 공지된 기타 방법에 의해 글루타메이트 또는 아스파테이트 라세마제로 전환된다. 알라닌 라세마제의 진화에 대하여 더 많은 관심은 Lys129, Met134를 비롯한 활성 부위 잔기, 및 Gly283과 Trp288 사이에 포함된 잔기(바실러스 스테아로써모필러스로부터 번호 매김됨)에 집중된다.

실시예 19

D- 페닐글리신 아미노트랜스퍼라제(D-4- 하이드록시페닐글리신 아미노트랜스퍼라제 )

도 3에 나타낸 바와 같이, D-페닐글리신 아미노트랜스퍼라제는 모나틴 생산을 위한 생합성 경로에서 유용하다. 예를 들면, D-페닐글리신 아미노트랜스퍼라제는 아미노 공여체로서 L-글루타메이트를 사용하여 R-MP로부터 R,R 모나틴을 생산한다.

올리고뉴클레오티드 프라이머로부터 P. 스투제리(P. stutzeri) 4D-하이드록시페닐글리신 아미노트랜스퍼라제의 PCR 합성

본 실시예는 아미노 공여체로서 L-글루타메이트를 사용하여 R 모나틴 전구체를 R,R 모나틴으로 전환시키는데 사용될 수 있는 입체적 역전 효소인, 4D-하이드록시페닐글리신 아미노트랜스퍼라제를 합성하는데 사용된 방법을 기술한다.

프라이머 디자인

슈도모나스 스투제리(Pseudomonas stutzeri) 4D-하이드록시페닐글리신 아미노트랜스퍼라제(4D-HPG AT)에 대하여 공개된 서열(진뱅크 수탁 번호 AY319935, 핵산 서열; 진뱅크 수탁 번호 AAQ8290, 단백질 서열)을 PCR 프라이머 디자인을 위한 주형으로서 사용하였다. 별법으로, 슈도모나스 퓨티다로부터의 4-D-하이드록시페닐글리신 아미노트랜스퍼라제(CAD42450(단백질), AX467211(뉴클레오티드))를 서열 주형으로서 사용한다. 총 34개의 순방향 프라이머 및 35개의 역방향 프라이머를 디자인하였다; 순방향 및 역방향 프라이머는 20개의 중복되는 염기쌍을 공유하며, 40-mers였다. 또한, pET 28 및 pET30 벡터(위스콘신주 매디슨에 소재하는 Novagen) 내로 클로닝시키기 위해 5' 제한 부위와 오버행을 포함하는 2개의 외측 프라이머를 디자인하였다.

P. 스투제리 4 D-HPG AT 외측 프라이머: N 말단(NdeI 부위 포함):

5'-GGCCGGCATATGTCGATCCTTAACGACTACAAACGT-3' (서열 번호: 405), 및

C 말단 (XhoI 부위 포함):

5'-GGAAGGCTCGAGTCATGATTGGTTTCCAGACAAATT-3' (서열 번호: 406).

중합효소 연쇄 반응 프로토콜

P. 스투제리로부터의 유전자 서열은 하기 프로토콜을 사용하여 증폭시켰다. 1차 100㎕의 PCR 반응은 0.05μM의 각 69개의 내부 프라이머, 0.4mM의 각 dNTP, 10U rTth 폴리머라제 XL(인디아나주 인디애나폴리스에 소재하는 Roche), 0.625 U Pfu 폴리머라제(캘리포니아주 라호야에 소재하는 Stratagene), 1X XL 완충액 및 1mM Mg(OAc)₂를 포함하였다. 사용된 열순환기 프로그램은 3분 동안 94℃에서 가열 개시, 하기 단계로 15회 반복: 30초 동안 94℃, 30초 동안 42℃ 및 15초 동안 68℃, 이어서 하기 단계로 10회 반복: 30초 동안 94℃, 30초 동안52℃, 및 30초 동안 68℃, 이어서 하기 단계로 10회 반복: 30초 동안 94℃, 30초 동안 60℃, 및 1분 15초 동안 68℃. 최종 10회의 순환 후에, 샘플을 7분 동안 68℃에서 유지시키고, 4℃에서 저장하였다. 상기 PCR 프로토콜을 통해 0.8% TAE-아가로스 겔 상의 ~0.5kb에서 산물의 도말표본을 생산하였다.

주형으로서 1차 PCR 반응물을 사용하여 2차 PCR 반응물을 세팅하였다. 2차 100㎕의 PCR 반응물은 2.5㎕의 1차 PCR 반응물, 0.5μM의, 각각의 외측 프라이머 2개(NdeI 및 XhoI 제한 부위 포함), 0.4mM의 각 dNTP, 10U rTth 폴리머라제 XL, 0.625 U Pfu 폴리머라제, 1X XL 완충액 및 1mM Mg(OAc)₂를 포함한다. 사용된 열순환기 프로그램은 3분 동안 94℃에서 가열 개시, 하기 단계로 10회 반복: 30초 동안 94℃, 30초 동안 52℃ 및 1분 30초 동안 68℃, 이어서 하기 단계로 15회 반복: 30초 동안 94℃, 30초 동안 60℃, 및 1분 30초 동안 68℃. 15회의 순환 후에, 샘플을 7분 동안 68℃에서 유지시키고, 4℃에서 저장하였다. 상기 PCR 프로토콜을 통해 0.8% TAE-아가로스 겔 상의 ~1.4kb에서 특유한 산물을 생산하였다.

퀴아젠 겔 추출 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 0.8% TAE-아가로스 겔로부터 PCR 산물을 겔 정제하였다. 산물을 TOPO 클로닝하고, 제조사(캘리포니아주 칼스배드에 소재하는 Invitrogen)의 프로토콜에 따라 TOP 10 세포 내로 형질전환시켰다. 플라스미드 DNA는 퀴아젠 스핀 미니프렙 키트(캘리포아주 발렌시아에 소재하는 Qiagen)를 사용하여 생성된 형질전환체로부터 정제하고, NdeI 및 XhoI를 사용하는 제한 분해에 의한 올바른 인서트에 대해 스크리닝하였다. 올바른 인서트를 갖는 것으로 보이는 플라스미드 서열은 일반 M13 순방향 및 M13 역방향 프라이머를 사용하여 디데옥시 쇄 종결 DNA 서열 분석을 통해 확인하였다. 서열 분석된 10개의 클론 모두 원하는 서열로부터 1 이상의 돌연변이를 가졌다. 최적의 클론은 아미노산 변이를 일으키는 단일 염기쌍 돌연변이를 가졌다. 제조사(캘리포니아주 라호야에 소재하는 Stratagene)의 권고에 따라 퀵체인지(QuickChange) 돌연변이 유발법 프로토콜을 사용하여 상기 클론의 서열을 보정하였다.

제조사(매사추세츠주 비벌리에 소재하는 New England Biolabs)의 권고된 프로토콜에 따라 제한 효소 NdeI 및 XhoI를 사용하여 보정된 TOPO 세포를 분해하고, 퀴아젠겔 추출 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 0.8% TAE-아가로스 겔로부터 겔 정제하였다. 제한 효소 NdeI 및 XhoI를 사용하여 분해한 후, 새우 알칼리성 포스파타제로 처리하고, 퀴아젠겔 추출 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 0.8% TAE-아가로스 겔로부터 겔 정제하여 벡터 pET 28 및 pET 30을 제조하였다.

분해된 벡터 및 인서트를 NEB 퀵 리게이션 키트(NEB Quick ligation Kit)(매사추세츠주 비벌리에 소재)를 사용하여 결찰시켰다. 대략 50ng의 처리된 인서트, 100ng의 처리된 벡터(인서트 대 벡터의 몰비는 3:1), 5U의 T4 DNA 리가제, 및 1X 결찰 완충액을 실온에서 5분 동안 인큐베이션시켰다. 결찰 혼합물을 TOP10F' 화학적 적격 세포(캘리포니아주 칼스배드에 소재하는 Invitrogen)로 형질전환시켰다. 225rpm으로 진탕시키면서 1시간 동안 실온에서 0.25mL의 SOC중에서 세포가 회수될 수 있도록 하였다. 카나마이신(50㎍/mL)을 함유하는 LB 플레이트 상에 세포를 플레이팅하였다. 퀴아젠 스핀 미니프렙 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 생성된 형질전환체로부터 플라스미드 DNA를 정제하고, NdeI 및 XhoI를 사용하는 제한 분해에 의한 올바른 인서트에 대해 스크리닝하였다.

유전자 발현 및 분석법

플라스미드 DNA를 E. 콜라이 발현 숙주 BL21(DE3)(위스콘신주 매디슨에 소재하는 Novagen) 내로 형질전환시켰다. 배양물을 배양하고, 퀴아젠 미니프렙 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 플라스미드를 단리하고, 제한 분해에 의해 분석하여 아이덴터티를 확인하였다.

BL21(DE3)에서의 유도는 먼저 pET 28(히스티딘으로 태깅됨) 및 pET 30(태깅되지 않음) 벡터, 둘 모두에서 P. 스투제리 4D - HPG를 사용하여 실시한다. 시간 경과에 따른 연구는, 카나마이신(50mg/L)을 함유하는 250mL LB에서 0.5-0.6의 OD₆₀₀까지 배양하고, 100mM IPTG(이소프로필 갈락카토시드)로 유도되고, 유도 이후 0 및 3시간째에 샘플링된 배양물을 사용하여 실시한다. 0시간째부터 3시간째까지의, 적절량의 세포를, 2-머캅토에탄올을 함유하는 40㎕의 도데실 황산나트륨 완충액에 현탁시키고, 10분 동안 95℃에서 가열하고 냉각시킨다. 총 세포 단백질 샘플의 분취량은 4-15% 구배 겔을 사용하여 SDS-PAGE에 의해 분석한다.

또한, 약하게 진탕시키면서 20분 동안 실온에서 0.625㎕의 벤조나제 뉴클레아제 및 3㎕의 프로테아제 저해제 칵테일 세트 #3(캘리포니아주 샌디에고에 소재하는 CalBiochem-NovaBiochem Corp.)을 함유하는 0.625mL 노바젠 벅버스터™ 시약(위스콘신주 매디슨에 소재하는 Novagen)중 5mL의 배양물로부터 세포 펠릿을 현탁시켜 3시간된 배양물로부터 세포 추출물을 제조하고, 16,000 x g로 원심분리하여 세포 파편을 제거한다. 세포 가용성 단백질의 분석을 위해 상등액(세포 추출물)을 4-15% 구배 겔 상에 로딩한다. 필요한 경우, 제조사(위스콘신주 매디슨에 소재하는 Novagen)의 프로토콜에 따라 His-Bind 900 카트리지를 사용하여 단백질을 정제하고, PD-10 칼럼(G25 Sephadex, 뉴저지주 피츠카타웨이에 소재하는 GE Healthcare)을 사용하여 이미다졸을 제거하기 위해 탈염시킨다.

D-페닐글리신 아미노트랜스퍼라제(DPGAT: D-phenylglycine aminotransferase)를 포함하는 유기체

입체적 역전 D-페닐글리신 아미노트랜스퍼라제(D-4-하이드록시페닐글리신 아미노트랜스퍼라제로도 명명됨)를 포함하는 슈도모나스 속 및 유사한 속의 유기체를 하기 방식으로 단리한다. 하기 배지: (1ℓ당) 15g 아가, 3.4g KH₂PO₄, 3.55g Na₂HPO₄, 0.2g MgSO₄-7H₂O, 8mg CaCl₂-2H₂O, 10mg 효모 추출물, 1ml 100Ox 미량 원소 용액, 1g D-페닐글리신 (D-4-하이드록시페닐글리신)을 포함하는 페트리 플레이트 상에서 토양 샘플을 인큐베이션시킨다.

단리물을 입체적 역전 아미노트랜스퍼라제(공지된 D-페닐글리신 아미노트랜스퍼라제로부터 디자인된 프라이머)의 존재에 대하여 PCR을 통해 시험하거나, 하기와 같이 입체적 역전 아미노트랜스퍼라제의 존재를 위해 추가로 강화시킨다: 플레이트로부터 얻은 단리물을 진탕시키면서 30℃하에 상기와 같은 액상 배지중 아가를 뺀 배지에서 OD_60O이 약 1.0일 될 때까지 배양할 수 있다. 원심분리하여 세포를 수거하고, 0.85% NaCl을 사용하여 2회에 걸쳐 세척한다. 10mg(습식 질량) 샘플을 1ml 인산칼륨 완충액(pH 7.0) 및 5mM D-페닐글리신(또는 D-4-하이드록시페닐글리신)에 현탁시킨다. 중화된 15mM (아미노옥시)아세트산을 상기 기술된 바와 같이 제조된 복제 샘플에 가한다. HPLC에 의해 D-페닐글리신(또는 D-4-하이드록시글리신) 소비에 관하여 측정한다. D-페닐글리신(또는 D-4-하이드록시페닐글리신)을 분해할 수는 있지만, (아미노옥시)아세트산의 존재하에서는 보다 느린 속도로 분해하는 단리물을 추가 분석을 위해 선별한다. 단리물을 PCR에 의해 입체적 역전 아미노트랜스퍼라제(공지된 D-페닐글리신 아미노트랜스퍼라제로부터 디자인된 프라이머)의 존재에 관하여 시험한다.

입체적 역전 아미노트랜스퍼라제의 존재는 상기 기술된 바와 같은 액상 배지중에서 배양물을 배양하고, 세포를 수거하고, 무세포 조 추출물(CFE: cell-free crude extract)을 제조하고, D-페닐글리신 아미노트랜스퍼라제(또는 D-4-하이드록시페닐글리신 아미노트랜스퍼라제) 효소 활성에 대하여 시험함으로써 확인한다. 최종 농도가 0.1M CAPS(pH 9.5), 60mM L-글루타메이트(나트륨염), 5mM 벤조일포름에이트(또는 4-하이드록시벤조에이트) 및 50μM PLP인 반응 혼합물에 CFE를 가한다. 최종 농도가 50mM 인산칼륨(pH 7.0), 60mM D-페닐글리신(또는 D-4-하이드록시페닐글리신), 5mM α-케토글루타레이트, 50μM PLP인 반응 혼합물에 CFE를 가하여 역 반응을 측정한다. 본 분석은 35℃에서 인큐베이션시키고, 분취량을 시점마다 취하고, 2분 동안 비등시켜 종결시킨다. 산물은 문헌 [Gil-Av, E., Tishbee, A., Hare, P. E. Resolution of underivatized amino acids by reversed phase chromatography. J. Am. Chem. Soc, 102: 5115-5117 (1980)]의 HLPC 방법에 의해, 또는 실시예 1(글루타메이트 형성 측정)에 기술된 방법에 의해 정량될 것이다.

PCR 기초 방법에 대한 대안으로서, 황산암모늄 분별, 및 통상의 칼럼 크로마토그래피를 비롯한, 통상의 단백질 정제 기법에 의해 입체적 역전 D-페닐글리신 아미노트랜스퍼라제를 단리된 박테리아로부터 정제한다. 일단 단백질이 적정한 수준으로 정제되고 나면, 펩티드 미세서열 분석 또는 통상의 에드만형 아미노산 서열 분석을 사용한다(이러한 유형의 실험에 사용되는 프로토콜 및 장비 설명에 관해서는 golgi.harvard.edu/microchem/을 참조). 축퇴성 프라이머는 단백질 공급원과 가장 흡사한 것으로 알려진 관계물로부터 사용가능한 서열에 기초하여 디자인된다. 이어서, 확립된 프로토콜에 따라 축퇴성 PCR 및 게놈 워킹을 실시하여 입체적 역전 D-페닐글리신 아미노트랜스퍼라제 코딩 서열을 단리한다.

DPGAT 모나틴 생산

상기 (1) 및 (2)에 기술되어 있는 바와 같이 D-하이드록시페닐글리신 아미노트랜스퍼라제를 조 무세포 단백질 추출물로 사용하거나, 상기 (1)에 기술되어 있는 바와 같이 정제한다. S. 멜리로티 및 R. 스파에로이데스 티로신(방향족) 아미노트랜스퍼라제는 WO 03/091396 A2 실시예 1에 기재되어 있는 바와 같이 제조한다. 코마모나스 테스토스테로니 ProA 알돌라제는 WO 03/091396 A2 실시예 4에 기재되어 있는 바와 같이 제조한다. 총 단백질의 분석법은 제조사(캘리포니아주 허큘리스 소재)의 프로토콜에 따라 바이오-래드 단백질 분석법을 이용하여 수행한다.

반응 혼합물(1mL 용량, 2회 실시)은 100mM 인산칼륨 완충액(pH 8), 2mM MgCl₂, 0.05mM 피리독살 5'-포스페이트(PLP), 200mM 피루브산나트륨, 5mM 나트륨 α-케토글루타레이트, 세포 추출물로 제공되는, 대략 280㎍/mL의 S. 멜리로티 TatA, 100㎕/mL의 D-하이드록시페닐글리신 아미노트랜스퍼라제 세포 추출물 또는 1 mg/mL 정제된 D-하이드록시페닐글리신 아미노트랜스퍼라제, 및 세포 추출물로서 제공되는 대략 100㎍/mL의 ProA 알돌라제를 포함한다. 고체 트립토판을 10.2mg/ml의 농도로 가한다. 음성 대조군은 D-하이드록시페닐글리신 아미노트랜스퍼라제를 포함하지 않는 것으로 설정한다. 샘플을 약 1시간 동안 또는 밤새도록 약하게 진탕시키면서 30℃에서 인큐베이션시켰다. 샘플을 원심분리하여 침전물을 제거하고, 주사기로 여과하고, 실시예 1에 기술된 LC/MS/MS 방법을 사용하여 모나틴을 분석하기 이전에 -80℃에서 저장한다.

모나틴 생산에 대한 활성이 향상된 D-하이드록시페닐글리신 아미노트랜스퍼라제는 돌연변이 유발성 PCR, 계대 돌연변이 유발성 균주, 또는 위치 지정 돌연변이 유발법을 비롯한, 당업자에게 공지되어 있는 돌연변이 유발법 기법에 의해 제조된다. 향상된 D-하이드록시페닐글리신 아미노트랜스퍼라제는 질소원으로서 R,R-모나틴을 포함하는 최소 배지 상에서의 성장에 의해 선별된다. 먼저, 선별은 성장에 기초하지만, 향상된 아미노트랜스퍼라제가 선별됨에 따라 스크린은 성장 속도에 기초한다. 즉, 돌연변이화된 버전의 유전자를 갖는 세포가 성장하고, 유전자는 질소원으로서 R,R-모나틴을 포함하는 최소 배지에서 발현된다. 돌연변이화된 버전의 유전자를 갖는 세포의 성장 속도를 돌연변이화되지 않은 버전의 것과 비교한다. 성장 속도가 더 빠른 세포를 선별하고, 아미노트랜스퍼라제를 추가로 분석한다. D-하이드록시페닐글리신 아미노트랜스퍼라제는 사용가능한 기법, 예로서, 오류 빈발 PCR 및 계대 돌연변이 유발성 균주에 의해, 또는 예로서, DNA 셔플링 및 다른 유도 진화 기법과 같이 허가받은 방법에 의해 돌연변이를 유발한다.

DPGAT 분석법

재조합 D-하이드록시페닐글리신 아미노트랜스퍼라제를 포함한 세포를 배양하고, 단백질을 발현시키고, 실시예 17에 기술되어 있는 바와 같이, 또는 표준 프로토콜에 의해 세포를 용해시켰다. 단백질은 그의 천연 숙주에서 기술된 방법(문헌 [Wiyakrutta, W., Meevootisom, V. A stereoinverting D-phenylglycine aminotransferase from Ps eudomonas stutzeri ST-201:purification, characterization, and application for D-phenylglycine synthesis. J. BiotechnoL, 55: 193-203 (1997)])을 사용하여 발현된다.

무세포 추출물을 최종 농도가 100mM 인산칼륨(pH 7.0-8.5), 60mM D-페닐글리신(또는 D-4-하이드록시페닐글리신), 5mM α-케토글루타레이트, 50μM PLP인 반응 혼합물에 가하였다. 분석법을 실온에서 인큐베이션시키고, 분취량을 시점마다 취하고, 동량의 포름산을 가하여 종결시켰다. 산물(1-글루타메이트)을 실시예 1에 기술되어 있는 바와 같이 정량하다.

실시예 20

D-메티오닌 아미노트랜스퍼라제 유전자 발견

배경

D-메티오닌-피루베이트 아미노트랜스퍼라제(EC 2.6.1.41)는 비록 드물기는 하나, 입체적 역전 트랜스아미나제의 또다른 일례인 것으로 간주된다. 이러한 효소는 D-메티오닌 및 피루베이트로부터 L-알라닌 및 4-메틸티오-2-옥소부타노에이트로의 가역적 전환을 촉진시킨다. 옥살로아세테이트, 페닐피루베이트, 2-옥소부티레이트, 2-옥소 발레레이트, 2-옥소헵타노에이트, 글리옥실레이트, 및 옥소글루타레이트 또한 아미노 수용체로서 사용될 수 있다.

D 또는 L 메티오닌의 아미노전이가 고등 식물(꽃양배추, 토마토, 사과, 완두 줄기, 바나나, 땅콩) 뿐만 아니라, 토양 미생물(에스케리키아 콜라이, 슈도모나스 피시(Pseudomonas pisi), 슈도모나스 애루지노사, 바실러스 마이코이데스(Bacillus mycoides), 아시네토박터 캘코아세티쿠스(Acinetobacter calcoaceticus), 에어로모나스 하이드로필라(Aeromonas hydrophila) B12E, 리조비움 트리폴리(Rhizobium trifolii) N2P7, 페니실륨 디기타툼(Penicillium digitatum), 사카로마이세스 세레비지아에, 코리네박테리움 D7F)에서 에틸렌 생산에 대한 경로의 일부로서 간주된다. 문헌 [D. C. Billington, B. T. Golding, and S. B. Primrose Biochem J. (1979) 182, 827-836]. 박테리아에서, L-메티오닌은 전형적으로 에틸렌 생산 연구에서 기질로서 사용되고, 광범위한 특이성을 갖는 효소, 예로서, E. 콜라이로부터의 TyrB 또는 AspC가 아미노전이를 일으키는 것으로 간주된다. 그러나, 문헌 ([S. B. Primrose J. Gen . MicroBiol . (1976), 95(1), 159-65] 및 [S. B. Primrose J. Gen. MicroBiol . (1977), 98, 519-528])은 E. 콜라이 균주 SPA O(University of Warwick culture collection)가 회분식 배양으로 L-메티오닌으로부터 에틸렌을 생산하는 것과 거의 비슷하게 D-메티오닌으로부터 에틸렌을 생산한다고 나타내었다. 광범위한 특이성을 갖는 D-아미노트랜스퍼라제는 E. 콜라이에서는 동정되지 않았기 때문에 E. 콜라이 D-아미노산 데하이드로게나제(dadA 유전자에 의해 코딩됨)가 D-메티오닌을 4-메틸티오-2-옥소부타노에이트로 전환시킨다는 한가지 가능한 설명이 존재할 수 있다. 그러나, 문헌상에는 상기 효소 어느 것도 기재되어 있지 않지만, E. 콜라이에 메티오닌 라세마제가 존재할 수도 있다.

E. 콜라이와는 대조적으로, 꽃양배추 작은 꽃(미토콘드리아 추출물 제제) 및 발아 땅콩 종자에서 에틸렌 생산은 D-메티오닌 및 피루베이트가 효소 추출물에 제공될 때에 L-메티오닌 및 피루베이트와 비교하여 더욱 높았다(문헌 [L.W. Mapson, J.F. March, and D.A. Wardale Biochem J. (1969) 115, 653-661]; [J.I. Durham, P.W. Morgan, J.M. Prescott and CM. Lyman Phytochemistry (1973) 12, 2123-2126]). 그러므로, 메티오닌 라세마제 및 L-아미노트랜스퍼라제의 조합 가능성은 본 데이타를 통해 입증되지 못한다. 데하이드로게나제 활성은 꽃양배추의 세포 추출물의 투석에 의해 배제시켰고, 어떤 NAD도 분석 혼합물에는 존재하지 않았다. 어떤 것도 산소를 소비한 것으로 기록되지 않았고, FAD도 필요로 하지 않았는 바, 옥시다제 활성을 배제시켰다. 땅콩 조직으로부터 D-메티오닌 아미노트랜스퍼라제를 정제하였는데, 이는 PLP에 의존하는 것으로 나타났고, L-메티오닌 아미노트랜스퍼라제 활성과는 무관한 것으로 나타났다. 이들 D-메티오닌-피루베이트 아미노트랜스퍼라제가 실제로 부산물로서 D-알라닌을 생산하고(실시예 13 및 14에 기술되어 있는 바실러스 효소와 유사), 세포는 D-알라닌을 L-알라닌(또는 유사한 아미노 공여체)로 재순환시키는 알라닌 라세마제를 함유한다는 가능성이 존재할 수 있다. 어느 경우이든, 고등 식물로부터 광범위한 특이성을 갖는 D-아미노트랜스퍼라제를 발견하는 것은 R,R 모나틴 또는 S,R 모나틴을 생산하는 공정 개발에 이로울 것이다.

실험 개관

D-메티오닌 아미노트랜스퍼라제는 표준 크로마토그래피 프로토콜 및 파미시아 AKTA 익스플로러 시스템(Pharmacia AKTA Explorer system)을 사용하여 꽃양배추 작은 꽃 및 발아 땅콩 배아로부터 부분적으로 정제한다. 상동성 단백질의 단백질 서열을 LC/MS/MS 핑거프린팅 기법에 의해 측정하고, 하버드 미량화학 시설(Harvard Microchemistry facility)에 의해 데이타베이스 검색을 실시한다. 식물 유전자의 코딩 영역은 실시예 19에 기술되어 있는 바와 같이 유전자 합성에 의해 표준 PCR 프로토콜을 사용하여 cDNA 라이브러리로부터 클로닝한다.

별법으로, D-메티오닌의 존재하에 성장시킨(및 에틸렌을 생산하는) 꽃양배추 조직 또는 땅콩 종자로부터 cDNA 발현 라이브러리를 작제한다(캘리포니아주 라호야에 소재하는 Stratagene). E. 콜라이 제네틱 스톡 센터(Genetic Stock Center)(Yale)로부터 입수한 E. 콜라이 메티오닌 영양 요구성 균주, 예로서, 균주 RC519 또는 AB 1931 내로 상기 라이브러리를 형질전환시킨다. D-메티오닌을 함유하는 최소 배지 상에서 성장할 수 있는 균주의 플라스미드는 관심의 대상이 되는 코딩 영역을 함유한다(유사한 스크리닝 기법에 관해 실시예 15 참조).

일단, 관심의 대상이 되는 코딩 영역을 수득하고, 표준 E. 콜라이 라보라토리 균주에서 발현시키고 난 후, 실시예 19에 기술된 바와 같이 D-하이드록시페닐글리신 아미노트랜스퍼라제 대신 생성된 유전자 산물을 분석법에 사용하여 R,R 모나틴을 생산할 수 있는데, 단, pH가 7.5(아미노트랜스퍼라제에 대한 최적의 pH)인 것은 예외로 한다. D-메티오닌 아미노트랜스퍼라제가 D-아미노산 공여체 기질에 대한 엄격한 필요조건을 갖는다면, 실시예 13 및 14에 기술되어 있는 바와 같이 R,R 모나틴을 제조하기 위해 상기 효소를 사용할 수 있다. 실시예 19에 기술된 바와 같이 유전자를 돌연변이화시키고, 활성 증가에 대하여 스크리닝할 수 있다.

방법

꽃양배추로부터의 단리

새로 채취한 400g의 꽃양배추 작은 꽃은 적셨다가 블렌더를 사용하여 혼합하는 것을 교대로 하여 4℃의 400mL 수크로스/완충 용액(0.4M 수크로스 및 0.1M 인산나트륨 완충액(pH 7.4))으로 추출한다. 세포 파편은 치즈천을 사용하여 여과함으로써 제거하고, 생성된 용액을 4℃에서 30분 동안 40,000Xg로 원심분리한다. 고체 물질(미토콘드리아 세포소기관 함유)을 20mL의 10mM 인산나트륨 완충액(pH 7.4)에 재현탁시키고, 효소를 200mL 냉(-30℃) 아세톤으로 추출한다. 현탁액을 재원심분리하고, 서번트 스피트 배크(Savant Speed Vac)를 사용하여 침전물을 건조시킨다. 고체 물질을 10mM 인산나트륨 완충액(pH 7.4)에 용해시키고, 잔류 아세톤은 PD-10 칼럼(뉴저지주 피츠카타웨이에 소재하는 GE Healthcare)을 사용하여 제거한다.

아미노트랜스퍼라제 활성은 0.1M 인산나트륨 완충액(pH 7.4)중 5mM D-메티오닌, 1mM 피루베이트, 0.05mM PLP 및 2mM EDTA에 함께 효소 제제를 인큐베이션시킴으로써 분석한다. 16시간 동안 25℃에서 분석을 실시한다. LC/MS(m/z 328) 및 실시예 1에 기술된 것과 유사한 방법론을 사용하여 2,4-디니트로페닐하이드라존 유도체의 형성에 의해 4-메틸티오-2-옥소부타노에이트를 측정한다. 2M 황산중 0.4%(w/v)의 2,4-디니트로페닐하이드라진 용액을 제조하고, 인큐베이션시킨 후, 상기 용량의 절반을 분석 혼합물에 가한다. 혼합물을 30분 동안 30℃에서 약하게 진탕시키면서 혼합하고, 침전물은 원심분리에 의해 수집하고, LC/MS에 의해 분석한다. 표준 크로마토그래피 기법에 의해 분리된 단백질 분획은 유사한 방식으로 활성에 대하여 분석하지만, 공-산물 알라닌은 실시예 1에 기술된 OPA 칼럼 후 유도체화 기법에 의해 측정한다.

땅콩(아르키아 히포게아 L. c. 스타르(Arachia hypogea L. cv . Starr)으로부터의 단리

문헌 [J.I. Durham, P.W. Morgan, J.M. Prescott and CM. Lyman Phytochemistry (1973) 12, 2123-2126]의 방법에 따라 발아 땅콩 배아 균질액(떡잎은 제외)으로부터 D-메티오닌 아미노트랜스퍼라제 효소를 정제한다. 조 추출물을 제조하는 동안 환원제를 사용하여 효소를 안정화시키고, 세포 파편은 33,000Xg으로 원심분리하여 제거한다. 저온에서 인큐베이션시키거나, 침전물내 단백질을 제거하여 35-50% 황산암모늄 분별을 추가로 정제한다. 이어서 겔 여과 크로마토그래피(Sephadex 200, 뉴저지주 피츠카타웨이에 소재하는 GE Healthcare)에 의해 활성 풀을 추가로 정제한다.

트랜스아미나제 단백질의 사용으로 단백질 분획이 강화됨에 따라, 미세서열 분석을 위해 관심의 대상이 되는 효소를 분리시키기 위하여 2D-겔 전기영동을 사용하다. NCBI에 기탁된 식물 서열중 상동성 코딩 영역을 밝혀낸 후, 표준 분자 생물학 기법을 사용하여 에스케리키아 콜라이에서 D-아미노트랜스퍼라제 단백질을 재조합으로 생산한다. 실시예 19(입체적 역전 트랜스아미나제) 또는 실시예 13 및 14(광범위한 특이성을 갖는 D-아미노트랜스퍼라제)에 기술되어 있는 바와 같이 R,R 모나틴을 생산하는데 꽃양배추 작은 꽃 또는 땅콩 종자로부터의 세포 추출물, 또는 재조합으로 생산된 상동성 효소가 사용될 수 있을 것으로 예측된다.

실시예 21

L-알라닌 아미노트랜스퍼라제 /알라닌 라세마제 /D-알라닌 아미노트랜스퍼라제

도 4, 6, 및 8은 L-아미노산 아미노트랜스퍼라제(예로서, L-알라닌-아미노트랜스퍼라제 및/또는 L-트립토판-아미노트랜스퍼라제), R-특이 알돌라제, 알라닌 라세마제 및 D-알라닌 아미노트랜스퍼라제를 사용하여 L-트립토판으로부터 입체이성적으로 증폭된 R,R 모나틴을 생산하는 생합성 경로를 도시한다.

트립토판-특이 아미노트랜스퍼라제는 실시예 16에 기술되어 있다. 별법으로, S. 멜리로티 및 R. 스파에로이데스 티로신(방향족) 아미노트랜스퍼라제는 WO 03/091396 A2 실시예 1에 기재되어 있는 바와 같이 제조한다. 코마모나스 테스토스테로니 ProA 알돌라제는 WO 03/091396 A2 실시예 4에 기재되어 있는 바와 같이 제조한다. 총 단백질의 분석법은 제조사(캘리포니아주 허큘리스 소재)의 프로토콜에 따라 바이오-래드 단백질 분석법을 이용하여 수행한다. 알라닌 라세마제는 시그마-알드리치(Sigma-Aldrich)(미주리주 세인트루이스에 소재)(카탈로그 번호 A8936)로부터 구입한다. D-알라닌 아미노트랜스퍼라제는 바이오카탈리틱스(바이오Catalytics)(카탈로그 번호 AT-103)(캘리포니아주 패서디나에 소재하는 BioCatalytics)로부터 구입한다.

L-알라닌 아미노트랜스퍼라제는 진핵생물, 박테리아, 및 원시세균에 널리 분포되어 있다. 하기 유기체들이 L-알라닌 아미노트랜스퍼라제(E. C. 2.6.1.2)를 함유하는 것으로서 동정되었다(서열 상동성에 기초): 아라비돕시스 탈리아나, 아쉬비아 고쉬피(Ashbya gossypii), 아조토박터 바인랜디(Azotobacter vinelandii), 비피도박테리움 론검(Bifidobacterium longum), 캐노하디티스 엘레강스(Caenorhabditis elegans), 칸디다 알비칸스(Candida albicans), 칸디다 글라브라타(Candida glabrata), 클라미도모나스 라인하르티(Chlamydomonas reinhardtii), 크립토코쿠스 네오포르만스(Cryptococcus neoformans ), 데바리오마이세스 한세니(Debaryomyces hansenii), 호모 사피언스(Homo sapiens), 호데움 불가레(Hordeum vulgare), 클루이베로미세스 락티스, 마그나포르테 그리시아(Magnaporthe grisea), 메디카고 트룬카툴라(Medicago truncatula), 무스 무스쿨루스(Mus musculus), 뉴로스포라 크라사(Neurospora crassa), 오리자 사티바(Oryza sativa), 파네로캐츠 크라이소스포리움(Phanerochaete chrysosporium), 피너스 테다(Pinus taeda), 슈도모나스 퓨티다, 피로코커스 압시(Pyrococcus abyssi), 피로코커스 퓨리오서스(Pyrococcus furiosus), 피로코커스 호리코시이(Pyrococcus horikoshii), 랫투스 노르베지쿠스(Rattus norvegicus), 사카로마이세스 세레비지아에, 시조사카로미세스 폼베, 타키후구 루브리페스(Takifugu rubripes), 트리파노소마 크루지(Trypanosoma cruzi), 비브리오 콜레라에, 비브리오 파라해모리티커스(Vibrio parahaemolyticus), 비브리오 불니피쿠스(Vibrio vulnificus), 야로위아 리폴리티카(Yarrowia lipolytica), 및 지 메이스(Zea mays). 추가로, 다수의 아미노트랜스퍼라제는 저수준의 알라닌 아미노트랜스퍼라제 활성을 갖고, 주어진 고수준의 L-글루타메이트 및 피루베이트는 상기를 L-알라닌 및 α-케토글루타레이트로 전환시킬 수 있다. 활성이 낮은 효소는 표준 돌연변이 유발법 기법 예로서, 오류 빈발 PCR 및 계대 돌연변이 유발성 균주에 의해, 또는 유도 진화 기법에 의해 향상된다. L-알라닌 아미노트랜스퍼라제에 대한 유전자는 프라이머를 디자인하는데 널리 사용가능한 것을 사용하고, 유전자/효소를 증폭, 클로닝, 발현 및 정제하는 표준 기법을 사용하여 클로닝된다.

반응 혼합물(1mL 용량, 2회 실시)은 100mM 인산칼륨 완충액(pH 8), 2mM MgCl₂, 0.05mM 피리독살 5'-포스페이트(PLP), 200mM 피루브산나트륨, 5mM 나트륨 α-케토글루타레이트, 세포 추출물로 제공되는, 대략 280㎍/mL의 S. 멜리로티 TatA(또는 기타 L-트립토판 특이 아미노트랜스퍼라제), 100㎕/mL의 알라닌 라세마제 세포 추출물 또는 1 mg/mL 정제된 알라닌 라세마제, 세포 추출물로 제공되는, 대략 280㎍/mL의 280㎍/mL D-알라닌 아미노트랜스퍼라제 및 세포 추출물로서 제공되는 대략 100㎍/mL의 ProA 알돌라제를 포함한다. 고체 트립토판을 10.2mg/ml의 농도로 가한다. 음성 대조군은 알라닌 라세마제를 포함하지 않는 것으로 설정한다. 샘플을 약 1시간 동안 또는 밤새도록 약하게 진탕시키면서 30℃에서 인큐베이션시켰다. 샘플을 원심분리하여 침전물을 제거하고, 주사기로 여과하고, 실시예 1에 기술된 LC/MS/MS 방법을 사용하여 모나틴을 분석하기 이전에 -80℃에서 저장한다. 이들 반응 혼합물에서, L-트립토판 아미노트랜스퍼라제가 아미노 수용체로서 피루베이트가 아닌 α-케토글루타레이트를 사용할 수 있다면, L-알라닌 아미노트랜스퍼라제를 첨가할 수 있으며, 이는 도 6에 나타낸 바와 같이 L-글루타메이트 및 피루베이트를 L-알라닌 및 α-케토글루타레이트로 전환시킨다.

실시예 22

서열 번호: 276, 244, 218, 228, 162, 50, 74, 44, 및 116의 알돌라제를 코딩하는 유전자의 서브클로닝

서열 번호: 276, 244, 218, 228, 162, 50, 74, 44, 및 116의 아미노산 서열을 갖는, 알돌라제를 코딩하는 유전자를 N-말단 His-태그와 함께 pET28b 발현 벡터(위스콘신주 매디슨에 소재하는 Novagen)로 서브클로닝시켜 정제될 수 있도록 하였다. 서열 번호: 275는 서열 번호: 276의 아미노산 서열을 갖는 알돌라제를 코딩하는 유전자의 서열이다. 서열 번호: 243은 서열 번호: 244의 아미노산 서열을 갖는 알돌라제를 코딩하는 유전자의 서열이다. 서열 번호: 217은 서열 번호: 218의 아미노산 서열을 갖는 알돌라제를 코딩하는 유전자의 서열이다. 서열 번호: 227은 서열 번호: 228의 아미노산 서열을 갖는 알돌라제를 코딩하는 유전자의 서열이다. 서열 번호: 161은 서열 번호: 162의 아미노산 서열을 갖는 알돌라제를 코딩하는 유전자의 서열이다. 서열 번호: 49는 서열 번호: 50의 아미노산 서열을 갖는 알돌라제를 코딩하는 유전자의 서열이다. 서열 번호: 73은 서열 번호: 74의 아미노산 서열을 갖는 알돌라제를 코딩하는 유전자의 서열이다. 서열 번호: 43은 서열 번호: 44의 아미노산 서열을 갖는 알돌라제를 코딩하는 유전자의 서열이다. 서열 번호: 115는 서열 번호: 116의 아미노산 서열을 갖는 알돌라제를 코딩하는 유전자의 서열이다.

클로닝에 사용된 프라이머를 표 24에 나타낸다.

[표 24]

상기 알돌라제를 코딩하는 유전자를 PCR에 의해 증폭시키고, 적절한 효소 (Nde I 및 BamH I)로 분해하고, 겔 정제하였다(QIAquick^® Gel extraction Kit(캘리포니아주 발렌시아에 소재하는 Qiagen)). Nde I 및 BamH I로 분해하고, 겔 정제한 pET28로 분해물을 개별적으로 결찰시켰다. 결찰물을 TOP10 세포(캘리포니아주 칼스배드에 소재하는 Invitrogen) 내로 형질전환시켰다. 각개 콜로니로부터의 미니프렙 DNA는 아가로스 겔 전기영동을 사용하는 크기 분석에 의해 인서트의 존재에 대하여 분석하였다. 인서트를 포함하는 단리물을 DNA 서열 분석하였다(매사추세츠주 비벌리에 소재하는 Agencourt).

알돌라제 정제

확인된 알돌라제 클론을 BL21(DE3) 또는 BL21(DE3) pLysS 내로 형질전환시켰다. 30℃ 테리픽 브로쓰(Terrific Broth)에서 밤새도록 유도시켰다. 적절한 항생제와 함께 밤새도록 배양된 배양물을 새 배지로 희석하고(전형적으로 1:100), 37℃ 통기하에 OD₆₀₀ ~0.6까지 배양하였다. 이어서, 배양물을 1mM IPTG로 유도하고, 30℃(통기하에)로 이동시키고, 밤새도록 계속하여 인큐베이션시켰다. 원심분리하여 세포를 수거하였다. 세포 펠릿은 전형적으로 냉동 해동 순환을 1회에 걸쳐 실시하여 세포 용해에 도움을 주었다. 세포 펠릿을 벅버스터 및 벤조나제 뉴클레아제(Benzonase Nuclease)(위스콘신주 매디슨에 소재하는 Novagen)(제조사의 프로토콜에 따름)에 용해시켰다. 원심분리에 의해 세포 파편을 제거하였다. 조 단백질 추출물을 제조사의 프로토콜에 따라 제조된 10mg 용량의 HIS-Bind 칼럼(위스콘신주 매디슨에 소재하는 Novagen)에 적용시켰다. 칼럼을 세척하고, 제조사의 프로토콜에 따라 단백질을 용리시켰다. PD-10 칼럼(뉴저지주 피츠카타웨이에 소재하는 GE Healthcare)로 정제된 단백질을 탈염시키고, 4mM MgCl₂, 200mM NaCl을 함유하는 50mM 인산칼륨 완충액(pH 7.5)에서 용리시켰다. 정제된 단백질은 아미콘(Amicon) 원심분리 농축기(5000MW 컷오프)(매사추세츠주 빌레리카에 소재하는 Millipore)로 농축시켰다. 농축시킨 후, 서열 번호: 44, 서열 번호: 28, 및 서열 번호: 276의 알돌라제는, 비록 활성이 여전히 매우 높기는 하였지만, 다소간의 침전 수준을 나타내었다는 것으로 기록되었다. 분석시까지 단백질을 -80℃에 저장하였다.

단백질 표준으로서 소 혈청 알부민("BSA": Bovine Serum Albumin)을 포함하는 미세역가 플레이트 프로토콜 및 피어스(Pierce) BCA 키트(일리노이주 록퍼드에 소재하는 Pierce)를 사용하여 단백질 분석을 수행하였다. 엑스페리온(Experion) Pro260 전기영동 시스템(캘리포니아주 허큘리스에 소재하는 Bio-Rad) 또는 SDS-PAGE를 사용하여 정제된 샘플내 알돌라제의 백분율(%)을 추정하고, 가용성 세포 추출물중 및 총 단백질중 발현 수준을 평가하였다.

정제된 알돌라제 시험

정제된 알돌라제를, D-트립토판으로부터 R,R 모나틴을 생산할 수 있는 그의 능력에 관하여 시험하고, 동일한 방식으로 제조된 서열 번호: 28 및 서열 번호: 54의 알돌라제와 비교하였다. 분석마다 동일한 농도(50㎍/mL)의 효소를 사용하나, 서열 번호: 244는 예외적으로 25㎍/mL인 것을 사용하여 미세원심분리관(2회)에서 정제된 단백질에 관하여 분석을 실시하였다. 서열 번호: 243은 잘 발현하지 못했고, 보다 소량의 정제된 단백질이 수득되었다. 2mg/mL의 바이오카탈리틱스 AT-103(캘리포니아주 패서디나에 소재하는 BioCatalytics)을 D-아미노트랜스퍼라제로서 사용하였다. 반응 혼합물 1mL당 하기를 가하였다: 알돌라제, 4mM MgCl₂, 50mM D-트립토판, D-아미노트랜스퍼라제, 200mM 피루브산나트륨, 100mM 인산칼륨 완충액(pH 7.5, 및 0.05mM PLP. 샘플을 30℃에서 인큐베이션시켰다. 30분, 1시간, 3시간, 및 밤새(19시간) 인큐베이션된 샘플을 채취하였다. 표 25는 역상 피크 면적에 의해 측정된, 각 시점에서 생산된 총 모나틴의 평균 결과 및 생산된 R,R 모나틴(%)를 나타낸다. 표 25 세번째 칸에서 실시예 1에 기술된 바와 같은 추가의 FDAA-유도체화 LC/MS/MS 분석은 몇몇 반응에 대하여 실시하고, 그 결과는 괄호 안에 표시한다.

[표 25]

서열 번호: 276 알돌라제는 고수준의 활성을 유지하였을 뿐만 아니라, R,R 모나틴 생산에 대하여 가장 높은 입체특이성도 유지하였다. 염화나트륨이 빠진 완충액에 상기 효소를 저장하는 것이 앞서 보고된 침전물 수준을 낮춰주는 것으로 보인다. 저장 완충액 중 마그네슘의 농도는 침전 수준에 별 영향을 주지 않는 것으로 보인다.

서열 번호: 276, 서열 번호: 28, 및 서열 번호: 244의 알돌라제 모두 R,R 모나틴 생산에 대한 활성이 높고 입체선택성이 높다는 것이 입증되었다. 이들 3개의 효소는 실시예 23에 기술되어 있는 바와 같이 제조하고, 10mL 혈청용 바이알을 사용하여 실시예 24에 기술되어 있는 바와 같이 혐기성으로 분석하였다. 0.05mg/mL의 각 알돌라제(정제된 것) 및 실시예 24에 기술되어 있는 바와 같이 제조된 2mg/mL의 정제된 B. 스파에리쿠스(B. sphaericus) D-아미노트랜스퍼라제를 사용하여 7mL에 대한 분석을 수행하였다. D-트립토판으로부터의 모나틴 생산에서 각 알돌라제 활성을 실시예 27에 기술되어 있는 바와 같이 제조된 S. 멜리로티 HMG 알돌라제와 비교하였다. 실시예 1에 기술되어 있는 LC-OPA 방법을 사용하여 전체 모나틴을 추정하였다. 실시예 1에 기술되어 있는 FDAA 유도체화 방법을 사용하여 형성된 R,R 모나틴의 백분율(%)을 측정하였다. 결과는 하기 표 26에 나타낸다.

[표 26]

이들 결과는 서열 번호: 276의 알돌라제가 대량의 혐기성 반응에서도 R,R 모나틴을 고수준으로 생산한다는 것을 입증한다.

실시예 23

서열 번호: 276 알돌라제의 발현 및 정제

pET28b 플라스미드 상에 서열 번호: 275로서 열거된 알돌라제 유전자를 수반하는 E. 콜라이 BL21(DE3)pLysS 숙주를 클로닝하는 것은 상기 실시예 22에 기술되어 있다.

진탕 플라스크내 50㎍/mL 카나마이신을 함유하는 EMD 바이오사이언스 오버나이트 익스프레스 시스템 II(EMD Biosciences Overnight Express System II)(위스콘신주 매디슨에 소재하는 Novagen)(용액 1-6)를 사용하여 아미노-말단 HIS₆-정제 태그를 갖는 서열 번호: 276 알돌라제를 생산하였다. 이러한 발현 시스템은 세포 성장을 모니터할 필요없이, IPTG 유도성 시스템의 발현을 유도한다. 알돌라제 작제물의 액상 배양물 또는 플레이트로부터 200mL 분취량의 배지(1L 플라스크중)를 접종한 후, 배양물을 225rpm으로 진탕시키면서 3O℃에서 밤새도록 인큐베이션시켰다. OD_600nm가 최소 6에 도달하였을 때, 원심분리하여 세포를 수거하고, 완충액으로 1회에 걸쳐 세척하였다.

알돌라제를 함유하는 무세포 추출물을 제조하기 위하여, 세포를 3-4용량의 100mM 인산칼륨(pH 7.8)에 현탁시키고, 현탁액의 온도를 15℃ 미만으로 유지시키면서 마이크로플루이딕스(Microfluidics) 균질기(매사추세츠주 뉴턴에 소재하는 Microfluidics)를 사용하여 파괴하였다(18,000psi로 3회 통과). 별법으로, 제조사의 프로토콜에 따라 1㎕/mL 벤조나제^® 뉴클레아제, 5㎕/mL 프로테아제 저해제 칵테일 세트 II, 및 0.033㎕/mL r리소자임(rLysozyme)™을 함유하는 EMD 바이오사이언스 벅버스터^®(1차 아민 무함유) 추출 시약(위스콘신주 매디슨에 소재하는 Novagen)을 사용하여 무세포 추출물을 제조하였다. 이후의 모든 정제 단계는 4℃에서 수행하였다. 세포 현탁액을 15,000-20,000xg으로 20-30분 동안 원심분리하여 세포 파편을 제거하였다. 무세포 추출물의 20-25mL의 분취량을, 앞서 200mM 염화나트륨을 함유하는 100mM 인산칼륨으로 평형화된 45mL의 GE 헬쓰케어 킬레이팅 세파로스™ 패스트 플로우 수지(Healthcare Chelating Sepharose Fast Flow resin) 칼럼(니켈(II)형)(뉴저지주 피츠카타웨이에 소재하는 GE Healthcare)에 적용시킨다. 니켈형의 수지를 생성하기 위하여 수지를 150mL의 200mM 황산니켈(II) 6수화물 및 150mL의 증류수로 세척하였다. 샘플을 로딩한 후, 25mM 이미다졸을 함유하는 150mL의 평형 완충액, 50mM 이미다졸을 함유하는 150mL의 평형 완충액 및 500mM 이미다졸을 함유하는 150mL의 평형 완충액으로 칼럼을 세척/용리시켰다. HIS₆-태깅된 단백질이 최종 세척시에 용리되었다. 500mM 이미다졸 세액은 제조사의 설명서에 따라 밀리포어/아미콘 세트리콘 플러스(Millipore/Amicon Centricon Plus)-70 원심분리식 여과기 장치(MWCO 10kDa)(매사추세츠주 빌레리카에 소재하는 Millipore)을 사용하여 15-20mL로 농축시켰다. 100mM 인산칼륨(pH 7.8)으로 앞서 평형화된 1회용 GE 헬쓰케어 PD10 칼럼(뉴저지주 피츠카타웨이에 소재하는 GE Healthcare)(칼럼당 2.5mL 샘플)을 통과시켜 이미다졸 및 염화나트륨을 제거하였다.

단백질 표준에 따라 BSA를 사용하여 피어스 BCA 분석 키트(일리노이주 록퍼드에 소재하는 Pierce)를 사용함으로써 각 분획의 단백질 농도를 측정하였다. 바이오-래드 엑스페리온 미소모세관 칩 시스템(캘리포니아주 허큘리스에 소재하는 Bio-Rad)을 사용하거나, 미니 프로티안(Mini PROTEAN)^® 3 세포용 기구(캘리포니아주 허큘리스에 소재하는 Bio-Rad)에서 이동하는 바이오-래드 4-15% SDS-폴리아크릴아미드 구배 겔을 사용하여 무세포 추출물중 각 분획의 순도 및 발현 수준을 측정하였다. 바이오-래드 바이오-세이프(Bio-Rad Bio-Safe) G-250 쿠마시 염색(캘리포니아주 허큘리스에 소재하는 Bio-Rad)을 사용하여 폴리아크릴아미드 겔중의 단백질을 시각화하고, 물로 탈색시켰다. 전형적으로 이러한 방법을 통해서 엑스페리온 소프트웨어에 의해 판정된 순도 85-95%의, 밤새도록 배양된 배양물 400mL로부터 ~50mg의 효소를 생산한다. 분취량(1-5mL)의 정제된 효소를 사용할 때까지 -80℃에서 저장하였다. 이러한 방식으로 효소 제제가 앞서 언급된 효소 침전물 수준을 감소시켰다. 저장 완충액내 마그네슘이 존재하는 것은 침전 수준에는 어떠한 영향도 미치지 않았다.

실시예 24

서열 번호: 276 알돌라제를 사용한 R,R- 모나틴 생산: 반응 조건의 최적화

성장 및 유도용의 EMD 바이오사이언스 오버나이트 익스프레스 시스템 II(위스콘신주 매디슨에 소재하는 Novagen)를 사용하여 하기 기술되는 바와 같이 HIS₆-태깅된 단백질로서 실시예 7에서 클로닝된 바실러스 스파에리쿠스(ATCC 균주 10208) D-알라닌 아미노트랜스퍼라제를 정제하였다. EMD 바이오사이언스 오버나이트 익스프레스 시스템 II(용액 1-6)(위스콘신주 매디슨에 소재하는 Novagen)는 진탕 플라스크중 50㎍/mL 카나마이신을 함유하였다. 이러한 발현 시스템은 세포 성장을 모니터할 필요없이, IPTG 유도성 시스템의 발현을 유도한다. 아미노트랜스퍼라제 작제물의 액상 배양물 또는 플레이트로부터 200mL 분취량의 배지(1L 플라스크중)를 접종한 후, 배양물을 225rpm으로 진탕시키면서 3O℃에서 밤새도록 인큐베이션시켰다. OD_600nm가 최소 6에 도달하였을 때, 원심분리하여 세포를 수거하고, 완충액으로 1회에 걸쳐 세척하였다.

D-알라닌 아미노트랜스퍼라제를 함유하는 무세포 추출물을 제조하기 위하여, 세포를 50μM 피리독살 포스페이트(PLP)를 함유하는 3-4용량의 100mM 인산칼륨(pH 7.8)에 현탁시키고, 현탁액의 온도를 15℃ 미만으로 유지시키면서 마이크로플루이딕스 균질기(매사추세츠주 뉴턴에 소재하는 Microfluidics)를 사용하여 파괴하였다(18,000psi로 3회 통과). 별법으로, 제조사의 프로토콜에 따라 1㎕/mL 벤조나제^® 뉴클레아제, 5㎕/mL 프로테아제 저해제 칵테일 세트 II, 및 0.033㎕/mL r리소자임™을 함유하는 EMD 바이오사이언스 벅버스터^®(1차 아민 무함유) 추출 시약(위스콘신주 매디슨에 소재하는 Novagen)을 사용하여 무세포 추출물을 제조하였다. 이후의 모든 정제 단계는 4℃에서 수행하였다. 세포 추출물을 15,000xg으로 20-30분 동안 원심분리하여 세포 파편을 제거하였다. 무세포 추출물의 20-25mL의 분취량을, 앞서 200mM 염화나트륨 및 50μM PLP를 함유하는 100mM 인산칼륨으로 평형화된 45mL의 GE 헬쓰케어 킬레이팅 세파로스™ 패스트 플로우 수지 칼럼(니켈(II)형)(뉴저지주 피츠카타웨이에 소재하는 GE Healthcare)에 적용시킨다. 니켈형의 수지를 생성하기 위하여 수지를 150mL의 200mM 황산니켈(II) 6수화물 및 150mL의 증류수로 세척하였다. 샘플을 로딩한 후, 25mM 이미다졸을 함유하는 150mL의 평형 완충액, 50mM 이미다졸을 함유하는 150mL의 평형 완충액 및 500mM 이미다졸을 함유하는 150mL의 평형 완충액으로 칼럼을 세척/용리시켰다. HIS₆-태깅된 단백질이 최종 세척시에 용리되었다. 500mM 이미다졸 세액은 제조사의 설명서에 따라 밀리포어/아미콘 세트리콘 플러스-70 원심분리식 여과기 장치(MWCO 10kDa)(매사추세츠주 빌레리카에 소재하는 Millipore)을 사용하여 15-20mL로 농축시켰다. 0.5μM PLP를 함유하는 100mM 인산칼륨(pH 7.8)으로 앞서 평형화된 1회용 GE 헬쓰케어 PD10 칼럼(뉴저지주 피츠카타웨이에 소재하는 GE Healthcare)(칼럼당 2.5mL 샘플)을 통과시켜 이미다졸 및 염화나트륨을 제거하였다. 칼럼당 3.5mL의 동일한 완충액을 사용하여 정제된 아미노트랜스퍼라제를 용리시켰다.

단백질 표준에 따라 BSA를 사용하여 피어스 BCA 분석 키트(일리노이주 록퍼드에 소재하는 Pierce)를 사용함으로써 각 분획의 단백질 농도를 측정하였다. 바이오-래드 엑스페리온 미소모세관 칩 시스템(캘리포니아주 허큘리스에 소재하는 Bio-Rad)을 사용하거나, 미니 프로티안^® 3 세포용 기구(캘리포니아주 허큘리스에 소재하는 Bio-Rad)에서 이동하는 바이오-래드 4-15% SDS-폴리아크릴아미드 구배 겔을 사용하여 무세포 추출물중 각 분획의 순도 및 발현 수준을 측정하였다. 바이오-래드 바이오-세이프 G-250 쿠마시 염색(캘리포니아주 허큘리스에 소재하는 Bio-Rad)을 사용하여 폴리아크릴아미드 겔중의 단백질을 시각화하고, 물로 탈색시켰다. 전형적으로 이러한 방법을 통해서 엑스페리온 소프트웨어에 의해 또는 SDS-PAGE 겔 분석으로부터 판정된 순도 85-95%의, 밤새도록 배양된 배양물 200mL로부터 ~50mg의 효소를 생산한다. 분취량(1-5mL)의 정제된 효소를 사용할 때까지 -80℃에서 저장하였다.

서열 번호: 276 알돌라제(실시예 22에서 클로닝됨)는 실시예 23에 기술되어 있는 바와 같이 HIS₆-태깅된 단백질로서 정제되었다.

서열 번호: 276 알돌라제에 대하여 바람직한 금속 보조 인자는 다양한 2가 금속을 스크리닝하여 결정하였다. 최종 용량을 7mL로 하여 10mL 혈청용 병용기중 혐기성인 것으로 반응을 설정하였다. 100mM 인산칼륨(pH 7.8), 200mM 피루브산나트륨, 0.05mM PLP 및 0.01%(v/v) 트윈 80으로 구성된 벌크 용액은 최종 용량을 48.8mL으로 제조하고, 30분 동안 질소를 살포하였다. D-트립토판(143mg; 최종 농도 100 mM)을 7개의 10mL 혈청용 바이알에 분배하였다. 염화물 염(최종 농도 4mM)으로부터 제조된 2가 금속 양이온의 2M 스톡 용액 0.014mL를 각 바이알에 가하였다. 음성 대조군의 경우, 0.014mL의 dH₂O를 가하였다. 혈청용 바이알은 고무 격막으로 뚜껑을 덮고, 16-18 게이지 니들을 통해 질소를 살포하였다. 혐기성 조건하에서 5.625mL의 혐기성 벌크 용액을 각각의 혐기성 혈청용 병 용기에 가하였다. 이어서, B. 스파에리쿠스 D-알라닌 아미노트랜스퍼라제 및 서열 번호: 276 알돌라제를 각각 최종 농도 2mg/mL 및 0.05mg/mL로 하여 각 혈청용 병용기에 혐기성으로 가하였다. 용액을 18시간 동안 완만하게 혼합하면서 실온에서 인큐베이션시켰다. 아미노산의 액상 크로마토그래피-이후의 칼럼 형광 검출 방법을 사용하여 실시예에 기술된 방법에 따라 최종 모나틴을 분석하였다(표 27).

[표 27]

통계학적 소프트웨어 디자인 엑스퍼트 7.0.0(미네소타주 미니애폴리스에 소재하는 Stat-Ease, Inc.)을 사용하여 디자인된 2수준 부분 요인 실험을 사용하여 서열 번호: 276 알돌라제에 대한 반응 조건을 추가로 조사하였다. 스크리닝 디자인은 4개의 중심점을 사용하여 2개의 수준으로 5개 인자에 관한 단일 블록으로 구성되었다(총 20회 실행). 최적화된 5개의 인자는 금속 보조 인자 농도, 반응 pH, 트윈® 80 농도, 피루베이트 대 트립토판 비, 및 알돌라제 농도였다(표 28).

밤새도록 혐기성 글러브 박스(미시간주 글래스 레이크에 소재하는 Coy Laboratory Products, Inc)에서 143mg의 D-트립토판을 함유하는 원추형 폴리프로필렌 관(14mL)으로부터 산소를 제거하였다. 2M MgCl₂; 1M 인산칼륨(pH 7.0, 7.75, 및 8.5); 10%(v/v) 트윈^® 80; 2M 피루브산나트륨, 및 10mM PLP(피리독살 5'-포스페이트)의 스톡 용액을 탈기수에서 제조하고, 밤새도록 혐기성 글러브 박스에서 평형화시켰다. 정제된 B. 스파에리쿠스 D-알라닌 아미노트랜스퍼라제 및 서열 번호: 276 알돌라제의 스톡 용액을 얼음상에서 해동시키고, 혐기성 글러브 박스에서 즉시 사용하였다. D-트립토판을 함유하는 14mL 원추형 관에 스톡 용액을 가하여 통계학적 디자인에 의해 측정되는 농도를 얻었다(표 28). 효소 첨가와 함께, 탈기수를 각 관에 가하여 최종 용량이 7.0mL가 되도록 하였다. 24시간 이하의 기간 동안 완만히 혼합시키면서 실온하에 혐기성 글러브 박스에서 관을 인큐베이션시켰다. 실시에 1에 기술된 방법에 따라 아미노산의 액체 크로마토그래피-포스트 칼럼 형광 검출 방법 및 시험관내 및 생체내에서의 모나틴 이성체의 분포 측정을 위한 LC/MS/MS 다반응 모니터링 방법(FDAA 유도체화 방법)을 사용하여 모나틴 농도 및 이성체 순도를 분석하였다.

[표 28]

상기 데이타의 통계학적 분석은, 반응 pH, 피루베이트 트립토판 비 및 알돌라제 농도가 모나틴 역가, 이성체 순도 및 탄소 수율에 영향을 주는 중요한 인자라는 것을 지시하였다. 과량의 피루베이트 조건하에서 최고의 모나틴 역가 및 최고의 이성체 순도라는 목표를 최대화시키기 위해 상기 인자들을 달리하는 디자인 엑스퍼트 소프트웨어를 사용하여 요구도 그래프를 작성하였다. 최적인 것으로 지시된 반응 조건은 1mM MgCl₂(pH>8.0), 0.01%(v/v) 트윈^® 80, 및 0.01 mg/mL 서열 번호: 276 알돌라제였다. 이는 전형적인 알돌라제 사용량보다 5배 감소된 양일 뿐만 아니라, 전형적인 2가 금속 사용량보다 4배 감소된 양이다.

반응 공정에 대한 최적의 pH 범위를 결정하기 위하여 추가의 실험을 실시하였다. pH 7.0 내지 9.0으로 pH 단위를 0.2씩 증가시키면서 1M EPPS 완충액의 스톡 용액을 제조하였다. 이들 용액에서 가스를 제거하고, 혐기성 글러브 박스에서 밤새도록 평형화시켰다. 혐기성 글러브 박스에서 밤새도록 143mg의 D-트립토판을 함유하는 폴리에틸렌 관(14mL)에서 산소를 제거하였다. 2M MgCl₂, 10%(v/v) 트윈^® 80, 2M 피루브산나트륨 및 10mM PLP의 스톡 용액은 탈기수에서 제거하고, 혐기성 글러브 박스에서 평형화시켰다. 정제된 B. 스파에리쿠스 D-알라닌 아미노트랜스퍼라제 및 서열 번호: 276 알돌라제의 제제를 얼음 상에서 해동시키고, 혐기성 글러브 박스에서 즉시 사용하였다. 스톡 용액을 14mL 원추형 관에 가하여 관 1개당 총 7mL 용량중 최종 농도가 100mM EPPS, 200mM 피루베이트, 100mM 트립토판, 1mM MgCl₂, 0.01%(v/v) 트윈^® 80, 0.05mM PLP, 2mg/mL B. 스파에리쿠스 D-알라닌 아미노트랜스퍼라제, 및 0.01 mg/mL 서열 번호: 276 알돌라제가 되도록 하였다. 22시간 동안 완만하게 교반하면서 반응물을 혐기성 글러브 박스에서 실온하에 인큐베이션시켰다. 샘플을 취하여, LC/MS/MS 다반응 모니터링 방법을 사용함으로써 실시예 1에 기술되어 있는 바와 같이 모나틴에 대하여 분석하였다(표 29).

[표 29]

본 결과는, pH가 7.0-8.0 사이로 증가함에 따라 모나틴 형성이 증가하였다는 것을 나타내었다. pH 8.0-8.2 범위에서 모나틴 형성은 최대에 도달하였고, pH 8.4보다 높은 범위에서는 감소하였다. 추가로, 모나틴의 이성체의 순도는 pH 8.4보다 높은 범위에서 감소하였다.

pH 8.5에서 서열 번호: 276 알돌라제(0.01 mg/mL), 2mg/mL의 T243N 4978 DAT(태깅되지 않음, 실시예 26), 1mM MgCl₂, 200mM 피루브산나트륨, 0.05mM PLP, 0.01% 트윈-80, 및 100mM D-트립토판을 사용하여 추가의 반응 최적화를 수행하였다. 알돌라제 및 D-아미노트랜스퍼라제 생산에 사용된 세포는 마이크로플루이딕스 균질기(매사추세츠주 뉴턴에 소재하는 Microfluidics)(20,000psi로 3회 통과)를 사용하여 파괴하고 개방시켰다. 원심분리(30분 동안 20,000xg)에 의해 세포 파편을 제거하고, 정화된 세포 추출물을 효소 반응에 사용하였다. 어떤 추가 완충액도 사용하지 않았지만, 수산화나트륨을 사용하여 반응 혼합물의 pH를 8.5로 조정하고, 효소를 첨가하기 이전에 질소로 플러쉬하였다. 헤드스페이스중의 질소를 사용하여 30℃하에 0.7L 식스포(Sixfor) 교반 발효기(스위스 보트민겐에 소재하는 Infors AG)에서 250mL의 반응을 수행하였다. 인산칼륨을 최종 농도 0, 5, 10, 20, 및 50 mM으로 가하였다. 5-10mM 포스페이트를 가하는 것이 최적인 것으로 밝혀졌으며, 이는 3.5 g/L 모나틴을 생산하였다(실시예 1에 기술된 LC/MS/MS에 의해 정량됨).

실시예 25

신규한 바실러스 D-아미노산 아미노트랜스퍼라제의 클로닝

바실러스 D-아미노산 아미노트랜스퍼라제("DAAT: D-amino acid aminotransferase" 또는 "DAT")(D-알라닌 아미노트랜스퍼라제 또는 D-아스파테이트 아미노트랜스퍼라제로도 알려져 있는 EC 2.6.1.21)를 재조합적으로 생산하였다. 이러한 아미노트랜스퍼라제는 R,R 모나틴 생산을 위한 알돌라제와 함께 커플형 분석법에 사용하였다. 이러한 아미노트랜스퍼라제 효소는 모나틴 생산에 대하여 앞서 기술된 바 있는 D-아미노트랜스퍼라제와 상동성이다(미국 공개 출원 번호 제20040063175호 및 미국 공개 출원 번호 제20050282260호). 유기체 ATCC 4978 - 원래는 바실러스 로탄스(Bacillus rotans)로서 기탁된 바실러스 스파에리쿠스- 를 ATCC로부터 주문하고, 이를 사용하여 게놈 DNA를 제조하였다. 공지된 바실러스 D-아미노트랜스퍼라제의 보존을 위해 단백질 서열 영역에서 축퇴성 프라이머을 디자인하고, 상기 언급된 ATCC 균주로부터의 내부 DAAT유전자 서열의 중합효소 연쇄 반응("PCR") 증폭을 위해 사용하였다. BD 게놈 워커(BD Genome Walker)™ 유니버살 키트(캘리포니아주 마운티 뷰에 소재하는 Clontech)를 사용하여 게놈 워킹을 실시하였다. 서열 분석(매사추세츠주 비벌리에 소재하는 Agencourt BioScience Corporation)을 통해 ATCC 4978로부터의 DAAT 유전자에 대한 전체 길이의 코딩 서열을 확인하였다. ATCC 4978로부터의 DAAT 유전자의 DNA 서열은 서열 번호: 357이고, 이를 하기에 나타낸다. 서열 번호: 357의 유전자는 표준 PCR 프로토콜에 의해 증폭될 수 있고, 표준 재조합 DNA 기법을 사용함으로써 클로닝될 수 있다. 서열 번호: 357의 유전자는 또한 당업자에게 알려져 있는 임의의 방법, 예로서, 당업자에게 공지되어 있는 조립 PCR 방법에 의해 재작제될 수 있다.

ATCC 4978 DAAT DNA 서열은

이다.

상기 DNA 서열에 의해 코딩되는 것과 같은, ATCC 4978로부터의 DAAT 유전자의 아미노산 서열은 서열 번호: 358이며, 하기 제시한다:

균주 ATCC 4978로부터 수득한 신규한 D-아미노트랜스퍼라제는 B. 스파에리쿠스 ATCC 10208의 공개된 D-아미노트랜스퍼라제 서열과 비교하였을 때, 뚜렷이 다른 아미노산 잔기 변이를 갖는 단백질 서열을 갖는다. ATCC 4978로부터의 DAAT는 B. 스파에리쿠스(ATCC 10208)로부터의 DAAT와 단지 72%의 동일성만을 갖는다. 상기 균주는 현재 ATCC에 B. 스파에리쿠스로서 명부에 기입되어 있지만, 이는 B. 로탄스(B. rotans)로서 기탁되었다. 상기의 신규한 DAAT와 B. 스파에리쿠스로부터의 DAAT 사이의 서열 정렬 및 가장 두드러진 차이에 기초하여 이들 DAAT 서열 뿐만 아니라 기타의 DAAT 서열에서 R,R 모나틴 생합체에 대한 DAAT 활성을 증가시키는 그의 역할(개별적으로 또는 조합하여)에 대하여 평가할 수 있는 다수의 후보 잔기를 동정한다.

실시예 26

ATCC 4978로부터의 D- 아미노트랜스퍼라제 돌연변이체의 특징화

실험 개관

바실러스 균주 ATCC 4978로부터의 신규한 D-아미노트랜스퍼라제 유전자(실시예 25에 기술)는 위치 지정 방법을 사용하여 돌연변이화시켰다. 돌연변이체 유전자를 발현시키고, 특히 하나 이상의 알돌라제와 커플링되었을 때 모나틴 생산 경로에 대한 관심의 대상이 되는 활성에 대하여 분석하였다.

실시예 16의 위치 지정 돌연변이 유발법 표적에 관한 아이디어 이외에, 실제로 R-MP를 YM-1 결정 구조의 활성 부위 내로 도킹함으로써 4978 아미노트랜스퍼라제 단백질이 상기 영역내 유사한 구조적인 특징을 가질 수 있는지 여부를 측정하기 위하여 1차 아미노산 서열 정렬이 사용될 수 있을 것이라는 다른 아이디어가 전개되었다. (4978 아미노트랜스퍼라제의 아미노산 번호 매김을 사용함으로써) 하기와 같은 추가의 돌연변이가 유익할 것이라고 예측되었다. 153의 알라닌을 아르기닌으로 돌연변이화시키는 것이 기질(R-MP)의 제2 카복실기를 안정화시킬 것이라고 간주되었다. 이러한 변이가 입체 장애를 증가시킬 수 있고, 이를 보상하기 위해 181번 위치 및 182번위치의 세린 잔기가 알라닌 또는 글리신으로 바뀔 수 있다. 아르기닌의 더 벌키한 측쇄를 위한 공간을 만들기 위해 180번, 181번, 또는 182번 위치의 아르기닌을 도입하고, 하나 이상의 다른 세린 잔기를 알라닌 또는 글리신으로 전환시킬 수 있을 것으로도 가정하였다. 200번 아미노산인 페닐알라닌은 활성 부위로 도킹되는 것으로 예측되는 R-MP의 부위와 공간적으로 근접하게 존재하며, 모나틴 아미노전이를 상당 촉진시키는 D-아미노트랜스퍼라제 중에서 상기 잔기내 다량의 변이가 존재한다. 상기 위치에서 아미노산 변형이 유용할 수 있을 것으로 간주되었다. 151번 위치의 루신을 페닐알라닌으로 돌연변이화시키는 것이 잠재적으로는 기질의 인돌 환과의 상호작용을 개선시킬 것으로 예측되었다.

문헌에 기초하여, 243번 위치의 트레오닌을 아스파라긴으로 돌연변이화시키는 것이 아미노전이 반응에 대한 R-MP의 선택성을 개선시킬 수 있을 것이라고 가정하였다. 유사하게, 100번 위치의 아스파라긴을 알라닌으로 돌연변이화시키는 것이 모나틴 아미노전이 반응에 대한 효소의 비활성을 개선시킬 수 있을 것이라고 간주되었다(문헌 ([Ro, et al., FEBS Lett 398: 141-145, (1996)]; [Sugio, S, et al, Biochemistry 54:9661-9669, (1995)]; EP1580268)).

(Lee et al.)은 141-144 영역(루프)의 돌연변이체에 대해 특징화하고, LRcD(본 단백질에 대하여 천연의 것)보다는 EYcY를 갖는 D-아미노트랜스퍼라제가 디카복실산 기질에 대하여 보다 낮은 Km을 갖는 경향이 있다는 것을 밝혀냈다(문헌 [Lee SG, Hong SP, Song JJ, Kim SJ, Kwak MS, Sung MH. Functional and structural characterization of thermostable D-amino acid aminotransferases from Geobacillus spp. Appl Environ Microbiol. 2006 Feb;72(2): 1588-94]). MP는 알파-케토 글루타레이트와 유사한, 디카복실산 기질이기 때문에 MP의 농도는 전형적인 모나틴 생산 반응 혼합물에서 상당히 낮고, 줄어든 Km은 잠재적으로 모나틴 생산을 위한 돌연변이체 DAT의 활성에 도움을 줄 수 있다.

하기에는 4978 D-아미노트랜스퍼라제 돌연변이체를 형성하는 방법과, 이들 돌연변이체를 사용하였을 때의 분석 결과를 기술한다.

돌연변이 유발법

돌연변이 유발법에 대한 프라이머는 스트라테이진 멀티-체인지 키트(캘리포니아주 라호야에 소재하는 Stratagene)에 열거된 제안에 따라 디자인하였다. 프라이머는 5'-인산화되었다. 제조사의 설명서에 따라 스트라테이진 멀티-체인지 키트(캘리포니아주 라호야에 소재하는 Stratagene)를 사용하여 돌연변이 유발법을 수행하였다. 돌연변이 유발법에 사용된 주형은 실시예 25에 기술된 것과 같은 pET30(태깅되지 않음) 또는 pET28(태깅됨) 4978 DAT이다. 프라이머를 하기 표 30에 열거한다:

[표 30]

E. 콜라이 XL10-골드 세포(캘리포니아주 라호야에 소재하는 Stratagene)를 형질전환시키고, 생성된 정제된 플라스미드 제제는 서열 분석하여 올바른 돌연변이가 혼입되었음을 확인하였다.

발현 및 분석법

올바른 돌연변이체 또는 야생형 4978 DAT를 함유하는 플라스미드 DNA 제제를 E. 콜라이 발현 숙주 BL21(DE3)(위스콘신주 매디슨에 소재하는 Novagen) 내로 형질전환시켰다. 상기 기술된 바와 같은 프로토콜을 사용하여 배양물을 배양하고, 퀴아젠 미니프렙 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 플라스미드를 단리하고, 상기 기술된 바와 같이 제한 분해에 의해 분석하여 인서트가 존재함을 확인하였다.

DAAT 유전자의 도입은 전형적으로 카나마이신(50㎍/mL)을 함유하는 LB 배지에서 실시하였다. 세포를 37℃에서 0.4-0.8의 OD_600nm으로 배양하고, 0.1mM IPTG(이소프로필 갈락카토시드)으로 유도하고, 유도 후 3-4시간째에 샘플링하였다.

벅버스터 시약 및 벤조나제 뉴클레아제(위스콘신주 매디슨에 소재하는 Novagen)를 사용하여 세포 추출물을 제조하였다. 약하게 진탕시키면서, 1ml에 대한 분석법을 실시하였고, 이는 10.2mg D-트립토판, 0.05mM PLP, 4mM MgCl₂, 100mM 인산칼륨 완충액(pH 7.5), 대략 50㎍의 알돌라제, 200mM 피루베이트, 및 세포 추출물로서 공급된 0.150-0.5mg/mL D-아미노트랜스퍼라제를 함유하였다. 바이오-래드 총 단백질 키트(Coomassie)(캘리포니아주 허큘리스에 소재하는 Bio-Rad) 또는 피어스 BCA 키트(일리노이주 록퍼드에 소재하는 Pierce)를 사용하여 총 단백질의 분석법을 수행하고, SDS-PAGE 또는 바이오-래드 엑스페리온 자동 전기영동 시스템(캘리포니아주 허큘리스에 소재하는 Bio-Rad)에 의해 D-아미노트랜스퍼라제의 발현율(%)을 추정하였다. 샘플을 3시간째 및 밤새 채취하였다.

서열 번호: 28의 R-특이적인 알돌라제를 대략 0.150mg/mL D-아미노트랜스퍼라제와 함께 분석법에 사용하였다.

제1 분석법은 하기 돌연변이체(태깅되지 않음)가 아미노전이 활성을 갖는다는 것을 나타내었다(가장 높은 것부터 낮은 것 순으로): T243N, T243S, T243N/N100A, N100A. T243N이 생산된 R,R 모나틴의 입체-순도를 상승시키는 것도 주목되었다. 정제된 코마모나스 테스토스테로니 ProA 알돌라제(100㎍/ml) 및 0.50mg/ml의 D-아미노트랜스퍼라제 돌연변이체(태깅되지 않음, 세포 추출물로서 공급됨)를 사용하여 분석법을 반복하였다. 샘플을 2시간째 및 밤새 채취하였다. 활성 단백질에 대한 결과는 하기에 나타내고, 2개의 결과에 대한 평균을 구하였다. 역상 HPLC 상에서 피크 면적에 의해 R,R 모나틴(%)을 측정한 후, 실시예 1에 기술된 FDAA 유도체화 방법을 사용하여 측정하였다. 표 31의 세번째 칸에서, 몇몇 반응에 대하여 실시예 1에 기술된 추가의 FDAA-유도체화 LC/MS/MS 분석을 실시하고, 그에 대한 결과는 괄호 안에 나타낸다. 오직 R,R 및 S,R 모나틴만이 D-트립토판으로부터 생산된다. T243R 돌연변이체는 시험된 조건하에서 모나틴을 생산하지 않는 것으로 나타났고, T243A 돌연변이체는 매우 낮은 수준으로 모나틴을 생산하였다.

[표 31]

바이오-래드 엑스페리온 소프트웨어를 사용하여 D-아미노트랜스퍼라제(%)를 추정하는 분석법을 실시하였지만, 야생형 효소와 비교하여 T243S 및 T243N 돌연변이체의 활성이 증가되었다는 것은 분명하다. T243N 돌연변이체 또한 형성된 R,R 모나틴(%)을 급격하게 증가시키는 추가의 잇점을 제공하였다. 이러한 효소는 아미노전이 반응에서 S-MP와 비교하여 R-MP에 대하여 증가된 선호도를 갖는다. N100A 돌연변이체는 문헌상에서 제안된 것과는 달리, 단독으로 또는 T243N과 조합된 경우 활성을 증가시키지 못했다. 상기 기술되어 있는 바와 같이 유사한 방법을 사용하여 태깅되지 않은 4978 DAT의 V34A 위치 지정된 돌연변이체 또한 형성하였다. V34A 위치 지정된 돌연변이체는 시험관 조건하에서 야생형 효소보다 유의적으로 더 낮은 활성을 갖는 것으로 밝혀졌다.

제1 분석법에서 또하나의 관심 포인트는, 야생형 효소가 N-말단 His-태그를 사용하여 생산되었을 때에 더 큰 활성을 갖는 것으로 나타났다는 점이었다. 이어서, 태깅된 버전의 유전자 상에서 돌연변이 유발법을 수행하였다. 추가로, N-말단 His-태그를 갖는 pET28b 내로 상기의 가장 가망성이 있는 돌연변이체를 서브클로닝하였다. 권고된 완충액(위스콘신주 매디슨에 소재하는 Novagen)과 함께 노바젠 HIS-결합 칼럼 및 제조사의 프로토콜을 사용하여 상기를 정제시켰다. GE 헬쓰케어 PD10 칼럼(뉴저지주 피츠카타웨이에 소재하는 GE Healthcare)을 사용하여 용리제 분획의 완충액을 분석법에 사용되는 완충액으로 교환하였다.

약하게 진탕시키면서, 정제된 D-아미노트랜스퍼라제(0.5mg/ml) 및 정제된 R-특이적인 알돌라제 서열 번호: 276(50㎍/ml)을 사용하여 1ml에 대한 분석법을 수행하고, 이는 10.2mg D-트립토판, 0.05mM PLP, 200mM 피루베이트, 4mM MgCl₂, 및 100mM 인산칼륨 완충액(pH 7.5)을 함유하였다. 2시간 동안 및 밤새도록 이중 샘플을 인큐베이션시켰다. 양성 대조군으로서, 바실러스 스파에리쿠스 DAT(실시예 7에서 클로닝됨)를 동일 분석법에 사용하였다. 결과를 표 32에 제시한다:

[표 32]

상기 데이타는 T243N 돌연변이체가 뚜렷하게 2시간째에 가장 높은 양의 모나틴을 생산한다는 것을 나타낸다. 시간이 증가함에 따라 T243N 돌연변이체 대 B. 스파에리쿠스 DAT 양성 대조군의 비는 감소한다. 이러한 결과는 T243N 돌연변이체가 모나틴 반응시 B. 스파에리쿠스 DAT만큼 안정적인 것은 아니라는 것을 나타낸다. 유사한 조건하에서 분석하였을 때, T243S(정제되고, 태깅됨) 효소는 T243N 돌연변이체와 유사한 수준의 활성을 가졌지만; 생산된 R,R 모나틴(%)은 더 낮았다(2시간째 및 밤새된 것, 둘 모두 97.2%). T243N/N100A 돌연변이체는 T243N 돌연변이체보다 더 낮은 활성을 가졌다. 그러나, T243S 및 T243N/N100A, 둘 모두 야생형 4978 DAT보다 더 높은 활성을 가졌다.

B. 스파에리쿠스 DAT 대신 T243N 돌연변이체를 사용하였을 때 반응비가 향상되었는지를 측정하기 위하여 아미노전이 분석법을 실시하였다. 1시간, 2시간, 및 5시간째의 시점에서 취하면서 ½ml에 관한 분석법을 실시하였다. 분석법에는 25mM 모나틴 또는 D-트립토판, 25mM 피루베이트, 100mM 인산칼륨(pH 7.5), 50μM PLP, 및 0.1 mg D-아미노트랜스퍼라제(태깅되고, 정제됨)이 함유되었다. 100㎍ 미만의 DAT가 사용된 경우, 알라닌 양을 100㎍의 D-아미노트랜스퍼라제로 정규화시켰다. 샘플을 포름산으로 처리하고, 부산물, 알라닌의 존재에 대하여 LC-OPA에 의해 분석하였다. 결과를 표 33 및 34에 나타낸다.

[표 33]

[표 34]

D-트립토판 반응의 경우, 상기 결과에서 몇몇 효소는 2시간째에 평형에 도달하였다. R,R 모나틴 반응은 분명 속도에 제한이 있으며, 이러한 활성에 대한 향상이 D-트립토판으로부터 모나틴을 생산하는 속도에 대하여 더 많은 영향력을 미친다.

T243N 4978 DAT 돌연변이체의 안정성을 조사하는 추가 분석법을 수행하였다. 야생형 효소는 또한 시간이 경과함에 따라 활성을 잃는다. 실시예 27은 T243N D-아미노트랜스퍼라제 돌연변이체의 안정성을 향상시키는 방법을 기술한다. 새로 제조된 태깅되지 않은 버전의 T243N 돌연변이체와 태깅된 버전의 T243N 돌연변이체를 제조하고, 활성에 대하여 비교하였을 때, 태깅되지 않은 버전의 것이 일시적으로는 안정성이 더 우수하였고, 그로써 전반적으로 상기가 모나틴 생산 반응에 사용하기에는 더 우수한 버전의 효소가 된다는 것이 밝혀졌다.

당업자에게 보편적으로 알려져 있는 방법에 의해 4978 DAT의 추가의 돌연변이체를 제조하였다. 그러나, 이러한 돌연변이화를 통해서 모두는 그들이 제조된 조건하에서 불용성인 단백질이 생성되었고, 이로써 활성에 대하여 분석할 수 없었다. 불용성 단백질을 생성시킨 돌연변이화는:

S180A/S181A/S182R;

L151F;

V34G;

S181R;

A153R/S181A/S182A;

A153R/S182A;

A153R/S182G;

S180R/S181A/S182G;

S180R/S181A/S182A;

S180R/S181G/S182G;

S180G/S181R/S182G; 및

S180A/S181R/S182A였다.

추가의 돌연변이 유발법

F200M 4978 DAT 돌연변이체를 생성하기 위하여 실시예 25로부터의 야생형 4978 DAT 오픈 리딩 프레임(태깅됨)은 프라이머 73 및 80(하기), 및 PfuTurbo DNA 폴리머라제(캘리포니아주 라호야에 소재하는 Stratagene)를 사용하여 증폭시키고, pCRII-Blunt(캘리포니아주 칼스배드에 소재하는 Invitrogen)로 클로닝하였다. 그의 서열을 확인하였다. 5' 및 3' 영역은 각각 프라이머 80과 96, 및 99와 103을 사용하여 증폭시켰다. 이어서, 증폭시킨 DNA는 퀴아젠 퀴아퀵 겔 추출 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 겔 정제시켰다. 증폭시킨 DNA는 프라이머 80과 99를 사용하여 다시 PCR시켰다. 상기 기술된 바와 같이 증폭된 DNA를 겔 정제시키고, pCRII Blunt로 클로닝하고, 그의 서열을 확인하였다. NdeI/XhoI 제한 분해 단편으로서 DAT 오픈 리딩 프레임을 pET28b로 서브클로닝하였다.

[표 35]

퀵체인지^® 멀티 위치 지정 돌연변이 유발법 키트(캘리포니아주 라호야에 소재하는 Stratagene)를 사용하여 추가의 위치 지정 돌연변이 유발법을 위해 하기 프라이머를 디자인하였다. 제조사의 설명서에 따라 스트라테이진 멀티-체인지 키트(캘리포니아주 라호야에 소재하는 Stratagene)를 사용하여 돌연변이 유발법을 수행하였다. 돌연변이 유발법에 사용된 주형은 실시예 25에 기술된 pET28(태깅됨) 4978 DAT 작제물이었다. 주형으로서 F200Y 돌연변이체를 사용하고, T243N(상기 열거됨) 프라이머를 사용하여 추가 회차의 돌연변이 유발법을 사용하여 이중 돌연변이체 또한 생성하였다.

[표 36]

DNA 서열 분석(Agencourt)에 의해 돌연변이체 코딩 영역을 확인하였다. 서열을 확인한 플라스미드를 BL21(DE3) 세포(위스콘신주 매디슨에 소재하는 Novagen) 내로 형질전환시켰다.

발현 및 분석법

500ml 배플 플라스크중 50㎍/ml 카나마이신과 함께 100ml LB를 함유하는 배양물에 밤새도록 배양된 배양물 1ml를 접종하고, 37℃에서 대략 0.6의 광학 밀도(600nm)로 배양하였다. 최종 농도 1mM의 IPTG에 의해 단백질의 생산을 유도하였다. IPTG를 첨가한 후, 4.5시간 동안 30℃에서 세포를 인큐베이션시켰다. 세포를 원심분리하고, -80℃에서 냉동시켰다. 세포를 파괴시키고(노바젠에 의해 권고된 프로토콜에 따라 1㎕/mL 벤조나제 뉴클레아제, 5㎕/mL 프로테아제 저해제 칵테일 II, 및 0.033㎕/mL r리소자임을 함유하는 노바젠 벅버스터 시약(위스콘신주 매디슨에 소재하는 Novagen)을 사용하여 제조), SDS-PAGE에 의해 분석하였다. 돌연변이체(141-LRcD-144 → EYcY) 및 (243-TS-244 → NR)를 통해 그들이 제조된 조건하에서 불용성인 단백질이 생성되었다. 돌연변이체 243-TS-244 → NK는 시험된 조건하에서는 정량가능한 활성을 갖지 못했고, 아마도 상기는 S244K 돌연변이체와 같이 야생형과 비교하였을 때 약한 활성을 갖는 효소일 것이다.

His-태깅된 단백질은 하기와 같이 정제하였다. HIS-결합 칼럼(위스콘신주 매디슨에 소재하는 Novagen)은 200mM NaCl 및 50μM PLP를 함유하는 10mL의 100mM 인산칼륨(pH 7.8)으로 평형화시켰다. 무세포 추출물을 칼럼 상에 로딩하였다. 10mL의 평형 완충액, 25mM 이미다졸을 함유하는 10mL의 평형 완충액, 및 50mM 이미다졸을 함유하는 10mL의 평형 완충액으로 칼럼을 세척하였다. 500mM 이미다졸을 함유하는 5ml 평형 완충액으로 단백질을 용리시켰다. 50μM PLP를 함유하는 100mM 인산칼륨(pH 7.8)에서 평형화된 PD10 칼럼을 사용하여 단백질을 탈염시켰다. 정제된 단백질을 농축시키고, 브래드포드 분석법(Bradford Assay)(캘리포니아주 허큘리스에 소재하는 Bio-Rad)을 사용하여 정량하였다.

500㎍/ml의 the D-아미노트랜스퍼라제, 서열 번호: 276의 알돌라제 50㎍/ml, 4mM MgCl₂, 50mM 인산칼륨(pH 8), 200mM 피루브산나트륨, 0.05mM PLP 및 20.4mg/ml D-트립토판을 사용하여 D-아미노트랜스퍼라제 돌연변이체를 분석 조건에 대하여 분석하였다. 최종 용량은 1.25ml였다. 0.5시간, 1시간, 2시간 및 14시간 후에 샘플(200㎕)을 채취하고, 실험 종결시까지 냉동시켰다. 샘플을 여과하고, 1 내지 10으로 희석시키고, 실시예 1에 기술된 바와 같이 LC/MS/MS에 의해 분석하였다.

실시예 25로부터의 야생형 4978 D-아미노트랜스퍼라제를 상대 활성(%)에 대한 참고로서 사용하였다. 표 37은 각 시점에서의 각 돌연변이체의 상대 활성을 나타낸다.

[표 37]

R,R 모나틴 생산에 관한 활성에 대하여 시험된 모든 돌연변이체 중 최고의 돌연변이체는 T243N이었다.

실시예 27

균주 ATCC 4978로부터의 D- 아미노트랜스퍼라제의 T243N 돌연변이체의 안정화

실시예 25에 나타낸 바와 같이, T243N 돌연변이체 DAT의 초기 활성은 B. 스파에리쿠스 DAT보다 유의적으로 더 높지만, 활성은 보다 신속하게 감소한다. 하기 기술하는 혐기성 프로토콜을 사용하는 추가의 실험은, T243N 돌연변이체 DAT의 초기 활성이 B. 스파에리쿠스 DAT보다 8배 이상 더 높지만, 활성은 혐기성 조건하에서도 신속하게 감소하였다는 것을 지시하였다. 장기간 동안 더 높은 활성을 유지하는지를 시험하기 위하여 하기 연구를 수행하였다.

균주 4978로부터의 D-아미노트랜스퍼라제의 T243N 돌연변이체(실시예 25에 기술됨) 및 S. 멜리로티 HMG 알돌라제를 HIS₆-태깅된 단백질로서 하기와 같이 정제하였다. 서열 번호: 276 알돌라제를 실시예 23에 기재된 바와 같이 정제하였다.

ATCC 4978로부터의 DAT ( T243N 돌연변이체)의 정제

진탕 플라스크중 50㎍/mL 카나마이신을 함유하는 EMD 바이오사이언스 오버나이트 익스프레스 시스템 II(용액 1-6)(위스콘신주 매디슨에 소재하는 Novagen)를 사용하여 아미노-말단 HIS₆-정제 태그를 포함하는 ATCC 균주 4978로부터의 D-아미노트랜스퍼라제의 T243N 돌연변이체를 생산하였다. 이러한 발현 시스템은 세포 성장을 모니터할 필요없이, IPTG 유도성 시스템의 발현을 유도한다. ATCC 균주 4978로부터의 T243N 돌연변이체 D-아미노트랜스퍼라제에 대한 유전자를 수반하는 E. 콜라이 BL21(DE3) 숙주의 액상 배양물 또는 플레이트로부터 200mL 분취량의 배지(1L 플라스크중)를 플라스미드 pET28b 상에 접종한 후, 배양물을 225rpm으로 진탕시키면서 3O℃에서 밤새도록 인큐베이션시켰다. OD_600nm가 최소 6에 도달하였을 때, 원심분리하여 세포를 수거하고, 완충액으로 1회에 걸쳐 세척하였다.

제조사의 프로토콜에 따라 1㎕/mL 벤조나제^® 뉴클레아제(위스콘신주 매디슨에 소재하는 Novagen), 5㎕/mL 프로테아제 저해제 칵테일 세트 II(캘리포니아주 샌디에고에 소재하는 CalBiochem-NovaBiochem Corp.), 및 0.033㎕/mL r리소자임™ (위스콘신주 매디슨에 소재하는 Novagen)을 함유하는 EMD 바이오사이언스 벅버스터^®(1차 아민 무함유) 추출 시약(위스콘신주 매디슨에 소재하는 Novagen)을 사용하여 무세포 추출물을 제조하였다. 이후의 모든 정제 단계는 4℃에서 수행하였다. 세포 추출물을 15,000xg으로 20-30분 동안 원심분리하여 세포 파편을 제거하였다. 무세포 추출물의 20-25mL의 분취량을, 앞서 200mM 염화나트륨 및 50μM PLP를 함유하는 100mM 인산칼륨으로 평형화된 45mL의 GE 헬쓰케어 킬레이팅 세파로스™ 패스트 플로우 수지 칼럼(니켈(II)형)(뉴저지주 피츠카타웨이에 소재하는 GE Healthcare)에 적용시켰다. 니켈형의 수지를 생성하기 위하여 수지를 150mL의 200mM 황산니켈(II) 6수화물 및 150mL의 증류수로 세척하였다. 샘플을 로딩한 후, 25mM 이미다졸을 함유하는 150mL의 평형 완충액, 50mM 이미다졸을 함유하는 150mL의 평형 완충액 및 500mM 이미다졸을 함유하는 150mL의 평형 완충액으로 칼럼을 세척/용리시켰다. HIS₆-태깅된 단백질이 최종 세척시에 용리되었다. 500mM 이미다졸 세액은 제조사의 설명서에 따라 밀리포어/아미콘 세트리콘 플러스-70 원심분리식 여과기 장치(MWCO 10kDa)(매사추세츠주 빌레리카에 소재하는 Millipore)을 사용하여 15-20mL로 농축시켰다. 0.5μM PLP를 함유하는 100mM 인산칼륨(pH 7.8)으로 앞서 평형화된 1회용 GE 헬쓰케어 PD10 칼럼(뉴저지주 피츠카타웨이에 소재하는 GE Healthcare)(칼럼당 2.5mL 샘플)을 통과시켜 이미다졸 및 염화나트륨을 제거하였다. 칼럼당 3.5mL의 동일한 완충액을 사용하여 정제된 아미노트랜스퍼라제를 용리시켰다. 단백질 표준에 따라 BSA를 사용하여 피어스 BCA 분석 키트(일리노이주 록퍼드에 소재하는 Pierce)를 사용함으로써 각 분획의 단백질 농도를 측정하였다.

바이오-래드 엑스페리온 미소모세관 칩 시스템(캘리포니아주 허큘리스에 소재하는 Bio-Rad)을 사용하거나, 미니 프로티안^® 3 세포용 기구에서 이동하는 바이오-래드 4-15% SDS-폴리아크릴아미드 구배 겔(캘리포니아주 허큘리스에 소재하는 Bio-Rad)을 사용하여 무세포 추출물 분획중 각 분획의 순도 및 발현 수준을 측정하였다. 바이오-래드 바이오-세이프 G-250 쿠마시 염색(캘리포니아주 허큘리스에 소재하는 Bio-Rad)을 사용하여 폴리아크릴아미드 겔중의 단백질을 시각화하고, 물로 탈색시켰다. 전형적으로 이러한 방법을 통해서 엑스페리온 소프트웨어에 의해 또는 SDS-PAGE 겔 분석으로부터 판정된 순도 85-90%의 ~20mg의 효소를 밤새도록 배양된 배양물 200mL로부터 생산한다. 분취량(1-5mL)의 정제된 효소를 사용할 때까지 -80℃에서 저장하였다.

서열 번호: 276 알돌라제의 정제는 실시예 23에 기술된 바와 같다.

S. 멜리로티 HMG 알돌라제의 정제

50mg/L 카나마이신을 함유하는 루리아-베르타니(Luria-Bertani) 브로쓰에서 배양된 배양물을 0.2mM IPTG로 유도함으로써 아미노-말단 HIS₆-정제 태그를 포함하는 S. 멜리로티 HMG 알돌라제(미국 공개 출원 번호 제20040063175호 및 WO 03091396 A2에 기재된 바와 같이 클로닝)를 생산하였다. S. 멜리로티 HMG 알돌라제에 대한 유전자를 수반하는 E. 콜라이 BL21(DE3) 숙주의 액상 배양물 또는 플레이트로부터 800mL 분취량의 배지를 pET30(Xa/LIC)에 접종한 후, 배양물을 225rpm으로 진탕시키면서 37℃에서 밤새도록 인큐베이션시켰다. 광학 밀도가 0.5-0.75의 600nm에 도달하였을 때, IPTG를 가하고, 4시간 동안 225rpm으로 진탕시키면서 30℃에서 인큐베이션시켰다. 원심분리하여 세포를 수거하고, 완충액으로 1회에 걸쳐 세척하였다.

S. 멜리로티 알돌라제를 함유하는 무세포 추출물을 제조하기 위해 세포를, 100mM NaCl를 함유하는 3-4용량의 50mM EPPS (N-(2-하이드록시에틸)피페라진-N'-(3-프로판설폰산)(pH 8.2)에 현탁시키고, 현탁액의 온도를 15℃ 미만으로 유지시키면서 마이크로플루이딕스 균질기(매사추세츠주 뉴턴에 소재하는 Microfluidics)를 사용하여 파괴하였다(18,000psi로 3회 통과). 세포 현탁액을 15,000-20,000xg으로 20-30분 동안 원심분리하여 세포 파편을 제거하였다. 제조사의 권고된 프로토콜을 따르나, 단, 예외적으로, 세척 완충액 단독으로 사용하는 대신, 결합 완충액:세척 완충액의 비율이 1:1인 용액을 사용하여 칼럼을 세척하여 EMD 바이오사이언스 HIS-결합^® 칼럼(위스콘신주 매디슨에 소재하는 Novagen)을 사용함으로써 HIS₆-태깅된 단백질을 정제하였다. 용리 분획은 제조사의 설명서에 따라 밀리포어/아미콘 15mL 원심분리식 여과기 장치(MWCO 5kDa)(매사추세츠주 빌레리카에 소재하는 Millipore)를 사용하여 7-10mL로 농축시켰다. 100mM NaCl을 함유하는 50mM EPPS(pH 8.2)로 앞서 평형화된 1회용 GE 헬쓰케어 PD10 칼럼(뉴저지주 피츠카타웨이에 소재하는 GE Healthcare)(칼럼당 2.5mL 샘플)을 통과시켜 이미다졸 및 염화나트륨을 제거하였다. 칼럼당 3.5mL의 동일한 완충액을 사용하여 정제된 알돌라제를 용리시켰다. 단백질 표준에 따라 BSA를 사용하여 피어스 BCA 분석 키트(일리노이주 록퍼드에 소재하는 Pierce)를 사용함으로써 각 분획의 단백질 농도를 측정하였다.

미니 프로티안^® 3 세포용 기구에서 이동하는 바이오-래드 4-15% SDS-폴리아크릴아미드 구배 겔(캘리포니아주 허큘리스에 소재하는 Bio-Rad)을 사용하여 무세포 추출물 분획중 각 분획의 순도 및 발현 수준을 측정하였다. 바이오-래드 바이오-세이프 G-250 쿠마시 염색(캘리포니아주 허큘리스에 소재하는 Bio-Rad)을 사용하여 폴리아크릴아미드 겔중의 단백질을 시각화하고, 물로 탈색시켰다. 전형적으로 이러한 방법을 통해서 순도 85-95%의, 배양물 800mL로부터 ~15-20mg의 효소를 생산한다. 분취량(1-5mL)의 정제된 효소를 사용할 때까지 -80℃에서 저장하였다.

모나틴 생산 분석법

밤새도록 혐기성 글러브 박스에서 143mg의 D-트립토판을 함유하는 원추형 폴리프로필렌 관(14mL)으로부터 산소를 제거하였다. 1M EPPS 완충액(pH 8.2), 2M MgCl₂, 2M 피루브산나트륨 및 10mM PLP의 스톡 용액을 탈기수에서 제조하고, 밤새도록 혐기성 글러브 박스에서 평형화시켰다. 혐기성 글러브 박스에서 10%(v/v) 트윈 80, 1%(v/v) 트윈 20, 1%(v/v) 트리톤 X-100, 100% 아세톤, 100% 에탄올 및 50%(w/v) 글리세롤의 스톡 용액을 2mL 미세원심분리관중 0.7g의 각 트레할로스, 이노시톨, 소르비톨 및 에리트리톨로 평형화시켰다. 정제된 효소 제제를 얼음상에서 해동시키고, 혐기성 글러브 박스에서 즉시 사용하였다. 14mL 원추형 관에 스톡 용액을 가하여 최종 농도 100mM EPPS, 200mM 피루베이트, 100mM 트립토판, 1mM MgCl₂, 0.05mM PLP, 0.5mg/mL D-아미노트랜스퍼라제, 및 0.01 mg/mL의 서열 번호: 276 알돌라제 또는 0.05mg/mL의 S. 멜리로티 HMG 알돌라제를 수득하였다. 제안된 효소 안정화 성분은 최종 농도를 달리하여(표 38 및 39) 가함으로써 관 1개당 최종 반응 용량이 7mL가 되도록 하였다. 24시간 이하의 기간 동안 완만하게 교반하면서 반응물을 혐기성 글러브 박스에서 실온하에 인큐베이션시켰다. 샘플을 주기적으로 취하고, LC/MS/MS 다반응 모니터링 방법을 사용함으로써 실시예 1에 기술되어 있는 바와 같이 모나틴에 대하여 분석하였다. 효소 첨가 이후 0시간째부터 3시간째 사이에 회수한 샘플로부터 초기 속도를 계산하였다.

[표 38]

[표 39]

0.01%-0.1%(v/v) 세제, 예로서, 트리톤 X-100, 트윈 20 또는 트윈 80, 또는 1%-10%(w/v) 폴리올, 예로서, 글리세롤, 트레할로스, 이노시톨 또는 소르비톨을 첨가하는 것이 실험 기간 동안 T243N D-아미노트랜스퍼라제의 안정성을 향상시켰다.

실시예 28

A: 슈도모나스 퓨티다 KT2440 의 광범위한 특이성을 갖는 아미노산 라세마제( BAR : B road - specificity A mino acid R acemase )의 클로닝

문헌 [Roise, D., Soda, K., Yagi, T., Walsch, C.T., Biochemistry 23, 5195-5201, (1984)]으로부터의 정보를 사용하여 P. 퓨티다 KT2440에서 BAR을 동정하였다. P. 스트리아타로부터 유래된 BAR 효소의 활성 부위를 서열 분석하고, 기록하였다 - LTAVLKADAYGXGIGL(서열 번호: 375). NCBI에서 사용가능한 P. 퓨티다 KT2440 게놈 서열을 BLAST하는데 상기 서열을 사용하였다. 거의 동일한 공통 서열을 갖는 단백질을 동정하였다. 아메리칸 타입 컬쳐 컬랙숀(버지니아주 마나싸스에 소재하는 ATCC)으로부터 입수한 게놈 DNA로부터의 유전자를 클로닝하기 위하여 프라이머를 디자인하였다.

(5 '-AGAAGACATATGCCCTTTCGCCGTAGGG-3' (서열 번호: 376 및

5'-AGAAGAGGATCCTCAGTCGACGAGTATCTTCG-3')(서열 번호: 377)).

표준 조건하에 PCR을 수행하고, PCR 산물을 정제하였다(QIAquick PCR purification kit, 캘리포니아주 발렌시아에 소재하는 Qiagen). 정제된 PCR 산물을 Nde I 및 BamH I로 분해하였다. 분해된 PCR 산물을 겔 정제하고(QIAquick 겔 추출 키트, 캘리포니아주 발렌시아에 소재하는 Qiagen), 유사한 방식으로 분해되고, 겔 정제된 pET30 및 pET28에 결찰시켰다. 인서트를 포함하는 클론을 서열 분석하고(매사추세츠주 비벌리에 소재하는 Agencourt), 올바른 서열을 포함하는 단리물을 동정하고(pET30 KT2440 BAR 및 pET28 KT2440BAR), 최종 연구에 사용하였다.

KT2440 BAR DNA 서열은:

이다.

KT2440 BAR 아미노산 서열은:

이다.

B) P. 퓨티다 KT2440 BAR 의 정제

상기 기술된 pET30 KT2440 BAR 플라스미드를BL21 DE3 pLysS(캘리포니아주 칼스배드에 소재하는 Invitrogen) 내로 형질전환시켰다. 생성된 균주는 37℃ LB 또는 테리픽 브로쓰에서 37℃ 통기하에 OD₆₀₀ 0.4-0.6까지 배양하고, 1mM IPTG로 유도하였다. 37℃ 통기하에 3-4시간 동안 계속하여 인큐베이션시켰다. 원심분리하여 세포를 수거하고, 사용시까지 세포 펠릿을 -80℃에 저장하였다. 세포 펠릿을 얼음상에서 해동시켰다. 세포를 벅버스터(위스콘신주 매디슨에 소재하는 Novagen) 및 벤조나제(위스콘신주 매디슨에 소재하는 Novagen)로 용해시켰다. 원심분리에 의해 세포 파편을 제거하고, 무세포 추출물을 즉시 사용하거나, -80℃에 저장하였다. KT2440 BAR 유전자 또한 pET28의 NdeI-BamHI 부위 내로 클로닝하고, BL21 DE3 pLysS 내로 형질전환시켰다. 상기 작제물은 매우 효율적으로 가용성 단백질을 발현하는 것으로 보이지는 않았고, 따라서 태깅되지 않은 버전의 것(pET30 KT2440 BAR)을 추가 연구에 사용하였다.

적어도 5 칼럼 용량의 완충액 A(25mM 인산칼륨(pH 8.0), 10μM 피리독살-5'-포스페이트(PLP))으로 평형화된 UnoQ 칼럼(캘리포니아주 허큘리스에 소재하는 Bio-Rad)에 추출물을 적용시켰다. 2 칼럼 용량의 완충액 A로 칼럼을 세척하였다. 20 칼럼 용량에 대하여 0-100% 완충액 B로부터 선형 구배의 완충액 B(완충액 A + 1M NaCl)로 단백질을 용리시키고, 구배 시작시부터 5ml 분획을 수집하였다. 실시예 4-파트 7에 기술된 암플렉스 레드(Amplex Red) 방법을 사용하여 분획을 분석하였다. 간략하면, 100㎍ D-아미노산 옥시다제(미주리주 세인트루이스에 소재하는 Sigma-Aldrich), 0.05mM FAD, 25mM L-trp, 및 분석하고자 하는 소량의 분획을 50㎕의 H₂O에서 조합하고, 제조사의 프로토콜에 지시된 바와 같이 제조된 50㎕의 암플렉스 레드 반응 완충액에 가하였다. 활성을 갖는 분획은 PD-10 칼럼(뉴저지주 피츠카타웨이에 소재하는 GE Healthcare)을 탈염시키고, 아미콘 원심분리 농축기(매사추세츠주 빌레리카에 소재하는 Millipore)로 농축시켰다. 정제된 단백질을 -80℃에 저장하였다.

C) 트립토판 라세마제 활성을 갖는 지오바실러스 스테아로서모필러스( Geobacillus stearothermophilus) 의 알라닌 라세마제 돌연변이체 Y354A 에 대한 생산 및 분석법

야생형 지오바실러스 스테아로서모필러스 알라닌 라세마제(서열 번호: 380, 하기에 나타냄)를 pET30 내로 클로닝하고, 위치 지정 돌연변이 유발법에 대한 주형으로 사용하여 Y354A 변이를 일으켰다. 표준 PCR 프로토콜에 의해 서열 번호: 380의 유전자를 증폭시킬 수 있고, 표준 재조합 DNA 기법을 사용하여 상기를 클로닝하였다. 서열 번호: 380의 유전자는 또한 당업계의 통상의 기술을 가진 자에게 공지되어 있는 임의의 방법, 예로서, 당업자에게 공지되어 있는 조립 PCR 방법에 의해 재작제할 수 있다.

야생형 지오바실러스 스테아로서모필러스 알라닌 라세마제 DNA 및 아미노산 서열은 서열 번호: 380로서 하기에 나타낸다:

알라닌 라세마제(지오바실러스 스테아로서모필러스)의 코딩된 아미노산 서열은 서열 번호: 381로서 하기에 나타낸다:

퀵체인지-멀티 위치 지정 돌연변이 유발법 키트(캘리포니아주 라호야에 소재하는 Stratagene)를 사용하여 돌연변이 유발법을 실시하였다. 하기 돌연변이 유발성 프라이머: 5'-gccatttggaaacgatcaacgcggaagtgccttgcacgatcag-3'(서열 번호: 382)을 사용하여 Y354A 변이를 일으켰다. 제조사의 프로토콜에 기재되어 있는 바와 같이 위치 지정 돌연변이 유발법을 수행하였다. 7개의 단리물을 서열 분석하고(매사추세츠주 비벌리에 소재하는 Agencourt), 올바른 서열을 갖는 단리물을 선별하고, 추가 분석을 위해 사용하였다.

pET30Y354A 단일 돌연변이체를 E. 콜라이 BL21(DE3)pLysS 내로 형질전환시켰다. 정제된 단백질를 하기 방식으로 제조하였다. 균주를 LB 또는 테리픽 브로쓰에서(37℃ 통기하에) OD₆₀₀ 0.4-0.6까지 배양하고, 1mM IPTG로 유도하였다. 37℃ 통기하에 ~3시간 동안 계속하여 인큐베이션시켰다. 원심분리하여 세포를 수거하고, 사용시까지 세포 펠릿을 -80℃에 저장하였다.

세포 펠릿을 얼음상에서 해동시키고, 적정량의 벅버스터(위스콘신주 매디슨에 소재하는 Novagen)과 벤조나제 뉴클레아제(위스콘신주 매디슨에 소재하는 Novagen)에 재현탁시켰다. 원심분리에 의해 세포 파편을 제거하고, 무세포 추출물은 결합 완충액으로 평형화된 HIS-결합 칼럼(위스콘신주 매디슨에 소재하는 Novagen)에 적용시켰다. 칼럼을 결합 완충액 및 세척 완충액으로 세척하고, 단백질을 용리 완충액으로 용리시켰다(제조사의 프로토콜에 지시된 바와 같이). PD-10 칼럼(뉴저지주 피츠카타웨이에 소재하는 GE Healthcare)을 사용하여 정제된 단백질을 탈염시켰다. 제조사의 프로토콜에 따라 50mM 인산칼륨(pH 8.0) 및 10μM 피리독살-5'-포스페이트로 단백질을 탈염시켰다. 단백질을 아미콘 원심분리 농축기(매사추세츠주 빌레리카에 소재하는 Millipore)를 사용하여 농축시켰다. 정제되고 농축된 단백질을 소량의 분취량으로 분할하고, 사용시까지 -80℃에 저장하였다.

알라닌 및 트립토판 분석법, 둘 모두에서 정제된 Y354A를 야생형 알라닌 라세마제(상기 기술된 방법으로 제조)와 비교하였다. 400㎕의 진한 정제된 단백질(>1 mg/ml) 및 50mM 기질을 사용하여 50mM 인산칼륨 완충액(pH 8), 및 10μM PLP중에서 37℃하에 분석법을 실시하였다. 실시예 1에 기술된 키랄 아미노산 방법론을 사용하여 D-알라닌 및 D-트립토판 검출을 실시하였다.

[표 40]

이들 데이타는 내부 표준을 사용하지 않고 분석하였다; 따라서, 이들 데이타는 반-정량적이며, 비교 목적으로 사용되어야 한다. 그럼에도 불구하고, 이들 결과는 Y354A 단일 돌연변이화는 알라닌 라세마제의 특이성을 확장시키는데 충분하기 때문에 이로써 대체 기질을 사용하여 아미노산 라세미화를 촉진시킬 수 있다는 것을 나타낸다.

D) BAR 효소 분석법

BAR 효소를 하기와 같이 분석하였다. 본 실시예에 기술되어 있는 바와 같이 암플렉스 레드 분석법을 설정하였다. P. 퓨티다 KT2440 BAR는 200㎍(본 실시예에 기술되어 있는 바와 같이 정제됨) 사용하였다. 야생형 G. 스테아로서모필러(G. stearothermophilus) 알라닌 라세마제 및 Y354A를 본 실시예에 기술되어 있는 바와 같이 정제하고, 200㎍/mL 또는 1000㎍/mL로 사용하였다. CE는 본 실시예에 기술되어 있는 바와 같이 제조된 무세포 추출물이다. 60분간의 시점 동안 얻은 결과를 하기 표 41에 나타낸다.

[표 41]

정제된 단백질을 또한 상기 기술된 바와 같이 50mM 인산칼륨(pH 8), 10μM PLP, 및 30mM L-트립토판에서 트립토판 라세마제 활성에 대하여 분석하였다. 200㎍/mL 또는 1000㎍/mL의 정제된 효소를 분석법에 사용하였다(괄호 안에 표시). 검출을 위해 실시예 1에 기술된 키랄 아미노산 방법을 사용하여 D-트립토판을 분석하였다.

[표 42]

본 분석법은 P. 퓨티다 KT2440 BAR 효소가 G. 스테아로서모필러스 유래된 효소 및 그의 Y354A 돌연변이체보다 트립토판에 대하여 활성이 더 크다는 것을 지시한다.

E) P. 퓨티다 KT2440 BAR 을 사용한 모나틴 생산

정제된 P. 퓨티다 KT2440 BAR(상기와 같이 정제됨)(100㎍) 또는 정제된 Y354A(상기와 같이 정제됨)(500㎍), D-아미노트랜스퍼라제(BioCatalytics AT-103 (캘리포니아주 패서디나 소재))(500㎍), 및 서열 번호: 276의 알돌라제(실시예 23에서와 같이 정제됨)(50㎍)을 사용하여 모나틴 생산 분석법을 수행하였다. L-트립토판으로 출발하는 모나틴 생산 실험은 하기와 같이 수행하였다. 상기 효소 이외에도, 1mL의 반응 혼합물당 하기의 것들을 첨가하였다: 4mM MgCl₂, 50mM L-트립토판, 100mM 피루브산나트륨, 100mM 인산칼륨 완충액(pH 7.5), 및 0.05mM PLP.

대조군으로서, 라세마제는 사용하지 않고, L-트립토판 대신 D-트립토판으로 출발하여 상기 기술된 바와 같이 실험을 수행하였다. 결과에 대한 요약은 하기 표 43에 제시한다.

[표 43]

본 실험에서 Y354A를 사용한 경우 어떤 모나틴도 검출되지 않았다. 모나틴을 생산하는데 과거에는 이러한 라세마제가 사용되어 왔으나(데이타로 나타내지 않음), 보다 더 높은 수준으로 효소가 사용되었다(보다 고수준의 모나틴을 관찰하기 위해서는 2mg 이상 내지 10mg 이하). L-트립토판으로부터 모나틴을 생산하기 위하여 P. 퓨티다 KT2440 BAR를 사용하였다. 본 실험에서 사용된 100㎍은 2시간 후 모나틴 생산을 관찰하기에는 충분치 않았지만, 18시간 후에는 모나틴을 관찰하기에 충분하였다. 입체이성체 분포는 생산된 모나틴 대부분이 R,R 이성체라는 것을 지시하였다. R,S 이성체는 생산되지 않았다. 이러한 결과는 KT2440 BAR이 모나틴의 R,R 이성체를 검출 가능할 정도로 라세미화시킬 수 없다는 것을 지시한다(R,R 이성체의 라세미화가 R,S 이성체를 생산할 것이다). 본 실험에서 상당량의 S,S 이성체가 생산되었다. 이는 아마도 본 실험에서 사용된 AT-103이 고도로 정제되지 못했고, 세포 추출물로부터의 L-아미노트랜스퍼라제를 함유할 수 있다는 사실과, S-MP의 아미노산전이에 대한 아미노 공여체로서 작용하는 다량의 L-트립토판이 존재한다는 사실에 기인할 것이다.

실시예 29

슈도모나스 태트롤렌스 ( Pseudomonas taetrolens ) 아르기닌 라세마제의 클로 닝 및 발현

실험 개관

슈도모나스 태트롤렌스(P. 그레비오렌스(P. graveolens)로도 공지됨) 아르기닌 라세마제(진뱅크 수탁 번호 AB096176, 핵산 서열) 및 그의 I384M 돌연변이체를 클로닝하고, 발현하고, L-트립토판으로부터 D-트립토판으로의 전환에 대한 활성에 관하여 시험하였다. 상기 유전자는 KT2440으로부터의 P. 퓨티다 BAR 유전자와는 72% 동일하고, 상기 기술된 NBRC 12996으로부터의 P. 퓨티다 BAR 유전자와는 73% 동일하다. 아미노산 서열은 P. 퓨티다 BAR 단백질, 둘 모두와 72% 동일하다.

중합효소 연쇄 반응 프로토콜

225rpm으로 진탕시키면서 28℃에서 슈도모나스 태트롤렌스(ATCC 4683)를 영양 브로쓰에서 배양하였다. pET 28 및 pET30 벡터(위스콘신주 매디슨에 소재하는 Novagen) 내로 클로닝시키기 위해 5' 제한 부위와 오버행을 포함하는 것으로 디자인된 프라이머를 사용하여 전체 세포에서 중합효소 연쇄 반응을 실시하였다.

프라이머 서열은

N 말단: 5'-ATAATACATATGCCCTTCTCCCGTACCC-3'(서열 번호: 408) 및

C 말단: 5'-GCGGCGGGATCCTTACTGATCTTTCAGGATT-3'(서열 번호: 409)이었다.

하기 PCR 프로토콜을 사용하여 P. 태트롤렌스로부터 유래된 유전자를 증폭시켰다. 25㎕의 배양된 세포를 10분 동안 96℃에서 용해시켰다. 원심분리에 의해 세포 파편을 제거하고, 상등액을 PCR에 대한 주형으로서 사용하였다. 100㎕의 반응물은 5㎕의 주형(용해된 세포 상등액), 1.6μM의 각 프라이머, 0.3mM의 각각의 dNTP, 10U rT^th 폴리머라제 XL(캘리포니아주 포스터 시티에 소재하는 Applied Biosystems), 1X XL 완충액 및 1mM Mg(OAc)₂를 함유하였다. 사용된 열순환기 프로그램은 3분 동안 94℃에서 가열 개시, 하기 단계로 8회 반복: 30초 동안 94℃, 30초 동안 52℃ 및 2분 동안 68℃, 이어서 하기 단계로 22회 반복: 30초 동안 94℃, 30초 동안 58℃, 및 2분 동안 68℃. 22회 반복한 후, 샘플을 7분 동안 68℃에서 유지시키고, 4℃에서 저장하였다. 상기 PCR 프로토콜을 통해 1230bp에서 산물이 생산되었다.

클로닝

퀴아젠 겔 추출 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 0.8% TAE-아가로스 겔로부터 PCR 산물을 겔 정제하였다. 산물을 TOPO 클로닝하고, 제조사(캘리포니아주 칼스배드에 소재하는 Invitrogen)의 프로토콜에 따라 TOP 10 세포 내로 형질전환시켰다. 플라스미드 DNA는 퀴아젠 스핀 미니프렙 키트(캘리포아주 발렌시아에 소재하는 Qiagen)를 사용하여 생성된 형질전환체로부터 정제하고, Nde I 및 BamH I를 사용하는 제한 분해에 의한 올바른 인서트에 대해 스크리닝하였다. 올바른 인서트를 갖는 것으로 보이는 플라스미드 서열은 일반 M13 순방향 및 M13 역방향 프라이머를 사용하여 디데옥시 쇄 종결 DNA 서열 분석을 통해 확인하였다.

제조사(매사추세츠주 비벌리에 소재하는 New England Biolabs)의 권고된 프로토콜에 따라 제한 효소 Nde I 및 BamH I를 사용하여 올바른 TOPO 세포를 분해하고, 퀴아젠겔 추출 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 0.8% TAE-아가로스 겔로부터 겔 정제하였다. 제한 효소 Nde I 및 BamH I를 사용하여 분해한 후, 새우 알칼리성 포스파타제(인디아나주 인디애나폴리스에 소재하는 Roche)로 처리하고, 퀴아젠겔 추출 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 0.8% TAE-아가로스 겔로부터 겔 정제하여 벡터 pET 28 및 pET 30을 제조하였다. 분해된 벡터 및 인서트를 래피드™ DNA 결찰 키트(인디아나주 인디애나폴리스에 소재하는 Roche)를 사용하여 결찰시켰다. 대략 50ng의 처리된 인서트, 100ng의 처리된 벡터(인서트 대 벡터의 몰비는 3:1), 5U의 T4 DNA 리가제, 및 1X 결찰 완충액을 실온에서 5분 동안 인큐베이션시켰다. 결찰 반응물은 고순도 PCR 산물 정제 키트(인디아나주 인디애나폴리스에 소재하는 Roche)를 사용하여 탈염시키고, 이를 사용하여 E. 콜라이 DH10B 전기 적격 세포(캘리포니아주 칼스배드에 소재하는 Invitrogen)로 형질전환시켰다. 10㎕의 각 결찰 반응물을 40㎕의 DH1OB에 가하고, 이는 하기 조건: 0.2cm 큐베트중 2.5kV, 25μF, 200ohm하에서 바이오래드 진 펄사르 II를 사용하여 전기천공법에 의해 형질전환되었다. 225rpm으로 진탕시키면서 1시간 동안 37℃에서 1mL의 실온의 SOC에 세포가 회수될 수 있도록 하였다. 카나마이신(50㎍/mL)을 함유하는 LB 플레이트 상에 세포를 플레이팅하였다. 퀴아젠 스핀 미니프렙 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 생성된 형질전환체로부터 플라스미드 DNA를 정제하고, Nde I 및 BamH I를 사용하는 제한 분해에 의한 올바른 인서트에 대해 스크리닝하였다.

유전자 발현 및 분석법

BL21DE3 pLysS에서의 유도는 먼저 pET 28(히스티딘으로 태깅됨) 및 pET 30(태깅되지 않음) 벡터, 둘 모두에서 실시하였다. 시간 경과에 따른 연구는, 37℃하에 카나마이신(50mg/L)을 함유하는 100mL LB에서 0.5의 OD₆₀₀까지 배양하고, 100mM IPTG(이소프로필 갈락카토시드)로 유도하고, 유도 이후 0 및 3시간째에 샘플링된 배양물을 사용하여 실시하였다. 0시간째부터 3시간째 시점까지의 세포를, 2-머캅토에탄올을 함유하는 1X 도데실 황산나트륨 완충액에 재현탁시키고, 10분 동안 95℃에서 가열하고 냉각시켰다. 총 세포 단백질 샘플의 분취량은 4-15% 구배 겔을 사용하여 SDS-PAGE에 의해 분석하였다.

또한, 약하게 진탕시키면서 20분 동안 실온에서 벤조나제 뉴클레아제 및 프로테아제 저해제 칵테일 세트 #3(캘리포니아주 샌디에고에 소재하는 CalBiochem-NovaBiochem Corp.)을 함유하는 노바젠 벅버스터™ 시약중 5mL의 배양물로부터 세포 펠릿을 현탁시켜 3시간된 배양물로부터 세포 추출물을 제조하고, 16,000 x g로 원심분리하여 세포 파편을 제거하였다. 세포 가용성 단백질의 분석을 위해 상등액(세포 추출물)을 4-15% 구배 겔 상에 로딩하였다.

클로닝된 P. 태트롤렌스 아르기닌 라세마제로부터의 3시간된 배양물은 pET 30(태깅되지 않음) 벡터에서 올바른 크기(대략 45kDa)에 상응하는 총 단백질 밴드를 나타내었다. P. 태트롤렌스 pET 30 유전자 산물은 P. 태트롤렌스 pET 28(히스티딘으로 태깅됨) 유전자 산물보다 더 높은 수준으로 과발현되었지만, 벡터 중 어느 것도 육안으로 볼 수 있는 가용성 단백질 밴드를 나타내지는 않았다.

유도된 배양물(100mL)로부터의 세포를 원심분리하고, 0.85% NaCl로 1회 세척하였다. 세포 펠릿을, 5㎕/mL 프로테아제 저해제 칵테일 세트 #3(캘리포니아주 샌디에고에 소재하는 CalBiochem-NovaBiochem Corp.) 및 1㎕/mL 벤조나제 뉴클레아제를 함유하는 5mL/g(습식 세포 중량)의 벅버스터(위스콘신주 매디슨에 소재하는 Novagen) 시약에 재현탁시켰다. 샘플을 궤도 진탕기 상에서 20분 동안 실온하에서 인큐베이션시켰다. 4℃에서 20분 동안 16,000Xg으로 원심분리하여 불용성 세포 파편을 제거하였다.

하기 프로토콜을 사용하여 트립토판 라세마제 활성에 대하여 세포 추출물을 분석하였다. 50mM 인산칼륨(pH 8.0), 0.05mM PLP 및 30mM L 트립토판에서 1mL의 반응을 수행하였다. 무세포 추출물을 첨가하고, 밤새도록 30℃에서 인큐베이션시켜 반응을 개시하였다. 밤새도록 인큐베이션시킨 후 샘플 분취량을 채취하였다(0분째의 샘플이 대조군 반응으로서 작용하였다). 진한 포름산(5㎕)을 각 250㎕의 샘플 분취량에 가하여 반응을 종결시키고, 침전된 단백질은 원심분리하여 제거하였다. 상등액을 제거하고, 실시예 1에 기술된 키랄 아미노산 방법에 의해 D-트립토판에 대하여 분석할 때까지 -80℃에서 냉동시켰다.

100μM IPTG(3시간)를 사용한 pET28 및 pET30 유도로부터의 세포 추출물에서 얻은 분석 결과는 P. 태트롤렌스 클론이 L-트립토판에 대하여 라세마제 활성을 나타낸다는 것을 입증한다. 또한, 태깅된 버전의 BAR은 태깅되지 않은 것(pET28)보다 활성이 작고, 침전될 수 있거나, 가용성이 낮은 것으로 보인다. 가용성 단백질이 매우 불충분하게 수득되었기 때문에 정량적이지는 못하지만, 하기 표 44에 초기 결과를 나타낸다.

[표 44]

상기 언급된 것과 동일한 조건을 사용하여 pET30(태깅되지 않음) 작제물의 유도를 반복하고, 육안으로 볼 수 있는 가용성 단백질 밴드를 SDS-PAGE에서 관찰하였다. 상기 언급된 것과 동일한 조건을 사용하여 분석법을 반복하고, 하기 표 45와 같은 결과를 얻었다.

[표 45]

또한, 용량을 2배로 하였을 때 더 많은 활성으로 확대되지는 않았다는 점에 주목하였다. 추가 실험으로, 세포 추출물 제조 이후 가능한 신속하게 벅버스터로부터 단백질을 제거하고, 0.01mM PLP를 함유하는 50mM 포스페이트 완충액(pH 8) 중에 단백질을 저장함으로써 종결지었다. 벅버스터내 세제가 반응을 저해할 수 있거나, 저장시 활성 손실을 일으킬 수 있다.

pET30 작제물의 유도를 다시 수행하고, 음이온 교환 크로마토그래피(실시예 28에 기술된 바와 같음)로 세포 추출물을 공정처리하여 더 많은 순수한 추출물을 수득하였다. 이러한 부분적으로 정제된 제제를 사용하여 분석법을 반복하였다. 하기 표 46의 라세마제 추출물 칸의 괄호 안에 표시된 숫자는 부분적으로 정제된 라세마제 효소가 본 분석법에서 사용된 대략적인 양을 나타낸다. 본 분석법의 결과는 하기 표 46에 나타낸다.

[표 46]

이러한 경우 밤새된 것인 샘플의 비선형성은 아마도 반응이 평형에 도달하고 있다는 사실에 기인하는 것이다. P. 태트롤렌스 BAR은 12996 BAR 및 KT2440 BAR과 같이 트립토판의 라세미화에 대하여 유의적인 활성을 갖는다는 것은 명백하다. KT2440 BAR 및 P. 태트롤렌스 BAR이 유사한 활성을 가지면, 이는 12996 BAR보다 약간 더 높은 것으로 보인다.

P. 태트롤렌스 아르기닌 라세마제의 DNA 서열을 하기 서열 번호: 410에 나타낸다. PCR 서열은 공개된 NCBI 서열과 비교하여 2개의 변화를 제공한다. 특히, PCR 서열은 902번 위치에 구아닌 대신 아데노신을 함유하였고, 921번 위치에 구아닌 대신 시토신을 함유하였다. 이들 DNA 변화를 통해 하나의 침묵 돌연변이 뿐만 아니라, 301번 아미노산 위치에서 글리신으로부터 아스파테이트로 하나가 변이되었다.

서열 번호: 410의 유전자에 의해 코딩된 단백질을 신호 펩티드 예측 프로그램 시그날P 3.0(www.cbs.dtu.dk/services/SignalP/)에 의해 분석하고, 23개 아미노산의 리더 서열을 예측하였다.

P. 태트롤렌스 BAR 의 1384M 돌연변이 유발법

태깅되지 않은 단백질을 생성하는 pET30내 P. 태트롤렌스 BAR 유전자를 사용하여 퀵체인지-멀티 위치 지정 돌연변이 유발법 키트(캘리포니아주 라호야에 소재하는 Stratagene)를 사용함으로써 돌연변이 유발법을 수행하였다. 하기 돌연변이 유발성 프라이머를 사용하여 I384M 변이: 5'-TACCCAGGCTGAGATGGAAGACATCAACG-3' (서열 번호: 411)를 일으켰다.

제조사의 프로토콜에 기재된 바와 같이 위치 지정 돌연변이 유발법을 수행하였다. 수개의 단리물을 서열 분석하고(매사추세츠주 비벌리에 소재하는 Agencourt), 올바른 서열을 갖는 단리물을 선별하고, 추가 분석에 사용하였다.

플라스미드를 BL21(DE3) 세포(위스콘신주 매디슨에 소재하는 Novagen) 내로 형질전환시켰다. 제조사의 프로토콜에 따라 50㎍/mL 카나마이신을 함유하는 오버나이트 익스프레스 II 배지(위스콘신주 매디슨에 소재하는 Novagen)에서 재조합 단백질을 생산하였다. 제조사의 프로토콜에 따라 벅버스터(위스콘신주 매디슨에 소재하는 Novagen)를 사용하여 무세포 추출물을 제조하고, 탈염시키고, 상기 기술된 엑스페리온 방법을 사용하여 표적 단백질의 발현율(%)에 관하여 분석하였다.

피어스 BCA 분석 키트(일리노이주 록퍼드에 소재하는 Pierce)를 사용하여 총 단백질의 분석법을 수행하였다. 양성 대조군과 동일한 방식으로 제조된 야생형 효소를 사용하여 돌연변이체 효소를 사용한 트립토판 라세마제 분석법을 실시하였다. 분석은 1mL당 하기를 함유하였다: 무세포 추출물 중 30mM L-트립토판, 50mM 인산칼륨(pH 8), 10μM PLP, 및 대략적으로 100㎍의 라세마제 단백질. 100㎍이 사용되지 않은 경우(엑스페리온 발현율(%) 및 피어스 총 단백질 수에 기초), 결과를 정규화시켰다. 실시예 1에 기술된 키랄 아미노산 방법을 사용하여 분석하기 위해 0분, 30분, 2시간, 및 밤새된 샘플을 수집하고, 2% 포름산으로 처리하고, 여과하고, 1:10으로 희석하였다.

야생형 효소는 30분째 49.1ppm D-트립토판을 생산한 반면, I384M 돌연변이체는 108ppm을 생산하는 것으로 나타났다. 2시간째의 시점에서는 유사하였는데- 229.4ppm D-트립토판이 야생형 효소에 의해 생산된 반면, I384M 돌연변이체에 대해서는 541.7이 생산되었다. I384M 돌연변이는 P. 태트롤렌스 BAR의 활성에 대해 대략 2배 정도의 활성을 갖는 것으로 보인다. 돌연변이체의 경우 밤새된 시점에서도 더 높았지만, 반응이 평형에 도달해감에 따라 활성에 있어서의 차이는 감소한다. 실시예 28에서와 같이 모나틴 생산에 대하여 분석법을 수행하였을 때, I384M은 야생형 P. 태트롤렌스 효소보다 어떤 잇점도 제공하지 못한 것으로 나타났다.

실시예 30

A. 카비애 ( A. caviae ) 추출 분석법

에어로모나스 카비애(Aeromonas caviae) ATCC 14486을 37℃ 영양 브로쓰에서 배양하였다. 배양물(200mL)로부터의 세포를 원심분리하고, 0.85% NaCl로 1회 세척하였다. 세포 펠릿을, 5㎕/mL 프로테아제 저해제 칵테일 세트 #3(캘리포니아주 샌디에고에 소재하는 CalBiochem-NovaBiochem Corp.) 및 1㎕/mL 벤조나제 뉴클레아제를 함유하는 5mL/g(습식 세포 중량)의 벅버스터™(위스콘신주 매디슨에 소재하는 Novagen) 시약에 재현탁시켰다. 샘플을 궤도 진탕기 상에서 20분 동안 실온하에서 인큐베이션시켰다. 4℃에서 20분 동안 16,000Xg으로 원심분리하여 불용성 세포 파편을 제거하였다. 무세포 추출물을 PD-10 칼럼(뉴저지주 피츠카타웨이에 소재하는 GE Healthcare) 상에서 탈염시켰다.

하기 프로토콜을 사용하여 트립토판 라세마제 활성에 대하여 무세포 추출물을 분석하였다. 50mM 인산칼륨(pH 8.0), 0.05mM PLP 및 30mM L 트립토판에서 1mL의 반응을 수행하였다. 무세포 추출물(100㎕ 또는 500㎕)을 첨가하고, 밤새도록 30℃에서 인큐베이션시켜 반응을 개시하였다. 인큐베이션 2시간째 및 밤새도록 인큐베이션시킨 후 샘플 분취량을 채취하였다(0분째의 샘플이 대조군 반응으로서 작용하였다). 진한 포름산(5㎕)을 각 250㎕의 샘플 분취량에 가하여 반응을 종결시키고, 침전된 단백질은 원심분리하여 제거하였다. 상등액을 제거하고, 실시예 1에 기술된 키랄 아미노산 방법에 의해 D-트립토판에 대하여 분석할 때까지 -80℃에서 냉동시켰다.

표 47에 나타낸 바와 같이, A. 카비애의 세포 추출물로부터 얻은 분석 결과는 L-트립토판에 대한 라세마제 활성을 입증하였다.

[표 47]

A. 카비애 세포 추출물에서 활성을 밝혀낸 후, 이들 종으로부터 BAR 유전자를 수득하기 위하여 축퇴성 프라이머를 디자인하였다(공지된 BAR 상동체의 보존 영역에 기초). 축퇴성 프라이머 서열을 하기에 나타낸다:

Aer deg F2: 5'-GCCAGCAACGARGARGCMCGCGT-3'(서열 번호: 412); 및

Aer deg R1: 5'-TGGCCSTKGATCAGCACA-3'(서열 번호: 413)

(여기서, K는 G 또는 T를 지시하고, R은 A 또는 G를 지시하고, S는 C 또는 G를 지시하고, M은 A 또는 C를 지시한다).

하기 프라이머를 사용하여 A. 카비애(ATCC 14486) 게놈 DNA로부터 715bp DNA 단편을 PCR 증폭시켰다. 하기 PCR 프로토콜을 사용하였다: 50㎕의 반응물은 0.5㎕의 주형(~100ng의 A. 카비애 게놈 DNA), 1.6μM의 각 프라이머, 0.3mM의 각각의 dNTP, 10U rT^th 폴리머라제 XL(캘리포니아주 포스터 시티에 소재하는 Applied Biosystems), 1X XL 완충액, 1mM Mg(OAc)₂ 및 2.5㎕의 디메틸 설폭시드를 함유하였다. 사용된 열순환기 프로그램은 3분 동안 94℃에서 가열 개시, 하기 단계로 30회 반복: 30초 동안 94℃, 30초 동안 53℃ 및 2분 동안 68℃. 30회 반복한 후, 샘플을 7분 동안 68℃에서 유지시키고, 4℃에서 저장하였다. 상기 PCR 프로토콜을 통해 715bp의 산물이 생산되었다.

클로닝

퀴아젠 겔 추출 키트(캘리포니아주 발렌시아에 소재하는 Qiagen)를 사용하여 0.8% TAE-아가로스 겔로부터 PCR 산물을 겔 정제하였다. 산물을 TOPO 클로닝하고, 제조사(캘리포니아주 칼스배드에 소재하는 Invitrogen)의 프로토콜에 따라 TOP 10 세포 내로 형질전환시켰다. 플라스미드 DNA는 퀴아젠 스핀 미니프렙 키트(캘리포아주 발렌시아에 소재하는 Qiagen)를 사용하여 생성된 형질전환체로부터 정제하고, EcoR 1을 사용하는 제한 분해에 의한 올바른 인서트에 대해 스크리닝하였다. 올바른 인서트를 갖는 것으로 보이는 플라스미드 서열은 일반 M13 순방향 프라이머를 사용하여 디데옥시 쇄 종결 DNA 서열 분석을 통해 확인하였다.

A. 카비애 PCR 산물의 DNA 서열을 하기에 서열 번호: 414로 나타내고, 축퇴성 프라이머 서열 영역은 밑줄로 표시되어 있다:

일부의 A. 카비애 BAR 효소의 아미노산 서열은 하기 서열 번호: 415로 나타낸다.

상기 서열 번호: 415의 공통 단백질 서열 단편은 아미노산 수준에 있어 A. 하이드로필라에 관하여 공개된 TIGR 서열과 89% 상동성이다. 고도로 관련된 에어로모나스 하이드로필라 단백질이 광범위한 특이성을 갖는 라세마제 활성을 나타내기 때문에, A. 카비애에 대한 전체 길이의 코딩 영역이 A. 카비애 세포 추출물 역시도 일단 수득되면, 트립토판에 대하여 광범위한 특이성을 갖는 활성도 갖는 라세마제를 생산하게 될 것이라고 예측되었다. 게놈 워커 방법을 사용하여 하기 서열 번호: 416에 나타낸 것과 같은, A. 카비애 BAR 유전자의 전체 길이의 유전자 서열을 수득하였다.

A. 카비애 천연 BAR에 대한 상응한 아미노산 서열은 하기 서열 번호: 417에 나타낸다:

프로그램 시그날P 3.0(www.cbs.dtu.dk/services/SignalP/)의 사용으로 서열 번호: 417의 처음 21개의 N-말단 아미노산 잔기가 신호 펩티드인 것으로 예측된다. 실험상의 증거를 통해 발현 산물이 E. 콜라이의 원형질막공간으로 분비하고, 신호 펩티드는 예측된 바와 같이 절단되었다는 것을 확인하였다. 상기 기술된 방법을 사용하여 클로닝되고 발현되었을 때 전체 길이의 유전자는 P. 태트롤렌스 BAR과 유사하나, 그보다는 좀 더 큰 활성을 갖는 것으로 밝혀졌다.

실시예 31

대체 발현 숙주에서 서열 번호: 276의 알돌라제의 생산

표준 분자 생물학 방법을 사용하여 서열 번호: 275의 유전자를, E. 콜라이 metE 유전자, 및 NgoMTV 제한 부위 및 베타 락타마제 유전자(bla)의 손쉬운 제거를 위해서 첨가된 제2 psiI 제한 부위에 삽입된 프로모터를 함유하는 pET23d 벡터(위스콘신주 매디슨에 소재하는 Novagen)의 유도체 내로 서브클로닝하였다. myo-이노시톨 옥시게나제 유전자에 대한 인서트를 함유하는 상기 벡터의 작제에 관해서는 PCT WO2006066072 실시예 2 및 20에 기재되어 있다. 알돌라제 인서트를 DNA 서열 분석(매사추세츠주 비벌리에 소재하는 Agencourt Bioscience Corporation)에 의해 확인하고, 올바른 인서트 서열을 갖는 플라스미드를 E. 콜라이 발현 숙주 BW30384(DE3)ΔompTΔmetE 내로 형질전환시켰다. 상기 발현 숙주의 작제 및 형질전환 프로토콜 또한 PCT WO2006066072(실시예 21 및 22)에 기재되어 있다. 100mg/L 암피실린을 함유하는 노바젠 오버나이트 익스프레스™ 오토인덕션 시스템 II(위스콘신주 매디슨에 소재하는 Novagen)을 사용하여 알돌라제 유전자를 발현하였다. 이러한 시스템은 바실러스 스파에리쿠스(ATCC 균주 10208) D-알라닌 아미노트랜스퍼라제의 발현에 대한 실시예 24에 기술되어 있다. 세포 용해를 위한 제조사의 권고된 프로토콜에 따라 1㎕/mL 벤조나제 뉴클레아제, 0.033㎕/mL r리소자임, 및 5㎕/mL 프로테아제 저해제 칵테일 세트 II를 함유하는 노바젠 벅버스터 추출 시약^®(1차 아민 무함유)(위스콘신주 매디슨에 소재하는 Novagen)을 사용하여 알돌라제를 함유하는 무세포 추출물 생산하였다. 무세포 추출물내 가용성 단백질을 바이오-래드 라보라토리즈 엑스페리온 자동화 전기영동 스테이션(바이오-Rad Laboratories Experion Automated Electrophoresis Station)(캘리포니아주 허큘리스에 소재하는 Bio-Rad) 상에서 분리하고, 실시예 12에 기술된 엑스페리온 소프트웨어버전 1.1.98.0을 사용하여 가용성 단백질 발현율(%)에 대하여 분석하였다.

E. 콜라이에서 알돌라제 발현을 향상시키기 위한 시도로, 코돈 2부터 7까지의 DNA 코딩 서열을 로슈 프로테오엑스퍼트(ProteoExpert) RTS E. 콜라이 HY 알고리즘을 사용하여 얻은 야생형 서열 분석으로부터 제안된 변이로 돌연변이화시켰다. 25㎕의 반응 혼합물당 0.75㎕의 퀵 솔루션(Quik Solution)을 사용하여 제조사의 제안된 프로토콜에 따라 퀵체인지®멀티 위치 지정 돌연변이 돌연변이 유발법 키트 또는 퀵체인지® II XL 위치 지정 돌연변이 유발법 키트(캘리포니아주 라호야에 소재하는 Stratagene)를 이용하여 변이를 일으키고, XL1O-골드® 초적격 세포 내로 형질전환시켰다. www. stratagene. com. qcprimerdesign의 온라인 상에서 이용가능한 스트라테이진 웹-기초 퀵체인지® 프라이머 디자인 프로그램으로 디자인된 프라이머(각각의 길이는 45개의 뉴클레오티드)를 사용하여 돌연변이화시켰다.

[표 48]

상기 코돈 변화를 갖는 알돌라제 유전자 서열을 E. 콜라이 발현 숙주 BW30384(DE3)ΔompTΔmetE 내로 형질전환시키고, 노바젠 오버나이트 익스프레스™ 오토인덕션 시스템 II(위스콘신주 매디슨에 소재하는 Novagen)을 사용하여 발현하였다. 상기 돌연변이 중 어느 것도 야생형 서열과 비교하였을 때 더 높은 수준으로 유전자를 발현시키지 못했다. 바이오-래드 엑스페리온 Pro260 소프트웨어 1.1.98.0에 의해 분석된, 무세포 추출물로부터 얻은 전형적인 결과는 하기 표 49에 나타내는데, 여기서, 단백질 발현이라는 표제하의 칸은 총 가용성 단백질(%)에 대한 값을 나타낸다.

실시예 7에 기술된 바와 같은 프로토콜을 사용하여 200mM 피루브산나트륨 및 100mM D-트립토판으로부터 R,R-모나틴을 생산할 수 있는 그의 능력에 관하여 세포 추출물(분석당 0.025mg/mL 가용성 단백질)을 분석하였다. 2mg/mL 최종 농도의 정제된 B. 스파에리쿠스(ATCC 10208) D-아미노트랜스퍼라제를 사용하여 혐기성 글러브 박스중 14mL 폴리프로필렌 관에서 반응(총 용량 7mL)을 수행하였다. 효소 첨가 이후 1, 4, 및 20시간째에 생산된 모나틴의 농도를 하기 표 49에 나타낸다. 표 49는, 20시간째에 야생형 알돌라제 서열을 함유하는 작제물로부터 생성된 무세포 추출물이 프로테오엑스퍼트 돌연변이를 수반하는 돌연변이로부터의 무세포 추출물보다 약간 더 높은 농도의 모나틴을 생산하였다는 것을 나타낸다. 모나틴 농도는 실시예 1에 기술된 LC/MS/MS 방법에 의해 측정하였다.

[표 49]

이들 데이타는, 서열 번호: 276의 알돌라제가 IPTG 유도없이도 대체 발현 숙주에서 생산될 수 있다는 것을 입증한다.

bla 유전자를 벡터로부터 제거하고, 또다른 효소를 위해 PCT WO2006066072에 기재된 항생제를 사용하지 않고 알돌라제를 생산하기 위한 추후 발효를 수행하였다. 엑스페리온 데이타에 따르면, 30℃의 공급형-배치 발효에서 발현 수준은 유도후 6-8시간째에 최대에 도달하였고, 서열 번호: 276의 알돌라제는 25-30%의 가용성 단백질로 생산되었다. 세포 농축 및 파괴 이전에 발효 산물을 15 또는 30℃(둘 모두 산소 제한 조건 및 통기 조건하에서)에서 6시간 동안 방치하였을 때, 안정성 연구에 있어 외관상 알돌라제 활성의 손실은 나타나지 않았다. 알돌라제는 -80℃에서 5일간 저장되었을 때 무세포 추출물 또는 세포 펠릿으로서 동등하게 안정적으로 저장되었다는 것일 밝혀졌다. -80℃에서 저장하기 이전에 완충액에서 세포 펠릿을 세척하는 것은 필수적인 것은 아니며, 실제로는 활성을 미세하게 감소시켰다. 세포를 증류수에 재현탁시키고, 발효 상등액, 또는 100mM 인산칼륨 완충액(pH 7.8)은 실온 또는 4℃에서 11일간 저장되었을 때 활성 또는 단백질 농도(SDS-PAGE로 판단)에 있어 손실이 없는 것으로 밝혀졌다. 인산칼륨 완충액에서 생산된 무세포 추출물은 4℃ 또는 실온에서 5일간 저장되었을 때, 어떤 알돌라제 활성 손실도 나타내지 않았다. 세포를 포스페이트 완충액에서 파괴하고 개방시킬 수 있고, 25%의 배양 상등액 또는 물은 유사하게 알돌라제 활성을 회복시키지만; 물에 1mM MgCl₂를 첨가하는 것은 알돌라제 활성을 미세하게 향상시키는 것으로 밝혀졌다. 이러한 데이타는 알돌라제 단백질이 충분히 안정한 바, 상업적으로 유용하다는 것을 나타낸다.

본 발명의 실시태양을 다수 기술하였다. 본 발명의 실시태양은 상기 기술된 측면들 중 하나 이상을 포함한다. 본 발명의 범주 및 정신으로부터 벗어남 없이 다양하게 변형될 수 있다는 것을 이해할 것이다. 따라서, 다른 실시태양은 하기 청구의 범위의 범주내에 포함된다.

SEQUENCE LISTING <110> Burke, Ellen Hicks, Paula M. Luginbuhl, Peter Richardson, Toby Weiner, David Zhao, Lishan <120> Aldolases, Nucleic Acids Encoding Them and Methods for Making and Using Them <130> D1710-6WO <140> PCT/US07/63515 <141> 2007-03-07 <150> 60/780,515 <151> 2006-03-07 <160> 417 <170> PatentIn 3.1 <210> 1 <211> 699 <212> DNA <213> Unknown <220> <223> Bacterial DNA <400> 1 atgcagccgc tgaaggaatt cgccgagctc tccaccccgc tgatcgccga cgcctgcgtg 60 cggctcgggg aacccctgcg cgtcgcgccc gccggcatcc tgcccgtcgt cgcgggccgg 120 cgcgtcgccg gccgggccct gcccgtacgg cactacggca gcgtcgacgt cttcctggag 180 gcgttcggcg aggccgagcc cggtgacgtc ctcgtcatcg acaacgcggg ccgcgtcgac 240 gaggcctgca tcggcgacct cgccgtcctg gaggcggcgg cggccggcat cgccggggtc 300 gtcgtgtggg gcctgcaccg ggacaccccc gacctcgtcg agatcgggct gcccgtcttc 360 tcctacggac gccacgcgcc cggccccgtg cgcgtcgacc cccgggaccc ggacgcgctg 420 acgaccgcgc ggttcggcga gcacgaggtg accgccgccg acgtcgtgtt cggcgacgac 480 gacggcgtgg tcttcgtcgc cgccgcccgg gccggcgccg tcctggaggc ggcccgggcc 540 ctgttccgta cggagcgcga gcaggcgcgg cggatcaggg cgggggagac gctgcgcgcc 600 cagacccggt tcgacgcgta cctggcgggc cgggccgagg acccctcgta caccttccgg 660 cagcacctgc gccggatcgg cggcgcgatc gaggagtga 699 <210> 2 <211> 232 <212> PRT <213> Unknown <220> <223> Bacterial protein <220> <221> DOMAIN <222> (8)...(165) <223> Demethylmenaquinone methyltransferase <400> 2 Met Gln Pro Leu Lys Glu Phe Ala Glu Leu Ser Thr Pro Leu Ile Ala 1 5 10 15 Asp Ala Cys Val Arg Leu Gly Glu Pro Leu Arg Val Ala Pro Ala Gly 20 25 30 Ile Leu Pro Val Val Ala Gly Arg Arg Val Ala Gly Arg Ala Leu Pro 35 40 45 Val Arg His Tyr Gly Ser Val Asp Val Phe Leu Glu Ala Phe Gly Glu 50 55 60 Ala Glu Pro Gly Asp Val Leu Val Ile Asp Asn Ala Gly Arg Val Asp 65 70 75 80 Glu Ala Cys Ile Gly Asp Leu Ala Val Leu Glu Ala Ala Ala Ala Gly 85 90 95 Ile Ala Gly Val Val Val Trp Gly Leu His Arg Asp Thr Pro Asp Leu 100 105 110 Val Glu Ile Gly Leu Pro Val Phe Ser Tyr Gly Arg His Ala Pro Gly 115 120 125 Pro Val Arg Val Asp Pro Arg Asp Pro Asp Ala Leu Thr Thr Ala Arg 130 135 140 Phe Gly Glu His Glu Val Thr Ala Ala Asp Val Val Phe Gly Asp Asp 145 150 155 160 Asp Gly Val Val Phe Val Ala Ala Ala Arg Ala Gly Ala Val Leu Glu 165 170 175 Ala Ala Arg Ala Leu Phe Arg Thr Glu Arg Glu Gln Ala Arg Arg Ile 180 185 190 Arg Ala Gly Glu Thr Leu Arg Ala Gln Thr Arg Phe Asp Ala Tyr Leu 195 200 205 Ala Gly Arg Ala Glu Asp Pro Ser Tyr Thr Phe Arg Gln His Leu Arg 210 215 220 Arg Ile Gly Gly Ala Ile Glu Glu 225 230 <210> 3 <211> 693 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 3 gtgaccggcc acgtcatcgt ccgcgagatc gaccgcgccg acgcgaacgc cctcgacggc 60 ctcgccgcgc tcggcgtctc gacggtgcac gaggccgacg gccgccgcgg cgcgctcgcc 120 accgccattc gaccgatcca cagtggattc acgatcgccg gttcggcggt gacggtctcc 180 tcccagccgg gcgacaacgt catgatccac gccgccattg aggtgtgccg gcccggcgac 240 atcctcgtgg tcaccaccac ctcgccgtcc accgacggga tgatcggcga actgctggcg 300 acgtcgctgc gcgcgcacgg ggtgcggggt gtcgtcaccg atgccggcgt acgcgacgtc 360 gcccagctcc gggcgatgaa cttcccggtg tggacgcgcg ccatcagtcc acaggggacg 420 gtcaaggcga gcccgggctc ggtgaacata ccggtcgtct gcgccggcca ggtcgtccac 480 cccggcgatg ccatcgtcgc cgacgacgac ggcgttgtcg tcgtcccgcg cgaccgggtg 540 ccggcggtgc tggcggccgg ccgggcgcgg gccgagagcg aggacgacaa acgcgtccgg 600 ctcgccggtg gcgaactctc ggtcgacatg tacgggctgc gcgagctgct cacccgactc 660 ggagtggagt acgtcgaccg gcggccggcg tga 693 <210> 4 <211> 230 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (28)...(174) <223> Demethylmenaquinone methyltransferase <400> 4 Met Thr Gly His Val Ile Val Arg Glu Ile Asp Arg Ala Asp Ala Asn 1 5 10 15 Ala Leu Asp Gly Leu Ala Ala Leu Gly Val Ser Thr Val His Glu Ala 20 25 30 Asp Gly Arg Arg Gly Ala Leu Ala Thr Ala Ile Arg Pro Ile His Ser 35 40 45 Gly Phe Thr Ile Ala Gly Ser Ala Val Thr Val Ser Ser Gln Pro Gly 50 55 60 Asp Asn Val Met Ile His Ala Ala Ile Glu Val Cys Arg Pro Gly Asp 65 70 75 80 Ile Leu Val Val Thr Thr Thr Ser Pro Ser Thr Asp Gly Met Ile Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Val Val 100 105 110 Thr Asp Ala Gly Val Arg Asp Val Ala Gln Leu Arg Ala Met Asn Phe 115 120 125 Pro Val Trp Thr Arg Ala Ile Ser Pro Gln Gly Thr Val Lys Ala Ser 130 135 140 Pro Gly Ser Val Asn Ile Pro Val Val Cys Ala Gly Gln Val Val His 145 150 155 160 Pro Gly Asp Ala Ile Val Ala Asp Asp Asp Gly Val Val Val Val Pro 165 170 175 Arg Asp Arg Val Pro Ala Val Leu Ala Ala Gly Arg Ala Arg Ala Glu 180 185 190 Ser Glu Asp Asp Lys Arg Val Arg Leu Ala Gly Gly Glu Leu Ser Val 195 200 205 Asp Met Tyr Gly Leu Arg Glu Leu Leu Thr Arg Leu Gly Val Glu Tyr 210 215 220 Val Asp Arg Arg Pro Ala 225 230 <210> 5 <211> 762 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 5 atggcgttga ataccggttc cgacattatt cgcccgtcca aggagctcgt tgccgggctc 60 aaagctcttg gcagtgcgac catcgcgggc acgctcggcc acatggggtt caagaacccg 120 cacatgacgg gcatcctgcc acagacggcg ggcaaggtca tggccggccc ggcgctgacg 180 ctgcagtgca tgccgcagcg accggacctg ttcagcgaag gcgaatacgc cgatcctgaa 240 acgcagctcc accgccatgt gctctatcac gtgcaggagg gcgacgtggt cgtcgtcgat 300 gcgcgcggcg atatgaagtc gggcatcttc ggcgacatga tgtcgaccta cttcaagggc 360 cgcggcggcg ccggcatcgt catcgacggc tgcatgcgcg atcgtcccaa tgtcgaaaag 420 ctcgacctgt cgctctggct caagggctgg acgccgaact accacgtcca gaccgacatc 480 tttccctacg cggtgaacgt tccagtcgca tgtggcggcg ttcttgtgct ccccggcgac 540 atcatcgttg ccgatgacga cggcgctgtc gtcgtgccgg tgaagatggc gcagcacatc 600 gtcgaggacg gcaagaagca cgccgagtgg gaagtgttct cgcgcgagaa gctgatggcc 660 ggcgagtcgc tccgccgtta ctacccgctg caccccgatg ccgaggacga ataccaggcc 720 tggcggaagg cgaaggggct gccgccgtcg ccctcgcgct aa 762 <210> 6 <211> 253 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (21)...(191) <223> Demethylmenaquinone methyltransferase <400> 6 Met Ala Leu Asn Thr Gly Ser Asp Ile Ile Arg Pro Ser Lys Glu Leu 1 5 10 15 Val Ala Gly Leu Lys Ala Leu Gly Ser Ala Thr Ile Ala Gly Thr Leu 20 25 30 Gly His Met Gly Phe Lys Asn Pro His Met Thr Gly Ile Leu Pro Gln 35 40 45 Thr Ala Gly Lys Val Met Ala Gly Pro Ala Leu Thr Leu Gln Cys Met 50 55 60 Pro Gln Arg Pro Asp Leu Phe Ser Glu Gly Glu Tyr Ala Asp Pro Glu 65 70 75 80 Thr Gln Leu His Arg His Val Leu Tyr His Val Gln Glu Gly Asp Val 85 90 95 Val Val Val Asp Ala Arg Gly Asp Met Lys Ser Gly Ile Phe Gly Asp 100 105 110 Met Met Ser Thr Tyr Phe Lys Gly Arg Gly Gly Ala Gly Ile Val Ile 115 120 125 Asp Gly Cys Met Arg Asp Arg Pro Asn Val Glu Lys Leu Asp Leu Ser 130 135 140 Leu Trp Leu Lys Gly Trp Thr Pro Asn Tyr His Val Gln Thr Asp Ile 145 150 155 160 Phe Pro Tyr Ala Val Asn Val Pro Val Ala Cys Gly Gly Val Leu Val 165 170 175 Leu Pro Gly Asp Ile Ile Val Ala Asp Asp Asp Gly Ala Val Val Val 180 185 190 Pro Val Lys Met Ala Gln His Ile Val Glu Asp Gly Lys Lys His Ala 195 200 205 Glu Trp Glu Val Phe Ser Arg Glu Lys Leu Met Ala Gly Glu Ser Leu 210 215 220 Arg Arg Tyr Tyr Pro Leu His Pro Asp Ala Glu Asp Glu Tyr Gln Ala 225 230 235 240 Trp Arg Lys Ala Lys Gly Leu Pro Pro Ser Pro Ser Arg 245 250 <210> 7 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 7 atgagtgtag tggtgcaaaa tatcgagcgg gcagatcagg caattatcaa ggcgcttgct 60 gaatgcggtg tagcaactgt gcatgaggcc caaggccgca cggggttgct ggcttcttat 120 atgcggccaa tttatagcgg tgcttgcatt ggtgcatcag cggtaaccat tctggctccg 180 ccttgcgata actggatggt ccatgtggcc attgagcaga taaagccggg tgatgctctg 240 gttatggcaa caacatcgtc atctgatgcc ggatattttg gtgacctgct ggcgacctcg 300 atgcaggcgc gtggcggggt tggcatgatt atcgatgccg gggtgcgcga tattaaagac 360 ctgaccgaga tgaaatgtcc tgtctggtca aaagcgatct gcgctgaagg gacggtgaaa 420 gaaacacttg gctctgtaaa tattccggtg gtttgcgccg gccagttggt caaccccggc 480 gatattgtca tcgctgatga tgatggggtc tgtgtcgttg agcgcgaaag ggctggcgaa 540 gttctggaaa aagcgcaagc ccgcatggct ttggaagaag acaaacgtaa acgtttggcc 600 tccggtgaac ttgggctgga tatgtataat atgcgcgagc gtctggctga aaaaggtctc 660 aaatatgttt aa 672 <210> 8 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 8 Met Ser Val Val Val Gln Asn Ile Glu Arg Ala Asp Gln Ala Ile Ile 1 5 10 15 Lys Ala Leu Ala Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Thr Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly Ala 35 40 45 Cys Ile Gly Ala Ser Ala Val Thr Ile Leu Ala Pro Pro Cys Asp Asn 50 55 60 Trp Met Val His Val Ala Ile Glu Gln Ile Lys Pro Gly Asp Ala Leu 65 70 75 80 Val Met Ala Thr Thr Ser Ser Ser Asp Ala Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Met Gln Ala Arg Gly Gly Val Gly Met Ile Ile Asp 100 105 110 Ala Gly Val Arg Asp Ile Lys Asp Leu Thr Glu Met Lys Cys Pro Val 115 120 125 Trp Ser Lys Ala Ile Cys Ala Glu Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Ile Pro Val Val Cys Ala Gly Gln Leu Val Asn Pro Gly 145 150 155 160 Asp Ile Val Ile Ala Asp Asp Asp Gly Val Cys Val Val Glu Arg Glu 165 170 175 Arg Ala Gly Glu Val Leu Glu Lys Ala Gln Ala Arg Met Ala Leu Glu 180 185 190 Glu Asp Lys Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu Asp Met 195 200 205 Tyr Asn Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val 210 215 220 <210> 9 <211> 552 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 9 atgaacggga ccgtcgtgcg caacatccat cgcgccgagg cgggggccat cgcggcgctc 60 gggcgcatcg gcgtctcgac cgtccacgag gcgcaggggc gcaccgggct catgcaggcc 120 tacatgcggc ccgtatggcg gggcgcgcgc atcgccggca gcgccgtgac cgtcctgtgc 180 catcccaacg acaactggat gatccacgtc gcgatggagg tggcaaggcc cggcgacgtg 240 ctcgtggtgg cttgctcgag cgagaacacg aacggcgcga tcggcgacct gatcgccacc 300 tcgctcatgg cgcgcggcgt gaaaggcgcg atcctcgaca tgggctgccg cgacgtgctg 360 gagctcgagc agatgaggtt tccgctctgg tcgcgggcca tctcggcgca gggaaccatc 420 aagggcacgc tcggctcggt caacttcccg gtcacctgcg ccggcgccca cgtcaggccg 480 ggcgacatcg tggtcgcgga cgacgacggc gtggtggtcg tgccccgcca ggacgcggcg 540 aaagtgatcc aa 552 <210> 10 <211> 184 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (21)...(173) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (2)...(5) <223> N-glycosylation site. Prosite id = PS00001 <400> 10 Met Asn Gly Thr Val Val Arg Asn Ile His Arg Ala Glu Ala Gly Ala 1 5 10 15 Ile Ala Ala Leu Gly Arg Ile Gly Val Ser Thr Val His Glu Ala Gln 20 25 30 Gly Arg Thr Gly Leu Met Gln Ala Tyr Met Arg Pro Val Trp Arg Gly 35 40 45 Ala Arg Ile Ala Gly Ser Ala Val Thr Val Leu Cys His Pro Asn Asp 50 55 60 Asn Trp Met Ile His Val Ala Met Glu Val Ala Arg Pro Gly Asp Val 65 70 75 80 Leu Val Val Ala Cys Ser Ser Glu Asn Thr Asn Gly Ala Ile Gly Asp 85 90 95 Leu Ile Ala Thr Ser Leu Met Ala Arg Gly Val Lys Gly Ala Ile Leu 100 105 110 Asp Met Gly Cys Arg Asp Val Leu Glu Leu Glu Gln Met Arg Phe Pro 115 120 125 Leu Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Ile Lys Gly Thr Leu 130 135 140 Gly Ser Val Asn Phe Pro Val Thr Cys Ala Gly Ala His Val Arg Pro 145 150 155 160 Gly Asp Ile Val Val Ala Asp Asp Asp Gly Val Val Val Val Pro Arg 165 170 175 Gln Asp Ala Ala Lys Val Ile Gln 180 <210> 11 <211> 645 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 11 atggatccag gggtcatcag gcgtctgggg gagctgggcg ttgcgaccgt tcacgaggcg 60 ctcggccgcc agggccttct cgatcccgtc gtgcgcccga tctaccccgg cgcgcgggcg 120 gccggaaccg ccgtaacggt gtgctgtccg gccggggaca acctgatgat ccatgcggcg 180 ctccaggtcg tggcgcgcgg cgacgtgctc gtcgtcacga ccgagccgcc gtcgacgtac 240 ggcatgttcg gcgacgtgct ggggacgtcg tgccaggcgc tcggggtcgc ggggctcgtc 300 atcgacgccg gcatccgtga cacggaggag ctcgagcgga tggcgtttcc cgcctgggcg 360 cgcgcgacgt cggcgcaggg cacggtgaaa gtggctccgg gcatcgtcaa cgcgccgatt 420 gtgtgcgcgg gcgcggacgt tcgtccgggc gacgttgtcg tggcggatcg cgacggcgtc 480 gtcatcgtcc cgcgcgagcg ggctgccgaa gcggcggagc ttggtgagca gcggcgcgat 540 cgcgagatcg aataccgccg gcggctggca ggtggagagc tgaccctgga cgtgctcgac 600 ctccggcgca ccctgcggga gatcgggatg gacaggctgg actga 645 <210> 12 <211> 214 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (10)...(162) <223> Demethylmenaquinone methyltransferase <400> 12 Met Asp Pro Gly Val Ile Arg Arg Leu Gly Glu Leu Gly Val Ala Thr 1 5 10 15 Val His Glu Ala Leu Gly Arg Gln Gly Leu Leu Asp Pro Val Val Arg 20 25 30 Pro Ile Tyr Pro Gly Ala Arg Ala Ala Gly Thr Ala Val Thr Val Cys 35 40 45 Cys Pro Ala Gly Asp Asn Leu Met Ile His Ala Ala Leu Gln Val Val 50 55 60 Ala Arg Gly Asp Val Leu Val Val Thr Thr Glu Pro Pro Ser Thr Tyr 65 70 75 80 Gly Met Phe Gly Asp Val Leu Gly Thr Ser Cys Gln Ala Leu Gly Val 85 90 95 Ala Gly Leu Val Ile Asp Ala Gly Ile Arg Asp Thr Glu Glu Leu Glu 100 105 110 Arg Met Ala Phe Pro Ala Trp Ala Arg Ala Thr Ser Ala Gln Gly Thr 115 120 125 Val Lys Val Ala Pro Gly Ile Val Asn Ala Pro Ile Val Cys Ala Gly 130 135 140 Ala Asp Val Arg Pro Gly Asp Val Val Val Ala Asp Arg Asp Gly Val 145 150 155 160 Val Ile Val Pro Arg Glu Arg Ala Ala Glu Ala Ala Glu Leu Gly Glu 165 170 175 Gln Arg Arg Asp Arg Glu Ile Glu Tyr Arg Arg Arg Leu Ala Gly Gly 180 185 190 Glu Leu Thr Leu Asp Val Leu Asp Leu Arg Arg Thr Leu Arg Glu Ile 195 200 205 Gly Met Asp Arg Leu Asp 210 <210> 13 <211> 498 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 13 atggcgaccg gggagtacga cgcatgggcc ggctcctggt actcgaagct ctcgccggag 60 ccgttcatgg atctcattcg tcccggcact gccctggtga tcgacgatgc gcccgcagcg 120 gatgtcggct ccatcgggtc gaacaacatc ctccaatgga agacgcgtgg gatggtggcg 180 gtcgtgacga acgcgacggc gcgggacacc gacgaaatcg ttgtcgagcg cgtgccgctc 240 tatttccggc agcctggccg cggcatccgt ccgggccgca atgagatcga atcggtcaac 300 cgtcccgtgg tcgtgggcgg ggtgctcgtg atgcccggcg acgtcatcgt cggagacggc 360 gacggcgtgg ttgtcgtccc acgcgcgcag gccgaggccg tggcgcgata tgctcacacg 420 atcctcgaga aggacacgga aggacgtcgg cggctctacc agcagctgaa gcttccaacc 480 gattcgacgg tccggtag 498 <210> 14 <211> 165 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <400> 14 Met Ala Thr Gly Glu Tyr Asp Ala Trp Ala Gly Ser Trp Tyr Ser Lys 1 5 10 15 Leu Ser Pro Glu Pro Phe Met Asp Leu Ile Arg Pro Gly Thr Ala Leu 20 25 30 Val Ile Asp Asp Ala Pro Ala Ala Asp Val Gly Ser Ile Gly Ser Asn 35 40 45 Asn Ile Leu Gln Trp Lys Thr Arg Gly Met Val Ala Val Val Thr Asn 50 55 60 Ala Thr Ala Arg Asp Thr Asp Glu Ile Val Val Glu Arg Val Pro Leu 65 70 75 80 Tyr Phe Arg Gln Pro Gly Arg Gly Ile Arg Pro Gly Arg Asn Glu Ile 85 90 95 Glu Ser Val Asn Arg Pro Val Val Val Gly Gly Val Leu Val Met Pro 100 105 110 Gly Asp Val Ile Val Gly Asp Gly Asp Gly Val Val Val Val Pro Arg 115 120 125 Ala Gln Ala Glu Ala Val Ala Arg Tyr Ala His Thr Ile Leu Glu Lys 130 135 140 Asp Thr Glu Gly Arg Arg Arg Leu Tyr Gln Gln Leu Lys Leu Pro Thr 145 150 155 160 Asp Ser Thr Val Arg 165 <210> 15 <211> 723 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 15 atgacaacaa gcactaaaaa tatgcaggta agtcagaaag ttattgacga tcttcgtcgc 60 gtgtcaacag caactctgca cactgcgctg ttcaaaagag gtttacgcaa cacctacatc 120 cagggtgtca gcctcatcaa caaccaaaaa ctgaagatgg tcggccaggc gttcaccctg 180 cgctacatcc cggctcgtga agacgttgac accgttgcgg cattcaaaag ccctgagcac 240 cctcagcgcc tggccgttga atccgtcccg gaaggcatgg tgctggtttc agactgtcgt 300 caggacgcaa cagctgcttc tgccgggagc atccttctta ctcgattgga agttcgcaag 360 tgtgcgggtt ttgtttccga tgcgggcatc agagatttca acgatgcatc tgaaatgaac 420 atgccgattt tttgcgccaa gccaagcgct ccaaccaacc tgaccaagca ccacgccgta 480 gacatacaag taccgatcgg ctgcggcggt gtgatggtta atccaggcga tgtgttagtc 540 ggcgatggtg acggcatcat cgttatccct gtggaaattg cacaggaggt ttcagaagaa 600 gcacttgcaa tggaactctt cgaagatttt gtgctggata aagttcgggc gggaagcaaa 660 gtcattgggc tgtaccctcc taacgcagaa actctggagg agtacaacaa ccaaaaggca 720 tag 723 <210> 16 <211> 240 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (19)...(188) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (155)...(158) <223> N-glycosylation site. Prosite id = PS00001 <400> 16 Met Thr Thr Ser Thr Lys Asn Met Gln Val Ser Gln Lys Val Ile Asp 1 5 10 15 Asp Leu Arg Arg Val Ser Thr Ala Thr Leu His Thr Ala Leu Phe Lys 20 25 30 Arg Gly Leu Arg Asn Thr Tyr Ile Gln Gly Val Ser Leu Ile Asn Asn 35 40 45 Gln Lys Leu Lys Met Val Gly Gln Ala Phe Thr Leu Arg Tyr Ile Pro 50 55 60 Ala Arg Glu Asp Val Asp Thr Val Ala Ala Phe Lys Ser Pro Glu His 65 70 75 80 Pro Gln Arg Leu Ala Val Glu Ser Val Pro Glu Gly Met Val Leu Val 85 90 95 Ser Asp Cys Arg Gln Asp Ala Thr Ala Ala Ser Ala Gly Ser Ile Leu 100 105 110 Leu Thr Arg Leu Glu Val Arg Lys Cys Ala Gly Phe Val Ser Asp Ala 115 120 125 Gly Ile Arg Asp Phe Asn Asp Ala Ser Glu Met Asn Met Pro Ile Phe 130 135 140 Cys Ala Lys Pro Ser Ala Pro Thr Asn Leu Thr Lys His His Ala Val 145 150 155 160 Asp Ile Gln Val Pro Ile Gly Cys Gly Gly Val Met Val Asn Pro Gly 165 170 175 Asp Val Leu Val Gly Asp Gly Asp Gly Ile Ile Val Ile Pro Val Glu 180 185 190 Ile Ala Gln Glu Val Ser Glu Glu Ala Leu Ala Met Glu Leu Phe Glu 195 200 205 Asp Phe Val Leu Asp Lys Val Arg Ala Gly Ser Lys Val Ile Gly Leu 210 215 220 Tyr Pro Pro Asn Ala Glu Thr Leu Glu Glu Tyr Asn Asn Gln Lys Ala 225 230 235 240 <210> 17 <211> 792 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 17 atgattcggt tgaccaacct gaaccccttt gagcggtttg acgatggccg ccccaaggtg 60 cccgatgacc tgctggagcg gatgaagctg gtcaccaccg aggaggcctg gggcacgctc 120 tatcacgccg gctacctgcg ccagttcgaa ggcaagtggc acgagaccca cccgggcgtc 180 atcactgtcg gccgcgccgt caccgcccag ttcctgcccc atcgccccga ctaccacgcc 240 gtggtgcaag aaaccggcgt cggcgaaggc cgcggcagcg ccggtggtca gaactcgtgg 300 atcatcgaga gcctgcagcg caacgacgtc atggtggtcg acatcttcgg caaggtcaaa 360 gacggcacgg tcgtcggcga caacctgggc accgccgtgc gcacccgcac ccgcgccggg 420 gccgtcatcg acggcggcgt gcgcgactac cagggcctga cccagctcac cgacgtcaac 480 ttctacatcc gcggtatgga cccgaccggc atcgccgacg tcaccctggc cggcctgaac 540 atccccatcc gcatcggtgg ctgcacagtc ctgcccggcg acgtggtcct cggcacgccc 600 agcggcgtcc tgttcatccc gccgcacctg gtgtcgaagg tggtcgagga gagcgaggac 660 gtccgcgtcc gcgacgagtt tggcaagagc cgcctggccg aaggcatttg gacctccggc 720 cagatcgact cggcctggag cgacgagatc aaggccgact tcgagaactg gaaggccaac 780 cgccccaagt ag 792 <210> 18 <211> 263 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (39)...(205) <223> Demethylmenaquinone methyltransferase <400> 18 Met Ile Arg Leu Thr Asn Leu Asn Pro Phe Glu Arg Phe Asp Asp Gly 1 5 10 15 Arg Pro Lys Val Pro Asp Asp Leu Leu Glu Arg Met Lys Leu Val Thr 20 25 30 Thr Glu Glu Ala Trp Gly Thr Leu Tyr His Ala Gly Tyr Leu Arg Gln 35 40 45 Phe Glu Gly Lys Trp His Glu Thr His Pro Gly Val Ile Thr Val Gly 50 55 60 Arg Ala Val Thr Ala Gln Phe Leu Pro His Arg Pro Asp Tyr His Ala 65 70 75 80 Val Val Gln Glu Thr Gly Val Gly Glu Gly Arg Gly Ser Ala Gly Gly 85 90 95 Gln Asn Ser Trp Ile Ile Glu Ser Leu Gln Arg Asn Asp Val Met Val 100 105 110 Val Asp Ile Phe Gly Lys Val Lys Asp Gly Thr Val Val Gly Asp Asn 115 120 125 Leu Gly Thr Ala Val Arg Thr Arg Thr Arg Ala Gly Ala Val Ile Asp 130 135 140 Gly Gly Val Arg Asp Tyr Gln Gly Leu Thr Gln Leu Thr Asp Val Asn 145 150 155 160 Phe Tyr Ile Arg Gly Met Asp Pro Thr Gly Ile Ala Asp Val Thr Leu 165 170 175 Ala Gly Leu Asn Ile Pro Ile Arg Ile Gly Gly Cys Thr Val Leu Pro 180 185 190 Gly Asp Val Val Leu Gly Thr Pro Ser Gly Val Leu Phe Ile Pro Pro 195 200 205 His Leu Val Ser Lys Val Val Glu Glu Ser Glu Asp Val Arg Val Arg 210 215 220 Asp Glu Phe Gly Lys Ser Arg Leu Ala Glu Gly Ile Trp Thr Ser Gly 225 230 235 240 Gln Ile Asp Ser Ala Trp Ser Asp Glu Ile Lys Ala Asp Phe Glu Asn 245 250 255 Trp Lys Ala Asn Arg Pro Lys 260 <210> 19 <211> 723 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 19 atgagcgatt ataccaacga gattaccggc gaaccgccag ctgctgaacc tttgccggac 60 gagcaggaaa tcttggattt tgtacggcag aagctgcatg tcgccgcggt ttgcgatatt 120 ttggatgatt tgggctaccg caatcaagcc atgcaccagc gattgcgccc gctcctaccc 180 gatattcgga actgtggttt tgtcgggcga gcgcgtacgt tgcgctggat ggagaccgat 240 tatattgtcg aggaagatcc ctatgggctg gagatcgact ttatggatag tctgggcgcg 300 ggtgatgtca ttgttcattc caccgaccct ggcggcacca atgccccgtg gggcgaactc 360 atgaccacca tcgccaagtt gcgcggcgca gttggctgcg tctgcgacag ccagatacgc 420 gacacggtgc agatcatcga catgggcttc cccgtctact acacgggaat tcgtccgttg 480 gattccaaag ggcgggcgcg cgtgatgggt ttggatctgc ccgtacgctg tggtgatgtg 540 ttggtgcatc ctggcgatct catcttcgcc gaccatgacg gcatcgtggt cattccgcaa 600 gcgcaggtgc agcaggtact caagctggcc caagaaaaga tggagaagga gaaccacacg 660 cgcaatgacc tgctcgcggg caagacactg cgcgaggtct atgatacgta tggggtgttg 720 tag 723 <210> 20 <211> 240 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (30)...(197) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (221)...(224) <223> N-glycosylation site. Prosite id = PS00001 <400> 20 Met Ser Asp Tyr Thr Asn Glu Ile Thr Gly Glu Pro Pro Ala Ala Glu 1 5 10 15 Pro Leu Pro Asp Glu Gln Glu Ile Leu Asp Phe Val Arg Gln Lys Leu 20 25 30 His Val Ala Ala Val Cys Asp Ile Leu Asp Asp Leu Gly Tyr Arg Asn 35 40 45 Gln Ala Met His Gln Arg Leu Arg Pro Leu Leu Pro Asp Ile Arg Asn 50 55 60 Cys Gly Phe Val Gly Arg Ala Arg Thr Leu Arg Trp Met Glu Thr Asp 65 70 75 80 Tyr Ile Val Glu Glu Asp Pro Tyr Gly Leu Glu Ile Asp Phe Met Asp 85 90 95 Ser Leu Gly Ala Gly Asp Val Ile Val His Ser Thr Asp Pro Gly Gly 100 105 110 Thr Asn Ala Pro Trp Gly Glu Leu Met Thr Thr Ile Ala Lys Leu Arg 115 120 125 Gly Ala Val Gly Cys Val Cys Asp Ser Gln Ile Arg Asp Thr Val Gln 130 135 140 Ile Ile Asp Met Gly Phe Pro Val Tyr Tyr Thr Gly Ile Arg Pro Leu 145 150 155 160 Asp Ser Lys Gly Arg Ala Arg Val Met Gly Leu Asp Leu Pro Val Arg 165 170 175 Cys Gly Asp Val Leu Val His Pro Gly Asp Leu Ile Phe Ala Asp His 180 185 190 Asp Gly Ile Val Val Ile Pro Gln Ala Gln Val Gln Gln Val Leu Lys 195 200 205 Leu Ala Gln Glu Lys Met Glu Lys Glu Asn His Thr Arg Asn Asp Leu 210 215 220 Leu Ala Gly Lys Thr Leu Arg Glu Val Tyr Asp Thr Tyr Gly Val Leu 225 230 235 240 <210> 21 <211> 444 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 21 atgaccaagc cgctgagtga agccgcgcgc gccaagctcg ccaccgtcag taccgccacg 60 ctgacgacgc aactgttcaa gcgcgggctg cgcaacacct tcatccaggg cgcacgcccg 120 ctcaatcccg acgcgccgcc gatggtcggc ccggcctaca cgctgcgcta tatcccggca 180 cgcgaggaca tcgacacgct cgatgtgttc aatgaccgca cccacccgca acgcaaggcc 240 gtggaggaca tcccgccggg cagcgtgctg gtgatggact gccgcggcga cgcgagcgtc 300 gcgtcggccg gcagcatcct ggtgacccgc atgatgatgc gcggcgcagc cggcgtggtc 360 agcgacggcg gcctgcgcga ttcccccgag atcgcgaagc tccccttccc cacctactgc 420 cagggcgggt cggcgcccac caac 444 <210> 22 <211> 148 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <400> 22 Met Thr Lys Pro Leu Ser Glu Ala Ala Arg Ala Lys Leu Ala Thr Val 1 5 10 15 Ser Thr Ala Thr Leu Thr Thr Gln Leu Phe Lys Arg Gly Leu Arg Asn 20 25 30 Thr Phe Ile Gln Gly Ala Arg Pro Leu Asn Pro Asp Ala Pro Pro Met 35 40 45 Val Gly Pro Ala Tyr Thr Leu Arg Tyr Ile Pro Ala Arg Glu Asp Ile 50 55 60 Asp Thr Leu Asp Val Phe Asn Asp Arg Thr His Pro Gln Arg Lys Ala 65 70 75 80 Val Glu Asp Ile Pro Pro Gly Ser Val Leu Val Met Asp Cys Arg Gly 85 90 95 Asp Ala Ser Val Ala Ser Ala Gly Ser Ile Leu Val Thr Arg Met Met 100 105 110 Met Arg Gly Ala Ala Gly Val Val Ser Asp Gly Gly Leu Arg Asp Ser 115 120 125 Pro Glu Ile Ala Lys Leu Pro Phe Pro Thr Tyr Cys Gln Gly Gly Ser 130 135 140 Ala Pro Thr Asn 145 <210> 23 <211> 801 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 23 atgatcaatt gcctcgcggc taaaccacag cggccttccc aattatccaa tccctatcag 60 gagcctgcca tgccagccat ctccctcgaa gtgcttgaga aactgcgcgc atacgatacg 120 cccaccattt gcaacgtgat cgagctgttc gacgtgcggc cgcgcaccag cggctacatg 180 gatgcccgca tccgcgcctg cttccccgag atgccgccgg tggtgggctt tgcctccacc 240 gccaccttcc gcgcttctga agcgccgctc tccggcccgg atatctacgg ctcgctgaac 300 ctgcaagtgg agagctttgg cacgctctcc ggcccggcca tcgtggtctt tcaagacctg 360 gacgacccgg cggtggcggc aacctttggc gaggtgatgt gcaccaccta ccagacgtac 420 ggatcggtcg ggctgatcac ctctggcgcg gggcgcgacc tggaccaggt acgcaagatt 480 ggttactcgg tcttcaccaa cggcgcgatt tgctcgcacg gctactgcca cattccggat 540 gtcaacgtgc cggtgcgggt gggcggctta atcgtgcgcc cggatgatct gctgcacatg 600 gacgtgaacg gcgtgaccaa catccccaag gagatcgcgg cggaggtggc ggaggcctgc 660 gaggcctacg tggcggcgga gatggcgacg ctgaacgggc tgcatgcgta taggcaagat 720 ggggatgccg ggaagctgca agaggcgaag aaggagagta aaaggctgat gcaggcgctg 780 aaggaacggg tgaggaggta a 801 <210> 24 <211> 266 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (36)...(207) <223> Demethylmenaquinone methyltransferase <400> 24 Met Ile Asn Cys Leu Ala Ala Lys Pro Gln Arg Pro Ser Gln Leu Ser 1 5 10 15 Asn Pro Tyr Gln Glu Pro Ala Met Pro Ala Ile Ser Leu Glu Val Leu 20 25 30 Glu Lys Leu Arg Ala Tyr Asp Thr Pro Thr Ile Cys Asn Val Ile Glu 35 40 45 Leu Phe Asp Val Arg Pro Arg Thr Ser Gly Tyr Met Asp Ala Arg Ile 50 55 60 Arg Ala Cys Phe Pro Glu Met Pro Pro Val Val Gly Phe Ala Ser Thr 65 70 75 80 Ala Thr Phe Arg Ala Ser Glu Ala Pro Leu Ser Gly Pro Asp Ile Tyr 85 90 95 Gly Ser Leu Asn Leu Gln Val Glu Ser Phe Gly Thr Leu Ser Gly Pro 100 105 110 Ala Ile Val Val Phe Gln Asp Leu Asp Asp Pro Ala Val Ala Ala Thr 115 120 125 Phe Gly Glu Val Met Cys Thr Thr Tyr Gln Thr Tyr Gly Ser Val Gly 130 135 140 Leu Ile Thr Ser Gly Ala Gly Arg Asp Leu Asp Gln Val Arg Lys Ile 145 150 155 160 Gly Tyr Ser Val Phe Thr Asn Gly Ala Ile Cys Ser His Gly Tyr Cys 165 170 175 His Ile Pro Asp Val Asn Val Pro Val Arg Val Gly Gly Leu Ile Val 180 185 190 Arg Pro Asp Asp Leu Leu His Met Asp Val Asn Gly Val Thr Asn Ile 195 200 205 Pro Lys Glu Ile Ala Ala Glu Val Ala Glu Ala Cys Glu Ala Tyr Val 210 215 220 Ala Ala Glu Met Ala Thr Leu Asn Gly Leu His Ala Tyr Arg Gln Asp 225 230 235 240 Gly Asp Ala Gly Lys Leu Gln Glu Ala Lys Lys Glu Ser Lys Arg Leu 245 250 255 Met Gln Ala Leu Lys Glu Arg Val Arg Arg 260 265 <210> 25 <211> 741 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 25 atggctgaga agaaactgac cgggcggatt gcgcgggaga aaatcaggtt gatggaggtg 60 ccgcggccgc cgcaaggcgt cgtcgagcgg ttcaagtcgc tcggcgattg caccggcatc 120 atttccgaca ccatggatga actgggcatc ccgaacggcg tgatcggcgc gtcagtgctg 180 cgaccaacca tccccggcac cgtcatcgcc gggccggcgt tgacgctgcg caacattctc 240 cagcgcatcg atccactcgc cggcgcgcgc gagcacgtca acaagatggc cgagttcgaa 300 tgtcacaacc tcgcgacccc gggcgacgtg ctggtgatcc agggggtgcc gaacgtctcc 360 agtatgggag gcatctcggc gctgaccggc aagcgcgccg gtgaagtcgg cgccatcgtc 420 gaaggcggca tccgcgacat tgcacattcg cgtgaggttg gctttccact gtggtcgagc 480 cagatcacgc cggtcaccgg caagtggcgg ctggaggcgg ccgagatcaa cggcaccatc 540 gaaatcggcg gcgtgcaggt gcaccccggc gatctggtgg tggccgacga caccggcgtc 600 tgcttcatcc cgcgcgacaa cattctggaa gtgctcgccg agtgcgagaa gaaagcgaag 660 gccgaggacc tgcgctgcaa ggcgatcgat ggcggcgtcc cggtgccgga tatctcgaaa 720 tcgacgtatg gagagacgtg a 741 <210> 26 <211> 246 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (38)...(202) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (119)...(122) <223> N-glycosylation site. Prosite id = PS00001 <220> <221> SITE <222> (179)...(182) <223> N-glycosylation site. Prosite id = PS00001 <400> 26 Met Ala Glu Lys Lys Leu Thr Gly Arg Ile Ala Arg Glu Lys Ile Arg 1 5 10 15 Leu Met Glu Val Pro Arg Pro Pro Gln Gly Val Val Glu Arg Phe Lys 20 25 30 Ser Leu Gly Asp Cys Thr Gly Ile Ile Ser Asp Thr Met Asp Glu Leu 35 40 45 Gly Ile Pro Asn Gly Val Ile Gly Ala Ser Val Leu Arg Pro Thr Ile 50 55 60 Pro Gly Thr Val Ile Ala Gly Pro Ala Leu Thr Leu Arg Asn Ile Leu 65 70 75 80 Gln Arg Ile Asp Pro Leu Ala Gly Ala Arg Glu His Val Asn Lys Met 85 90 95 Ala Glu Phe Glu Cys His Asn Leu Ala Thr Pro Gly Asp Val Leu Val 100 105 110 Ile Gln Gly Val Pro Asn Val Ser Ser Met Gly Gly Ile Ser Ala Leu 115 120 125 Thr Gly Lys Arg Ala Gly Glu Val Gly Ala Ile Val Glu Gly Gly Ile 130 135 140 Arg Asp Ile Ala His Ser Arg Glu Val Gly Phe Pro Leu Trp Ser Ser 145 150 155 160 Gln Ile Thr Pro Val Thr Gly Lys Trp Arg Leu Glu Ala Ala Glu Ile 165 170 175 Asn Gly Thr Ile Glu Ile Gly Gly Val Gln Val His Pro Gly Asp Leu 180 185 190 Val Val Ala Asp Asp Thr Gly Val Cys Phe Ile Pro Arg Asp Asn Ile 195 200 205 Leu Glu Val Leu Ala Glu Cys Glu Lys Lys Ala Lys Ala Glu Asp Leu 210 215 220 Arg Cys Lys Ala Ile Asp Gly Gly Val Pro Val Pro Asp Ile Ser Lys 225 230 235 240 Ser Thr Tyr Gly Glu Thr 245 <210> 27 <211> 693 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 27 atgatttatc agccggggac aacaggcatc gtcgtgcagg atattgcacg cgctgatcaa 60 gccattatcg atggcctagc agaatgtggt gtggcgacgg tgcatgaggc acaggggcgc 120 aagggcctgt tggcggatta tatgacgccg atttactcgg gcgcgcgcat cgctggatct 180 gcggtgacca ttctggcacc gccgtgtgac aattggatga tccatgtggc ggtagaacag 240 ttgcaaaagg gcgatgtgtt gctgctgggc acgatcacac cgtccaatgc tggctatttc 300 ggtgacttgc tggccacgtc agccatggcg cacggttgtc gcggattgat cattgatggc 360 ggtgtgcgcg atgtgcaaga gctgacggat atgggctttc cggtttggtc caaggccgta 420 catgcccaag gcacaatcaa agaaacgctg ggatcggtca acgtgccagt tgtctgcggc 480 caagagttgg taaaccccgg tgatattgtg gtggccgacg atgacggggt gtgcgttgtg 540 cgccgcgaag aagctgctga tgtgctggct aaggcgcggg cgcgcgagag caatgaagcg 600 gccaagcgcg cgcgttttga ggccggtgag ctggggctgg atatctatga catgcgcgcg 660 cggctggccg aaaaaggact gaaatacgtc tga 693 <210> 28 <211> 230 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (27)...(179) <223> Demethylmenaquinone methyltransferase <400> 28 Met Ile Tyr Gln Pro Gly Thr Thr Gly Ile Val Val Gln Asp Ile Ala 1 5 10 15 Arg Ala Asp Gln Ala Ile Ile Asp Gly Leu Ala Glu Cys Gly Val Ala 20 25 30 Thr Val His Glu Ala Gln Gly Arg Lys Gly Leu Leu Ala Asp Tyr Met 35 40 45 Thr Pro Ile Tyr Ser Gly Ala Arg Ile Ala Gly Ser Ala Val Thr Ile 50 55 60 Leu Ala Pro Pro Cys Asp Asn Trp Met Ile His Val Ala Val Glu Gln 65 70 75 80 Leu Gln Lys Gly Asp Val Leu Leu Leu Gly Thr Ile Thr Pro Ser Asn 85 90 95 Ala Gly Tyr Phe Gly Asp Leu Leu Ala Thr Ser Ala Met Ala His Gly 100 105 110 Cys Arg Gly Leu Ile Ile Asp Gly Gly Val Arg Asp Val Gln Glu Leu 115 120 125 Thr Asp Met Gly Phe Pro Val Trp Ser Lys Ala Val His Ala Gln Gly 130 135 140 Thr Ile Lys Glu Thr Leu Gly Ser Val Asn Val Pro Val Val Cys Gly 145 150 155 160 Gln Glu Leu Val Asn Pro Gly Asp Ile Val Val Ala Asp Asp Asp Gly 165 170 175 Val Cys Val Val Arg Arg Glu Glu Ala Ala Asp Val Leu Ala Lys Ala 180 185 190 Arg Ala Arg Glu Ser Asn Glu Ala Ala Lys Arg Ala Arg Phe Glu Ala 195 200 205 Gly Glu Leu Gly Leu Asp Ile Tyr Asp Met Arg Ala Arg Leu Ala Glu 210 215 220 Lys Gly Leu Lys Tyr Val 225 230 <210> 29 <211> 756 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 29 ttgcagcgac agctttccac actgcagcgg cgatggaagg cttatacgtc gggcatggaa 60 cagaagattg cggaacggct gtcggccttg tcggtggcgc atctggccga tggctgcctg 120 cgtgccggaa cggcgatgcg ggtggtggcc aatctacccc cgatcgtagc tggtcagcga 180 acgtccggcc ggacacggcc ggtgcggcat tacggcagcg tcgacgtctt ccttgaagcg 240 ctggccgacc ccagggcggg cgatgtgctg gtcgtcgaca atggcgaccg ggacgatgaa 300 ggctgcatcg gcgacctgac ggcgctggaa gtcgctcagg ccgggctggc cgggatcatc 360 atctcgggcc ggcaccgcga cacggcgatc ctccgctcca ttccaatcgc cttgttcagc 420 cgcggtgcct gcgcgcgtgg gccggtccgg ctcgacgtcc gcgcgccgga gacattcgtc 480 agcgcccgca ttggcgacga ggtcgtaacc gcagcagatt gggtagcggc cgatgacgac 540 ggcgccatct tcatcggcga caaccatatt gcggcggtgg tcgcggcggc ggagtcgatc 600 cgcgacaccg agctccggca gaccgggctg atgaaggccg ggacaagctt gcgcgagcag 660 cttgaggtcg cggcttatct ggacgcgcgg gcggcggatc cggcgctgga cttccgcgcc 720 catttgcgcg cgctcaacgc ggcgatcgag gaatga 756 <210> 30 <211> 251 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (28)...(184) <223> Demethylmenaquinone methyltransferase <400> 30 Met Gln Arg Gln Leu Ser Thr Leu Gln Arg Arg Trp Lys Ala Tyr Thr 1 5 10 15 Ser Gly Met Glu Gln Lys Ile Ala Glu Arg Leu Ser Ala Leu Ser Val 20 25 30 Ala His Leu Ala Asp Gly Cys Leu Arg Ala Gly Thr Ala Met Arg Val 35 40 45 Val Ala Asn Leu Pro Pro Ile Val Ala Gly Gln Arg Thr Ser Gly Arg 50 55 60 Thr Arg Pro Val Arg His Tyr Gly Ser Val Asp Val Phe Leu Glu Ala 65 70 75 80 Leu Ala Asp Pro Arg Ala Gly Asp Val Leu Val Val Asp Asn Gly Asp 85 90 95 Arg Asp Asp Glu Gly Cys Ile Gly Asp Leu Thr Ala Leu Glu Val Ala 100 105 110 Gln Ala Gly Leu Ala Gly Ile Ile Ile Ser Gly Arg His Arg Asp Thr 115 120 125 Ala Ile Leu Arg Ser Ile Pro Ile Ala Leu Phe Ser Arg Gly Ala Cys 130 135 140 Ala Arg Gly Pro Val Arg Leu Asp Val Arg Ala Pro Glu Thr Phe Val 145 150 155 160 Ser Ala Arg Ile Gly Asp Glu Val Val Thr Ala Ala Asp Trp Val Ala 165 170 175 Ala Asp Asp Asp Gly Ala Ile Phe Ile Gly Asp Asn His Ile Ala Ala 180 185 190 Val Val Ala Ala Ala Glu Ser Ile Arg Asp Thr Glu Leu Arg Gln Thr 195 200 205 Gly Leu Met Lys Ala Gly Thr Ser Leu Arg Glu Gln Leu Glu Val Ala 210 215 220 Ala Tyr Leu Asp Ala Arg Ala Ala Asp Pro Ala Leu Asp Phe Arg Ala 225 230 235 240 His Leu Arg Ala Leu Asn Ala Ala Ile Glu Glu 245 250 <210> 31 <211> 327 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 31 gtgagacagg gaatgcgact tgctcacacg cgtgtggcgc ccgaacttgt atcggccttc 60 tcggctgttc agaccgccac gattcacgag gcacaaggtg gtatcggtgc ggtcgcggcg 120 gatattcgcc ctctcgaccg ggcaatgtcc atctgcggcc ctgccctgac gatcaaaact 180 ccgcccgcgg acaacctggc gcttcaccag gcgctttatc tcgcggaacc gggtgacgtg 240 ctggtggtcg attgcgcaag ccacaccgag gccgggcaat ggggcggcat tctcatggaa 300 gcagccaagg tgcgcggcat agccggg 327 <210> 32 <211> 109 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <400> 32 Met Arg Gln Gly Met Arg Leu Ala His Thr Arg Val Ala Pro Glu Leu 1 5 10 15 Val Ser Ala Phe Ser Ala Val Gln Thr Ala Thr Ile His Glu Ala Gln 20 25 30 Gly Gly Ile Gly Ala Val Ala Ala Asp Ile Arg Pro Leu Asp Arg Ala 35 40 45 Met Ser Ile Cys Gly Pro Ala Leu Thr Ile Lys Thr Pro Pro Ala Asp 50 55 60 Asn Leu Ala Leu His Gln Ala Leu Tyr Leu Ala Glu Pro Gly Asp Val 65 70 75 80 Leu Val Val Asp Cys Ala Ser His Thr Glu Ala Gly Gln Trp Gly Gly 85 90 95 Ile Leu Met Glu Ala Ala Lys Val Arg Gly Ile Ala Gly 100 105 <210> 33 <211> 681 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 33 gcgctcgaga gcgtcacgac cgcgacgctg accaccgtgc tgctgaagca gggcctgcgc 60 aacgtctgga tgcgcggcac ccggccgctg gcgagcggtc agccgcgcaa ggtcgggcgc 120 gcgttcacgc tccgcttcgt gccggcgcgc gaggacctcg cgaccccggc ttcatggggc 180 gcgccgatct cgacccgcgc cgcgatcgag gcgatgccgg aaggcgtgat cgcggtcgcc 240 gatgcgatgg gcgtgactga cgccggcatc ttcggcgaca tcctgtgcgc ccggatgcgc 300 cggcgcaacg tggccgcgct cgtgaccgac ggcgtgatcc gcgacctggc cggcgtgctg 360 agcaccggcc tgccggtctg gtgccagggt accgcagcgc cttcgtcggt caccggcctg 420 accttcgtcg cctggcagca gccggtcggc tgcggtgggg tggcggtgtt cccgaacgac 480 gtggtcgtca tcgacgccga cggcgcggtc gtcatcccgg ctgcgctgct cgatggcgtc 540 atcgcggagg cgatcgagca ggagacccag gagggctgga tcatgcggga ggtggagggc 600 ggtgcggcgc tgccgggcct ctatccgatg aacgaggcga cgaaggcgcg ctacgaagcc 660 tggaagaagg cgagcgactg a 681 <210> 34 <211> 226 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (3)...(171) <223> Demethylmenaquinone methyltransferase <400> 34 Ala Leu Glu Ser Val Thr Thr Ala Thr Leu Thr Thr Val Leu Leu Lys 1 5 10 15 Gln Gly Leu Arg Asn Val Trp Met Arg Gly Thr Arg Pro Leu Ala Ser 20 25 30 Gly Gln Pro Arg Lys Val Gly Arg Ala Phe Thr Leu Arg Phe Val Pro 35 40 45 Ala Arg Glu Asp Leu Ala Thr Pro Ala Ser Trp Gly Ala Pro Ile Ser 50 55 60 Thr Arg Ala Ala Ile Glu Ala Met Pro Glu Gly Val Ile Ala Val Ala 65 70 75 80 Asp Ala Met Gly Val Thr Asp Ala Gly Ile Phe Gly Asp Ile Leu Cys 85 90 95 Ala Arg Met Arg Arg Arg Asn Val Ala Ala Leu Val Thr Asp Gly Val 100 105 110 Ile Arg Asp Leu Ala Gly Val Leu Ser Thr Gly Leu Pro Val Trp Cys 115 120 125 Gln Gly Thr Ala Ala Pro Ser Ser Val Thr Gly Leu Thr Phe Val Ala 130 135 140 Trp Gln Gln Pro Val Gly Cys Gly Gly Val Ala Val Phe Pro Asn Asp 145 150 155 160 Val Val Val Ile Asp Ala Asp Gly Ala Val Val Ile Pro Ala Ala Leu 165 170 175 Leu Asp Gly Val Ile Ala Glu Ala Ile Glu Gln Glu Thr Gln Glu Gly 180 185 190 Trp Ile Met Arg Glu Val Glu Gly Gly Ala Ala Leu Pro Gly Leu Tyr 195 200 205 Pro Met Asn Glu Ala Thr Lys Ala Arg Tyr Glu Ala Trp Lys Lys Ala 210 215 220 Ser Asp 225 <210> 35 <211> 681 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 35 gtgaccgatc cggttgtcgt tcgacagatc gacaggccgt ccgcgaatct ggtcgctgat 60 ctgcagcgct acggcgtctc caccgtgcac gaggcgcaag ggcgtcgcgg cctgctcgcg 120 tcgtacatgc ggccgatcta tgccggcgcg ctcatcgccg gtcccgcgat cacggtcctg 180 gtgccgcctg gcgacaactt gatgatccac gtcgccgtgg aagtgtgcca gcccggcgac 240 gttctcatcg tcgccaccac ctcgccgtgc accgacggct atttcggcga gctgctggcg 300 acgtcgctgc gggcccgcgg cgtggcgggg ctcgtgatcg atgcgggctg ccgggatgtt 360 cgcgcgctga cagaaatgcg atttcccgtc tggagccgcg cgatcagcgc gcagggaacc 420 gtcaaagcga cgctgggctc ggtgaacgcg gcggtggtgt gcgccggggc gtcggtgaga 480 gccggggatc tcatcgtggc cgacgatgac ggggtggtgg cggtgcggcg ggaggaagtc 540 gtcgccgtga cgcaggcagc cgaacagcgc gttcgcaagg aagagggcac gcgcgcacgg 600 ctcgcgcagg gcgagctcgg cctggacatt tacggcttgc gccagaagct gtcggatctc 660 ggcttgaagt catcgtcgtg a 681 <210> 36 <211> 226 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 36 Met Thr Asp Pro Val Val Val Arg Gln Ile Asp Arg Pro Ser Ala Asn 1 5 10 15 Leu Val Ala Asp Leu Gln Arg Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala 35 40 45 Gly Ala Leu Ile Ala Gly Pro Ala Ile Thr Val Leu Val Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Pro Gly Asp 65 70 75 80 Val Leu Ile Val Ala Thr Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Ala Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Arg Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Ala Ala Val Val Cys Ala Gly Ala Ser Val Arg 145 150 155 160 Ala Gly Asp Leu Ile Val Ala Asp Asp Asp Gly Val Val Ala Val Arg 165 170 175 Arg Glu Glu Val Val Ala Val Thr Gln Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Gln Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Gln Lys Leu Ser Asp Leu Gly Leu Lys Ser 210 215 220 Ser Ser 225 <210> 37 <211> 675 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 37 atggccggcg tcgtggttca acagatcgag cgcgccggtc tcgacactgc cgctgccctc 60 ggggaatgcg gcgtcgccac agtgcacgag gcgcagggcc ggacagggct gatgcgctcc 120 tacatgcggc cgatttattc aggcgcccgc gttgcgggcc ccgcggtaac ggtgtctatc 180 ccgccgggcg acaactggat gattcacgtc gctgtggaac agtgccggga aggcgacgtc 240 ctcgtcgtgg cgccgacgag tccttgcgag gacggctatt tcggcgagct gctcgcctgc 300 tcgctgcaga cccgccgagt gagcggtctc atcatagagg ccggggtgcg cgacgtccgc 360 gagctgaccg agatgcggtt cccggtttgg tccaaggcga ttctcgcaca agggactgtg 420 aaggaaacca tcggctcggt gaacgtcgca atcgtctgcg ccggtgcggc ggtcagtccc 480 ggcgacgtga tcgtcgccga tgacgacggc gtctgcattg tgccgcgcgg acaggcggag 540 acggtgcttc aggcgagccg cgcccgcgag gcgaaggagg ccgaaacgcg gcggcggctc 600 cggtcgggcg aactcggcct cgatatctac agcatgcgcg aaaagctggc ggccaggggc 660 ctgaaatatg tctga 675 <210> 38 <211> 224 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (21)...(173) <223> Demethylmenaquinone methyltransferase <400> 38 Met Ala Gly Val Val Val Gln Gln Ile Glu Arg Ala Gly Leu Asp Thr 1 5 10 15 Ala Ala Ala Leu Gly Glu Cys Gly Val Ala Thr Val His Glu Ala Gln 20 25 30 Gly Arg Thr Gly Leu Met Arg Ser Tyr Met Arg Pro Ile Tyr Ser Gly 35 40 45 Ala Arg Val Ala Gly Pro Ala Val Thr Val Ser Ile Pro Pro Gly Asp 50 55 60 Asn Trp Met Ile His Val Ala Val Glu Gln Cys Arg Glu Gly Asp Val 65 70 75 80 Leu Val Val Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Glu 85 90 95 Leu Leu Ala Cys Ser Leu Gln Thr Arg Arg Val Ser Gly Leu Ile Ile 100 105 110 Glu Ala Gly Val Arg Asp Val Arg Glu Leu Thr Glu Met Arg Phe Pro 115 120 125 Val Trp Ser Lys Ala Ile Leu Ala Gln Gly Thr Val Lys Glu Thr Ile 130 135 140 Gly Ser Val Asn Val Ala Ile Val Cys Ala Gly Ala Ala Val Ser Pro 145 150 155 160 Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Ile Val Pro Arg 165 170 175 Gly Gln Ala Glu Thr Val Leu Gln Ala Ser Arg Ala Arg Glu Ala Lys 180 185 190 Glu Ala Glu Thr Arg Arg Arg Leu Arg Ser Gly Glu Leu Gly Leu Asp 195 200 205 Ile Tyr Ser Met Arg Glu Lys Leu Ala Ala Arg Gly Leu Lys Tyr Val 210 215 220 <210> 39 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 39 atggccaaag ttgttcaaaa tatcgaacgc gcagcccaaa aggtgattga tgcgcttggg 60 gcctgcggtg ttgccacggt gcatgaggcg caggggcgca aaggcctgct cgcttcctat 120 atgcggccga tttattccgg tgcgcggctt gcggcatcgg cggtgaccat atcggctgca 180 cccggtgata actggatggt gcatgtggcg attgagcaag tgaaagaggg cgacattttg 240 gtgcttgccc cgacctcgcc ttgtgaagac ggctattttg gcgatctgct ggcgacatcg 300 atgcaggcgc gtggcgggcg tgggctgatt atcgatgccg gggttcgcga tattcgcgat 360 ctgacggaaa tgggttttcc ggtgtggtca aaggcgattt atgcccaagg cacggtcaag 420 aaaacgctgg ggtcggttaa tattcctatc gtctgcgccg gtgcgcttat caatgctggc 480 gacattattg ttgccgatga tgacggtgtg tgtgttgtgg cccgagaaga ggccgaagcg 540 gtgctggcca aggcgcaggc gcgcgaggcc aatgaggaag acaagcgcaa gcggttggct 600 gccggtgagt tggggcttga tatgtataac atgcgcgcac ggctggcgga aaagggcctg 660 aaatatgttt ag 672 <210> 40 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 40 Met Ala Lys Val Val Gln Asn Ile Glu Arg Ala Ala Gln Lys Val Ile 1 5 10 15 Asp Ala Leu Gly Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly Ala 35 40 45 Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Ala Pro Gly Asp Asn 50 55 60 Trp Met Val His Val Ala Ile Glu Gln Val Lys Glu Gly Asp Ile Leu 65 70 75 80 Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Met Gln Ala Arg Gly Gly Arg Gly Leu Ile Ile Asp 100 105 110 Ala Gly Val Arg Asp Ile Arg Asp Leu Thr Glu Met Gly Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Tyr Ala Gln Gly Thr Val Lys Lys Thr Leu Gly 130 135 140 Ser Val Asn Ile Pro Ile Val Cys Ala Gly Ala Leu Ile Asn Ala Gly 145 150 155 160 Asp Ile Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Ala Arg Glu 165 170 175 Glu Ala Glu Ala Val Leu Ala Lys Ala Gln Ala Arg Glu Ala Asn Glu 180 185 190 Glu Asp Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Met 195 200 205 Tyr Asn Met Arg Ala Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val 210 215 220 <210> 41 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 41 atgggtgtcg tggtccagaa cattgcccgc gcagcctccg atgtcatcga tcggctcgca 60 gcctgcggtg tcgcaacggt acatgaggcg cagggtcgca cggggctgct tgccagccat 120 atgcggccga tctatccggg cgcgcggctc gcggcaagcg cggtgaccat ctctgcgccg 180 ccaggtgaca actggatgat ccatgtggcg atcgagcagt tgaaggatgg cgacgtgctg 240 ctgctcgcgc cgacgagccc ctgcgaggat ggctatttcg gcgacctcct ggcgacgtcg 300 gccagggcga ggggctgccg gggcctgatc atcgatgccg gcgtgcgcga cgttgccgat 360 ctgaccgaga tgaagtttcc cgtctggtcg aaggcgatct ttgcgcaggg aaccgtcaag 420 gagactgtcg gatcggtgaa tgtaccggtc gtttgcgccg gtgctttcgt caatccgggc 480 gatgtgatcg tcgccgacga tgacggcgcc tgcgtcgtgc cccggcaaga cgcggccgat 540 gtggccgaca aggcggaggc acgtgtcgct gccgaggagg ccaagcgcaa gcggctggca 600 tcgggcgagc ttgggctcga catctacgac atgcgcgggc ggctggcgca gaggggcctg 660 aaatatgtct ga 672 <210> 42 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 42 Met Gly Val Val Val Gln Asn Ile Ala Arg Ala Ala Ser Asp Val Ile 1 5 10 15 Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Thr Gly Leu Leu Ala Ser His Met Arg Pro Ile Tyr Pro Gly Ala 35 40 45 Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn 50 55 60 Trp Met Ile His Val Ala Ile Glu Gln Leu Lys Asp Gly Asp Val Leu 65 70 75 80 Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Arg Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp 100 105 110 Ala Gly Val Arg Asp Val Ala Asp Leu Thr Glu Met Lys Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Val Gly 130 135 140 Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Phe Val Asn Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Ala Cys Val Val Pro Arg Gln 165 170 175 Asp Ala Ala Asp Val Ala Asp Lys Ala Glu Ala Arg Val Ala Ala Glu 180 185 190 Glu Ala Lys Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Asp Met Arg Gly Arg Leu Ala Gln Arg Gly Leu Lys Tyr Val 210 215 220 <210> 43 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 43 atgagcgtcg tcgttcagaa catcgcgcgc gccgatcaat ccatcgtcga taggctcggg 60 gcctgcggcg tcgccaccgt gcacgaagcg cagggccgca aaggattgct cgcgagccac 120 atgcggccga tctattccgg cgcgcggctc gcggcgagcg ccgtgaccat ctcggcgccg 180 ccgggtgaca attggatggt ccatgtcgcg atcgagcaat tgcgagccgg cgacattatg 240 gtgctcgcgc cgaccagccc gtgcgaggat ggctatttcg gtgatctgct cgcgacctcg 300 gcgaaagcgc ggggctgccg cggtctcatc atcgatgccg gcgtgcgcga tgtcgccgat 360 ctcaccgcga tgcagtttcc cgtctggtcc aaggccgtct tcgcccaggg aaccgtgaag 420 gaaacgctcg gctcggtaaa catccccgtg gtctgcgccg gtgcgctggt caatccgggc 480 gatgtcatcg tcgccgatga cgatggtgtc tgcgtcgtgc gccgcgaaga ggcggaggcg 540 gtggcgcaga aggccgaggc ccgcgtcgcc gccgaggagg ataagcgcaa gcgcctcgcc 600 gccggcgaac tcggcctcga catctacaag atgcgcgagc ggctcgccga gaaggggctc 660 aaatatgtct ga 672 <210> 44 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 44 Met Ser Val Val Val Gln Asn Ile Ala Arg Ala Asp Gln Ser Ile Val 1 5 10 15 Asp Arg Leu Gly Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Lys Gly Leu Leu Ala Ser His Met Arg Pro Ile Tyr Ser Gly Ala 35 40 45 Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn 50 55 60 Trp Met Val His Val Ala Ile Glu Gln Leu Arg Ala Gly Asp Ile Met 65 70 75 80 Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Lys Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp 100 105 110 Ala Gly Val Arg Asp Val Ala Asp Leu Thr Ala Met Gln Phe Pro Val 115 120 125 Trp Ser Lys Ala Val Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Ile Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu 165 170 175 Glu Ala Glu Ala Val Ala Gln Lys Ala Glu Ala Arg Val Ala Ala Glu 180 185 190 Glu Asp Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val 210 215 220 <210> 45 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 45 atgaacgttg tcgtccagaa ctttgaacgg gctgatcctg cggttgttaa ggccttgggc 60 gaatgtggtg tggccacggt gcatgaagca cagggccgca aggggctttt agcctcttat 120 atacgcccga tttatagcgg aacttctatc ggggcttcgg ctgttaccat acttgcggct 180 ccatgcgaca actggatgct gcatgtggcg atcgaacaag tgcaagcggg cgatgtattg 240 gtactggcgg ttacgtcacc atcagacgca ggttactttg gcgatttgtt agcaacatct 300 gcgcaagcgc ggggttgcgc aggtttgatc actgatgcgg gcgtacgcga tgtgcgcgat 360 ttgcaggcga tgaattttcc ggtttggtcg aaagcgatct gtgcgcaagg cacggtgaaa 420 gaaaccctgg gttcggtcaa cgttcccgtt gtctgtgcag gagcgaagat taatcccggt 480 gatgtgattg tggcggatga tgatggggtt tgcgctgtga agtgcgaaga ggcggcagag 540 gttttgaaaa aagcgcaagc gcgtttggcc aatgaagagc agaaacgtac gcgattggct 600 gatggtgagt tagggctgga catgtatgat atgcgcgggc gcctagctga aaaaggtctg 660 aaatatgtct aa 672 <210> 46 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 46 Met Asn Val Val Val Gln Asn Phe Glu Arg Ala Asp Pro Ala Val Val 1 5 10 15 Lys Ala Leu Gly Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Lys Gly Leu Leu Ala Ser Tyr Ile Arg Pro Ile Tyr Ser Gly Thr 35 40 45 Ser Ile Gly Ala Ser Ala Val Thr Ile Leu Ala Ala Pro Cys Asp Asn 50 55 60 Trp Met Leu His Val Ala Ile Glu Gln Val Gln Ala Gly Asp Val Leu 65 70 75 80 Val Leu Ala Val Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Gln Ala Arg Gly Cys Ala Gly Leu Ile Thr Asp 100 105 110 Ala Gly Val Arg Asp Val Arg Asp Leu Gln Ala Met Asn Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Cys Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Lys Ile Asn Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Ala Val Lys Cys Glu 165 170 175 Glu Ala Ala Glu Val Leu Lys Lys Ala Gln Ala Arg Leu Ala Asn Glu 180 185 190 Glu Gln Lys Arg Thr Arg Leu Ala Asp Gly Glu Leu Gly Leu Asp Met 195 200 205 Tyr Asp Met Arg Gly Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val 210 215 220 <210> 47 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 47 atgggtattg ttgttcagaa catcaagcgg gcggaccccg ggatcatagc aggtcttggc 60 aaatgcggcg ttgccactgt gcatgaagcg caggggtgca aggggctcct ggcggcctat 120 atgcggccca tttattctgg cgcgcgcctt gccgcctccg ctgtcaccat ttccgcgccg 180 ccgggagaca actggatggt gcatgtcgcc attgagcagg tgaggcaagg tgatattctg 240 gttcttgccc caacatcgcc ctgtgaagac ggctatttcg gtgatttgct cgccacctcc 300 atgctgcagc gcggcggcag ggggctgatt attgacgccg gtgtccgcga tatccgtgat 360 ctgactcaaa tgaaatttcc ggtgtggtcg aaaaccgttt ttgcgcaggg caccgttaag 420 gaaacccttg gctctgtgaa cgtcccgata gtttgcgccg gtgaagtggt caatcctggc 480 gacatcatga ttgccgatga tgatggtgtg tgcgtggtcc ggcgcgacga cgctgaaagc 540 gtgcttgaaa aagcattggc gcgtgaggca aaggaagaag atacacgcaa acgccttgcg 600 gcaggcgagc tgggtcttga tatttacggc atgcgcgcac gtctggccga aaagggccta 660 aaatatgtct ga 672 <210> 48 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 48 Met Gly Ile Val Val Gln Asn Ile Lys Arg Ala Asp Pro Gly Ile Ile 1 5 10 15 Ala Gly Leu Gly Lys Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Cys Lys Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Ser Gly Ala 35 40 45 Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn 50 55 60 Trp Met Val His Val Ala Ile Glu Gln Val Arg Gln Gly Asp Ile Leu 65 70 75 80 Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Met Leu Gln Arg Gly Gly Arg Gly Leu Ile Ile Asp 100 105 110 Ala Gly Val Arg Asp Ile Arg Asp Leu Thr Gln Met Lys Phe Pro Val 115 120 125 Trp Ser Lys Thr Val Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Ile Val Cys Ala Gly Glu Val Val Asn Pro Gly 145 150 155 160 Asp Ile Met Ile Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Asp 165 170 175 Asp Ala Glu Ser Val Leu Glu Lys Ala Leu Ala Arg Glu Ala Lys Glu 180 185 190 Glu Asp Thr Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Gly Met Arg Ala Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val 210 215 220 <210> 49 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 49 atgagcatcg tcgtccagaa catcgagcgc gccgacaagg atgcggttgt ggcactcggc 60 gaatgcggcg ttgcgacggt gcatgaggcg caggcccgca aagggctcat gcggccttac 120 atgcggccaa tctatgccgg cgcccgcatc gccggcccag ccgtgacggt ctcgatcgcg 180 ccgggcgaca actggatgat ccatgtggca gtggagcagt gccgcgacgg cgatatcctc 240 gtggtggcac cgaccagccc gagtgaagac ggctatttcg gcgaactgct ggcgcgctcg 300 ctcatggcgc gcggtgtgaa ggggctgatc atcgaagccg gggtgcgcga cgtgcgcgac 360 ctcaccgaga tcaatttccc ggtctggtcg aaagcgatct ccgcgcaagg gacggtgaag 420 gaaacgctcg gctcggtgaa tgtgccggtc gtctgcgccg gcgcgctggt caatccgggc 480 gacgtcatca ttgccgatga cgacggcgtc tgtgtcgtgg cgcgcgctgc ggcaagtgac 540 gttgcgaagg cgtcccgaac ccgcgaagcc aaggaagccg aaacccgcaa gcgcctgatg 600 gcgggtgaac tcggactcga catctacggg atgcgcgaca agcttgcggc caagggcctg 660 aaatatgtct ga 672 <210> 50 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 50 Met Ser Ile Val Val Gln Asn Ile Glu Arg Ala Asp Lys Asp Ala Val 1 5 10 15 Val Ala Leu Gly Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Ala 20 25 30 Arg Lys Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Ala Gly Ala 35 40 45 Arg Ile Ala Gly Pro Ala Val Thr Val Ser Ile Ala Pro Gly Asp Asn 50 55 60 Trp Met Ile His Val Ala Val Glu Gln Cys Arg Asp Gly Asp Ile Leu 65 70 75 80 Val Val Ala Pro Thr Ser Pro Ser Glu Asp Gly Tyr Phe Gly Glu Leu 85 90 95 Leu Ala Arg Ser Leu Met Ala Arg Gly Val Lys Gly Leu Ile Ile Glu 100 105 110 Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Ile Asn Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro Gly 145 150 155 160 Asp Val Ile Ile Ala Asp Asp Asp Gly Val Cys Val Val Ala Arg Ala 165 170 175 Ala Ala Ser Asp Val Ala Lys Ala Ser Arg Thr Arg Glu Ala Lys Glu 180 185 190 Ala Glu Thr Arg Lys Arg Leu Met Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Gly Met Arg Asp Lys Leu Ala Ala Lys Gly Leu Lys Tyr Val 210 215 220 <210> 51 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 51 atgggcgtcg tggtccagaa tatcgcccgg gccgagcagt ccgtcgtcga caggctggct 60 gcgtgcggtg ttgccacggt gcacgaggcg cagggccgca aggggctgct cgcgagttct 120 gtgcggccga tctatccggg cgcgcgggtg gcggccagcg cggtcacgat ctcagcgccg 180 ccgggtgaca actggatggt ccatgtagcg atcgaacagt tgaaggaggg cgacatcctg 240 ctgttggcgc cgaccagtcc ctgcgaggat ggctatttcg gtgatctgct cgccacttcg 300 gccatggcgc ggggctgccg cggactgatc atagatgcgg gggtgcgcga cgtcgcggac 360 ctgacggcga tgcagtttcc agtctggtcc aaggcgatct tcgcccaagg caccgtcaag 420 gaaacgctgg gttcggtgaa tattcctgtg gtctgcgccg gcgcgctggt caatcccggt 480 gacgtgatcg tggccgatga cgacggcgtc tgcgtcgtcc gccgcgaaga ggcggccgcc 540 gtcgccgaaa aggcggaggc acgggtggcg atcgaggaag gcaaacgcaa gcggctcgcg 600 gcgggcgaac tcgggctcga tatttacgac atgcgcagtc gccttgccga gaaggggctg 660 aaatatgtct ga 672 <210> 52 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 52 Met Gly Val Val Val Gln Asn Ile Ala Arg Ala Glu Gln Ser Val Val 1 5 10 15 Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Lys Gly Leu Leu Ala Ser Ser Val Arg Pro Ile Tyr Pro Gly Ala 35 40 45 Arg Val Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn 50 55 60 Trp Met Val His Val Ala Ile Glu Gln Leu Lys Glu Gly Asp Ile Leu 65 70 75 80 Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Met Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp 100 105 110 Ala Gly Val Arg Asp Val Ala Asp Leu Thr Ala Met Gln Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Ile Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu 165 170 175 Glu Ala Ala Ala Val Ala Glu Lys Ala Glu Ala Arg Val Ala Ile Glu 180 185 190 Glu Gly Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Asp Met Arg Ser Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val 210 215 220 <210> 53 <211> 675 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 53 atgaagccgg tggtggtgca gactatcgag cgggccgacc gagcgatcat cgagggtctg 60 gccgcgtgtg gcgttgccac cgtccatgag gcgcaggggc gccgggggct gcttgcgtcc 120 tacatgcgcc cgatctattc gggcgctgcg gttgcggcct cggccgtcac catcctctct 180 ccaccctgcg acaactggat gctgcacgtc gccatcgagc agatccagcc gggcgacatt 240 ctcgttctcg gcacgacctc tccgtccgat gccggctatt tcggtgatct gctggcgact 300 tcggccaagg cgcgcggttg cgtcgggttg gtcatcgatg ccggcgtacg cgatatccgc 360 gacctgacag cgatgcagtt tccggtctgg tccaaggccg tttcggccca gggcacgatc 420 aaggagacgc tgggttcggt caacgtcccc gtcgtctgcg ccggtgctct ggtcaatccc 480 ggcgacgtcg tcgtggccga tgacgacggt gtctgcgtgg tgcgccgcga ggaagccgcg 540 gaaacgctgg aaaaggcccg ggcgcggatc gccaatgagg aggaaaagcg ccagcgcttt 600 gccgctggcg aactcgggct cgacatctac aagatgcgcg aacgcctcgc tgccctgggg 660 ctcacctatg tctga 675 <210> 54 <211> 224 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (21)...(173) <223> Demethylmenaquinone methyltransferase <400> 54 Met Lys Pro Val Val Val Gln Thr Ile Glu Arg Ala Asp Arg Ala Ile 1 5 10 15 Ile Glu Gly Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln 20 25 30 Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly 35 40 45 Ala Ala Val Ala Ala Ser Ala Val Thr Ile Leu Ser Pro Pro Cys Asp 50 55 60 Asn Trp Met Leu His Val Ala Ile Glu Gln Ile Gln Pro Gly Asp Ile 65 70 75 80 Leu Val Leu Gly Thr Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp 85 90 95 Leu Leu Ala Thr Ser Ala Lys Ala Arg Gly Cys Val Gly Leu Val Ile 100 105 110 Asp Ala Gly Val Arg Asp Ile Arg Asp Leu Thr Ala Met Gln Phe Pro 115 120 125 Val Trp Ser Lys Ala Val Ser Ala Gln Gly Thr Ile Lys Glu Thr Leu 130 135 140 Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro 145 150 155 160 Gly Asp Val Val Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg 165 170 175 Glu Glu Ala Ala Glu Thr Leu Glu Lys Ala Arg Ala Arg Ile Ala Asn 180 185 190 Glu Glu Glu Lys Arg Gln Arg Phe Ala Ala Gly Glu Leu Gly Leu Asp 195 200 205 Ile Tyr Lys Met Arg Glu Arg Leu Ala Ala Leu Gly Leu Thr Tyr Val 210 215 220 <210> 55 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 55 atgaatgatc cggtggtggt ccggcaagtg gagcagccgc cagccgacgc cgttgtcgca 60 ttggagaagt gtggtgtgac gaccgtgcat gaagctcagg gacgttgtgg tctccttgcc 120 tcctacatgc gtccgattta ctcgggagca agcatcgccg gttccgctgt gactgtctct 180 ctgcctcctg gcgacaacct catgatccac gtcgccgtcg aggtttgcgg tccgggaaac 240 atcctggtcg tttcaccaac gtcgccttgc accgatggct acttcggaga gctgttggcg 300 acatctctcc gtgcccacgg tgtaagaggg ctggtgatcg acgccggctg ccgcgacgtc 360 cggtcgttaa ccgagatgaa atttcctgtc tggagccgcg gcatcagctc gcaagggaca 420 gtcaaagcca cgctcggatc tgtgaacgtg gcggtcactt gcgcgggtgc actggtcgaa 480 gctggcgatg taatcgtcgc cgatgacgat ggagttgtgg ttgtgaagcg cgcgcaggcg 540 caagaggtcg ccgccgcggc gcaacaacgg gttcgcaaag aagacgtaac tcgagagcga 600 cttgctcgtg gagaactcgg actggatatt tacgacatgc gccaaaagat cgcgcaactg 660 ggcctaaagt atctgtga 678 <210> 56 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 56 Met Asn Asp Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Val Val Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser 35 40 45 Gly Ala Ser Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Gly Ile Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Ala Val Thr Cys Ala Gly Ala Leu Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Gln Ala Gln Glu Val Ala Ala Ala Ala Gln Gln Arg Val Arg 180 185 190 Lys Glu Asp Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 57 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 57 atgaatgatc cggtggtagt ccgagaggtg gagcagccac cagcggatgc ggttgtcaca 60 ttggagaagt gcggagtgac aactgtgcat gaggcgcagg gacgttgtgg ccttctcgcc 120 cactacatgc gtccgattta tcctggagcc accatcgccg gttccgctgt cactgtctct 180 ttgccgcctg gcgacaacct catgatccac gttgcggtcg aggtttgtcg tccgggaaac 240 atcctggtcg tttcaccgac gtcgccttgc accgatggct acttcggaga gctgttggcg 300 acatctctcc gtgcccacgg tgtaagaggg ctggtgatcg acgccggctg ccgcgacgtc 360 cggtcgttga ccgagatgaa atttcctgtc tggagccgcg gcatcagctc gcaagggacg 420 gtcaaagcca cgctcggatc tgtgaacgtg gcggtcactt gcgcgggtgc actggtcgaa 480 gctggcgatg taatcgtcgc cgatgacgat ggagttgtgg ttgtgaagcg cgcgcaggcg 540 caagaggtcg ccgccgcggc gcaacaacgg gttcgcaaag aagacgtaac tcgagagcga 600 cttgctcgtg gagaactcgg actcgatatt tacgacatgc gccaaaagat cgcgcaactg 660 ggcctaaagt atctgtga 678 <210> 58 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 58 Met Asn Asp Pro Val Val Val Arg Glu Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Val Val Thr Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro Ile Tyr Pro 35 40 45 Gly Ala Thr Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Gly Ile Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Ala Val Thr Cys Ala Gly Ala Leu Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Gln Ala Gln Glu Val Ala Ala Ala Ala Gln Gln Arg Val Arg 180 185 190 Lys Glu Asp Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 59 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 59 atgaatgatc cggtggtagt ccgagaggtg gagcagccac cagcggatgc ggttgtcaca 60 ttggagaagt gtggagtgac aaccgtgcat gaggcacagg gacgttgtgg ccttctcgcg 120 cactacatgc gtccgattta cccgggggca accatcgccg gttccgctgt cactgtctct 180 ttgccgcctg gcgacaacct catgatccac gtcgccgtcg aggtttgcgg tccgggaaac 240 atcctggtcg tttcaccgac gtcgccttgc accgatggct acttcggaga gctgttggcg 300 acatctctcc gtgcccacgg tgtaagaggg ctggtgatcg acgccggatg ccgtgatgtc 360 cggtcgttga ccgagatgaa atttcctgtc tggagccgcg cgatcagctc gcaagggaca 420 gtcaaagcca cgctcgggtc ggtgaacgtg gcggtcactt gcgcgggtgc actggtcgaa 480 gctggcgatg taatcgtcgc cgatgacgat ggagttgtgg ttgtgaagcg cgcgcgggcg 540 caagaggtcg cggccgcggc gcaacaacgg gttcgcaaag aagacgtaac tcgagagcga 600 cttgctcgtg gagaactcgg actcgatatt tacgacatgc gccaaaagat cgcgcaactg 660 ggcctaaagt atctgtga 678 <210> 60 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 60 Met Asn Asp Pro Val Val Val Arg Glu Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Val Val Thr Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro Ile Tyr Pro 35 40 45 Gly Ala Thr Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Ala Val Thr Cys Ala Gly Ala Leu Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Arg Ala Gln Glu Val Ala Ala Ala Ala Gln Gln Arg Val Arg 180 185 190 Lys Glu Asp Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 61 <211> 675 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 61 atgagcggcg tggttgtgcg ggaggtcgcc cgcccggcgc ccgatctcgt ggcctcgctc 60 gaagaggcgg gtgtctcaac cgtccacgaa gcacagggac gccggggact gctcgccacc 120 tacatgcgtc cgatctacgc cggagccacg ctcgcgggac cggcagtcac cgtcctcgtc 180 ccccccggcg acaacctgat gattcacgta gccgtggagg tgtgccgccc gggtgacgtg 240 ctggtcgtcg ccgtcacgtc gccgtgcacc gacggttact tcggcgagct gctggcgacg 300 tcggttcgcg cgcgcggcgt caaggggctc gtcatcgatg caggctgccg ggacgtgcgg 360 gcgctcaccg agatgcggtt tccggtgtgg agccgggcgg tcagcgcgca gggcaccgtc 420 aaggccacgc tgggctccgt gagcgttccg gtcgtttgcg ccggcgcgct gatcgaggcc 480 ggcgacgtcg tcgtgggcga cgacgacgga gtggttgtcg tgaaacggag cgaggccgat 540 gcggtcgtga gtgcttcgcg ccagcggctc ctcaaggaag aggggacgcg tcagcgcctg 600 gcaagcggtg aactcggtct ggacatctac tcgctgcgca aaacgctttc cgacctgggg 660 ctgaagtacc ggtaa 675 <210> 62 <211> 224 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (21)...(173) <223> Demethylmenaquinone methyltransferase <400> 62 Met Ser Gly Val Val Val Arg Glu Val Ala Arg Pro Ala Pro Asp Leu 1 5 10 15 Val Ala Ser Leu Glu Glu Ala Gly Val Ser Thr Val His Glu Ala Gln 20 25 30 Gly Arg Arg Gly Leu Leu Ala Thr Tyr Met Arg Pro Ile Tyr Ala Gly 35 40 45 Ala Thr Leu Ala Gly Pro Ala Val Thr Val Leu Val Pro Pro Gly Asp 50 55 60 Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp Val 65 70 75 80 Leu Val Val Ala Val Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly Glu 85 90 95 Leu Leu Ala Thr Ser Val Arg Ala Arg Gly Val Lys Gly Leu Val Ile 100 105 110 Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Arg Phe Pro 115 120 125 Val Trp Ser Arg Ala Val Ser Ala Gln Gly Thr Val Lys Ala Thr Leu 130 135 140 Gly Ser Val Ser Val Pro Val Val Cys Ala Gly Ala Leu Ile Glu Ala 145 150 155 160 Gly Asp Val Val Val Gly Asp Asp Asp Gly Val Val Val Val Lys Arg 165 170 175 Ser Glu Ala Asp Ala Val Val Ser Ala Ser Arg Gln Arg Leu Leu Lys 180 185 190 Glu Glu Gly Thr Arg Gln Arg Leu Ala Ser Gly Glu Leu Gly Leu Asp 195 200 205 Ile Tyr Ser Leu Arg Lys Thr Leu Ser Asp Leu Gly Leu Lys Tyr Arg 210 215 220 <210> 63 <211> 693 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 63 atgaccggca tcgtcgtcca gtggttcgag cgcacgccgc ttgccgatgt cgcggcgctt 60 gccgagttcg gcgtggctac catccacgag gcgcaaggcc gcaaggggct gctcgcgtcc 120 tacatgcggc cgatctatgc gggtgctgcc gcggcgggca atgccgtcac agtatcggtg 180 cctcccggtg acaactggat gatccatgtg gcggtcgagg tgtgccgcga gggcgacgtg 240 ctggtggtcg ccccgacctc gccctgcgac aacggctatt tcggtgagct gctggcctgc 300 tcgctcaagg cgcgcggcgt gcgcgggctc gtcatcgagg ccggctgccg cgacgtgaag 360 ccactctccg acatgaagtt tcccgtgtgg tcgcgcgccg tttccgccca gggcaccgtc 420 aaggagagcc tgggcgacgt caacctgccg ctcgtgatcg ccagccagac cgtgcatcct 480 ggcgacgtgg tggtcgccga tgacgacggt gtcgtcatcg tcgctcgcgg cgaggtgcgc 540 gccgtcaccg ccaagtcgcg cgagcgcgag gacaaggagg ccgcaagccg cgagaagctg 600 agcaaggggg aggtgggcct cgacatctac ggcatgcggg ccaagctgaa ggagaagggc 660 attcgctacg tcgcgaatcc cgacaaactc tga 693 <210> 64 <211> 230 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (21)...(173) <223> Demethylmenaquinone methyltransferase <400> 64 Met Thr Gly Ile Val Val Gln Trp Phe Glu Arg Thr Pro Leu Ala Asp 1 5 10 15 Val Ala Ala Leu Ala Glu Phe Gly Val Ala Thr Ile His Glu Ala Gln 20 25 30 Gly Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala Gly 35 40 45 Ala Ala Ala Ala Gly Asn Ala Val Thr Val Ser Val Pro Pro Gly Asp 50 55 60 Asn Trp Met Ile His Val Ala Val Glu Val Cys Arg Glu Gly Asp Val 65 70 75 80 Leu Val Val Ala Pro Thr Ser Pro Cys Asp Asn Gly Tyr Phe Gly Glu 85 90 95 Leu Leu Ala Cys Ser Leu Lys Ala Arg Gly Val Arg Gly Leu Val Ile 100 105 110 Glu Ala Gly Cys Arg Asp Val Lys Pro Leu Ser Asp Met Lys Phe Pro 115 120 125 Val Trp Ser Arg Ala Val Ser Ala Gln Gly Thr Val Lys Glu Ser Leu 130 135 140 Gly Asp Val Asn Leu Pro Leu Val Ile Ala Ser Gln Thr Val His Pro 145 150 155 160 Gly Asp Val Val Val Ala Asp Asp Asp Gly Val Val Ile Val Ala Arg 165 170 175 Gly Glu Val Arg Ala Val Thr Ala Lys Ser Arg Glu Arg Glu Asp Lys 180 185 190 Glu Ala Ala Ser Arg Glu Lys Leu Ser Lys Gly Glu Val Gly Leu Asp 195 200 205 Ile Tyr Gly Met Arg Ala Lys Leu Lys Glu Lys Gly Ile Arg Tyr Val 210 215 220 Ala Asn Pro Asp Lys Leu 225 230 <210> 65 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 65 atgagcatcg tcgtcacgaa gatcgagcgc gccggcgcgg cggccgtcgc cgcgctgcgc 60 acaagtggcg ttgccacagt gcacgaggcg caagggcgca cgggcttgat gcgtccctac 120 atgcggccga tctacccggg cgcgcgcatc gccggcacgg cgatcaccgt ctccctgcct 180 ccgggcgaca actggatgat ccacgtcgcg gtcgagcagt gccgcgaggg cgatatcctc 240 gtggtggcgc cgaccagccc gagcgacgac ggctatttcg gcgacctgct tggcaattcg 300 ctcgtcgcac gcggcgtcag gggcctggtg atcgaggccg gtgtgcgtga cgtgcgcgac 360 ctcacggaga tgcgctttcc ggtctggtcg aagacgattt cggcgcaagg cacggtcaag 420 gagacgttgg gctcggtcaa cgtgccgatc gtctgcgcgg gtgctgccgt gaaccccgga 480 gacgtgatcg tggccgacga cgacggcgtc tgcgtcgtgc cgcgccagac ggtcacagag 540 gtcgtcgagg cggcccacgc ccgcgaggcc aaggaggccg aggtccggca gcggctcatc 600 gcgggcgagc ttggcctcga cgtctacggc atgcgcgaga agctggcggc caagggcctc 660 aaatatgtct ga 672 <210> 66 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> SIGNAL <222> (1)...(27) <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 66 Met Ser Ile Val Val Thr Lys Ile Glu Arg Ala Gly Ala Ala Ala Val 1 5 10 15 Ala Ala Leu Arg Thr Ser Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Pro Gly Ala 35 40 45 Arg Ile Ala Gly Thr Ala Ile Thr Val Ser Leu Pro Pro Gly Asp Asn 50 55 60 Trp Met Ile His Val Ala Val Glu Gln Cys Arg Glu Gly Asp Ile Leu 65 70 75 80 Val Val Ala Pro Thr Ser Pro Ser Asp Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Gly Asn Ser Leu Val Ala Arg Gly Val Arg Gly Leu Val Ile Glu 100 105 110 Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Met Arg Phe Pro Val 115 120 125 Trp Ser Lys Thr Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Ala Val Asn Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Pro Arg Gln 165 170 175 Thr Val Thr Glu Val Val Glu Ala Ala His Ala Arg Glu Ala Lys Glu 180 185 190 Ala Glu Val Arg Gln Arg Leu Ile Ala Gly Glu Leu Gly Leu Asp Val 195 200 205 Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Val 210 215 220 <210> 67 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 67 atgagcgttg tcgtcacgaa gatcgagcgc gccggcgccg aagctgttgt agcgctggcc 60 gaaagtggtg tgtcgaccgt gcacgaggcg cagggccgga ccgggctgat gcggccttat 120 atgcggccga tctacgcggg cgcgcggatc gccgggacgg cgatcaccgt gtcgctgcag 180 ccgggcgaca actggatgat ccatgtggcg gtcgagcaat gccggcaggg cgacatcctc 240 gtcgtggcgc cgaccagccc gagcgacgac gggtatttcg gcgacctgct cggcaattcg 300 cttgtcgcgc ggggcgtcag ggggctggtg atcgaggccg gcgtgcgcga cgtgcgcgat 360 ctgaccgcga tgggttttcc ggtatggtcg aagacagtct cggcgcaagg caccgtgaag 420 gagacgctcg gctcggtgaa cgtgcccgtc gtctgcgcgg gggcgaccgc aaaccccggt 480 gacgtgatcg tggccgatga cgacggcgtc tgcgtggtgc cgcgcgagac ggccgcggca 540 gtggtcgagg cggcccatgc gcgggaggtg aaggaggcag aggtacggcg gcggctgatc 600 tccggcgagc tcggcctaga catctacggc atgcgcgaca agctcgctgc caagggcctc 660 aaatatgtct ga 672 <210> 68 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 68 Met Ser Val Val Val Thr Lys Ile Glu Arg Ala Gly Ala Glu Ala Val 1 5 10 15 Val Ala Leu Ala Glu Ser Gly Val Ser Thr Val His Glu Ala Gln Gly 20 25 30 Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Ala Gly Ala 35 40 45 Arg Ile Ala Gly Thr Ala Ile Thr Val Ser Leu Gln Pro Gly Asp Asn 50 55 60 Trp Met Ile His Val Ala Val Glu Gln Cys Arg Gln Gly Asp Ile Leu 65 70 75 80 Val Val Ala Pro Thr Ser Pro Ser Asp Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Gly Asn Ser Leu Val Ala Arg Gly Val Arg Gly Leu Val Ile Glu 100 105 110 Ala Gly Val Arg Asp Val Arg Asp Leu Thr Ala Met Gly Phe Pro Val 115 120 125 Trp Ser Lys Thr Val Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Thr Ala Asn Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Pro Arg Glu 165 170 175 Thr Ala Ala Ala Val Val Glu Ala Ala His Ala Arg Glu Val Lys Glu 180 185 190 Ala Glu Val Arg Arg Arg Leu Ile Ser Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Gly Met Arg Asp Lys Leu Ala Ala Lys Gly Leu Lys Tyr Val 210 215 220 <210> 69 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 69 atgggcaccg tggttcaaaa cattgcgcgc gctgaccact ccgtcatcga ccgccttgct 60 gcctgcggtg tcgccaccgt tcacgaggcc cagggccgca ccggattgct cgccagttac 120 atgcggccga tctatgcggg cgcgcggctg gccgctagcg ccgtcaccat ctccgcccca 180 ccgggcgaca actggatgat ccacgtcgcc atcgagcaac tcaaggcagg cgacatcatg 240 gtgctggccc cgaccagccc ctgcgaggac ggttatttcg gcgacctgct cgccacttcc 300 gcccaagcgc gagggtgcaa gggcctaatc atcgacgccg gcgtgcgcga cgttgcagac 360 ctgaccgcga tgggatttcc cgtgtggtcc aaggccatct tcgcgcaggg tacggtcaag 420 gcgagtttgg gttcagtcaa tgtgtcggtg gtctgtgcta gtgccttgat caatccgggc 480 gacattgtcg tggccgacga tgatggtgtg tgtgtcgtac ggcgcgagga cgcggtctcc 540 gtggcggcga aggccgaagc gcgggtggca gccgaagagg acaagcgccg gcgcctcgca 600 gggggcgaac tgggacttga tatttatggg atgcgcgaca cgctcgcggc caaggggcta 660 aaatatgtct ga 672 <210> 70 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (149)...(152) <223> N-glycosylation site. Prosite id = PS00001 <400> 70 Met Gly Thr Val Val Gln Asn Ile Ala Arg Ala Asp His Ser Val Ile 1 5 10 15 Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Thr Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala Gly Ala 35 40 45 Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn 50 55 60 Trp Met Ile His Val Ala Ile Glu Gln Leu Lys Ala Gly Asp Ile Met 65 70 75 80 Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Gln Ala Arg Gly Cys Lys Gly Leu Ile Ile Asp 100 105 110 Ala Gly Val Arg Asp Val Ala Asp Leu Thr Ala Met Gly Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Ala Ser Leu Gly 130 135 140 Ser Val Asn Val Ser Val Val Cys Ala Ser Ala Leu Ile Asn Pro Gly 145 150 155 160 Asp Ile Val Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu 165 170 175 Asp Ala Val Ser Val Ala Ala Lys Ala Glu Ala Arg Val Ala Ala Glu 180 185 190 Glu Asp Lys Arg Arg Arg Leu Ala Gly Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Gly Met Arg Asp Thr Leu Ala Ala Lys Gly Leu Lys Tyr Val 210 215 220 <210> 71 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 71 atgagcgtcg tcgtccagac catcgcgcgc gccgatcaga cggtcatcga ccgcctcggc 60 gcctgcggcg tcgccaccgt acatgaggcg cagggccgca aggggctact cgcgagctac 120 atgcggccca tctattccgg cgcgcggctg gctgcgagcg cggtgacaat ttcggcgccg 180 cccggcgaca actggatgat ccacgtcgcc atcgagcagc tcaaggccgg cgacatcatg 240 gtgctcgctc ccaccagccc ctgcgaagac ggctatttcg gcgacctgct cgcgacgtcg 300 gctgtggcgc gcggctgccg cgggctcgtc atcgaggccg gcgtgcgcga tgtggccgat 360 ctcaccgcga tgaaattccc ggtatggtcg aaagccatct ccgctcaggg caccgtcaag 420 gagacgctgg gctcggtgaa cgtgccgatc gtatgcgccg gcacgctggt cgagccgggc 480 gacgtcatcg tcgccgacga tgacggcgtc tgcgtcgtgc gccgcgaaga ggcggaggcc 540 gtggcgcaga aggccgaggc ccgcatcgcc accgaagagg acaagcgcaa acgcctggcg 600 ggcggcgagc tcggtctcga catctacaag atgcgcgagc ggctggccga aaaaggactc 660 aaatatgtct ag 672 <210> 72 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 72 Met Ser Val Val Val Gln Thr Ile Ala Arg Ala Asp Gln Thr Val Ile 1 5 10 15 Asp Arg Leu Gly Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly Ala 35 40 45 Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn 50 55 60 Trp Met Ile His Val Ala Ile Glu Gln Leu Lys Ala Gly Asp Ile Met 65 70 75 80 Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Val Ala Arg Gly Cys Arg Gly Leu Val Ile Glu 100 105 110 Ala Gly Val Arg Asp Val Ala Asp Leu Thr Ala Met Lys Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Ile Val Cys Ala Gly Thr Leu Val Glu Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu 165 170 175 Glu Ala Glu Ala Val Ala Gln Lys Ala Glu Ala Arg Ile Ala Thr Glu 180 185 190 Glu Asp Lys Arg Lys Arg Leu Ala Gly Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val 210 215 220 <210> 73 <211> 690 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 73 atgagcgtgg tcatcaccaa tatccagcgc cccgatcccg agcacaccaa agcgctcgcc 60 gccttcggcg ttgcgactat tcacgaggcg cagggccgca ccggactgat gcagtccttc 120 atgcgaccga tctatgccgg cgcgcgcgcc gccggcaccg ccgtcaccgt gtcgctgccc 180 cccgccgaca actggatgat ccacgtcgcg gtggagcaat gccaggcagg cgacattctc 240 gtcgtcgcgc cgacctcgcc ctccgatgtc ggatatttcg gcgagctcct cgccacctcg 300 ctcgccgcac ggggcgtggt cggcctcatc atcgaaggcg gctgccgcga cgtcgcggca 360 ttgaccgaga tgggtttccc ggtctggtcg cgcgccgtat cggcgcaggg caccgtgaag 420 gagacgctcg gctccgtgaa cataccgatc gtctgcgccg gcgcgcatat tcatcccggc 480 gacttcgtcg ccgccgacga tgacggcgtg gtcgtcgtgc cccgcgccca cgtggcggaa 540 atcgccgccg cctccctcgc gcgcgaggac aaggaggccg ccgttcgcga gcgcctgaaa 600 tccggtgagc tcggcctcga tatttacggc atgcgcccgc gcctcaagga gaaaggcctc 660 gtctggcgcg aaacgccgga gaagaaatag 690 <210> 74 <211> 229 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 74 Met Ser Val Val Ile Thr Asn Ile Gln Arg Pro Asp Pro Glu His Thr 1 5 10 15 Lys Ala Leu Ala Ala Phe Gly Val Ala Thr Ile His Glu Ala Gln Gly 20 25 30 Arg Thr Gly Leu Met Gln Ser Phe Met Arg Pro Ile Tyr Ala Gly Ala 35 40 45 Arg Ala Ala Gly Thr Ala Val Thr Val Ser Leu Pro Pro Ala Asp Asn 50 55 60 Trp Met Ile His Val Ala Val Glu Gln Cys Gln Ala Gly Asp Ile Leu 65 70 75 80 Val Val Ala Pro Thr Ser Pro Ser Asp Val Gly Tyr Phe Gly Glu Leu 85 90 95 Leu Ala Thr Ser Leu Ala Ala Arg Gly Val Val Gly Leu Ile Ile Glu 100 105 110 Gly Gly Cys Arg Asp Val Ala Ala Leu Thr Glu Met Gly Phe Pro Val 115 120 125 Trp Ser Arg Ala Val Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Ile Pro Ile Val Cys Ala Gly Ala His Ile His Pro Gly 145 150 155 160 Asp Phe Val Ala Ala Asp Asp Asp Gly Val Val Val Val Pro Arg Ala 165 170 175 His Val Ala Glu Ile Ala Ala Ala Ser Leu Ala Arg Glu Asp Lys Glu 180 185 190 Ala Ala Val Arg Glu Arg Leu Lys Ser Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Gly Met Arg Pro Arg Leu Lys Glu Lys Gly Leu Val Trp Arg Glu 210 215 220 Thr Pro Glu Lys Lys 225 <210> 75 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 75 atgggagtcg tcgttcagaa tatcgcgcgg gccgagcagg agatcatcga ccggctggcc 60 gcctgcggcg ttgccaccgt tcacgaagcg caagggcgca aagggctgct ggcaagctat 120 atgcggccga tctatcaggg tgcgcggctc gccgcgagcg ccgtcacaat ctcggcgccg 180 ccgggcgaca actggatggt tcatgtcgcc atcgaacaga taagggccgg cgacatcctg 240 ctgcttgcgc ccacaagccc gtgcgaggac ggctattttg gcgatctcct cgcaacgtcc 300 gcgcaggcaa gggggtgccg cgggctggtc atcgacgctg gtgtgcgcga catcgccgat 360 ctgaaggcga tgaattttcc ggtctggtcg aaggccgtgt tcgcgcaggg aacgatcaag 420 gagacactcg gatcggtcaa tgtgcccgtg gtctgtgccg gagcgctggt caatccggga 480 gacgtgattg tggcggacga cgacggcgtc tgcgtcgtgc gccgggagga ggccgaaaac 540 gtagtccaga aagccgaggc gcgggtcagc gcggaagtgg ccaagcgcgc caggctcgca 600 gccggcgaac tcggcctcga catctacagg atgcgcgaaa ggctggcgga gaaggggctg 660 aaatatgtct ga 672 <210> 76 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 76 Met Gly Val Val Val Gln Asn Ile Ala Arg Ala Glu Gln Glu Ile Ile 1 5 10 15 Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Gln Gly Ala 35 40 45 Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn 50 55 60 Trp Met Val His Val Ala Ile Glu Gln Ile Arg Ala Gly Asp Ile Leu 65 70 75 80 Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Gln Ala Arg Gly Cys Arg Gly Leu Val Ile Asp 100 105 110 Ala Gly Val Arg Asp Ile Ala Asp Leu Lys Ala Met Asn Phe Pro Val 115 120 125 Trp Ser Lys Ala Val Phe Ala Gln Gly Thr Ile Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu 165 170 175 Glu Ala Glu Asn Val Val Gln Lys Ala Glu Ala Arg Val Ser Ala Glu 180 185 190 Val Ala Lys Arg Ala Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Arg Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val 210 215 220 <210> 77 <211> 681 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 77 gtgaccgatc cggttgtcgc tcgacagatc gacaggccgc ccgcgaatct ggtcgccgat 60 ctgcagcgct acggcgtctc caccgtccac gaggcgcaag ggcgtcgcgg cctgctcgcg 120 tcgtacatgc ggccgatcta tgccggcgcg ctcattgccg gtcccgcgat cacggtcctg 180 gtaccgcctg gcgacaactt gatgatccac gtcgccgtgg aagtgtgcca gcctggcgac 240 gttctcgtcg tcgccacgac gtcgccgtgc accgacggct atttcggcga gctgctggcg 300 acgtcgctgc gggcccgcgg cgtggcgggg ctcgtgatcg atgcgggctg ccgggatgtt 360 cgcgcgctga cggaaatgcg atttcccgtc tggagccgcg cgatcagcgc gcagggaacc 420 gtcaaagcca cgctgggctc ggtgaacgcg gcggtggtgt gcgccgggac gtcggtgaga 480 gccggggatc tcatcgtggc cgacgatgac ggggtggtgg cggtgcggcg ggaggaagtc 540 gtcgccgtga cgcaggcggc cgaacagcgc gttcgcaagg aagagggcac gcgcgcacgg 600 ctcgcgcagg gcgagctcgg cctggacatt tacggcttgc gccagaagct gtcggatcta 660 ggcttgaagt catcgtcgtg a 681 <210> 78 <211> 226 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 78 Met Thr Asp Pro Val Val Ala Arg Gln Ile Asp Arg Pro Pro Ala Asn 1 5 10 15 Leu Val Ala Asp Leu Gln Arg Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala 35 40 45 Gly Ala Leu Ile Ala Gly Pro Ala Ile Thr Val Leu Val Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Pro Gly Asp 65 70 75 80 Val Leu Val Val Ala Thr Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Ala Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Arg Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Ala Ala Val Val Cys Ala Gly Thr Ser Val Arg 145 150 155 160 Ala Gly Asp Leu Ile Val Ala Asp Asp Asp Gly Val Val Ala Val Arg 165 170 175 Arg Glu Glu Val Val Ala Val Thr Gln Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Gln Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Gln Lys Leu Ser Asp Leu Gly Leu Lys Ser 210 215 220 Ser Ser 225 <210> 79 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 79 atgagcgagc cggtcgtcgt tcggcagatc gagaggccct cttcggccgc gatcgccgat 60 ctccggcggt acggcgtctc gacggttcac gaagcgcagg gccgccgcgg actgctcgcg 120 tccggcctgc ggccgatcta tgcgaccgcg ctcatggcgg gccctgcgat cacggtgctg 180 gtcgcaccgg gcgacaacct gatgatccac gtcgccgtcg aggtctgcca gcccggggat 240 gtgctcgtgg tcacgccgac gtcaccgtgc acggacggct atttcggcga gctgctggcc 300 acgtcgctgc gggcgcgagg cgttgcgggc ctcgtcatcg acgccggctg ccgcgacatt 360 cgcgcgctga cggagatgcg gtttcccgta tggagtcgcg cgatcagcgc gcagggcacg 420 gtcaaagcca cgctcggctc cgtgaatgtc cccgtcgtct gcgccggcgc gcttgtcgaa 480 gcgggcgacg tcatcgtcgc cgacgatgac ggggtcgtgg tggtgaagcg gggcgaagtc 540 gacgtcgtca tccaggcggc ggagcagcgc gtgcgcaagg aagaagtcac gcgggcccgg 600 ctggcgcagg gcgagctcgg tctggacatc tacggcctgc gcaagaagat tgcggacctg 660 ggcttgaagt cgtcgtga 678 <210> 80 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 80 Met Ser Glu Pro Val Val Val Arg Gln Ile Glu Arg Pro Ser Ser Ala 1 5 10 15 Ala Ile Ala Asp Leu Arg Arg Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Arg Gly Leu Leu Ala Ser Gly Leu Arg Pro Ile Tyr Ala 35 40 45 Thr Ala Leu Met Ala Gly Pro Ala Ile Thr Val Leu Val Ala Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Pro Gly Asp 65 70 75 80 Val Leu Val Val Thr Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Ala Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Ile Arg Ala Leu Thr Glu Met Arg Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Gly Glu Val Asp Val Val Ile Gln Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Glu Val Thr Arg Ala Arg Leu Ala Gln Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Lys Lys Ile Ala Asp Leu Gly Leu Lys Ser 210 215 220 Ser 225 <210> 81 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 81 atgaacgagc cgaccgttgt tcgagcgatc gacaggccgc cggcggatgt ggtcgcggcg 60 ctccagcgct acggcgtgtc gaccgtgcat gaagcacaag ggagacgcgg cctcgtagcg 120 tcctgcatgc ggccgatcta caccggcgct ttggtcgccg gtcctgccgt aaccgtctcg 180 ctcccgccgg gcgacaacct catgattcac gtcgctgtcg aagcctgcca ggcgggcgac 240 gtgcttgtcg tggtgccgac ctccccgtgc acggacgggt atttcggtga gttactggcg 300 acgtcgctgc acgcacgcgg agtcgtggct ctcgtcatcg atgccggctg ccgcgacgtg 360 cgcgctctgt cggagatgcg atttcctgtc tggagccgcg cgatcagcgc tcagggcacg 420 gtcaaagcca cgttgggatc ggtgaacgtt cccgtggtgt gcgcgggagc gcccgtggag 480 cccggcgatg tgatcgtcgc cgacgacgat ggggtggtgg ttgtgaagcg cagcgaggtg 540 gagggggtgg cgcaggcgtc ggagcagcga gtcctgaagg aggaggcgac gcgcgagcgg 600 ttggcgcgcg gcgagctggg cctcgacatc tacgggctgc ggaaaaaggt gtcggacctc 660 ggcctgaaat attcgtga 678 <210> 82 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 82 Met Asn Glu Pro Thr Val Val Arg Ala Ile Asp Arg Pro Pro Ala Asp 1 5 10 15 Val Val Ala Ala Leu Gln Arg Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Arg Gly Leu Val Ala Ser Cys Met Arg Pro Ile Tyr Thr 35 40 45 Gly Ala Leu Val Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Ala Cys Gln Ala Gly Asp 65 70 75 80 Val Leu Val Val Val Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu His Ala Arg Gly Val Val Ala Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Ser Glu Met Arg Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Pro Val Glu 145 150 155 160 Pro Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ser Glu Val Glu Gly Val Ala Gln Ala Ser Glu Gln Arg Val Leu 180 185 190 Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Lys Lys Val Ser Asp Leu Gly Leu Lys Tyr 210 215 220 Ser 225 <210> 83 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 83 atgagcgagc cggtcgtcgt tcggcagatc gagaggccct cttcggccgc gatcgccgat 60 ctccggcggt acggcgtctc gacggttcac gaagcgcagg gccgccgcgg actgctcgcg 120 tccggcctgc ggccgatcta tgcgagcgcg ctcatggtgg gccctgcgat cacggtgctg 180 gtcgcaccgg gcgacaacct gatgatccac gtcgccgtcg aggtctgcca gcccggggat 240 gtgctcgtgg tcacgccgac gtcaccgtgc acggacggct atttcggcga gctgctggcc 300 acgtcgctgc gggcgcgagg cgttgcgggc ctcgtcatcg acgccggctg ccgcgacatt 360 cgcgcgctga cggagatgcg gtttcccgta tggagtcgcg cgatcagcgc gcagggcacg 420 gtcaaagcca cgctcggctc cgtgaatgtc cccgtcgtct gcgccggcgc gctcgtcgaa 480 gcgggcgacg tcatcgtcgc cgacgatgac ggggtcgtgg tggtgaagcg gggcgaagtc 540 gacgtcgtca tccaggcggc ggagcagcgc gtgcgcaagg aagaagtcac gcgggcgcgg 600 ctggcgcagg gcgagctcgg tctggacatc tacggcctgc gcaagaagat tgcggacctg 660 ggcttgaagt cgttgtga 678 <210> 84 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 84 Met Ser Glu Pro Val Val Val Arg Gln Ile Glu Arg Pro Ser Ser Ala 1 5 10 15 Ala Ile Ala Asp Leu Arg Arg Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Arg Gly Leu Leu Ala Ser Gly Leu Arg Pro Ile Tyr Ala 35 40 45 Ser Ala Leu Met Val Gly Pro Ala Ile Thr Val Leu Val Ala Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Pro Gly Asp 65 70 75 80 Val Leu Val Val Thr Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Ala Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Ile Arg Ala Leu Thr Glu Met Arg Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Gly Glu Val Asp Val Val Ile Gln Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Glu Val Thr Arg Ala Arg Leu Ala Gln Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Lys Lys Ile Ala Asp Leu Gly Leu Lys Ser 210 215 220 Leu 225 <210> 85 <211> 699 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 85 atgaccggca ttgtcgtcga gaccatcgag cgcgcgtcgc tcgccgacat cgccgcgttg 60 gccgaattcg gcgtcgccac catccacgag gcgcagggcc gcatcggcct gcttgcctcc 120 accatgcgcc cgatctacgc aggcgcggcg gccgccggca atgccgtcac cgtgtcggtg 180 ccgcccggcg acaactggat gatccacgtc gccgtcgagc agtgccgcga aggcgatatt 240 ctcgtcgtcg cccccaccag cccgaacgac aacggctact ttggcgaact gctggcctgc 300 tcgctcaagt cgcgcggcgt gcgcggcctc atcatcgagg ccggctgccg cgacgtgaaa 360 ccgctcaccg agatgaagtt ccccgtctgg tcccgcgccg tctcctccca gggcacggtg 420 aaggaaagcc tcggcgacgt gaacctgccg ctctcgatcg ccggccagct cgtcaacccc 480 ggcgatgtca tcgtcgccga tgacgacggc gtggtcgtgg tctcccgcaa tgaagtcagg 540 agcgtcaccg ccaagtcccg cgagcgcgaa gacaaggagg ccaagaaccg cgtgcagctc 600 caagccggcc agctcggcat cgacatctac ggcatgcgcg acaagctcaa ggccaagggc 660 ctccgctacg tcaaatccgc ggcggagttg aagaagtag 699 <210> 86 <211> 232 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (21)...(173) <223> Demethylmenaquinone methyltransferase <400> 86 Met Thr Gly Ile Val Val Glu Thr Ile Glu Arg Ala Ser Leu Ala Asp 1 5 10 15 Ile Ala Ala Leu Ala Glu Phe Gly Val Ala Thr Ile His Glu Ala Gln 20 25 30 Gly Arg Ile Gly Leu Leu Ala Ser Thr Met Arg Pro Ile Tyr Ala Gly 35 40 45 Ala Ala Ala Ala Gly Asn Ala Val Thr Val Ser Val Pro Pro Gly Asp 50 55 60 Asn Trp Met Ile His Val Ala Val Glu Gln Cys Arg Glu Gly Asp Ile 65 70 75 80 Leu Val Val Ala Pro Thr Ser Pro Asn Asp Asn Gly Tyr Phe Gly Glu 85 90 95 Leu Leu Ala Cys Ser Leu Lys Ser Arg Gly Val Arg Gly Leu Ile Ile 100 105 110 Glu Ala Gly Cys Arg Asp Val Lys Pro Leu Thr Glu Met Lys Phe Pro 115 120 125 Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Glu Ser Leu 130 135 140 Gly Asp Val Asn Leu Pro Leu Ser Ile Ala Gly Gln Leu Val Asn Pro 145 150 155 160 Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Ser Arg 165 170 175 Asn Glu Val Arg Ser Val Thr Ala Lys Ser Arg Glu Arg Glu Asp Lys 180 185 190 Glu Ala Lys Asn Arg Val Gln Leu Gln Ala Gly Gln Leu Gly Ile Asp 195 200 205 Ile Tyr Gly Met Arg Asp Lys Leu Lys Ala Lys Gly Leu Arg Tyr Val 210 215 220 Lys Ser Ala Ala Glu Leu Lys Lys 225 230 <210> 87 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 87 atgggcattg tcgttcagaa cattcagcgg gcggagcagt ccgtcatcga tcgtctcgct 60 gcttgcggag ttgcgaccgt acatgaagcg cagggccgca aggggctgct cgccagctac 120 atgcggccga tttatccggg cgcgcggatc gcggcgagtg ccgtgacaat ttccgcgcct 180 ccgggcgata actggatgct gcatgtggcg atcgagcaga tcaaggcggg cgatatccta 240 ctgcttgcgc cgaccagtcc ctgcgaggac ggttatttcg gcgatctctt ggcgacgtct 300 gccatggcac gcggctgccg cgggttggtg atcgatgccg gcgtgcgcga tgtcgccgat 360 ctcaaggcga tgaattttcc cgtttggtcg aagacgatct ctgcacaggg gacggtcaag 420 gagacggtgg gctcggtcaa tattcccgtc gtctgcgcca gtgcgctcgt caatcctggc 480 gatgtgatcg ttgccgatga tgatggcgtc tgcgtcgtac ggcgggagga agctgccgag 540 gtcgcggata aggccgagca gcgggtcgcg gcagaagagg acaagcgccg gcgactggcc 600 gcgggtgaac tcgggctcga tatctacaag atgcgcgagc ggctggcgga gaaggggctg 660 aaatatgtct ag 672 <210> 88 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 88 Met Gly Ile Val Val Gln Asn Ile Gln Arg Ala Glu Gln Ser Val Ile 1 5 10 15 Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro Gly Ala 35 40 45 Arg Ile Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn 50 55 60 Trp Met Leu His Val Ala Ile Glu Gln Ile Lys Ala Gly Asp Ile Leu 65 70 75 80 Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Met Ala Arg Gly Cys Arg Gly Leu Val Ile Asp 100 105 110 Ala Gly Val Arg Asp Val Ala Asp Leu Lys Ala Met Asn Phe Pro Val 115 120 125 Trp Ser Lys Thr Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Val Gly 130 135 140 Ser Val Asn Ile Pro Val Val Cys Ala Ser Ala Leu Val Asn Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu 165 170 175 Glu Ala Ala Glu Val Ala Asp Lys Ala Glu Gln Arg Val Ala Ala Glu 180 185 190 Glu Asp Lys Arg Arg Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val 210 215 220 <210> 89 <211> 696 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 89 atgaagcgcg gcgtggtggt gacccatatc gcgcgggcgg atgcggcgaa cgtggccgtg 60 ctgcgggagg caggcgttgc gaccgtccac gaggcgcaga gccggcttgg tcttctagcg 120 tgctacatgc ggccgatcta tccgggcgcg gccattgccg gaccggccgt cacggtgctc 180 gtgccgccgt cggacaactg gatgctgcat gtggcggtcg aacagtgccg cgcaggcgac 240 gtgctggtgg tggcgcccac gtctgcctgc gaggacgggt atttcgggga actgcttgcc 300 acgtcgctcg cgaagcgcgg cgtacagggc ctgatcatcg atgcgggctg ccgggatgtg 360 tgcgcgctca aggcaatgga ttttcccgtg tggtcgaagg ccgtctccgc gcagggcacg 420 gtcaaggaga cgctcggctc ggtcaatgtg ccggtcgtat gcgcgcagca gatcgtgcat 480 ccgggagacg tgatcgtggc cgatgacgac ggcatcgtcg tggcgccgct cgccaccgtc 540 gaggcggtag cgaaggccgc gcaggcgcgc ctggagaagg aagagaagac gcgtgcggtg 600 ctcgcaagcg gcacgctcgg cctcgactac tacgcgatgc gtgacaggct cgcggaaaga 660 ggcttgcgct acgtcgattc ggcctctgaa ctttga 696 <210> 90 <211> 231 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 90 Met Lys Arg Gly Val Val Val Thr His Ile Ala Arg Ala Asp Ala Ala 1 5 10 15 Asn Val Ala Val Leu Arg Glu Ala Gly Val Ala Thr Val His Glu Ala 20 25 30 Gln Ser Arg Leu Gly Leu Leu Ala Cys Tyr Met Arg Pro Ile Tyr Pro 35 40 45 Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Leu Val Pro Pro Ser 50 55 60 Asp Asn Trp Met Leu His Val Ala Val Glu Gln Cys Arg Ala Gly Asp 65 70 75 80 Val Leu Val Val Ala Pro Thr Ser Ala Cys Glu Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Ala Lys Arg Gly Val Gln Gly Leu Ile 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Cys Ala Leu Lys Ala Met Asp Phe 115 120 125 Pro Val Trp Ser Lys Ala Val Ser Ala Gln Gly Thr Val Lys Glu Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Val Val Cys Ala Gln Gln Ile Val His 145 150 155 160 Pro Gly Asp Val Ile Val Ala Asp Asp Asp Gly Ile Val Val Ala Pro 165 170 175 Leu Ala Thr Val Glu Ala Val Ala Lys Ala Ala Gln Ala Arg Leu Glu 180 185 190 Lys Glu Glu Lys Thr Arg Ala Val Leu Ala Ser Gly Thr Leu Gly Leu 195 200 205 Asp Tyr Tyr Ala Met Arg Asp Arg Leu Ala Glu Arg Gly Leu Arg Tyr 210 215 220 Val Asp Ser Ala Ser Glu Leu 225 230 <210> 91 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 91 atgaacaaac cggtggtggt ccggaaggtc gaacagccgc cacaagatgc ggtggcggct 60 ctggagaaat atggcgtgtc cacggtgcac gaagcgcaag gccgttgcgg gctgctcgcc 120 ccttacatgc gcccgatcta tgccggcgct tccatggccg ggcccgccgt caccgtctcc 180 cttccgcccg gtgacaacct catgatccat gtcgcggtcg aagtgtgcca gcccggaaac 240 attctggtcg tcgcccccac ttcaccttgt accgacgggt atttcggcga gttgctggct 300 acttccttgc gcgcccacgg cgtgaaggca ctcataatcg atgccggatg ccgtgacgtg 360 cgctccctca ccgaaatgaa gtttcccgtg tggagccgcg ccgtcagttc gcagggaaca 420 gtgaagtcca cgctcggatc agtgaacgtg ggcgtagtgt gtgcgggcgc tttcatcgaa 480 gcgggcgaca tcgtcgtcgc tgatgatgac ggagttgtcg tcgtgaagcg gactttcgcg 540 cgcgacgtgg ttgaagcctg tgaacagagg gttcgcaagg aagaggcgac gcgggcacgg 600 ctggcgcggg gcgaacttgg gctggacatc tacggattgc gctccaaggt ggcggaactc 660 ggtctcaagt acatataa 678 <210> 92 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 92 Met Asn Lys Pro Val Val Val Arg Lys Val Glu Gln Pro Pro Gln Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Tyr Ala 35 40 45 Gly Ala Ser Met Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Ala Leu Ile 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ser Thr 130 135 140 Leu Gly Ser Val Asn Val Gly Val Val Cys Ala Gly Ala Phe Ile Glu 145 150 155 160 Ala Gly Asp Ile Val Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Thr Phe Ala Arg Asp Val Val Glu Ala Cys Glu Gln Arg Val Arg 180 185 190 Lys Glu Glu Ala Thr Arg Ala Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Ser Lys Val Ala Glu Leu Gly Leu Lys Tyr 210 215 220 Ile 225 <210> 93 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 93 atgaataaac cggtggtagt ccggcaagtg gagcagccac cagcggacgc ggttgcggcg 60 ctggagaagt atggcgtcac caccgtgcat gaggctcagg gacgttgtgg cctgctcgcg 120 cactacatgc gtccgatttt tccgggagcg gccatctcgg gttctgctgt caccgtagcc 180 ttgccgccgg gcgataacct catgatccac gtcgcggtcg aggtctgcgg cccgggaaac 240 atcctggtgg ttgcgccgac ctcgccttcg acggatggct acttcggtga gctgttggcg 300 acctctctgc gtgctcgcgg tgtgaaagga cttgtgattg atgccggatg ccgtgacgtt 360 cgctccctga ccgagatgaa attccccgtc tggagccgtg ccatcagctc gcagggaaca 420 gtcaaggcca ccctcggatc ggtgaatgtg ccggtcatgt gcgcgggcgc gctcgtcgaa 480 gctggggatg tcatcgtcgc cgatgatgat ggaattgtgg ttgtcaagcg cgcgcatgcg 540 cacgaggtgg ccgcggcggc agaacaaagg gtgcgcaaag agaatataac ccgcgaacgg 600 cttcgacgcg gagagctcgg actcgatatt tacgacatgc gccaaaaaat cgcgcaactg 660 ggcctcaaat acctgtga 678 <210> 94 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 94 Met Asn Lys Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro Ile Phe Pro 35 40 45 Gly Ala Ala Ile Ser Gly Ser Ala Val Thr Val Ala Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Ser Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Lys Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Val Met Cys Ala Gly Ala Leu Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Ile Val Val Val Lys 165 170 175 Arg Ala His Ala His Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Ile Thr Arg Glu Arg Leu Arg Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 95 <211> 639 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 95 gtgagcgatc cgatcgccga cctgcgcggg tatggagtct cgacggttca cgaggcccag 60 ggccggcgcg gtctgctggc gccttacatg cgtccgatct atgccggcgc ccttgtcgcc 120 ggaccagccg tgacggttct ggtcccgccc ggcgacaacc tgatgatcca cgtcgccgtc 180 gagcggtgct cgccgggcga catcctcgtc gtcgcgccga cgtcgccgtg cacggacggc 240 tatttcggcg agctgctggc gacgtcgctg cgggcacgcg gtgtcgccgc actgatcatc 300 gacgccggct gcagggacgt gcgagcgctc accgagatgc gcttcccggt gtggagccgc 360 gccatcagcg cccaaggaac ggtgaaggcg acgctcggct cggtgaatgt gccagtggtc 420 tgcgccggag ccatcgtcgg tcctggcgac gtcatggttg cggacgatga cggcgtggtc 480 gtggtgagga aggacgaagt cgccgcggtg acgcaggcgg cggcgcagcg ggtccgcaaa 540 gaagagggca cgcgggcgcg gctggccgcg ggcgagctcg gcctggacat ctacggcctc 600 cggcagaagc tgtcggatct cggcctgaag tcgtcgtga 639 <210> 96 <211> 212 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (9)...(161) <223> Demethylmenaquinone methyltransferase <400> 96 Met Ser Asp Pro Ile Ala Asp Leu Arg Gly Tyr Gly Val Ser Thr Val 1 5 10 15 His Glu Ala Gln Gly Arg Arg Gly Leu Leu Ala Pro Tyr Met Arg Pro 20 25 30 Ile Tyr Ala Gly Ala Leu Val Ala Gly Pro Ala Val Thr Val Leu Val 35 40 45 Pro Pro Gly Asp Asn Leu Met Ile His Val Ala Val Glu Arg Cys Ser 50 55 60 Pro Gly Asp Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly 65 70 75 80 Tyr Phe Gly Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Ala 85 90 95 Ala Leu Ile Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu 100 105 110 Met Arg Phe Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val 115 120 125 Lys Ala Thr Leu Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala 130 135 140 Ile Val Gly Pro Gly Asp Val Met Val Ala Asp Asp Asp Gly Val Val 145 150 155 160 Val Val Arg Lys Asp Glu Val Ala Ala Val Thr Gln Ala Ala Ala Gln 165 170 175 Arg Val Arg Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Ala Gly Glu 180 185 190 Leu Gly Leu Asp Ile Tyr Gly Leu Arg Gln Lys Leu Ser Asp Leu Gly 195 200 205 Leu Lys Ser Ser 210 <210> 97 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 97 atgagcggcc ccacggtcgt tcgcgagatc gaccggccgg aaggcgacct cgtgaccgca 60 cttgagcacg cgggcgtgtc gacggtccac gaagcacagg gacggcgggg actgctcgcc 120 acctacatgc ggccgattta cgccggagcc gtgatcgccg gaccggcggt caccgtcctc 180 gtgccgcccg gcgacaacct gatgattcac gtggcggtcg aagtgtgccg cccgggtgac 240 gtgctggtcg tcgccgtcac gtcgccgtgt accgacggct acttcggtga gctgctggcg 300 acgtcggttc gcgcgcgcgg cgtcaaaggg ctcgtcatcg atgcagggtg ccgggacgtg 360 cgggcgctca ccgagatgcg gtttccggtg tggagccggg cggtcagtgc gcagggcacc 420 gtcaaggcca cgctcggctc cgtgaacgtt ccagtcgtgt gtgccggcgc gctcatcaca 480 ggtggagacg tcgtcatcgc cgacgacgat ggggtggtcg tggtgaagcg cgaggaagtg 540 gacgcggtcg ttcaggactc gcgccagcgg ctgctcaagg aagacgggac gcgagagcgt 600 ctcgcgacag gcgagctggg gctggacatc tactcgctgc gcaagatgct gtccgatctg 660 ggactgaagt accgatag 678 <210> 98 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 98 Met Ser Gly Pro Thr Val Val Arg Glu Ile Asp Arg Pro Glu Gly Asp 1 5 10 15 Leu Val Thr Ala Leu Glu His Ala Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Arg Gly Leu Leu Ala Thr Tyr Met Arg Pro Ile Tyr Ala 35 40 45 Gly Ala Val Ile Ala Gly Pro Ala Val Thr Val Leu Val Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp 65 70 75 80 Val Leu Val Val Ala Val Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Val Arg Ala Arg Gly Val Lys Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Arg Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ala Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Ile Thr 145 150 155 160 Gly Gly Asp Val Val Ile Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Glu Glu Val Asp Ala Val Val Gln Asp Ser Arg Gln Arg Leu Leu 180 185 190 Lys Glu Asp Gly Thr Arg Glu Arg Leu Ala Thr Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Ser Leu Arg Lys Met Leu Ser Asp Leu Gly Leu Lys Tyr 210 215 220 Arg 225 <210> 99 <211> 639 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 99 gtgagcgatc cgatcgccga cctgcgaggg tatggtgtct ccacggttca cgaggcgcag 60 ggccggcgcg gcctgctggc gccttacatg cgtccgatct atgccggcgc gctcgtcgcc 120 ggaccagccg tgacggtcct ggtcccgccc ggcgacaacc tgatgatcca cgtcgctgtc 180 gagcggtgct cgccaggcga catcctcgtc gtcgcgccga cgtcgccgtg cacggacggc 240 tatttcggcg agctgctggc gacgtcgctg cgggcacgcg gtgtcgccgc actgatcatc 300 gacgctggct gcagggacgt gcgagcgctc accgagatgc gcttcccggt gtggagccgc 360 gccatcagcg cccaaggaac ggtgaaagcg acgctcggct cggtgaatgt gccactggtc 420 tgcgccggag ccatcgtcgg tcctggcgac gtcatggttg cggacgatga cggcgtggtc 480 gtggtgagga aggacgaagt cgccgcggtg acgcaggcgg cggcgcagcg ggtccgcaaa 540 gaagaaggca cgcgggcgcg gctggccgcg ggcgagctcg gcctggacat ctacggcctc 600 cggcagaagc tgtcggatct cggcctgaag tcgtcgtga 639 <210> 100 <211> 212 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (9)...(161) <223> Demethylmenaquinone methyltransferase <400> 100 Met Ser Asp Pro Ile Ala Asp Leu Arg Gly Tyr Gly Val Ser Thr Val 1 5 10 15 His Glu Ala Gln Gly Arg Arg Gly Leu Leu Ala Pro Tyr Met Arg Pro 20 25 30 Ile Tyr Ala Gly Ala Leu Val Ala Gly Pro Ala Val Thr Val Leu Val 35 40 45 Pro Pro Gly Asp Asn Leu Met Ile His Val Ala Val Glu Arg Cys Ser 50 55 60 Pro Gly Asp Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly 65 70 75 80 Tyr Phe Gly Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Ala 85 90 95 Ala Leu Ile Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu 100 105 110 Met Arg Phe Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val 115 120 125 Lys Ala Thr Leu Gly Ser Val Asn Val Pro Leu Val Cys Ala Gly Ala 130 135 140 Ile Val Gly Pro Gly Asp Val Met Val Ala Asp Asp Asp Gly Val Val 145 150 155 160 Val Val Arg Lys Asp Glu Val Ala Ala Val Thr Gln Ala Ala Ala Gln 165 170 175 Arg Val Arg Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Ala Gly Glu 180 185 190 Leu Gly Leu Asp Ile Tyr Gly Leu Arg Gln Lys Leu Ser Asp Leu Gly 195 200 205 Leu Lys Ser Ser 210 <210> 101 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 101 atgaacacac cggtggtagc aagacaagtg gagcagccac cagcggatgc aattgccgca 60 ttggagaagt gtggagtgac aaccgtccat gaggctcagg gacgttgtgg cctccttgcg 120 tcctacattc gcccgattta cccgggagca gccatcgcag gatccgctat cactgtgtct 180 ttgcctcctg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240 atcctggtag tttcaccgac gtcgccttgt acggacggct acttcggtga gttgttggca 300 acatctctcc gtgcccacgg agtgattggg cttgtgatcg atgccggatg ccgtgatgtg 360 cgctctctga cagaaatgaa attcccggtc tggagccgcg ccatctgttc gcgagggaca 420 gtcaaggcca cacttggatc ggtgaatgtg cccatcgtat gcgcgggtgc aatggtcgag 480 gctggtgatg gcatcgtcgc cgacgatgat ggcgttgtcg ttgtgaagcg agcgctggcg 540 caggagatcg ctgcggcggc ggaacaaagg gttcgcaaag agaatgtaac ccgcgaacga 600 ctcgcacgtg gagagctcgg acttgatatt tacgacatgc gccaaaagat cgcgcaactg 660 ggcctcaaat atctctga 678 <210> 102 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (28)...(174) <223> Demethylmenaquinone methyltransferase <400> 102 Met Asn Thr Pro Val Val Ala Arg Gln Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Ile Ala Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Ile Arg Pro Ile Tyr Pro 35 40 45 Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Ile Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Cys Ser Arg Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Met Val Glu 145 150 155 160 Ala Gly Asp Gly Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Leu Ala Gln Glu Ile Ala Ala Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 103 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 103 atgaatcgac cggtggtagt ccggcaagtg gagcaggcac cagcggatgc ggtcgccgca 60 ctggagaagt gcggagtgac caccgtgcat gaggctcagg gacggggtgg cctgcttgcc 120 tcctacatgc gcccgattta cccgggagca gccatcgccg gttccgcgat caccgtgtct 180 ttgccccctg gcgataacct catgatccac gtcgcagtgg aggtctgcgg tccgggaaac 240 attctggtgg tttcaccgat ctcgccttgt acggatggtt acttcggcga gctgttggca 300 acatccctcc gtgcccgcgg tgggagaggg cttgtgatcg atgccggatg ccgggacgtg 360 cgctctttaa cagaaatgaa atttccagtc tggagccgcg ccgtcagttc gcaggggaca 420 gtcaaggcca cactgggatc ggtgaatgtg cccgtcgtgt gtgcgggcgc actggtcgag 480 gcgggtgatg tcatcgtcgc cgatgacgat ggagttgtgg tggtgaagcg cgcgctggcc 540 caggaggtcg ccgccgcagc ggaacaaagg gttcgcaaag agaacctgac ccgcgaacga 600 cttgcgcgtg gagaactcgg actcgatatt tacgacatgc gccaaaagat cgcgcaaatg 660 ggccttaaat atctctaa 678 <210> 104 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 104 Met Asn Arg Pro Val Val Val Arg Gln Val Glu Gln Ala Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Gly Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro 35 40 45 Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ser Pro Ile Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Gly Arg Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Leu Ala Gln Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Leu Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Met Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 105 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 105 atgaatacac cggtggtagt ccggcaagtg gagcagccac ctgcggaggc ggttgccgca 60 ctggaaaagc gtggggtgac aaccgtgcat gaggctcagg gacgttgtgg cctccttgcc 120 tcctacatgc gcccgattta cacgggagca gcgatcgcag gatccgctat cacagtgtcc 180 ttgccgcccg gcgacaacct catgatccac gttgccgtgg aggtatgtgg ttcaggaaac 240 atcctggtag tttcaccaac ctcgccttgt gcggatggct acttcggtga gctgttggca 300 acatctctcc gtgcccatgg tgtcagaggg ctggtgatcg atgcgggatg ccgtgatgtg 360 cgctccctaa cagagatgaa atttccggtc tggagccgcg ccgtcagctc acaggggaca 420 gtcaaggcca cacttggatc ggtgaacgtg cccatcgttt gcgcgggtgc actggtcgac 480 gctggtgatg tcatcgtcgc agatgacgat ggcgttgtgg tggtgaagcg cgcgatggcg 540 caagaggtcg ccgcggcggc ggaacaaagg gttcgcaaag agaatctgac ccgcgaacga 600 cttgcgcgtg gtgaacttgg tctcgatatt tacgacatgc gccaaaagat cgcgcaactg 660 ggacttaagt atctgtaa 678 <210> 106 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 106 Met Asn Thr Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Glu 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Arg Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Thr 35 40 45 Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Ser Gly Asn 65 70 75 80 Ile Leu Val Val Ser Pro Thr Ser Pro Cys Ala Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Leu Val Asp 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Met Ala Gln Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Leu Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 107 <211> 636 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 107 gtgagcgatc cgatcgccgc cctgcgcgga tatggcgttt cgacggtgca cgaggcgcag 60 gggcggcgcg gcctgctggc gccttacatg cgcccgatct atgccggtgc gctcctcgcc 120 gggcccgcgg tgacggtcct ggttcctcct ggcgacaacc tgatgatcca cgtggcggtc 180 gagaaatgct cgcctggaga cgtcctcgtc gtcgccccgg cgtctccgtg cacggacggc 240 tacttcggag aattgcttgc gacgtcgttg cgggcccgcg gcgttgccgg cttgatcatc 300 gatgccggct gccgggatgt gcgcgcgctc acggagatgc ggtttccggt gtggagccgc 360 ttcgtctgcg ctcagggcac ggtgaaggcc acgctcggct cgctgaatgt gccgctggtc 420 tgcgccggcg ccctcatcgc tcccgctgat gtcatcgttg cagacgatga cggggtggtg 480 gtggtgaaga gggacgagat cgccatggtg acgcaggcgg cggagcagcg ggttcgcaaa 540 gaggaaggca cgcgcgcgcg gctcgccgcg ggcgagctcg gcctggacat ctacggcttg 600 cggcagaagc tgtcggacct cggcctcaag tcgtga 636 <210> 108 <211> 211 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (9)...(161) <223> Demethylmenaquinone methyltransferase <400> 108 Met Ser Asp Pro Ile Ala Ala Leu Arg Gly Tyr Gly Val Ser Thr Val 1 5 10 15 His Glu Ala Gln Gly Arg Arg Gly Leu Leu Ala Pro Tyr Met Arg Pro 20 25 30 Ile Tyr Ala Gly Ala Leu Leu Ala Gly Pro Ala Val Thr Val Leu Val 35 40 45 Pro Pro Gly Asp Asn Leu Met Ile His Val Ala Val Glu Lys Cys Ser 50 55 60 Pro Gly Asp Val Leu Val Val Ala Pro Ala Ser Pro Cys Thr Asp Gly 65 70 75 80 Tyr Phe Gly Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Ala 85 90 95 Gly Leu Ile Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu 100 105 110 Met Arg Phe Pro Val Trp Ser Arg Phe Val Cys Ala Gln Gly Thr Val 115 120 125 Lys Ala Thr Leu Gly Ser Leu Asn Val Pro Leu Val Cys Ala Gly Ala 130 135 140 Leu Ile Ala Pro Ala Asp Val Ile Val Ala Asp Asp Asp Gly Val Val 145 150 155 160 Val Val Lys Arg Asp Glu Ile Ala Met Val Thr Gln Ala Ala Glu Gln 165 170 175 Arg Val Arg Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Ala Gly Glu 180 185 190 Leu Gly Leu Asp Ile Tyr Gly Leu Arg Gln Lys Leu Ser Asp Leu Gly 195 200 205 Leu Lys Ser 210 <210> 109 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 109 atgaatacac cggtggtagt aagacaagtg gagcagccac cagcggatgc aattgccgca 60 ttaaagaagt gtggagtgac aaccgtccat gaggctcagg gacgtggtgg cctccttgcg 120 tcctacatgc gcccgattta cccgggagca gccatcgcag gatccgctat cactgtgtct 180 ttgcctcctg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240 atcctggtag tttcaccgac gtcgccttgt acggacggct acttcggtga gttgttggca 300 acatctctcc gtgcccacgg agtgattggg cttgtgatcg atgccggatg ccgtgatgtg 360 cgctccctga cagaaatgaa gttcccggtc tggagccgcg ccatctgttc gcaagggaca 420 gtcaaggcca cacttggatc ggtgaatgtg cccatcgtat gcgcgggtgc attggtcgag 480 gctggtgatg tcatcgtcgc cgacgatgat ggcgttgtcg ttgtgaagcg agcgctggcg 540 caagagatcg ccgcggcggc ggaacaaagg gttcgcaaag agaatgtaac ccgcgaacga 600 ctcgcacgtg gagagctcgg acttgatatt tacgacatgc gccaaaagat cgcgcaactg 660 ggcctgaaat atctctga 678 <210> 110 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 110 Met Asn Thr Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Ile Ala Ala Leu Lys Lys Cys Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Gly Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro 35 40 45 Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Ile Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Cys Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Leu Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Leu Ala Gln Glu Ile Ala Ala Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 111 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 111 atgaaagagg cggtggtggt caggaatatt gagcgcccgc cggccgatgt gatcgcggcg 60 ctggaaaagt ttggtgtttc aacggtacac gaagcgcaag gccgccgcgg acttctggcc 120 gcttatatga ggccgattta tgggggcgcg gccattgccg ggcctgcggt gactgtctcg 180 ttggctccgg gtgacaatct aatgattcac gtggccgtgg aagtttgccg gtcaggtgac 240 attctcgtgg tcgctccgac gtcgccgtgc acggatgggt attttggcga gttgctggcg 300 acttccttgc gcgcgcacgg ggtaaaagga ctcgtgatcg aggcaggatg ccgcgatgtc 360 cgggcgctta cggagatgaa atttcccgtg tggagccgcg cggtgagttc gcagggaacg 420 gtgaaggcta gtttgggctc ggtgaacgtg ggaattgtgt gcgctgccgc ggcgatcgaa 480 gccggcgacg cgatcgttgc cgatgatgac ggcgttgtgg tggtgaaacg cggcgacgcc 540 gccagtgttg tcgccgcgtc gcagcaacgc gtccgcaagg aagaggctgc gcgaggacgc 600 ctggcgcgcg gcgaactggg cctggacatt tacggcctgc gcgccaaggt cgcggagctt 660 ggcttgaaat atttgtga 678 <210> 112 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 112 Met Lys Glu Ala Val Val Val Arg Asn Ile Glu Arg Pro Pro Ala Asp 1 5 10 15 Val Ile Ala Ala Leu Glu Lys Phe Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Arg Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Gly 35 40 45 Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Leu Ala Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Ser Gly Asp 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val 100 105 110 Ile Glu Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Ser 130 135 140 Leu Gly Ser Val Asn Val Gly Ile Val Cys Ala Ala Ala Ala Ile Glu 145 150 155 160 Ala Gly Asp Ala Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Gly Asp Ala Ala Ser Val Val Ala Ala Ser Gln Gln Arg Val Arg 180 185 190 Lys Glu Glu Ala Ala Arg Gly Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Ala Lys Val Ala Glu Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 113 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 113 atgaaagggg cggtggtggt caggaatatc gagcgcccgc cggccgaggt ggtcgcggcg 60 ctggaaaagt ttggtgtttc gacggtgcac gaagcgcaag gacgccgcgg acttctggcc 120 gcttatatga ggccgattta tgggggcgcg gccattgccg ggcctgcggt gactgtctcg 180 ttggctccgg gcgacaattt aatgattcac gtggcggtgg aagtttgccg gtcaggcgac 240 attctcgtgg tcgctccgac gtcgccgtgc acggatgggt attttggcga gttgctggcg 300 acttccttgc gcgcgcacgg ggtaaaagga ctggtgatcg aggcaggatg ccgcgatgtc 360 cgggcgctta cggagatgaa atttcccgtg tggagccgcg cggtgagttc gcagggaacg 420 gtgaaggcta ctttgggctc ggtgaacgtg gaaattgtgt gcgctgccgc ggcgatcgaa 480 gccggtgacg tgatcgttgc cgatgatgac ggcgttgtgg tggtgaaacg gggcgacgcc 540 gccgctgtgg tcgccgcgtc gcagcaacgc gtccgcaaag aagaagctac gcgagaacgc 600 ctggcgcgcg gcgaactggg cctggacatt tacggcctgc gcgccaaggt cgcggagctt 660 ggcttgaaat atttgtga 678 <210> 114 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 114 Met Lys Gly Ala Val Val Val Arg Asn Ile Glu Arg Pro Pro Ala Glu 1 5 10 15 Val Val Ala Ala Leu Glu Lys Phe Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Arg Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Gly 35 40 45 Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Leu Ala Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Ser Gly Asp 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val 100 105 110 Ile Glu Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Glu Ile Val Cys Ala Ala Ala Ala Ile Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Gly Asp Ala Ala Ala Val Val Ala Ala Ser Gln Gln Arg Val Arg 180 185 190 Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Ala Lys Val Ala Glu Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 115 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 115 atgtcggttg tcgttcagaa catcgagcgt gctgatcagt cggtcatcga ccggctggcc 60 gcctgcggcg ttgccacggt gcatgaagcg cagggccgca agggcctgct cgccagctat 120 atgcggccga tctttccggg tgcacgcctc gcggcgagtg ccgtcactat ctccgcacct 180 ccgggcgaca actggatgct gcatgtggcg atcgaacagt tgaaggccgg cgacattctg 240 ctgctcgccc cgaccagccc ctgcgaggac ggctatttcg gtgatctcct cgccacgtct 300 gcgcaggcgc gcggttgcga gggattgatc atcgatgcgg gtgttcggga tgtggctgat 360 ctgacggaga tgaaatttcc tgtctggtcg aaggcgatct tcgcccaggg cacagtcaag 420 gagaccctcg gttctgtgaa cgtaccggtc gtatgcgctg gcgcctatgt tcgcccgggt 480 gatgtgatcg ttgccgatga tgatggcgtt tgtgttgtgc tgcgcgagga agctgaagtg 540 gtcgcaaaga aggcggaagc ccgtgttgcg gccgaagatg gtaaacgcaa gcggctcgcg 600 gccggcgaac tcggcctcga tatctacgac atgcgcggcc ggctggctga aaagggcctg 660 aagtatatct ga 672 <210> 116 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 116 Met Ser Val Val Val Gln Asn Ile Glu Arg Ala Asp Gln Ser Val Ile 1 5 10 15 Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Phe Pro Gly Ala 35 40 45 Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn 50 55 60 Trp Met Leu His Val Ala Ile Glu Gln Leu Lys Ala Gly Asp Ile Leu 65 70 75 80 Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Gln Ala Arg Gly Cys Glu Gly Leu Ile Ile Asp 100 105 110 Ala Gly Val Arg Asp Val Ala Asp Leu Thr Glu Met Lys Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Tyr Val Arg Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Leu Arg Glu 165 170 175 Glu Ala Glu Val Val Ala Lys Lys Ala Glu Ala Arg Val Ala Ala Glu 180 185 190 Asp Gly Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Asp Met Arg Gly Arg Leu Ala Glu Lys Gly Leu Lys Tyr Ile 210 215 220 <210> 117 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 117 atgggtgtcg tcgtccagaa cattgaccgc gccgagcaag ccgtcatcga ccggctcgcc 60 gcctgcggcg tcgcgaccgt gcatgaggcg caggggcgca aggggctgct ggcgagctat 120 atgcggccga tctatcccgg cgcgcggatc gcggcgagtg cggtgacgat ctcggcgccg 180 cctggtgaca actggatggt gcatgtggcg atcgagcagg tgaaggatgg cgacatcctg 240 ctgctggcac cgaccagccc ctgcgaggac ggctatttcg gcgatctttt ggcgacctcg 300 gccttggcgc ggggctgccg cgggctggtc atcgatgccg gcgtgcgcga cgtcgctgac 360 cttgcggcga tgaagtttcc ggtctggtcg aaagcgatct tcgcccaggg cacggtcaag 420 gaaacgctgg gttcggtgaa tgtgccggtc gtctgcgccg gcgcgctggt caaccccggc 480 gacgtgatcg tcgccgacga tgacggcgtt tgtgtcgttc gccgcgaaga ggcggcggag 540 gttgcagaca aggctgaggc ccacgtcgcg gcagaggagg gcaagcgcaa gcggctggcg 600 gccggcgagc ttggtctcga catctacgac atgcgcaagc ggctcgccga gaaagggctg 660 aaatatgtct ga 672 <210> 118 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 118 Met Gly Val Val Val Gln Asn Ile Asp Arg Ala Glu Gln Ala Val Ile 1 5 10 15 Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro Gly Ala 35 40 45 Arg Ile Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn 50 55 60 Trp Met Val His Val Ala Ile Glu Gln Val Lys Asp Gly Asp Ile Leu 65 70 75 80 Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Leu Ala Arg Gly Cys Arg Gly Leu Val Ile Asp 100 105 110 Ala Gly Val Arg Asp Val Ala Asp Leu Ala Ala Met Lys Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu 165 170 175 Glu Ala Ala Glu Val Ala Asp Lys Ala Glu Ala His Val Ala Ala Glu 180 185 190 Glu Gly Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Asp Met Arg Lys Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val 210 215 220 <210> 119 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 119 atgggtattg ttgttcagaa catcaagcgg gcggaccccg ggatcatagc aggtcttggc 60 aaatgcggcg ttgccactgt gcatgaagcg caggggtgca aggggctcct ggcggcctat 120 atgcggccca tttattctgg cgcgcgcctt gccgcctccg ctgtcaccat ttccgcgccg 180 ccgggagaca actggatggt gcatgtcgcc attgagcagg tgaggcaagg tgatattctg 240 gttcttgccc caacatcgcc ctgtgaagac ggctatttcg gtgatttgct cgccacctcc 300 atgctgcagc gcggcggcag ggggctgatt attgacgccg gtgtccgcga tatccgtgat 360 ctgactcaaa tgaaatttcc ggtgtggtcg aaaaccgttt ttgcgcaggg caccgttaag 420 gaaacccttg gctctgtgaa cgtcccgata gtttgcgccg gtgaagtggt caatcctggc 480 gacatcatga ttgccgatga tgatggtgtg tgcgtggtcc ggcgcgacga cgctgaaagc 540 gtgcttgaaa aagcattggc gcgtgaggca aaggaagaag atacacgcaa acgccttgcg 600 gcaggcgagc tgggtcttga tatttacggc atgcgcgcac gtctggccga aaagggccta 660 aaatatgtct ga 672 <210> 120 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 120 Met Gly Ile Val Val Gln Asn Ile Lys Arg Ala Asp Pro Gly Ile Ile 1 5 10 15 Ala Gly Leu Gly Lys Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Cys Lys Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Ser Gly Ala 35 40 45 Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn 50 55 60 Trp Met Val His Val Ala Ile Glu Gln Val Arg Gln Gly Asp Ile Leu 65 70 75 80 Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Met Leu Gln Arg Gly Gly Arg Gly Leu Ile Ile Asp 100 105 110 Ala Gly Val Arg Asp Ile Arg Asp Leu Thr Gln Met Lys Phe Pro Val 115 120 125 Trp Ser Lys Thr Val Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Ile Val Cys Ala Gly Glu Val Val Asn Pro Gly 145 150 155 160 Asp Ile Met Ile Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Asp 165 170 175 Asp Ala Glu Ser Val Leu Glu Lys Ala Leu Ala Arg Glu Ala Lys Glu 180 185 190 Glu Asp Thr Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Gly Met Arg Ala Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val 210 215 220 <210> 121 <211> 696 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 121 atgaagcgcg gtgtcgtcgt cacccatatc gagcgcgcca acccgcgtga cgtggccgtg 60 cttcagcagg cgggcgctgc gaccgttcat gaagcgcaga gccgtctggg cctgctcgcg 120 tcgtacatgc ggcccatcta tgcgggcgcg tcaatcgcgg gatcggcggt gacggtgctc 180 gtgccgccgt cggacaactg gatgttgcac gttgccgccg aacagtgccg cgaaggcgac 240 gtgctcgtgg tcgcgccgac ttcgccgtgc gaagacggct acttcggcga actgctcgcg 300 acgtcgcttg ccgcgcgcgg tgtgcgcggg ctcatcatcg atgcgggctg tcgcgatgtg 360 cgcgcgctca aggacatgaa cttcccggtc tggtcgaaag cggtctctgc gcaaggcacg 420 gtgaaggaga cgctgggctc ggtcaatgtg cctgttgtgt gcgcacagca gatcgtgcat 480 gcgggcgacg tgatcgtcgc cgacgatgac ggcgtcgtgg tcgtgccgtt cgccacggtg 540 tcgcgcgtgg ccgaagcagc gcaggcgcgt ctcgcgaagg aagagaagac gcgttccgtg 600 ctcgcgacgg gcgtgctggg cctcgactac tacagcatgc gtgacaagct cgcggaaaag 660 ggcctgcgtt acgtcgggtc gatcgaggaa gcgtga 696 <210> 122 <211> 231 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 122 Met Lys Arg Gly Val Val Val Thr His Ile Glu Arg Ala Asn Pro Arg 1 5 10 15 Asp Val Ala Val Leu Gln Gln Ala Gly Ala Ala Thr Val His Glu Ala 20 25 30 Gln Ser Arg Leu Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala 35 40 45 Gly Ala Ser Ile Ala Gly Ser Ala Val Thr Val Leu Val Pro Pro Ser 50 55 60 Asp Asn Trp Met Leu His Val Ala Ala Glu Gln Cys Arg Glu Gly Asp 65 70 75 80 Val Leu Val Val Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Ala Ala Arg Gly Val Arg Gly Leu Ile 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Lys Asp Met Asn Phe 115 120 125 Pro Val Trp Ser Lys Ala Val Ser Ala Gln Gly Thr Val Lys Glu Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Val Val Cys Ala Gln Gln Ile Val His 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Pro 165 170 175 Phe Ala Thr Val Ser Arg Val Ala Glu Ala Ala Gln Ala Arg Leu Ala 180 185 190 Lys Glu Glu Lys Thr Arg Ser Val Leu Ala Thr Gly Val Leu Gly Leu 195 200 205 Asp Tyr Tyr Ser Met Arg Asp Lys Leu Ala Glu Lys Gly Leu Arg Tyr 210 215 220 Val Gly Ser Ile Glu Glu Ala 225 230 <210> 123 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 123 atgaacaaac ccgtggtagt gcggcaactg gagcagccac ccgccgatgc ggttgcggcc 60 ctggagaagt atggcgtgac taccgtccac gaggctcagg gacgttgtgg cctgctggct 120 ccttatatgc gaccgatttt tgcgggagcc tgcatcgccg gttccgccgt caccgtgtct 180 ttgccgcccg gcgataactt catgatccac gttgccgtcg aggtctgcag tccgggcagc 240 attctcgtag tcgcccccac ctcaccttgc acggacggtt atttcggcga actcttggca 300 acttccctcc gcgctcacgg tgtcaaagga ctggtcattg atgccggctg ccgggatgtt 360 cgctcgttaa cggaaatgaa attccccgtt tggagccgtg cggtgagttc gcaaggaacg 420 gtgaaggcta cgctcggatc tgtgaatgtg ccggtcattt gcgcgggcgc cgaggtggaa 480 gccggtgacg tcatcatcgc cgatgacgat ggtgtggtag tggtgaagcg tgcgactgcc 540 cacgaggtag cagcggcggc ggaacaacga gttcgcaagg agaatgccac tcgcgaacga 600 ctggcacgag gagaactcgg cctcgacatc tacgacatgc ggcaaaaaat cgcgcaactt 660 ggtctcaaat atctgtga 678 <210> 124 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 124 Met Asn Lys Pro Val Val Val Arg Gln Leu Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Phe Ala 35 40 45 Gly Ala Cys Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Phe Met Ile His Val Ala Val Glu Val Cys Ser Pro Gly Ser 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Val Ile Cys Ala Gly Ala Glu Val Glu 145 150 155 160 Ala Gly Asp Val Ile Ile Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Thr Ala His Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 125 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 125 atgaacgatc ccgtcgtcgt ccgagagatc gagaggccgt cggcgacgtc gatcgacgat 60 ctgcggcgtt tcggcgtctc gacggtgcac gaagcgcagg ggcgccgcgg gctgctcgca 120 tcgtacatgc ggccgatcta tgccggcgcg ctggtcgccg ggcctgcgat taccgtcctg 180 gtgacgccgg gcgacaacct gatgatccat gtcgcggtcg agatctgcca gccaggcgat 240 gtcctcgtcg tcgccccgac gtcgccgtgc accgacggat acttcggcga gctgctggcg 300 acgtcgttgc gagcgcatgg cgtcgcgggt ctgatcatcg atgccggctg ccgggatgtt 360 cgctcgttga gcgagatgcg atttcccgtg tggagccgcg cgatcagcgc ccaggggacc 420 gtcaaggcga cgctgggttc ggtgaacgtg ccgctggtgt gcgccggagc gctggtcgag 480 ccgggcgatg cgatcgtcgc cgacgacgac ggtgtcgtcg tcgtcaggcg ggaacaggtc 540 gacactgtgt gccaggcggc gggacagcgc gtgcgcaagg aagaggacac gcgcgcgcgg 600 ctggcgcaag gcgagcttgg cctcgacatc tacggcttgc gcaaaaagct gtcggacctc 660 gggttgaagt cgtcgtga 678 <210> 126 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 126 Met Asn Asp Pro Val Val Val Arg Glu Ile Glu Arg Pro Ser Ala Thr 1 5 10 15 Ser Ile Asp Asp Leu Arg Arg Phe Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala 35 40 45 Gly Ala Leu Val Ala Gly Pro Ala Ile Thr Val Leu Val Thr Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Ile Cys Gln Pro Gly Asp 65 70 75 80 Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Ala Gly Leu Ile 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Ser Glu Met Arg Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Leu Val Cys Ala Gly Ala Leu Val Glu 145 150 155 160 Pro Gly Asp Ala Ile Val Ala Asp Asp Asp Gly Val Val Val Val Arg 165 170 175 Arg Glu Gln Val Asp Thr Val Cys Gln Ala Ala Gly Gln Arg Val Arg 180 185 190 Lys Glu Glu Asp Thr Arg Ala Arg Leu Ala Gln Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Lys Lys Leu Ser Asp Leu Gly Leu Lys Ser 210 215 220 Ser 225 <210> 127 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 127 atgaacgatc cggtcgtcgt tcgcgagatc gacaggccgg cgggtaccgc catcgacgat 60 ctccggcgct tcggcgtgtc gaccgtccac gaagcgcagg ggcgttgcgg cttgctcgct 120 tcgtacatac ggccgattta ttcaggcgcc ctgctcgccg gcccggcgat caccgtccag 180 gttacgcctg gcgacaacct gatgatccac gtcgctgtcg aagtgtgccg gccaggagac 240 gtgctcgtcg tcgccccgac gtcgccgtgc acggatggct atttcggcga gctgctcgcg 300 acatcgctgc gtgcccacgg cgtcgtcggg ctgatcatcg acgccggttg ccgggacgtt 360 cgcgccttga gcgagatgcg atttcctgtg tggagtcgcg cgatcagcgc gcagggcacc 420 gtcaaagcca cgctgggctc ggtgaacgtg ccgctgttgt gtgccgggat gctggtcgag 480 gccggcgacg cgatcgtggc cgacgacgac ggagtggtgg tggtcaggcg gagccaggtc 540 gatgctgtcc gcgaggcggc cgaacgacgc gtgcgcaagg aagaggacac gcgggcccgg 600 ctcgcccgag gcgagcttgg cctcgacatc tacggcctgc gcaggaaact gtcagacccc 660 ggtttgaagt cgtcgtga 678 <210> 128 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 128 Met Asn Asp Pro Val Val Val Arg Glu Ile Asp Arg Pro Ala Gly Thr 1 5 10 15 Ala Ile Asp Asp Leu Arg Arg Phe Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Ile Arg Pro Ile Tyr Ser 35 40 45 Gly Ala Leu Leu Ala Gly Pro Ala Ile Thr Val Gln Val Thr Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp 65 70 75 80 Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Val Gly Leu Ile 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Ser Glu Met Arg Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Leu Leu Cys Ala Gly Met Leu Val Glu 145 150 155 160 Ala Gly Asp Ala Ile Val Ala Asp Asp Asp Gly Val Val Val Val Arg 165 170 175 Arg Ser Gln Val Asp Ala Val Arg Glu Ala Ala Glu Arg Arg Val Arg 180 185 190 Lys Glu Glu Asp Thr Arg Ala Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Arg Lys Leu Ser Asp Pro Gly Leu Lys Ser 210 215 220 Ser 225 <210> 129 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 129 atgaacaaac cggtggtggt ccggaaggtc gaacagccgc cacaagatgc ggtggcggct 60 ctggagaaat atggcgtctc cacggtgcac gaagcgcaag gccgttgcgg gctgctcgcc 120 gcttacatgc gcccgatcta tgccggagct tccatggccg gacccgccgt gaccgtttcc 180 cttccgcccg gtgacaacct catgatccac gtcgcggtcg aagtgtgcca ccccggaaac 240 attctggtcg tcgcccccac ttcaccttgt accgacgggt atttcggcga gttgctggct 300 acttccttgc gcgcccacgg cgtgaaggca ctcataatcg atgccggatg ccgtgacgtg 360 cgctccctca ccgaaatgaa gtttcccgtg tggagccgcg ccgtcagttc gcagggaaca 420 gtgaagtcca cgctcggatc agtgaacgtg ggcgtagtgt gtgcgggcgc tttcatcgaa 480 gcgggcgaca tcgtcgtcgc tgatgatgac ggagtcgtcg tcgtgaagag ggctttcgcg 540 cgcgacgtgg ttgaagcctg tgaacagagg gtccgcaagg aagaagcgac gcgggcacgc 600 ctggcgcagg gcgagcttgg tctggacatc tacggattgc gcgccaaagt ggcggagctc 660 ggtctcaagt acatataa 678 <210> 130 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 130 Met Asn Lys Pro Val Val Val Arg Lys Val Glu Gln Pro Pro Gln Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Ala 35 40 45 Gly Ala Ser Met Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys His Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Ala Leu Ile 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ser Thr 130 135 140 Leu Gly Ser Val Asn Val Gly Val Val Cys Ala Gly Ala Phe Ile Glu 145 150 155 160 Ala Gly Asp Ile Val Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Phe Ala Arg Asp Val Val Glu Ala Cys Glu Gln Arg Val Arg 180 185 190 Lys Glu Glu Ala Thr Arg Ala Arg Leu Ala Gln Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Ala Lys Val Ala Glu Leu Gly Leu Lys Tyr 210 215 220 Ile 225 <210> 131 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 131 atgagcatcg tcgtgcagaa catcgagcga gcggacctgg aggcggttac gacgcttggc 60 gaatgcggtg tggcgaccgt gcacgaggca caaggccgca cgggcctcat gctcccctat 120 atgcggccga tctggccggg cgcacggatc gcaggcccgg ctgtgaccgt ctccctgccg 180 ccgggcgaca actggatgat ccatgtcgcg gtggagcaat gccgggaggg cgacatcctg 240 atcgtggcgc cgaccagccc cagcgaggac ggctatttcg gcgagcttct ggcgcgctcg 300 ctcgtggcgc gcagcgtcaa gggcttcgtg atcgaggctg gggtgcgcga tgtgcgcgac 360 cttaccgaga tacgtttccc ggtctggtcg cgggcagtct ccgcccaggg cacggtcaag 420 gaaacgatcg gctcggtgaa cgtgccgatc gtctgcgcag gtgctgcggt gaatccgggc 480 gacgtggtcg tggctgacga tgacggcata tgtgtcgtgg ctcgcgacaa agctggtgag 540 gtggccaagg ctgcgcgagc gcgcgaggcg aaggaagctg aaacgcgccg ccggctgatc 600 aatggcgagc tcgggctcga catctatgga atgcgggaga agcttgcggc gaagggcctg 660 aaatatgtct ga 672 <210> 132 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 132 Met Ser Ile Val Val Gln Asn Ile Glu Arg Ala Asp Leu Glu Ala Val 1 5 10 15 Thr Thr Leu Gly Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Thr Gly Leu Met Leu Pro Tyr Met Arg Pro Ile Trp Pro Gly Ala 35 40 45 Arg Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly Asp Asn 50 55 60 Trp Met Ile His Val Ala Val Glu Gln Cys Arg Glu Gly Asp Ile Leu 65 70 75 80 Ile Val Ala Pro Thr Ser Pro Ser Glu Asp Gly Tyr Phe Gly Glu Leu 85 90 95 Leu Ala Arg Ser Leu Val Ala Arg Ser Val Lys Gly Phe Val Ile Glu 100 105 110 Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Ile Arg Phe Pro Val 115 120 125 Trp Ser Arg Ala Val Ser Ala Gln Gly Thr Val Lys Glu Thr Ile Gly 130 135 140 Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Ala Val Asn Pro Gly 145 150 155 160 Asp Val Val Val Ala Asp Asp Asp Gly Ile Cys Val Val Ala Arg Asp 165 170 175 Lys Ala Gly Glu Val Ala Lys Ala Ala Arg Ala Arg Glu Ala Lys Glu 180 185 190 Ala Glu Thr Arg Arg Arg Leu Ile Asn Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Val 210 215 220 <210> 133 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 133 atgaacatcg tcgtccagaa catcgagcgc gccgatccgg cggtgatcgc cggcctcgcc 60 gagtgcggcg tcgccacagt ccacgaagcg caggggcgca tcgggctgat gtcatcgaag 120 atgcggccga tctacgccgg cgcccgcatc gcggcctcgg cggtgaccgt gtcgctgccg 180 ccggccgaca actggatgat ccatgtcgcc gtggagcaga tcaaagcggg cgacgtcatg 240 gtcgtggcgc cgacctcgcc ctcggacgcg ggctattttg gcgacctgct cgccaattcg 300 ctgcaggccc ggggctgcgc cggcctcgtg atcgatgccg gggtgcgcga cgtgcgtgac 360 cttaccgaaa tgcggttccc cgtctggtcg acggcgatct cggcgcaggg aaccgtcaag 420 gaaacgcttg gttcggtgaa cgtcccgatc gtctgcgccg gtgcacatgt cgaacccggc 480 gacgtgatcg tcgccgacga cgacggcgtc tgcatcgtca agcgcaccga cgcggctgcg 540 gtgctcgaaa aggcgcgggc ccggctcgcg aacgaaaccg acaagcgcga gaaactcgcg 600 aacggcacgc tgggcctcga tctctacaag atgcgcgagg cgctggagaa gaagggcctc 660 aggtatgcct ga 672 <210> 134 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (193)...(196) <223> N-glycosylation site. Prosite id = PS00001 <220> <221> SITE <222> (204)...(207) <223> N-glycosylation site. Prosite id = PS00001 <400> 134 Met Asn Ile Val Val Gln Asn Ile Glu Arg Ala Asp Pro Ala Val Ile 1 5 10 15 Ala Gly Leu Ala Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Ile Gly Leu Met Ser Ser Lys Met Arg Pro Ile Tyr Ala Gly Ala 35 40 45 Arg Ile Ala Ala Ser Ala Val Thr Val Ser Leu Pro Pro Ala Asp Asn 50 55 60 Trp Met Ile His Val Ala Val Glu Gln Ile Lys Ala Gly Asp Val Met 65 70 75 80 Val Val Ala Pro Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Asn Ser Leu Gln Ala Arg Gly Cys Ala Gly Leu Val Ile Asp 100 105 110 Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Met Arg Phe Pro Val 115 120 125 Trp Ser Thr Ala Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala His Val Glu Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Ile Val Lys Arg Thr 165 170 175 Asp Ala Ala Ala Val Leu Glu Lys Ala Arg Ala Arg Leu Ala Asn Glu 180 185 190 Thr Asp Lys Arg Glu Lys Leu Ala Asn Gly Thr Leu Gly Leu Asp Leu 195 200 205 Tyr Lys Met Arg Glu Ala Leu Glu Lys Lys Gly Leu Arg Tyr Ala 210 215 220 <210> 135 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 135 atgagcgtcg tcgtccagaa catcgcgcgc gccgatcaag cgatcgtcga tcggctcgcg 60 gcctgcggtg ttgccactgt gcatgaagcg cagggccgca agggactgct cgcgagccat 120 atgcggccga tctatcccgg tacccggctc gcggcgagcg ctgtgaccat ctcggcgccg 180 ccgggcgaca actggatggt ccacgtcgcg atcgagcaat tgcgagcggg cgacatcatg 240 gtgctcgccc cgaccagccc ctgcgaggat ggttatttcg gcgatctgct tgccacatcg 300 gcgaaagcac ggggctgccg cggtctcatc atcgatgccg gcgtccgcga tgtcgccgat 360 ctcacggcga tgcagtttcc tgtctggtcc aaggccatct tcgcgcaagg caccgtcaag 420 gaaacgctcg gctcggtgaa catcccggtg gtgtgcgcgg gtgcgctggt caatcccggc 480 gatgtcatcg tcgccgatga cgatggcgtc tgcgttgtgc gccgcgaaga ggcggaggcg 540 gtggcgcaga aggccgaagc ccgcgtcgcc gccgaggacg acaagcgcaa gcgcctcgcc 600 gccggcgaac tcggtctcga catctacaag atgcgcgagc ggctggccga gaaggggctc 660 aaatatgtct ga 672 <210> 136 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 136 Met Ser Val Val Val Gln Asn Ile Ala Arg Ala Asp Gln Ala Ile Val 1 5 10 15 Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Lys Gly Leu Leu Ala Ser His Met Arg Pro Ile Tyr Pro Gly Thr 35 40 45 Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn 50 55 60 Trp Met Val His Val Ala Ile Glu Gln Leu Arg Ala Gly Asp Ile Met 65 70 75 80 Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Lys Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp 100 105 110 Ala Gly Val Arg Asp Val Ala Asp Leu Thr Ala Met Gln Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Ile Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu 165 170 175 Glu Ala Glu Ala Val Ala Gln Lys Ala Glu Ala Arg Val Ala Ala Glu 180 185 190 Asp Asp Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val 210 215 220 <210> 137 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 137 atggctgtcg tggtccagaa tattgcccgt gccgaccagg cggtcattga ccggctggcc 60 gcctgtgatg tcgccacggt tcatgaggcg cagggccgca agggcctgct cgccggctac 120 atgcggccga tttatcccgg tgcccggatt gctgccagtg ccgtaacgat ctctgcgccg 180 cccggcgaca actggatggt ccatgtggcg atcgaacagc tcaaggcggg cgatatcctg 240 ttgcttgcgc cgacaagccc ctgcgaggac ggctatttcg gcgatcttct cgcgacgtcg 300 gccgttgcgc gcggctgccg cgggcttatc atcgatgccg gcgtgcgtga cgttgccgat 360 ctcacggaaa tgaagtttcc ggtctggtcc aaggcggtct tcgcccaggg cacggtcaag 420 gagacgctcg gctcggtcaa tgtgaccgtg gtctgtgccg gtgccctggt caatgccggc 480 gacgtgatcg tggccgacga cgatggcgtc tgcgtggtcc ggcgcgagga agcggctgac 540 gtggctgcca aagccgaggc gcgtgtcgct gccgaggagg gcaagcgcaa gcggctcgcg 600 gccggcgaac tcgggctcga catttacgac atgcgcgggc gattggcgga gaagggactg 660 agatatgtct ga 672 <210> 138 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (149)...(152) <223> N-glycosylation site. Prosite id = PS00001 <400> 138 Met Ala Val Val Val Gln Asn Ile Ala Arg Ala Asp Gln Ala Val Ile 1 5 10 15 Asp Arg Leu Ala Ala Cys Asp Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Lys Gly Leu Leu Ala Gly Tyr Met Arg Pro Ile Tyr Pro Gly Ala 35 40 45 Arg Ile Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn 50 55 60 Trp Met Val His Val Ala Ile Glu Gln Leu Lys Ala Gly Asp Ile Leu 65 70 75 80 Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Val Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp 100 105 110 Ala Gly Val Arg Asp Val Ala Asp Leu Thr Glu Met Lys Phe Pro Val 115 120 125 Trp Ser Lys Ala Val Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Thr Val Val Cys Ala Gly Ala Leu Val Asn Ala Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu 165 170 175 Glu Ala Ala Asp Val Ala Ala Lys Ala Glu Ala Arg Val Ala Ala Glu 180 185 190 Glu Gly Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Asp Met Arg Gly Arg Leu Ala Glu Lys Gly Leu Arg Tyr Val 210 215 220 <210> 139 <211> 693 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 139 atgaattatc agccggggac aacaggcatc gtcgtgcagg atattgcgcg cgctgatcaa 60 gccattatcg atggcctagc agaatgtggt gtggcgacgg tgcatgaggc acaagggcgc 120 aaggggctgt tggcggacta tatgacgccg attttttcag gcgcgggcat cgctggatct 180 gcggtgacca ttctggcgcc accttgtgac aattggatga ttcatgtggc ggtagaacag 240 ttgcaaaagg gcgatgtgtt gctgctgggc acgatcacac cgtccaatgc tggctatttc 300 ggtgacttgc tggccacgtc agccatggcg cacggttgtc gcggattgat cattgatggc 360 ggtgtgcgcg atgtgcaaga gctgacggat atgggctttc cggtttggtc caaggccgta 420 catgcccaag gcacaatcaa agaaacgctg ggatcggtca acgtgccagt tgtctgcggc 480 caagagttgg taaatcccgg tgatattgtg gtggccgatg atgacggggt gtgcgttgtg 540 cgccgcgaag aagctgctga tgtgctggct aaggcgcggg cgcgcgagag taatgaagcc 600 gccaagcgcg cgcgttttga ggacggtgag ctggggctgg atatctatga catgcgcgcg 660 cggctggccg aaaagggact gaaatacgtc tga 693 <210> 140 <211> 230 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (27)...(179) <223> Demethylmenaquinone methyltransferase <400> 140 Met Asn Tyr Gln Pro Gly Thr Thr Gly Ile Val Val Gln Asp Ile Ala 1 5 10 15 Arg Ala Asp Gln Ala Ile Ile Asp Gly Leu Ala Glu Cys Gly Val Ala 20 25 30 Thr Val His Glu Ala Gln Gly Arg Lys Gly Leu Leu Ala Asp Tyr Met 35 40 45 Thr Pro Ile Phe Ser Gly Ala Gly Ile Ala Gly Ser Ala Val Thr Ile 50 55 60 Leu Ala Pro Pro Cys Asp Asn Trp Met Ile His Val Ala Val Glu Gln 65 70 75 80 Leu Gln Lys Gly Asp Val Leu Leu Leu Gly Thr Ile Thr Pro Ser Asn 85 90 95 Ala Gly Tyr Phe Gly Asp Leu Leu Ala Thr Ser Ala Met Ala His Gly 100 105 110 Cys Arg Gly Leu Ile Ile Asp Gly Gly Val Arg Asp Val Gln Glu Leu 115 120 125 Thr Asp Met Gly Phe Pro Val Trp Ser Lys Ala Val His Ala Gln Gly 130 135 140 Thr Ile Lys Glu Thr Leu Gly Ser Val Asn Val Pro Val Val Cys Gly 145 150 155 160 Gln Glu Leu Val Asn Pro Gly Asp Ile Val Val Ala Asp Asp Asp Gly 165 170 175 Val Cys Val Val Arg Arg Glu Glu Ala Ala Asp Val Leu Ala Lys Ala 180 185 190 Arg Ala Arg Glu Ser Asn Glu Ala Ala Lys Arg Ala Arg Phe Glu Asp 195 200 205 Gly Glu Leu Gly Leu Asp Ile Tyr Asp Met Arg Ala Arg Leu Ala Glu 210 215 220 Lys Gly Leu Lys Tyr Val 225 230 <210> 141 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 141 atgagcgtcg tcgtccagaa catcgaacgc gccgacccgg actccgtcgc cgtgctcggc 60 gcgagcggcg tcgccaccgt gcacgaagcg caaggccgga cgggactcat gcggccctat 120 atgcggccga tctattcggg cgtgcgcatt gccggaccga ccgtcacggt ctccatcccg 180 ccgggcgaca actggatgat tcatgtcgcg gtcgagcagt gccgcgaagg cgacattctc 240 gttgtggctc cgaccagccc gagcgatgac ggctatttcg gcgacctgct tgccgggtcg 300 cttatggcac gaggcgtcaa ggctctcatc atcgaggccg gtgtgcgcga cgttcgcgat 360 ctgaccgaaa tgcgctttcc ggtctggtcg aagaccattt ccgcgcaggg aaccgtcaag 420 gaaacgcttg gctccgtgaa tgtgccgatc gtctgcgccg gtgcggcggt caatcccggc 480 gacgcggtcg tggccgatga cgacggcgta tgcgtcgtgc cgcgagagcg agcggccgag 540 gtggccaagg cgtcgcaggc ccgcgaggca aaggaagccg ggacgcgccg gcggctgatg 600 gccggtgaac tggggctcga catctacggc atgcgcgaga aactcgctgc caagggtttg 660 aaatatgtct ga 672 <210> 142 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 142 Met Ser Val Val Val Gln Asn Ile Glu Arg Ala Asp Pro Asp Ser Val 1 5 10 15 Ala Val Leu Gly Ala Ser Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Ser Gly Val 35 40 45 Arg Ile Ala Gly Pro Thr Val Thr Val Ser Ile Pro Pro Gly Asp Asn 50 55 60 Trp Met Ile His Val Ala Val Glu Gln Cys Arg Glu Gly Asp Ile Leu 65 70 75 80 Val Val Ala Pro Thr Ser Pro Ser Asp Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Gly Ser Leu Met Ala Arg Gly Val Lys Ala Leu Ile Ile Glu 100 105 110 Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Met Arg Phe Pro Val 115 120 125 Trp Ser Lys Thr Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Ala Val Asn Pro Gly 145 150 155 160 Asp Ala Val Val Ala Asp Asp Asp Gly Val Cys Val Val Pro Arg Glu 165 170 175 Arg Ala Ala Glu Val Ala Lys Ala Ser Gln Ala Arg Glu Ala Lys Glu 180 185 190 Ala Gly Thr Arg Arg Arg Leu Met Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Val 210 215 220 <210> 143 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 143 atgagcgtcg tcgtccagaa catcgaacgc gccgacccgg actccgtcac cgtgctcggc 60 gcgagcggcg tcgccaccgt gcacgaagcg caaggccgga cgggactcat gcggccctac 120 atgcggccga tctattcggg cgtgcgcatt gccggaccgg ccgtcacggt ctccatcccg 180 ccgggcgaca actggatgat tcatgtcgcg gtcgagcagt gccgcgaagg cgacattctc 240 gttgtggctc cgaccagccc gagcgatgat ggctatttcg gcgacctgct tgccgggtcg 300 cttgtggcac gaggcgtcaa ggctctcatc atcgaggccg gtgtgcgcga cgttcgcgat 360 ctgaccgaaa tgcgctttcc ggtctggtcg aagaccattt ccgcgcaggg aaccgtcaag 420 gaaacgcttg gctccgtgaa tgtgccgatc gtctgcgccg gtgcggcggt caatcccggc 480 gacgcggtcg tggccgatga cgacggcgta tgcgtcgtgc cgcgagagcg agcggctgag 540 gtggccaagg cgtcgcaggc ccgcgaggca aaggaggccg ggacgcgccg gcggctgatg 600 gccggtgaac tggggctcga catctacggc atgcgcgaga aactcgctgc caagggtttg 660 aaatatgtct ga 672 <210> 144 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (1)...(21) <223> TonB-dependent receptor proteins signature 1. Prosite id = PS00430 <400> 144 Met Ser Val Val Val Gln Asn Ile Glu Arg Ala Asp Pro Asp Ser Val 1 5 10 15 Thr Val Leu Gly Ala Ser Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Ser Gly Val 35 40 45 Arg Ile Ala Gly Pro Ala Val Thr Val Ser Ile Pro Pro Gly Asp Asn 50 55 60 Trp Met Ile His Val Ala Val Glu Gln Cys Arg Glu Gly Asp Ile Leu 65 70 75 80 Val Val Ala Pro Thr Ser Pro Ser Asp Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Gly Ser Leu Val Ala Arg Gly Val Lys Ala Leu Ile Ile Glu 100 105 110 Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Met Arg Phe Pro Val 115 120 125 Trp Ser Lys Thr Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Ala Val Asn Pro Gly 145 150 155 160 Asp Ala Val Val Ala Asp Asp Asp Gly Val Cys Val Val Pro Arg Glu 165 170 175 Arg Ala Ala Glu Val Ala Lys Ala Ser Gln Ala Arg Glu Ala Lys Glu 180 185 190 Ala Gly Thr Arg Arg Arg Leu Met Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Val 210 215 220 <210> 145 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 145 atgaccatcg tcgtcaccgg catcgagcgc gcgggagcgg acactgtcgc cgcgctgggc 60 acaagcggcg tcgcgaccgt acacgaggcg cagggccgca ccggcctgat gcgtccctac 120 atgcggccga tctatacggg agcgcgcatc gccgggacgg cgattaccgt gtcgctgccg 180 cccggcgaca actggatgat ccacgtcgcc gtcgagcagt gccggcaagg cgatatcctc 240 gtggtggcgc cgaccagccc gagcgacgac ggctatttcg gcgacctgct cgccaattct 300 ctcgtcgccc gcggcgtgag gggcatggtc atcgaggccg gcgtgcgtga cgttcgcgat 360 ctcaccgaga tgcgcttccc ggtctggtcg aagacgatct cggcgcaggg aacggtcaag 420 gagacgctcg gctcggtcaa cgtgccggtc gtctgcgctg gcttggccgt gaacccgggc 480 gacatcatcg tggccgacga cgacggcatc tgcgtggtgc cgcgccagac cgccgcgcag 540 gtcgtcgagg cggctcatgc gcgcgaggcg aaggaggcgg aggtccgtcg gcggctcatc 600 gccggcgaac tcggcctcga tatctacggc atgcgtgaga agctggcggc caagggcctg 660 aaatatgtct ga 672 <210> 146 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 146 Met Thr Ile Val Val Thr Gly Ile Glu Arg Ala Gly Ala Asp Thr Val 1 5 10 15 Ala Ala Leu Gly Thr Ser Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Thr Gly Ala 35 40 45 Arg Ile Ala Gly Thr Ala Ile Thr Val Ser Leu Pro Pro Gly Asp Asn 50 55 60 Trp Met Ile His Val Ala Val Glu Gln Cys Arg Gln Gly Asp Ile Leu 65 70 75 80 Val Val Ala Pro Thr Ser Pro Ser Asp Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Asn Ser Leu Val Ala Arg Gly Val Arg Gly Met Val Ile Glu 100 105 110 Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Met Arg Phe Pro Val 115 120 125 Trp Ser Lys Thr Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Val Val Cys Ala Gly Leu Ala Val Asn Pro Gly 145 150 155 160 Asp Ile Ile Val Ala Asp Asp Asp Gly Ile Cys Val Val Pro Arg Gln 165 170 175 Thr Ala Ala Gln Val Val Glu Ala Ala His Ala Arg Glu Ala Lys Glu 180 185 190 Ala Glu Val Arg Arg Arg Leu Ile Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Val 210 215 220 <210> 147 <211> 675 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 147 gtgagcggca tcgtcgtcca gaacatcgag cgcgccgacc ccgcgatcat cacgggcctc 60 gccgaatgcg gcgtcgccac ggtgcatgag gcgcagggcc gcaagggtct gctcgcgtcc 120 tacatgcggc cgatctatgc cggcgccgct gtcggcgcat cggcggtcac catcctcgcc 180 ccgccctgcg acaactggat ggtgcatgtg gcgatcgagc aggtgcgggc aggggacatc 240 ctcgtcctcg cgaccacctc gccctccgac gccggctatt tcggcgatct gctcgccacc 300 tcgatgaagg cccgcggcgg tgtcggcctc atcatcgatg ccggcgttcg tgacattcgc 360 gacctcacgg cggtgcagtt cccggtgtgg tccaaggccg tctgcgccca gggcaccatc 420 aaggaaacgc tgggctcggt gaacgtgccg gtggtctgtg ccggcgagct ggtcaacccg 480 ggcgatgtca tcgtcgccga tgacgacggc gtctgcgtcg tgcggcgcga ggaagctgcc 540 gatgtgctga agaaggcgca ggcccgcgtg gcgaacgaag gcgacaagcg tcagcgcctc 600 gcggccggcg aactcggcct cgacatgtac aagatgcgcg acaagctgaa ggaaatgggc 660 ctcaaatatg tctga 675 <210> 148 <211> 224 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (21)...(173) <223> Demethylmenaquinone methyltransferase <400> 148 Met Ser Gly Ile Val Val Gln Asn Ile Glu Arg Ala Asp Pro Ala Ile 1 5 10 15 Ile Thr Gly Leu Ala Glu Cys Gly Val Ala Thr Val His Glu Ala Gln 20 25 30 Gly Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala Gly 35 40 45 Ala Ala Val Gly Ala Ser Ala Val Thr Ile Leu Ala Pro Pro Cys Asp 50 55 60 Asn Trp Met Val His Val Ala Ile Glu Gln Val Arg Ala Gly Asp Ile 65 70 75 80 Leu Val Leu Ala Thr Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp 85 90 95 Leu Leu Ala Thr Ser Met Lys Ala Arg Gly Gly Val Gly Leu Ile Ile 100 105 110 Asp Ala Gly Val Arg Asp Ile Arg Asp Leu Thr Ala Val Gln Phe Pro 115 120 125 Val Trp Ser Lys Ala Val Cys Ala Gln Gly Thr Ile Lys Glu Thr Leu 130 135 140 Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Glu Leu Val Asn Pro 145 150 155 160 Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg 165 170 175 Glu Glu Ala Ala Asp Val Leu Lys Lys Ala Gln Ala Arg Val Ala Asn 180 185 190 Glu Gly Asp Lys Arg Gln Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp 195 200 205 Met Tyr Lys Met Arg Asp Lys Leu Lys Glu Met Gly Leu Lys Tyr Val 210 215 220 <210> 149 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 149 atgaataaac cggtggtagt tcgacaggtc gagcagccat cagccgatgc ggttgcggca 60 ctagaaaagt gtggcgtaac gacggtgcat aaggctcagg gacgctgcgg cttgcttgca 120 gcctacatgc gaccgatttt cccaggagct agcatcgccg gttctgcggt cactgtgtcc 180 ctgccgccgg gcgacaacct gatgattcac gtcgcggtcg aggtctgcag cacaggaaac 240 attctggtgg tcgctccgac ctcgccatgc acggatggtt acttcggtga actcctcgca 300 acgtcgttgc gcgcgcacgg tgtaagaggc cttgtgatcg atgctggatg ccgtgacgtt 360 cgctctttga cggaaatgaa attcccggtc tggagccgcg ccatcagctc tcaggggaca 420 gtgaaagcca cactcggatc agtcaatgtg ccgatcacat gcgcggggac actcgttgaa 480 tccggtgacg tcatcgtcgc cgacgatgat ggtgtcgtag tcgtgaagcg tacggccgca 540 caagaagtcg ccgcagccgc tgaacaaagg gtgcgcaaag agaatgcgac ccgtgaacga 600 ctcgcacggg gcgaactcgg tctcgatatc tacgagatgc gccagaaaat cgcgcagctc 660 ggcctcaagt atctgtga 678 <210> 150 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 150 Met Asn Lys Pro Val Val Val Arg Gln Val Glu Gln Pro Ser Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Lys Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Phe Pro 35 40 45 Gly Ala Ser Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Ser Thr Gly Asn 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Thr Cys Ala Gly Thr Leu Val Glu 145 150 155 160 Ser Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Thr Ala Ala Gln Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Glu Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 151 <211> 675 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 151 atgagcggaa ttgttgtcca gaatatcgag cgcgccgacg cggcggtcat cgcagccttg 60 gaaagctgcg gcgtctcaac tgtgcacgag gctcaaggcc gtactggact gctggcttct 120 tatatgcgtc caatctacac aggtgcacgg atagcaggaa gtgcagtgac tatctccgca 180 cctcctggcg ataactggat ggtgcatgtg gctatcgagc aattgcacgc aggcgacata 240 ttgataatcg caccaacctc gccgtgcgaa gacggctatt tcggcgactt gctagccacg 300 tctgcgcagg cccgtgggtg caagggtctg attatcaacg ccggcgttcg cgatgtgcgc 360 gatttgactg aaatgggctt tcccgtctgg tcgaaggcca tttttgccca aggcactatc 420 aaagcatcgc tgggttcggt caacataccc gtcgtgtgcg caggcgcgcc catcaatccc 480 ggcgatgtga ttgtggccga tgatgacggc gtttgtgtcg tgccgcgcca gaatgcggca 540 gaggtcgcaa aggcggcgaa ggcacgtgag gcgaacgagg ccgcaaagcg cgaccagctt 600 gcaaccggca tcttggggct tgatatgtat gacatgcgcg gaaatctcgc cgagatgggg 660 ctgaaatata tatga 675 <210> 152 <211> 224 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (21)...(173) <223> Demethylmenaquinone methyltransferase <400> 152 Met Ser Gly Ile Val Val Gln Asn Ile Glu Arg Ala Asp Ala Ala Val 1 5 10 15 Ile Ala Ala Leu Glu Ser Cys Gly Val Ser Thr Val His Glu Ala Gln 20 25 30 Gly Arg Thr Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Thr Gly 35 40 45 Ala Arg Ile Ala Gly Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp 50 55 60 Asn Trp Met Val His Val Ala Ile Glu Gln Leu His Ala Gly Asp Ile 65 70 75 80 Leu Ile Ile Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp 85 90 95 Leu Leu Ala Thr Ser Ala Gln Ala Arg Gly Cys Lys Gly Leu Ile Ile 100 105 110 Asn Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Met Gly Phe Pro 115 120 125 Val Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Ile Lys Ala Ser Leu 130 135 140 Gly Ser Val Asn Ile Pro Val Val Cys Ala Gly Ala Pro Ile Asn Pro 145 150 155 160 Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Pro Arg 165 170 175 Gln Asn Ala Ala Glu Val Ala Lys Ala Ala Lys Ala Arg Glu Ala Asn 180 185 190 Glu Ala Ala Lys Arg Asp Gln Leu Ala Thr Gly Ile Leu Gly Leu Asp 195 200 205 Met Tyr Asp Met Arg Gly Asn Leu Ala Glu Met Gly Leu Lys Tyr Ile 210 215 220 <210> 153 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 153 atgtccgtcg tcgtccagaa catcgcgcgc gccgaccagt ccgtcatcga tcggctcggc 60 gcctgcggcg tcgccactgt gcatgaagcg cagggccgca cgggactgct agccagctac 120 atgcgcccca tctatcgggg tgcgcgtctg gccgcgagcg cggtgaccat ctcggccccg 180 cccggcgaca attggatgct ccatgtcgcc atcgagcagc tgaggcccgg cgacatcatg 240 gtgcttgccc ccaccagccc ctgcgaggat ggctatttcg gcgacctgct tgcgacatcg 300 gccctggcgc gcggctgccg tggtctcgtc atcgaggcgg gcgttcgcga tgtcgccgac 360 ctcaccgcga tgaagtttcc cgtctggtcc aaagccatct tcgcccaggg caccgtcaag 420 ggaacgctgg gttcggtgaa cgtgcccgtc gtctgtgccg gcgcgctgat caatcccggt 480 gacgtcattg tggccgatga cgatggcgtc tgcgtggtgc gccgcgagga agccgaagcg 540 gtggcgcaaa aggccgaggc gcgcgtcgcc gccgaagagg ataagcgcaa gcgcctcgcc 600 gccggcgaac tcgggctcga tatctacaag atgcgcgagc ggctcgccga aaagggactc 660 aaatatgtct ag 672 <210> 154 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 154 Met Ser Val Val Val Gln Asn Ile Ala Arg Ala Asp Gln Ser Val Ile 1 5 10 15 Asp Arg Leu Gly Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Thr Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Arg Gly Ala 35 40 45 Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn 50 55 60 Trp Met Leu His Val Ala Ile Glu Gln Leu Arg Pro Gly Asp Ile Met 65 70 75 80 Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Leu Ala Arg Gly Cys Arg Gly Leu Val Ile Glu 100 105 110 Ala Gly Val Arg Asp Val Ala Asp Leu Thr Ala Met Lys Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Gly Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Ile Asn Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu 165 170 175 Glu Ala Glu Ala Val Ala Gln Lys Ala Glu Ala Arg Val Ala Ala Glu 180 185 190 Glu Asp Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val 210 215 220 <210> 155 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 155 atgaacatcg tggtgcagaa catcgagcgc gccgatccgg ccgtgatcgc cggactcgcg 60 gattgcggcg tcgccaccgt gcacgaggcg caggggcgca tcggactgat gtcgtccaag 120 atgcgaccga tctatccggg cgcgcgtgtc gcggcgtcgg cggtgacggt gtcgctgccg 180 ccggccgaca actggatgat tcatgtggcg gtggagcaga tcaaggccgg cgacatcatg 240 gtggtcgctc cgacctcgcc gtctgatgcc ggctacttcg gcgacctact ggcgacctcg 300 ctcaaggcgc ggggctgcgt gggactggtg atcgacgcgg gggtgcgcga tgtgcgcgac 360 ctgaccgaaa tgcagttccc ggtgtggtcg acggcgatct cggcgcaggg gaccgtgaaa 420 gaaacgctgg gctcggtgaa cgtccctgtc atctgcgccg gcgcgcatgt ggagccgggc 480 gacgtgattg ttgccgacga cgacggggtc tgcatcgtca agcgtgccaa tgcggcggcg 540 gtgcttgaga aggcgcgagc gcgggtcgcc ggcgaagccg acaagcgcga gagattagcg 600 aacggcacgc tcgggctcga cctctacaag atgcgcgaag ggctggagaa gaagggtcta 660 aaatatgtct ga 672 <210> 156 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (204)...(207) <223> N-glycosylation site. Prosite id = PS00001 <400> 156 Met Asn Ile Val Val Gln Asn Ile Glu Arg Ala Asp Pro Ala Val Ile 1 5 10 15 Ala Gly Leu Ala Asp Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Ile Gly Leu Met Ser Ser Lys Met Arg Pro Ile Tyr Pro Gly Ala 35 40 45 Arg Val Ala Ala Ser Ala Val Thr Val Ser Leu Pro Pro Ala Asp Asn 50 55 60 Trp Met Ile His Val Ala Val Glu Gln Ile Lys Ala Gly Asp Ile Met 65 70 75 80 Val Val Ala Pro Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Leu Lys Ala Arg Gly Cys Val Gly Leu Val Ile Asp 100 105 110 Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Met Gln Phe Pro Val 115 120 125 Trp Ser Thr Ala Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Val Ile Cys Ala Gly Ala His Val Glu Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Ile Val Lys Arg Ala 165 170 175 Asn Ala Ala Ala Val Leu Glu Lys Ala Arg Ala Arg Val Ala Gly Glu 180 185 190 Ala Asp Lys Arg Glu Arg Leu Ala Asn Gly Thr Leu Gly Leu Asp Leu 195 200 205 Tyr Lys Met Arg Glu Gly Leu Glu Lys Lys Gly Leu Lys Tyr Val 210 215 220 <210> 157 <211> 690 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 157 atgagcgtgg tcgtcaccgg cgtgcagcgg cccgctcccg cggacgtcgc ggcattgggc 60 cgcttcggcg tagcgacaat ccacgaggcg cagggacgca ctggactaat gcacgcttac 120 atgcggccga tctattccgg cgcgcatgtc tgcggtccag cggtaaccgt gtctctcccg 180 ccagcggaca actggatgat ccacgttgcc atcgagcaat gtgttgcagg cgacatcctc 240 gtggtggcac caacctcgcc ttccgacgcc ggctatttcg gcgagctact ggcaacctcg 300 cttcaggcgc gcggcgtgaa ggggcttatc atcgaggctg gctgccgcga tgtcgcggca 360 ctgactgcca tgcgcttccc ggtgtggtcg cgctcgatct ctgcgcaggg gacagtgaag 420 gagacgctcg gctcggtaaa tgtgcccgtc gtctgtaccg gcgcgctggt ggcgccgggc 480 gatgttatcg tcgctgacga cgatggagtt gtcgtggtcc caaaggacaa tgtggccgcc 540 atcgcctccg cctccgcggc gcgtgaggcg aaggaggaag aggtgcgggc gaagctcaag 600 gccggcgtgc tgggcctcga catctacggc gtgcgcgagc ggctgaagga gaaggggctt 660 cgctatcgtg ccgccgacga aggccactag 690 <210> 158 <211> 229 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (20)...(40) <223> Multicopper oxidases signature 1. Prosite id = PS00079 <400> 158 Met Ser Val Val Val Thr Gly Val Gln Arg Pro Ala Pro Ala Asp Val 1 5 10 15 Ala Ala Leu Gly Arg Phe Gly Val Ala Thr Ile His Glu Ala Gln Gly 20 25 30 Arg Thr Gly Leu Met His Ala Tyr Met Arg Pro Ile Tyr Ser Gly Ala 35 40 45 His Val Cys Gly Pro Ala Val Thr Val Ser Leu Pro Pro Ala Asp Asn 50 55 60 Trp Met Ile His Val Ala Ile Glu Gln Cys Val Ala Gly Asp Ile Leu 65 70 75 80 Val Val Ala Pro Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Glu Leu 85 90 95 Leu Ala Thr Ser Leu Gln Ala Arg Gly Val Lys Gly Leu Ile Ile Glu 100 105 110 Ala Gly Cys Arg Asp Val Ala Ala Leu Thr Ala Met Arg Phe Pro Val 115 120 125 Trp Ser Arg Ser Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Val Val Cys Thr Gly Ala Leu Val Ala Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Pro Lys Asp 165 170 175 Asn Val Ala Ala Ile Ala Ser Ala Ser Ala Ala Arg Glu Ala Lys Glu 180 185 190 Glu Glu Val Arg Ala Lys Leu Lys Ala Gly Val Leu Gly Leu Asp Ile 195 200 205 Tyr Gly Val Arg Glu Arg Leu Lys Glu Lys Gly Leu Arg Tyr Arg Ala 210 215 220 Ala Asp Glu Gly His 225 <210> 159 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 159 atggcggtag tcgtccagaa tatcgagcgg gcggacggcg cggccatcga caagctggca 60 acatgcggcg tggcgaccgt gcacgaggcg caggggcgca ccggtctgct ggcatcggcc 120 atgcggccga tctacgccgg cgcccagatt gccggatcgg cgatcaccat ttcggcccca 180 cccggcgaca actggatggt gtacgtcgca atcgaacagc tcaagcaggg cgacgtgctg 240 gtgattgccc cgacgagtcc ctgtgaagac ggatacttcg gcgacctgct tgccacttcg 300 gcgatggcgc gcggctgccg cggcctgatc atcgatgcgg gcgtgcgcga cgtgcgcgat 360 ctgaccgcaa tgcgcttccc ggtctggtcc aaggcgatct tcgcgcaggg aaccgtcaag 420 gagacgctcg ggtcggtcaa cgtggcggtc gtgtgcgcca acgcgctggt caaccccggc 480 gacgtgatta tagccgacga cgacggcgtc gtcgtggtgc cacgcgcgca ggccggcgag 540 gtcctgaaga aggcggaagc gcgcatcgca tcggaagaag ccaagcgcaa gcggctggcg 600 gccggcgaac tcggcctcga tctctacgac atgcgcggca gactggccga caagggcctg 660 aagtatgttt ga 672 <210> 160 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 160 Met Ala Val Val Val Gln Asn Ile Glu Arg Ala Asp Gly Ala Ala Ile 1 5 10 15 Asp Lys Leu Ala Thr Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Thr Gly Leu Leu Ala Ser Ala Met Arg Pro Ile Tyr Ala Gly Ala 35 40 45 Gln Ile Ala Gly Ser Ala Ile Thr Ile Ser Ala Pro Pro Gly Asp Asn 50 55 60 Trp Met Val Tyr Val Ala Ile Glu Gln Leu Lys Gln Gly Asp Val Leu 65 70 75 80 Val Ile Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Met Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp 100 105 110 Ala Gly Val Arg Asp Val Arg Asp Leu Thr Ala Met Arg Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Ala Val Val Cys Ala Asn Ala Leu Val Asn Pro Gly 145 150 155 160 Asp Val Ile Ile Ala Asp Asp Asp Gly Val Val Val Val Pro Arg Ala 165 170 175 Gln Ala Gly Glu Val Leu Lys Lys Ala Glu Ala Arg Ile Ala Ser Glu 180 185 190 Glu Ala Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Leu 195 200 205 Tyr Asp Met Arg Gly Arg Leu Ala Asp Lys Gly Leu Lys Tyr Val 210 215 220 <210> 161 <211> 699 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 161 atgagcgtgg tcgtcaccgg catcgcgcgg cctgaccgcg ccgaggtgga aggcttcgct 60 gccatcggcg tggcgaccat ccacgaggcg cagggccgca ccggcctgat gcagtccttc 120 atgcagccga tctataccgg cgcgcacatt ggcgggcccg cggtgacggt ctcgctgccg 180 cccggcgaca actggatgat tcacgtcgcg gtagagcagt gccaggccgg cgacgttctg 240 gtcgtcgccc ccacctcacc ctcggacgtc ggctatttcg gcgagctgct ggcgacctcg 300 ctcgtcgcac gcggcatccg cggcctcgtc atcgaggccg gctgccgcga taaaacggcg 360 ctgactgcga tgcgctttcc cgtttggtcc cgcgcggtct cggcgcaggg aacggtcaag 420 gagacgctcg gctcggtgaa tgtcccactc gtctgcgccg gtgcgctggt aaatcccggt 480 gatctcgtgg tcgccgatga cgacggtgtc gtcgttgtgc cgcgcgacaa ggtcgcggcg 540 gtgcgggcgg catcgcttgc acgcgaggcg aaggaggatg gggtgcgcgc gcggctgcag 600 gccggcgagc tcggactcga cgtctacggc atgcgcgagc gcctgaagga aaaggggctg 660 gtctatcgcg cggcgaacac cgacgggaaa aacggctga 699 <210> 162 <211> 232 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 162 Met Ser Val Val Val Thr Gly Ile Ala Arg Pro Asp Arg Ala Glu Val 1 5 10 15 Glu Gly Phe Ala Ala Ile Gly Val Ala Thr Ile His Glu Ala Gln Gly 20 25 30 Arg Thr Gly Leu Met Gln Ser Phe Met Gln Pro Ile Tyr Thr Gly Ala 35 40 45 His Ile Gly Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly Asp Asn 50 55 60 Trp Met Ile His Val Ala Val Glu Gln Cys Gln Ala Gly Asp Val Leu 65 70 75 80 Val Val Ala Pro Thr Ser Pro Ser Asp Val Gly Tyr Phe Gly Glu Leu 85 90 95 Leu Ala Thr Ser Leu Val Ala Arg Gly Ile Arg Gly Leu Val Ile Glu 100 105 110 Ala Gly Cys Arg Asp Lys Thr Ala Leu Thr Ala Met Arg Phe Pro Val 115 120 125 Trp Ser Arg Ala Val Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Leu Val Cys Ala Gly Ala Leu Val Asn Pro Gly 145 150 155 160 Asp Leu Val Val Ala Asp Asp Asp Gly Val Val Val Val Pro Arg Asp 165 170 175 Lys Val Ala Ala Val Arg Ala Ala Ser Leu Ala Arg Glu Ala Lys Glu 180 185 190 Asp Gly Val Arg Ala Arg Leu Gln Ala Gly Glu Leu Gly Leu Asp Val 195 200 205 Tyr Gly Met Arg Glu Arg Leu Lys Glu Lys Gly Leu Val Tyr Arg Ala 210 215 220 Ala Asn Thr Asp Gly Lys Asn Gly 225 230 <210> 163 <211> 699 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 163 atgagtgtcg tcgtcacagg aattccgcgg gcctcggcat ctgagatcga cgcgcttcgc 60 cgctgcgggg tggcgacgat ccacgaggcg caagggcgta ccggccttct gcgcgcgaac 120 atgcggccga tctacgctgg tgcccatgcc gtcggatcgg cggtgaccgt gtcgttgccc 180 ccggccgata actggatgat ccatgtggcg gtcgagcagt gtcaggcagg agacgtcctc 240 gtcgtggccc cgacttcgcc ttcggatgcc ggctactttg gcgagctgct ggcgacctct 300 ctcgccgcgc ggggtgtgcg cggcctcgtt atcgaggctg ggtgccgcga cgtggcggcg 360 ttgacggcaa tgcgttttcc ggtctggtca cgcgccgtct ccgcacaagg gacggtgaag 420 gagacgcttg gttcggtgaa tgtgccgatc atctgcgccg gtgctctcgt gaatccggga 480 gacgttgtcg ttgccgacga tgacggcgtg gtcgttgtgc cacgcatcgg agtggcggat 540 gtcgctgccg cctcggccgc gcgtgaagcg aaggaggatc aggtcagggc gcgcttcaag 600 gcgggcgagc tcgggctcga tatctatagg atgcgcgagc ggctgaagga aaaagggctc 660 gtctaccgta ccgcgggtga tggcccaggc gggggctag 699 <210> 164 <211> 232 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 164 Met Ser Val Val Val Thr Gly Ile Pro Arg Ala Ser Ala Ser Glu Ile 1 5 10 15 Asp Ala Leu Arg Arg Cys Gly Val Ala Thr Ile His Glu Ala Gln Gly 20 25 30 Arg Thr Gly Leu Leu Arg Ala Asn Met Arg Pro Ile Tyr Ala Gly Ala 35 40 45 His Ala Val Gly Ser Ala Val Thr Val Ser Leu Pro Pro Ala Asp Asn 50 55 60 Trp Met Ile His Val Ala Val Glu Gln Cys Gln Ala Gly Asp Val Leu 65 70 75 80 Val Val Ala Pro Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Glu Leu 85 90 95 Leu Ala Thr Ser Leu Ala Ala Arg Gly Val Arg Gly Leu Val Ile Glu 100 105 110 Ala Gly Cys Arg Asp Val Ala Ala Leu Thr Ala Met Arg Phe Pro Val 115 120 125 Trp Ser Arg Ala Val Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Ile Ile Cys Ala Gly Ala Leu Val Asn Pro Gly 145 150 155 160 Asp Val Val Val Ala Asp Asp Asp Gly Val Val Val Val Pro Arg Ile 165 170 175 Gly Val Ala Asp Val Ala Ala Ala Ser Ala Ala Arg Glu Ala Lys Glu 180 185 190 Asp Gln Val Arg Ala Arg Phe Lys Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Arg Met Arg Glu Arg Leu Lys Glu Lys Gly Leu Val Tyr Arg Thr 210 215 220 Ala Gly Asp Gly Pro Gly Gly Gly 225 230 <210> 165 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 165 atgggtgtgg tggtccagaa tatcgcccgc gccgcgcaat ccgtcatcga ccggctcgcg 60 gcttgcggcg tcgcgacggt tcatgaagca caggggcgca aaggcctgct cgccagccgt 120 atgcggccga tctatcccgg cgcccggatc gccgcgagcg cggtgacgat ctcagcgccg 180 cccggtgaca actggatgat tcatgtggcg atcgagcagc tcaagacggg tgacatcctg 240 cttctggcgc cgaccagtcc ttgcgaggac ggctatttcg gcgatctgct tgcgacgtcc 300 gcgatggcgc ggggctgtcg gggattgatc atcgatgctg gcgtgcgcga tgtcgccgac 360 ctggccgcga tgaaattccc tgtctggtcg aaggccatct tcgcgcaggg cacggtcaag 420 gagacagtcg gttccgtgaa tgtgccggtc gtctgcgccg gcgcgctggt caatcccggc 480 gatgtgatcg tcgccgacga tgacggcgtc tgtgtcgtca ggcgcgagga tgcggctgat 540 gtggctgaca aggccgaggc gcgcgtcgcg gccgaagaga gcaagcgcaa gcggctagca 600 tcaggcgagc tcggtctcga catttacgat atgcgccaac ggctcacgga gaaaggcctt 660 agatatgtct ga 672 <210> 166 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 166 Met Gly Val Val Val Gln Asn Ile Ala Arg Ala Ala Gln Ser Val Ile 1 5 10 15 Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Lys Gly Leu Leu Ala Ser Arg Met Arg Pro Ile Tyr Pro Gly Ala 35 40 45 Arg Ile Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn 50 55 60 Trp Met Ile His Val Ala Ile Glu Gln Leu Lys Thr Gly Asp Ile Leu 65 70 75 80 Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Met Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp 100 105 110 Ala Gly Val Arg Asp Val Ala Asp Leu Ala Ala Met Lys Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Val Gly 130 135 140 Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu 165 170 175 Asp Ala Ala Asp Val Ala Asp Lys Ala Glu Ala Arg Val Ala Ala Glu 180 185 190 Glu Ser Lys Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Asp Met Arg Gln Arg Leu Thr Glu Lys Gly Leu Arg Tyr Val 210 215 220 <210> 167 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 167 atgggcgtcg tggtccagaa catcgcccgc gccgagcgag atgtcatcga ccggcttgcg 60 atctgcggcg tcgcgaccgt gcatgaggcg caagggcgca aggggctgct ggcgagctat 120 atgcggccga tctatcccgg cgcgcggatt gcggcgagcg ccgtcaccat ttcggctccc 180 cccggtgaca actggatggt ccatgtggcg atcgagcagg tgagggaggg cgacatcctg 240 ctgctcgctc cgacgagccc ttgcgaggac gggtattttg gcgacctgct ggcgacctcg 300 gccatggcgc gcggatgccg cgggctggtc atcgatgccg gcgtgcgtga tgtcgccgat 360 ctcacggcga tgcagttccc cgtctggtcg aaggcgatct tcgcacaggg cacggtcaag 420 gagacgctgg gctctgtgaa tgtgccggtc gtctgcgccg gcgcgcttat caatccgggc 480 gatgtcatcg tggcggatga tgacggcgtc tgcgtcgtca ggcgcgagga ggcggccgat 540 gtcgccgcca aggccgaggc gcgcgttggc gccgaggagg ccaagcgcaa gcgtctcgct 600 gccggcgaac tcggactcga catctacgat atgcgcaggc gtctcgccga gaagggattg 660 aaatatgtct ga 672 <210> 168 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 168 Met Gly Val Val Val Gln Asn Ile Ala Arg Ala Glu Arg Asp Val Ile 1 5 10 15 Asp Arg Leu Ala Ile Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro Gly Ala 35 40 45 Arg Ile Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn 50 55 60 Trp Met Val His Val Ala Ile Glu Gln Val Arg Glu Gly Asp Ile Leu 65 70 75 80 Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Met Ala Arg Gly Cys Arg Gly Leu Val Ile Asp 100 105 110 Ala Gly Val Arg Asp Val Ala Asp Leu Thr Ala Met Gln Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Ile Asn Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu 165 170 175 Glu Ala Ala Asp Val Ala Ala Lys Ala Glu Ala Arg Val Gly Ala Glu 180 185 190 Glu Ala Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Asp Met Arg Arg Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val 210 215 220 <210> 169 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 169 atgagtgtgg tcgttcagaa tatcgagcgg gccgatcccg ccatcatcgc cggccttgcc 60 gaatgcggtg tggcgaccgt ccacgaagcg cagggccgca agggcctgct ggcgtcctat 120 atgcgtccca tctactcggg cgcgcgcctg gcagcaagtg ccgtgaccat ttcggcgccg 180 ccctgcgaca actggatgtt gcatgtcgcc attgagaaat tgcgggaggg cgacattctc 240 gtcctcgccc caacgtcgcc gtctgacgct gggtactttg gcgacctgct ggccacttcg 300 gcgcaggccc gcggctgcaa gggcctgatc attgatgccg gcgtacgcga cgtggccgac 360 ctcacgcgga tgaaattccc cgtctggtcc aaggcgatat ttgcccaggg cacgatcaag 420 gagacgctgg gctcggtcaa tgtgccgatt gtctgcgcgg gcgagctggt caatgccggc 480 gacatcatcg tggccgatga cgatggggtt tgcgttgtgc gccgcgagga ggctgctgcg 540 gtgctcgaag cctcgcagaa gcgcgtggcc aatgaagaga gcacgcgcaa gcgcctcgct 600 gccggggaac tgggactcga catctatgga atgcgccagc ggctgaccga gaaggggttg 660 aagtatgtct ga 672 <210> 170 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 170 Met Ser Val Val Val Gln Asn Ile Glu Arg Ala Asp Pro Ala Ile Ile 1 5 10 15 Ala Gly Leu Ala Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly Ala 35 40 45 Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Cys Asp Asn 50 55 60 Trp Met Leu His Val Ala Ile Glu Lys Leu Arg Glu Gly Asp Ile Leu 65 70 75 80 Val Leu Ala Pro Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Gln Ala Arg Gly Cys Lys Gly Leu Ile Ile Asp 100 105 110 Ala Gly Val Arg Asp Val Ala Asp Leu Thr Arg Met Lys Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Ile Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Ile Val Cys Ala Gly Glu Leu Val Asn Ala Gly 145 150 155 160 Asp Ile Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu 165 170 175 Glu Ala Ala Ala Val Leu Glu Ala Ser Gln Lys Arg Val Ala Asn Glu 180 185 190 Glu Ser Thr Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Gly Met Arg Gln Arg Leu Thr Glu Lys Gly Leu Lys Tyr Val 210 215 220 <210> 171 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 171 atgaccgtcg tcgtccgcaa cttcgagcgc gcgtcgcccg aagtcgtagc cgtgctgggc 60 gaatgcggcg tggcgacggt gcatgaagcg caaggccgca gcggcctcat gctcgccttc 120 atgcggccga tcttcgcggg cgcccgcatc gccgggccgg cggtgacagt ttccgtcccg 180 ccgggcgaca actggatgat ccatgtggcg atcgagcagt gccgcgaagg cgacgtgctc 240 gtcgtggcgc cgaccagccc ctccgaggac ggctatttcg gcgacctgct cgcgcactcg 300 ctgatggcgc ggggcgtcaa ggggctcgtc attgaggccg gcgttcgcga tctacgcgat 360 ctcaccgaga tgcgctttcc ggtctggtcc cggacgatct ccgcgcaggg aacggtcaag 420 gagacgctcg gctcggtgaa cgtgccgatc gtctgcgccg gcgcggcggt cgatccgggc 480 gacgtagtcg tggccgacga cgacggcgtc tgcatcgtga gacgcgcccg ggcggaagag 540 gtcgcgaaag cggcgcgcga acgcgaggcg aaggagaggg agacgcggcg gcggctggcc 600 gccggcgagc tcggtctcga catctatggc atgcgcgaga agcttgcggc caaagggctg 660 aaatatgtct ga 672 <210> 172 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 172 Met Thr Val Val Val Arg Asn Phe Glu Arg Ala Ser Pro Glu Val Val 1 5 10 15 Ala Val Leu Gly Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Ser Gly Leu Met Leu Ala Phe Met Arg Pro Ile Phe Ala Gly Ala 35 40 45 Arg Ile Ala Gly Pro Ala Val Thr Val Ser Val Pro Pro Gly Asp Asn 50 55 60 Trp Met Ile His Val Ala Ile Glu Gln Cys Arg Glu Gly Asp Val Leu 65 70 75 80 Val Val Ala Pro Thr Ser Pro Ser Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala His Ser Leu Met Ala Arg Gly Val Lys Gly Leu Val Ile Glu 100 105 110 Ala Gly Val Arg Asp Leu Arg Asp Leu Thr Glu Met Arg Phe Pro Val 115 120 125 Trp Ser Arg Thr Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Ala Val Asp Pro Gly 145 150 155 160 Asp Val Val Val Ala Asp Asp Asp Gly Val Cys Ile Val Arg Arg Ala 165 170 175 Arg Ala Glu Glu Val Ala Lys Ala Ala Arg Glu Arg Glu Ala Lys Glu 180 185 190 Arg Glu Thr Arg Arg Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Val 210 215 220 <210> 173 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 173 atgggcgttg tggtccagaa tgtcggccgc gccgaacaat ccgtcatcga ccggctcgca 60 gcctgtggcg tggcgactgt gcatgaggcg cagggccgcc ggggcctcct cgcgagctac 120 atgcggccga tctattccgg tgcacggatc gccgcgagtg cagtgacgat ctcggcgccg 180 cccagtgaca actggatgct gcatgtggcg atcgagcaat tgaagcaggg cgatctgctt 240 ctgctcgcgc ccaccagccc gtgcgaagac ggctatttcg gtgacctgct cgcgacctct 300 gccgtggcgc gaggttgccg cggcctgatc atcgacgcgg gcgtacgcga tgtcgccgac 360 ctgacggcca tgtcgtttcc ggtctggtcc aaggcgatat ctgcgcaagg caccgtcaag 420 gagacattgg gctcggtgaa tgtgccggtc gtctgcgccg gtgcgctggt caacccaggc 480 gacgtgatcg tggccgacga cgatggcgtc tgcgtcgtgc gccgcgagga ggcggcggag 540 atcgccgaca aggccgaagc gcgcgtcgcg gccgaggaaa gcaagcgggc gcggctggca 600 gccggcgaac ttgggttgga tatctacgac atgcgcaagc ggctcgccga gaaagggctg 660 aagtatgtct ga 672 <210> 174 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 174 Met Gly Val Val Val Gln Asn Val Gly Arg Ala Glu Gln Ser Val Ile 1 5 10 15 Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly Ala 35 40 45 Arg Ile Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Ser Asp Asn 50 55 60 Trp Met Leu His Val Ala Ile Glu Gln Leu Lys Gln Gly Asp Leu Leu 65 70 75 80 Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Val Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp 100 105 110 Ala Gly Val Arg Asp Val Ala Asp Leu Thr Ala Met Ser Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu 165 170 175 Glu Ala Ala Glu Ile Ala Asp Lys Ala Glu Ala Arg Val Ala Ala Glu 180 185 190 Glu Ser Lys Arg Ala Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Asp Met Arg Lys Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val 210 215 220 <210> 175 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 175 atgggtgtcg tcgtccagaa tatcgagcgc gccgatcctt cggtcatcga acggctggcg 60 gcatgcgggg ttgctactgt gcacgaagcg cagggacgca agggtctgct ggcgagccat 120 atgcggccga tctatgccgg tgcgcgcctt gcagccagtg ccgtgaccat atcggcgccg 180 ccgggcgata actggatgat ccatgtcgcc atcgaacagc tcagggcggg tgacataatg 240 gtgcttgccc cgacaagtcc ctgcgaggat ggctatttcg gcgacttgct ggcgacgtct 300 gctgcggcgc gaggctgccg ggggctgatc atcgatgcgg gcgtgcgtga cgtggcggac 360 ctgacggcga tgaagtttcc ggtgtggtcg aaggccattt ttgcgcaggg cacggtcaag 420 gaaacgctgg gctcggtcaa tgtgccggtg gtctgcgcgg gagcgctggt caacccgggc 480 gacgtgatcg tggccgatga cgacggcgtc tgcgtcgtgc gacgcgagga agcggccgcg 540 gtggccgaca aggccgaggc gcgcgtggct gcggaagagg acaagcgcag gcgcctggcg 600 gccggggaac tgggcctcga catctacaag atgcgcgagc gcctggccga gaagggcctc 660 aggtatgtct ga 672 <210> 176 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 176 Met Gly Val Val Val Gln Asn Ile Glu Arg Ala Asp Pro Ser Val Ile 1 5 10 15 Glu Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Lys Gly Leu Leu Ala Ser His Met Arg Pro Ile Tyr Ala Gly Ala 35 40 45 Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn 50 55 60 Trp Met Ile His Val Ala Ile Glu Gln Leu Arg Ala Gly Asp Ile Met 65 70 75 80 Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Ala Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp 100 105 110 Ala Gly Val Arg Asp Val Ala Asp Leu Thr Ala Met Lys Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu 165 170 175 Glu Ala Ala Ala Val Ala Asp Lys Ala Glu Ala Arg Val Ala Ala Glu 180 185 190 Glu Asp Lys Arg Arg Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Arg Tyr Val 210 215 220 <210> 177 <211> 675 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 177 atggggggcg tagtcgtgca gaacatcgag cgggccgacg cggaaaccat ccgccggctc 60 ggcgaatgcg gtgtggcgac ggtgcacgag gcgcaggggc gcagcgggct gatggcgccc 120 catatgacgc cggtctggcg cggcgcatcg gttgccggtt cggcggtgac gatctccgcc 180 ccgcccggcg acaactggat gctgcacgtg gcgatcgagc aggtgcatga gggcgatatc 240 ctcgtgctgg cgccgaccag tccttccacg gacggctatt tcggcgattt gcttgccacc 300 tcggcgatgg cgcgggggtg tcgcgggctg gtcatcgaag caggcgtgcg cgacgtggcc 360 gacctgacga agatgcggtt ccccgtctgg tcgaaggcgg tccacgcgca gggtacggtc 420 aaagagacgc cgggctcagt caacgtgccg gtcgtctgcg ccggtgccca tgtgcggccg 480 ggcgacgtca tcgtggccga cgatgacggc gtgtgcgtgg tcaggcgcga ggaggcggcg 540 gaaatattga ggaaggccga ggcccgcatc gccaacgaag ccgacaagcg cgagcgtttc 600 gccgccggcg aactcggcct cgacatctac ggcatgcgcg agaagctggc cgccaaggga 660 ttgaaatata tctga 675 <210> 178 <211> 224 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (21)...(173) <223> Demethylmenaquinone methyltransferase <400> 178 Met Gly Gly Val Val Val Gln Asn Ile Glu Arg Ala Asp Ala Glu Thr 1 5 10 15 Ile Arg Arg Leu Gly Glu Cys Gly Val Ala Thr Val His Glu Ala Gln 20 25 30 Gly Arg Ser Gly Leu Met Ala Pro His Met Thr Pro Val Trp Arg Gly 35 40 45 Ala Ser Val Ala Gly Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp 50 55 60 Asn Trp Met Leu His Val Ala Ile Glu Gln Val His Glu Gly Asp Ile 65 70 75 80 Leu Val Leu Ala Pro Thr Ser Pro Ser Thr Asp Gly Tyr Phe Gly Asp 85 90 95 Leu Leu Ala Thr Ser Ala Met Ala Arg Gly Cys Arg Gly Leu Val Ile 100 105 110 Glu Ala Gly Val Arg Asp Val Ala Asp Leu Thr Lys Met Arg Phe Pro 115 120 125 Val Trp Ser Lys Ala Val His Ala Gln Gly Thr Val Lys Glu Thr Pro 130 135 140 Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala His Val Arg Pro 145 150 155 160 Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg 165 170 175 Glu Glu Ala Ala Glu Ile Leu Arg Lys Ala Glu Ala Arg Ile Ala Asn 180 185 190 Glu Ala Asp Lys Arg Glu Arg Phe Ala Ala Gly Glu Leu Gly Leu Asp 195 200 205 Ile Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Ile 210 215 220 <210> 179 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 179 atgggggtcg tggtccagaa catcgaacgc gccgatcagg ccgtcatcaa ccgccttgcc 60 gcctgcggcg tggccaccgt gcacgaggcg cagggccgca agggcctgct cgccgccaat 120 atgcgtccga tctacagcgg agaacgtctg gcggcctcgg ccgtgacgat ttccgcgccc 180 cccggtgaca actggatggt ccatgtcgcg atcgagcaat tgcaggccgg tgacatcatg 240 gttttggccc ccacctcgcc ctgcgaggac ggctatttcg gtgatcttct ggccacgtcg 300 gctatcgcac gtggctgcaa gggcctgatc atcgatgcgg gcgtgcgcga tgtgtcggat 360 ctgacggcga tgaaattccc cgtctggtcc aaggcgatct tcgcccaagg cacggtcaag 420 gaaacccttg ggtcggtgaa tattcccgtg gtctgcgccg gcgcgctgat caatcccggt 480 gatgtaattg tggccgatga cgacggcgtt tgcgtggtcc gccgcgagga agccgaagcc 540 gttgcagcca aagccgaagc ccgtgtcgca gccgaagaag gcaagcgcgt gcgtctggcc 600 gcgggtgaac tgggccttga tatctataac atgcgcgaac gtctggccga gaagggcctg 660 aaatatgtct ga 672 <210> 180 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 180 Met Gly Val Val Val Gln Asn Ile Glu Arg Ala Asp Gln Ala Val Ile 1 5 10 15 Asn Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Lys Gly Leu Leu Ala Ala Asn Met Arg Pro Ile Tyr Ser Gly Glu 35 40 45 Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn 50 55 60 Trp Met Val His Val Ala Ile Glu Gln Leu Gln Ala Gly Asp Ile Met 65 70 75 80 Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Ile Ala Arg Gly Cys Lys Gly Leu Ile Ile Asp 100 105 110 Ala Gly Val Arg Asp Val Ser Asp Leu Thr Ala Met Lys Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Ile Pro Val Val Cys Ala Gly Ala Leu Ile Asn Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu 165 170 175 Glu Ala Glu Ala Val Ala Ala Lys Ala Glu Ala Arg Val Ala Ala Glu 180 185 190 Glu Gly Lys Arg Val Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Asn Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val 210 215 220 <210> 181 <211> 687 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 181 atgagcggtc atcgcatcgt ccgcaactat ccaaaagcag actcgggcgt cgcctccgct 60 ctgggcgctc tgggcagcgc gaccgtgcac gaggccatgg gccgcgtggg atacgccggc 120 caccgtatcc ggccgatcca gcagggcgtg tcgatcggcg gcaccgccgt aaccgtctcg 180 gtcgcaccgg gtgacaacct gatggttcac gccgcgattg ccgaggccaa cgaaggcgac 240 gtgctggtcg tcgttcccgt gagcgacagc gcgttcggct ttatcggcga cctgatggcg 300 actcagatgc gctctcgccg gctgcgcggt tacgtgacct ccggcggcgt gcgtgatacc 360 gccgagttgg cccgcttggg ttttccggta tggacgaaat acgtctcgtc gcaagggacg 420 gtgaaagata cccccggctc ggtcaatgtg cccgtcgtgc tcgaaggcgt cgtggtccat 480 cctggagacg tcgtggtagc ggacgacgac ggcgtcacca tcgtgccgcg cgagatcgcc 540 gccgacacgc tccaggccgc tcgggcccgc gtggagaagg aagccgcgac ccgatcgcgg 600 tatgcggcgg gcgagctttc actcgacgtc aacaacctgc gcccgaccct cgcagcgctg 660 ggagtggagt atgtcgattt cgggtga 687 <210> 182 <211> 228 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> SIGNAL <222> (1)...(31) <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 182 Met Ser Gly His Arg Ile Val Arg Asn Tyr Pro Lys Ala Asp Ser Gly 1 5 10 15 Val Ala Ser Ala Leu Gly Ala Leu Gly Ser Ala Thr Val His Glu Ala 20 25 30 Met Gly Arg Val Gly Tyr Ala Gly His Arg Ile Arg Pro Ile Gln Gln 35 40 45 Gly Val Ser Ile Gly Gly Thr Ala Val Thr Val Ser Val Ala Pro Gly 50 55 60 Asp Asn Leu Met Val His Ala Ala Ile Ala Glu Ala Asn Glu Gly Asp 65 70 75 80 Val Leu Val Val Val Pro Val Ser Asp Ser Ala Phe Gly Phe Ile Gly 85 90 95 Asp Leu Met Ala Thr Gln Met Arg Ser Arg Arg Leu Arg Gly Tyr Val 100 105 110 Thr Ser Gly Gly Val Arg Asp Thr Ala Glu Leu Ala Arg Leu Gly Phe 115 120 125 Pro Val Trp Thr Lys Tyr Val Ser Ser Gln Gly Thr Val Lys Asp Thr 130 135 140 Pro Gly Ser Val Asn Val Pro Val Val Leu Glu Gly Val Val Val His 145 150 155 160 Pro Gly Asp Val Val Val Ala Asp Asp Asp Gly Val Thr Ile Val Pro 165 170 175 Arg Glu Ile Ala Ala Asp Thr Leu Gln Ala Ala Arg Ala Arg Val Glu 180 185 190 Lys Glu Ala Ala Thr Arg Ser Arg Tyr Ala Ala Gly Glu Leu Ser Leu 195 200 205 Asp Val Asn Asn Leu Arg Pro Thr Leu Ala Ala Leu Gly Val Glu Tyr 210 215 220 Val Asp Phe Gly 225 <210> 183 <211> 693 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 183 atgcgcggcg tcgtggtccg gaacattcca cgcgccgacg cgcgcgagat cgcggttctg 60 catgaagcgg gcgtcgccac cgtgcacgag gcgcagagcc gcctcggtct gctcgcttcg 120 tacatgcggc ccatttacga gggcgcatcg attgccggtc cggccgtgac cgtgctcgtg 180 ccgccatcgg acaactggat gctgcacgtc gccgctgaac agtgccagcc cggcgatgtc 240 ctcgtggtcg cgccgacgtc gccgtgcgaa gacggctact tcggcgaact gttggcgacg 300 tcgctggcac agctcggcgt gcgcggactg atcatcgatg cgggctgccg cgacatccgt 360 gcgctcaagg cgatgaattt ccccgtgtgg tcgaaaggga tctcggcgca agggaccgtc 420 aaggaaacgc tcgggtcggt gaacatcccc gtggtgtgcg cgcagcaact ggtgcgaccg 480 ggcgacgtga tcgtggccga tgacgatggc gtcgtggtcg tcgcgttcga gacggtggcg 540 gccgtggcga gcgccgcacg cgcgcgcctc gagaaggaag agaagacgcg cagcgtgctt 600 gcgacaggcc agctcggtct cgactactac gcgatgcgcg agaagcttgc ggcaaagggt 660 ttgcgttacg tcgattccgc tgcgggtctt tga 693 <210> 184 <211> 230 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (21)...(173) <223> Demethylmenaquinone methyltransferase <400> 184 Met Arg Gly Val Val Val Arg Asn Ile Pro Arg Ala Asp Ala Arg Glu 1 5 10 15 Ile Ala Val Leu His Glu Ala Gly Val Ala Thr Val His Glu Ala Gln 20 25 30 Ser Arg Leu Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Glu Gly 35 40 45 Ala Ser Ile Ala Gly Pro Ala Val Thr Val Leu Val Pro Pro Ser Asp 50 55 60 Asn Trp Met Leu His Val Ala Ala Glu Gln Cys Gln Pro Gly Asp Val 65 70 75 80 Leu Val Val Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Glu 85 90 95 Leu Leu Ala Thr Ser Leu Ala Gln Leu Gly Val Arg Gly Leu Ile Ile 100 105 110 Asp Ala Gly Cys Arg Asp Ile Arg Ala Leu Lys Ala Met Asn Phe Pro 115 120 125 Val Trp Ser Lys Gly Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu 130 135 140 Gly Ser Val Asn Ile Pro Val Val Cys Ala Gln Gln Leu Val Arg Pro 145 150 155 160 Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Ala Phe 165 170 175 Glu Thr Val Ala Ala Val Ala Ser Ala Ala Arg Ala Arg Leu Glu Lys 180 185 190 Glu Glu Lys Thr Arg Ser Val Leu Ala Thr Gly Gln Leu Gly Leu Asp 195 200 205 Tyr Tyr Ala Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Arg Tyr Val 210 215 220 Asp Ser Ala Ala Gly Leu 225 230 <210> 185 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 185 atgaatcgac cggtggtagt ccggcaagtt gaacagccac cagcggatgc ggttgccgca 60 ctggagaggt atggcgtgac aaccgtccat gaggctcagg gacccggtgg cctcctagcc 120 tcctacatgc gcccgattta cccgggagca gtcatcgccg gttccgcggt cactgtgtct 180 ttacctcctg gcgacaacct catgatccac gtggccgtgg aggtctgtgg tccgggaaac 240 attctggttg ttgcaccgat ctcgccgtgt acggatggct acttcggaga gctgttggca 300 acctctctcc gcgcccacgg tgtgcgaggg cttgtgatcg atgccggatg ccgggacgtg 360 cgctctctca cagaaatgaa atttccggcc tggagccgcg ccgtcagttc acaggggaca 420 gtcaaggcca ccctgggatc ggtgaatgtg ccgattgtgt gcgcgggcgc gcgggtcgag 480 gctggggatg tcatcgtcgc cgatgacgat ggagttgtgg tggtgaagcg cgcgctggcc 540 gaagaggtcg ccgccgcggc ggaacaaagg gttcgcaaag agaatgtgac ccgggaacga 600 cttgcgcgtg gagagctggg actcgatatt tacgacatgc gccaaaagat cgcacaactg 660 ggccttaaat atctctga 678 <210> 186 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 186 Met Asn Arg Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Arg Tyr Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Pro Gly Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro 35 40 45 Gly Ala Val Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ala Pro Ile Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Ala Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Arg Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Leu Ala Glu Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 187 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 187 atgaatcgac cggtggtagt ccggcaagtt gaacagccac cagcggatgc ggttgccgca 60 ctggagaagt atggcgtgac aaccgtccat gaggctcagg gacccggtgg cctcctagcc 120 tcctacatgc gcccgattta cccgggagca gtcatcgccg gttccgcggt cactgtgtct 180 ttacctcctg gcgacaacct catgatccac gtggccgtgg aggtctgtgg tccgggaaac 240 attctggttg ttgcaccgat ctcgccgtgt acggatggct acttcggaga gctgttggca 300 acctctctcc gcgcccacgg tgtgcgaggg cttgtgatcg atgccggatg ccgggacgtg 360 cgctctctca cagaaatgaa atttccggtc tggagccgcg ccgtcagtcc acaggggaca 420 gtcaaggcca ccctgggatc ggtgaatgtg ccgattgtgt gcgcgggcgc gcgggtcgag 480 gctggggatg tcatcgtcgc cgatgacgat ggagttgtgg tggtgaagcg cgcgctggcc 540 gaagaggtcg ccgccgcggc ggaacaaagg gttcgcaaag agaatgtgac ccgggaacga 600 cttgcgcgtg gagagctggg actcgatatt tacgacatgc gccaaaagat cgcacaactg 660 ggccttaaat atctctga 678 <210> 188 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 188 Met Asn Arg Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Pro Gly Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro 35 40 45 Gly Ala Val Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ala Pro Ile Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Pro Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Arg Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Leu Ala Glu Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 189 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 189 atgaacaaac cggtggtgat ccggcaactg gagcgggcgc cggctgatgc ggtggcggcg 60 ctcgaaaaat atggtgtgtc caccgtgcat gaagctcagg gacgttgcgg actactcgct 120 tcctacatgc gaccgattta tccgggtgcc gctattgccg ggtcggcggt cacggtgtca 180 cttccgcccg gcgataacct gatgattcac gttgccgtcg aggtttgcca gtccggcgac 240 atactcgtgg ttgcccccac ctcgccttgc tcggacggat acttcgggga gttgttggca 300 acatctttgc gcgcccacgg cgtgaagggg cttgtcattg aggcaggatg ccgtgatgtt 360 cgctcgctca ccgaaatgaa gttcccggtc tggagccgcg ccgtcagttc gcaaggcacc 420 gtgaagtcta acctcggatc ggtgaatgtg ggcatagtct gtgcgggtgc acacattgac 480 gctggcgatg tggtcgtggc agatgacgac ggtgtcgtgg cggtgaagcg cgcatccgcc 540 caagaagtag ttggggcgtg cgaacaacgg gttcgcaagg aagaggcagc ccgtgagcgg 600 ctggcgcggg gagagcttgg cctcgacatc tacggcttgc gcacacgaat cgcggaaatg 660 ggtctcaagt atcaatga 678 <210> 190 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 190 Met Asn Lys Pro Val Val Ile Arg Gln Leu Glu Arg Ala Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro 35 40 45 Gly Ala Ala Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Ser Gly Asp 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val 100 105 110 Ile Glu Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ser Asn 130 135 140 Leu Gly Ser Val Asn Val Gly Ile Val Cys Ala Gly Ala His Ile Asp 145 150 155 160 Ala Gly Asp Val Val Val Ala Asp Asp Asp Gly Val Val Ala Val Lys 165 170 175 Arg Ala Ser Ala Gln Glu Val Val Gly Ala Cys Glu Gln Arg Val Arg 180 185 190 Lys Glu Glu Ala Ala Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Thr Arg Ile Ala Glu Met Gly Leu Lys Tyr 210 215 220 Gln 225 <210> 191 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 191 atgaacaaac cggtggtgat ccggcaactg gagcgggcgc cggctgatgc ggtggcggcg 60 ctcgaaaaat atggtgtgtc caccgtgcat gaagctcagg gacgttgcgg actactcgct 120 tcctacatgc gaccgattta tccgggtgcc gctattgccg ggtcggcggt cacggtgtca 180 cttccgcccg gcgataacct gatgattcac gttgccgtcg aggtttgcca gtccggcgac 240 atactcgtgg ttgcccccac ctcgccttgc tcggacggat acttcgggga gttgttggca 300 acatctttgc gcgcccacgg cgtgaagggg cttgtcattg aggcaggatg ccgtgatgtt 360 cgctcgctca ccgaaatgaa gttcccggtc tggagccgcg ccgtcagttc gcaaggcacc 420 gtgaagtcta acctcggatc ggtgaatgtg ggcatagtct gtgcgggtgc acacattgac 480 gctggcgatg tggtcgtggc agatgacgac ggtgtcgtgg cggtgaagcg cgcatccgcc 540 caagaagtag ttggggcgtg cgaacaacgg gttcgcaagg aagaggcaac ccgtgagcgg 600 ctggcgcggg gagagcttgg cctcgacatc tacggcttgc gcacacgaat cgcggaaatg 660 ggtctcaagt atcaatga 678 <210> 192 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 192 Met Asn Lys Pro Val Val Ile Arg Gln Leu Glu Arg Ala Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro 35 40 45 Gly Ala Ala Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Ser Gly Asp 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val 100 105 110 Ile Glu Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ser Asn 130 135 140 Leu Gly Ser Val Asn Val Gly Ile Val Cys Ala Gly Ala His Ile Asp 145 150 155 160 Ala Gly Asp Val Val Val Ala Asp Asp Asp Gly Val Val Ala Val Lys 165 170 175 Arg Ala Ser Ala Gln Glu Val Val Gly Ala Cys Glu Gln Arg Val Arg 180 185 190 Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Thr Arg Ile Ala Glu Met Gly Leu Lys Tyr 210 215 220 Gln 225 <210> 193 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 193 atgaatacac cggtggtagt ccggcaggtg gagcagccgc cagcaggtgc ggttgccaca 60 ctggagaagt gtggggtgac aaccgtgcat gaggctcaag gacgttgtgg cctgcttgcg 120 ccctacctgc gcccgattta cccgggagca gccatcgccg gttccgcgat caccgtgact 180 ttgcctccgg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240 attctcgtag tttcaccgac ctcggcttgc accgatggct acttcggtga gctgttggcc 300 acatctctcc gtgcccacgg tgtgagaggg ctggtgatcg atgccggatg ccgtgatgtg 360 cgctctctaa cagaaatgaa attcccggtc tggagccgcg ccgtcagtcc gcagggcacc 420 gtcaaggcca cgctgggatc ggtgaatgtg cccatcgtgt gcgcgggcgc actggtcgaa 480 gctggtgatg ttatcgtcgc cgatgacgat ggcgtggtgg tggtgaggcg cgcgctggcc 540 gaagaggtcg ccgcggcggc ggaacaaagg gttcagaaag agaatgtgac ccgcgagcgg 600 cttgcacgcg gagagctcgg cctcgatatt tacgacattc gccaacggat cgcgcaactg 660 ggccttaaat atctgtaa 678 <210> 194 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 194 Met Asn Thr Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Gly 1 5 10 15 Ala Val Ala Thr Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Pro Tyr Leu Arg Pro Ile Tyr Pro 35 40 45 Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Thr Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ser Pro Thr Ser Ala Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Pro Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Leu Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Arg 165 170 175 Arg Ala Leu Ala Glu Glu Val Ala Ala Ala Ala Glu Gln Arg Val Gln 180 185 190 Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Ile Arg Gln Arg Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 195 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 195 atgaatacac cggtggtagt ccggcaggtg gagcagccgc cagcaggtgc ggttgccaca 60 ctggagaagt gtggggtgac aaccgtgcat gaggctcaag gacgttgtgg cctgcttgcg 120 ccctacatgc gcccgattta cccgggagca gccatcgccg gttccgcgat caccgtgact 180 ttgcctccgg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240 attttggtgg tttcaccgac ctcggcttgc accgatggct acttcggtga gctgttggcc 300 acctctctcc gtgctcacgg tgtgagaggg ctggtgatcg atgccggatg ccgtgatgtg 360 cgctctctaa cagaaatgaa attcccggtc tggagccgcg ccgtcagttc gcagggcacc 420 gtcaaggcca cactgggatc ggtgaatgtg cccatcgtgt gcgcgggcgc actggtcgaa 480 gctggtgatg tcatcgtcgc cgatgacgat ggagtggtgg tggtgaggcg cgcgctggcc 540 gaagaggtcg ccgccgcggc ggaacaaagg gctcagaaag agaatgtgac ccgcgagcga 600 ctggcgcgcg gagagctcgg cctcgatatt tacgacatgc gccaaaagat cgcgcaactg 660 ggccttaaat atccgtaa 678 <210> 196 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 196 Met Asn Thr Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Gly 1 5 10 15 Ala Val Ala Thr Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Tyr Pro 35 40 45 Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Thr Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ser Pro Thr Ser Ala Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Leu Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Arg 165 170 175 Arg Ala Leu Ala Glu Glu Val Ala Ala Ala Ala Glu Gln Arg Ala Gln 180 185 190 Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Pro 225 <210> 197 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 197 atgaataaac cggtggtaat ccggcaagtg gagcagccac cagcggacgc cgttgcagca 60 ttggagaagt atggcgtcac aaccgtgcat gaggtgcagg gacgctgtgg cctcctcgcg 120 cactacgtgc gtccgattta cgcaggagct gcaatcgcag gttccgctgt tactgtgtcg 180 ttgcctcccg gcgacaacct catgattcat gttgctgtcg aggtctgcgg tcctggaaat 240 attctggttg tttcacccac ctccccttgt acagacggct atttcggtga actgttggca 300 acgtctttgc gcgctcacgg agtgaagggg cttgtgatcg atgccggatg ccgcgacgtt 360 cgctcactga cggagatgaa attcccggtg tggagccggg ccatctgctc acaggggaca 420 gtcaaggcta cactcggatc ggtcaatgtg cccatcatgt gcgcgggcgc actcgtcgaa 480 gccggcgacg tcatcgtggc cgacgatgat ggagtggtgg ttgtgaagcg agcgatggcg 540 attgacgtcg ccgcggccgc cgagcaaagg gttcacaaag agaatacgac ccgcgaacgg 600 cttgcacgtg gagagcttgg gctcgatatt tacgagatgc gtcagaaaat cgtacaactg 660 ggccttaagt attcctga 678 <210> 198 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (197)...(200) <223> N-glycosylation site. Prosite id = PS00001 <400> 198 Met Asn Lys Pro Val Val Ile Arg Gln Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Thr Thr Val His Glu Val 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala His Tyr Val Arg Pro Ile Tyr Ala 35 40 45 Gly Ala Ala Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Cys Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Met Cys Ala Gly Ala Leu Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Met Ala Ile Asp Val Ala Ala Ala Ala Glu Gln Arg Val His 180 185 190 Lys Glu Asn Thr Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Glu Met Arg Gln Lys Ile Val Gln Leu Gly Leu Lys Tyr 210 215 220 Ser 225 <210> 199 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 199 atgaacaagc ccgtggtggt gcgggacatc gagcggccgc cggcggatgc catcgcggcg 60 ctcgaacggt acggtgtgtc cacggtgcac gaggcgcagg gccgttgcgg gctgctggcc 120 ccttacatgc gtccgatcta tgcgggcgca gcgatcgctg gtcccgccgt tacagtttca 180 cttccgccgg gagacaacct gatgatccac gtcgccgtcg aagtgtgccg tcccggagac 240 atcctggttg tcacgccgac ctcgccgtgc accgacggct attttggaga gttgctcgcg 300 acttcgctgg ctgcgcacgg ggtgaaagga ctggtcattg atgcgggatg ccgcgatgtt 360 cgagcgttga ccgagatgaa atttcccgtc tggagccgcg ccgtgagttc gcagggaacg 420 gtgaaggcta cacttgggtc ggtgaatgtg acgattgcat gcgcgggggc tacggttgag 480 cccggtgacg taatcgtagc ggacgatgat ggcgtcgttg tggtgaaacg ggctgaggcg 540 caagacgttg tcgccgcatc tgagcagaga gtgcgaaagg aagagggaac ccgtaaacgg 600 ctcgcgcagg gcgaactcgg cttggatatt tacggcttgc gcgcgaagat cgcggacctc 660 ggcctcaagt acttgtag 678 <210> 200 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (151)...(154) <223> N-glycosylation site. Prosite id = PS00001 <400> 200 Met Asn Lys Pro Val Val Val Arg Asp Ile Glu Arg Pro Pro Ala Asp 1 5 10 15 Ala Ile Ala Ala Leu Glu Arg Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Tyr Ala 35 40 45 Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp 65 70 75 80 Ile Leu Val Val Thr Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Ala Ala His Gly Val Lys Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Thr Ile Ala Cys Ala Gly Ala Thr Val Glu 145 150 155 160 Pro Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Glu Ala Gln Asp Val Val Ala Ala Ser Glu Gln Arg Val Arg 180 185 190 Lys Glu Glu Gly Thr Arg Lys Arg Leu Ala Gln Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Ala Lys Ile Ala Asp Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 201 <211> 633 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 201 atgagcaacg atttgcggcg cttcggcgtc tcgacgctgc acgaggcgca aggacggcgc 60 gggttgctcg cgtcatacat gcggccgatc tatccgggcg cgctggtcgc cggtccggcg 120 gtaaccgtcc tcgtgccgcc aggcgacaac ctggtgatcc acgtcgcggt ggaagcgtgc 180 gcgccgggcg acgtcctcgt cgtcgcgccg acgtcgccct gcacggacgg ctattttggc 240 gagctgctgg cgacgtcttt acgcgctcgg aacgtggcgg gcctggtgat cgacgccggc 300 tgccgggatg tccgtgcgct caccgagatg cggttcccgg tctggcgccg cgccatcagc 360 gcgcagggga cggtcaaggc gacgctcggc tctctgaaca cgccgatcgt ctgtgccgga 420 gcgctcgttg cccccggcga tgtcatcgtg gccgacgatg acggagtcgt cgtggtgaag 480 cgggaggaaa tcgcggcggt gacgcaggcg gcggagcagc gcgtccgcaa ggaagagggt 540 acgcgagcga ggctcgcaaa cggtgaactg ggtttggaca tctacggctt gcggcagaag 600 ctggcggacc tgggcctgaa gtcgtcatcg tga 633 <210> 202 <211> 210 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (6)...(158) <223> Demethylmenaquinone methyltransferase <400> 202 Met Ser Asn Asp Leu Arg Arg Phe Gly Val Ser Thr Leu His Glu Ala 1 5 10 15 Gln Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro 20 25 30 Gly Ala Leu Val Ala Gly Pro Ala Val Thr Val Leu Val Pro Pro Gly 35 40 45 Asp Asn Leu Val Ile His Val Ala Val Glu Ala Cys Ala Pro Gly Asp 50 55 60 Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 65 70 75 80 Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Asn Val Ala Gly Leu Val 85 90 95 Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Arg Phe 100 105 110 Pro Val Trp Arg Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr 115 120 125 Leu Gly Ser Leu Asn Thr Pro Ile Val Cys Ala Gly Ala Leu Val Ala 130 135 140 Pro Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 145 150 155 160 Arg Glu Glu Ile Ala Ala Val Thr Gln Ala Ala Glu Gln Arg Val Arg 165 170 175 Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Asn Gly Glu Leu Gly Leu 180 185 190 Asp Ile Tyr Gly Leu Arg Gln Lys Leu Ala Asp Leu Gly Leu Lys Ser 195 200 205 Ser Ser 210 <210> 203 <211> 699 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 203 atgaccggca ttgtcgtcga gaccatcgag cgcgcgtccc tcgccgacat cgccgcgctg 60 gccgagttcg gcgtcgccac catccacgag gcgcagggcc gcatcggtct cctcgcctcc 120 accatgcgcc cgatctacgc gggtgccgca gccgccggca atgccgtcac cgtgtcggtt 180 ccgcccggcg acaactggat gatccacgtg gccgtcgagc agtgccgcga gggcgacatc 240 ctggtggtgg cccccaccag cccgaacgac aacggctact tcggcgaact gctggcctgc 300 tcgctcaagt cgcgcggcgt gcgcggcctc atcatcgaag ccggctgccg cgacgtgaaa 360 ccgctcaccg agatgaagtt ccccgtctgg tcccgcgccg tctcctccca aggcaccgtc 420 aaggaaagcc tcggcgacgt gaatctgccg ctctcgatcg cgggccagct cgtcaacccc 480 ggcgatgtca tcgtcgccga tgacgacggc gtggtcgtgg tcgcccgcag cgatgtgcgc 540 tcagtcaccg ccaagtcgcg cgaacgcgaa gacaaggaag ccaaaaaccg ggtgcaactc 600 caggccggcc agctcggcat tgacatctat ggcatgcgcg acaagctcaa ggccaaaggc 660 ctgcgctacg tgaaaagcgc ggcggacctg aagggctaa 699 <210> 204 <211> 232 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (21)...(173) <223> Demethylmenaquinone methyltransferase <400> 204 Met Thr Gly Ile Val Val Glu Thr Ile Glu Arg Ala Ser Leu Ala Asp 1 5 10 15 Ile Ala Ala Leu Ala Glu Phe Gly Val Ala Thr Ile His Glu Ala Gln 20 25 30 Gly Arg Ile Gly Leu Leu Ala Ser Thr Met Arg Pro Ile Tyr Ala Gly 35 40 45 Ala Ala Ala Ala Gly Asn Ala Val Thr Val Ser Val Pro Pro Gly Asp 50 55 60 Asn Trp Met Ile His Val Ala Val Glu Gln Cys Arg Glu Gly Asp Ile 65 70 75 80 Leu Val Val Ala Pro Thr Ser Pro Asn Asp Asn Gly Tyr Phe Gly Glu 85 90 95 Leu Leu Ala Cys Ser Leu Lys Ser Arg Gly Val Arg Gly Leu Ile Ile 100 105 110 Glu Ala Gly Cys Arg Asp Val Lys Pro Leu Thr Glu Met Lys Phe Pro 115 120 125 Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Glu Ser Leu 130 135 140 Gly Asp Val Asn Leu Pro Leu Ser Ile Ala Gly Gln Leu Val Asn Pro 145 150 155 160 Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Ala Arg 165 170 175 Ser Asp Val Arg Ser Val Thr Ala Lys Ser Arg Glu Arg Glu Asp Lys 180 185 190 Glu Ala Lys Asn Arg Val Gln Leu Gln Ala Gly Gln Leu Gly Ile Asp 195 200 205 Ile Tyr Gly Met Arg Asp Lys Leu Lys Ala Lys Gly Leu Arg Tyr Val 210 215 220 Lys Ser Ala Ala Asp Leu Lys Gly 225 230 <210> 205 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 205 atgaacacac cggtggtagc aagacaagtg gagcagccac cagcggatgc aattgccgca 60 ttggagaagt gtggagtgac aaccgtccat gaggctcagg gacgttgtgg cctccttgcg 120 tcctacattc gcccgattta cccgggagca gccatcgcag gatccgctat cactgtgtct 180 ttgcctcctg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240 atcctggtag tttcaccgac gtcgccttgt acggacggct acttcggtga gttgttggca 300 acatctctcc gtgcccacgg agtgattggg cttgtgatcg atgccggatg ccgtgatgtg 360 cgctctctga cagaaatgaa attcccggtc tggagccgcg ccatctgttc gcaagggaca 420 gtcaaggcca cacttggatc ggtgaatgtg cccatcgtat gcgcgggtgc aatggtcgag 480 gctggtgatg tcatcgtcgc cgacgatgat ggcgttgtcg ttgtgaagcg agcgctggcg 540 caggagatcg ctgcggcggc ggaacaaagg gttcgcaaag agaatgtaac ccgcgaacga 600 ctcgcacgtg gagatctcgg acttgatatt tacgacatgc gccaaaagat cgcgcaactg 660 ggcctcaaat atctctga 678 <210> 206 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (28)...(174) <223> Demethylmenaquinone methyltransferase <400> 206 Met Asn Thr Pro Val Val Ala Arg Gln Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Ile Ala Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Ile Arg Pro Ile Tyr Pro 35 40 45 Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Ile Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Cys Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Met Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Leu Ala Gln Glu Ile Ala Ala Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Asp Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 207 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 207 atgaacaaac cggtggtgat ccggcaagtg gagcggccgc cggctgacgc ggtggcggcg 60 ctcgaaaccc atggcgtgtc caccgtgcat gaggcccagg ggcgttgcgg actgctcgct 120 tcctacatgc ggccgattta tcccggcgcc gcgattgccg ggtcggcggt cacggtgtcg 180 cttccgcccg gcgataatct catgattcat gttgccgtgg aggtctgcca atccggcgac 240 attctcgtgg ttgctcccac gtcgccttgt tcggacggtt acttcggtga actcctggca 300 acctccctgc gggcgcacgg cgtcaggggg ctcgttatcg atgcaggttg ccgcgacgtt 360 cgctcgctta ccgagatgaa gttccccgtc tggagccgcg ctgtcagttc gcaaggcacc 420 gtgaaatcca ctctcggatc ggtgaatgtg agcgtcgttt gcgccggagc acgcatcgaa 480 gccggcgatg tggtcgtcgc cgatgacgat ggcgtcgttg tggtggagcg agcacgcgcc 540 cacgaagtag tcgctgcgtg cgaacaacgc attcgcaagg aagaggcaac tcgcgagcgg 600 ctggcgcggg gagaactcgg actcgatatc tacggcttgc gcacaaaaat cgcggagatg 660 ggtctcaagt atcagtga 678 <210> 208 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (151)...(154) <223> N-glycosylation site. Prosite id = PS00001 <400> 208 Met Asn Lys Pro Val Val Ile Arg Gln Val Glu Arg Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Thr His Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro 35 40 45 Gly Ala Ala Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Ser Gly Asp 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ser Thr 130 135 140 Leu Gly Ser Val Asn Val Ser Val Val Cys Ala Gly Ala Arg Ile Glu 145 150 155 160 Ala Gly Asp Val Val Val Ala Asp Asp Asp Gly Val Val Val Val Glu 165 170 175 Arg Ala Arg Ala His Glu Val Val Ala Ala Cys Glu Gln Arg Ile Arg 180 185 190 Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Thr Lys Ile Ala Glu Met Gly Leu Lys Tyr 210 215 220 Gln 225 <210> 209 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 209 atgaatacac cagtggtagt ccgacaggtg cagcagccac cagccgaaac ggtggccgcg 60 ctggagaagt gtggggtgac aacggtgcat gaggctcagg gacgtgctgg cctgcttgcg 120 tcctacatgc gcccgatcta cccgggagca gcgatcgctg gttccgctat cacggtgtct 180 ttgcctcccg gcgacaacct catgatccac gttgcggtgg aggtctgcgg cccgggaaac 240 atcctggtag tttcaccaac ctcgccttct acggatggct acttcggtga gctgttggca 300 acatctctcc gtgcccacgg tgtgagaggg cttgtgatcg atgctggatg ccgtgatgtg 360 cgctctttaa cagaaatgaa attccccgtc tggagccgcg ccatcaattc gcaggggaca 420 gtcaagacca cacttggatc ggtgaatgtg cccatcgttt gcgcgggcgc actggtcgac 480 gctggagatg tcatcgtcgc ggatgacgat ggagttgtag ttgttaagca ggcgatggcg 540 cgagaggttg ccgcggcagc ggaacaaagg gttcgcaaag agaacctgac ccgcgaacga 600 cttgcgcgcg gagaacttgg tctcgacatt tacgagatac gacaaaagat cgcgcaacta 660 ggacttaagt atttgtaa 678 <210> 210 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 210 Met Asn Thr Pro Val Val Val Arg Gln Val Gln Gln Pro Pro Ala Glu 1 5 10 15 Thr Val Ala Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Ala Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro 35 40 45 Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ser Pro Thr Ser Pro Ser Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Asn Ser Gln Gly Thr Val Lys Thr Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Leu Val Asp 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Gln Ala Met Ala Arg Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Leu Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Glu Ile Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 211 <211> 702 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 211 gtgagcgccg tcatcaggaa cattccacgc tcgccgcccg agctcctcga tcgcttcaag 60 ggcctcggcg ttgcgaccgt ctcggaagcg cagggccgca agggcctttt ggccccgtat 120 atgcgcccga tctatccggg ggccgcgctg atcggcaatg cggtgacggc ctcggtcgcg 180 cccggcgaca attggacgat ccatgtcgcc gtcgaagtct gccaggaagg cgacgcgctc 240 gtcgtcgcgc ccacctcctt ctgcgaggac ggctatttcg gcgagctact cgccacgtct 300 ctgcagcagc gcggtgtgcg cgggctcatt ctcgaagcag gctgccgcga cgtgcgcgag 360 cttcaaagga tgaattttcc ggtttggtcg cgcgcaatct atgcgcaagg aactgtgaaa 420 gagacggtgg gcgacgtgaa cctgccgctc cgctgcgcag gccagatcgt caatgccggc 480 gatctcattg tcgccgacga cgacggcgtt tgcgtcgtgc cctatgccga tgtcgagaag 540 gtcttgaacg cggcccgcga acgtgcggcg aaggaagaga ggaaccgtgc cgagttcgcc 600 aagggcgtgc tcggcctcga cctctacaaa taccgcgagc gcctcgccgc caagggcctc 660 aaatatttcg acgacatcga ggcgtataag aaggcgaagt ga 702 <210> 212 <211> 233 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 212 Met Ser Ala Val Ile Arg Asn Ile Pro Arg Ser Pro Pro Glu Leu Leu 1 5 10 15 Asp Arg Phe Lys Gly Leu Gly Val Ala Thr Val Ser Glu Ala Gln Gly 20 25 30 Arg Lys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Tyr Pro Gly Ala 35 40 45 Ala Leu Ile Gly Asn Ala Val Thr Ala Ser Val Ala Pro Gly Asp Asn 50 55 60 Trp Thr Ile His Val Ala Val Glu Val Cys Gln Glu Gly Asp Ala Leu 65 70 75 80 Val Val Ala Pro Thr Ser Phe Cys Glu Asp Gly Tyr Phe Gly Glu Leu 85 90 95 Leu Ala Thr Ser Leu Gln Gln Arg Gly Val Arg Gly Leu Ile Leu Glu 100 105 110 Ala Gly Cys Arg Asp Val Arg Glu Leu Gln Arg Met Asn Phe Pro Val 115 120 125 Trp Ser Arg Ala Ile Tyr Ala Gln Gly Thr Val Lys Glu Thr Val Gly 130 135 140 Asp Val Asn Leu Pro Leu Arg Cys Ala Gly Gln Ile Val Asn Ala Gly 145 150 155 160 Asp Leu Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Pro Tyr Ala 165 170 175 Asp Val Glu Lys Val Leu Asn Ala Ala Arg Glu Arg Ala Ala Lys Glu 180 185 190 Glu Arg Asn Arg Ala Glu Phe Ala Lys Gly Val Leu Gly Leu Asp Leu 195 200 205 Tyr Lys Tyr Arg Glu Arg Leu Ala Ala Lys Gly Leu Lys Tyr Phe Asp 210 215 220 Asp Ile Glu Ala Tyr Lys Lys Ala Lys 225 230 <210> 213 <211> 690 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 213 atgagcgttg tcatcacgaa gattacgcgg ccggacccca aacatgtgga gatgctggct 60 gctttcggtg tcgccaccat tcatgaggcg cagggccgca ccggcctgat gcagtcctac 120 atgcgccccg tctatgccgg cgcccgtgcc gccggcacag ccgtcacggt ctcgctgccc 180 cccgccgaca actggatgat ccatgtcgcc gtggagcagt gccgggaagg cgacattctc 240 gtcgtcgcgc ccacttcgcc ctccgatgtc gggtatttcg gcgagctgct ggcgacctcg 300 ctcgtcgccc gcggcgtccg cggcctcgtc attgaaggcg gctgccgcga tgtcagggcg 360 ctgaccgaga tgcgcttccc ggtctggtcg cgcgccattt ccgcgcaggg caccgtcaag 420 gaaacgctcg gctcggtgaa cgtgccgatc gtttgcgccg gcgcgcatat ccatcccggc 480 gatttcattg ccgccgacga cgatggcgtt gtcgtggtgc gccgcagccg cgtcgccgag 540 atcgccgccg ccgcgatggc gcgcgaagac aaggaaacaa ccgtccgcga gcgcctgaaa 600 gccggagagc ttggcctcga catttacgga atgcgcccgc gtctcaagga aaagggcctc 660 gtctggcgcg agacgccgga gaaggagtag 690 <210> 214 <211> 229 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 214 Met Ser Val Val Ile Thr Lys Ile Thr Arg Pro Asp Pro Lys His Val 1 5 10 15 Glu Met Leu Ala Ala Phe Gly Val Ala Thr Ile His Glu Ala Gln Gly 20 25 30 Arg Thr Gly Leu Met Gln Ser Tyr Met Arg Pro Val Tyr Ala Gly Ala 35 40 45 Arg Ala Ala Gly Thr Ala Val Thr Val Ser Leu Pro Pro Ala Asp Asn 50 55 60 Trp Met Ile His Val Ala Val Glu Gln Cys Arg Glu Gly Asp Ile Leu 65 70 75 80 Val Val Ala Pro Thr Ser Pro Ser Asp Val Gly Tyr Phe Gly Glu Leu 85 90 95 Leu Ala Thr Ser Leu Val Ala Arg Gly Val Arg Gly Leu Val Ile Glu 100 105 110 Gly Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Arg Phe Pro Val 115 120 125 Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala His Ile His Pro Gly 145 150 155 160 Asp Phe Ile Ala Ala Asp Asp Asp Gly Val Val Val Val Arg Arg Ser 165 170 175 Arg Val Ala Glu Ile Ala Ala Ala Ala Met Ala Arg Glu Asp Lys Glu 180 185 190 Thr Thr Val Arg Glu Arg Leu Lys Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Gly Met Arg Pro Arg Leu Lys Glu Lys Gly Leu Val Trp Arg Glu 210 215 220 Thr Pro Glu Lys Glu 225 <210> 215 <211> 702 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 215 gtgagcgccg tcatcaggaa cattccacgc tcgccgctcg agctcctcga tcgcttcaag 60 ggcctcggcg ttgcgaccgt ctcggaagcg cagggccgca agggcctttt ggcctcgtat 120 atgcgcccga tctatccggg ggccgcgctg atcggcaatg cggtgacggc ctcggtcgcg 180 cccggcgaca attggacgat ccatgtcgcc gtcgaagtct gccaggaagg cgacgcgctc 240 gtcgtcgcgc ccacctcctt ctgcgaggac ggctatttcg gcgagctact cgccacgtct 300 ctgcagcagc gcggtgtgcg cgggctcatt ctcgaagcag gctgccgcga cgtgcgcgag 360 cttcaaagga tgaattttcc ggtttggtcg cgcgcaatct atgcgcaagg aactgtgaaa 420 gagacggtgg gcgacgtgaa cctgccgctc cgctgcgcag gccagatcgt caatgccggc 480 gatctcattg tcgccgacga cgacggcgtt tgcgtcgtgc cctatgccga tgtcgagaag 540 gtcttgaacg cggcccgcga acgtgcggcg aaggaagaga ggaaccgtgc cgagttcgcc 600 aagggcgtgc tcggcctcga cctctacaaa taccgcgagc gcctcgccgc caagggcctc 660 aaatatttcg acgacatcga ggcgtataag aaggcgaagt ga 702 <210> 216 <211> 233 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 216 Met Ser Ala Val Ile Arg Asn Ile Pro Arg Ser Pro Leu Glu Leu Leu 1 5 10 15 Asp Arg Phe Lys Gly Leu Gly Val Ala Thr Val Ser Glu Ala Gln Gly 20 25 30 Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro Gly Ala 35 40 45 Ala Leu Ile Gly Asn Ala Val Thr Ala Ser Val Ala Pro Gly Asp Asn 50 55 60 Trp Thr Ile His Val Ala Val Glu Val Cys Gln Glu Gly Asp Ala Leu 65 70 75 80 Val Val Ala Pro Thr Ser Phe Cys Glu Asp Gly Tyr Phe Gly Glu Leu 85 90 95 Leu Ala Thr Ser Leu Gln Gln Arg Gly Val Arg Gly Leu Ile Leu Glu 100 105 110 Ala Gly Cys Arg Asp Val Arg Glu Leu Gln Arg Met Asn Phe Pro Val 115 120 125 Trp Ser Arg Ala Ile Tyr Ala Gln Gly Thr Val Lys Glu Thr Val Gly 130 135 140 Asp Val Asn Leu Pro Leu Arg Cys Ala Gly Gln Ile Val Asn Ala Gly 145 150 155 160 Asp Leu Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Pro Tyr Ala 165 170 175 Asp Val Glu Lys Val Leu Asn Ala Ala Arg Glu Arg Ala Ala Lys Glu 180 185 190 Glu Arg Asn Arg Ala Glu Phe Ala Lys Gly Val Leu Gly Leu Asp Leu 195 200 205 Tyr Lys Tyr Arg Glu Arg Leu Ala Ala Lys Gly Leu Lys Tyr Phe Asp 210 215 220 Asp Ile Glu Ala Tyr Lys Lys Ala Lys 225 230 <210> 217 <211> 702 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 217 gtgagcgtgg tcatccgaaa cattccgcgc acgccgctcg cgctgctgga cagtttcaaa 60 gggttcggcg ttgcgacgat ctcggaggcg cagggccgca agggcctcat ggcttcttat 120 atgcgtccga tttatccggg agctgagctt gtcggcaatg cggtgacggc ctcggtcgcg 180 cccggcgaca attggacgat ccatgtcgcg atcgaagtct gccaggaagg tgatgtgctc 240 gtggtcgcgc ctgcctcgtt ttgcgaggat ggctatttcg gcgagcttct cgcgacttcg 300 cttcagcagc gcggcgtgcg cgggctcatt ctcgaagccg gctgccgcga cgtacgcgcg 360 cttcagaaga tgaattttcc ggtttggtcg cgcgcgattt tcgcacaagg aaccgtgaaa 420 gagacggtcg gcgacgtcaa cctgccgctc cactgcgcgg gccagatcgt gcatggcggc 480 gatctcatcg tcgccgatga tgacggcgtc tgcgtcgtgc cgcataccga tgtcgagaag 540 gtcttgagcg cggcgcgcga acgcgcggcg aaggaggagc gaaaccgcgc cgagtttgcc 600 aagggcgtgc tcggcctcga cctctacaaa taccgcgagc gcctcgctca aaagggcctc 660 aagtattacg acgacatcga agcctataac aaagcgaagt ga 702 <210> 218 <211> 233 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 218 Met Ser Val Val Ile Arg Asn Ile Pro Arg Thr Pro Leu Ala Leu Leu 1 5 10 15 Asp Ser Phe Lys Gly Phe Gly Val Ala Thr Ile Ser Glu Ala Gln Gly 20 25 30 Arg Lys Gly Leu Met Ala Ser Tyr Met Arg Pro Ile Tyr Pro Gly Ala 35 40 45 Glu Leu Val Gly Asn Ala Val Thr Ala Ser Val Ala Pro Gly Asp Asn 50 55 60 Trp Thr Ile His Val Ala Ile Glu Val Cys Gln Glu Gly Asp Val Leu 65 70 75 80 Val Val Ala Pro Ala Ser Phe Cys Glu Asp Gly Tyr Phe Gly Glu Leu 85 90 95 Leu Ala Thr Ser Leu Gln Gln Arg Gly Val Arg Gly Leu Ile Leu Glu 100 105 110 Ala Gly Cys Arg Asp Val Arg Ala Leu Gln Lys Met Asn Phe Pro Val 115 120 125 Trp Ser Arg Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Val Gly 130 135 140 Asp Val Asn Leu Pro Leu His Cys Ala Gly Gln Ile Val His Gly Gly 145 150 155 160 Asp Leu Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Pro His Thr 165 170 175 Asp Val Glu Lys Val Leu Ser Ala Ala Arg Glu Arg Ala Ala Lys Glu 180 185 190 Glu Arg Asn Arg Ala Glu Phe Ala Lys Gly Val Leu Gly Leu Asp Leu 195 200 205 Tyr Lys Tyr Arg Glu Arg Leu Ala Gln Lys Gly Leu Lys Tyr Tyr Asp 210 215 220 Asp Ile Glu Ala Tyr Asn Lys Ala Lys 225 230 <210> 219 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 219 atgagcgtgg tcgtgcagaa catcgaacgc gccgacgcgt catttgtggc aacgctcggc 60 gagtgcggcg tggcgaccgt gcacgaggcg caaggtcgaa ctggcttgat gcgcccttac 120 atgcgaccga tctacgccgg cgcccgcatc gccggaccgg cggtgacggt gtcgatcccg 180 cccggcgaca actggatgat ccacgtcgcg gtcgagcagt gccgcgaggg cgatatcctc 240 gtcgtggccc cgaccagccc gagcgaggac ggctatttcg gcgagttgct ggcgcgctcg 300 ctgctcgcgc gcggcgtgag gggtcttgtc atcgaggccg gcgtccgcga cgtacgcgat 360 ctcaccgaga tcaagttccc cgtatggtcc aaagcgatat cggcgcaagg cacggtgaag 420 gagacgatcg gctcggtgaa tgtgccggtc gtatgtgccg gcgccgccat caatcccggc 480 gatgtcatag tcgctgacga cgacggtgtc tgcgtcgtgt cacgcgaacg ggcggaagac 540 gtcgccaagg ccgcgcgcgc ccgcgaagcc aaggaagcgg aaacgcgcaa gcggctgata 600 tcaggcgagc tcggcctcga tatctacggc atgcgcgaga agctcgcggc gaaaggcctc 660 aaatatgcct ga 672 <210> 220 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 220 Met Ser Val Val Val Gln Asn Ile Glu Arg Ala Asp Ala Ser Phe Val 1 5 10 15 Ala Thr Leu Gly Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Ala Gly Ala 35 40 45 Arg Ile Ala Gly Pro Ala Val Thr Val Ser Ile Pro Pro Gly Asp Asn 50 55 60 Trp Met Ile His Val Ala Val Glu Gln Cys Arg Glu Gly Asp Ile Leu 65 70 75 80 Val Val Ala Pro Thr Ser Pro Ser Glu Asp Gly Tyr Phe Gly Glu Leu 85 90 95 Leu Ala Arg Ser Leu Leu Ala Arg Gly Val Arg Gly Leu Val Ile Glu 100 105 110 Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Ile Lys Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Ile Gly 130 135 140 Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Ala Ile Asn Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Ser Arg Glu 165 170 175 Arg Ala Glu Asp Val Ala Lys Ala Ala Arg Ala Arg Glu Ala Lys Glu 180 185 190 Ala Glu Thr Arg Lys Arg Leu Ile Ser Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Ala 210 215 220 <210> 221 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 221 atgagcgtgg tcgtgcagaa catcgaacgc gccgacgcgt cttttgtggc aacgctcggc 60 gagtgcggcg tggcgaccgt gcacgaggcg caaggtcgaa ccggcttgat gcgcccctac 120 atgcgaccga tctacgccgg cgcccgcatc gccgggccgg cggtgacggt gtcgatccca 180 cccggcgaca actggatgat ccacgtcgcg gtcgagcaat gccgcgacgg tgacatcctg 240 gtcgtcgcgc cgaccagccc gagcgaggac ggctatttcg gcgagttgct ggcgcgctcg 300 cttctcgcgc gtggcgtgag aggcctcgtc atcgaggccg gcgtccgcga cgtgcgcgac 360 cttaccgaaa tcggatttcc cgtctggtcg aaggcgatct ccgcacaagg caccgtcaag 420 gagacgctcg gcttggtgaa cgtgccggtt gtctgcgccg gcgctacggt caacccgggc 480 gatgtcatcg tcgcggacga cgacggtgtg tgcgtggtgc cacgcggcaa tgccgaagag 540 gtcgcgaagg ccgcccgcgc ccgcgaggca aaggaggcgg agacgagcaa gcggttgata 600 gcaggtgagc tcggcctcga catctacggc atgcgcgaga agctggcggc caagggcctc 660 aaatatgtct ga 672 <210> 222 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 222 Met Ser Val Val Val Gln Asn Ile Glu Arg Ala Asp Ala Ser Phe Val 1 5 10 15 Ala Thr Leu Gly Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Ala Gly Ala 35 40 45 Arg Ile Ala Gly Pro Ala Val Thr Val Ser Ile Pro Pro Gly Asp Asn 50 55 60 Trp Met Ile His Val Ala Val Glu Gln Cys Arg Asp Gly Asp Ile Leu 65 70 75 80 Val Val Ala Pro Thr Ser Pro Ser Glu Asp Gly Tyr Phe Gly Glu Leu 85 90 95 Leu Ala Arg Ser Leu Leu Ala Arg Gly Val Arg Gly Leu Val Ile Glu 100 105 110 Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Ile Gly Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140 Leu Val Asn Val Pro Val Val Cys Ala Gly Ala Thr Val Asn Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Pro Arg Gly 165 170 175 Asn Ala Glu Glu Val Ala Lys Ala Ala Arg Ala Arg Glu Ala Lys Glu 180 185 190 Ala Glu Thr Ser Lys Arg Leu Ile Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Val 210 215 220 <210> 223 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 223 atgaacgagc cgatcgtcgt tcggacgatc gcgcggccgt cggccgaggc gatcgcggcg 60 ctgcagcggt acggcgtgtc gactgtgcat gaagcgcaag gacgacgcgg actgctcggg 120 tctcgcttgc gaccgatcta cagcggcgcg gcgatcgccg gtccagcggt caccgtttcg 180 ctgccgcctg gtgacaacct catgattcac gtcgccgtcg aggtgtgcca gcctggcgac 240 gtgctcgtcg tggccccgac ctccccctgc acggacggct atttcggtga actgttggcc 300 acgtcgtttc gcgcacgcgg cgtcgtcggc ctgatcatcg atgccggctg ccgcgacgtg 360 cgcgcgttgt cggagatgcg ctttcccgtc tggagccgcg cgatcagcgc gcagggtacg 420 gtgaaggcct cgttgggttc ggtgaacgtt gccgtcgtgt gtgggggagc gtccgtcaat 480 ccaggcgatg cgatcgtggc cgacgatgat ggggtggtgg tcgtggcgcg caacgaggtg 540 gaagcggtgg tgcaggcgtc ggagcagcgc atccggaagg aacaggcgac gcgcgagcgg 600 ctggcgagcg gtgaactggg cctcgatatc tacggcctca ggaaaaaggt gtcggacctc 660 gggctgaaat attcgtga 678 <210> 224 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 224 Met Asn Glu Pro Ile Val Val Arg Thr Ile Ala Arg Pro Ser Ala Glu 1 5 10 15 Ala Ile Ala Ala Leu Gln Arg Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Arg Gly Leu Leu Gly Ser Arg Leu Arg Pro Ile Tyr Ser 35 40 45 Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Pro Gly Asp 65 70 75 80 Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Phe Arg Ala Arg Gly Val Val Gly Leu Ile 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Ser Glu Met Arg Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Ser 130 135 140 Leu Gly Ser Val Asn Val Ala Val Val Cys Gly Gly Ala Ser Val Asn 145 150 155 160 Pro Gly Asp Ala Ile Val Ala Asp Asp Asp Gly Val Val Val Val Ala 165 170 175 Arg Asn Glu Val Glu Ala Val Val Gln Ala Ser Glu Gln Arg Ile Arg 180 185 190 Lys Glu Gln Ala Thr Arg Glu Arg Leu Ala Ser Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Lys Lys Val Ser Asp Leu Gly Leu Lys Tyr 210 215 220 Ser 225 <210> 225 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 225 atgaacgttg tcgtccggaa tatcgagcgg gccgctgcgg atacgatcgc cgtgcttggc 60 gaatgcggcg tcgcgacggt gcacgaggca cagggccgca gcggcctcat gcgtccctat 120 atgcgaccga tctatacggg cgcgcgcatc gccggctcgg cggtcactgt gtcggtcccg 180 ccgggcgaca actggatgat ccatgtcgcg gtcgaacaat gccacgacgg cgacgtcctc 240 gtcgtggcgc cgaccagccc atgcgatgac ggctatttcg gcgagcttct ggcgcgctcg 300 ctgcgggcgc acggcgtgag aggcctcgtg atcgaggcag gcgtgcgcga cgtgcgcgat 360 ctcaccgaga tgcagttccc ggtctggtcg aaatcgatct ccgcgcaagg gacggtgaag 420 gagacgatcg gctcggtgaa cgtgccggtc gtctgcgcgg gtgccgccgt caatccgggc 480 gacgtcatcg tggccgacga cgatggcgtc tgcgttgtac cgcgaggcca ggcggcagtc 540 gttgccgagg cggcacgcgc gcgcgaggcg aaggaggccg aggtccgcaa gcgcctggtt 600 gccggggagc tcggtctcga catctacggc atgcgcgaac ggctggcggc gaagggcctg 660 aagtatgtct ga 672 <210> 226 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 226 Met Asn Val Val Val Arg Asn Ile Glu Arg Ala Ala Ala Asp Thr Ile 1 5 10 15 Ala Val Leu Gly Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Ser Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Thr Gly Ala 35 40 45 Arg Ile Ala Gly Ser Ala Val Thr Val Ser Val Pro Pro Gly Asp Asn 50 55 60 Trp Met Ile His Val Ala Val Glu Gln Cys His Asp Gly Asp Val Leu 65 70 75 80 Val Val Ala Pro Thr Ser Pro Cys Asp Asp Gly Tyr Phe Gly Glu Leu 85 90 95 Leu Ala Arg Ser Leu Arg Ala His Gly Val Arg Gly Leu Val Ile Glu 100 105 110 Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Met Gln Phe Pro Val 115 120 125 Trp Ser Lys Ser Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Ile Gly 130 135 140 Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Ala Val Asn Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Pro Arg Gly 165 170 175 Gln Ala Ala Val Val Ala Glu Ala Ala Arg Ala Arg Glu Ala Lys Glu 180 185 190 Ala Glu Val Arg Lys Arg Leu Val Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Gly Met Arg Glu Arg Leu Ala Ala Lys Gly Leu Lys Tyr Val 210 215 220 <210> 227 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 227 atgaacaagc ccgtggttgt gcggaacatc gagcgtccgc cggcggatgc tgtggccgcg 60 cttgagaaat acggcgtgtc gacggtgcac gaggcccagg gccggaacgg cctactggcc 120 tcctatatgc gcccgatcta tgcaggagcc gcgatcgctg gaccagccgt cacagtttcc 180 ctcccgccgg gagacaacct gatgattcac gtcgccgtcg aggtctgtcg gcctggggat 240 gtcctcgttg ttgcgccgac atcgccatgc accgacggct attttggaga gttgcttgca 300 acttcgctcg cggcgcatgg ggtgaaaggc ttagtcattg aggcgggatg tcgcgacgtc 360 cgagctctga cggaaatgaa gtttccagtc tggagccgcg ccgtcagctc gcaaggaacg 420 gtgaaggcaa cacttgggtc ggtaaatgta acgattgttt gtgcgggtgc tgcggttgca 480 cccggtgatg tgatcgtggc ggacgatgat ggcgtcgttg tcgtgaaacg gacagaggcg 540 caagaggtcg ttaccgcatc tgagcagaga ttgcgaaagg aagagggaac ccgcaagcgg 600 cttgcttcgg gggaactcgg cctggatatt tacggcctgc gaccgaagat tgcagacctc 660 ggtctcaagt acttgtag 678 <210> 228 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (151)...(154) <223> N-glycosylation site. Prosite id = PS00001 <400> 228 Met Asn Lys Pro Val Val Val Arg Asn Ile Glu Arg Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Asn Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala 35 40 45 Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp 65 70 75 80 Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Ala Ala His Gly Val Lys Gly Leu Val 100 105 110 Ile Glu Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Thr Ile Val Cys Ala Gly Ala Ala Val Ala 145 150 155 160 Pro Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Thr Glu Ala Gln Glu Val Val Thr Ala Ser Glu Gln Arg Leu Arg 180 185 190 Lys Glu Glu Gly Thr Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Pro Lys Ile Ala Asp Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 229 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 229 atgaacaagc ccgtggttgt gcggaacatc gagcgtccgc cggcggatgc tgtggccgcg 60 cttgagaaat acggcgtgtc gacggtgcac gaggcccagg gccggaacgg cctactggcc 120 tcctatatgc gcccgatcta tgcaggagcc gcgatcgctg gaccagccgt cacagtttcc 180 ctcccgccgg gagacaacct gatgattcac gtcgccgtcg aggtctgtcg gcctggggat 240 gtcctcgttg ttgcgccgac atcgccatgc accgacggct attttggaga gttgcttgca 300 acttcgctcg cggcgcatgg ggtgaaaggc ttagtcattg aggcgggatg tcgcgacgtc 360 cgagctctga cggaaatgaa gtttccagtc tggagccgcg ccgtcagctc gcaaggaacg 420 gtgaaggcaa cacttgggtc ggtaaatgta acgattgttt gtgcgggtgc tgcggttgca 480 cccggtgatg tgatcgtggc ggacgatgat ggcgtcgttg tcgtgaaacg gacagaggcg 540 caagaggccg ttaccgcatc tgagcagaga ttgcgaaagg aagagggaac ccgcaagcgg 600 cttgcttcgg gggaactcgg cctggatatt tacggcctgc gaccgaagat tgcagacctc 660 ggtctcaagt acttgtag 678 <210> 230 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (151)...(154) <223> N-glycosylation site. Prosite id = PS00001 <400> 230 Met Asn Lys Pro Val Val Val Arg Asn Ile Glu Arg Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Asn Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala 35 40 45 Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp 65 70 75 80 Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Ala Ala His Gly Val Lys Gly Leu Val 100 105 110 Ile Glu Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Thr Ile Val Cys Ala Gly Ala Ala Val Ala 145 150 155 160 Pro Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Thr Glu Ala Gln Glu Ala Val Thr Ala Ser Glu Gln Arg Leu Arg 180 185 190 Lys Glu Glu Gly Thr Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Pro Lys Ile Ala Asp Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 231 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 231 atgaatgaac cggtggtaat ccggcaggtg gagcagccac cagcagacgc agttgccgca 60 ttggagaaat gtggcgtgac aaccgtccat gaagctcaag gacgttgtgg cctgcttgcg 120 cactacatgc gtcccatttt cccgggagca accatcgcgg gttccgccgt caccgtgtct 180 ctgcctcccg gtgacaacct catgatccac gttgcggtcg aagtctgcag gccgggaaac 240 atcctggtcg tttcaccgac atcgccgtgc tcggatggct acttcggcga gctattggca 300 acttctctgc gtgctcacgg tgtaagaggg cttgtgatcg acgccggatg cagggacgtc 360 cgctcgctga ctgagatgaa atttcccgtc tggagccgcg ccatcagttc gcagggtacc 420 gtcaaagcca cgctcggatc ggtgaatgtg ccgatcacgt gcgcgggcgc gttagtcgac 480 gcaggtgatg tcattgtcgc tgacgatgat ggagttgtgg ttgtgaagcg cgcgcaggcg 540 caagaggtcg ctgccgcggc ggagcaaagg gttcgcaaag agaacgcgac ccgcgaacga 600 cttgcacgtg gagagctagg actcgatatt tacgacatgc gccagaagat cgcgcaactg 660 ggccttaagt atcggtga 678 <210> 232 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 232 Met Asn Glu Pro Val Val Ile Arg Gln Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro Ile Phe Pro 35 40 45 Gly Ala Thr Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ser Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Thr Cys Ala Gly Ala Leu Val Asp 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Gln Ala Gln Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Arg 225 <210> 233 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 233 atgaacaaac cggtggtgat ccggcaagtg gagcggccgc cggctgacgc ggtggcggcg 60 ctcgaaacct atggcgtgtc caccgtgcac gaggcccagg ggcgttgcgg gctgctcgct 120 tcctacatgc ggccgattta tggcggcgcc ctgattgccg ggtcggcggt cacggtgtca 180 cttccgcccg gcgataatct gatgattcac gttgccgtgg aggtctgcca atccggcgac 240 attctcgtgg ttgctcccac gtcgccttgt tcggacggtt acttcggtga acttctggca 300 acctccctgc gggcacacgg cgtcaagggg ctcgtgattg atgcgggttg ccgcgacgtt 360 cggtcgctta ccgaaatgaa gttccccgtc tggagccgcg ctgtcagttc gcaaggaacc 420 gtgaaatcga ctctcggatc ggtgaatgta agcgtcgttt gcgccggagc acgcatcgaa 480 gccggcgatg tggtcgtcgc ggatgacgat ggcgtcgtgg tggtggcgcg ggcacgcgcc 540 cacgaagtag tcgcggcgtg cgaacaacgc attcgcaagg aagaggcaac ccgcgaacgg 600 ctggcgcggg gagaactcgg actcgatatc tacggcttgc gcacaaaaat cgcggagatg 660 ggtctcgagt atcaatga 678 <210> 234 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (151)...(154) <223> N-glycosylation site. Prosite id = PS00001 <400> 234 Met Asn Lys Pro Val Val Ile Arg Gln Val Glu Arg Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Thr Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Gly 35 40 45 Gly Ala Leu Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Ser Gly Asp 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ser Thr 130 135 140 Leu Gly Ser Val Asn Val Ser Val Val Cys Ala Gly Ala Arg Ile Glu 145 150 155 160 Ala Gly Asp Val Val Val Ala Asp Asp Asp Gly Val Val Val Val Ala 165 170 175 Arg Ala Arg Ala His Glu Val Val Ala Ala Cys Glu Gln Arg Ile Arg 180 185 190 Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Thr Lys Ile Ala Glu Met Gly Leu Glu Tyr 210 215 220 Gln 225 <210> 235 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 235 atgaatgaac cggtggtaat ccggcaggtg gagcagccac cagcagacgc agttgccgca 60 ttggagaaat gtggcgtgac aaccgtccat gaagctcaag gacgttgtgg cctgcttgcg 120 cactacatgc gtcccatttt cccgggagca accatcgcgg gttccgccgt caccgtgtct 180 ctgcctcccg gtgacaacct catgatccac gttgcggtcg aagtctgcag gccgggaaac 240 atcctggtcg tttcaccgac atcgccgtgc tcggatggct acttcggcga gctattggca 300 acttctctgc atgctcacgg tgtaagaggg cttgtgatcg acgccggatg cagggacgtc 360 cgctcgctga ctgagatgaa atttcccgtc tggagccgcg ccatcagttc gcagggtacc 420 gtcaaagcca cgctcggatc ggtgaatgtg ccgatcacgt gcgcgggcgc gttagtcgac 480 gcaggtgata tcattgtcgc tgacgatgat ggagttgtgg ttgtgaagcg cgcgcaggcg 540 caagaggtcg ctgccgcggc ggagcaaagg gttcgcaaag agaacgcgac ccgcgaacga 600 cttgcacgtg gagagctagg actcgatatt tacgacatgc gccagaagat cgcacaactg 660 ggccttaagt atcggtga 678 <210> 236 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 236 Met Asn Glu Pro Val Val Ile Arg Gln Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro Ile Phe Pro 35 40 45 Gly Ala Thr Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ser Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu His Ala His Gly Val Arg Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Thr Cys Ala Gly Ala Leu Val Asp 145 150 155 160 Ala Gly Asp Ile Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Gln Ala Gln Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Arg 225 <210> 237 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 237 atgaacaagc ccgtggtggt ccggcacgtg gagcagccac ctgctgatgc ggtagccgct 60 ttggaaaagt atggcgtgtc aaccgttcat gaggcccagg gacggtcggg tcttctcgcc 120 agttacctgc ggccgatctt tgccggcgcc tcaatcgcag ggccggcggt tacggtctcg 180 ctgccacctg gggacaattt gatgatccac gtcgccgtcg aggtgtgcac gcctggaagc 240 atccttgtcg tcgccccaac ctccccttgt acggacggct atttcggaga gctgctggcg 300 acctcgcttc gcgcacacgg cgtaaagggg ttggtcatcg atgccgggtg tcgcgacgtt 360 aggtctttaa cggaaatgaa ctttcccgtt tggagccgct cggtcagttc gcaaggaacc 420 gtcaaagcga cgttgggatc ggtgaatgta ggcgtcgtct gcgccggtgc atacgtcgag 480 ccaggcgacg tgatcgtcgc ggacgatgac ggagttgtag tcgtgaagcg ggcggctgcg 540 cccgaggctg tcgtcgcctc cgaagcgaga gttcgtaaag aagccgcgac gcgcgagcgt 600 ctctcccgcg gagagcttgg ccttgacatc tacggcctac gttcaaagat tgcggacctt 660 ggcctcgagt atctgtga 678 <210> 238 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 238 Met Asn Lys Pro Val Val Val Arg His Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Ser Gly Leu Leu Ala Ser Tyr Leu Arg Pro Ile Phe Ala 35 40 45 Gly Ala Ser Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Thr Pro Gly Ser 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Asn Phe 115 120 125 Pro Val Trp Ser Arg Ser Val Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Gly Val Val Cys Ala Gly Ala Tyr Val Glu 145 150 155 160 Pro Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Ala Ala Pro Glu Ala Val Val Ala Ser Glu Ala Arg Val Arg 180 185 190 Lys Glu Ala Ala Thr Arg Glu Arg Leu Ser Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Ser Lys Ile Ala Asp Leu Gly Leu Glu Tyr 210 215 220 Leu 225 <210> 239 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 239 atgaacaaac cggtggtgat ccggcaagcg gagcggccgc cggctgacgc ggtggcggcg 60 ctcgcaacct atggcgtgtc caccgtgcat gaggcccagg ggcgttgcgg actgctcgct 120 tcctacatgc ggccgattta tcacggcacc gcgattgccg ggtcggcggt cacggtgtcc 180 cttccgcccg gcgacaatct gatgattcac gttgccgtgg aggtctgcca atccggcgac 240 attctcgtgg tcgctcccac gtcgccctgt tccgacggtt acttcggcga actcctggcc 300 acctctctgc gggcgcacgg cgtcaagggg ctcgttattg atgcgggttg ccgcgacgtt 360 cgctcgctca gcgcaatgaa gttccccgtc tggagccgcg ctgtcagttc gcaaggcacc 420 gtgaaatcta ctctcggatc ggtgaatgtg agcgtcgttt gcgccggagc acgcatcgaa 480 gccggcgacg tggtcgtcgc ggatgacgat ggcgtcgtgg tggtggagcg agcatccgcc 540 cacgaagtag tcgtggcgtg cgaacaacgc cttcgcaagg aagaggcaac tcgcgagcgc 600 ctggcgcggg gagaactcgg actcgacatc tacggcttgc gcacaaaagt cgcggagatg 660 ggtctcaagt atcaatga 678 <210> 240 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (151)...(154) <223> N-glycosylation site. Prosite id = PS00001 <400> 240 Met Asn Lys Pro Val Val Ile Arg Gln Ala Glu Arg Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Ala Thr Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr His 35 40 45 Gly Thr Ala Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Ser Gly Asp 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Ser Ala Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ser Thr 130 135 140 Leu Gly Ser Val Asn Val Ser Val Val Cys Ala Gly Ala Arg Ile Glu 145 150 155 160 Ala Gly Asp Val Val Val Ala Asp Asp Asp Gly Val Val Val Val Glu 165 170 175 Arg Ala Ser Ala His Glu Val Val Val Ala Cys Glu Gln Arg Leu Arg 180 185 190 Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Thr Lys Val Ala Glu Met Gly Leu Lys Tyr 210 215 220 Gln 225 <210> 241 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 241 atgaacaaac cggtggtgat ccggcaagtg gagcggccgc cggctgacgc ggtggcggcg 60 ctcgcaacct atggcgtgtc caccgtgcat gaggcccagg ggcgttgcgg actgctcgct 120 tcctacatgc ggccgattta tcccggcacc gcgattgccg ggtcggcggt cacggtgtcc 180 cttccgcccg gcgacaatct gatgattcac gttgccgtgg aggtctgcca atccggcgac 240 attctcgtgg tcgctcccac gtcgccttgt tcggacggtt acttcggcga actcctggcc 300 acctctctgc gggcgcacga cgtcaagggg ctcgttattg atgcgggttg ccgcgacgtt 360 cgctcgctca gcgcaatgaa gttccccgtc tggagccgcg ctgtcagttc gcaaagcacc 420 gtgaaatcta ctctcggatc ggtgaatgtg agcgtcgttt gcgccggagc acgcatcgaa 480 gccggcgacg tggtcgtcgc ggatgacgat ggcgtcgtgg tggtggagcg agcatccgcc 540 cacgaagtag tcgcggcgtg cgaacaacgc cttcgcaagg aagaggcaac tcgcgagcgc 600 ctggcgcggg gagaactcgg actcgacatc tacggcttgc gcacaaaagt cgcggagatg 660 ggtctcaagt atcaatga 678 <210> 242 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (151)...(154) <223> N-glycosylation site. Prosite id = PS00001 <400> 242 Met Asn Lys Pro Val Val Ile Arg Gln Val Glu Arg Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Ala Thr Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro 35 40 45 Gly Thr Ala Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Ser Gly Asp 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Asp Val Lys Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Ser Ala Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Ser Thr Val Lys Ser Thr 130 135 140 Leu Gly Ser Val Asn Val Ser Val Val Cys Ala Gly Ala Arg Ile Glu 145 150 155 160 Ala Gly Asp Val Val Val Ala Asp Asp Asp Gly Val Val Val Val Glu 165 170 175 Arg Ala Ser Ala His Glu Val Val Ala Ala Cys Glu Gln Arg Leu Arg 180 185 190 Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Thr Lys Val Ala Glu Met Gly Leu Lys Tyr 210 215 220 Gln 225 <210> 243 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 243 atgaacagac ctgtggttgt ccgggaggtg gagcggccgc cggcagatgc tgtgacagcg 60 ctcgagcagt acggggtatc gacggtgcat gaagctcaag ggcgttgcgg gttactcgca 120 tcgtatatgc ggccgattta tgccggagcg gccatcgctg gtcccgccgt gactgtttct 180 ctacctccgg gagacaactt gatgattcac gtggcggtcg aggtctgccg tccgggagac 240 atcctcgttg tggcgccgac gtcgccgtgt acggatggct attttggaga gctgcttgca 300 acttcactcc gagcacatgg cgtgaaagga cttgtgatcg atgcgggatg tcgcgatgtt 360 cgctcgctga ctgagatgaa gtttcccgtg tggagtcgcg cggtgagttc gcagggaacg 420 gtgaaggcga cgctcggatc agtaaatgtg agtatcgtgt gcgccggcgc actcgtcgaa 480 gccggcgatg tcatcatcgc ggatgacgat ggagccgtag ttgtgaggag gacagccgcg 540 aaagacgtgg tcgcggcgtc tgaacagaga gtgcgaaaag aagaggcgac gcgaaggcgg 600 cttgcgcaag gcgaactcgg tctggacatc tacgggttgc gcgcgaaaat cgcggacctc 660 ggtctcaagt acctgtaa 678 <210> 244 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (151)...(154) <223> N-glycosylation site. Prosite id = PS00001 <400> 244 Met Asn Arg Pro Val Val Val Arg Glu Val Glu Arg Pro Pro Ala Asp 1 5 10 15 Ala Val Thr Ala Leu Glu Gln Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala 35 40 45 Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Ser Ile Val Cys Ala Gly Ala Leu Val Glu 145 150 155 160 Ala Gly Asp Val Ile Ile Ala Asp Asp Asp Gly Ala Val Val Val Arg 165 170 175 Arg Thr Ala Ala Lys Asp Val Val Ala Ala Ser Glu Gln Arg Val Arg 180 185 190 Lys Glu Glu Ala Thr Arg Arg Arg Leu Ala Gln Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Ala Lys Ile Ala Asp Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 245 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 245 atgaacaagt ccgtggtggt tcgcaacgtc gagcagcctc ctgccgatgc catggccgcg 60 ctcgaaaaat atggcgtttc caccgttcac gaagcgcaag gccgctgcgg cttgctcgcc 120 tcttacatgc gcccaatttt cgggggtgcc tccgtcgccg gccccgcggt caccgtctcc 180 gtgccgcccg gcgacaacct catgattcac gtcgctgtag aagtctgccg cccgggagac 240 attctcgtcg tagcccccac atcgcgctgc accgacggct acttcggcga actactagcc 300 acttcgttgc gcgcccacgg cgtcaaaggc ctcgtcatcg atgccggttg ccgcgacgtc 360 cgctccttga ccgaaatgaa atttcccgtc tggagccgcg ccatcagttc gcaaggcacc 420 gtcaaatcca ctgtgggctc ggtaaacgtc cccgtcgtgt gtgcgggcgc actcatcgca 480 cccggcgacg tcatggtcgc ggatgacgat ggcgttgtcg tcgtgcagcg cgccgccgcc 540 cgcgacgtcg tcgccgcctc ggaacaaagg attcgcaagg aagaagccac acgtgagcgt 600 ctggtgcgcg gtgaactcag cctcgatatc tacggcctgc gcgcaaaact caccgaattg 660 ggtctcacgt acttgtag 678 <210> 246 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (2)...(5) <223> N-glycosylation site. Prosite id = PS00001 <400> 246 Met Asn Lys Ser Val Val Val Arg Asn Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Met Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Phe Gly 35 40 45 Gly Ala Ser Val Ala Gly Pro Ala Val Thr Val Ser Val Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Arg Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ser Thr 130 135 140 Val Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Ile Ala 145 150 155 160 Pro Gly Asp Val Met Val Ala Asp Asp Asp Gly Val Val Val Val Gln 165 170 175 Arg Ala Ala Ala Arg Asp Val Val Ala Ala Ser Glu Gln Arg Ile Arg 180 185 190 Lys Glu Glu Ala Thr Arg Glu Arg Leu Val Arg Gly Glu Leu Ser Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Ala Lys Leu Thr Glu Leu Gly Leu Thr Tyr 210 215 220 Leu 225 <210> 247 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 247 gtgacgggtc cgatcgtcgt tcgcaccatc gacagaccga tggccgatgt cgtcgccgcg 60 ctgcagcgcc atggcgtctc gacggttcac gaagcacaag ggcgacgggg actgctcgcg 120 tcctgcgtgc ggccgatcta tgtgggcgcc gtgattgcgg gtcctgccgt caccgtctcg 180 ctgccacctg gcgacaacct gatgattcac gtcgcggtgg agatgtgtca gcccggcgat 240 gtcctcgtcg tcgccccgac ctctccgtgc accgacggct atttcggcga actgctggcg 300 acctcattgc acgcccgcgg cgtcacggga ctcatcatcg atgccggctg ccgggacgtt 360 cgcgccttga cggacatgcg atttccggtt tggagccgcg cgatcagcgc gcagggcacc 420 gtcaagtcaa cgctcggatc agtgaacgtg ccggtggtgt gcgccggagc gttggtccac 480 gcgggcgacg ccatcgtggc ggatgacgat ggcgtggtgg tggtgagacg ggaagaggcg 540 gggaccgtgt cggaggcgtg cgcggagcgg gcgcgcaagg aagaggccac gagggaacgg 600 ctcgcgcgag gcgagcttgg tctcgatatc tacggcctgc gaaaaaaact caccgacctc 660 ggcctgaagt attcgtag 678 <210> 248 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 248 Met Thr Gly Pro Ile Val Val Arg Thr Ile Asp Arg Pro Met Ala Asp 1 5 10 15 Val Val Ala Ala Leu Gln Arg His Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Arg Gly Leu Leu Ala Ser Cys Val Arg Pro Ile Tyr Val 35 40 45 Gly Ala Val Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Met Cys Gln Pro Gly Asp 65 70 75 80 Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu His Ala Arg Gly Val Thr Gly Leu Ile 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Asp Met Arg Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ser Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val His 145 150 155 160 Ala Gly Asp Ala Ile Val Ala Asp Asp Asp Gly Val Val Val Val Arg 165 170 175 Arg Glu Glu Ala Gly Thr Val Ser Glu Ala Cys Ala Glu Arg Ala Arg 180 185 190 Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Lys Lys Leu Thr Asp Leu Gly Leu Lys Tyr 210 215 220 Ser 225 <210> 249 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 249 atgaacaagt ccgtggtggt tcgcaacgtc gagcagcctc ctgccgatgc catggccgcg 60 ctcgaaaaat atggcgtttc caccgttcac gaagcgcaag gccgctgcgg cttgctcgcc 120 tcttacatgc gcccaatttt cgggggtgcc tccgtcgccg gccccgcggt caccgtctcc 180 gtgccgcccg gcgacaacct catgattcac gtcgctgtag aagtctgccg cccgggagac 240 attctcgtcg tagcccccac atcgccctgc accgacggct acttcggcga actactagcc 300 acttcgttgc gcgcccacgg cgtcaaaggc ctcgtcatcg atgccggttg ccgcgacgtc 360 cgctccttga ccgaaatgaa atttcccgtc tggagccgcg ccatcagttc gcaaggcacc 420 gtcaaatcca ctgtgggctc ggtaaacgtc cccgtcgtgt gtgcgggcgc actcatcgca 480 cccggcgacg tcatggtcgc ggatgacgat ggcgttgtcg tcgtgcagcg cgccgccgcc 540 cgcgacgtcg tcgccgcctc ggaacaaagg attcgcaagg aagaagccac acgtgagcgt 600 ctggtgcgcg gtgaactcgg cctcgatatc tacggcctgc gcgcaaaact caccgaattg 660 ggtgtcacgt acttgtag 678 <210> 250 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (2)...(5) <223> N-glycosylation site. Prosite id = PS00001 <400> 250 Met Asn Lys Ser Val Val Val Arg Asn Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Met Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Phe Gly 35 40 45 Gly Ala Ser Val Ala Gly Pro Ala Val Thr Val Ser Val Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ser Thr 130 135 140 Val Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Ile Ala 145 150 155 160 Pro Gly Asp Val Met Val Ala Asp Asp Asp Gly Val Val Val Val Gln 165 170 175 Arg Ala Ala Ala Arg Asp Val Val Ala Ala Ser Glu Gln Arg Ile Arg 180 185 190 Lys Glu Glu Ala Thr Arg Glu Arg Leu Val Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Ala Lys Leu Thr Glu Leu Gly Val Thr Tyr 210 215 220 Leu 225 <210> 251 <211> 693 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 251 atgaacaagc cggcattcgt tcgccccgta gttgttcgca atgtcgagca accttctgcc 60 gacgcggtag ccgcgctcga aaaatatggc gtctcgaccg ttcatgaagc gcagggccgc 120 tgtggcttgc tcgcttcctg tatccgcccg attttcgcgg gcgccgccgt cgccggtccc 180 gtggtcaccg tttccgtgcc gccaggggac aacctgatga ttcacgtcgc agtggaagtc 240 tgccgcccgg gagatatcct cgtcgtagcc ccaacgtctc cttgcaccga cggctacttc 300 ggcgaactat tggccacttc gcttcgcgcg cacggcgtca agggcttgat tattgacgcc 360 ggctgccgtg acgtccgcgc cctcaccgaa atgaaatttc ccgtctggag ccgcgccgtc 420 agttcgcaag gcactgtcaa atccacgtta ggctcggtga atgtttcagt cgtctgtgcc 480 ggcgcactgg tcgcacccgg cgacgtcatc gtcgccgatg acgacggagt ggtcgtcgtc 540 cagcgcgctg ccgcccgcga ggtagtcgcc gccgcagaac aaaggattcg caaggaagaa 600 gccactcgcg aacgcctcgc gcgcggtgaa ctcggtctcg atatctacag cctgcgcgca 660 aaactcaccg aactcggcct cacctacttg tga 693 <210> 252 <211> 230 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (27)...(179) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (156)...(159) <223> N-glycosylation site. Prosite id = PS00001 <400> 252 Met Asn Lys Pro Ala Phe Val Arg Pro Val Val Val Arg Asn Val Glu 1 5 10 15 Gln Pro Ser Ala Asp Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser 20 25 30 Thr Val His Glu Ala Gln Gly Arg Cys Gly Leu Leu Ala Ser Cys Ile 35 40 45 Arg Pro Ile Phe Ala Gly Ala Ala Val Ala Gly Pro Val Val Thr Val 50 55 60 Ser Val Pro Pro Gly Asp Asn Leu Met Ile His Val Ala Val Glu Val 65 70 75 80 Cys Arg Pro Gly Asp Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr 85 90 95 Asp Gly Tyr Phe Gly Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly 100 105 110 Val Lys Gly Leu Ile Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu 115 120 125 Thr Glu Met Lys Phe Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly 130 135 140 Thr Val Lys Ser Thr Leu Gly Ser Val Asn Val Ser Val Val Cys Ala 145 150 155 160 Gly Ala Leu Val Ala Pro Gly Asp Val Ile Val Ala Asp Asp Asp Gly 165 170 175 Val Val Val Val Gln Arg Ala Ala Ala Arg Glu Val Val Ala Ala Ala 180 185 190 Glu Gln Arg Ile Arg Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg 195 200 205 Gly Glu Leu Gly Leu Asp Ile Tyr Ser Leu Arg Ala Lys Leu Thr Glu 210 215 220 Leu Gly Leu Thr Tyr Leu 225 230 <210> 253 <211> 702 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 253 atgagcggta tcgtcgtcca ggacttcgag cgcgcatcgc tcgccgacat caaggcgctc 60 gccgagttcg gcgtcgccac gatccacgag gcgcagggcc gcgttggcct gctcgcgtcg 120 tacatgcgcc cgatttatgc gggagctgca gccgccggca atgccgtcac cgtgtcggtg 180 ccgccgggcg acaactggat gatccacgtg gcggtggagg tgtgccgcga gggcgacatc 240 ctcgtggtgg cgccgacctc gccaaacgac aacggctact tcggcgagct gctggcgtct 300 tcactgaaga gccgcggtgt gcgtgggctc gtcatcgagg ccggatgccg cgacgtgaag 360 cccctcaccg acatgaaatt cccggtgtgg tcgcgcgccg tgtccgcgca agggacagtc 420 aaggagagcc tcggcgatgt gaacctcccg cttgtcattg ccgggcagac ggtgaacccc 480 ggcgacgtga tcgtggctga cgacgacggc gttgtcatcg ttggccgcag cgaggtgcgc 540 gccgtgacga ccaaatcgcg cgagcgcgag gagaaggagg ccaagaaccg cttgcagctc 600 accagcggcc agctcggcat cgacatctat ggtatgcgcg gcaagctcaa ggaaaagggg 660 ctgcgctacg tgaagaacgc gagcgagttg aaggccaaat aa 702 <210> 254 <211> 233 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (21)...(173) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (229)...(232) <223> N-glycosylation site. Prosite id = PS00001 <400> 254 Met Ser Gly Ile Val Val Gln Asp Phe Glu Arg Ala Ser Leu Ala Asp 1 5 10 15 Ile Lys Ala Leu Ala Glu Phe Gly Val Ala Thr Ile His Glu Ala Gln 20 25 30 Gly Arg Val Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala Gly 35 40 45 Ala Ala Ala Ala Gly Asn Ala Val Thr Val Ser Val Pro Pro Gly Asp 50 55 60 Asn Trp Met Ile His Val Ala Val Glu Val Cys Arg Glu Gly Asp Ile 65 70 75 80 Leu Val Val Ala Pro Thr Ser Pro Asn Asp Asn Gly Tyr Phe Gly Glu 85 90 95 Leu Leu Ala Ser Ser Leu Lys Ser Arg Gly Val Arg Gly Leu Val Ile 100 105 110 Glu Ala Gly Cys Arg Asp Val Lys Pro Leu Thr Asp Met Lys Phe Pro 115 120 125 Val Trp Ser Arg Ala Val Ser Ala Gln Gly Thr Val Lys Glu Ser Leu 130 135 140 Gly Asp Val Asn Leu Pro Leu Val Ile Ala Gly Gln Thr Val Asn Pro 145 150 155 160 Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Ile Val Gly Arg 165 170 175 Ser Glu Val Arg Ala Val Thr Thr Lys Ser Arg Glu Arg Glu Glu Lys 180 185 190 Glu Ala Lys Asn Arg Leu Gln Leu Thr Ser Gly Gln Leu Gly Ile Asp 195 200 205 Ile Tyr Gly Met Arg Gly Lys Leu Lys Glu Lys Gly Leu Arg Tyr Val 210 215 220 Lys Asn Ala Ser Glu Leu Lys Ala Lys 225 230 <210> 255 <211> 681 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 255 atgaacgatc cgatcgtcgt tcgacagatc gacagaccat caggcccttc ggtcgatagt 60 ctgcgtcgct ttggcgtctc gaccgtgcac gaggcacagg ggcgccgcgg gctgctcgcg 120 tcgcacatgc ggccgattta cgccggtgcg ctcgtcgctg gtccagcgat cactgtcctg 180 gtgccgccgg gcgacaacct gatgattcac gtcgcggtgg aggtgtgcca gccgggtgac 240 gttctcgttg ttgctccgac gtcgccgtgc accgacggct atttcggcga gctgctggcg 300 acctcgctgc gggctcgtgg cgtggcggga ctcatcatcg acgccggttg ccgggatgtt 360 cgggcgctga gcgagatgcg atttcccgtc tggagtcgcg cgatcagcgc gcagggtacc 420 gtcaaggcga cgctgggttc ggtgaacgtg cccctggtgt gcgccggggc gctggtcgag 480 gcgggagaca ttgtcgtcgc cgacgatgac ggcgtcgtga tcgtcaagaa ggatcaggtc 540 gatgcggtca ctcaggcagc cgaacagcgc gtgcgcaaag aagaggacac acgggcgcgg 600 ttggcgcgag gcgagctcgg cctggacatc tacgccttgc gcaagaagct gtcggacctc 660 gggctgaagt cgtcgtcgtg a 681 <210> 256 <211> 226 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 256 Met Asn Asp Pro Ile Val Val Arg Gln Ile Asp Arg Pro Ser Gly Pro 1 5 10 15 Ser Val Asp Ser Leu Arg Arg Phe Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Arg Gly Leu Leu Ala Ser His Met Arg Pro Ile Tyr Ala 35 40 45 Gly Ala Leu Val Ala Gly Pro Ala Ile Thr Val Leu Val Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Pro Gly Asp 65 70 75 80 Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Ala Gly Leu Ile 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Ser Glu Met Arg Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Leu Val Cys Ala Gly Ala Leu Val Glu 145 150 155 160 Ala Gly Asp Ile Val Val Ala Asp Asp Asp Gly Val Val Ile Val Lys 165 170 175 Lys Asp Gln Val Asp Ala Val Thr Gln Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Glu Asp Thr Arg Ala Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Ala Leu Arg Lys Lys Leu Ser Asp Leu Gly Leu Lys Ser 210 215 220 Ser Ser 225 <210> 257 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 257 atgaacgatc ccttcgtcgt tcgacaggtg gaccgaccgt cagctgcgtc gatcgacgat 60 ctgcggcgat tcggcgtctc gaccgtgcac gaggcccagg ggcgccgcgg gttgctcgca 120 tcgtacatgc ggccgatcta caccggtgcg ctcgtcgccg gtcctgccat cacggtcctg 180 gtggcgccgg gcgacaacct gatgatccac gtcgcggtgg aggtgtgcca gcctggtgat 240 gtcctcgtcg tcgccccgac gtcgccatgc acggacgggt atttcggcga actgctggcg 300 acctcgttgc gggctcgcgg cgtcgcaggg ctcatcatcg acgccggctg ccgcgatgtt 360 cgagcgttga gcgagatgcg gtttcccgtc tggagtcgcg cgatcagcgc gcagggcacc 420 gtcaaggcga cgctgggttc ggtgaatgtg ccgctgatgt gcgccggaac gctggtcgag 480 gccggagacg tgatcgtggc cgatgatgac ggcgtcgtgg tcgtcaagcg ggagcaggtc 540 gatgccgtaa cgcaggccgc cgaacagcgc gtgcgaaagg aagaggacac acgggcacgg 600 ctcgcgcgag gcgagctggg cctcgacatc tacggcttgc gcaagaaact gtcggacctc 660 ggtttgaagt cgtcgtga 678 <210> 258 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 258 Met Asn Asp Pro Phe Val Val Arg Gln Val Asp Arg Pro Ser Ala Ala 1 5 10 15 Ser Ile Asp Asp Leu Arg Arg Phe Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Thr 35 40 45 Gly Ala Leu Val Ala Gly Pro Ala Ile Thr Val Leu Val Ala Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Pro Gly Asp 65 70 75 80 Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Ala Gly Leu Ile 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Ser Glu Met Arg Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Leu Met Cys Ala Gly Thr Leu Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Glu Gln Val Asp Ala Val Thr Gln Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Glu Asp Thr Arg Ala Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Lys Lys Leu Ser Asp Leu Gly Leu Lys Ser 210 215 220 Ser 225 <210> 259 <211> 579 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 259 atgcggccca tctatgccgg tgcggcggcc gccggcagcg ccgtcaccgt atccgtacct 60 ccgggcgaca actggatgat ccacgtggcc gtcgaagtct gccgcgaagg cgacgtgctg 120 gtcgtcgccc caacctcgcc atgcgataac ggctacttcg gcgagctgct cgccagctcg 180 ctcaagtccc gtggcgtgcg cgggcttgtc atcgaggcag gctgtcgcga cgtgagagca 240 ctctcggata tgaaattccc ggtctggtcg cgggccgtct ccgcgcaagg cactgtgaag 300 gaaagcctgg gcgacgtgaa cctgccgctc gtgatcgccg gacagctcgt caatccgggc 360 gatgtcgtgg ttgccgacga cgacggcgtc gtcgtcgtgg cgcggttaga agcgcgcgcc 420 gtgaccgcca agtcgcacga acgggagcag aaagaagcag ccaaccgcga gcagctgagc 480 aagggtgagc tcggcatcga tacctacggc atgcgcaaga agctcgccga caaggggctg 540 cgctacgtcg ccaccgccga agaactcaag gcgaagtga 579 <210> 260 <211> 192 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (1)...(132) <223> Demethylmenaquinone methyltransferase <400> 260 Met Arg Pro Ile Tyr Ala Gly Ala Ala Ala Ala Gly Ser Ala Val Thr 1 5 10 15 Val Ser Val Pro Pro Gly Asp Asn Trp Met Ile His Val Ala Val Glu 20 25 30 Val Cys Arg Glu Gly Asp Val Leu Val Val Ala Pro Thr Ser Pro Cys 35 40 45 Asp Asn Gly Tyr Phe Gly Glu Leu Leu Ala Ser Ser Leu Lys Ser Arg 50 55 60 Gly Val Arg Gly Leu Val Ile Glu Ala Gly Cys Arg Asp Val Arg Ala 65 70 75 80 Leu Ser Asp Met Lys Phe Pro Val Trp Ser Arg Ala Val Ser Ala Gln 85 90 95 Gly Thr Val Lys Glu Ser Leu Gly Asp Val Asn Leu Pro Leu Val Ile 100 105 110 Ala Gly Gln Leu Val Asn Pro Gly Asp Val Val Val Ala Asp Asp Asp 115 120 125 Gly Val Val Val Val Ala Arg Leu Glu Ala Arg Ala Val Thr Ala Lys 130 135 140 Ser His Glu Arg Glu Gln Lys Glu Ala Ala Asn Arg Glu Gln Leu Ser 145 150 155 160 Lys Gly Glu Leu Gly Ile Asp Thr Tyr Gly Met Arg Lys Lys Leu Ala 165 170 175 Asp Lys Gly Leu Arg Tyr Val Ala Thr Ala Glu Glu Leu Lys Ala Lys 180 185 190 <210> 261 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 261 atgaatcaac cggcggtagt ccgccacgtg gagcagccac ccgccgacgc ggttgcggcg 60 ctggagaagt atggtgtgac gaccgtgcat gaagctcagg gacgttgtgg cctccttgcc 120 gcgtacatgc gtccgatttt cccgggagcg gccatcgccg gctccgctgt caccgtgtcg 180 ttgcctcccg gcgacaacct catgatccat gtcgcggtcg aggtctgcag gccgggaaac 240 atcctggtcg tttcacccac ctcgccttgt accgacggat acttcggtga actgttggca 300 acttctctgc gagctcacgg cgtgcaaggt cttgtgattg atgccggatg ccgcgacgtt 360 cgaccgctga ctgagatgaa attcccggtc tggagccgga ccatcagctc gcaggggacg 420 gtcaaggcca cactcggatc ggtcaatgtc ccgatcatgt gcgcgggcgc actcgtcgaa 480 gctggcgacg tcatcatcgc cgatgacgat ggggtcgtgg ttgtcaagcg tgcagacgcg 540 caccaggtcg ctgctgctgc ggaacaaagg gttcggaaag agaatgtgac ccgtgagcga 600 cttgcgcgtg gagagctagg actcgatatc tacgacatgc gccagaaaat cgcgcaactg 660 ggcctcaaat acctgtaa 678 <210> 262 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 262 Met Asn Gln Pro Ala Val Val Arg His Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Phe Pro 35 40 45 Gly Ala Ala Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Gln Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Pro Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Thr Ile Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Met Cys Ala Gly Ala Leu Val Glu 145 150 155 160 Ala Gly Asp Val Ile Ile Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Asp Ala His Gln Val Ala Ala Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 263 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 263 atgaataaac cggtggtagt tcgtcaagtg gagcagccac caacggatgc ggttacggca 60 ctagaaaagt atggcgtgac gaccgtgcat gaagcccagg gacgttgtgg cctccttgcc 120 tcctacatgc gtccgatttt tccgggagcg agcatcgcgg gttctgccgt cactgtgtct 180 ttgcctcctg gcgacaacct gatgatccac gtggcggtcg aggtctgtgg tccgggaaat 240 atcctcgtcg tttcgccgac ttcgccttgt accgatggct acttcggtga attgttggcc 300 acttccctgc gtgcccgagg tgtccaagga ttagtcatcg atgccggatg ccgtgacgtc 360 cgctcgctga cggagatgaa attcccggtc tggagtcgtg ccatcagctc gcagggcaca 420 gtcaaagcca cccttggatc ggtgaacgtg ccgatcatgt gtgcgggtgc gtccgtggaa 480 gcgggcgatg taattgtggc cgatgatgat ggagttgttg tcgtgaagcg tgcggccgca 540 caagacgtcg ctgcggccgc ggaacaaagg gttcgcaagg aaaacgcgac ccgcgaacgt 600 cttgcacgcg gcgaactcgg actcgatatc tacgacatgc gccagaagat cgcgcagctg 660 ggcctcaaat atctgtga 678 <210> 264 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 264 Met Asn Lys Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Thr Asp 1 5 10 15 Ala Val Thr Ala Leu Glu Lys Tyr Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Phe Pro 35 40 45 Gly Ala Ser Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Gln Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Met Cys Ala Gly Ala Ser Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Ala Ala Gln Asp Val Ala Ala Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 265 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 265 atgacgggtc ctatcgtcgt gcgtcacatc gaacggccac cggcagctgc cgtggcacgg 60 ctgcaggagt acggcgtggc gacggtccac gaagcgcaag gacgccgcgg gttgctggcc 120 gcctatatgc gaccgatcta tgcgggcgca gccattgcgg gccctgcggt cacggtgtcc 180 gttccgccgg gcgacaacct gatgatccac gtcgcggtgg aggtctgcca gccgggagac 240 gtgctcgtcg tcgctcccac gtcaccgtgc acggacggct acttcggcga gctgctcgcg 300 acctcgctgc aggctcatgg cgtcgtcgcg ctcgtcatcg acgccggatg ccgagatgtg 360 cgtgccatga cagagatgcg cttccccgtc tggagccgcg cagtcagttc gcagggcacc 420 gtgaaagcga cgctggggtc ggtgaacgtg ccggtggcat gtgcgggcac gctcgtgaat 480 cccggcgatg tcgtcatagc ggatgatgac ggcgttgtgg tggtgaggcg agacgaggtg 540 gaagagaccg tgagctcgtc ggaaaagcgg atccagaaag aggcgattac gcgagagcgg 600 ctcgccagcg gcgagctcgg gctggatatc tacgggctgc ggaagaaact cgccgacctc 660 ggactgaagt actcataa 678 <210> 266 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 266 Met Thr Gly Pro Ile Val Val Arg His Ile Glu Arg Pro Pro Ala Ala 1 5 10 15 Ala Val Ala Arg Leu Gln Glu Tyr Gly Val Ala Thr Val His Glu Ala 20 25 30 Gln Gly Arg Arg Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Ala 35 40 45 Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Val Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Pro Gly Asp 65 70 75 80 Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Gln Ala His Gly Val Val Ala Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Met Thr Glu Met Arg Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Val Ala Cys Ala Gly Thr Leu Val Asn 145 150 155 160 Pro Gly Asp Val Val Ile Ala Asp Asp Asp Gly Val Val Val Val Arg 165 170 175 Arg Asp Glu Val Glu Glu Thr Val Ser Ser Ser Glu Lys Arg Ile Gln 180 185 190 Lys Glu Ala Ile Thr Arg Glu Arg Leu Ala Ser Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Lys Lys Leu Ala Asp Leu Gly Leu Lys Tyr 210 215 220 Ser 225 <210> 267 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 267 atgaatacac cgttggtagt ccgacaagtc gagcagccac cagcggacgc ggttgcggca 60 ttggaaaagt gcggagtcac aaccgtgcat gaggctcagg gacgtggtgg cctctttgcc 120 tcctacatgc gcccgattta cccgggagca accatcgcag gatccgccat cacagtgtct 180 gtgcctccgg gcgacaacct tatgatccat gtggctgtgg aagtctgcgg tgcgggaaac 240 atcctggtgg tttcaccaac ctccccttgt acggatggat acttcggtga gctgttggca 300 acatctcttc gcgcccacgg tgtgaggggg cttgtgatcg atgccggatg tcgtgatgtg 360 cgctctctga cggatatgaa atttccggtt tggagtcgca ccgtcagttc gcaagggaca 420 gtcaaggcca cactcggatc ggtgaatgta cccatcgttt gtgcgggcgc gatggttgag 480 gccggtgatg tgatcgtcgc cgacgacgat ggagttgtgg tggtgaagcg cgcgctggcg 540 ccagaggtcg ccgcggcggc gcaacaaagg gttcgcaaag agaatttggc ccgcgaacga 600 cttggacgcg gagaactcgg actcgacatt tatgacatgc gcgaaaagat cgcgaaactg 660 ggccttaagt atttgtaa 678 <210> 268 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 268 Met Asn Thr Pro Leu Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Gly Gly Leu Phe Ala Ser Tyr Met Arg Pro Ile Tyr Pro 35 40 45 Gly Ala Thr Ile Ala Gly Ser Ala Ile Thr Val Ser Val Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Ala Gly Asn 65 70 75 80 Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Asp Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Thr Val Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Met Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Leu Ala Pro Glu Val Ala Ala Ala Ala Gln Gln Arg Val Arg 180 185 190 Lys Glu Asn Leu Ala Arg Glu Arg Leu Gly Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Glu Lys Ile Ala Lys Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 269 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 269 atgaacacac cggtcgtagt ccggcaagtg gagcaaccat caatggatgt gattgcagcc 60 ctggagaaac atggtgtgac gaccgtacat gaggcccagg gacgttgtgg cctgctggcg 120 tgttacatgc gtccgatttt ccccggagcg agcatcgctg gttccgcggt cactgtttct 180 ttgccccccg gcgataatct tatgatccac gttgcggtcg aggtctgcag tccagggaac 240 atccttgtag ttgccccgac ctcgccttgc acggatggct atttcggaga attgttggca 300 acttccctgc gcgctcgcgg tgtgaaaggt ctcgtgattg atgccggatg ccgtgatgtt 360 cgctctttga cggaaatgaa gttcccggtc tggagccgag cgatcagctc gcagggaacg 420 gtcaaatcta cactcggctc cgtgaacgtg cctatcctgt gcgcgggcgc actcgtcgag 480 gccggcgata tcatcgccgc cgatgacgac ggcgttgtcg ttgtcaagcg cgcaatggcg 540 caggaggtcg ccacggcggc agaacaaagg gtgcgcaaag agaatgtgac ccgagagcgt 600 cttgcgcggg gagatctcgg gctcgatatc tacgacatgc ggcagaaact cgcccaactg 660 ggcctcaaat atctgtga 678 <210> 270 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 270 Met Asn Thr Pro Val Val Val Arg Gln Val Glu Gln Pro Ser Met Asp 1 5 10 15 Val Ile Ala Ala Leu Glu Lys His Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Cys Tyr Met Arg Pro Ile Phe Pro 35 40 45 Gly Ala Ser Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Ser Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Lys Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ser Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Leu Cys Ala Gly Ala Leu Val Glu 145 150 155 160 Ala Gly Asp Ile Ile Ala Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Met Ala Gln Glu Val Ala Thr Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Asp Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Leu Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 271 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 271 atgaaccaag ccgtggtggt ccggaatatc gagcgcccgc ccgcggatgt agttgctgcg 60 ttggagaaac ttggtgtttc cacggtgcac gaggcgcagg gacgttgcgg tctgttcgct 120 acgtatatga ggccgattta tgcgggtgcg gcgattgccg ggccggcggt taccgtatcg 180 ttgccgccgg gtgacaattt gatgattcac gtggccgtgg aagtgtgccg cgcgggggac 240 attttggtgg tcgcgccgac ttcgccttgc acggacgggt atttcggcga attgctggcg 300 acttcgttgc gcgcacatgg cgtcaagggc ctggtgatcg atgcggggtg ccgcgacgtc 360 cgagcgctcg cggagatgaa atttcccgtg tggagccgcg cagtaagttc gcagggaacg 420 gtgaagtcga cccttggttc ggtaaacgtc ggaattgtgt gcgcaggagc acgcgtggaa 480 gccggagacg tgatcgttgc cgacgatgac ggcgtagtgg gggtgaagtg cggcgcagcg 540 caggaagtgg ttgccgcggc gcagctgcgc gttcgcaagg aagaggccac gcgcgaacgc 600 ttggggcgtg gcgagctcgg cctggatatc cacgggctgc gggccaaggt cgcggagctt 660 ggcctgaaat atttgtga 678 <210> 272 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 272 Met Asn Gln Ala Val Val Val Arg Asn Ile Glu Arg Pro Pro Ala Asp 1 5 10 15 Val Val Ala Ala Leu Glu Lys Leu Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Phe Ala Thr Tyr Met Arg Pro Ile Tyr Ala 35 40 45 Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Ala Gly Asp 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Ala Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ser Thr 130 135 140 Leu Gly Ser Val Asn Val Gly Ile Val Cys Ala Gly Ala Arg Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Gly Val Lys 165 170 175 Cys Gly Ala Ala Gln Glu Val Val Ala Ala Ala Gln Leu Arg Val Arg 180 185 190 Lys Glu Glu Ala Thr Arg Glu Arg Leu Gly Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile His Gly Leu Arg Ala Lys Val Ala Glu Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 273 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 273 atgaacaagc ccgtggttgt gcggaacatc gagcgtccgc cggcggatgc tgtggccgcg 60 cttgagaaat acggcgtgtc gacggtgcac gaggcccagg gccggaacgg cctactggcc 120 tcctatatgc gcccgatcta tgcaggagcc gcgatcgctg gaccagccgt cacagtttcc 180 ctcccgccgg gagacaacct gatgattcac gtcgccgtcg aggtctgtcg acctggggat 240 gtcctcgttg ttgcgccgac atcgccatgc accgacggct attttggcga gttgcttgca 300 acttcgctcg cggcgcatgg ggtgaaaggc ttgatcattg aggcgggatg tcgcgacgtc 360 cgagctctga cggaaatgaa gtttccagtc tggagccgcg ccgtcagctc gcaaggaacg 420 gtgaaggcaa cacttgggtc ggtaaatgta acgattgttt gtgcgggtgc tgcggttgcg 480 cccggtgatg tgatcgtggc ggacgatgat ggcgtcgttg tcgtgaaacg gacagaggcg 540 caagaggtcg ttaccgcatc tgagcagaga ttgcgaaagg aagagggaac ccgcaagcgg 600 cttgcttcgg gggaactcgg cctggatatt tacggcctgc gagcgaagat tgcagacctc 660 ggtctcaagt acttgtag 678 <210> 274 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (151)...(154) <223> N-glycosylation site. Prosite id = PS00001 <400> 274 Met Asn Lys Pro Val Val Val Arg Asn Ile Glu Arg Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Asn Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala 35 40 45 Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp 65 70 75 80 Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Ala Ala His Gly Val Lys Gly Leu Ile 100 105 110 Ile Glu Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Thr Ile Val Cys Ala Gly Ala Ala Val Ala 145 150 155 160 Pro Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Thr Glu Ala Gln Glu Val Val Thr Ala Ser Glu Gln Arg Leu Arg 180 185 190 Lys Glu Glu Gly Thr Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Ala Lys Ile Ala Asp Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 275 <211> 690 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 275 atgcctatcg ttgttacgaa gatcgaccga cccagcgcgg cggacgtcga aaggatcgcc 60 gcctatggtg tcgcgacctt gcatgaagcg caaggacgaa ccgggttgat ggcgtccaat 120 atgcgcccaa tctatcgccc tgcgcacatt gccgggcccg cggtgacctg ccttgtggcg 180 cctggcgaca attggatgat ccatgtcgcc gtcgaacagt gccagccggg agatgtcctg 240 gtcgtggtac cgaccagccc ctgcgaagac ggctatttcg gcgatctgct ggcgacctcg 300 ctgcggtcgc gcggggtcaa aggtctgatc atcgaggccg gcgtacgcga tatcgcgaca 360 ttgaccgaga tgaaattccc ggtctggtcc aaggcggtgt tcgcgcaagg aacggtcaag 420 gagaccatcg ccagcgtcaa tgtgcccctc gtctgcgcgg gcgcccgcat cgtgccgggc 480 gatctgatcg ttgccgacga cgacggggtc gtcgtgattc caagacgttc cgttccggcg 540 gtcctttcca gcgccgaggc ccgcgaagag aaggaagccc gcaaccgcgc ccgcttcgaa 600 gctggcgagc tgggcctcga cgtctacaac atgcgccagc gcctggccga caagggcttg 660 cgctatgtcg agcggctgcc cgaggaatag 690 <210> 276 <211> 229 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 276 Met Pro Ile Val Val Thr Lys Ile Asp Arg Pro Ser Ala Ala Asp Val 1 5 10 15 Glu Arg Ile Ala Ala Tyr Gly Val Ala Thr Leu His Glu Ala Gln Gly 20 25 30 Arg Thr Gly Leu Met Ala Ser Asn Met Arg Pro Ile Tyr Arg Pro Ala 35 40 45 His Ile Ala Gly Pro Ala Val Thr Cys Leu Val Ala Pro Gly Asp Asn 50 55 60 Trp Met Ile His Val Ala Val Glu Gln Cys Gln Pro Gly Asp Val Leu 65 70 75 80 Val Val Val Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Leu Arg Ser Arg Gly Val Lys Gly Leu Ile Ile Glu 100 105 110 Ala Gly Val Arg Asp Ile Ala Thr Leu Thr Glu Met Lys Phe Pro Val 115 120 125 Trp Ser Lys Ala Val Phe Ala Gln Gly Thr Val Lys Glu Thr Ile Ala 130 135 140 Ser Val Asn Val Pro Leu Val Cys Ala Gly Ala Arg Ile Val Pro Gly 145 150 155 160 Asp Leu Ile Val Ala Asp Asp Asp Gly Val Val Val Ile Pro Arg Arg 165 170 175 Ser Val Pro Ala Val Leu Ser Ser Ala Glu Ala Arg Glu Glu Lys Glu 180 185 190 Ala Arg Asn Arg Ala Arg Phe Glu Ala Gly Glu Leu Gly Leu Asp Val 195 200 205 Tyr Asn Met Arg Gln Arg Leu Ala Asp Lys Gly Leu Arg Tyr Val Glu 210 215 220 Arg Leu Pro Glu Glu 225 <210> 277 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 277 atgaatacac cggtggtagt ccgacaagtg gagcagccac cagcggatgc ggttgccgca 60 ttggagaagt gtggagtgac caccgtgcat gaggcgcagg gacgctgcgg cctccttgcg 120 tcctacatgc gcccaattta cccgggagca gccatcgccg gttccgctat cactgtgtct 180 ttgcctcctg gcgacaacct catgatccat gttgcggtgg aggtctgcag tccgggaaat 240 atcctggtag tttcaccggc ctcgccttgt accgatggct acttcggtga gctgttggcg 300 acgtctctcc gtgcccacgg cgtgagaggg cttgtgatcg aggcgggatg ccgtgacgtg 360 cgctctctaa cagaaatgaa attcccggtc tggagccgcg ccatcagttc gcaggggaca 420 gtcaaggcta cacttggatc ggtaaacgtg cccatcgtgt gcgcgggcgc acgggtcgag 480 gctggtgatg tcatcgtcgc cgatgacgat ggagtggtgg ttgtgaagcg ggcgcttgcg 540 caagaggtcg ccgcggcggc ggaacaaagg gttcgcaaag agaatgcgac ccgcgaacga 600 cttgcgcgcg gagaactcgg actcgatatt tacgacctgc gccaaaagat cgctcaactg 660 ggccttaaat atctgtga 678 <210> 278 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 278 Met Asn Thr Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro 35 40 45 Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Ser Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ser Pro Ala Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val 100 105 110 Ile Glu Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Arg Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Leu Ala Gln Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Leu Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 279 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 279 atgaataaac cggtggtagt gcggcaagtc gagcagccac ccgccgatgc ggttgcggcc 60 ctggagaagt atggcgtgac caccgtgcac gaagctcaag cgcgttgtgg cctgctggct 120 ccctatatgc gcccgatttt tgcgggagca tgcatcgccg gttccgccgt gaccgtgtct 180 ttgccgcctg gcgataatct catgatccac gttgccgtcg aggtctgcac tccgggcagc 240 attctggtag ttgcccccac ctcgccttgc acggacggtt atttcgggga actcctggca 300 acttccctgc tcgctcacgg tgtcaaagga ttggtcatcg atgctggctg tcgggatgtt 360 cgctcgttaa cggaaatgaa attccccgtc tggagccgtg ctgtcagttc tcaaggaacg 420 gtgaaggcca cgctcggatc ggtgaatgtg ccggtcattt gcgcgggcgc ggaggtggag 480 gctggcgata tcatcatcgc cgatgatgat ggtgtggtgg tggtgaagcg cacgctggcg 540 cacgaggtgg cagcggcggc ggaactacgg gttcgcaagg agaatgccac ccgcgaacga 600 ctcgcacgag gggatctcgg cctcgatatc tacgacatgc ggcaaaaaat cgcgcaactt 660 ggtctcaaat atctgtga 678 <210> 280 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 280 Met Asn Lys Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Ala Arg Cys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Phe Ala 35 40 45 Gly Ala Cys Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Thr Pro Gly Ser 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Leu Ala His Gly Val Lys Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Val Ile Cys Ala Gly Ala Glu Val Glu 145 150 155 160 Ala Gly Asp Ile Ile Ile Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Thr Leu Ala His Glu Val Ala Ala Ala Ala Glu Leu Arg Val Arg 180 185 190 Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Asp Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 281 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 281 atgaacaagc ccgtggtcgt ccggcacgtg gaccaaccgt cagccgacgt tgtggctgcg 60 ctggagaagt acggagtctc gaccgtgcac gaagcgcaag gccgttgcgg tctactggcc 120 tcgtacatgc acccgattta tcccggcgat tccatcgctg ggcctgcggt cacggtttcg 180 cttccgccag gtgacaattt gatgatccat gttgcggtcg aggtctgccc ggcgggaagc 240 gttctggtcg tggctcccac ctcaccgtgc acagacggtt atttcggcga attgctggca 300 acttctctgc gcgctcacca tgtgacgggg ttggttatcg atgccggttg ccgcgacgtt 360 cgctcactca cggaaatgaa gtttccggtg tggagtcgcg ccgtcagttc acaggggacc 420 gtaaagtcga cgcttggctc cgtgaacgtg ccagtagtgt gcgccggggc ccatgtcgaa 480 gcgggcgata tcatcgtcgc cgatgacgat ggagtggtag ttgtaaagcg attggacgca 540 cccgaggtag tcgctgcgtg cgaacaaagg gttcgcaagg aacaggtgac gcgcgaacgg 600 ctggcgcgcg gcgaactggg tctggatatt tacggcctgc gaagcaaaat cgccgaactt 660 ggcctcaagt acgagtag 678 <210> 282 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 282 Met Asn Lys Pro Val Val Val Arg His Val Asp Gln Pro Ser Ala Asp 1 5 10 15 Val Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met His Pro Ile Tyr Pro 35 40 45 Gly Asp Ser Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Pro Ala Gly Ser 65 70 75 80 Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His His Val Thr Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ser Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala His Val Glu 145 150 155 160 Ala Gly Asp Ile Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Leu Asp Ala Pro Glu Val Val Ala Ala Cys Glu Gln Arg Val Arg 180 185 190 Lys Glu Gln Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Ser Lys Ile Ala Glu Leu Gly Leu Lys Tyr 210 215 220 Glu 225 <210> 283 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 283 atgaatacac cggtggtagt ccggcaagtg gagcagccac cagcggacgc ggtggccgca 60 ttggagaact gtggcgtgac caccgtgcat gaggctcagg gacgtagtgg cctgcttgcc 120 tcctacatgc gcccgattta ccagggagca gccatcgcag gttccgctct caccgtgtct 180 ttgcctccgg gcgacaacct catgatgcat gttgcggtag agttctgcgg cccgggaaat 240 atcctggtcg ttgcaccgac ctcgccctgt acggatggct acttcggtga gctgttggca 300 acatctctcc gtgcccacgg tgggagaggg cttgtgatcg atgccggatg ccgtgacctg 360 cgctctctaa cagaaatgaa attccctgtc tggagccgcg ccatcagttc gcaagggacg 420 gtcaaggcca cacttggatc cgtgaatgtg cccatcgtat gcgcgggcgc attggtcgag 480 gccggagatg tcatcgtcgc cgatgacgat ggagttgtgg ttgtgaagcg cgccctcgcg 540 caagaggtca gggcggcggc ggagcaaagg gttcgcaaag aaaatgcgac ccgcgaaaga 600 ctcgcacgtg gagaactcgg actcgacatt tacgacatgc gccaaaagat cgcgcagctg 660 ggccttaaat atctgtga 678 <210> 284 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 284 Met Asn Thr Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Asn Cys Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Ser Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Gln 35 40 45 Gly Ala Ala Ile Ala Gly Ser Ala Leu Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Met His Val Ala Val Glu Phe Cys Gly Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Gly Arg Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Leu Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Leu Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Leu Ala Gln Glu Val Arg Ala Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 285 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 285 atgaatacac cggtggtagt aagacaagtg gagcagccac cagcggatgc aattgccgca 60 ttgaagaagt gtggcgtgac aaccgtccac gaggctcagg gacgtggtgg ccttcttgcg 120 tcctacatgc gcccgattta cccgggagca gccatcgcag gatccgctat cactgtgtct 180 ttgcctcctg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240 atcctggtag tttcaccgac ctcgccttgt acggatggct acttcggtga gttgttggca 300 acatctctcc gtgcccaggg cgtgattggg cttgtgatcg atgccggatg ccgtgacgtg 360 cgctctctaa cagaaatgaa attcccggtc tggagccgcg ccatctgttc gcaagggaca 420 gtcaaggcca cacttggatc ggtgaatgtg cccatcgtat gcgcgggtgc attggtcgag 480 gctggtgatg tcatcgtcgc cgacgacgat ggcgttgtgg ttgtaaagcg agcgctggcg 540 caagaggtcg ccgctgcggc ggaacaaaag gttcgcaaag agaatgtaac ccgcgaacga 600 ctcgcacgtg gagagctcgg acttgatatt tacgacatgc gccaaaagat cgcgcaactg 660 ggcctcaaat atctgtga 678 <210> 286 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 286 Met Asn Thr Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Ile Ala Ala Leu Lys Lys Cys Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Gly Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro 35 40 45 Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala Gln Gly Val Ile Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Cys Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Leu Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Leu Ala Gln Glu Val Ala Ala Ala Ala Glu Gln Lys Val Arg 180 185 190 Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 287 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 287 atgaacaaac cgttggtgat ccggcaagtg gagcggccgc cggctgacgc tgtggcggcg 60 ctcgaaaaat atggcgtgtc caccgtgcat gaagcccagg gacgttgcgg actgctcgct 120 tcctacatgc gaccgattta tcccggtgct gccgttgccg gttcggcggt caccgtatcc 180 cttccgcccg gcgataatct gatgattcac gttgctgtcg aggtctgcca gtccggcgat 240 attctcgtgg ttgctccgac ctcgccttgc tcggacggat acttcggtga gttgctggcg 300 acgtccttgc gcgcgcacgg cgtgaagggc ctcgtcattg acgcggggtg ccgtgacgtt 360 cgctcactta ccgaaatgag gttccccgtc tggagccgca gcgtcagctc gcaaggtacc 420 gtgaagtcta ctctcggatc tgtgaatgtg agcattgttt gtgccggcgc gcacatcgaa 480 gctggtgatg tgatcgtcgc ggatgacgac ggtgtcgtgg tggtgaagcg cgcatccgcc 540 cacgaagtag tcgcggcgtg cgaacagcgg gttcgcaagg aagaggtcac tcgggagcgg 600 ttggcgcgcg gggagcttgg gcttgacatc tacgggttgc gcacaaaaat cgcggaaatg 660 ggtctcaagt atcaatga 678 <210> 288 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (151)...(154) <223> N-glycosylation site. Prosite id = PS00001 <400> 288 Met Asn Lys Pro Leu Val Ile Arg Gln Val Glu Arg Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro 35 40 45 Gly Ala Ala Val Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Ser Gly Asp 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Arg Phe 115 120 125 Pro Val Trp Ser Arg Ser Val Ser Ser Gln Gly Thr Val Lys Ser Thr 130 135 140 Leu Gly Ser Val Asn Val Ser Ile Val Cys Ala Gly Ala His Ile Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Ser Ala His Glu Val Val Ala Ala Cys Glu Gln Arg Val Arg 180 185 190 Lys Glu Glu Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Thr Lys Ile Ala Glu Met Gly Leu Lys Tyr 210 215 220 Gln 225 <210> 289 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 289 atgaacaagc ccgtggttgt gcggaacatc gagcgtccgc cggcggatgc tgtggccgcg 60 cttgagaaat acggcgtgtc gacggtgcac gaggcccagg gccggaacgg cctactggcc 120 tcctatatgc gcccgatcta tgcaggagcc gcgatcgctg gaccagccgt cacagtttcc 180 ctcccgccgg gagacaacct gatgattcac gtcgccgtcg aggtctgtcg gcctggggat 240 gtcctcgttg ttgcgccgac atcgccatgc accgacggct attttggaga gttgcttgca 300 acttcgctcg cggcgcatgg ggtgaaaggc ttagtcattg aggcgggatg tcgcgacgtc 360 cgagctctga tggaaatgaa gtttccagtc tggagccgcg ccgtcaactc gcaaggaacg 420 gtgaaggcaa cacttgggtc ggtaaatgta acgattgttt gtgcgggtgc tgcggttgcg 480 cccggtgatg tgatcgtggc ggacgatgat ggcgtcgttg tcgtgaaacg gacagaggcg 540 caagaggtcg ttaccgcatc tgagcagaga ttgcgaaagg aagagggaac ccgcaagcgg 600 cttgcttcgg gggaactcgg cctggatatt tacggcctgc gagcgaagat tgcagacctc 660 ggtctcaagt acttgtag 678 <210> 290 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <220> <221> SITE <222> (151)...(154) <223> N-glycosylation site. Prosite id = PS00001 <400> 290 Met Asn Lys Pro Val Val Val Arg Asn Ile Glu Arg Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala 20 25 30 Gln Gly Arg Asn Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala 35 40 45 Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp 65 70 75 80 Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Ala Ala His Gly Val Lys Gly Leu Val 100 105 110 Ile Glu Ala Gly Cys Arg Asp Val Arg Ala Leu Met Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Asn Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Thr Ile Val Cys Ala Gly Ala Ala Val Ala 145 150 155 160 Pro Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Thr Glu Ala Gln Glu Val Val Thr Ala Ser Glu Gln Arg Leu Arg 180 185 190 Lys Glu Glu Gly Thr Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Gly Leu Arg Ala Lys Ile Ala Asp Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 291 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 291 atgaataaac cggtggtagt ccggcaagtg gagcagccac ccgcggacgc ggttgcggcg 60 ctggagaagt atggcgttac caccgtgcat gaggctcagg gacgttgtgg cctgctcgcg 120 cactacatgc gtccgatttt tccgggagcg gccatctcgg gttctgctgt caccgtagct 180 ttgccgccgg gcgataacct catgatccac gtcgcggtcg aggtctgcgg cccgggaaac 240 atcctggttg tggcaccgac ctcgccttcg acggatggct acttcggtga gctgttggcg 300 acctctttgc gtgctcacgg tgtgaaaggg cttgtgattg atgccggatg ccgtgacgtt 360 cgctccctga ccgagatgaa attccccgtc tggagccgtg ccatcagctc gcagggaaca 420 gtcaaggcca ccctcggatc ggtgaatgtg ccggtcatgt gcgcgggcgc gctcgtcgaa 480 gctggggatg tcatcgtcgc cgatgatgat ggagttgtgg ttgtgaagcg cgcgaatgcg 540 cacgaggtgg ccgcggcggc agaacaaagg gtgcgcaagg agaatataac ccgcgaacgg 600 cttcgacgcg gagagctcgg actcgatatt tacgacatgc gccaaaaaat cgcgcaactg 660 ggcctcaaat acctgtga 678 <210> 292 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 292 Met Asn Lys Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro Ile Phe Pro 35 40 45 Gly Ala Ala Ile Ser Gly Ser Ala Val Thr Val Ala Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Ser Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Val Met Cys Ala Gly Ala Leu Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Asn Ala His Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Ile Thr Arg Glu Arg Leu Arg Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 293 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 293 atgaatcgac cggtggtagt ccggcaagtt gaacagccac cagcggatgc ggttgccgca 60 ctggagaagt atggcgtgac aaccgtccat gaggctcagg gacccggtgg cctcctagcc 120 tcctacatgc gcccgattta cccgggagca gtcatcgccg gttccgcggt cactgtgtct 180 ttacctcctg gcgacaacct catgatccac gtggccgtgg aggtctgtgg tccgggaaac 240 attctggttg ttgcaccgat ctcgccgtgt acggatggct acttcggaga gctgttggca 300 acctctctcc gcgcccacgg tgtgcgaggg cttgtgatcg atgccggatg ccgggacgtg 360 cgctctctca cagaaatgaa atttccggtc tggagccgcg ccgtcagttc acaggggaca 420 gtcaaggcca ccctgggatc ggtgaatgtg ccgattgtgt gcgcgggcgc gcgggtcggg 480 gctggggatg tcatcgtcgc cgatgacgat ggagttgtgg tggtgaagcg cgcgctggcc 540 gaagaggtcg ccgccgcggc ggaacaaagg gttcgcaaag agaatgtgac ccgggaacga 600 cttgcgcgtg gagagctggg actcgatatt tacgacatgc gccaaaagat cgcacaactg 660 ggccttaaat atctctga 678 <210> 294 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 294 Met Asn Arg Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Pro Gly Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro 35 40 45 Gly Ala Val Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ala Pro Ile Ser Pro Cys Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Arg Val Gly 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala Leu Ala Glu Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 295 <211> 678 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 295 atgaataaac cggtggtagt ccggcaagtg gagcagccgc cagcggacgc ggttgcggcg 60 ctggagaagt atggcgtcac caccgtgcat gaggctcagg gacgttgtgg cctgctcggg 120 cactacatgc gtccgatttt tccgggagcg gccatctcgg gttctgcagt caccgtagct 180 ttgccgccgg gcgataacct catgatccac gtcgcggtcg aggtctgcgg cccgggaaac 240 atcctggtgg ttgcaccgac ctcgccttcg acggatggct acttcggtga gctgttggcg 300 acctctctgc gtgctcgcga tgtgaaaggg cttgtgattg atgccggatg ccgtgacgtt 360 cgctccctga ccgagatgaa attccccgtc tggagccgtg ccatcagctc gcagggaacg 420 gtcaaggcca ccctcggatc ggtgaatgtg ccggtcacgt gcgcgggcgc gctcgtcgaa 480 gccggggatg tcatcgtcgc cgatgatgat ggagttgtgg ttgtgaagcg cgcgcatgcg 540 cacgaggtgg cggcggcggc agaacaaagg gtgcgcaaag agaatataac ccgcgaacgg 600 cttcgacgcg gagagctcgg actcgatatt tacgacatgc gccaaaagat cgcgcaactg 660 ggcctcaaat acctgtga 678 <210> 296 <211> 225 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (22)...(174) <223> Demethylmenaquinone methyltransferase <400> 296 Met Asn Lys Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp 1 5 10 15 Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Thr Thr Val His Glu Ala 20 25 30 Gln Gly Arg Cys Gly Leu Leu Gly His Tyr Met Arg Pro Ile Phe Pro 35 40 45 Gly Ala Ala Ile Ser Gly Ser Ala Val Thr Val Ala Leu Pro Pro Gly 50 55 60 Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn 65 70 75 80 Ile Leu Val Val Ala Pro Thr Ser Pro Ser Thr Asp Gly Tyr Phe Gly 85 90 95 Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Asp Val Lys Gly Leu Val 100 105 110 Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125 Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140 Leu Gly Ser Val Asn Val Pro Val Thr Cys Ala Gly Ala Leu Val Glu 145 150 155 160 Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys 165 170 175 Arg Ala His Ala His Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg 180 185 190 Lys Glu Asn Ile Thr Arg Glu Arg Leu Arg Arg Gly Glu Leu Gly Leu 195 200 205 Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr 210 215 220 Leu 225 <210> 297 <211> 672 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 297 atgggtgtcg tcgtccaaaa catcgagcgg gctgcgcaag ggaccatcga ccgcctcgcc 60 gcctgcgggg tggctaccgt ccatgaagcg caggggcgca aggggctgct ggcgagccac 120 atgcggccgg tctacagggg cgcacggctc gccgcgagcg cggtgacgat ttcggcgccg 180 cccggcgaca actggatgat ccatgtcgcc atcgagcagc tccaagccgg cgacatcatg 240 gtgctggcgc cgaccagccc gtgcgaggac ggatatttcg gcgacctcct ggcgacctcg 300 gcgcaggcgc gcgggtgcaa ggggctggtg atcgatgccg gcgtgcgcga cgttgccgac 360 cttacggcaa tgcagttccc ggtgtggtcg aaggcgatct tcgcgcaggg cacgctgaaa 420 gagacgctgg gttcggtgaa cgtgccggtg gtctgcgccg gcgcgctggt caacccgggc 480 gacgtcatcg tcgccgatga cgacggggtc tgcgtggtac gccgcgagga ggtcgaggca 540 gtggcggaaa aggcggaagc ccgcgtcgct gccgaggagg acaagcgcaa gcgcctcgcc 600 gggggagaac tggggctcga catctacaag atgcgcgagc gcttggccga gaagggcctc 660 aaatatgtct ga 672 <210> 298 <211> 223 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (20)...(172) <223> Demethylmenaquinone methyltransferase <400> 298 Met Gly Val Val Val Gln Asn Ile Glu Arg Ala Ala Gln Gly Thr Ile 1 5 10 15 Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly 20 25 30 Arg Lys Gly Leu Leu Ala Ser His Met Arg Pro Val Tyr Arg Gly Ala 35 40 45 Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn 50 55 60 Trp Met Ile His Val Ala Ile Glu Gln Leu Gln Ala Gly Asp Ile Met 65 70 75 80 Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu 85 90 95 Leu Ala Thr Ser Ala Gln Ala Arg Gly Cys Lys Gly Leu Val Ile Asp 100 105 110 Ala Gly Val Arg Asp Val Ala Asp Leu Thr Ala Met Gln Phe Pro Val 115 120 125 Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Leu Lys Glu Thr Leu Gly 130 135 140 Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro Gly 145 150 155 160 Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu 165 170 175 Glu Val Glu Ala Val Ala Glu Lys Ala Glu Ala Arg Val Ala Ala Glu 180 185 190 Glu Asp Lys Arg Lys Arg Leu Ala Gly Gly Glu Leu Gly Leu Asp Ile 195 200 205 Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val 210 215 220 <210> 299 <211> 501 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 299 atgggttcct tggcaactgc cgaagcttgt gacacgaatg cagcacacct gacaagcggt 60 gacatccggg tcctgccacc actcttcaag atttacgggc aaagtcgggc attctctggg 120 ccaatcgtga ctgtgaaggt atttgaagac aatgtgctgg tacgggaact tcttgaaacc 180 aaaggcgacg gtagagttct ggtgatagac ggcggaggga gcatgaggtg tgccttggtc 240 ggaggaaacc tggggcagtt agcgcagaac atggggtggg cggggattgt tgtaaacggg 300 tgcataagag acgtagatga gatcaacggg tgcgatgttg gggttagagc attggcatcc 360 catccacaga agtcgaataa aaaggggcat ggggagaaac acatgccgat taatatcgcg 420 ggcacgatga tccgagacgg agagtggttg tatgcagaca gtgatggcat tctcatctcc 480 agaactgagc tctctatcta g 501 <210> 300 <211> 166 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (2)...(159) <223> Demethylmenaquinone methyltransferase <400> 300 Met Gly Ser Leu Ala Thr Ala Glu Ala Cys Asp Thr Asn Ala Ala His 1 5 10 15 Leu Thr Ser Gly Asp Ile Arg Val Leu Pro Pro Leu Phe Lys Ile Tyr 20 25 30 Gly Gln Ser Arg Ala Phe Ser Gly Pro Ile Val Thr Val Lys Val Phe 35 40 45 Glu Asp Asn Val Leu Val Arg Glu Leu Leu Glu Thr Lys Gly Asp Gly 50 55 60 Arg Val Leu Val Ile Asp Gly Gly Gly Ser Met Arg Cys Ala Leu Val 65 70 75 80 Gly Gly Asn Leu Gly Gln Leu Ala Gln Asn Met Gly Trp Ala Gly Ile 85 90 95 Val Val Asn Gly Cys Ile Arg Asp Val Asp Glu Ile Asn Gly Cys Asp 100 105 110 Val Gly Val Arg Ala Leu Ala Ser His Pro Gln Lys Ser Asn Lys Lys 115 120 125 Gly His Gly Glu Lys His Met Pro Ile Asn Ile Ala Gly Thr Met Ile 130 135 140 Arg Asp Gly Glu Trp Leu Tyr Ala Asp Ser Asp Gly Ile Leu Ile Ser 145 150 155 160 Arg Thr Glu Leu Ser Ile 165 <210> 301 <211> 501 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 301 atgggttcct tggcaactgc cgaagcttgt gacacgaatg cagcacacct gacaagcggt 60 gacatccggg tcctgccacc actcttcaag atttacgggc aaagtcgggc attctctggg 120 ccaatcgtga ctgtgaaggt atttgaagac aatgtgctgg tacgggaact tcttgaaacc 180 aaaggcgacg gtagagttct ggtgatagac ggcggaggga gcatgaggtg tgccttggtc 240 ggaggaaacc tggggcagtt agctcagaac atggggtggg cagggattgt tgtaaacggg 300 tgcataagag acatagatga gatcaacggg tgcgatgttg gggttagagc attggcatcc 360 catccacaga agtcgaataa aaaggggcat ggggagaaac acatgccgat taatatcgcg 420 ggcacgatga tccgagacgg agagtggttg tatgcagaca gtgatggcat tctcatctcc 480 agaactgagc tctctatcta g 501 <210> 302 <211> 166 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (2)...(159) <223> Demethylmenaquinone methyltransferase <400> 302 Met Gly Ser Leu Ala Thr Ala Glu Ala Cys Asp Thr Asn Ala Ala His 1 5 10 15 Leu Thr Ser Gly Asp Ile Arg Val Leu Pro Pro Leu Phe Lys Ile Tyr 20 25 30 Gly Gln Ser Arg Ala Phe Ser Gly Pro Ile Val Thr Val Lys Val Phe 35 40 45 Glu Asp Asn Val Leu Val Arg Glu Leu Leu Glu Thr Lys Gly Asp Gly 50 55 60 Arg Val Leu Val Ile Asp Gly Gly Gly Ser Met Arg Cys Ala Leu Val 65 70 75 80 Gly Gly Asn Leu Gly Gln Leu Ala Gln Asn Met Gly Trp Ala Gly Ile 85 90 95 Val Val Asn Gly Cys Ile Arg Asp Ile Asp Glu Ile Asn Gly Cys Asp 100 105 110 Val Gly Val Arg Ala Leu Ala Ser His Pro Gln Lys Ser Asn Lys Lys 115 120 125 Gly His Gly Glu Lys His Met Pro Ile Asn Ile Ala Gly Thr Met Ile 130 135 140 Arg Asp Gly Glu Trp Leu Tyr Ala Asp Ser Asp Gly Ile Leu Ile Ser 145 150 155 160 Arg Thr Glu Leu Ser Ile 165 <210> 303 <211> 501 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 303 atggccttag taaccactgc cgaagtttgt gatgcgaacc cacagctcat tgtgagcggc 60 gagcttcgcg cactccatcc aattttccaa atttacggta ggcggcaagt cttctccggg 120 cccgttgtta cgctgaaggt gtttgaagat aatgtgttgg tgcgcgaatt tcttgaggag 180 aggggcaatg gcagggttct tgttgtcgat ggtggtggca gcttgagatg cgcaatactc 240 ggtggcaacc ccgttgtaca agctcagaac aacgggtggg ctggcattgt ggttaacggg 300 tgtataaggg atgttgatga aatcaacggg tgcgacattg gagtcagagc tctggccgcg 360 cacccggtga aagccaataa gaaaggcatc ggtgagaagc atgttccggt gaacattggt 420 ggaacccgta tatgtgatgg agagtggctc tatgcagata ccgatggtat tttggtgtct 480 aaaaccgagt tgtctgtcta a 501 <210> 304 <211> 166 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (2)...(159) <223> Demethylmenaquinone methyltransferase <400> 304 Met Ala Leu Val Thr Thr Ala Glu Val Cys Asp Ala Asn Pro Gln Leu 1 5 10 15 Ile Val Ser Gly Glu Leu Arg Ala Leu His Pro Ile Phe Gln Ile Tyr 20 25 30 Gly Arg Arg Gln Val Phe Ser Gly Pro Val Val Thr Leu Lys Val Phe 35 40 45 Glu Asp Asn Val Leu Val Arg Glu Phe Leu Glu Glu Arg Gly Asn Gly 50 55 60 Arg Val Leu Val Val Asp Gly Gly Gly Ser Leu Arg Cys Ala Ile Leu 65 70 75 80 Gly Gly Asn Pro Val Val Gln Ala Gln Asn Asn Gly Trp Ala Gly Ile 85 90 95 Val Val Asn Gly Cys Ile Arg Asp Val Asp Glu Ile Asn Gly Cys Asp 100 105 110 Ile Gly Val Arg Ala Leu Ala Ala His Pro Val Lys Ala Asn Lys Lys 115 120 125 Gly Ile Gly Glu Lys His Val Pro Val Asn Ile Gly Gly Thr Arg Ile 130 135 140 Cys Asp Gly Glu Trp Leu Tyr Ala Asp Thr Asp Gly Ile Leu Val Ser 145 150 155 160 Lys Thr Glu Leu Ser Val 165 <210> 305 <211> 639 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 305 ttggatcaaa tccacaaatc cggcattatc cccgtcgtcg aaatcgactc ggtagaacgc 60 gccgtcccgc tggctgaggc attgcttgca ggagggctga cggtcgtgga gatcaccctc 120 cgcaccgggg cggcgctcga gtcgattcga gcaattgctc agcaggtacc agaggtcagt 180 gtcggggcag gaacagtcat tacctgggaa caggcgcagg cggcacgtga tgcaggcgcg 240 cagttcctcg tctcaccggg gatggtggag caggttgtca tctgggcgca ggagcaccag 300 cttccgatca tacctggcgc agcaactccc accgagatga tccgcggcat caacctgggg 360 ctcaacctcc tgaaattctt tcccgccgaa acgatgggtg gggtaagcgc tgttaaggcg 420 ttatctgacc cgtttccgca gttgaaattc attcccacgg gcggcatcag gttggaaaat 480 gcagcttcgt atctcgcgca tcctaaaatc catgctgtgg gcggctcgtg gatagcgaaa 540 cgagagatga tcgcggatgg cagatttgat gagatccggc gtatggcaca ggaagccaga 600 gacctggtaa agcagatcag gaggaaaacg atcccatga 639 <210> 306 <211> 212 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (1)...(195) <223> KDPG and KHG aldolase <220> <221> SITE <222> (32)...(41) <223> KDPG and KHG aldolases active site. Prosite id = PS00159 <400> 306 Met Asp Gln Ile His Lys Ser Gly Ile Ile Pro Val Val Glu Ile Asp 1 5 10 15 Ser Val Glu Arg Ala Val Pro Leu Ala Glu Ala Leu Leu Ala Gly Gly 20 25 30 Leu Thr Val Val Glu Ile Thr Leu Arg Thr Gly Ala Ala Leu Glu Ser 35 40 45 Ile Arg Ala Ile Ala Gln Gln Val Pro Glu Val Ser Val Gly Ala Gly 50 55 60 Thr Val Ile Thr Trp Glu Gln Ala Gln Ala Ala Arg Asp Ala Gly Ala 65 70 75 80 Gln Phe Leu Val Ser Pro Gly Met Val Glu Gln Val Val Ile Trp Ala 85 90 95 Gln Glu His Gln Leu Pro Ile Ile Pro Gly Ala Ala Thr Pro Thr Glu 100 105 110 Met Ile Arg Gly Ile Asn Leu Gly Leu Asn Leu Leu Lys Phe Phe Pro 115 120 125 Ala Glu Thr Met Gly Gly Val Ser Ala Val Lys Ala Leu Ser Asp Pro 130 135 140 Phe Pro Gln Leu Lys Phe Ile Pro Thr Gly Gly Ile Arg Leu Glu Asn 145 150 155 160 Ala Ala Ser Tyr Leu Ala His Pro Lys Ile His Ala Val Gly Gly Ser 165 170 175 Trp Ile Ala Lys Arg Glu Met Ile Ala Asp Gly Arg Phe Asp Glu Ile 180 185 190 Arg Arg Met Ala Gln Glu Ala Arg Asp Leu Val Lys Gln Ile Arg Arg 195 200 205 Lys Thr Ile Pro 210 <210> 307 <211> 639 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 307 ttgactttga aacaaggcgt gttgcctttg tattttaata aggacgagga ggtgagtatc 60 gctgttttaa aagctttata tgaagcggga attcgtacag ttgaatatac gaatcgtggt 120 gaagccgcat tgaaaaactt taagtcgttg cgcaaggtat gtgataccga attgaatgga 180 atgtacctcg gtattgggac gattaaaaat ggccagcagg cacaagcttt tgtggatgca 240 ggtgcagatt atttaattag tccgggtgta gtggatgatg cagcaaaagt tgccgatcaa 300 aatggtttgt tatatgtgcc tggtgcaatg accccaacag aaattatcag ggcagagcaa 360 caatttggat caacgctggt gaaacttttt ccgggtaata ttttaggccc tggctttgtt 420 agtgctatta aagaattgtt cagcggattg aaatttatta ttaccggagg agttgaaccg 480 gaagaaaata atttgaaagg atggttcaac gcaggtgccg cagctgtggg catgggaagt 540 aaattaatta ccaaacaggt tttggaaaat aaagactatg caaaaattac agagttaact 600 aaggaatctt taagactgat taaattggtc agagggtaa 639 <210> 308 <211> 212 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (2)...(199) <223> KDPG and KHG aldolase <400> 308 Met Thr Leu Lys Gln Gly Val Leu Pro Leu Tyr Phe Asn Lys Asp Glu 1 5 10 15 Glu Val Ser Ile Ala Val Leu Lys Ala Leu Tyr Glu Ala Gly Ile Arg 20 25 30 Thr Val Glu Tyr Thr Asn Arg Gly Glu Ala Ala Leu Lys Asn Phe Lys 35 40 45 Ser Leu Arg Lys Val Cys Asp Thr Glu Leu Asn Gly Met Tyr Leu Gly 50 55 60 Ile Gly Thr Ile Lys Asn Gly Gln Gln Ala Gln Ala Phe Val Asp Ala 65 70 75 80 Gly Ala Asp Tyr Leu Ile Ser Pro Gly Val Val Asp Asp Ala Ala Lys 85 90 95 Val Ala Asp Gln Asn Gly Leu Leu Tyr Val Pro Gly Ala Met Thr Pro 100 105 110 Thr Glu Ile Ile Arg Ala Glu Gln Gln Phe Gly Ser Thr Leu Val Lys 115 120 125 Leu Phe Pro Gly Asn Ile Leu Gly Pro Gly Phe Val Ser Ala Ile Lys 130 135 140 Glu Leu Phe Ser Gly Leu Lys Phe Ile Ile Thr Gly Gly Val Glu Pro 145 150 155 160 Glu Glu Asn Asn Leu Lys Gly Trp Phe Asn Ala Gly Ala Ala Ala Val 165 170 175 Gly Met Gly Ser Lys Leu Ile Thr Lys Gln Val Leu Glu Asn Lys Asp 180 185 190 Tyr Ala Lys Ile Thr Glu Leu Thr Lys Glu Ser Leu Arg Leu Ile Lys 195 200 205 Leu Val Arg Gly 210 <210> 309 <211> 687 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 309 atgagtattg ctgcaaatac aggtgtagac aaaaaaaatg agatcctaca attaacattg 60 caacaaggtg tgttgccttt gtattttaat aaagatgaag aagtgagtat tgctgttttg 120 aaagcgttat atgaggcagg cattcgcaca gttgagtata ccaatcgtgg agaagccgca 180 ttaaaaaatt ttaaagtact gagaaaaatt tgtgatacgg aattgagtgg attatacctg 240 ggtatcggca ccattaaaaa tggagaacag gcaaaagctt ttgttgatgc cggtgcagat 300 tatttaatta gtccgggtgt ggtagatgat gcagcaaaaa ttgctgatca aaatggattg 360 ttatatgtgc ctggtgccat gacgccaact gaaattatca gggcagaaca atttggtgca 420 acactggtaa aactttttcc cggtaatatt ttaggccctg gtttcgttag tgccgttaag 480 gaattattca gcggtttgaa atttatcatc actggtggag tagaacctga agaaaataat 540 ttgaaaggat ggtttaatgc aggtgctgcg gccgtaggaa tgggaagtaa attgatcaca 600 aaacaaactt tggaaaataa agactacgca aaaattacag agctcacgaa agagtcttta 660 agattgattg aactggtgcg gaaataa 687 <210> 310 <211> 228 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (16)...(215) <223> KDPG and KHG aldolase <400> 310 Met Ser Ile Ala Ala Asn Thr Gly Val Asp Lys Lys Asn Glu Ile Leu 1 5 10 15 Gln Leu Thr Leu Gln Gln Gly Val Leu Pro Leu Tyr Phe Asn Lys Asp 20 25 30 Glu Glu Val Ser Ile Ala Val Leu Lys Ala Leu Tyr Glu Ala Gly Ile 35 40 45 Arg Thr Val Glu Tyr Thr Asn Arg Gly Glu Ala Ala Leu Lys Asn Phe 50 55 60 Lys Val Leu Arg Lys Ile Cys Asp Thr Glu Leu Ser Gly Leu Tyr Leu 65 70 75 80 Gly Ile Gly Thr Ile Lys Asn Gly Glu Gln Ala Lys Ala Phe Val Asp 85 90 95 Ala Gly Ala Asp Tyr Leu Ile Ser Pro Gly Val Val Asp Asp Ala Ala 100 105 110 Lys Ile Ala Asp Gln Asn Gly Leu Leu Tyr Val Pro Gly Ala Met Thr 115 120 125 Pro Thr Glu Ile Ile Arg Ala Glu Gln Phe Gly Ala Thr Leu Val Lys 130 135 140 Leu Phe Pro Gly Asn Ile Leu Gly Pro Gly Phe Val Ser Ala Val Lys 145 150 155 160 Glu Leu Phe Ser Gly Leu Lys Phe Ile Ile Thr Gly Gly Val Glu Pro 165 170 175 Glu Glu Asn Asn Leu Lys Gly Trp Phe Asn Ala Gly Ala Ala Ala Val 180 185 190 Gly Met Gly Ser Lys Leu Ile Thr Lys Gln Thr Leu Glu Asn Lys Asp 195 200 205 Tyr Ala Lys Ile Thr Glu Leu Thr Lys Glu Ser Leu Arg Leu Ile Glu 210 215 220 Leu Val Arg Lys 225 <210> 311 <211> 600 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 311 atgatattcg ccgatgccat agccgaatgc ggcctcatcg ccatcctgcg cggcattgca 60 acggctgaaa ttgaagccgt gggacaagcc ctcatcgaag ccggcattcg cgtcgctgaa 120 attccgctga actcgccgga tccatttgcc tccatcgaga aaatggccaa ggccttcaag 180 ggcgagctgg ttgtcggggc tggaaccgtt ctcagtgtgc aggatgtcaa tttactgaaa 240 gcccatggcg gccagatcag cgtttctccc gattgcaacg aggcggtggt cgcacgcacc 300 aaagaactgg gtctggagcc cgttcccggc gtcttcacgc ccactgaggc ttttgccgcg 360 atccgcgccg gggcaaccca tatcaagttg tttccggcgg aagccgcaag ccccgcaacc 420 atcagggcct ggcgcgctgt tcttccaaag catgtgaaaa tctatccggt gggcggcatc 480 acgccagcaa atatgcaggg ctgggttgat gccggcgccg caggctttgg aattggctca 540 aatatctata agcagggggc cacagccgcc aacgtggcaa aggcggccaa ggaattcttt 600 <210> 312 <211> 200 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (4)...(198) <223> KDPG and KHG aldolase <400> 312 Met Ile Phe Ala Asp Ala Ile Ala Glu Cys Gly Leu Ile Ala Ile Leu 1 5 10 15 Arg Gly Ile Ala Thr Ala Glu Ile Glu Ala Val Gly Gln Ala Leu Ile 20 25 30 Glu Ala Gly Ile Arg Val Ala Glu Ile Pro Leu Asn Ser Pro Asp Pro 35 40 45 Phe Ala Ser Ile Glu Lys Met Ala Lys Ala Phe Lys Gly Glu Leu Val 50 55 60 Val Gly Ala Gly Thr Val Leu Ser Val Gln Asp Val Asn Leu Leu Lys 65 70 75 80 Ala His Gly Gly Gln Ile Ser Val Ser Pro Asp Cys Asn Glu Ala Val 85 90 95 Val Ala Arg Thr Lys Glu Leu Gly Leu Glu Pro Val Pro Gly Val Phe 100 105 110 Thr Pro Thr Glu Ala Phe Ala Ala Ile Arg Ala Gly Ala Thr His Ile 115 120 125 Lys Leu Phe Pro Ala Glu Ala Ala Ser Pro Ala Thr Ile Arg Ala Trp 130 135 140 Arg Ala Val Leu Pro Lys His Val Lys Ile Tyr Pro Val Gly Gly Ile 145 150 155 160 Thr Pro Ala Asn Met Gln Gly Trp Val Asp Ala Gly Ala Ala Gly Phe 165 170 175 Gly Ile Gly Ser Asn Ile Tyr Lys Gln Gly Ala Thr Ala Ala Asn Val 180 185 190 Ala Lys Ala Ala Lys Glu Phe Phe 195 200 <210> 313 <211> 681 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 313 atgagccagc ccgatagaaa cctgaaggag accgtgattg cgttaactaa ggaatgcggg 60 gttctgccct gcatcaagtt gcgcaaaaaa gatgatttta ttgcctatgc ccaggcgatg 120 tatgacggag gagctcgcgt catcgaagtg accatgacaa ctccaggcgc cctggaagcg 180 atcgaagcca tttcgtctgc ctttaaagac aaactctatg ttgcttcggg caccacattg 240 gacgcgtcca ctgcgcgcga ggtcatcact cacggcggaa gctgcattgt taatccttgt 300 gtcatccccg aagtgatcga tgtcgccaac cgctatggca ttccagttta ttccggagca 360 ttcactgcga ccgaggtgtt cacggcgatg cgcgccggag cgtccatggt caaaatattt 420 cccgggggtc tgggcggcgc caagtacatg accaatctga aaatggtatt cccagaagtg 480 aacctgattc cttcaggggg aattaacctt gataatgctc ccgaatttat tcgcgccggc 540 gcctgcgctg tcagtggtgc acgaactttc atggatcacg aaatgattgc caagcatggt 600 ttgaaatgga ttactcaaca gacgtcaaaa ttcattgaag tggttctgga agcgaagcgg 660 aacgctccag agttgccttg a 681 <210> 314 <211> 226 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (12)...(207) <223> KDPG and KHG aldolase <400> 314 Met Ser Gln Pro Asp Arg Asn Leu Lys Glu Thr Val Ile Ala Leu Thr 1 5 10 15 Lys Glu Cys Gly Val Leu Pro Cys Ile Lys Leu Arg Lys Lys Asp Asp 20 25 30 Phe Ile Ala Tyr Ala Gln Ala Met Tyr Asp Gly Gly Ala Arg Val Ile 35 40 45 Glu Val Thr Met Thr Thr Pro Gly Ala Leu Glu Ala Ile Glu Ala Ile 50 55 60 Ser Ser Ala Phe Lys Asp Lys Leu Tyr Val Ala Ser Gly Thr Thr Leu 65 70 75 80 Asp Ala Ser Thr Ala Arg Glu Val Ile Thr His Gly Gly Ser Cys Ile 85 90 95 Val Asn Pro Cys Val Ile Pro Glu Val Ile Asp Val Ala Asn Arg Tyr 100 105 110 Gly Ile Pro Val Tyr Ser Gly Ala Phe Thr Ala Thr Glu Val Phe Thr 115 120 125 Ala Met Arg Ala Gly Ala Ser Met Val Lys Ile Phe Pro Gly Gly Leu 130 135 140 Gly Gly Ala Lys Tyr Met Thr Asn Leu Lys Met Val Phe Pro Glu Val 145 150 155 160 Asn Leu Ile Pro Ser Gly Gly Ile Asn Leu Asp Asn Ala Pro Glu Phe 165 170 175 Ile Arg Ala Gly Ala Cys Ala Val Ser Gly Ala Arg Thr Phe Met Asp 180 185 190 His Glu Met Ile Ala Lys His Gly Leu Lys Trp Ile Thr Gln Gln Thr 195 200 205 Ser Lys Phe Ile Glu Val Val Leu Glu Ala Lys Arg Asn Ala Pro Glu 210 215 220 Leu Pro 225 <210> 315 <211> 576 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 315 atggcacaat ttacaagaat agaagttgca acagcaatga aagaaactgg gatgattcct 60 ttgtttttta acaacgattt agaattaagt aaaaaagtat taaaagcttg ttacgatggt 120 ggagcacgct taatggaatt tactgctcgt ggagattttg cacacgaagt ttttggtgaa 180 ttaacaaaat atgcaattgc agaattacca ggaatgatta tgggtgtagg ttctgtaacc 240 gatgcagctg cagcatcttt atacatggct ttaggagcaa actttattgt aactccagta 300 ttaagagaag atatagcaat tgtttgtaac agacgtaaag ttttatggtc tcctggttgt 360 ggaactttaa ctgaaattac taaggccgaa gaattaggat gtgaaattgt aaaattattc 420 cctggtgata tttatggacc tcaatttgta aaaggaatta aaggaccaca accttggact 480 agtgtaatgc caactggagg agtttctcca acaaaagaaa atttaacagg ttggtttaat 540 gcaggtgtaa cttgtgttgg aatgggatct caatta 576 <210> 316 <211> 192 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (9)...(192) <223> KDPG and KHG aldolase <220> <221> SITE <222> (176)...(179) <223> N-glycosylation site. Prosite id = PS00001 <400> 316 Met Ala Gln Phe Thr Arg Ile Glu Val Ala Thr Ala Met Lys Glu Thr 1 5 10 15 Gly Met Ile Pro Leu Phe Phe Asn Asn Asp Leu Glu Leu Ser Lys Lys 20 25 30 Val Leu Lys Ala Cys Tyr Asp Gly Gly Ala Arg Leu Met Glu Phe Thr 35 40 45 Ala Arg Gly Asp Phe Ala His Glu Val Phe Gly Glu Leu Thr Lys Tyr 50 55 60 Ala Ile Ala Glu Leu Pro Gly Met Ile Met Gly Val Gly Ser Val Thr 65 70 75 80 Asp Ala Ala Ala Ala Ser Leu Tyr Met Ala Leu Gly Ala Asn Phe Ile 85 90 95 Val Thr Pro Val Leu Arg Glu Asp Ile Ala Ile Val Cys Asn Arg Arg 100 105 110 Lys Val Leu Trp Ser Pro Gly Cys Gly Thr Leu Thr Glu Ile Thr Lys 115 120 125 Ala Glu Glu Leu Gly Cys Glu Ile Val Lys Leu Phe Pro Gly Asp Ile 130 135 140 Tyr Gly Pro Gln Phe Val Lys Gly Ile Lys Gly Pro Gln Pro Trp Thr 145 150 155 160 Ser Val Met Pro Thr Gly Gly Val Ser Pro Thr Lys Glu Asn Leu Thr 165 170 175 Gly Trp Phe Asn Ala Gly Val Thr Cys Val Gly Met Gly Ser Gln Leu 180 185 190 <210> 317 <211> 612 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 317 atgagcgggc gagagatcat tgcgatcctg cggggcgtgc gcccgaatga ggtggtggcc 60 attgggcacg ttctgctgga tgcaggtatc gacaagatcg aagttccgct gaattccccc 120 gatgcctttg aaagcattgc gcttttggcg gatgcgtttc acgatagtgc ggtgataggt 180 gctggcaccg ttctgacgcc acaagacgtg gtgaaggtgc atcaacaggg tggcgcgatg 240 gtggtatcgc ctgattgcaa tccggatgtg atcaaggcaa ccaaggcgct gggcatgttg 300 tcttaccccg gtgttttcac cccgaccgaa gcttttaccg ccctgcgttc tggtgcggat 360 gggatcaaac tgtttcctgc ttcaggcatt ggccctgcag ggctggccgc gatgttggcc 420 gttttgccca caggcatgcg cagctatgcg gtggggggcg tcgggccaga tagcttcgcg 480 ccttggatcg gagttggcgt gaccggattt ggcattggaa cgggcctgtt caaaccgggg 540 tttggcacgg ctgatgtggc taaacgggca gcggacattg tggcggccta tgatcggggt 600 attttgaaat ga 612 <210> 318 <211> 203 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (1)...(192) <223> KDPG and KHG aldolase <400> 318 Met Ser Gly Arg Glu Ile Ile Ala Ile Leu Arg Gly Val Arg Pro Asn 1 5 10 15 Glu Val Val Ala Ile Gly His Val Leu Leu Asp Ala Gly Ile Asp Lys 20 25 30 Ile Glu Val Pro Leu Asn Ser Pro Asp Ala Phe Glu Ser Ile Ala Leu 35 40 45 Leu Ala Asp Ala Phe His Asp Ser Ala Val Ile Gly Ala Gly Thr Val 50 55 60 Leu Thr Pro Gln Asp Val Val Lys Val His Gln Gln Gly Gly Ala Met 65 70 75 80 Val Val Ser Pro Asp Cys Asn Pro Asp Val Ile Lys Ala Thr Lys Ala 85 90 95 Leu Gly Met Leu Ser Tyr Pro Gly Val Phe Thr Pro Thr Glu Ala Phe 100 105 110 Thr Ala Leu Arg Ser Gly Ala Asp Gly Ile Lys Leu Phe Pro Ala Ser 115 120 125 Gly Ile Gly Pro Ala Gly Leu Ala Ala Met Leu Ala Val Leu Pro Thr 130 135 140 Gly Met Arg Ser Tyr Ala Val Gly Gly Val Gly Pro Asp Ser Phe Ala 145 150 155 160 Pro Trp Ile Gly Val Gly Val Thr Gly Phe Gly Ile Gly Thr Gly Leu 165 170 175 Phe Lys Pro Gly Phe Gly Thr Ala Asp Val Ala Lys Arg Ala Ala Asp 180 185 190 Ile Val Ala Ala Tyr Asp Arg Gly Ile Leu Lys 195 200 <210> 319 <211> 600 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 319 gtgccggttc tggtcatcga agacgtcaat gatgccgtgc cgcttgccaa ggccttggtg 60 gccggtggtt tgcgcgtgct tgaaatcacc ctgcgcagtg ccgccgccga ggaaagcatt 120 aaacgtatta tcgccgaagt tcccgatgca attaccggtg cgggcaccgt gatcaatgcc 180 aaacagatgg aacgtatggc cgaaatcggt tgtgcttttg cggtttcgcc gggccatacc 240 gatggtttgc ttaaggccgc caaagatacc ggcgtgccgt tgctgcccgg tgccggaacg 300 ccgtctgaaa tcatgcatct gattgatcat ggctatgaca tcttgaaatt cttcccggcc 360 gaacaacagg gcggtgtttc gatgcttaaa gccctgtctg gcccgctgcc acaggtgaaa 420 ttctgcccga cgggtggtgt gtcgctggca aatttggggg attatctcgc cctgccaaat 480 atcatcaccg ttggtgggtc gtgggtctcg ccaaaaagcg cggtcaaggc cggtgactgg 540 gcaacgatca cgcgcctggc acaggaagca accgacaagg ttgccgaact tcgcggttaa 600 <210> 320 <211> 199 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (1)...(186) <223> KDPG and KHG aldolase <220> <221> SITE <222> (23)...(32) <223> KDPG and KHG aldolases active site. Prosite id = PS00159 <220> <221> SITE <222> (112)...(125) <223> KDPG and KHG aldolases Schiff-base forming residue. Prosite id = PS00160 <400> 320 Met Pro Val Leu Val Ile Glu Asp Val Asn Asp Ala Val Pro Leu Ala 1 5 10 15 Lys Ala Leu Val Ala Gly Gly Leu Arg Val Leu Glu Ile Thr Leu Arg 20 25 30 Ser Ala Ala Ala Glu Glu Ser Ile Lys Arg Ile Ile Ala Glu Val Pro 35 40 45 Asp Ala Ile Thr Gly Ala Gly Thr Val Ile Asn Ala Lys Gln Met Glu 50 55 60 Arg Met Ala Glu Ile Gly Cys Ala Phe Ala Val Ser Pro Gly His Thr 65 70 75 80 Asp Gly Leu Leu Lys Ala Ala Lys Asp Thr Gly Val Pro Leu Leu Pro 85 90 95 Gly Ala Gly Thr Pro Ser Glu Ile Met His Leu Ile Asp His Gly Tyr 100 105 110 Asp Ile Leu Lys Phe Phe Pro Ala Glu Gln Gln Gly Gly Val Ser Met 115 120 125 Leu Lys Ala Leu Ser Gly Pro Leu Pro Gln Val Lys Phe Cys Pro Thr 130 135 140 Gly Gly Val Ser Leu Ala Asn Leu Gly Asp Tyr Leu Ala Leu Pro Asn 145 150 155 160 Ile Ile Thr Val Gly Gly Ser Trp Val Ser Pro Lys Ser Ala Val Lys 165 170 175 Ala Gly Asp Trp Ala Thr Ile Thr Arg Leu Ala Gln Glu Ala Thr Asp 180 185 190 Lys Val Ala Glu Leu Arg Gly 195 <210> 321 <211> 654 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 321 atgaccagcg aaacgaacca gatattagag gcgaaatttg ccgctgcgcc ggtggtgccc 60 ctgatcgaag ccagtgaccc tacggttgcg gtagcaatcg caaaagcgct gcaggcgggc 120 ggcctcgatg tgatcgaagt cgtcctccgg accgacgcgg cgctcgattg catggaagcc 180 attatcgcgg agacttcgga catcattgtt ggcgcgggaa caatcttgac cgctgacgat 240 gcgaaggcag ctgttacccg cggcgcgcag ttcattgtgt gcccgggact ggtcgacgcg 300 gtggtcaatt tctgcaaggc aaatgatctt ccggtcttcc cgggaacaat gaccccgggc 360 gaagtgcaac aggcccataa tctcggtctc ggaacggtga aattctttcc cgccaaactc 420 gctggcggtg tgccgatgct caaggcattg agctcggtct ttcgcaatat gcgtttcatg 480 ccgacgggtg gggtgtcagc agagaatctg ggcgaatttc tggccgtgcc ttccgtaatt 540 gcctgcggcg gtagctggct cacgccgaaa gcggctatcg acgcgggcga ttacgatgca 600 atcaccaagc tggcccgtga agctgtcgct ctcgcacgtg cctctagacc ataa 654 <210> 322 <211> 217 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (9)...(204) <223> KDPG and KHG aldolase <400> 322 Met Thr Ser Glu Thr Asn Gln Ile Leu Glu Ala Lys Phe Ala Ala Ala 1 5 10 15 Pro Val Val Pro Leu Ile Glu Ala Ser Asp Pro Thr Val Ala Val Ala 20 25 30 Ile Ala Lys Ala Leu Gln Ala Gly Gly Leu Asp Val Ile Glu Val Val 35 40 45 Leu Arg Thr Asp Ala Ala Leu Asp Cys Met Glu Ala Ile Ile Ala Glu 50 55 60 Thr Ser Asp Ile Ile Val Gly Ala Gly Thr Ile Leu Thr Ala Asp Asp 65 70 75 80 Ala Lys Ala Ala Val Thr Arg Gly Ala Gln Phe Ile Val Cys Pro Gly 85 90 95 Leu Val Asp Ala Val Val Asn Phe Cys Lys Ala Asn Asp Leu Pro Val 100 105 110 Phe Pro Gly Thr Met Thr Pro Gly Glu Val Gln Gln Ala His Asn Leu 115 120 125 Gly Leu Gly Thr Val Lys Phe Phe Pro Ala Lys Leu Ala Gly Gly Val 130 135 140 Pro Met Leu Lys Ala Leu Ser Ser Val Phe Arg Asn Met Arg Phe Met 145 150 155 160 Pro Thr Gly Gly Val Ser Ala Glu Asn Leu Gly Glu Phe Leu Ala Val 165 170 175 Pro Ser Val Ile Ala Cys Gly Gly Ser Trp Leu Thr Pro Lys Ala Ala 180 185 190 Ile Asp Ala Gly Asp Tyr Asp Ala Ile Thr Lys Leu Ala Arg Glu Ala 195 200 205 Val Ala Leu Ala Arg Ala Ser Arg Pro 210 215 <210> 323 <211> 603 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 323 atgacgttcc ccctgagatc actcgtggaa gccgcgacca aggcaccgat tgtacccgtt 60 ctggtcgtcg accgcattga agttgcggcc ccccttgcgc gggcgcttgt tgatggcggc 120 ctgacaattg ccgaagtcac gctgcgaaca ccttcggggc tggcggtaat cgaagagatg 180 aaatccgccg agcccggcct gaaggtcggc gcgggcaccg tgttgaccga atccgatgtc 240 gagaacgcat tggcggccgg cgcggatttc ctcgtggcac cgggcatgtc gccaaaactg 300 ttggccggac tgggtggcca ccgccgcctg atgatccctg gcgttgcgac agccagcgaa 360 gccatggcca ggcacgagga cgggttcgac ctgttgaaac tgtttccggc ctcgattgcc 420 ggcggagtca gcgctctcaa ggcgcttggc ggtccgctgc cgcacctgcg cttcatgccg 480 accggcggca tcaccgaggc ggatgtcggc aaatacctcg cccttcccaa tgttttcgcg 540 gccggaggct cgtggattgc gacgggcgcc gacattgctg ccgaagactc gagccgaatt 600 ctt 603 <210> 324 <211> 201 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (9)...(201) <223> KDPG and KHG aldolase <220> <221> SITE <222> (40)...(49) <223> KDPG and KHG aldolases active site. Prosite id = PS00159 <400> 324 Met Thr Phe Pro Leu Arg Ser Leu Val Glu Ala Ala Thr Lys Ala Pro 1 5 10 15 Ile Val Pro Val Leu Val Val Asp Arg Ile Glu Val Ala Ala Pro Leu 20 25 30 Ala Arg Ala Leu Val Asp Gly Gly Leu Thr Ile Ala Glu Val Thr Leu 35 40 45 Arg Thr Pro Ser Gly Leu Ala Val Ile Glu Glu Met Lys Ser Ala Glu 50 55 60 Pro Gly Leu Lys Val Gly Ala Gly Thr Val Leu Thr Glu Ser Asp Val 65 70 75 80 Glu Asn Ala Leu Ala Ala Gly Ala Asp Phe Leu Val Ala Pro Gly Met 85 90 95 Ser Pro Lys Leu Leu Ala Gly Leu Gly Gly His Arg Arg Leu Met Ile 100 105 110 Pro Gly Val Ala Thr Ala Ser Glu Ala Met Ala Arg His Glu Asp Gly 115 120 125 Phe Asp Leu Leu Lys Leu Phe Pro Ala Ser Ile Ala Gly Gly Val Ser 130 135 140 Ala Leu Lys Ala Leu Gly Gly Pro Leu Pro His Leu Arg Phe Met Pro 145 150 155 160 Thr Gly Gly Ile Thr Glu Ala Asp Val Gly Lys Tyr Leu Ala Leu Pro 165 170 175 Asn Val Phe Ala Ala Gly Gly Ser Trp Ile Ala Thr Gly Ala Asp Ile 180 185 190 Ala Ala Glu Asp Ser Ser Arg Ile Leu 195 200 <210> 325 <211> 648 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 325 atacaagaag taaaggagat tggtttattg cctttatatt atcacgacga tgcagctatt 60 tgtctgaaag tagctaatac tttgtatgat gccgatgtaa aatgcataga atttacaaac 120 cgtggtgaat atgcacttac aaactttaaa cacttagtga agctgagaga tgaaaagatg 180 aaaggtctat tgcttgcagt gggcacaatt aaaaccggga cggatgctca gaaatttatt 240 gatgccggtg ccgatttttt gatcagccca atatttgaca gcagcgtttg cgatacggcc 300 tatttgaata aaacgttgtg gataccaggt tgtacaacgc caacagaaat tcatgtagca 360 cagcaagcgg gttgtaagct tatcaaatta ttcccgggaa atgtactggg gccgggtttt 420 gtagaagcga tcatgccatt attcagtgga attgatttta cgatcactgg tggagtagaa 480 gcaacagaag caaatctggg tgcctggttt aaatcaggtg tgaaggtagt tggaatgggc 540 agcaagctta taacaaaaga cattttaaag aatggtgatt atgatggatt gaaagctaaa 600 acaaaagaag tgctttcaat aattcgacat attaaatcag ctaaatag 648 <210> 326 <211> 215 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (1)...(200) <223> KDPG and KHG aldolase <220> <221> SITE <222> (104)...(107) <223> N-glycosylation site. Prosite id = PS00001 <400> 326 Ile Gln Glu Val Lys Glu Ile Gly Leu Leu Pro Leu Tyr Tyr His Asp 1 5 10 15 Asp Ala Ala Ile Cys Leu Lys Val Ala Asn Thr Leu Tyr Asp Ala Asp 20 25 30 Val Lys Cys Ile Glu Phe Thr Asn Arg Gly Glu Tyr Ala Leu Thr Asn 35 40 45 Phe Lys His Leu Val Lys Leu Arg Asp Glu Lys Met Lys Gly Leu Leu 50 55 60 Leu Ala Val Gly Thr Ile Lys Thr Gly Thr Asp Ala Gln Lys Phe Ile 65 70 75 80 Asp Ala Gly Ala Asp Phe Leu Ile Ser Pro Ile Phe Asp Ser Ser Val 85 90 95 Cys Asp Thr Ala Tyr Leu Asn Lys Thr Leu Trp Ile Pro Gly Cys Thr 100 105 110 Thr Pro Thr Glu Ile His Val Ala Gln Gln Ala Gly Cys Lys Leu Ile 115 120 125 Lys Leu Phe Pro Gly Asn Val Leu Gly Pro Gly Phe Val Glu Ala Ile 130 135 140 Met Pro Leu Phe Ser Gly Ile Asp Phe Thr Ile Thr Gly Gly Val Glu 145 150 155 160 Ala Thr Glu Ala Asn Leu Gly Ala Trp Phe Lys Ser Gly Val Lys Val 165 170 175 Val Gly Met Gly Ser Lys Leu Ile Thr Lys Asp Ile Leu Lys Asn Gly 180 185 190 Asp Tyr Asp Gly Leu Lys Ala Lys Thr Lys Glu Val Leu Ser Ile Ile 195 200 205 Arg His Ile Lys Ser Ala Lys 210 215 <210> 327 <211> 642 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 327 atggaacaat ctatctttga ttacttctac aaaatcggcg tcattcccgt actggaaatc 60 gactcggcgc ttcatgccaa accgttagcc gaggcgctgc tggcaggagg tctgcctatc 120 gccgagatca cactgcgcac cgaggcagcg ctcgaggcga ttcgcactat tgcgcgcgat 180 gtaccggatg tcatcgtcgg ggctggaacc gtgataacct gggaacaagc cgaagcggca 240 cgtgacgcgg gcgcgcaatt tctcgtctca cccgggatgg tggagcaggt tgtcatctgg 300 gcacaggaaa atcaaatccc tgttctgccc ggcgctgtga cccccaccga gatgatccgc 360 gccatccatc tcggtttgaa gtttctgaaa tttttcccat cggaagctgt aggcggactc 420 aaagccctca aggccctctc agaccccttt ccgggattgc gatttatccc aaccggtgga 480 gtgaagtttg agaatctggc ggattatcta caaatggaaa agatccacgc tgtcggcggc 540 tcgtggatgg caaagcgcca gatgatcgcc gaccgaaaat tcgacgagat tacgcgattg 600 gcgaatgaag ccagcgacct tgtgacaaaa atcaggaagt ag 642 <210> 328 <211> 213 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (5)...(200) <223> KDPG and KHG aldolase <220> <221> SITE <222> (37)...(46) <223> KDPG and KHG aldolases active site. Prosite id = PS00159 <400> 328 Met Glu Gln Ser Ile Phe Asp Tyr Phe Tyr Lys Ile Gly Val Ile Pro 1 5 10 15 Val Leu Glu Ile Asp Ser Ala Leu His Ala Lys Pro Leu Ala Glu Ala 20 25 30 Leu Leu Ala Gly Gly Leu Pro Ile Ala Glu Ile Thr Leu Arg Thr Glu 35 40 45 Ala Ala Leu Glu Ala Ile Arg Thr Ile Ala Arg Asp Val Pro Asp Val 50 55 60 Ile Val Gly Ala Gly Thr Val Ile Thr Trp Glu Gln Ala Glu Ala Ala 65 70 75 80 Arg Asp Ala Gly Ala Gln Phe Leu Val Ser Pro Gly Met Val Glu Gln 85 90 95 Val Val Ile Trp Ala Gln Glu Asn Gln Ile Pro Val Leu Pro Gly Ala 100 105 110 Val Thr Pro Thr Glu Met Ile Arg Ala Ile His Leu Gly Leu Lys Phe 115 120 125 Leu Lys Phe Phe Pro Ser Glu Ala Val Gly Gly Leu Lys Ala Leu Lys 130 135 140 Ala Leu Ser Asp Pro Phe Pro Gly Leu Arg Phe Ile Pro Thr Gly Gly 145 150 155 160 Val Lys Phe Glu Asn Leu Ala Asp Tyr Leu Gln Met Glu Lys Ile His 165 170 175 Ala Val Gly Gly Ser Trp Met Ala Lys Arg Gln Met Ile Ala Asp Arg 180 185 190 Lys Phe Asp Glu Ile Thr Arg Leu Ala Asn Glu Ala Ser Asp Leu Val 195 200 205 Thr Lys Ile Arg Lys 210 <210> 329 <211> 618 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 329 atgactcgct tttctgaact tatgtcaggg caaacattac tgcctataat tcaagccgac 60 acaccagagc aaggcgttaa aatagctcaa gctatggcta atgctggcct tactttggtt 120 gaagtagtac ttagaactga tgcatcgtta gatgcattaa aagctattaa agagcaggtg 180 ccagcgctta aagtaggtgc aggcacagta ataaatactg acattttaga gcaagcactt 240 gcagcaggtg ccgactttat tgttacgcca gcagtgtctc cgcaattatt agccgcgcta 300 acaaaatgca atgtgccggt acttcctggt gtgtctaaca cgggtgacat tttaatggcg 360 cttgagtacg gttttgaaga acaaaaatta ttccctgcat cgctcgctgg tggtgcacca 420 ttcgtatcgg ctgtctcgtc agtatttaga gctgctagct tttgtcctac aggtggcgta 480 agcgagcaaa ataaaatgga ttacttatct ttaaataatg tatttgctgt gggtggtact 540 tggattgcaa ataaagagtg ggttgcacaa gaaaactggc aagcaattac tgactcgtgt 600 attcaagcat taaagtag 618 <210> 330 <211> 205 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (4)...(199) <223> KDPG and KHG aldolase <400> 330 Met Thr Arg Phe Ser Glu Leu Met Ser Gly Gln Thr Leu Leu Pro Ile 1 5 10 15 Ile Gln Ala Asp Thr Pro Glu Gln Gly Val Lys Ile Ala Gln Ala Met 20 25 30 Ala Asn Ala Gly Leu Thr Leu Val Glu Val Val Leu Arg Thr Asp Ala 35 40 45 Ser Leu Asp Ala Leu Lys Ala Ile Lys Glu Gln Val Pro Ala Leu Lys 50 55 60 Val Gly Ala Gly Thr Val Ile Asn Thr Asp Ile Leu Glu Gln Ala Leu 65 70 75 80 Ala Ala Gly Ala Asp Phe Ile Val Thr Pro Ala Val Ser Pro Gln Leu 85 90 95 Leu Ala Ala Leu Thr Lys Cys Asn Val Pro Val Leu Pro Gly Val Ser 100 105 110 Asn Thr Gly Asp Ile Leu Met Ala Leu Glu Tyr Gly Phe Glu Glu Gln 115 120 125 Lys Leu Phe Pro Ala Ser Leu Ala Gly Gly Ala Pro Phe Val Ser Ala 130 135 140 Val Ser Ser Val Phe Arg Ala Ala Ser Phe Cys Pro Thr Gly Gly Val 145 150 155 160 Ser Glu Gln Asn Lys Met Asp Tyr Leu Ser Leu Asn Asn Val Phe Ala 165 170 175 Val Gly Gly Thr Trp Ile Ala Asn Lys Glu Trp Val Ala Gln Glu Asn 180 185 190 Trp Gln Ala Ile Thr Asp Ser Cys Ile Gln Ala Leu Lys 195 200 205 <210> 331 <211> 663 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 331 atggcatatc cgaccgcggt caattcacag attaccgaca cagcaggcaa ggttttgcat 60 cgcaaactga ttgctatttt acgcggagtg aagcccgatg aagcggcatc catggcgcgt 120 gtgctggtcg atgccgggat cacgatgatc gaggtgccgc tgaattcccc ggaaccgctt 180 aaaagcattg cgatcatgaa ggcagaagtc ggtgacgcgg ccctgatcgg ggcaggtacg 240 gtcttaacgg tcgaggatgt tgtgaacgtt cgtgacgcgg gcggtgagtt tgttgtgtcg 300 cccaattacg atgtcgatgt gattaaaaaa accaaggaag tcggtatggg aagttggccg 360 ggggtgctga ctccgaccga atgtttcgcc gcgatcaagg ccggggcgga tgggcttaaa 420 atattccctg ccagcatcat tggcgcatcg gggatttcgg cgatgcgggc ggttttgcca 480 aaagatatgc cggtttatgc ggttggtggt gttgggccgg atgattttgc gacctatgcc 540 aaggcggggt gcgatggttt cggccttgga tcggggattt ataaacccgg cctgacagcg 600 gacgaagtat cggggcgcgc tattgccttc gtaacggcgc atgacgcggt atttgcgggc 660 tag 663 <210> 332 <211> 220 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (15)...(211) <223> KDPG and KHG aldolase <400> 332 Met Ala Tyr Pro Thr Ala Val Asn Ser Gln Ile Thr Asp Thr Ala Gly 1 5 10 15 Lys Val Leu His Arg Lys Leu Ile Ala Ile Leu Arg Gly Val Lys Pro 20 25 30 Asp Glu Ala Ala Ser Met Ala Arg Val Leu Val Asp Ala Gly Ile Thr 35 40 45 Met Ile Glu Val Pro Leu Asn Ser Pro Glu Pro Leu Lys Ser Ile Ala 50 55 60 Ile Met Lys Ala Glu Val Gly Asp Ala Ala Leu Ile Gly Ala Gly Thr 65 70 75 80 Val Leu Thr Val Glu Asp Val Val Asn Val Arg Asp Ala Gly Gly Glu 85 90 95 Phe Val Val Ser Pro Asn Tyr Asp Val Asp Val Ile Lys Lys Thr Lys 100 105 110 Glu Val Gly Met Gly Ser Trp Pro Gly Val Leu Thr Pro Thr Glu Cys 115 120 125 Phe Ala Ala Ile Lys Ala Gly Ala Asp Gly Leu Lys Ile Phe Pro Ala 130 135 140 Ser Ile Ile Gly Ala Ser Gly Ile Ser Ala Met Arg Ala Val Leu Pro 145 150 155 160 Lys Asp Met Pro Val Tyr Ala Val Gly Gly Val Gly Pro Asp Asp Phe 165 170 175 Ala Thr Tyr Ala Lys Ala Gly Cys Asp Gly Phe Gly Leu Gly Ser Gly 180 185 190 Ile Tyr Lys Pro Gly Leu Thr Ala Asp Glu Val Ser Gly Arg Ala Ile 195 200 205 Ala Phe Val Thr Ala His Asp Ala Val Phe Ala Gly 210 215 220 <210> 333 <211> 648 <212> DNA <213> Unknown <220> <223> DNA obtained from environmental sample <400> 333 atggcgattg atcccgccgc tgccagtcgg cgcatgcgcg aattggcggc gctggccccg 60 gtgatcccgg tgctggtgat cgaggatgcc gcaagggcga ggcccctggc cgaggcgctg 120 gtggcgggtg gtctgccggt gctggaggtg acgctgcgca ccccggccgc gccagaggtc 180 attcgcgaga tgtcccgggt cccgggggcc attgtcggcg ccggcaccgt gatcacaccg 240 gccgacgtgc ggatcgcaca agcggcgggg gcccgattcg ccgtctcccc cggcgcgacc 300 gatgcgttgc tcgatgcctg cgaagcggcg gggctgccgc tcctgcccgg cgcggccacg 360 gcgagcgagg cgatggcgct tctggcgcgc ggctacgaca tgctgaagtt ctttcccgcc 420 gaggcagtgg gcggcgcggc ggcgcttgca gcgctgggcg cgccgctgcc gcagatttcc 480 ttctgcccga ccggaggggt cagcccggca aacgcgcccg actacctcgc cttgcccacg 540 gttccctgcg tcggcggcag ctgggtggcc ccgaaaccac aggtcgccgc cggcgactgg 600 gacgcgatcc gtgccctcgc cgaacacgcc cgcaccctcg cgccctga 648 <210> 334 <211> 215 <212> PRT <213> Unknown <220> <223> Protein obtained from environmental sample <220> <221> DOMAIN <222> (12)...(206) <223> KDPG and KHG aldolase <220> <221> SITE <222> (44)...(53) <223> KDPG and KHG aldolases active site. Prosite id = PS00159 <220> <221> SITE <222> (133)...(146) <223> KDPG and KHG aldolases Schiff-base forming residue. Prosite id = PS00160 <400> 334 Met Ala Ile Asp Pro Ala Ala Ala Ser Arg Arg Met Arg Glu Leu Ala 1 5 10 15 Ala Leu Ala Pro Val Ile Pro Val Leu Val Ile Glu Asp Ala Ala Arg 20 25 30 Ala Arg Pro Leu Ala Glu Ala Leu Val Ala Gly Gly Leu Pro Val Leu 35 40 45 Glu Val Thr Leu Arg Thr Pro Ala Ala Pro Glu Val Ile Arg Glu Met 50 55 60 Ser Arg Val Pro Gly Ala Ile Val Gly Ala Gly Thr Val Ile Thr Pro 65 70 75 80 Ala Asp Val Arg Ile Ala Gln Ala Ala Gly Ala Arg Phe Ala Val Ser 85 90 95 Pro Gly Ala Thr Asp Ala Leu Leu Asp Ala Cys Glu Ala Ala Gly Leu 100 105 110 Pro Leu Leu Pro Gly Ala Ala Thr Ala Ser Glu Ala Met Ala Leu Leu 115 120 125 Ala Arg Gly Tyr Asp Met Leu Lys Phe Phe Pro Ala Glu Ala Val Gly 130 135 140 Gly Ala Ala Ala Leu Ala Ala Leu Gly Ala Pro Leu Pro Gln Ile Ser 145 150 155 160 Phe Cys Pro Thr Gly Gly Val Ser Pro Ala Asn Ala Pro Asp Tyr Leu 165 170 175 Ala Leu Pro Thr Val Pro Cys Val Gly Gly Ser Trp Val Ala Pro Lys 180 185 190 Pro Gln Val Ala Ala Gly Asp Trp Asp Ala Ile Arg Ala Leu Ala Glu 195 200 205 His Ala Arg Thr Leu Ala Pro 210 215 <210> 335 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Primer <220> <221> misc_feature <222> (1)..(19) <223> b is c, g, or t <220> <221> misc_feature <222> (1)..(19) <223> y is c or t <220> <221> misc_feature <222> (1)..(19) <223> r is a or g <220> <221> misc_feature <222> (1)..(19) <223> w is a or t <400> 335 aargtbtwyg argacaatg 19 <210> 336 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Primer <220> <221> misc_feature <222> (1)..(18) <223> d is a, g, or t <220> <221> misc_feature <222> (1)..(18) <223> y is c or t <220> <221> misc_feature <222> (1)..(18) <223> r is a or g <220> <221> misc_feature <222> (1)..(18) <223> w is a or t <400> 336 gcdcagawca ayggrtgg 18 <210> 337 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Primer <220> <221> misc_feature <222> (1)..(23) <223> d is a, g, or t <220> <221> misc_feature <222> (1)..(23) <223> y is c or t <220> <221> misc_feature <222> (1)..(23) <223> r is a or g <220> <221> misc_feature <222> (1)..(23) <223> s is c or g <400> 337 ccatcrsyat cdgcrtadag cca 23 <210> 338 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Primer <220> <221> misc_feature <222> (1)..(20) <223> d is a, g, or t <220> <221> misc_feature <222> (1)..(20) <223> y is c or t <220> <221> misc_feature <222> (1)..(20) <223> r is a or g <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, or t <400> 338 gcrtadagcc aytcnccrtc 20 <210> 339 <211> 30 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 339 ataagacata tgcctatcgt tgttacgaag 30 <210> 340 <211> 33 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 340 ataagaggat ccttattcct cgggcagccg ctc 33 <210> 341 <211> 30 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 341 ataagacata tgaacagacc tgtggttgtc 30 <210> 342 <211> 33 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 342 ataagaggat ccttacaggt acttgagacc gag 33 <210> 343 <211> 30 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 343 ataagacata tgagcgtggt catccgaaac 30 <210> 344 <211> 33 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 344 ataagaggat ccttacttcg ctttgttata ggc 33 <210> 345 <211> 30 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 345 ataagacata tgaacaagcc cgtggttgtg 30 <210> 346 <211> 34 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 346 ataagaggat ccttacaagt acttgagacc gagg 34 <210> 347 <211> 29 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 347 ataagacata tgagcgtggt cgtcaccgg 29 <210> 348 <211> 34 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 348 ataagaggat ccttagccgt ttttcccgtc ggtg 34 <210> 349 <211> 33 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 349 agaagacata tgatgagcat cgtcgtccag aac 33 <210> 350 <211> 34 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 350 agaagaggat cctcagacat atttcaggcc cttg 34 <210> 351 <211> 30 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 351 agaagacata tgatgagcgt ggtcatcacc 30 <210> 352 <211> 33 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 352 acaacaggat ccctatttct tctccggcgt ttc 33 <210> 353 <211> 30 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 353 ataatacata tgagcgtcgt cgttcagaac 30 <210> 354 <211> 34 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 354 ataataggat ccttagacat atttgagccc cttc 34 <210> 355 <211> 33 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 355 agaagacata tgatgtcggt tgtcgttcag aac 33 <210> 356 <211> 31 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 356 agaagaggat cctcagatat acttcaggcc c 31 <210> 357 <211> 852 <212> DNA <213> Artificial sequence <220> <223> ATCC 4978 DAAT <400> 357 atgagttata gcttatggaa tgaccaaatt gtgaatgatg aagaagtagt agttgataag 60 gaggaccgtg gctatcaatt tggcgatggt gtttatgaag ttgtaaaagt atataacggt 120 gaattattta cagcggagga gcatgtcgat cgtttttacg cgagtgctga aaaaattcgc 180 gttacgatcc cttatacaaa agacaaattg catcaattat tgcatcagtt agttgaaatg 240 aataaagttc aaacaggaca tatttatttc caaattacgc gtggtgcagg ccctcgtaat 300 catattttcc ctggtgatga agtgaagcca gtattaacag gtaataccaa ggaaaatcca 360 cgtcccgtag caaactttga aaaaggtgtg aaagcaacat ttgtagaaga cattcgttgg 420 ttacgctgtg acattaaatc attaaattta cttggtgcgg tacttgctaa acaagaagca 480 catgaaaaag gatgctatga agcggtttta catcgtgatg aaatcgtaac agaaggctct 540 tcttcaaata tttatggaat taaagatggc gtattataca cacatccagc gaataacttc 600 atcttaaatg gtattacacg tcaagtaatc attaaatgtg ctgctgaaat tggcttacca 660 gtgaaggaag aagcaatgac aaaaactcag cttcttgcaa tggatgaagt gattgtttca 720 tcaacgactt cagaagtaac gccaattatc gacatagatg gaacagtaat tggtgcgggt 780 aaaccgggtg actggacacg taaattacaa gcacaatttg atacgaaaat cccaaaaggt 840 attcgcgcat aa 852 <210> 358 <211> 283 <212> PRT <213> Artificial sequence <220> <223> ATCC 4978 DAAT <400> 358 Met Ser Tyr Ser Leu Trp Asn Asp Gln Ile Val Asn Asp Glu Glu Val 1 5 10 15 Val Val Asp Lys Glu Asp Arg Gly Tyr Gln Phe Gly Asp Gly Val Tyr 20 25 30 Glu Val Val Lys Val Tyr Asn Gly Glu Leu Phe Thr Ala Glu Glu His 35 40 45 Val Asp Arg Phe Tyr Ala Ser Ala Glu Lys Ile Arg Val Thr Ile Pro 50 55 60 Tyr Thr Lys Asp Lys Leu His Gln Leu Leu His Gln Leu Val Glu Met 65 70 75 80 Asn Lys Val Gln Thr Gly His Ile Tyr Phe Gln Ile Thr Arg Gly Ala 85 90 95 Gly Pro Arg Asn His Ile Phe Pro Gly Asp Glu Val Lys Pro Val Leu 100 105 110 Thr Gly Asn Thr Lys Glu Asn Pro Arg Pro Val Ala Asn Phe Glu Lys 115 120 125 Gly Val Lys Ala Thr Phe Val Glu Asp Ile Arg Trp Leu Arg Cys Asp 130 135 140 Ile Lys Ser Leu Asn Leu Leu Gly Ala Val Leu Ala Lys Gln Glu Ala 145 150 155 160 His Glu Lys Gly Cys Tyr Glu Ala Val Leu His Arg Asp Glu Ile Val 165 170 175 Thr Glu Gly Ser Ser Ser Asn Ile Tyr Gly Ile Lys Asp Gly Val Leu 180 185 190 Tyr Thr His Pro Ala Asn Asn Phe Ile Leu Asn Gly Ile Thr Arg Gln 195 200 205 Val Ile Ile Lys Cys Ala Ala Glu Ile Gly Leu Pro Val Lys Glu Glu 210 215 220 Ala Met Thr Lys Thr Gln Leu Leu Ala Met Asp Glu Val Ile Val Ser 225 230 235 240 Ser Thr Thr Ser Glu Val Thr Pro Ile Ile Asp Ile Asp Gly Thr Val 245 250 255 Ile Gly Ala Gly Lys Pro Gly Asp Trp Thr Arg Lys Leu Gln Ala Gln 260 265 270 Phe Asp Thr Lys Ile Pro Lys Gly Ile Arg Ala 275 280 <210> 359 <211> 35 <212> DNA <213> Artificial sequence <220> <223> Mutagenic primer <400> 359 gtgattgttt catcaacgaa ttcagaagta acgcc 35 <210> 360 <211> 35 <212> DNA <213> Artificial sequence <220> <223> Mutagenic primer <400> 360 gtgattgttt catcaacgcg ttcagaagta acgcc 35 <210> 361 <211> 35 <212> DNA <213> Artificial sequence <220> <223> Mutagenic primer <400> 361 gtgattgttt catcaacgag ttcagaagta acgcc 35 <210> 362 <211> 35 <212> DNA <213> Artificial sequence <220> <223> Mutagenic primer <400> 362 gtgattgttt catcaacggc ttcagaagta acgcc 35 <210> 363 <211> 31 <212> DNA <213> Artificial sequence <220> <223> Mutagenic primer <400> 363 gtgcaggccc tcgtgctcat attttccctg g 31 <210> 364 <211> 45 <212> DNA <213> Artificial sequence <220> <223> Mutagenic primer <400> 364 gaagtgattg tttcatcaac gcagtcagaa gtaacgccaa ttatc 45 <210> 365 <211> 40 <212> DNA <213> Artificial sequence <220> <223> Mutagenic primer <400> 365 catatgagtt atagcttatg gaatgaccaa attgtgaatg 40 <210> 366 <211> 34 <212> DNA <213> Artificial sequence <220> <223> Mutagenic primer <400> 366 ctcgagtgcg gccgcaagct tgtcgacgga gctc 34 <210> 367 <211> 95 <212> DNA <213> Artificial sequence <220> <223> Mutagenic primer <400> 367 aatatttatg gaattaaaga tggcgtatta tacacacatc cagcgaataa catgatctta 60 aatggtatta cacgtcaagt aatcattaaa tgtgc 95 <210> 368 <211> 34 <212> DNA <213> Artificial sequence <220> <223> Mutagenic primer <400> 368 ggccagtgaa ttgtaatacg actcactata gggc 34 <210> 369 <211> 42 <212> DNA <213> Artificial sequence <220> <223> Mutagenic primer <400> 369 cgccatcttt aattccataa atatttgaag aagagccttc tg 42 <210> 370 <211> 66 <212> DNA <213> Artificial sequence <220> <223> Mutagenic primer <400> 370 gcaacatttg tagaagacat tcgttgggaa tactgttaca ttaaatcatt aaatttactt 60 ggtgcg 66 <210> 371 <211> 55 <212> DNA <213> Artificial sequence <220> <223> Mutagenic primer <400> 371 gtattataca cacatccagc gaataactac atcttaaatg gtattacacg tcaag 55 <210> 372 <211> 64 <212> DNA <213> Artificial sequence <220> <223> Mutagenic primer <400> 372 gcaatggatg aagtgattgt ttcatcaacg actaaagaag taacgccaat tatcgacata 60 gatg 64 <210> 373 <211> 64 <212> DNA <213> Artificial sequence <220> <223> Mutagenic primer <400> 373 gcaatggatg aagtgattgt ttcatcaacg aataaagaag taacgccaat tatcgacata 60 gatg 64 <210> 374 <211> 64 <212> DNA <213> Artificial sequence <220> <223> Mutagenic primer <400> 374 gcaatggatg aagtgattgt ttcatcaacg aatcgtgaag taacgccaat tatcgacata 60 gatg 64 <210> 375 <211> 16 <212> PRT <213> P. striata <220> <221> misc_feature <222> (12)..(12) <223> Xaa can be any naturally occurring amino acid <400> 375 Leu Thr Ala Val Leu Lys Ala Asp Ala Tyr Gly Xaa Gly Ile Gly Leu 1 5 10 15 <210> 376 <211> 28 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 376 agaagacata tgccctttcg ccgtaggg 28 <210> 377 <211> 32 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 377 agaagaggat cctcagtcga cgagtatctt cg 32 <210> 378 <211> 1230 <212> DNA <213> Artificial sequence <220> <223> KT2440 BAR <400> 378 atgccctttc gccgtaccct tctggctgca tccctggcac ttctgatcac cggacaggcc 60 cccctgtatg cggcaccacc gttgtcgatg gacaacggca ccaacaccct gaccgtgcaa 120 aacagcaatg cctgggtcga agtcagcgcc agcgccctgc agcacaacat ccgcacgctg 180 caggccgagc tggccggcaa gtccaagctg tgcgccgtgc tcaaggccga tgcctatggc 240 cacggtatcg gcctggtaat gccatcgatc atcgcccaag gcgtgccctg cgtggcggtg 300 gccagcaacg aggaggcccg cgtggtccgc gccagtggct tcaccgggca actggtgcgg 360 gtacgcctgg ccagcctcag cgagctggaa gatggcttgc agtacgacat ggaagagctg 420 gtgggcagcg cggaatttgc ccgccaggcc gatgccatcg ccgcgcgcca tggcaagacc 480 ttgcgcattc acatggcgct caactccagc ggcatgagcc gcaacggggt ggagatggcc 540 acctggtccg gccgtggcga agcgctgcag atcaccgacc agaagcacct caagctggtc 600 gcgctgatga cccacttcgc cgtggaagac aaggacgatg tacgcaaggg cctggcggca 660 ttcaacgagc agaccgactg gttgatcaag cacgccaggc tggaccgcag caagctcacc 720 ctgcacgccg ccaactcgtt cgctacgctg gaagtgccgg aagcgcgcct ggacatggta 780 cgaacgggtg gcgcgctgtt cggcgacacc gtgccggcgc gcaccgagta caaacgtgcg 840 atgcagttca aatcgcacgt ggcggcggtg cacagctatc cggccggcaa caccgtgggc 900 tatgaccgca ccttcaccct ggcccgtgat tcgcggctgg ccaacattac ggtcgggtac 960 tccgatggct accgccgggt attcaccaac aagggccatg tgctgatcaa cggccaccgt 1020 gtgccggtcg tgggcaaggt gtcgatgaac acgctgatgg tcgatgtcac cgacttccct 1080 gatgtgaagg ggggtaacga agtggtgctg ttcggcaagc aggccggggg cgaaatcacc 1140 caggccgaga tggaagaaat caacggcgcg ttgctcgccg atttgtacac cgtatggggc 1200 aattccaacc cgaagatact cgtcgactga 1230 <210> 379 <211> 409 <212> PRT <213> Artificial sequence <220> <223> KT2440 BAR <400> 379 Met Pro Phe Arg Arg Thr Leu Leu Ala Ala Ser Leu Ala Leu Leu Ile 1 5 10 15 Thr Gly Gln Ala Pro Leu Tyr Ala Ala Pro Pro Leu Ser Met Asp Asn 20 25 30 Gly Thr Asn Thr Leu Thr Val Gln Asn Ser Asn Ala Trp Val Glu Val 35 40 45 Ser Ala Ser Ala Leu Gln His Asn Ile Arg Thr Leu Gln Ala Glu Leu 50 55 60 Ala Gly Lys Ser Lys Leu Cys Ala Val Leu Lys Ala Asp Ala Tyr Gly 65 70 75 80 His Gly Ile Gly Leu Val Met Pro Ser Ile Ile Ala Gln Gly Val Pro 85 90 95 Cys Val Ala Val Ala Ser Asn Glu Glu Ala Arg Val Val Arg Ala Ser 100 105 110 Gly Phe Thr Gly Gln Leu Val Arg Val Arg Leu Ala Ser Leu Ser Glu 115 120 125 Leu Glu Asp Gly Leu Gln Tyr Asp Met Glu Glu Leu Val Gly Ser Ala 130 135 140 Glu Phe Ala Arg Gln Ala Asp Ala Ile Ala Ala Arg His Gly Lys Thr 145 150 155 160 Leu Arg Ile His Met Ala Leu Asn Ser Ser Gly Met Ser Arg Asn Gly 165 170 175 Val Glu Met Ala Thr Trp Ser Gly Arg Gly Glu Ala Leu Gln Ile Thr 180 185 190 Asp Gln Lys His Leu Lys Leu Val Ala Leu Met Thr His Phe Ala Val 195 200 205 Glu Asp Lys Asp Asp Val Arg Lys Gly Leu Ala Ala Phe Asn Glu Gln 210 215 220 Thr Asp Trp Leu Ile Lys His Ala Arg Leu Asp Arg Ser Lys Leu Thr 225 230 235 240 Leu His Ala Ala Asn Ser Phe Ala Thr Leu Glu Val Pro Glu Ala Arg 245 250 255 Leu Asp Met Val Arg Thr Gly Gly Ala Leu Phe Gly Asp Thr Val Pro 260 265 270 Ala Arg Thr Glu Tyr Lys Arg Ala Met Gln Phe Lys Ser His Val Ala 275 280 285 Ala Val His Ser Tyr Pro Ala Gly Asn Thr Val Gly Tyr Asp Arg Thr 290 295 300 Phe Thr Leu Ala Arg Asp Ser Arg Leu Ala Asn Ile Thr Val Gly Tyr 305 310 315 320 Ser Asp Gly Tyr Arg Arg Val Phe Thr Asn Lys Gly His Val Leu Ile 325 330 335 Asn Gly His Arg Val Pro Val Val Gly Lys Val Ser Met Asn Thr Leu 340 345 350 Met Val Asp Val Thr Asp Phe Pro Asp Val Lys Gly Gly Asn Glu Val 355 360 365 Val Leu Phe Gly Lys Gln Ala Gly Gly Glu Ile Thr Gln Ala Glu Met 370 375 380 Glu Glu Ile Asn Gly Ala Leu Leu Ala Asp Leu Tyr Thr Val Trp Gly 385 390 395 400 Asn Ser Asn Pro Lys Ile Leu Val Asp 405 <210> 380 <211> 1152 <212> DNA <213> Geobacillus stearothermophilus <400> 380 atggacgagt ttcaccgcga tacgtgggcg gaagtggatt tggacgccat ttacgacaat 60 gtggagaatt tgcgccgttt gctgccggac gacacgcaca ttatggcggt cgtgaaggcg 120 aacgcctatg gacatgggga tgtgcaggtg gcaaggacag cgctcgaagc gggggcctcc 180 cgcctggcgg ttgccttttt ggatgaggcg ctcgctttaa gggaaaaagg aatcgaagcg 240 ccgattctag ttctcggggc ttcccgtcca gctgatgcgg cgctggccgc ccagcagcgc 300 attgccctga ccgtgttccg ctccgactgg ttggaagaag cgtccgccct ttacagcggc 360 ccttttccta ttcatttcca tttgaaaatg gacaccggca tgggacggct tggagtgaaa 420 gacgaggaag agacgaaacg aatcgtagcg ctgattgagc gccatccgca ttttgtgctt 480 gaaggggtgt acacgcattt tgcgactgcg gatgaggtga acaccgatta tttttcctat 540 cagtataccc gttttttgca catgctcgaa tggctgccgt cgcgcccgcc gctcgtccat 600 tgcgccaaca gcgcagcgtc gctccgtttc cctgaccgga cgttcaatat ggtccgcttc 660 ggcattgcca tgtatgggct tgccccgtcg cccggcatca agccgctgct gccgtatcca 720 ttaaaagaag cattttcgct ccatagccgc ctcgtacacg tcaaaaaact gcaaccaggc 780 gaaaaggtga gctatggtgc gacgtacact gcgcagacgg aggagtggat cgggacgatt 840 ccgatcggct atgcggacgg ctggctccgc cgcctgcagc actttcatgt ccttgttgac 900 ggacaaaagg cgccgattgt cggccgcatt tgcatggacc agtgcatgat ccgcctgcct 960 ggtccgctgc cggtcggcac gaaggtgaca ctgattggtc gccaagggga cgaggtaatt 1020 tccattgatg atgtcgctcg ccatttggaa acgatcaact acgaagtgcc ttgcacgatc 1080 agttatcgag tgccccgtat ttttttccgc cataagcgta taatggaagt gagaaacgcc 1140 gttggccgcg ga 1152 <210> 381 <211> 384 <212> PRT <213> Geobacillus stearothermophilus <400> 381 Met Asp Glu Phe His Arg Asp Thr Trp Ala Glu Val Asp Leu Asp Ala 1 5 10 15 Ile Tyr Asp Asn Val Glu Asn Leu Arg Arg Leu Leu Pro Asp Asp Thr 20 25 30 His Ile Met Ala Val Val Lys Ala Asn Ala Tyr Gly His Gly Asp Val 35 40 45 Gln Val Ala Arg Thr Ala Leu Glu Ala Gly Ala Ser Arg Leu Ala Val 50 55 60 Ala Phe Leu Asp Glu Ala Leu Ala Leu Arg Glu Lys Gly Ile Glu Ala 65 70 75 80 Pro Ile Leu Val Leu Gly Ala Ser Arg Pro Ala Asp Ala Ala Leu Ala 85 90 95 Ala Gln Gln Arg Ile Ala Leu Thr Val Phe Arg Ser Asp Trp Leu Glu 100 105 110 Glu Ala Ser Ala Leu Tyr Ser Gly Pro Phe Pro Ile His Phe His Leu 115 120 125 Lys Met Asp Thr Gly Met Gly Arg Leu Gly Val Lys Asp Glu Glu Glu 130 135 140 Thr Lys Arg Ile Val Ala Leu Ile Glu Arg His Pro His Phe Val Leu 145 150 155 160 Glu Gly Val Tyr Thr His Phe Ala Thr Ala Asp Glu Val Asn Thr Asp 165 170 175 Tyr Phe Ser Tyr Gln Tyr Thr Arg Phe Leu His Met Leu Glu Trp Leu 180 185 190 Pro Ser Arg Pro Pro Leu Val His Cys Ala Asn Ser Ala Ala Ser Leu 195 200 205 Arg Phe Pro Asp Arg Thr Phe Asn Met Val Arg Phe Gly Ile Ala Met 210 215 220 Tyr Gly Leu Ala Pro Ser Pro Gly Ile Lys Pro Leu Leu Pro Tyr Pro 225 230 235 240 Leu Lys Glu Ala Phe Ser Leu His Ser Arg Leu Val His Val Lys Lys 245 250 255 Leu Gln Pro Gly Glu Lys Val Ser Tyr Gly Ala Thr Tyr Thr Ala Gln 260 265 270 Thr Glu Glu Trp Ile Gly Thr Ile Pro Ile Gly Tyr Ala Asp Gly Trp 275 280 285 Leu Arg Arg Leu Gln His Phe His Val Leu Val Asp Gly Gln Lys Ala 290 295 300 Pro Ile Val Gly Arg Ile Cys Met Asp Gln Cys Met Ile Arg Leu Pro 305 310 315 320 Gly Pro Leu Pro Val Gly Thr Lys Val Thr Leu Ile Gly Arg Gln Gly 325 330 335 Asp Glu Val Ile Ser Ile Asp Asp Val Ala Arg His Leu Glu Thr Ile 340 345 350 Asn Tyr Glu Val Pro Cys Thr Ile Ser Tyr Arg Val Pro Arg Ile Phe 355 360 365 Phe Arg His Lys Arg Ile Met Glu Val Arg Asn Ala Val Gly Arg Gly 370 375 380 <210> 382 <211> 43 <212> DNA <213> Artificial sequence <220> <223> Mutagenic primer <400> 382 gccatttgga aacgatcaac gcggaagtgc cttgcacgat cag 43 <210> 383 <211> 30 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 383 gatataccat ggcatactca ttatggaatg 30 <210> 384 <211> 32 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 384 gttatcggat ccttaggcat taattgaaat tg 32 <210> 385 <211> 36 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 385 gaggagctcg agtcagacgt atttcagtcc tttttc 36 <210> 386 <211> 29 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 386 agaagacata tgatttatca gccggggac 29 <210> 387 <211> 30 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 387 agaagacata tgggtgtcgt cgtccaaaac 30 <210> 388 <211> 31 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 388 ataataggat ccttagacat atttgaggcc c 31 <210> 389 <211> 28 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 389 ataatacata tgaagccggt ggtggtgc 28 <210> 390 <211> 31 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 390 agaagaggat ccttagacat aggtgagccc c 31 <210> 391 <211> 26 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 391 ataataccat gggtgtcgtg gtccag 26 <210> 392 <211> 32 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 392 agaagaggat ccttagacat atttcaggcc cc 32 <210> 393 <211> 30 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 393 gcggaacata tgtttgagaa cattaccgcc 30 <210> 394 <211> 32 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 394 ataaccggat ccttacagca ctgccacaat cg 32 <210> 395 <211> 36 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 395 cgctcttatg gttcggtttg cttgggttgc tcaccc 36 <210> 396 <211> 36 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 396 gggtgagcaa cccaagcttt ccgaaccata agagcg 36 <210> 397 <211> 39 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 397 caaaaaatac cagcgttaag ggagtgtggg tgagcaacc 39 <210> 398 <211> 29 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 398 cattaccgcc gctactgccg acccgattc 29 <210> 399 <211> 39 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 399 caccaaaaat tacctcggcg tagacggcat ccctgaatt 39 <210> 400 <211> 35 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 400 tgatgcggaa aatcacgctc ttgacttcga tgcac 35 <210> 401 <211> 35 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 401 gcggcgccat ggaaaatgat ccgattggtc taatg 35 <210> 402 <211> 33 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 402 gcggcggtcg acgcaattac aattgtgttt gtc 33 <210> 403 <211> 34 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 403 gcggcgccat ggatgtatgt ataattttat ttag 34 <210> 404 <211> 36 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 404 gcggcggtcg acaaatttca ttattcattc taattt 36 <210> 405 <211> 36 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 405 ggccggcata tgtcgatcct taacgactac aaacgt 36 <210> 406 <211> 36 <212> DNA <213> Artificial sequence <220> <223> Primer <400> 406 ggaaggctcg agtcatgatt ggtttccaga caaatt 36 <210> 407 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Signal Sequence <400> 407 Met Ser Ile Val Val Thr Lys Ile Glu Arg Ala Gly Ala Ala Ala Val 1 5 10 15 Ala Ala Leu Arg Thr Ser Gly Val Ala Thr Val 20 25 <210> 408 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 408 ataatacata tgcccttctc ccgtaccc 28 <210> 409 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 409 gcggcgggat ccttactgat ctttcaggat t 31 <210> 410 <211> 1230 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Pseudomonas taetrolens arginine racemase <400> 410 atgcccttct cccgtaccct gctcgccctt tcccttggca tggcattgct gcaaaacccg 60 gcctttgctg cgccacccct gtcgatgacc gacggcgtag ctcaagtgaa tacccaggac 120 agcaatgcct gggtcgaaat caataaagcc gcgttcgagc acaacatacg gactctgcaa 180 accgccctcg ccggcaagtc gcagatctgc gccgtactca aggcggatgc ctatggccac 240 ggtatcggct tgttgatgcc ctcggtgatc gccatgggtg ttccctgtgt cggtgtcgcc 300 agcaacgaag aagcccgcgt cgtgcgcgag agcggtttca agggtcaact gatacgcgtg 360 cgcaccgctg ccctgagcga actggaagct gcactgccgt acaacatgga agagctggtg 420 ggcaacctgg acttcgcggt caaggccagc ctgattgccg aggatcacgg tcgcccgctg 480 gtggtgcacc tgggtctgaa ttccagcggc atgagccgta acggagtgga catgaccacc 540 gctcagggcc gtcgtgatgc ggtagctatc accaaggtgc caaacctgga agtgcgggcg 600 atcatgaccc acttcgcggt cgaagatgct gccgacgtgc gtgccgggct caaggccttc 660 aatcagcaag cccaatggct gatgaacgtg gcccagcttg atcgcagcaa gatcaccctg 720 cacgcggcca actcgttcgc cacactggag gtgcccgaat cgcatctgga catggtccgc 780 cccggcggcg cgctgttcgg cgacaccgta ccgtcccaca ccgagtacaa gcgggtcatg 840 cagttcaagt cccacgtggc gtcggtcaac agctacccca agggcaacac cgtcggttat 900 gaccgcacgt acaccctggg ccgcgactcg cggctggcca acatcaccgt cggctactct 960 gacggctacc gccgcgcgtt taccaataaa gggattgtgc tgatcaacgg ccatcgcgtg 1020 ccagtggtgg gcaaagtctc gatgaacacc ctgatggtgg acgtcactga cgcgccggat 1080 gtgaaaagcg gcgatgaagt ggtgctgttc gggcaccagg gcaaggccga gattacccag 1140 gctgagatcg aagacatcaa cggtgcactg cttgcggatc tgtataccgt gtggggcaat 1200 tccaacccta aaatcctgaa agatcagtaa 1230 <210> 411 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 411 tacccaggct gagatggaag acatcaacg 29 <210> 412 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 412 gccagcaacg argargcmcg cgt 23 <210> 413 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 413 tggccstkga tcagcaca 18 <210> 414 <211> 716 <212> DNA <213> Artificial Sequence <220> <223> A.caviae PCR product <400> 414 gccagcaacg argargcmcg cgttgcccgc gagaagggct tcgaaggtcg cctgatgcgg 60 gtacgtgccg ccaccccgga tgaagtggag caggccctgc cctacaagct ggaggagctc 120 atcggcagcc tggagagcgc caaggggatc gccgacatcg cccagcgcca tcacaccaac 180 atcccggtgc acatcggcct gaactccgcc ggcatgagcc gcaacggcat cgatctgcgc 240 caggacgatg ccaaggccga tgccctggcc atgctcaagc tcaaggggat caccccggtc 300 ggcatcatga cccacttccc ggtggaggag aaagaggacg tcaagctggg gctggcccag 360 ttcaagctgg actaccagtg gctcatcgac gccggcaagc tggatcgcag caagctcacc 420 atccacgccg ccaactcctt cgccaccctg gaagtaccgg aagcctactt tgacatggtg 480 cgcccgggcg gcatcatcta tggcgacacc attccctcct acaccgagta caagaaggtg 540 atggcgttca agacccaggt cgcctccgtc aaccactacc cggcgggcaa caccgtcggc 600 tatgaccgca ccttcaccct caagcgcgac tccctgctgg ccaacctgcc gatgggctac 660 tccgacggct accgccgcgc catgagcaac aaggcctatg tgctgatcma sggcca 716 <210> 415 <211> 238 <212> PRT <213> Aeromonas caviae <220> <221> MISC_FEATURE <222> (237)..(237) <223> Xaa can be Phe, Gln, Asn or Lys <400> 415 Ala Ser Asn Glu Glu Ala Arg Val Ala Arg Glu Lys Gly Phe Glu Gly 1 5 10 15 Arg Leu Met Arg Val Arg Ala Ala Thr Pro Asp Glu Val Glu Gln Ala 20 25 30 Leu Pro Tyr Lys Leu Glu Glu Leu Ile Gly Ser Leu Glu Ser Ala Lys 35 40 45 Gly Ile Ala Asp Ile Ala Gln Arg His His Thr Asn Ile Pro Val His 50 55 60 Ile Gly Leu Asn Ser Ala Gly Met Ser Arg Asn Gly Ile Asp Leu Arg 65 70 75 80 Gln Asp Asp Ala Lys Ala Asp Ala Leu Ala Met Leu Lys Leu Lys Gly 85 90 95 Ile Thr Pro Val Gly Ile Met Thr His Phe Pro Val Glu Glu Lys Glu 100 105 110 Asp Val Lys Leu Gly Leu Ala Gln Phe Lys Leu Asp Tyr Gln Trp Leu 115 120 125 Ile Asp Ala Gly Lys Leu Asp Arg Ser Lys Leu Thr Ile His Ala Ala 130 135 140 Asn Ser Phe Ala Thr Leu Glu Val Pro Glu Ala Tyr Phe Asp Met Val 145 150 155 160 Arg Pro Gly Gly Ile Ile Tyr Gly Asp Thr Ile Pro Ser Tyr Thr Glu 165 170 175 Tyr Lys Lys Val Met Ala Phe Lys Thr Gln Val Ala Ser Val Asn His 180 185 190 Tyr Pro Ala Gly Asn Thr Val Gly Tyr Asp Arg Thr Phe Thr Leu Lys 195 200 205 Arg Asp Ser Leu Leu Ala Asn Leu Pro Met Gly Tyr Ser Asp Gly Tyr 210 215 220 Arg Arg Ala Met Ser Asn Lys Ala Tyr Val Leu Ile Xaa Gly 225 230 235 <210> 416 <211> 1227 <212> DNA <213> Aeromonas caviae <400> 416 atgcacaaga aaacactgct cgcgaccctg atctttggcc tgctggccgg ccaggcagtc 60 gccgccccct atctgccgct cgccgacgac caccgcaacg gtcaggaaca gaccgccgcc 120 aacgcctggc tggaagtgga tctcggcgcc ttcgagcaca acatccagac cctgaagaat 180 cgcctcggtg acaagggccc gcagatctgc gccatcatga aggcggacgc ctacggtcac 240 ggcatcgacc tgctggtccc ttccgtggtc aaggcaggca tcccctgcat cggcatcgcc 300 agcaacgaag aagcacgtgt tgcccgcgag aagggcttcg aaggtcgcct gatgcgggta 360 cgtgccgcca ccccggatga agtggagcag gccctgccct acaagctgga ggagctcatc 420 ggcagcctgg agagcgccaa ggggatcgcc gacatcgccc agcgccatca caccaacatc 480 ccggtgcaca tcggcctgaa ctccgccggc atgagccgca acggcatcga tctgcgccag 540 gacgatgcca aggccgatgc cctggccatg ctcaagctca aggggatcac cccggtcggc 600 atcatgaccc acttcccggt ggaggagaaa gaggacgtca agctggggct ggcccagttc 660 aagctggact accagtggct catcgacgcc ggcaagctgg atcgcagcaa gctcaccatc 720 cacgccgcca actccttcgc caccctggaa gtaccggaag cctactttga catggtgcgc 780 ccgggcggca tcatctatgg cgacaccatt ccctcctaca ccgagtacaa gaaggtgatg 840 gcgttcaaga cccaggtcgc ctccgtcaac cactacccgg cgggcaacac cgtcggctat 900 gaccgcacct tcaccctcaa gcgcgactcc ctgctggcca acctgccgat gggctactcc 960 gacggctacc gccgcgccat gagcaacaag gcctatgtgc tgatccatgg ccagaaggcc 1020 cccgtcgtgg gcaagacttc catgaacacc accatggtgg acgtcaccga catcaagggg 1080 atcaaacccg gtgacgaggt ggtcctgttc ggacgccagg gtgatgccga ggtgaaacaa 1140 tctgatctgg aggagtacaa cggtgccctc ttggcggaca tgtacaccgt ctggggctat 1200 accaacccca agaagatcaa gcgctaa 1227 <210> 417 <211> 408 <212> PRT <213> Aeromonas caviae <400> 417 Met His Lys Lys Thr Leu Leu Ala Thr Leu Ile Phe Gly Leu Leu Ala 1 5 10 15 Gly Gln Ala Val Ala Ala Pro Tyr Leu Pro Leu Ala Asp Asp His Arg 20 25 30 Asn Gly Gln Glu Gln Thr Ala Ala Asn Ala Trp Leu Glu Val Asp Leu 35 40 45 Gly Ala Phe Glu His Asn Ile Gln Thr Leu Lys Asn Arg Leu Gly Asp 50 55 60 Lys Gly Pro Gln Ile Cys Ala Ile Met Lys Ala Asp Ala Tyr Gly His 65 70 75 80 Gly Ile Asp Leu Leu Val Pro Ser Val Val Lys Ala Gly Ile Pro Cys 85 90 95 Ile Gly Ile Ala Ser Asn Glu Glu Ala Arg Val Ala Arg Glu Lys Gly 100 105 110 Phe Glu Gly Arg Leu Met Arg Val Arg Ala Ala Thr Pro Asp Glu Val 115 120 125 Glu Gln Ala Leu Pro Tyr Lys Leu Glu Glu Leu Ile Gly Ser Leu Glu 130 135 140 Ser Ala Lys Gly Ile Ala Asp Ile Ala Gln Arg His His Thr Asn Ile 145 150 155 160 Pro Val His Ile Gly Leu Asn Ser Ala Gly Met Ser Arg Asn Gly Ile 165 170 175 Asp Leu Arg Gln Asp Asp Ala Lys Ala Asp Ala Leu Ala Met Leu Lys 180 185 190 Leu Lys Gly Ile Thr Pro Val Gly Ile Met Thr His Phe Pro Val Glu 195 200 205 Glu Lys Glu Asp Val Lys Leu Gly Leu Ala Gln Phe Lys Leu Asp Tyr 210 215 220 Gln Trp Leu Ile Asp Ala Gly Lys Leu Asp Arg Ser Lys Leu Thr Ile 225 230 235 240 His Ala Ala Asn Ser Phe Ala Thr Leu Glu Val Pro Glu Ala Tyr Phe 245 250 255 Asp Met Val Arg Pro Gly Gly Ile Ile Tyr Gly Asp Thr Ile Pro Ser 260 265 270 Tyr Thr Glu Tyr Lys Lys Val Met Ala Phe Lys Thr Gln Val Ala Ser 275 280 285 Val Asn His Tyr Pro Ala Gly Asn Thr Val Gly Tyr Asp Arg Thr Phe 290 295 300 Thr Leu Lys Arg Asp Ser Leu Leu Ala Asn Leu Pro Met Gly Tyr Ser 305 310 315 320 Asp Gly Tyr Arg Arg Ala Met Ser Asn Lys Ala Tyr Val Leu Ile His 325 330 335 Gly Gln Lys Ala Pro Val Val Gly Lys Thr Ser Met Asn Thr Thr Met 340 345 350 Val Asp Val Thr Asp Ile Lys Gly Ile Lys Pro Gly Asp Glu Val Val 355 360 365 Leu Phe Gly Arg Gln Gly Asp Ala Glu Val Lys Gln Ser Asp Leu Glu 370 375 380 Glu Tyr Asn Gly Ala Leu Leu Ala Asp Met Tyr Thr Val Trp Gly Tyr 385 390 395 400 Thr Asn Pro Lys Lys Ile Lys Arg 405

Claims

(a) cDNA, 전사체(mRNA) 또는 유전자의 적어도 약 20개, 30개, 40개, 50개, 75개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개, 650개, 700개, 750개, 800개, 850개, 900개, 950개, 1000개, 1050개, 1100개, 1150개 또는 그 이상의 잔기로 이루어진 영역, 또는 전체 길이에 걸쳐서, 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 67, 서열 번호: 69, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161, 서열 번호: 163, 서열 번호: 165, 서열 번호: 167, 서열 번호: 169, 서열 번호: 171, 서열 번호: 173, 서열 번호: 175, 서열 번호: 177, 서열 번호: 179, 서열 번호: 181, 서열 번호: 183, 서열 번호: 185, 서열 번호: 187, 서열 번호: 189, 서열 번호: 191, 서열 번호: 193, 서열 번호: 195, 서열 번호: 197, 서열 번호: 199, 서열 번호: 201, 서열 번호: 203, 서열 번호: 205, 서열 번호: 207, 서열 번호: 209, 서열 번호: 211, 서열 번호: 213, 서열 번호: 215, 서열 번호: 217, 서열 번호: 219, 서열 번호: 221, 서열 번호: 223, 서열 번호: 225, 서열 번호: 227, 서열 번호: 229, 서열 번호: 231, 서열 번호: 233, 서열 번호: 235, 서열 번호: 237, 서열 번호: 239, 서열 번호: 241, 서열 번호: 243, 서열 번호: 245, 서열 번호: 247, 서열 번호: 249, 서열 번호: 251, 서열 번호: 253, 서열 번호: 255, 서열 번호: 257, 서열 번호: 259, 서열 번호: 261, 서열 번호: 263, 서열 번호: 265, 서열 번호: 267, 서열 번호: 269, 서열 번호: 271, 서열 번호: 273, 서열 번호: 275, 서열 번호: 277, 서열 번호: 279, 서열 번호: 281, 서열 번호: 283, 서열 번호: 285, 서열 번호: 287, 서열 번호: 289, 서열 번호: 291, 서열 번호: 293, 서열 번호: 295, 서열 번호: 297, 서열 번호: 299, 서열 번호: 301, 서열 번호: 303, 서열 번호: 305, 서열 번호: 307, 서열 번호: 309, 서열 번호: 311, 서열 번호: 313, 서열 번호: 315, 서열 번호: 317, 서열 번호: 319, 서열 번호: 321, 서열 번호: 323, 서열 번호: 325, 서열 번호: 327, 서열 번호: 329, 서열 번호: 331, 서열 번호: 333, 서열 번호: 335, 서열 번호: 336, 서열 번호: 337 및/또는 서열 번호: 338의 서열과 적어도 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의, 또는 완벽한(100%) 서열 동일성을 갖는 서열을 포함하는, 하나 이상의 폴리펩티드를 코딩하는 핵산으로서,
상기 핵산은 알돌라제 활성을 갖는 하나 이상의 폴리펩티드를 코딩하거나, 알돌라제 특이 항체를 생성할 수 있는 폴리펩티드 또는 펩티드(에피토프 또는 면역원으로서 작용하는 폴리펩티드 또는 펩티드)를 코딩하고,
경우에 따라, 상기 서열 동일성은 서열 비교 알고리즘을 사용하는 분석법 또는 시각적 조사에 의해 측정되며,
경우에 따라, 상기 서열 비교 알고리즘은 필터링 셋팅이 blastall -p blastp -d"nr pataa" -FF로 설정되고 기타 모든 선택 사양이 디폴트값으로 설정되는 BLAST 버전 2.2.2 알고리즘인, 핵산;
(b) 엄격한 조건하에 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 67, 서열 번호: 69, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161, 서열 번호: 163, 서열 번호: 165, 서열 번호: 167, 서열 번호: 169, 서열 번호: 171, 서열 번호: 173, 서열 번호: 175, 서열 번호: 177, 서열 번호: 179, 서열 번호: 181, 서열 번호: 183, 서열 번호: 185, 서열 번호: 187, 서열 번호: 189, 서열 번호: 191, 서열 번호: 193, 서열 번호: 195, 서열 번호: 197, 서열 번호: 199, 서열 번호: 201, 서열 번호: 203, 서열 번호: 205, 서열 번호: 207, 서열 번호: 209, 서열 번호: 211, 서열 번호: 213, 서열 번호: 215, 서열 번호: 217, 서열 번호: 219, 서열 번호: 221, 서열 번호: 223, 서열 번호: 225, 서열 번호: 227, 서열 번호: 229, 서열 번호: 231, 서열 번호: 233, 서열 번호: 235, 서열 번호: 237, 서열 번호: 239, 서열 번호: 241, 서열 번호: 243, 서열 번호: 245, 서열 번호: 247, 서열 번호: 249, 서열 번호: 251, 서열 번호: 253, 서열 번호: 255, 서열 번호: 257, 서열 번호: 259, 서열 번호: 261, 서열 번호: 263, 서열 번호: 265, 서열 번호: 267, 서열 번호: 269, 서열 번호: 271, 서열 번호: 273, 서열 번호: 275, 서열 번호: 277, 서열 번호: 279, 서열 번호: 281, 서열 번호: 283, 서열 번호: 285, 서열 번호: 287, 서열 번호: 289, 서열 번호: 291, 서열 번호: 293, 서열 번호: 295, 서열 번호: 297, 서열 번호: 299, 서열 번호: 301, 서열 번호: 303, 서열 번호: 305, 서열 번호: 307, 서열 번호: 309, 서열 번호: 311, 서열 번호: 313, 서열 번호: 315, 서열 번호: 317, 서열 번호: 319, 서열 번호: 321, 서열 번호: 323, 서열 번호: 325, 서열 번호: 327, 서열 번호: 329, 서열 번호: 331, 서열 번호: 333, 서열 번호: 335, 서열 번호: 336, 서열 번호: 337 및/또는 서열 번호: 338의 서열을 포함하는 핵산의 상보체에 혼성화하는 서열을 포함하는, 하나 이상의 폴리펩티드를 코딩하는 핵산으로서,
상기 핵산은 알돌라제 활성을 갖는 하나 이상의 폴리펩티드를 코딩하거나, 알돌라제 특이 항체를 생성할 수 있는 폴리펩티드 또는 펩티드(에피토프 또는 면역원으로서 작용하는 폴리펩티드 또는 펩티드)를 코딩하고,
경우에 따라, 상기 엄격한 조건은 약 65℃의 온도에서 약 15분 동안 0.2xSSC 중에서 세척하는 것을 포함하는 세척 단계를 포함하며,
경우에 따라, 상기 핵산은 적어도 약 20개, 30개, 40개, 50개, 60개, 75개, 100개, 150개, 200개, 300개, 400개, 500개, 600개, 700개, 800개, 900개, 1000개 또는 그 이상의 잔기 길이 또는 전체 길이의 유전자 또는 전사체인, 핵산;
(c) 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 66, 서열 번호: 68, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162, 서열 번호: 164, 서열 번호: 166, 서열 번호: 168, 서열 번호: 170, 서열 번호: 172, 서열 번호: 174, 서열 번호: 176, 서열 번호: 178, 서열 번호: 180, 서열 번호: 182, 서열 번호: 184, 서열 번호: 186, 서열 번호: 188, 서열 번호: 190, 서열 번호: 192, 서열 번호: 194, 서열 번호: 196, 서열 번호: 198, 서열 번호: 200, 서열 번호: 202, 서열 번호: 204, 서열 번호: 206, 서열 번호: 208, 서열 번호: 210, 서열 번호: 212, 서열 번호: 214, 서열 번호: 216, 서열 번호: 218, 서열 번호: 220, 서열 번호: 222, 서열 번호: 224, 서열 번호: 226, 서열 번호: 228, 서열 번호: 230, 서열 번호: 232, 서열 번호: 234, 서열 번호: 236, 서열 번호: 238, 서열 번호: 240, 서열 번호: 242, 서열 번호: 244, 서열 번호: 246, 서열 번호: 248, 서열 번호: 250, 서열 번호: 252, 서열 번호: 254, 서열 번호: 256, 서열 번호: 258, 서열 번호: 260, 서열 번호: 262, 서열 번호: 264, 서열 번호: 266, 서열 번호: 268, 서열 번호: 270, 서열 번호: 272, 서열 번호: 274, 서열 번호: 276, 서열 번호: 278, 서열 번호: 280, 서열 번호: 282, 서열 번호: 284, 서열 번호: 286, 서열 번호: 288, 서열 번호: 290, 서열 번호: 292, 서열 번호: 294, 서열 번호: 296, 서열 번호: 298, 서열 번호: 300, 서열 번호: 302, 서열 번호: 304, 서열 번호: 306, 서열 번호: 308, 서열 번호: 310, 서열 번호: 312, 서열 번호: 314, 서열 번호: 316, 서열 번호: 318, 서열 번호: 320, 서열 번호: 322, 서열 번호: 324, 서열 번호: 326, 서열 번호: 328, 서열 번호: 330, 서열 번호: 332, 및/또는 서열 번호: 334의 서열, 또는 그 효소 활성 단편을 포함하며 알돌라제 활성을 갖는 하나 이상의 폴리펩티드를 코딩하는 핵산;
(d) (i) 하나 이상의 보존적 아미노산 치환을 가지며 그의 알돌라제 활성을 유지하는 폴리펩티드를 코딩하는 (a), (b) 또는 (c)의 핵산; 또는 (ii) 하나 이상의 보존적 아미노산 치환이 한 아미노산을 특징이 유사한 또다른 아미노산으로 치환하는 것을 포함하거나; 보존적 치환이 지방족 아미노산의 또다른 지방족 아미노산으로의 대체; 세린의 트레오닌으로의 대체 또는 그 반대; 산성 잔기의 또다른 산성 잔기로의 대체; 아미드기를 보유하는 잔기의 아미드기를 보유하는 또다른 잔기로의 대체; 염기성 잔기의 또다른 염기성 잔기로의 교환; 또는 방향족 잔기의 또다른 방향족 잔기로의 대체를 포함하는 것인 (d)(i)의 핵산;
(e) 알돌라제 활성은 갖지만 신호 서열이 결여되어 있는 폴리펩티드를 코딩하는, (a), (b), (c) 또는 (d)의 핵산(폴리뉴클레오티드);
(f) 알돌라제 활성을 갖고 추가로 이종 서열을 포함하는 폴리펩티드를 코딩하는, (a), (b), (c), (d) 또는 (e)의 핵산(폴리뉴클레오티드);
(g) 이종 서열이 (i) 이종 신호 서열; (ii) 이종 신호 서열이 이종 효소로부터 유래되는 것인 (i)의 서열; 또는 (iii) 태그, 에피토프, 표적화 펩티드, 절단 가능한 서열, 검출 가능한 부분 또는 효소를 코딩하는 서열을 포함하는 것인 (f)의 핵산(폴리뉴클레오티드); 또는
(h) (a), (b), (c), (d), (e), (f) 또는 (g)에 상보성인 핵산 서열
을 포함하는, 단리된, 합성 또는 재조합 핵산.