KR20090032676A

KR20090032676A - 토양 메타게놈에서 유래한 항생 활성을 암호화하는유전자군

Info

Publication number: KR20090032676A
Application number: KR1020070098109A
Authority: KR
Inventors: 이선우; 정유진; 이재헌; 정은숙
Original assignee: 동아대학교 산학협력단
Priority date: 2007-09-28
Filing date: 2007-09-28
Publication date: 2009-04-01
Also published as: KR100952754B1

Abstract

본 발명은 토양 미생물 메타게놈에서 유래한 항진균 및 항세균 활성을 암호화하는 유전자 집단과 항생활성 유전자 발현을 조절하는 조절 유전자에 관한 것으로, 메타게놈으로부터 얻은 22 kb의 항생활성 유전자 집단 orf20 내지 orf39을 특징으로 한다. 본 발명은 항효모 활성과 Bacillus subtilis에 대한 길항력을 가지는 클론인 EAF66 의 유전자에 대한 것으로 이러한 유전자 집단을 대장균에 발현하여 새로운 항생제 활성의 개발이 가능하며, 항진균 및 항세균 활성을 나타내므로 항생물질 생산을 위해 유용하게 이용할 수 있다.

메타게놈, 항진균, 항세균.

Description

토양 메타게놈에서 유래한 항생 활성을 암호화하는 유전자군{A GENE CLUSTER ENCODING ANTIBIOTIC ACTIVITY FROM SOIL METAGENOME}

본 발명은 토양 미생물의 총 유전체인 메타게놈으로부터 항생 활성을 암호화하는 유전자 집단을 선발하고 그 항생 효과를 증명하는 데 관한 것이다.

미생물 자체나 미생물의 2차 대사 산물이나 단백질 등을 산업적으로 이용하려는 연구가 지난 100여 년간 여러 분야에서 폭넓게 시도되어 왔다. 이는 주로 배양이 가능한 미생물을 대상으로 하며 많은 미생물 2차 대사산물들이 산업에 이용되어 왔다(예를 들면, 항생제, 항암제, 항균제, 면역억제제, 효소억제제, 제초제, 살충제, 생장 호르몬 등).

그러나 배양이 가능한 미생물로부터의 산물은 이미 많이 연구가 되어있고, 새로운 항생제를 방선균 등으로부터 찾으려는 시도는 계속하고 있으나 기존의 발견된 물질을 반복해서 분리하게 되는 예가 흔하다(Handelsman 등 1998).

항생물질 탐색의 고전적인 방법은 항생물질을 생산하는 미생물을 탐색하고 이들 미생물의 발효에 의해 항생물질을 확보하는 것이다. 그러나 분자 미생물 생태학의 연구결과 자연계에 존재하는 미생물의 99% 이상이 전형적인 배지에서 배양이 되지 않는다는 사실이 증명되었다(Amann 등 1995, Hugenholtz 와 Pace 1996,Ward 등 1990). 따라서 실제로 배양되어 동정이 된 적이 없는 대다수의 미생물들의 산물을 찾으려는 노력이 필요하며 이는 분자생물학적인 재조합 유전자 조작과 유전자 발현을 통하여 가능하리라 여겨진다.

메타게놈 연구는 이를 위해 시도되고 있는 최근의 접근방법으로, 메타게놈이란 자연계에 존재하는 모든 미생물의 유전체를 통칭하는 것으로 정의된다. 우선 자연계로부터 미생물을 배양하지 않고 메타게놈을 분리하며 이들을 라이브러리로 작성하여 배양가능한 대장균에 도입하므로서 구성된다. 이는 미생물산물을 배양이 되지 않았던 미생물로부터 확보하려는 접근 방법이라고 할 수 있다. 이 방법으로 유전자의 유래가 되는 미생물에 대한 정보는 얻기가 어려우나 미생물 산물과 유전자를 동시에 확보할 수 있는 장점이 있다.

미국 위스콘신 대학 연구팀은 처음으로 대형의 메타게놈을 성공적으로 분리하여 bacterial artificial chromosome (BAC) vector에 클로닝하여 메타게놈 라이브러리를 구축하였고 이로부터 광범위 항생물질 및 그 생합성 관련 유전자들을 분리하였다(Gillespie 등 2002 Rondon 등2000). TIGR 연구팀에서도 해양 미생물의 총 미생물 메타게놈 라이브러리를 BAC에 구축하여 해양의 배양되지 않는 미생물의 유전자원 탐색을 시도하고 있다.

본 발명의 목적은 토양미생물의 메타게놈으로부터 항생물질 생산에 관련된 신규한 유전자 집단을 제공하는 것이다.

또한 활성 메타게놈에서 활성관련 부위를 결정하고 염기서열을 결정하여 기보고된 유전자 집단과 상동성을 비교함으로써 항생 활성을 암호화하는 신규한 유전자 집단을 제공하는 것을 목적으로 한다.

상기 목적을 달성하기 위하여, 본 발명에서는 메타게놈으로부터 항생 활성이 있는 신규한 유전자 집단을 선발하여 제공한다.

본 발명자들은 토양 미생물의 메타게놈을 분리하여 포스미드를 이용하여 대장균에 메타게놈 라이브러리를 작성하고 항생 활성을 가지는 클론을 탐색하였다. 탐색의 대상인 균주는 진균인 Saccharomyces cerevisiae 와 세균인 Bacillus subtilis 였으며 항생 활성을 가지는 메타게놈 클론을 확보하였다.

활성 메타게놈에서 활성관련 부위를 결정하였고 염기서열을 결정하였는 바 기보고된 유전자 집단과 상동성이 아주 낮아 항생 활성을 암호화하는 신규한 유전자로서 본 발명을 완성하였다.

메타게놈으로부터 얻은 서열번호 1의 orf20 내지 orf39 까지의 유전자 집단으로서 항생활성을 가지는 것을 특징으로 한다. 상기 유전자 집단 중 항생활성의 발현에 직접적으로 관련되는 것은 orf29 내지 orf36 까지이다. 또한 상기 유전자 집단과 70% 이상의 상동성을 가진 유전자 집단이 가능하다.

또한 본 발명에서는 서열번호 2의 orf29 내지 orf36 까지의 항생활성 유전자가 코딩하는 단백질의 아미노산 서열을 규명하였다.

ORF20은 IclR response regulator(-frame)를, ORF28는 LysR family response regulator를 코딩한다. ORF29~ORF26은 항생활성 유전자로서, ORF30은 Ketoacyl synthase, ORF31는 ACP synthase, ORF32는 ACP synthase, ORF33은 Ketoacyl synthase, chain length, ORF34는 Aminotransferase, ORF35는 ACP reductase, ORF36은 Ketoreductase를 코딩한다.

한편, 상기 유전자 집단 중 orf20 및 orf28는 항생활성 유전자의 발현을 조절하는 조절유전자인 것을 특징으로 한다. 상기 조절유전자 orf20 및 orf28과 각각 70% 이상의 상동성을 가진 유전자가 가능하다. 서열번호 3 및 4의 orf20 및 orf28 조절 유전자는 IclR response regulator 및 LysR family response regulator을 코딩한다.

본 발명에서 제공하는 유전자의 전체 염기서열은 22,099 bp 이다. 본 유전자를 형질전환한 대장균은 벡터만 가지고 있는 대장균이 가지지 못하는 항진균 활성과 항세균 활성을 가진다. 항진균 활성은 효모인 Saccharomyces cerevisiae 에 대하여 항세균 활성은 그람 양성인 Bacillus subtilis 에 대하여 활성을 나타내었다. 그러나 그람 음성 세균인 Agrobacterium tumefaciens 에 대하여는 활성을 보이지 않았다.

이와 같은 유전자와 전체적으로 상동성을 보이는 유전자 집단은 아직 보고되 지 않았으며 아노테이션된 아미노산의 서열은 기존의 단백질들과 29-53% 정도의 상동성을 보여 신규한 유전자 집단으로 판단된다.

본 발명의 유전자 집단은 대장균에 형질전환하여 항생물질 생산에 이용할 수 있다. 본 유전자를 형질전환한 대장균은 벡터만 가지고 있는 대장균이 가지지 못하는 항진균 활성과 항세균 활성을 가진다. 항진균 활성은 효모인 Saccharomyces cerevisiae 에 대하여 항세균 활성은 그람 양성인 Bacillus subtilis에 대하여 활성을 나타내었다. 그러나 그람 음성 세균인 Agrobacterium tumefaciens 에 대하여는 활성을 보이지 않았다.

본 발명의 유전자 집단은 항진균 및 항세균 활성을 나타내므로 항생물질 생산을 위해 유용하게 이용할 수 있다.

이하, 본 발명을 실시예에 의하여 보다 상세하게 설명하고자 한다.

실시예 1: 토양 메타게놈 DNA 의 분리

본 연구에 사용한 토양 시료는 대전시 유성구 일대의 산림토양으로부터 채취하여 메타게놈 라이브러리 작성에 사용하였다. 채취한 토양은 각 구멍이 1.40 mm직경인 체에 쳐서 1.5 mm 이상의 입자와 식물 잔재물 등을 제거하고 메타게놈 추출을 위하여 5g씩 사용하였다.

SDS와 proteinase K를 처리하여 DNA를 추출하였는데 좀더 자세히 기술하면 아래와 같다.

산림토양 5g을 먼저 완충용액 15 ml 에 넣어 섞어주었다.

상기 완충용액의 조성은, 100 mM 의 Tris-HCl(pH 8.0), 100 mM 의 EDTA (pH 8.0), 100 mM의 sodium-phosphate (pH 8.0), 1.5 M 의 NaCl, 1%의 CTAB의 구성으로 이루어진다.

완충용액에 현탁이 된 산림토양에 100mg/ml 농도의 proteinase K를 100 μl 첨가하고 37℃ 진탕배양기에서 150 rpm의 속도로 30분간 진탕하였다. 이후에 20%의 SDS를 1.5 ml 첨가하고 잘 흔들어 섞어주었다. 이를 65℃ 항온수조에서 30분마다 한번씩 섞어주면서 2시간 동안 유지하였다.

이후에 7,000 rpm에서 10분간 원심분리하여 상등액을 분리하고 같은 부피의 클로로포름/아이소 아밀 알코올 (24:1)을 첨가하여 섞어준 후 8,000 rpm에서 5분간 원심분리하여 DNA가 포함된 상등액을 새 튜브로 옮긴다.

상등액의 부피의 0.6배에 해당하는 아이소프로파놀을 첨가하고 섞고 11,000 rpm에서 5분간 원심분리하여 DNA 침전물을 얻었고 이를 70% 에탄올을 첨가하여 재원심분리하고 침전물을 말려서 0.5 ml의 TE 완충액(10 mM Tris-HCl, 1 mM EDTA, pH 8.0) 에 녹여서 4℃에 보관하면서 라이브러리 작성에 이용하였다.

분리된 DNA의 양과 크기 결정은 pulsed field gel electrophoresis (PFGE) 로 확인하였다. PFGE를 수행하는 조건은 6 V/cm에서, 120° fixed angle로 1-6초 switch time 조건에서 6시간 수행하였다.

각종 토양으로부터 메타게놈을 분리하여 토양 1g 당 약 1～1.5 μg 의 DNA를 회수하였고 분리된 DNA 크기는 20~100 kb 정도로 대형으로 분리가 가능하였다.

실시예 2: 메타게놈 라이브러리의 작성

DNA의 전기영동, plasmid 분리, DNA의 절단 등은 기준이 되는 분자생물학적 방법(Sambrook 등 1989)으로 수행하였다. 시약 및 제한효소의 사용 등은 제조회사에서 추천한 방법에 따라 수행하였다.

추출해낸 메타게놈을 low melting point agarose gel에서 전기영동을 한 후 20-kb 이상의 DNA를 포함하는 agarose block만을 회수하고, 이를 GeLase 를 처리하여 DNA를 순화하였다. 이 과정을 통하여 humic acid 등을 제거할 수 있었다.

순화된 DNA 조각의 양끝 말단을 DNA end-repair 효소를 이용하여 수리하고, 20kb 이상의 메타게놈을 제한효소 Eco72I로 처리한 포스미드 벡터 pEpiFOS-5(Epicentre, USA) 에 라이게이션한 후 packagene extract (Epicentre. USA)를 이용하여 E. coli 에 도입하여 형질 전환체들을 선발하였다. 형질 전환체 들로부터 재조합 효율을 검정하기 위하여 전통적인 SDS-alkali lysis 방법으로 plasmid를 분리한 후 제한효소로 절단하여 전기영동 하였다.

검정한 80개의 형질전환체들은 모두 재조합 플라스미드로 확인되어 라이브러리가 잘 작성됨을 알 수 있었다.

채취한 산림표토 토양으로부터 라이브러리를 작성하였는데 토양 metagenomic DNA 1 μg당 25,000 ~ 60,000 클론의 확보가 가능하였다. 작성한 라이브러리는 1,000~1,500 클론씩 pool로 -80℃에 보관하였다. 유성구의 산림표토로부터 작성한 라이브러리는 총 112,000 클론이었다. 삽입된 메타게놈 DNA 의 평균 크기는 무작위로 메타게놈 라이브러리 클론 플라스미드를 추출하여 BamHI으로 절단한 후 전기영동하여 확인한 결과 35 kb 이상으로 나타났다.

실시예 3: 메타게놈 라이브러리의 항생활성 검정 및 선발

작성된 산림표토 메타게놈 라이브러리로부터 항진균, 항세균 활성 검정을 위해 효모(Saccharomyces cerevisiae)와 Agrobacterium tumefaciens, 그리고 Bacillus subtilis를 이용하였다. 먼저 작성된 라이브러리의 LB replica plate를 준비하여 각 클론들을 37℃에서 이틀간 선배양하였다. 그 위에 효모나 A. tumefaciens, 또는 B. subtilis가 포함된 탑아가(topagar)를 중층하여 30℃에서 2일간 후배양하고 효모나 세균들에 대한 생육 저해 클론 존재여부를 조사하여 항진균, 항세균 활성을 검정하였다.

선발된 활성 클론은 플라스미드를 재분리하고 대장균 EPI-100 에 형질전환하여 대상 검정 생물로 길항작용을 재검정하고 -80℃에 보관하였다.

본 발명에서 작성한 산림표토 메타게놈 라이브러리로부터 항진균 활성 클론 1종을 분리하여 재검정 결과, 항진균 활성 클론은 B. subtilis 에 대한 항세균 활성을 나타내었으나 A. tumefaciens에 대한 항생활성은 보이지 않았다.

선발된 클론들 중 항진균 활성이 우수한 클론의 유전자를 in vitro에서 트랜스포존 삽입변이 방법(insertional mutagenesis)과 염기서열 분석을 통해 항진균 관련 유전자를 분석하였다. 본 발명은 항효모 활성과 B. subtilis에 대한 길항력을 가지는 클론인 EAF66 의 유전자에 대한 것이다.

실시예 4: 항생활성 유전자 부위 결정

항진균 활성을 보이는 클론인 EAF66 에 대하여 in vitro에서 트랜스포존 삽입변이 방법(insertional mutagenesis)과 염기서열 분석을 통해 항진균 관련 유전자를 분석하였다. 트랜스포존 삽입 변이는 transposase와 GPS3 트랜스포존을 함유한 플라스미드를 제공하는 제조회사의 추천방법에 따라 수행하였다.

서로 다른 부위에 트랜스포존을 삽입한 각 변이체들을 약 200개체 선발하여 항효모 활성 및 B. subtilis에 대한 항세균 활성을 재검정하여 활성을 상실한 변이체를 19개체 선발하였다. 활성을 상실한 변이체들의 트랜스포존 삽입부위의 DNA 염기서열을 결정하기 위하여 삽입 주변부위 DNA를 PstI으로 절단하였다. 절단된 DNA들을 PstI으로 절단하고 Shrimp alkaline phosphatase 처리한 pUC119 에 라이게이션하여 클로닝하고 가나마이신이 첨가된 배지에서 선발된 형질전환체로부터 플라스미드를 분리하고 염기서열을 결정하여 삽입부위를 결정하였다. 활성을 상실한 변이체들의 트랜스포존 삽입 부위는 도 1A에 "

" 로 나타나 있다.

실시예 5: 항생활성 유전자 집단 염기서열 결정

항생 활성 클론 EAF66 의 플라스미드를 분리하고 총 염기서열을 분석한 결과 삽입 DNA의 크기는 40 kb 이상이었으며 이들 중 22 kb 부위가 활성에 필요하며 최소한 8개 이상의 유전자가 생리활성 표현형에 관련되어 있는 것으로 나타났다.

이들 활성에 직접적으로 관여된 유전자는 회색의 화살표로 도 1A에 표현되었으며 이들은 orf29에서 orf36까지이다. 이들은 각 orf의 종결코돈과 연속되는 orf의 개시코돈이 서로 겹쳐 연결되어 한개의 프로모터에 의해 유전자의 발현이 조절될 한 개의 전사단위(transcriptional unit)로 추론된다. 상기 항생활성 유전자 집단의 각 유전자에 있어서, ORF29는 서열번호 4의 단백질의 아미노산 서열을 나타내며, ORF30은 서열번호 5로서 Ketoacyl synthase, ORF31은 서열번호 6의 ACP synthase, ORF 32는 서열번호 7의 ACP synthase, ORF 33은 서열번호 8의 Ketoacyl synthase, ORF34는 서열번호 9의 Aminotransferase, ORF35는 서열번호 10의 ACP reductase, ORF36는 서열번호 11의 Ketoreductase의 단백질을 각각 암호화하는 것을 특징으로 한다.

유전자 집단 내에 유전자의 기원을 판단할 만한 계통분류적 표지유전자는 포함되어 있지 않았다. 항균 활성 클론의 구성은 도 1A에 나타나 있으며 트랜스포존 삽입부위와 함께 표시하였다. DNA의 염기서열은 BLASTX 검색을 통해, 항균활성 관련 유전자들은 GenBank의 유전자들과 비교하여 그 유사도가 가장 높은 유전자들을 도 2에 표로서 표현하였다. orf29에서 orf36의 유전자들은 추론한 아미노산 수준에서 가장 높은 유사성(identity)이 29~53% 수준으로 신규 유전자 집단으로 판단되었다.

실시예 6: 항생활성 유전자 발현 조절 유전자 결정

도 1에 나타난 것처럼 두 개의 조절 유전자를 각각 XhoI 과 SphI으로 절단하 여 pUC129와 pUC119에 각각 서브 클로닝하였다. orf20을 포함하는 1.25 kb의 XhoI 으로 절단한 EAF66 DNA 조각은 pUC129에 서브클로닝하여 pEJ102로 명명하였다. 그리고 orf28을 포함하는 2.58 kb의 SphI 으로 절단한 EAF66 DNA 조각은 pUC119에 서브클로닝하여 pEJ101로 명명하였다 (도 1).

pEJ101 과 pEJ102는 각각 lac 프로모터에 의해 강하게 발현되는 LysR 계의 조절단백질과 IclR 계의 조절단백질을 암호화하는 유전자를 포함하였다. 각 플라스미드를 EAF66 이나 pEPI-FOS5를 포함하는 대장균에 형질전환하였다. 그리고 실시예 3에서 실시한 방법에 따라 효모에 대한 항진균활성을 검정하였다.

도 3에서 나타난 것처럼 EAF66과 pUC129를 가진 대장균(도 3A), EAF66과 pUC119를 가진 대장균 (도 3C)에 비해 EAF66과 함께 pEJ101이나 pEJ102 (도 3B, 도 3D) 를 가진 대장균의 항진균 활성이 증가한 것을 효모 생육저지대가 증가한 것을 보고 판단할 수 있다. 대조군인 pEPI-FOS5와 pEJ102를 가진 대장균은(도 3E) EAF66 를 함유하고 있지 않아 항진균 활성이 전혀 나타나지 않았다.

따라서 high copy number plasmid에 서브클론되어 도입된 orf20과 orf28의 유전자 산물인 두 개의 조절단백질 IclR 과 LysR은 EAF66에서 발현되는 항생활성을 양성적으로 조절함을 나타내었다.

이상에서는 본 발명의 바람직한 실시예에 대해 설명하였으나 당해 기술분야에서 통상의 지식을 가진 자라면 본원 발명의 요지를 벗어남이 없이 다양한 변형실시가 가능할 것이며, 이러한 변형실시는 본원발명의 보호범위에 속하는 것으로서 본원발명의 보호범위는 특허청구범위에 기재된 바에 따라 해석되어야 할 것이다.

도 1은 메타게놈에서 분리한 항진균 및 항세균 활성 유전자 집단의 유전자 지도와 조절 유전자, 그리고 트랜스포존 삽입 변이로 항생활성을 상실한 유전자를 나타낸 도면이다.

도 2는 항생활성을 보이는 유전자 집단의 각 유전자들을 GenBank의 유전자들과 상동성을 비교하여 유사한 유전자와 아미노산 수준에서 동일성 그리고 유사 유전자를 가진 미생물을 나타낸 표이다.

도 3은 두 개의 조절 유전자를 과다발현하도록 형질전환한 대장균이 항생활성 유전자의 활성을 증가시켜 항생활성이 증가한 것을 나타낸 사진이다.

<110> Dong-A University Research Foundation For Industry-Academy Cooperation <120> A GENE CLUSTER ENCODING ANTIBIOTIC ACTIVITY FROM SOIL METAGENOME <160> 11 <170> KopatentIn 1.71 <210> 1 <211> 22099 <212> DNA <213> metagenome <400> 1 ttagaaactc ccggtataac ccagggtggc tgaaatctgg gcggcggtgc cgaccaggtc 60 ttccagccac tcttcctgca ggcggtcggc gggcgccgag atcgacaggc ccgcgaccag 120 tttgccggaa tcgtcatgga tgccggccgc catgcagcgc acccccagct ccagttcctc 180 gttgtcgcgc gcatagccgc gcgtacgcac catcgacagc tcacgttcga gcttgcccag 240 gtccgtgatc gaattcttgt tgtggcccgc caggccggtg cgcgtggcgt aggcgcggat 300 cgccttcggc tcgtccaccg acaggaacag cttgccggtc gacgtcaggt gcagcggacc 360 gcgcccgccg atcgcgcgca ccacctgcat gccggagcgc tcggaaaaag cgcggtcgat 420 gtagacgatc tcgtcgccct ggcgcaccga caggttgatg gtctgctggg tcttcttgtg 480 cagcgcgcgc atgaagtcca gcgccgcctc gcgtaccgac agccggctct tgaccacatt 540 gcccagttcc agcaggcgca tgccgaggcg gtaggtgccc ggctcgacgc ggtcgacaaa 600 gcgcgtgatc accatgtcgt tgaggatgcg gtgcgcggtg gaaggatgca ggcccgatac 660 cttggacagt tccttcaggc tcaccggatc ggtgtagttg gccagcgcgt ccagcagggc 720 caccatgcgt tcgatgacct ggatcgaggt tttgggggcg tcaacggttt cgattttcat 780 aatgtggttg gtgcggtgca gtatatgtcc ctactttata ccataatgtg aaaagaggtg 840 gcaatttctg cgcacggcaa cacttttgtg gaagtcgcgc tgcgcgcggg gcataatgcg 900 gcatcaatgc aactttggaa acaggccatg acgcaaccag tcagcgaatt caagagtaaa 960 agcgggctcg gccgtatcct gccggccatg ggttacgcgc tggccggcct gaaagcagcc 1020 gcgaaaaacg agcacgcctt ccgccaggaa ctggtcgtgg tcgcgatcgg caccgtgttc 1080 gcgctggtgc tgccgatttc cgcctaccag aagctgctgc tgatcggcat gctggtgttt 1140 gtgctgattg tcgagctgtt caattccgcg atcgaagcga tcgtcgaccg cgtctcgctc 1200 gagcgccatc cgctgtccaa gaacgccaag gacatgggca gcgccgccgt catgctcgcc 1260 atcttcctcg ccgtcgccgt ctgggtggtg gtgctgttca cccgcttcta ctaaaacccg 1320 cataagcaag cgcgaaagca ttccttcgct ttcgccgccc cctcccgtaa tctttcagaa 1380 ttggggtcag acctacattc tgaaactatt tcagaatgta ggtctgaccc caattctgaa 1440 acattcagga ggcggcgatg gcggcacaac ttgcggcaca acttttcccc gattttcatg 1500 tcgtgatcgt tccgggcctg catgacagcg gcccggcgca ctggcagtcg cgctggcacc 1560 gcttgcatcc ggagtgctcg cgcgtgcgcc aggacgactt cgacgatccg cgcctggcgc 1620 agtgggccgc gcgcctggac caggtgcgcg ccgccgaccc gcgcccggcc ttgctggtcg 1680 cccacagttt tggcgcgctg accgcggtcc acagcatcgc ccgcaatgac gacaatattg 1740 ccggcgcgct gctggtggcc ccggccgatc ccgacaagtt cggtgtggcg gacctgctgc 1800 cggcctggcg cctgccgtgt ccgacacttg tggtggccag cgccaacgat ccctggatgc 1860 gcctcgagcg cgcggcgcag tgggccgcgc gctggggcag cgagctggtc gacgcgggcc 1920 ggctgggcca tatcaacgcc gactcgcgcc tgggcgactg gcctgccgga aagaccctgt 1980 tgcggacgct ggcacatcgg gcgcacaata ggcgactggc cttttcggca tgattgaatt 2040 ttttacctca ccaattacgg agattgcaat gactttacga ctgggtgata ccgctcccga 2100 tttcgagcag gattcttcgc agggaccgat caagtttcat gagtgggcag gcgattcctg 2160 ggtggtgctg ttttcgcacc cggccgactt cacgccggtg tgcactaccg aactgggctt 2220 gaccgccaag ctgaaaccgg aattcgacaa gcgcaacgtc aaggcgatcg cgctgtcggt 2280 cgacccggcc gagcagcacc gccagtggat caaggacatc gaggaaaccc agcagaccgt 2340 ggtcggcttc cccatcatcg ccgacgccga caagaaagtc gcagcgctgt acgacatgat 2400 ccatcccgag cagtcggcca ccgccaccgt gcgctcgctg ttcgtgatcg acccgaacaa 2460 gaagatccgc ctgtcgatca cttatccgat gagcaccggc cgcaatttcg atgaagtgct 2520 gcgcgtaatc gacgccctgc agctgaccga caagcacacg gtggccacgc ccggcaactg 2580 gaaagacggc gacgacgtca tcattccgct gaccgtgcag gatccggaag tgctcaagca 2640 aaaatatccg aaaggcttca ccgccgcgcg tccctacctg cgcgtgaccc cgcagccgaa 2700 caaataaggg ggcagggcgg ccgccctgcg cggccgttca ctgtacgcat aagcaaataa 2760 gcagactgtc gtttgatata cggctgagca cctttaccct tgcgccatca tcaaggggat 2820 cccatgctca tcacgtatat cgtttccggt tttgccgtcg gcctgctggt cggcatgacc 2880 ggcgtgggcg gcggttccct gatgacgccc ctgctgaccc tgattttcgg ggtcccgccc 2940 tcggttgccg tcggcaccga cctcgctttc gcctccatca ccaaatcggc cggcgcgttt 3000 actcaccgcc tgcgcggcac ggtgcgctgg gacatcgtca agctgctgtg catcggcgcc 3060 ttgccggccg ccgtcgccac cgccctggcc ctcaagcagt acggcgccct tgacgcgagc 3120 atcggccagt tcatccgcta ttcgatcgcc ggttcggtgc tcctcaccgt cgtcgcgctc 3180 attttcaagg gcaagatgct ggcctggctg aacgcgcatc cggagcgcca gctgcagggc 3240 cgggcccttg atgccgccac cgtgttcgcc ggcctgggac tgggcgtgct ggtcaccatt 3300 tcctcgatcg gcgccggcgc catcggcgcc accctgctgg tcatgctgta tccgcgcctg 3360 tcggcggccg aagtggccgg caccgacatc gcctacgccg tgccgctgac cgccatcgcc 3420 gccttcggcc actggtggct gggctcgatc aactggacct tgctggccat gctgctggtc 3480 ggctcgctgc cgggcatcac cctcggttcc tggatcgcca agtcggtgcc ggaaaagttc 3540 ctgcgggtgc tgctggccat gaccctgacc ggcgtcgcgg ccaagctgat ctactaggcg 3600 ttttcctaat atcgttattc gtctatgtaa atgagaaaca gttcgtttcc tttatgacag 3660 tgtagtgcga ttattgagac ttcttagatc aaaatgtaat aagagggttt catgtcaatt 3720 cccccaccca aacgcgcgcc ttaccgggtc atgcccggtt tcggcctgtc gctcgggttc 3780 accatctttt acctggcgct gattgtcctg atcccgctgt cagcggtgtt cctcaagacc 3840 ttcaccatga cctgggacgc cttcgtcacg gccgtcacgt ccgaacgcgt gatggcgtcc 3900 taccgcctga ccttcggcgc ctcgctgatc gcggccatga tcaatgtgtt cttcggcggg 3960 atcgtggcct gggtgctggt gcgctaccag tttcccggca agcgcatcat cgatgccctg 4020 gtcgacctgc cattcgcact gccgaccgcg gtggccggca tcacgctgac cgccctgtat 4080 tcgaccaatg gctggatcgg gcgctacctc gacagcttcg gctggaaagt cgccttcacg 4140 ccggtcggcg tggtggtggc gctgaccttc atcggcctgc ctttcgtggt gcgcacggtg 4200 cagccggtgc tggaagacgc cgagcgcgaa ctggaagaag cggccgccag cctgggcgcc 4260 aattcgctgc agaccttcac ccgcatcatt ttcccgacca tcatgcccgc catgctgacc 4320 ggcttcgcgc tcgcttttgc acgcgccacc ggcgaatacg gctcggtcat tttcatcgcg 4380 ggtaacatgc cgatgatctc cgagatcacg ccgctgttca tcatcaccaa gctggaacag 4440 tacgactaca ccggcgccac cgcgatcgcg gtggtgatgc tgctggtgtc cttcgtgctg 4500 ctgctgacga ttaacctgct gcaggcgtgg acgcgcaaac gggcgggccg caaatgagcg 4560 ccatgaacaa acaagcttcc aatgtactgg agccggcctg ggtcaagctg ctgctgctgg 4620 tgatcgcctt cagcttcctg acgctgttcc tgttcgtgcc gctggtggcg gtattcgtcg 4680 aagcgttcaa gaagggcgcc ggcgcctact tcgccgccat caccgatccg gacgccgtct 4740 ccgccatcaa gctgaccctg atcgcggcgg tcatttcggt gccgctcaac ctggtgttcg 4800 gcctggccgc gtcgtgggcc atcgccaagc atgaatttcg cggcaagagc atcctgctca 4860 cgctgatcga cctgccgttt tcggtttcgc ccgtgatctc gggcctgatc tacgtgctgc 4920 tgttcggcgc ccagggctgg ttcggcccgt ggctgcagga gcacgacatc aagatcctgt 4980 tcgcggtgcc gggcattgtg ctggccacga tcttcatcac cttcccgttt gtggcgcgcg 5040 agctgatccc gctgatgcaa tcgcagggca acgaggaaga ggaggccgcg ctggtgctgg 5100 gggcctccgg ctggaagacc ttccgccacg tgacgctgcc gaacatcaaa tggggcctgc 5160 tgtacggcgt gatcctgtgt aatgcgcgcg ccatgggcga attcggtgcg gtgtcggtgg 5220 tgtcgggcca tatccgcggc gagaccaaca ccatgccact gcaggtggag atcctctaca 5280 acgagtacaa cttcgccgcg gcgttcgcgg tcgcctcgct gctcgcgctg ctggcgctgg 5340 tgaccctggc aatcaaatcc tttatcgaat ggcgtttgca ccagaccgac ccggtcgaag 5400 ctgaagcacg caaactggag cactgatcat gacgatcgaa gtcaagaaca tcaacaagcg 5460 tttcggcgaa ttcaccgcgc tcgataacgt gtccctgcaa tttccggcgg gcgaactgac 5520 cgcgctgctg gggccttcgg gctgcggcaa gaccacgctg ctgcgcatca tcgcgggcct 5580 ggagcatccc gattcgggcc aggtgctgct ggacgccgaa gacgcctcca gccgccacgt 5640 gcgcgagcgc caggtcggct tcgtgttcca gcactatgcg ctgtttcgcc acatgacggt 5700 gttcgagaac gtcgccttcg gcctgcgcgt gcgcccgcgc gccacgcggc cgtcggagac 5760 cgagatccgg gcccgcgtca aggaactgct ggagctggtg cagctcgact ggctggccga 5820 ccgcttcccg ccgcaactgt cgggcggaca gcgccagcgc atcgccctgg cgcgcgcgct 5880 ggcggtggag ccgcgcgtgc tgctgctcga cgagccgttc ggcgcgctcg acgccaaggt 5940 gcgcaaggaa ctgcggcgct ggctgcgccg cctgcacgac gacctgcatg tcaccagcat 6000 cttcgtcacc cacgaccagg aagaggcgct cgaagtggcc gaccaggtgg tcctgatgaa 6060 caaggggaag gtcgagcagc tcggcgcgcc gggcgacgtc tacaaccatc cggcttcgcc 6120 gtttgtgtac agctttctcg gcaacgtcaa cctgttccac ggccgcgtgc acgaaggcgt 6180 gctggccagc ggcgacgcca gcttcacggg tgcccgacca tgccgaggtg cagacgcgaa 6240 aggcatcgcc tatgtgcgtc cgcacgacct cgatgtggac cgctacacgc cgggcggcga 6300 gggcattgtg gtcaagctca aacgcgcgca cgccatcggt ccgctggccc agctggacct 6360 gcagcgcgcc gacaacgcgg agctgatcga agcggtcatt cccaacgagc gttttggcca 6420 gctgcagatc aaggaaggcg acaccctgct ggtgcgcccg cgccgcatgc acgtgtttgt 6480 cgaccaggga gcctcgatat gaacttccaa caattgcgct cgattcgcga aaccgcacgc 6540 cgcggctaca acctgaccga agtggccaat gcgctgttca cctcgcagcc cggcgtgagc 6600 cgccagatcc gtgagctgga agatgaactg ggcgtggtga ttttcgaacg caacggcaag 6660 cgcctgaccg gcatgaccga gccgggcaag ggcatcctca agatcatcga ccgcctgctg 6720 gtggaagccg aaaacctgca gcaggccagc atggactatg cgggccagaa cagcggcacc 6780 ctgaccatcg ccgctaccca cacccaggcg cgctatgcgc tgccgaaagt ggtgcagtcg 6840 ttccgccacg attttcccga cgtgcgcatc gcgctccagc aaagcgcgcc tgaccatatc 6900 gccgaatggg ttttatcggg caaggccgat atcggcatcg ccacggaggg cctgtcgcag 6960 ttcccggacc tggtgtcctt cccgtgctac cgctggagcc acctgatcgt ggtgccggac 7020 gggcacccgc tgctggcaca ttcgccgatc cggctggaag acctggcggc tttcccgctc 7080 attacctacg acgtgggctt cacgggccgc gggcatatcg acgccgcctt cgcgcaggcc 7140 ggcgtcaaga ccgacatcgt gctgaccgcg atggattcgg acgtgatcaa gcagtatgtg 7200 agcctggggc tgggcgtggg catcgtggcc tcgatggcct tcgaccatgg gcgcgacaag 7260 ggcctgcgcg cggtggaggc gtcgcacctg ttcgcgccca acgtgacccg gctggcggtg 7320 cggcgcggcg cctacctgcg cgcctacgcg tatcacttca tttcgcagtt tgcgccagaa 7380 ctgaagcgcg cggacatcga agcggcgatc ggggcggaag gctgacccgg ggcgggcgaa 7440 gcattagagg attttttcta aaccttcccg cctgggcctg cctcgaccgt tttagcggac 7500 ccggcaggcg tttaagtatt ttttgtgcaa taaatgctgc atcgcgtcat acgtttgtca 7560 cattcatccc gtttcgggat cgaccatctc cacgcttgat ttctgtttcc ccaacgcatt 7620 aattggtctt ccagacccgc ttgtcccgcc cgccggacct gcgctttcgc cgagtgaaaa 7680 agcttatgtt cgctatggga cataggctct ttcggcttgc ttctactatt tccctgttga 7740 aacagaatcc ccgcttacac ggcaatctgg tcttgtttat ctgccaactt tccgatgaca 7800 ttttcgtgac aatgatatgt acaccacgaa atcaattctg cgtaaacccc ttgtttctta 7860 aaaggttctt aacgtattcg ccaagcgaca aagttaaatt taagatttta ataacattga 7920 gtaagaagta aatttgcgat atagttatgt tgttgtttag caattaatcg ccgccggttt 7980 acagtcgccg tctccccctt cgccgcagtt tcgccgatcc cggcccacct gatcccggcg 8040 ggttttctgg acgtgagggg gctacgcact atgcggtaca ggacgtcttc aagagccccg 8100 gctgtgcggg aactgtcctg gcgcgggccg cggacagcag taatcgagcg ctaattgctg 8160 cggcgcacaa gagcgctcta ggcagcagca cgcaacacat ataacagcca caaaactaag 8220 gaaactgaca tgaacaatcc ctacaccgca gctgaaatgc aaaccatcgt gaacggcgta 8280 cttgccggcg tgcttggcgt cgacccgtcc gagatcgccg ccgacagcgc catcgtcgac 8340 gacttcggcg cggattcgct cgacttcgtc gagttcaaca ccacgctgga aaagaaactc 8400 aacatgtcga tgccgaaaaa aggtcccttg tcgcaggccg gcaaagccac cggcacgccc 8460 gagctgttct acagcggccg caccggcctg accgagcaag gcgtggacct gctgcgcaat 8520 agcctgtcgc agtacaccca gctgagcacc ggcatgaccg tgcacgatgt attcaacctg 8580 acctcggtcg gcaacatcgc ttcgctgtgc ctgaacctgt tcaaccacct gccggacacc 8640 tgcccggatt gcggccacgc tgaagcgaaa ctgtcggcgg ccggcaaagt ggtgtgcgcc 8700 tcgtgcagcg cgacggtgcg tccgctgcag ggcgacgagg ccgacgagcg ccacatccgc 8760 cagtacctcg ataccgcgct cgcccaggca gcctgaaatc atgaaaacgc aagtcgtcgt 8820 caccggcatc ggtgtcatct gcagccaggc ctcgtcggcc ggcgaactgt tcggacgcct 8880 gaaagatggc ttgtcgtccg tgcgtaacaa cgccaggatg gccgccagcg gcgtgtccaa 8940 tcccgcctgc gcgtacatcg acgagcatgt gtgggaccag ctcgaggccg agcaggccgg 9000 ccgcttcccg gaccatctcg gtccgcaagc gcgcctggcg ctgcatgcgg ccggccaggc 9060 cgtgcgccat gccggcatcg acctcggcgc cgtcgagcgc aagggactgt tcgtcgcgtc 9120 caacaagtac acgctcacca gcgagcacct gctgggcatc gggcgccatt acgacgccga 9180 cagcgccacg gtcaacctgg acagctacgt gcaggacgag cgccacgacg ccggcgccta 9240 cttccacaag cgccaggaca tggcggcgct gaccctggcg cagctgtacg gtttcgacga 9300 cgccgtcatg acgccgggcg acgcctgcgc cgccggcggc gtctcggtcg gcaccggctt 9360 tcgccatatc gcccacggcg agctcgatgt cgccctggtc ggcgccaccg aggcgatgag 9420 caactacgtg ccgctgatgg gcttttcgat cctgggcgcg tcggcgccgg atttcaacga 9480 cgacccagcc gctatcagcc gccccttcga caaggaccgc agcggtttcg tcatgggcga 9540 gggcagcgcc ttcctggtgc tcgagtcgct cgagcatgcg cagcggcgcg gggcgccgat 9600 cctggcgcgc gtgagcggct tcgccaagca ggtcgaggct taccgcatca ccgccagccc 9660 ggccgacggt tcccagtacg cgcgctgcat gcgcgccgcc ctcgacgacg ccggcctcga 9720 tgccgcctcc atcgaccatg tcaacgccca cggcacctcg acccagtcca acgacagctg 9780 cgaaagcgcg gccatcaagc aggtgttcgg agcgcgcgcg ccgcaggttc cggtcacggc 9840 caacaagtcg gccctgggcc actcgctggc tgccagcggc gccatcgaag cggtgctgtc 9900 ggtaatgtcg ctgcaggagc aggtgctgct gccgaccctg aacttcagcg agggcgacgc 9960 caataccgag ggcctggaca tcgtgcgcgc aacacgtccc gcgccggtcg cgcacatcat 10020 gtccaattct ttcggcttcg gcggacagaa ctgcgtcctg atcctgagca cgcactgacc 10080 cgggagcgat catgaaaacc aaggtctaca tcgacggcgg ctccgccctg tgcgccgccg 10140 gcgccggcat cgcgccgctg tggtccgcca tggcggcggg cgcgcgcaat ctgtccgcct 10200 tgccttgtcc cgctttcgac agctggccgt ggcccgaagt gttcctggtc gacgagcccg 10260 gcgcggccga gctcaaggtc gaccgcaagc tgctgcgcac catggaaaag caagccaagc 10320 tgaccctgct gggcgccgct gccgcgctgg cggcatgccc gccggccgtc gacgccgacc 10380 ccagccggat cggcctgtat ctcggcctgc cgacggtgga cgaggcggtg ccgccctggc 10440 cgctgctcga agccatgcac gaagcgggca gcacgcattt cgacagcgag atgctgcacc 10500 gcgaagtgcc cgccttcttc ggcctgtcga ccctgaacag caacgcctgc gcccatatcg 10560 cgggcacctt cggcatggcc ggctcgatgg gcgcctgttc gcctttcgcc gacgccggcc 10620 tggcggcctt gatcgaaggc gccctgtcgg tctgcaatgg cgagaacagc gaagccctgg 10680 tgggtggttg cagcgccaag atcaatccgc tgctgatgct gcagtacgag cacctgggct 10740 ggctggccga agcgggacgc attcccggtg aaggcgtggc cttcctcacc gtcggcgcgg 10800 ccagccggag cgagacggcg gtgcgcctgg ccggctatgc gcgcggcttc atcgcctccg 10860 aggtccaggc cgcggcggtc atcgcaccgg tggtcgagac cgcgctggcg atggccggca 10920 tcaccgcgca cgagctggac tgggtgctgc ccggggcctg cagcgacgcc gagatggcgc 10980 tgcttgcgcg cttggcggag ggcacgccgc tggtgcgcgc ctgcagcgcc gaggtgtgcg 11040 gcgcgctggg accggcggcg ccggtgctcg gcgtactgct ggcggcgcat gcgatccgca 11100 gcggcgcgcg cctgcgctac acggcgcccg gccagcccca gcgcgaagaa gcggcgcggg 11160 tgcgccatgt gctggtcacc gcgcgcggcc cggaagggca atacgccgcc gtagttgtat 11220 cgaaggagaa gtgcgatgag taaccgtgtc gtcatcaccg gcttgggcgt ggtcagcgcg 11280 ctgggctacg actgggagac cttctggaac gccctgttgg ccggcaagtc ggggatccgg 11340 ccctggcagc cggacgaagt cgaaggcttc ccggtgcagt atgcggcgcc ggtggacctg 11400 gccgatttcg agcgcacctt cgcgcgcgcc gcggaactgg cgcagccgat ggaaaggcgc 11460 agccgcttcg gcctgatggc cgcgcgcggc gcgctggccg acgccggcct ggcaggcaag 11520 gtccgtcaca acaccggcgt ggcggtcggc tccggcgtgc cggaacgctg cagcgccgac 11580 atgctgctgg cgctcggtcc cgccggcccg cgctgggaaa acctgtatgc gcgccgagcc 11640 gagctcaatg catccatgcg gccggggaac gaccacctgg cggcgctggt cgccaggagt 11700 tatggctgcg acggcccggt gctcaatttc agcaccgcct gcgccggcgc cgcgcatgca 11760 atcggcagca gtttccgcat gatccgcgac ggcgaaaccg actgcatgct ggccggcggc 11820 gccgattcgg tgctgaacct gatgaccatg ctgggcctga acctgatcgg cgcgccctcg 11880 acctcggaag accacggcga caagctgtgc cgcccgttcg acagcgcgcg cagcggcttc 11940 gtggcggccg agggcggcgc catgctggtg ctcgagagcg aacgccgcgc gcgcagccgg 12000 ggcgcccgca tttacgccga aatctgcggt ttcggcagtt cgctcgacgc ctaccgggtc 12060 acggcgccgc atccggaagg gcgcggcgcg gcgctcgcca tgcgcaaggc gctggccgac 12120 gccggcctgc agccgggtgc gatcggctac atcaatgccc acggcacctc gaccccgctc 12180 aacgacgtgg ccgaaacgcg ggccatcaag tcggtgtttg ccgacggtgg ccactatcgc 12240 aagctgatgg tcagcgccag caagtcgcag atcggccaca tgatcgcggc cgccggcgcc 12300 cccgaatgca tcgccacggt gctggcgctg catgccggcc atgtgccgcc caccctcaat 12360 ctggaccatc ccgatcccga atgcgatctc gattacgtgc cgcacctggc gcggcgcgcg 12420 ccgatccagg ccgcgctgtc gaattccttc ggcttcggcg gcctcaatgt gtcgctggcc 12480 ctgcgccgct accaggaata atcatgatga acacttcagc tgacaacacc attgtcatta 12540 ccggcaccgg ctgccttttg cccggcagtt ccacgcccgc gcaattctgg gaccgcctgg 12600 tgcaggggga aagcggcctg acgccctaca gcgacgagcg catcggctcg cgcctgatcg 12660 gccatttcgg ccatctcagc gccgagcagc gcgccgccgc cgccgaggcg gtaccgttca 12720 agctgcgccg cttcgcctcg agctgctcga tgtggggcgt gaaggccgcc accgatgcgc 12780 tggcccacgc cggcctcgac ctgaaaacca tacccgacga ccgctgcggg ctgttcaccg 12840 cccagggcga ctacctccat ccttcggtgc agtcgttcgc gaccggcctg ggtaacgccg 12900 tgccgaacga cttgccggcg ctgaccaggg aattcaccca ccaccgcggc atggagccct 12960 tcatggcgat caagagcctg gccaacaaca tgctggcgat ggccagcctg accctgggca 13020 cgcgcggcga ttgcggcgcc ttcgtccaga acaaaagcgc caccgtggcg gccttgcgca 13080 gtgccgcctt cagcctgcgc cacggctaca gcgattgcgc tttgctgatc tgctcgggca 13140 gctataacga ggtcctgacg ctggccgaac tgcagcgctc gggctacctg agcgccggcg 13200 ccggcggcgc gcgctcggtg cggcccttcg accgccgccg cgacggcacc atcgccggcg 13260 aaggcgcggt tgccttcgtc ctcgagaccg cggccaacgc ccgccgccgc ggcgccgccg 13320 tcctggccac gctgggcggc atcggtaacc tggtgcagca gccgggcgcg caagcgggca 13380 gcgacgccta ccgccgctgc gccgacaagg cgctggccgg ttccggcgtc gacttcggcg 13440 acatcggcgc catcgtggcg cgcggcaccg gcggccagtc gcacgacgcg catgaggcga 13500 gcctgctggc gcagctgcaa cagggccgcg gcggggtacc aatcacctgc gccacgccaa 13560 ttgtcggcag cgtgccggcc tgtccggtcg actggctcgc gtccatcggc atcctgcagg 13620 agggcgtggt gccgccgatc gccaacctgg aggacgctct cgacgccggc ctgcacttcg 13680 tgcatggcaa gccagagcag cgcgacgcgc gccacgtcct gtcgctgagc gccggctaca 13740 ccggtttcca ctcggccgtc cttttttccg cagcatcgca ctaggcacaa tccatgtcca 13800 attaccagca ctacgtcaaa acgcatttgt ccaagctgct cgccgcgctc ggactcgata 13860 tcagctacac gcgcgccgcc ggcgacacgc tctactaccg cgaccgccac ggcgaagaaa 13920 tccccgtgct cgacctgctg ggcggctacg gctcgctcat cttcggccac aaccacccgc 13980 agatcatggc caccgccacc gacctgatcg cgcagcaagt gccggtgcac gcccagttct 14040 cgctgcgcga gcgcgccggc gagctggcca ggcgcctgtc cgggatggtc cagcgcgaga 14100 gcggcagcga ggaagaattc aacgtcacct tcgccaacag cggcgccgag gcgatcgagg 14160 tggcgatcaa gcatgcggaa ctggaccgca tcctcaagct gcaaaccctg ctcgacgacg 14220 tcaccctcaa tatcgaacgg gtgcaaaagg ccatccgcaa cggcacggcc aaggtgccgg 14280 tcgacgtcta ccgccattcg ccgatccgcg agcaggtgtt cgacgtgcgc ggcttcgaag 14340 agctgatcgt cggcctggtg tcgcacaaca ctacccagct ggtgaagcgt cccattttcc 14400 tggtgctgga aaaatccttt cacggcaaac tgatcggcag cgtgcagctc acctacaaca 14460 agaatttccg gcgcccgttc cagtactttg gcctgaacac ccgcttcatt tcgccgcatg 14520 acccggacca gctgcggcgc gtgctggccg aggaacgcat cgtgctgtac gacctggacg 14580 tgcaggacgg cgtggtacgc gtcgtcgagc gcccgatccc gatcttcgcc gccttcctgg 14640 tcgagccgat ccagggcgag ggcggggtcc acatgctgga tgcagacttc gccaaactgg 14700 tgcgcaagac ctgcaacgaa ctcgattgcc cgctgatcgt cgacgagatc cagagcggca 14760 tggggcgctc gggcagcttc ctggccagca ccctgatccc gctcaagggc gactattaca 14820 cgctgtccaa gtcgctcggc ggcggcctgg ccaagatttc ggcgaccctg atccgcaaga 14880 gccgggtgcg caaggaattc agcctggtgc acagctccac cttcgccgag gacgacttct 14940 cgtcggggat cgcgctcaag gtgctcgaca tgctcgaagc ggacgatggc aaggcctacc 15000 atcaggtgca ggacagcgcg gccaagctgt ttgccgcctt cgagcgggtg cgcgccgcct 15060 tcccggacgt gatcaaggaa gtgcgcgggc agggcctgtt catcggcgtc gagttccaca 15120 gccaaaagaa cgccagctcg atcatcatcc gcggcagcgc ctacaacgat tccttcggct 15180 atctgctgtc gggctacctg ctgcaccagg agcggatccg catcgcgccg cccggcagcg 15240 cgccgaacgt gctgcgcatc gagccgtcga tgttcctgag cgatgcccag gtggcgcacg 15300 tggaagcggc cttcgggcgc ctgtgcgaca tcgtgcgcaa gcaggatgcg ctgcatttcg 15360 tgttcccgtt aacggcgtcc agccgcgcca agccgcgccg cgaggcgcag gacttcagcc 15420 aggcgttccc ggcgcagccg gccgcggaca gcaggttcga gccgacccgc ccggtgcgca 15480 agatcgcctt catcaaccac ctgatcaacc cgcagctgct gaccgaggtc gatccctcgc 15540 tggcggtgct cacggccgag gaactgcgcc agttcgtgct gaagatggac ccgaacaaga 15600 aggcggcccc gtatcccgcg gtgcgcatcc attcgccgct gggcagcgcg gtcgacttca 15660 tcctctatcc gctgtgcgtg agctcggagc agatgggcca gtacctcgcc gacggcaagc 15720 tcgatggcat ccgcgacgat atccaggacc gcatcaaggc cgcctccgag gacggctgcg 15780 agatcgccgg cctgggcatg tttacctcga tcgtgaccaa caactgcctg tcgctgcggg 15840 tgcccgacac cgcgctcacc accggcaacg ccttcaccgt cgccatggcg atcgatgcca 15900 tcgacaacgc ggtggccgcg gccggactgc cgatcgagga actcacggtg gtggtggtcg 15960 gcgccgcggg caacatcgcc agcacctacg cttcgctgct gagcgaaaaa accacgcgcc 16020 tgatcctgct gggcagcgag cgcaatggct cgctcagccg cctgaaccag accttgcaca 16080 gcatttacga cgacacctgg caggaaatct gcacgctgcc gcgcgagaaa ctgggccgcc 16140 tggcccagcg cctggtacgc gagccgctgg tggccgaatg gctggaagag ggcaccgcac 16200 cgcagcgcgg gcgcggcaag gccatcgccc agtacgtggc cgaacgccac ggccacgatc 16260 cttacattac ggtgtcgacc gaccgttcgc tgatcaggcg cggccacatc gtgctgtgcg 16320 ccgccaacag cgccgagccg ttcctgaccg gcgaggactt ccgcgagaac gccatcgtgt 16380 gcgatatcgc ggtgcccaac aatgtatgcg aaggcatcgg caaggatcgg ccggacgtgg 16440 tgtaccagca gggtggcatc gtggccacgc cgaatggcga aagcctgcat ccgggggcgc 16500 gcgcctttct cggcgccggc cagctgttcg cctgcatggc cgaaaccgtg atcatgggcc 16560 tggccggcat caaccgccac tactcctacg gcgccatctc caagcagcag gtgcgcgaaa 16620 tcgcggcgct cgggcgcgcg cacggcttca gcctggccga gtacaagacc ggcagctccc 16680 tctgacaaca aaggaatatg acagtgaaat tatcggatca ggtagcaatc gtgaccggcg 16740 ccagccgcgg catcgggcgc gcaatcgcgg tgctgttcgc ggaagagggc tgcgacgtgg 16800 ccatcaacta ccgcggcgac gaggccgggg cgctggagac cgcggcggcg gtcgaacagt 16860 tcggccgcaa ggccatgctg gtcaaggccg acgtctccag cttcgagcag tgcgaacgca 16920 tggccgatgc ggtcgccgag cgcttcggca agatcgacat cctcgtcaac aatgcgggca 16980 tcacgcgcga caacctgctg gtcagcatgg acgccgagga tatcgaagca gtcattcgca 17040 ccaacctgct gggcgtgatc tacccgacca aggcggtggc catgcacatg gtgcgcaagc 17100 gctcggggcg catcgtcaac atgtcttcgt cggcggcgtc caggccgggc aaaggccaat 17160 gcaactacgc cgcggccaag ggcggggtcg aatcgttcac gcgcgccatg gcggtcgagc 17220 tggcggcgcg caatgtgctg gtcaatgcgg tggcgcccgg cgtcatcatg accgacatgt 17280 cggagcagat ccgcgacatg ggcgacgagg aaatcaaggc gcgcctgctg ctcaagcgct 17340 atgcgcagcc gcgcgaggtg gccgacctgg tgctgcacct ggccagcccg gccaaccagt 17400 acatgaccgg cgaggtgctg cacctcaatg gcggcttgaa gatggcatga cgatgatgct 17460 cgacaccaaa gtcgccctcg tcaccggcgc cggcaacggc atcggcgccg ccgccgcccg 17520 cctgctgtgc gagcgcaaga tccacacgct gatcctgctg gacctgtcca ccgcggcgat 17580 cgacacgctc gcgaccgagc tgcaaggcag cggcacgcgc gtgctgtgct gcagcgccga 17640 catctccgac cgcgcggccc tgcgcgccgc cctcaagccg atcgtggcgc gcaccggcaa 17700 gatcgacatc ctggtcaaca gcgccggcat cgccgacgag aacgagccgg aacaggagga 17760 catctggcgc cgggtgctgg acgtgaatgt ccatggcact tatttcgtca cgctggaagc 17820 gctggacgcc atgccggacg gcggccgcat cgtcaacgtg gcctccatcc tcgggcgcgc 17880 gggcaatgtg cgcaacacgg cctattgcac ctccaagcac gccatgctcg gttttaccaa 17940 gagcctggcg ctggatgtgg ccagccgcaa gatcacggtc aacgcggtat tgccggcctg 18000 ggtcgatacg cccatgctgc gccgcgagat gggcctgcag gccgaaaaga tcggcgcgga 18060 gctggaccag atgctgcgca atgcccgcaa aaagatcccg ctgcgcagcc tggtgcaaag 18120 cggcgaggtg gcggccatga tcggctacct ggtatcggac gcggcgtcca gcgtgaccgc 18180 gcaaagcttc accatcgacg gcggcttcac atgcggcgtc tgaggctggc ggcggcgctg 18240 ctggcaggtt cgctatgcgg cgccgcgcag ggccaggagc ctgcgctcga tatcggcgtc 18300 tcggttgcgc tgcagtacgc ggcccacatc ggcgagaagc cccgcgcacg acccagcgcg 18360 gcggccagct caatgtcaag ttcgagcacg acggcggcgc gttccgggtc cgcggcgagg 18420 gccgcgtgcg ctggaacgac gcctaccgtg gcggcgtgta cagccgcgag gcgcgcgacg 18480 cctacgtgcg cagcgccgac tggcgcgagc tgtatatcgc aggcgaggct gcgggctgga 18540 acctgtcggc cggtttgcag caggtggtat ggggcaaggc cgacaacctg cgcgtggtcg 18600 acatggtcaa tccggtcgac ctgcgcgact tcatcctgcc cgagctgaac gactatcgca 18660 agccggtccc gatggtgcgc ggcacccgcg ccgtcggcga ctggcagctc gagctgttgt 18720 acctgccgcg cttcgtgccg acacgttacg cgcgtccggg cagcgaattc gacctggcgc 18780 agccagatcc cgagctgctc gcgagcgtcc agctgctgcc ggagcagcgt ccctcaaagt 18840 cgttcagggg tggcgaattg ggcatgcagg tctcgcgcag cttcggcgcg ctcgacctgt 18900 ccggctacct gttccatacc tgggatgaca atccggtgta ccgcttcctg cccgcgcagg 18960 atggcgccgg ccagccggct gttggcttgc agccggccta ccggcgccag tcgatggccg 19020 gcctgtcgct ggcccacgca atgggcaatg gcctggtgct gcgctccgaa ctggcctacg 19080 tgcccaattt tacctacatg gtcgcggcgg gcagcgaaga cggcctggca cgcagcgcca 19140 cgctcaccgg cctgctggga ctggactacg tgtggcgcga ctggctgctg tcggcgcagg 19200 tgaccgaccg ccatatcgat gcctgggacc gcagctacct gctgcgcaag cacgacccga 19260 tggtcaccct cgccgccacc ggcaccgcca tggccggcaa actcgattcg cgcctgtcgc 19320 tggcgcgctt cgccggcacg ggcggctacg tggcccaggc caggggcacc tggaagcccg 19380 acgacagctg ggcttacacc gccggggtcg acgtcttcgg cggcgacccg gccgggatct 19440 tcggacgctt ccgcaacaag gaccggctct ggttcgaact gaaataccac ttttaaaacc 19500 ataacaacac ctgatggagt atccgatgca agtgaaacga atcgtggcgg cagccctgct 19560 gatgctgtcg tcggcggcgg gggccacggc cctcagcgcc gaccagatcc tggaaaaagt 19620 gcgcaaccgc gccgacggcg ccgacatcct ggccgaagcc cagctggtgc tcaaggagag 19680 caacggcggc agccgcacgc gcaccctgct gttcttggaa aaggactacg gcaaggatga 19740 aaagctgacc ctggccttca ccggcccggc cgacgtcaag ggcgtggtcc tgcaaagcgt 19800 gaactacgac gaagcggcgg ccaaggagga cgaccagtgg atgtacttgc cggcctttcg 19860 ccaggtgagg cgcatcgccg ccaccgacaa gcgcggctcc ttcatgggca gccagttctc 19920 gtacatcgac ctggacaagc tgcgcgtggg cgactatcgc cagaagctgg taggcgagga 19980 gaccatcgac ggcaagccct gctacatgat cgaacgcaca cccgcatcgg aaagcgtgat 20040 caaccgcacc ggctatcaca agaacatggt gtgggtcgac aaggagacct tcgtcatcct 20100 caagcaaagc tacttcgatg cgcgcggcgt gcagttcaag tacttcctgg ccaaaaaggt 20160 cgagaagatc caagacatct ggaccgtgac ccacagcgaa atgcaggacg tggtcaacca 20220 gcgctcgtcg gccctgatct tcaacaaagt gcgctacaac gccggcctgg acgacgcggt 20280 attccaacaa aacatcatga aaacgggagt caatagtgga aacctacctg caattcgttg 20340 accgctggtc caaggccatc ctcgccgtcc tggcgctggt aacggccttc ttcgtggtcc 20400 agctgggcgc cctgaccaac gacagcaatc cctacctgct ggccgagtcg cacccggcgc 20460 gcaagtcgat cctcgacctg cagaaggaat tcaccggcac cttcgacgcg gcgatgatag 20520 tcgtgcacaa tccggccggc gtgttcaacc ggaccacgct ggacgcggtg ctggagatga 20580 ccacggcctc gcgcaagctg atgctggcca ccgagggcga tgcggcctac ctggaagggc 20640 tcaagcagcg ctatggcgcg gccaacccgg ccttcggcgc cgccatcgac gcggtcctcg 20700 ccaaaggcct ggagcagaac gactatttcg cggccgagaa gctgatcgaa ctgggtaaac 20760 cgctcgacct gtcgcatgcc gaaaccgcct tcctgtccta cctgccgcgc cgcctcaatc 20820 ccgtgaagga aatggccggc ctggcggcga ccgacaacat cctgaccaag gatggcacgc 20880 tggtcatcac caagagcctg caggacaaga ccacgccgcc ggcccagatc cgcgccgacg 20940 tgatgggcaa cgagatgctg atgaagagcg tcatctcgga cgacgaaaaa gtcaccatga 21000 tcacggtcga actgttcgtc aagcaggacg acgccgacgg ccaggtgcgc gcctacgacg 21060 ccatcaagaa aatcctcgac gactaccgca aggcccatcc ggagttcaag gacgaggtgt 21120 acatcgccgg caccccgatc ttcatcgccg agcagaagaa actgaccgac agcgaccttg 21180 gcaccctgct gccgctggtg atcggtgtcg tcggcgcgat cctgatcgtc tacttccgca 21240 ggccgctcgg cttcatcctg ccgatggtca atgtgatcat gtgcaccatc tggacgctgg 21300 gcgccatgag cctgatgcgg gtgccgatgg acctggtcac cagcgcgctg ccggtgttcc 21360 tgattaccat ctgcggcgcc gacgccatcc acatgatgag cgagtactac acccagaaga 21420 gcagcggcat cgacaccagg gaagcggtgc gccgcaccct gcgcgcaatg gtctcgccga 21480 ttgtactgac cactgtcacc acggtggccg gcttcctgtt ttcgaccgcc accaatatct 21540 ccagcatcca gtcgttcggc attttcatgg ccgtcggcct ggtcagcgcg cagatcatct 21600 cgctgctcct gatcccggcg tggatcaatc tgatgggtgg caaaaagcag gtcgccagcg 21660 ccagcggcga agtcgacgcc ggctggctcg gacgcgccct ggcctccgtg ttcgccgcgc 21720 tgatccgcaa gcgcaaggcg gcgctgctgg ccttcgccgt gctgatggtg ggcgcgggcc 21780 tgatggccac ccgcatctcg gtggacgatg ccggctcggc ctacttcctg cccgataacg 21840 agtaccgcaa gtccgatgaa ttcatcaacg gccacatcgc cggcaccagc cctggctgga 21900 tccgcatcga aggcgccggt ccgaacgcca tgctcaacgt cgagaccatg gtcttcatcg 21960 acaagctcga cgccttcctg ctgtcgcagc ccaaggtgac gtacacgtat tcgccggcca 22020 cctacgtcaa gcgcatgaac ctggcggtca acgacatgaa gccggaattc aaccgcctgc 22080 cgcgcaagag cgaaaccgt 22099 <210> 2 <211> 259 <212> PRT <213> metagenome <400> 2 Met Lys Ile Glu Thr Val Asp Ala Pro Lys Thr Ser Ile Gln Val Ile 1 5 10 15 Glu Arg Met Val Ala Leu Leu Asp Ala Leu Ala Asn Tyr Thr Asp Pro 20 25 30 Val Ser Leu Lys Glu Leu Ser Lys Val Ser Gly Leu His Pro Ser Thr 35 40 45 Ala His Arg Ile Leu Asn Asp Met Val Ile Thr Arg Phe Val Asp Arg 50 55 60 Val Glu Pro Gly Thr Tyr Arg Leu Gly Met Arg Leu Leu Glu Leu Gly 65 70 75 80 Asn Val Val Lys Ser Arg Leu Ser Val Arg Glu Ala Ala Leu Asp Phe 85 90 95 Met Arg Ala Leu His Lys Lys Thr Gln Gln Thr Ile Asn Leu Ser Val 100 105 110 Arg Gln Gly Asp Glu Ile Val Tyr Ile Asp Arg Ala Phe Ser Glu Arg 115 120 125 Ser Gly Met Gln Val Val Arg Ala Ile Gly Gly Arg Gly Pro Leu His 130 135 140 Leu Thr Ser Thr Gly Lys Leu Phe Leu Ser Val Asp Glu Pro Lys Ala 145 150 155 160 Ile Arg Ala Tyr Ala Thr Arg Thr Gly Leu Ala Gly His Asn Lys Asn 165 170 175 Ser Ile Thr Asp Leu Gly Lys Leu Glu Arg Glu Leu Ser Met Val Arg 180 185 190 Thr Arg Gly Tyr Ala Arg Asp Asn Glu Glu Leu Glu Leu Gly Val Arg 195 200 205 Cys Met Ala Ala Gly Ile His Asp Asp Ser Gly Lys Leu Val Ala Gly 210 215 220 Leu Ser Ile Ser Ala Pro Ala Asp Arg Leu Gln Glu Glu Trp Leu Glu 225 230 235 240 Asp Leu Val Gly Thr Ala Ala Gln Ile Ser Ala Thr Leu Gly Tyr Thr 245 250 255 Gly Ser Phe <210> 3 <211> 308 <212> PRT <213> metagenome <400> 3 Met Asn Phe Gln Gln Leu Arg Ser Ile Arg Glu Thr Ala Arg Arg Gly 1 5 10 15 Tyr Asn Leu Thr Glu Val Ala Asn Ala Leu Phe Thr Ser Gln Pro Gly 20 25 30 Val Ser Arg Gln Ile Arg Glu Leu Glu Asp Glu Leu Gly Val Val Ile 35 40 45 Phe Glu Arg Asn Gly Lys Arg Leu Thr Gly Met Thr Glu Pro Gly Lys 50 55 60 Gly Ile Leu Lys Ile Ile Asp Arg Leu Leu Val Glu Ala Glu Asn Leu 65 70 75 80 Gln Gln Ala Ser Met Asp Tyr Ala Gly Gln Asn Ser Gly Thr Leu Thr 85 90 95 Ile Ala Ala Thr His Thr Gln Ala Arg Tyr Ala Leu Pro Lys Val Val 100 105 110 Gln Ser Phe Arg His Asp Phe Pro Asp Val Arg Ile Ala Leu Gln Gln 115 120 125 Ser Ala Pro Asp His Ile Ala Glu Trp Val Leu Ser Gly Lys Ala Asp 130 135 140 Ile Gly Ile Ala Thr Glu Gly Leu Ser Gln Phe Pro Asp Leu Val Ser 145 150 155 160 Phe Pro Cys Tyr Arg Trp Ser His Leu Ile Val Val Pro Asp Gly His 165 170 175 Pro Leu Leu Ala His Ser Pro Ile Arg Leu Glu Asp Leu Ala Ala Phe 180 185 190 Pro Leu Ile Thr Tyr Asp Val Gly Phe Thr Gly Arg Gly His Ile Asp 195 200 205 Ala Ala Phe Ala Gln Ala Gly Val Lys Thr Asp Ile Val Leu Thr Ala 210 215 220 Met Asp Ser Asp Val Ile Lys Gln Tyr Val Ser Leu Gly Leu Gly Val 225 230 235 240 Gly Ile Val Ala Ser Met Ala Phe Asp His Gly Arg Asp Lys Gly Leu 245 250 255 Arg Ala Val Glu Ala Ser His Leu Phe Ala Pro Asn Val Thr Arg Leu 260 265 270 Ala Val Arg Arg Gly Ala Tyr Leu Arg Ala Tyr Ala Tyr His Phe Ile 275 280 285 Ser Gln Phe Ala Pro Glu Leu Lys Arg Ala Asp Ile Glu Ala Ala Ile 290 295 300 Gly Ala Glu Gly 305 <210> 4 <211> 188 <212> PRT <213> metagenome <400> 4 Met Asn Asn Pro Tyr Thr Ala Ala Glu Met Gln Thr Ile Val Asn Gly 1 5 10 15 Val Leu Ala Gly Val Leu Gly Val Asp Pro Ser Glu Ile Ala Ala Asp 20 25 30 Ser Ala Ile Val Asp Asp Phe Gly Ala Asp Ser Leu Asp Phe Val Glu 35 40 45 Phe Asn Thr Thr Leu Glu Lys Lys Leu Asn Met Ser Met Pro Lys Lys 50 55 60 Gly Pro Leu Ser Gln Ala Gly Lys Ala Thr Gly Thr Pro Glu Leu Phe 65 70 75 80 Tyr Ser Gly Arg Thr Gly Leu Thr Glu Gln Gly Val Asp Leu Leu Arg 85 90 95 Asn Ser Leu Ser Gln Tyr Thr Gln Leu Ser Thr Gly Met Thr Val His 100 105 110 Asp Val Phe Asn Leu Thr Ser Val Gly Asn Ile Ala Ser Leu Cys Leu 115 120 125 Asn Leu Phe Asn His Leu Pro Asp Thr Cys Pro Asp Cys Gly His Ala 130 135 140 Glu Ala Lys Leu Ser Ala Ala Gly Lys Val Val Cys Ala Ser Cys Ser 145 150 155 160 Ala Thr Val Arg Pro Leu Gln Gly Asp Glu Ala Asp Glu Arg His Ile 165 170 175 Arg Gln Tyr Leu Asp Thr Ala Leu Ala Gln Ala Ala 180 185 <210> 5 <211> 425 <212> PRT <213> metagenome <400> 5 Met Lys Thr Gln Val Val Val Thr Gly Ile Gly Val Ile Cys Ser Gln 1 5 10 15 Ala Ser Ser Ala Gly Glu Leu Phe Gly Arg Leu Lys Asp Gly Leu Ser 20 25 30 Ser Val Arg Asn Asn Ala Arg Met Ala Ala Ser Gly Val Ser Asn Pro 35 40 45 Ala Cys Ala Tyr Ile Asp Glu His Val Trp Asp Gln Leu Glu Ala Glu 50 55 60 Gln Ala Gly Arg Phe Pro Asp His Leu Gly Pro Gln Ala Arg Leu Ala 65 70 75 80 Leu His Ala Ala Gly Gln Ala Val Arg His Ala Gly Ile Asp Leu Gly 85 90 95 Ala Val Glu Arg Lys Gly Leu Phe Val Ala Ser Asn Lys Tyr Thr Leu 100 105 110 Thr Ser Glu His Leu Leu Gly Ile Gly Arg His Tyr Asp Ala Asp Ser 115 120 125 Ala Thr Val Asn Leu Asp Ser Tyr Val Gln Asp Glu Arg His Asp Ala 130 135 140 Gly Ala Tyr Phe His Lys Arg Gln Asp Met Ala Ala Leu Thr Leu Ala 145 150 155 160 Gln Leu Tyr Gly Phe Asp Asp Ala Val Met Thr Pro Gly Asp Ala Cys 165 170 175 Ala Ala Gly Gly Val Ser Val Gly Thr Gly Phe Arg His Ile Ala His 180 185 190 Gly Glu Leu Asp Val Ala Leu Val Gly Ala Thr Glu Ala Met Ser Asn 195 200 205 Tyr Val Pro Leu Met Gly Phe Ser Ile Leu Gly Ala Ser Ala Pro Asp 210 215 220 Phe Asn Asp Asp Pro Ala Ala Ile Ser Arg Pro Phe Asp Lys Asp Arg 225 230 235 240 Ser Gly Phe Val Met Gly Glu Gly Ser Ala Phe Leu Val Leu Glu Ser 245 250 255 Leu Glu His Ala Gln Arg Arg Gly Ala Pro Ile Leu Ala Arg Val Ser 260 265 270 Gly Phe Ala Lys Gln Val Glu Ala Tyr Arg Ile Thr Ala Ser Pro Ala 275 280 285 Asp Gly Ser Gln Tyr Ala Arg Cys Met Arg Ala Ala Leu Asp Asp Ala 290 295 300 Gly Leu Asp Ala Ala Ser Ile Asp His Val Asn Ala His Gly Thr Ser 305 310 315 320 Thr Gln Ser Asn Asp Ser Cys Glu Ser Ala Ala Ile Lys Gln Val Phe 325 330 335 Gly Ala Arg Ala Pro Gln Val Pro Val Thr Ala Asn Lys Ser Ala Leu 340 345 350 Gly His Ser Leu Ala Ala Ser Gly Ala Ile Glu Ala Val Leu Ser Val 355 360 365 Met Ser Leu Gln Glu Gln Val Leu Leu Pro Thr Leu Asn Phe Ser Glu 370 375 380 Gly Asp Ala Asn Thr Glu Gly Leu Asp Ile Val Arg Ala Thr Arg Pro 385 390 395 400 Ala Pro Val Ala His Ile Met Ser Asn Ser Phe Gly Phe Gly Gly Gln 405 410 415 Asn Cys Val Leu Ile Leu Ser Thr His 420 425 <210> 6 <211> 383 <212> PRT <213> metagenome <400> 6 Met Lys Thr Lys Val Tyr Ile Asp Gly Gly Ser Ala Leu Cys Ala Ala 1 5 10 15 Gly Ala Gly Ile Ala Pro Leu Trp Ser Ala Met Ala Ala Gly Ala Arg 20 25 30 Asn Leu Ser Ala Leu Pro Cys Pro Ala Phe Asp Ser Trp Pro Trp Pro 35 40 45 Glu Val Phe Leu Val Asp Glu Pro Gly Ala Ala Glu Leu Lys Val Asp 50 55 60 Arg Lys Leu Leu Arg Thr Met Glu Lys Gln Ala Lys Leu Thr Leu Leu 65 70 75 80 Gly Ala Ala Ala Ala Leu Ala Ala Cys Pro Pro Ala Val Asp Ala Asp 85 90 95 Pro Ser Arg Ile Gly Leu Tyr Leu Gly Leu Pro Thr Val Asp Glu Ala 100 105 110 Val Pro Pro Trp Pro Leu Leu Glu Ala Met His Glu Ala Gly Ser Thr 115 120 125 His Phe Asp Ser Glu Met Leu His Arg Glu Val Pro Ala Phe Phe Gly 130 135 140 Leu Ser Thr Leu Asn Ser Asn Ala Cys Ala His Ile Ala Gly Thr Phe 145 150 155 160 Gly Met Ala Gly Ser Met Gly Ala Cys Ser Pro Phe Ala Asp Ala Gly 165 170 175 Leu Ala Ala Leu Ile Glu Gly Ala Leu Ser Val Cys Asn Gly Glu Asn 180 185 190 Ser Glu Ala Leu Val Gly Gly Cys Ser Ala Lys Ile Asn Pro Leu Leu 195 200 205 Met Leu Gln Tyr Glu His Leu Gly Trp Leu Ala Glu Ala Gly Arg Ile 210 215 220 Pro Gly Glu Gly Val Ala Phe Leu Thr Val Gly Ala Ala Ser Arg Ser 225 230 235 240 Glu Thr Ala Val Arg Leu Ala Gly Tyr Ala Arg Gly Phe Ile Ala Ser 245 250 255 Glu Val Gln Ala Ala Ala Val Ile Ala Pro Val Val Glu Thr Ala Leu 260 265 270 Ala Met Ala Gly Ile Thr Ala His Glu Leu Asp Trp Val Leu Pro Gly 275 280 285 Ala Cys Ser Asp Ala Glu Met Ala Leu Leu Ala Arg Leu Ala Glu Gly 290 295 300 Thr Pro Leu Val Arg Ala Cys Ser Ala Glu Val Cys Gly Ala Leu Gly 305 310 315 320 Pro Ala Ala Pro Val Leu Gly Val Leu Leu Ala Ala His Ala Ile Arg 325 330 335 Ser Gly Ala Arg Leu Arg Tyr Thr Ala Pro Gly Gln Pro Gln Arg Glu 340 345 350 Glu Ala Ala Arg Val Arg His Val Leu Val Thr Ala Arg Gly Pro Glu 355 360 365 Gly Gln Tyr Ala Ala Val Val Val Ser Lys Glu Lys Cys Asp Glu 370 375 380 <210> 7 <211> 421 <212> PRT <213> metagenome <400> 7 Met Ser Asn Arg Val Val Ile Thr Gly Leu Gly Val Val Ser Ala Leu 1 5 10 15 Gly Tyr Asp Trp Glu Thr Phe Trp Asn Ala Leu Leu Ala Gly Lys Ser 20 25 30 Gly Ile Arg Pro Trp Gln Pro Asp Glu Val Glu Gly Phe Pro Val Gln 35 40 45 Tyr Ala Ala Pro Val Asp Leu Ala Asp Phe Glu Arg Thr Phe Ala Arg 50 55 60 Ala Ala Glu Leu Ala Gln Pro Met Glu Arg Arg Ser Arg Phe Gly Leu 65 70 75 80 Met Ala Ala Arg Gly Ala Leu Ala Asp Ala Gly Leu Ala Gly Lys Val 85 90 95 Arg His Asn Thr Gly Val Ala Val Gly Ser Gly Val Pro Glu Arg Cys 100 105 110 Ser Ala Asp Met Leu Leu Ala Leu Gly Pro Ala Gly Pro Arg Trp Glu 115 120 125 Asn Leu Tyr Ala Arg Arg Ala Glu Leu Asn Ala Ser Met Arg Pro Gly 130 135 140 Asn Asp His Leu Ala Ala Leu Val Ala Arg Ser Tyr Gly Cys Asp Gly 145 150 155 160 Pro Val Leu Asn Phe Ser Thr Ala Cys Ala Gly Ala Ala His Ala Ile 165 170 175 Gly Ser Ser Phe Arg Met Ile Arg Asp Gly Glu Thr Asp Cys Met Leu 180 185 190 Ala Gly Gly Ala Asp Ser Val Leu Asn Leu Met Thr Met Leu Gly Leu 195 200 205 Asn Leu Ile Gly Ala Pro Ser Thr Ser Glu Asp His Gly Asp Lys Leu 210 215 220 Cys Arg Pro Phe Asp Ser Ala Arg Ser Gly Phe Val Ala Ala Glu Gly 225 230 235 240 Gly Ala Met Leu Val Leu Glu Ser Glu Arg Arg Ala Arg Ser Arg Gly 245 250 255 Ala Arg Ile Tyr Ala Glu Ile Cys Gly Phe Gly Ser Ser Leu Asp Ala 260 265 270 Tyr Arg Val Thr Ala Pro His Pro Glu Gly Arg Gly Ala Ala Leu Ala 275 280 285 Met Arg Lys Ala Leu Ala Asp Ala Gly Leu Gln Pro Gly Ala Ile Gly 290 295 300 Tyr Ile Asn Ala His Gly Thr Ser Thr Pro Leu Asn Asp Val Ala Glu 305 310 315 320 Thr Arg Ala Ile Lys Ser Val Phe Ala Asp Gly Gly His Tyr Arg Lys 325 330 335 Leu Met Val Ser Ala Ser Lys Ser Gln Ile Gly His Met Ile Ala Ala 340 345 350 Ala Gly Ala Pro Glu Cys Ile Ala Thr Val Leu Ala Leu His Ala Gly 355 360 365 His Val Pro Pro Thr Leu Asn Leu Asp His Pro Asp Pro Glu Cys Asp 370 375 380 Leu Asp Tyr Val Pro His Leu Ala Arg Arg Ala Pro Ile Gln Ala Ala 385 390 395 400 Leu Ser Asn Ser Phe Gly Phe Gly Gly Leu Asn Val Ser Leu Ala Leu 405 410 415 Arg Arg Tyr Gln Glu 420 <210> 8 <211> 425 <212> PRT <213> metagenome <400> 8 Met Asn Thr Ser Ala Asp Asn Thr Ile Val Ile Thr Gly Thr Gly Cys 1 5 10 15 Leu Leu Pro Gly Ser Ser Thr Pro Ala Gln Phe Trp Asp Arg Leu Val 20 25 30 Gln Gly Glu Ser Gly Leu Thr Pro Tyr Ser Asp Glu Arg Ile Gly Ser 35 40 45 Arg Leu Ile Gly His Phe Gly His Leu Ser Ala Glu Gln Arg Ala Ala 50 55 60 Ala Ala Glu Ala Val Pro Phe Lys Leu Arg Arg Phe Ala Ser Ser Cys 65 70 75 80 Ser Met Trp Gly Val Lys Ala Ala Thr Asp Ala Leu Ala His Ala Gly 85 90 95 Leu Asp Leu Lys Thr Ile Pro Asp Asp Arg Cys Gly Leu Phe Thr Ala 100 105 110 Gln Gly Asp Tyr Leu His Pro Ser Val Gln Ser Phe Ala Thr Gly Leu 115 120 125 Gly Asn Ala Val Pro Asn Asp Leu Pro Ala Leu Thr Arg Glu Phe Thr 130 135 140 His His Arg Gly Met Glu Pro Phe Met Ala Ile Lys Ser Leu Ala Asn 145 150 155 160 Asn Met Leu Ala Met Ala Ser Leu Thr Leu Gly Thr Arg Gly Asp Cys 165 170 175 Gly Ala Phe Val Gln Asn Lys Ser Ala Thr Val Ala Ala Leu Arg Ser 180 185 190 Ala Ala Phe Ser Leu Arg His Gly Tyr Ser Asp Cys Ala Leu Leu Ile 195 200 205 Cys Ser Gly Ser Tyr Asn Glu Val Leu Thr Leu Ala Glu Leu Gln Arg 210 215 220 Ser Gly Tyr Leu Ser Ala Gly Ala Gly Gly Ala Arg Ser Val Arg Pro 225 230 235 240 Phe Asp Arg Arg Arg Asp Gly Thr Ile Ala Gly Glu Gly Ala Val Ala 245 250 255 Phe Val Leu Glu Thr Ala Ala Asn Ala Arg Arg Arg Gly Ala Ala Val 260 265 270 Leu Ala Thr Leu Gly Gly Ile Gly Asn Leu Val Gln Gln Pro Gly Ala 275 280 285 Gln Ala Gly Ser Asp Ala Tyr Arg Arg Cys Ala Asp Lys Ala Leu Ala 290 295 300 Gly Ser Gly Val Asp Phe Gly Asp Ile Gly Ala Ile Val Ala Arg Gly 305 310 315 320 Thr Gly Gly Gln Ser His Asp Ala His Glu Ala Ser Leu Leu Ala Gln 325 330 335 Leu Gln Gln Gly Arg Gly Gly Val Pro Ile Thr Cys Ala Thr Pro Ile 340 345 350 Val Gly Ser Val Pro Ala Cys Pro Val Asp Trp Leu Ala Ser Ile Gly 355 360 365 Ile Leu Gln Glu Gly Val Val Pro Pro Ile Ala Asn Leu Glu Asp Ala 370 375 380 Leu Asp Ala Gly Leu His Phe Val His Gly Lys Pro Glu Gln Arg Asp 385 390 395 400 Ala Arg His Val Leu Ser Leu Ser Ala Gly Tyr Thr Gly Phe His Ser 405 410 415 Ala Val Leu Phe Ser Ala Ala Ser His 420 425 <210> 9 <211> 963 <212> PRT <213> metagenome <400> 9 Met Ser Asn Tyr Gln His Tyr Val Lys Thr His Leu Ser Lys Leu Leu 1 5 10 15 Ala Ala Leu Gly Leu Asp Ile Ser Tyr Thr Arg Ala Ala Gly Asp Thr 20 25 30 Leu Tyr Tyr Arg Asp Arg His Gly Glu Glu Ile Pro Val Leu Asp Leu 35 40 45 Leu Gly Gly Tyr Gly Ser Leu Ile Phe Gly His Asn His Pro Gln Ile 50 55 60 Met Ala Thr Ala Thr Asp Leu Ile Ala Gln Gln Val Pro Val His Ala 65 70 75 80 Gln Phe Ser Leu Arg Glu Arg Ala Gly Glu Leu Ala Arg Arg Leu Ser 85 90 95 Gly Met Val Gln Arg Glu Ser Gly Ser Glu Glu Glu Phe Asn Val Thr 100 105 110 Phe Ala Asn Ser Gly Ala Glu Ala Ile Glu Val Ala Ile Lys His Ala 115 120 125 Glu Leu Asp Arg Ile Leu Lys Leu Gln Thr Leu Leu Asp Asp Val Thr 130 135 140 Leu Asn Ile Glu Arg Val Gln Lys Ala Ile Arg Asn Gly Thr Ala Lys 145 150 155 160 Val Pro Val Asp Val Tyr Arg His Ser Pro Ile Arg Glu Gln Val Phe 165 170 175 Asp Val Arg Gly Phe Glu Glu Leu Ile Val Gly Leu Val Ser His Asn 180 185 190 Thr Thr Gln Leu Val Lys Arg Pro Ile Phe Leu Val Leu Glu Lys Ser 195 200 205 Phe His Gly Lys Leu Ile Gly Ser Val Gln Leu Thr Tyr Asn Lys Asn 210 215 220 Phe Arg Arg Pro Phe Gln Tyr Phe Gly Leu Asn Thr Arg Phe Ile Ser 225 230 235 240 Pro His Asp Pro Asp Gln Leu Arg Arg Val Leu Ala Glu Glu Arg Ile 245 250 255 Val Leu Tyr Asp Leu Asp Val Gln Asp Gly Val Val Arg Val Val Glu 260 265 270 Arg Pro Ile Pro Ile Phe Ala Ala Phe Leu Val Glu Pro Ile Gln Gly 275 280 285 Glu Gly Gly Val His Met Leu Asp Ala Asp Phe Ala Lys Leu Val Arg 290 295 300 Lys Thr Cys Asn Glu Leu Asp Cys Pro Leu Ile Val Asp Glu Ile Gln 305 310 315 320 Ser Gly Met Gly Arg Ser Gly Ser Phe Leu Ala Ser Thr Leu Ile Pro 325 330 335 Leu Lys Gly Asp Tyr Tyr Thr Leu Ser Lys Ser Leu Gly Gly Gly Leu 340 345 350 Ala Lys Ile Ser Ala Thr Leu Ile Arg Lys Ser Arg Val Arg Lys Glu 355 360 365 Phe Ser Leu Val His Ser Ser Thr Phe Ala Glu Asp Asp Phe Ser Ser 370 375 380 Gly Ile Ala Leu Lys Val Leu Asp Met Leu Glu Ala Asp Asp Gly Lys 385 390 395 400 Ala Tyr His Gln Val Gln Asp Ser Ala Ala Lys Leu Phe Ala Ala Phe 405 410 415 Glu Arg Val Arg Ala Ala Phe Pro Asp Val Ile Lys Glu Val Arg Gly 420 425 430 Gln Gly Leu Phe Ile Gly Val Glu Phe His Ser Gln Lys Asn Ala Ser 435 440 445 Ser Ile Ile Ile Arg Gly Ser Ala Tyr Asn Asp Ser Phe Gly Tyr Leu 450 455 460 Leu Ser Gly Tyr Leu Leu His Gln Glu Arg Ile Arg Ile Ala Pro Pro 465 470 475 480 Gly Ser Ala Pro Asn Val Leu Arg Ile Glu Pro Ser Met Phe Leu Ser 485 490 495 Asp Ala Gln Val Ala His Val Glu Ala Ala Phe Gly Arg Leu Cys Asp 500 505 510 Ile Val Arg Lys Gln Asp Ala Leu His Phe Val Phe Pro Leu Thr Ala 515 520 525 Ser Ser Arg Ala Lys Pro Arg Arg Glu Ala Gln Asp Phe Ser Gln Ala 530 535 540 Phe Pro Ala Gln Pro Ala Ala Asp Ser Arg Phe Glu Pro Thr Arg Pro 545 550 555 560 Val Arg Lys Ile Ala Phe Ile Asn His Leu Ile Asn Pro Gln Leu Leu 565 570 575 Thr Glu Val Asp Pro Ser Leu Ala Val Leu Thr Ala Glu Glu Leu Arg 580 585 590 Gln Phe Val Leu Lys Met Asp Pro Asn Lys Lys Ala Ala Pro Tyr Pro 595 600 605 Ala Val Arg Ile His Ser Pro Leu Gly Ser Ala Val Asp Phe Ile Leu 610 615 620 Tyr Pro Leu Cys Val Ser Ser Glu Gln Met Gly Gln Tyr Leu Ala Asp 625 630 635 640 Gly Lys Leu Asp Gly Ile Arg Asp Asp Ile Gln Asp Arg Ile Lys Ala 645 650 655 Ala Ser Glu Asp Gly Cys Glu Ile Ala Gly Leu Gly Met Phe Thr Ser 660 665 670 Ile Val Thr Asn Asn Cys Leu Ser Leu Arg Val Pro Asp Thr Ala Leu 675 680 685 Thr Thr Gly Asn Ala Phe Thr Val Ala Met Ala Ile Asp Ala Ile Asp 690 695 700 Asn Ala Val Ala Ala Ala Gly Leu Pro Ile Glu Glu Leu Thr Val Val 705 710 715 720 Val Val Gly Ala Ala Gly Asn Ile Ala Ser Thr Tyr Ala Ser Leu Leu 725 730 735 Ser Glu Lys Thr Thr Arg Leu Ile Leu Leu Gly Ser Glu Arg Asn Gly 740 745 750 Ser Leu Ser Arg Leu Asn Gln Thr Leu His Ser Ile Tyr Asp Asp Thr 755 760 765 Trp Gln Glu Ile Cys Thr Leu Pro Arg Glu Lys Leu Gly Arg Leu Ala 770 775 780 Gln Arg Leu Val Arg Glu Pro Leu Val Ala Glu Trp Leu Glu Glu Gly 785 790 795 800 Thr Ala Pro Gln Arg Gly Arg Gly Lys Ala Ile Ala Gln Tyr Val Ala 805 810 815 Glu Arg His Gly His Asp Pro Tyr Ile Thr Val Ser Thr Asp Arg Ser 820 825 830 Leu Ile Arg Arg Gly His Ile Val Leu Cys Ala Ala Asn Ser Ala Glu 835 840 845 Pro Phe Leu Thr Gly Glu Asp Phe Arg Glu Asn Ala Ile Val Cys Asp 850 855 860 Ile Ala Val Pro Asn Asn Val Cys Glu Gly Ile Gly Lys Asp Arg Pro 865 870 875 880 Asp Val Val Tyr Gln Gln Gly Gly Ile Val Ala Thr Pro Asn Gly Glu 885 890 895 Ser Leu His Pro Gly Ala Arg Ala Phe Leu Gly Ala Gly Gln Leu Phe 900 905 910 Ala Cys Met Ala Glu Thr Val Ile Met Gly Leu Ala Gly Ile Asn Arg 915 920 925 His Tyr Ser Tyr Gly Ala Ile Ser Lys Gln Gln Val Arg Glu Ile Ala 930 935 940 Ala Leu Gly Arg Ala His Gly Phe Ser Leu Ala Glu Tyr Lys Thr Gly 945 950 955 960 Ser Ser Leu <210> 10 <211> 250 <212> PRT <213> metagenome <400> 10 Met Thr Val Lys Leu Ser Asp Gln Val Ala Ile Val Thr Gly Ala Ser 1 5 10 15 Arg Gly Ile Gly Arg Ala Ile Ala Val Leu Phe Ala Glu Glu Gly Cys 20 25 30 Asp Val Ala Ile Asn Tyr Arg Gly Asp Glu Ala Gly Ala Leu Glu Thr 35 40 45 Ala Ala Ala Val Glu Gln Phe Gly Arg Lys Ala Met Leu Val Lys Ala 50 55 60 Asp Val Ser Ser Phe Glu Gln Cys Glu Arg Met Ala Asp Ala Val Ala 65 70 75 80 Glu Arg Phe Gly Lys Ile Asp Ile Leu Val Asn Asn Ala Gly Ile Thr 85 90 95 Arg Asp Asn Leu Leu Val Ser Met Asp Ala Glu Asp Ile Glu Ala Val 100 105 110 Ile Arg Thr Asn Leu Leu Gly Val Ile Tyr Pro Thr Lys Ala Val Ala 115 120 125 Met His Met Val Arg Lys Arg Ser Gly Arg Ile Val Asn Met Ser Ser 130 135 140 Ser Ala Ala Ser Arg Pro Gly Lys Gly Gln Cys Asn Tyr Ala Ala Ala 145 150 155 160 Lys Gly Gly Val Glu Ser Phe Thr Arg Ala Met Ala Val Glu Leu Ala 165 170 175 Ala Arg Asn Val Leu Val Asn Ala Val Ala Pro Gly Val Ile Met Thr 180 185 190 Asp Met Ser Glu Gln Ile Arg Asp Met Gly Asp Glu Glu Ile Lys Ala 195 200 205 Arg Leu Leu Leu Lys Arg Tyr Ala Gln Pro Arg Glu Val Ala Asp Leu 210 215 220 Val Leu His Leu Ala Ser Pro Ala Asn Gln Tyr Met Thr Gly Glu Val 225 230 235 240 Leu His Leu Asn Gly Gly Leu Lys Met Ala 245 250 <210> 11 <211> 258 <212> PRT <213> metagenome <400> 11 Met Thr Met Met Leu Asp Thr Lys Val Ala Leu Val Thr Gly Ala Gly 1 5 10 15 Asn Gly Ile Gly Ala Ala Ala Ala Arg Leu Leu Cys Glu Arg Lys Ile 20 25 30 His Thr Leu Ile Leu Leu Asp Leu Ser Thr Ala Ala Ile Asp Thr Leu 35 40 45 Ala Thr Glu Leu Gln Gly Ser Gly Thr Arg Val Leu Cys Cys Ser Ala 50 55 60 Asp Ile Ser Asp Arg Ala Ala Leu Arg Ala Ala Leu Lys Pro Ile Val 65 70 75 80 Ala Arg Thr Gly Lys Ile Asp Ile Leu Val Asn Ser Ala Gly Ile Ala 85 90 95 Asp Glu Asn Glu Pro Glu Gln Glu Asp Ile Trp Arg Arg Val Leu Asp 100 105 110 Val Asn Val His Gly Thr Tyr Phe Val Thr Leu Glu Ala Leu Asp Ala 115 120 125 Met Pro Asp Gly Gly Arg Ile Val Asn Val Ala Ser Ile Leu Gly Arg 130 135 140 Ala Gly Asn Val Arg Asn Thr Ala Tyr Cys Thr Ser Lys His Ala Met 145 150 155 160 Leu Gly Phe Thr Lys Ser Leu Ala Leu Asp Val Ala Ser Arg Lys Ile 165 170 175 Thr Val Asn Ala Val Leu Pro Ala Trp Val Asp Thr Pro Met Leu Arg 180 185 190 Arg Glu Met Gly Leu Gln Ala Glu Lys Ile Gly Ala Glu Leu Asp Gln 195 200 205 Met Leu Arg Asn Ala Arg Lys Lys Ile Pro Leu Arg Ser Leu Val Gln 210 215 220 Ser Gly Glu Val Ala Ala Met Ile Gly Tyr Leu Val Ser Asp Ala Ala 225 230 235 240 Ser Ser Val Thr Ala Gln Ser Phe Thr Ile Asp Gly Gly Phe Thr Cys 245 250 255 Gly Val

Claims

메타게놈으로부터 얻은 서열번호 1의 orf20 내지 orf39 까지의 항생활성 유전자 집단.
제1항에 있어서,

상기 유전자 집단 중 항생활성의 발현에 직접적으로 관련되는 것을 특징으로 하는 orf29 내지 orf36 까지의 항생활성 유전자 집단.
제1항의 유전자 집단과 70% 이상의 상동성을 가진 유전자 집단.
제1항에 있어서,

상기 유전자 집단 중 orf20 및 orf28는 항생활성 유전자의 발현을 조절하는 조절유전자인 것을 특징으로 하는 유전자 집단.
제4항의 조절유전자 orf20 및 orf28과 각각 70% 이상의 상동성을 가진 유전자.
서열번호 4 ~ 서열번호 11의 orf29 내지 orf36 까지의 항생활성 유전자가 코딩하는 단백질의 아미노산 서열.
서열번호 2 및 서열번호 3의 orf20 및 orf28 조절 유전자가 코딩하는 IclR response regulator 및 LysR family response regulator의 아미노산 서열.
제1항의 유전자 집단에 의해 형질전환되어 항생물질을 생산 가능한 대장균.