KR20090032676A - 토양 메타게놈에서 유래한 항생 활성을 암호화하는유전자군 - Google Patents
토양 메타게놈에서 유래한 항생 활성을 암호화하는유전자군 Download PDFInfo
- Publication number
- KR20090032676A KR20090032676A KR1020070098109A KR20070098109A KR20090032676A KR 20090032676 A KR20090032676 A KR 20090032676A KR 1020070098109 A KR1020070098109 A KR 1020070098109A KR 20070098109 A KR20070098109 A KR 20070098109A KR 20090032676 A KR20090032676 A KR 20090032676A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- leu
- gly
- val
- ser
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N63/00—Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicinal Chemistry (AREA)
- Agronomy & Crop Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Environmental Sciences (AREA)
- Physics & Mathematics (AREA)
- Pest Control & Pesticides (AREA)
- Dentistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Virology (AREA)
Abstract
본 발명은 토양 미생물 메타게놈에서 유래한 항진균 및 항세균 활성을 암호화하는 유전자 집단과 항생활성 유전자 발현을 조절하는 조절 유전자에 관한 것으로, 메타게놈으로부터 얻은 22 kb의 항생활성 유전자 집단 orf20 내지 orf39을 특징으로 한다. 본 발명은 항효모 활성과 Bacillus subtilis에 대한 길항력을 가지는 클론인 EAF66 의 유전자에 대한 것으로 이러한 유전자 집단을 대장균에 발현하여 새로운 항생제 활성의 개발이 가능하며, 항진균 및 항세균 활성을 나타내므로 항생물질 생산을 위해 유용하게 이용할 수 있다.
메타게놈, 항진균, 항세균.
Description
본 발명은 토양 미생물의 총 유전체인 메타게놈으로부터 항생 활성을 암호화하는 유전자 집단을 선발하고 그 항생 효과를 증명하는 데 관한 것이다.
미생물 자체나 미생물의 2차 대사 산물이나 단백질 등을 산업적으로 이용하려는 연구가 지난 100여 년간 여러 분야에서 폭넓게 시도되어 왔다. 이는 주로 배양이 가능한 미생물을 대상으로 하며 많은 미생물 2차 대사산물들이 산업에 이용되어 왔다(예를 들면, 항생제, 항암제, 항균제, 면역억제제, 효소억제제, 제초제, 살충제, 생장 호르몬 등).
그러나 배양이 가능한 미생물로부터의 산물은 이미 많이 연구가 되어있고, 새로운 항생제를 방선균 등으로부터 찾으려는 시도는 계속하고 있으나 기존의 발견된 물질을 반복해서 분리하게 되는 예가 흔하다(Handelsman 등 1998).
항생물질 탐색의 고전적인 방법은 항생물질을 생산하는 미생물을 탐색하고 이들 미생물의 발효에 의해 항생물질을 확보하는 것이다. 그러나 분자 미생물 생태학의 연구결과 자연계에 존재하는 미생물의 99% 이상이 전형적인 배지에서 배양이 되지 않는다는 사실이 증명되었다(Amann 등 1995, Hugenholtz 와 Pace 1996,Ward 등 1990). 따라서 실제로 배양되어 동정이 된 적이 없는 대다수의 미생물들의 산물을 찾으려는 노력이 필요하며 이는 분자생물학적인 재조합 유전자 조작과 유전자 발현을 통하여 가능하리라 여겨진다.
메타게놈 연구는 이를 위해 시도되고 있는 최근의 접근방법으로, 메타게놈이란 자연계에 존재하는 모든 미생물의 유전체를 통칭하는 것으로 정의된다. 우선 자연계로부터 미생물을 배양하지 않고 메타게놈을 분리하며 이들을 라이브러리로 작성하여 배양가능한 대장균에 도입하므로서 구성된다. 이는 미생물산물을 배양이 되지 않았던 미생물로부터 확보하려는 접근 방법이라고 할 수 있다. 이 방법으로 유전자의 유래가 되는 미생물에 대한 정보는 얻기가 어려우나 미생물 산물과 유전자를 동시에 확보할 수 있는 장점이 있다.
미국 위스콘신 대학 연구팀은 처음으로 대형의 메타게놈을 성공적으로 분리하여 bacterial artificial chromosome (BAC) vector에 클로닝하여 메타게놈 라이브러리를 구축하였고 이로부터 광범위 항생물질 및 그 생합성 관련 유전자들을 분리하였다(Gillespie 등 2002 Rondon 등2000). TIGR 연구팀에서도 해양 미생물의 총 미생물 메타게놈 라이브러리를 BAC에 구축하여 해양의 배양되지 않는 미생물의 유전자원 탐색을 시도하고 있다.
본 발명의 목적은 토양미생물의 메타게놈으로부터 항생물질 생산에 관련된 신규한 유전자 집단을 제공하는 것이다.
또한 활성 메타게놈에서 활성관련 부위를 결정하고 염기서열을 결정하여 기보고된 유전자 집단과 상동성을 비교함으로써 항생 활성을 암호화하는 신규한 유전자 집단을 제공하는 것을 목적으로 한다.
상기 목적을 달성하기 위하여, 본 발명에서는 메타게놈으로부터 항생 활성이 있는 신규한 유전자 집단을 선발하여 제공한다.
본 발명자들은 토양 미생물의 메타게놈을 분리하여 포스미드를 이용하여 대장균에 메타게놈 라이브러리를 작성하고 항생 활성을 가지는 클론을 탐색하였다. 탐색의 대상인 균주는 진균인 Saccharomyces cerevisiae 와 세균인 Bacillus subtilis 였으며 항생 활성을 가지는 메타게놈 클론을 확보하였다.
활성 메타게놈에서 활성관련 부위를 결정하였고 염기서열을 결정하였는 바 기보고된 유전자 집단과 상동성이 아주 낮아 항생 활성을 암호화하는 신규한 유전자로서 본 발명을 완성하였다.
메타게놈으로부터 얻은 서열번호 1의 orf20 내지 orf39 까지의 유전자 집단으로서 항생활성을 가지는 것을 특징으로 한다. 상기 유전자 집단 중 항생활성의 발현에 직접적으로 관련되는 것은 orf29 내지 orf36 까지이다. 또한 상기 유전자 집단과 70% 이상의 상동성을 가진 유전자 집단이 가능하다.
또한 본 발명에서는 서열번호 2의 orf29 내지 orf36 까지의 항생활성 유전자가 코딩하는 단백질의 아미노산 서열을 규명하였다.
ORF20은 IclR response regulator(-frame)를, ORF28는 LysR family response regulator를 코딩한다. ORF29~ORF26은 항생활성 유전자로서, ORF30은 Ketoacyl synthase, ORF31는 ACP synthase, ORF32는 ACP synthase, ORF33은 Ketoacyl synthase, chain length, ORF34는 Aminotransferase, ORF35는 ACP reductase, ORF36은 Ketoreductase를 코딩한다.
한편, 상기 유전자 집단 중 orf20 및 orf28는 항생활성 유전자의 발현을 조절하는 조절유전자인 것을 특징으로 한다. 상기 조절유전자 orf20 및 orf28과 각각 70% 이상의 상동성을 가진 유전자가 가능하다. 서열번호 3 및 4의 orf20 및 orf28 조절 유전자는 IclR response regulator 및 LysR family response regulator을 코딩한다.
본 발명에서 제공하는 유전자의 전체 염기서열은 22,099 bp 이다. 본 유전자를 형질전환한 대장균은 벡터만 가지고 있는 대장균이 가지지 못하는 항진균 활성과 항세균 활성을 가진다. 항진균 활성은 효모인 Saccharomyces cerevisiae 에 대하여 항세균 활성은 그람 양성인 Bacillus subtilis 에 대하여 활성을 나타내었다. 그러나 그람 음성 세균인 Agrobacterium tumefaciens 에 대하여는 활성을 보이지 않았다.
이와 같은 유전자와 전체적으로 상동성을 보이는 유전자 집단은 아직 보고되 지 않았으며 아노테이션된 아미노산의 서열은 기존의 단백질들과 29-53% 정도의 상동성을 보여 신규한 유전자 집단으로 판단된다.
본 발명의 유전자 집단은 대장균에 형질전환하여 항생물질 생산에 이용할 수 있다. 본 유전자를 형질전환한 대장균은 벡터만 가지고 있는 대장균이 가지지 못하는 항진균 활성과 항세균 활성을 가진다. 항진균 활성은 효모인 Saccharomyces cerevisiae 에 대하여 항세균 활성은 그람 양성인 Bacillus subtilis에 대하여 활성을 나타내었다. 그러나 그람 음성 세균인 Agrobacterium tumefaciens 에 대하여는 활성을 보이지 않았다.
본 발명의 유전자 집단은 항진균 및 항세균 활성을 나타내므로 항생물질 생산을 위해 유용하게 이용할 수 있다.
이하, 본 발명을 실시예에 의하여 보다 상세하게 설명하고자 한다.
실시예 1: 토양 메타게놈 DNA 의 분리
본 연구에 사용한 토양 시료는 대전시 유성구 일대의 산림토양으로부터 채취하여 메타게놈 라이브러리 작성에 사용하였다. 채취한 토양은 각 구멍이 1.40 mm직경인 체에 쳐서 1.5 mm 이상의 입자와 식물 잔재물 등을 제거하고 메타게놈 추출을 위하여 5g씩 사용하였다.
SDS와 proteinase K를 처리하여 DNA를 추출하였는데 좀더 자세히 기술하면 아래와 같다.
산림토양 5g을 먼저 완충용액 15 ml 에 넣어 섞어주었다.
상기 완충용액의 조성은, 100 mM 의 Tris-HCl(pH 8.0), 100 mM 의 EDTA (pH 8.0), 100 mM의 sodium-phosphate (pH 8.0), 1.5 M 의 NaCl, 1%의 CTAB의 구성으로 이루어진다.
완충용액에 현탁이 된 산림토양에 100mg/ml 농도의 proteinase K를 100 μl 첨가하고 37℃ 진탕배양기에서 150 rpm의 속도로 30분간 진탕하였다. 이후에 20%의 SDS를 1.5 ml 첨가하고 잘 흔들어 섞어주었다. 이를 65℃ 항온수조에서 30분마다 한번씩 섞어주면서 2시간 동안 유지하였다.
이후에 7,000 rpm에서 10분간 원심분리하여 상등액을 분리하고 같은 부피의 클로로포름/아이소 아밀 알코올 (24:1)을 첨가하여 섞어준 후 8,000 rpm에서 5분간 원심분리하여 DNA가 포함된 상등액을 새 튜브로 옮긴다.
상등액의 부피의 0.6배에 해당하는 아이소프로파놀을 첨가하고 섞고 11,000 rpm에서 5분간 원심분리하여 DNA 침전물을 얻었고 이를 70% 에탄올을 첨가하여 재원심분리하고 침전물을 말려서 0.5 ml의 TE 완충액(10 mM Tris-HCl, 1 mM EDTA, pH 8.0) 에 녹여서 4℃에 보관하면서 라이브러리 작성에 이용하였다.
분리된 DNA의 양과 크기 결정은 pulsed field gel electrophoresis (PFGE) 로 확인하였다. PFGE를 수행하는 조건은 6 V/cm에서, 120° fixed angle로 1-6초 switch time 조건에서 6시간 수행하였다.
각종 토양으로부터 메타게놈을 분리하여 토양 1g 당 약 1~1.5 μg 의 DNA를 회수하였고 분리된 DNA 크기는 20~100 kb 정도로 대형으로 분리가 가능하였다.
실시예 2: 메타게놈 라이브러리의 작성
DNA의 전기영동, plasmid 분리, DNA의 절단 등은 기준이 되는 분자생물학적 방법(Sambrook 등 1989)으로 수행하였다. 시약 및 제한효소의 사용 등은 제조회사에서 추천한 방법에 따라 수행하였다.
추출해낸 메타게놈을 low melting point agarose gel에서 전기영동을 한 후 20-kb 이상의 DNA를 포함하는 agarose block만을 회수하고, 이를 GeLase 를 처리하여 DNA를 순화하였다. 이 과정을 통하여 humic acid 등을 제거할 수 있었다.
순화된 DNA 조각의 양끝 말단을 DNA end-repair 효소를 이용하여 수리하고, 20kb 이상의 메타게놈을 제한효소 Eco72I로 처리한 포스미드 벡터 pEpiFOS-5(Epicentre, USA) 에 라이게이션한 후 packagene extract (Epicentre. USA)를 이용하여 E. coli 에 도입하여 형질 전환체들을 선발하였다. 형질 전환체 들로부터 재조합 효율을 검정하기 위하여 전통적인 SDS-alkali lysis 방법으로 plasmid를 분리한 후 제한효소로 절단하여 전기영동 하였다.
검정한 80개의 형질전환체들은 모두 재조합 플라스미드로 확인되어 라이브러리가 잘 작성됨을 알 수 있었다.
채취한 산림표토 토양으로부터 라이브러리를 작성하였는데 토양 metagenomic DNA 1 μg당 25,000 ~ 60,000 클론의 확보가 가능하였다. 작성한 라이브러리는 1,000~1,500 클론씩 pool로 -80℃에 보관하였다. 유성구의 산림표토로부터 작성한 라이브러리는 총 112,000 클론이었다. 삽입된 메타게놈 DNA 의 평균 크기는 무작위로 메타게놈 라이브러리 클론 플라스미드를 추출하여 BamHI으로 절단한 후 전기영동하여 확인한 결과 35 kb 이상으로 나타났다.
실시예 3: 메타게놈 라이브러리의 항생활성 검정 및 선발
작성된 산림표토 메타게놈 라이브러리로부터 항진균, 항세균 활성 검정을 위해 효모(Saccharomyces cerevisiae)와 Agrobacterium tumefaciens, 그리고 Bacillus subtilis를 이용하였다. 먼저 작성된 라이브러리의 LB replica plate를 준비하여 각 클론들을 37℃에서 이틀간 선배양하였다. 그 위에 효모나 A. tumefaciens, 또는 B. subtilis가 포함된 탑아가(topagar)를 중층하여 30℃에서 2일간 후배양하고 효모나 세균들에 대한 생육 저해 클론 존재여부를 조사하여 항진균, 항세균 활성을 검정하였다.
선발된 활성 클론은 플라스미드를 재분리하고 대장균 EPI-100 에 형질전환하여 대상 검정 생물로 길항작용을 재검정하고 -80℃에 보관하였다.
본 발명에서 작성한 산림표토 메타게놈 라이브러리로부터 항진균 활성 클론 1종을 분리하여 재검정 결과, 항진균 활성 클론은 B. subtilis 에 대한 항세균 활성을 나타내었으나 A. tumefaciens에 대한 항생활성은 보이지 않았다.
선발된 클론들 중 항진균 활성이 우수한 클론의 유전자를 in vitro에서 트랜스포존 삽입변이 방법(insertional mutagenesis)과 염기서열 분석을 통해 항진균 관련 유전자를 분석하였다. 본 발명은 항효모 활성과 B. subtilis에 대한 길항력을 가지는 클론인 EAF66 의 유전자에 대한 것이다.
실시예 4: 항생활성 유전자 부위 결정
항진균 활성을 보이는 클론인 EAF66 에 대하여 in vitro에서 트랜스포존 삽입변이 방법(insertional mutagenesis)과 염기서열 분석을 통해 항진균 관련 유전자를 분석하였다. 트랜스포존 삽입 변이는 transposase와 GPS3 트랜스포존을 함유한 플라스미드를 제공하는 제조회사의 추천방법에 따라 수행하였다.
서로 다른 부위에 트랜스포존을 삽입한 각 변이체들을 약 200개체 선발하여 항효모 활성 및 B. subtilis에 대한 항세균 활성을 재검정하여 활성을 상실한 변이체를 19개체 선발하였다. 활성을 상실한 변이체들의 트랜스포존 삽입부위의 DNA 염기서열을 결정하기 위하여 삽입 주변부위 DNA를 PstI으로 절단하였다. 절단된 DNA들을 PstI으로 절단하고 Shrimp alkaline phosphatase 처리한 pUC119 에 라이게이션하여 클로닝하고 가나마이신이 첨가된 배지에서 선발된 형질전환체로부터 플라스미드를 분리하고 염기서열을 결정하여 삽입부위를 결정하였다. 활성을 상실한 변이체들의 트랜스포존 삽입 부위는 도 1A에 " " 로 나타나 있다.
실시예 5: 항생활성 유전자 집단 염기서열 결정
항생 활성 클론 EAF66 의 플라스미드를 분리하고 총 염기서열을 분석한 결과 삽입 DNA의 크기는 40 kb 이상이었으며 이들 중 22 kb 부위가 활성에 필요하며 최소한 8개 이상의 유전자가 생리활성 표현형에 관련되어 있는 것으로 나타났다.
이들 활성에 직접적으로 관여된 유전자는 회색의 화살표로 도 1A에 표현되었으며 이들은 orf29에서 orf36까지이다. 이들은 각 orf의 종결코돈과 연속되는 orf의 개시코돈이 서로 겹쳐 연결되어 한개의 프로모터에 의해 유전자의 발현이 조절될 한 개의 전사단위(transcriptional unit)로 추론된다. 상기 항생활성 유전자 집단의 각 유전자에 있어서, ORF29는 서열번호 4의 단백질의 아미노산 서열을 나타내며, ORF30은 서열번호 5로서 Ketoacyl synthase, ORF31은 서열번호 6의 ACP synthase, ORF 32는 서열번호 7의 ACP synthase, ORF 33은 서열번호 8의 Ketoacyl synthase, ORF34는 서열번호 9의 Aminotransferase, ORF35는 서열번호 10의 ACP reductase, ORF36는 서열번호 11의 Ketoreductase의 단백질을 각각 암호화하는 것을 특징으로 한다.
유전자 집단 내에 유전자의 기원을 판단할 만한 계통분류적 표지유전자는 포함되어 있지 않았다. 항균 활성 클론의 구성은 도 1A에 나타나 있으며 트랜스포존 삽입부위와 함께 표시하였다. DNA의 염기서열은 BLASTX 검색을 통해, 항균활성 관련 유전자들은 GenBank의 유전자들과 비교하여 그 유사도가 가장 높은 유전자들을 도 2에 표로서 표현하였다. orf29에서 orf36의 유전자들은 추론한 아미노산 수준에서 가장 높은 유사성(identity)이 29~53% 수준으로 신규 유전자 집단으로 판단되었다.
실시예 6: 항생활성 유전자 발현 조절 유전자 결정
도 1에 나타난 것처럼 두 개의 조절 유전자를 각각 XhoI 과 SphI으로 절단하 여 pUC129와 pUC119에 각각 서브 클로닝하였다. orf20을 포함하는 1.25 kb의 XhoI 으로 절단한 EAF66 DNA 조각은 pUC129에 서브클로닝하여 pEJ102로 명명하였다. 그리고 orf28을 포함하는 2.58 kb의 SphI 으로 절단한 EAF66 DNA 조각은 pUC119에 서브클로닝하여 pEJ101로 명명하였다 (도 1).
pEJ101 과 pEJ102는 각각 lac 프로모터에 의해 강하게 발현되는 LysR 계의 조절단백질과 IclR 계의 조절단백질을 암호화하는 유전자를 포함하였다. 각 플라스미드를 EAF66 이나 pEPI-FOS5를 포함하는 대장균에 형질전환하였다. 그리고 실시예 3에서 실시한 방법에 따라 효모에 대한 항진균활성을 검정하였다.
도 3에서 나타난 것처럼 EAF66과 pUC129를 가진 대장균(도 3A), EAF66과 pUC119를 가진 대장균 (도 3C)에 비해 EAF66과 함께 pEJ101이나 pEJ102 (도 3B, 도 3D) 를 가진 대장균의 항진균 활성이 증가한 것을 효모 생육저지대가 증가한 것을 보고 판단할 수 있다. 대조군인 pEPI-FOS5와 pEJ102를 가진 대장균은(도 3E) EAF66 를 함유하고 있지 않아 항진균 활성이 전혀 나타나지 않았다.
따라서 high copy number plasmid에 서브클론되어 도입된 orf20과 orf28의 유전자 산물인 두 개의 조절단백질 IclR 과 LysR은 EAF66에서 발현되는 항생활성을 양성적으로 조절함을 나타내었다.
이상에서는 본 발명의 바람직한 실시예에 대해 설명하였으나 당해 기술분야에서 통상의 지식을 가진 자라면 본원 발명의 요지를 벗어남이 없이 다양한 변형실시가 가능할 것이며, 이러한 변형실시는 본원발명의 보호범위에 속하는 것으로서 본원발명의 보호범위는 특허청구범위에 기재된 바에 따라 해석되어야 할 것이다.
도 1은 메타게놈에서 분리한 항진균 및 항세균 활성 유전자 집단의 유전자 지도와 조절 유전자, 그리고 트랜스포존 삽입 변이로 항생활성을 상실한 유전자를 나타낸 도면이다.
도 2는 항생활성을 보이는 유전자 집단의 각 유전자들을 GenBank의 유전자들과 상동성을 비교하여 유사한 유전자와 아미노산 수준에서 동일성 그리고 유사 유전자를 가진 미생물을 나타낸 표이다.
도 3은 두 개의 조절 유전자를 과다발현하도록 형질전환한 대장균이 항생활성 유전자의 활성을 증가시켜 항생활성이 증가한 것을 나타낸 사진이다.
<110> Dong-A University Research Foundation For Industry-Academy Cooperation
<120> A GENE CLUSTER ENCODING ANTIBIOTIC ACTIVITY FROM SOIL METAGENOME
<160> 11
<170> KopatentIn 1.71
<210> 1
<211> 22099
<212> DNA
<213> metagenome
<400> 1
ttagaaactc ccggtataac ccagggtggc tgaaatctgg gcggcggtgc cgaccaggtc 60
ttccagccac tcttcctgca ggcggtcggc gggcgccgag atcgacaggc ccgcgaccag 120
tttgccggaa tcgtcatgga tgccggccgc catgcagcgc acccccagct ccagttcctc 180
gttgtcgcgc gcatagccgc gcgtacgcac catcgacagc tcacgttcga gcttgcccag 240
gtccgtgatc gaattcttgt tgtggcccgc caggccggtg cgcgtggcgt aggcgcggat 300
cgccttcggc tcgtccaccg acaggaacag cttgccggtc gacgtcaggt gcagcggacc 360
gcgcccgccg atcgcgcgca ccacctgcat gccggagcgc tcggaaaaag cgcggtcgat 420
gtagacgatc tcgtcgccct ggcgcaccga caggttgatg gtctgctggg tcttcttgtg 480
cagcgcgcgc atgaagtcca gcgccgcctc gcgtaccgac agccggctct tgaccacatt 540
gcccagttcc agcaggcgca tgccgaggcg gtaggtgccc ggctcgacgc ggtcgacaaa 600
gcgcgtgatc accatgtcgt tgaggatgcg gtgcgcggtg gaaggatgca ggcccgatac 660
cttggacagt tccttcaggc tcaccggatc ggtgtagttg gccagcgcgt ccagcagggc 720
caccatgcgt tcgatgacct ggatcgaggt tttgggggcg tcaacggttt cgattttcat 780
aatgtggttg gtgcggtgca gtatatgtcc ctactttata ccataatgtg aaaagaggtg 840
gcaatttctg cgcacggcaa cacttttgtg gaagtcgcgc tgcgcgcggg gcataatgcg 900
gcatcaatgc aactttggaa acaggccatg acgcaaccag tcagcgaatt caagagtaaa 960
agcgggctcg gccgtatcct gccggccatg ggttacgcgc tggccggcct gaaagcagcc 1020
gcgaaaaacg agcacgcctt ccgccaggaa ctggtcgtgg tcgcgatcgg caccgtgttc 1080
gcgctggtgc tgccgatttc cgcctaccag aagctgctgc tgatcggcat gctggtgttt 1140
gtgctgattg tcgagctgtt caattccgcg atcgaagcga tcgtcgaccg cgtctcgctc 1200
gagcgccatc cgctgtccaa gaacgccaag gacatgggca gcgccgccgt catgctcgcc 1260
atcttcctcg ccgtcgccgt ctgggtggtg gtgctgttca cccgcttcta ctaaaacccg 1320
cataagcaag cgcgaaagca ttccttcgct ttcgccgccc cctcccgtaa tctttcagaa 1380
ttggggtcag acctacattc tgaaactatt tcagaatgta ggtctgaccc caattctgaa 1440
acattcagga ggcggcgatg gcggcacaac ttgcggcaca acttttcccc gattttcatg 1500
tcgtgatcgt tccgggcctg catgacagcg gcccggcgca ctggcagtcg cgctggcacc 1560
gcttgcatcc ggagtgctcg cgcgtgcgcc aggacgactt cgacgatccg cgcctggcgc 1620
agtgggccgc gcgcctggac caggtgcgcg ccgccgaccc gcgcccggcc ttgctggtcg 1680
cccacagttt tggcgcgctg accgcggtcc acagcatcgc ccgcaatgac gacaatattg 1740
ccggcgcgct gctggtggcc ccggccgatc ccgacaagtt cggtgtggcg gacctgctgc 1800
cggcctggcg cctgccgtgt ccgacacttg tggtggccag cgccaacgat ccctggatgc 1860
gcctcgagcg cgcggcgcag tgggccgcgc gctggggcag cgagctggtc gacgcgggcc 1920
ggctgggcca tatcaacgcc gactcgcgcc tgggcgactg gcctgccgga aagaccctgt 1980
tgcggacgct ggcacatcgg gcgcacaata ggcgactggc cttttcggca tgattgaatt 2040
ttttacctca ccaattacgg agattgcaat gactttacga ctgggtgata ccgctcccga 2100
tttcgagcag gattcttcgc agggaccgat caagtttcat gagtgggcag gcgattcctg 2160
ggtggtgctg ttttcgcacc cggccgactt cacgccggtg tgcactaccg aactgggctt 2220
gaccgccaag ctgaaaccgg aattcgacaa gcgcaacgtc aaggcgatcg cgctgtcggt 2280
cgacccggcc gagcagcacc gccagtggat caaggacatc gaggaaaccc agcagaccgt 2340
ggtcggcttc cccatcatcg ccgacgccga caagaaagtc gcagcgctgt acgacatgat 2400
ccatcccgag cagtcggcca ccgccaccgt gcgctcgctg ttcgtgatcg acccgaacaa 2460
gaagatccgc ctgtcgatca cttatccgat gagcaccggc cgcaatttcg atgaagtgct 2520
gcgcgtaatc gacgccctgc agctgaccga caagcacacg gtggccacgc ccggcaactg 2580
gaaagacggc gacgacgtca tcattccgct gaccgtgcag gatccggaag tgctcaagca 2640
aaaatatccg aaaggcttca ccgccgcgcg tccctacctg cgcgtgaccc cgcagccgaa 2700
caaataaggg ggcagggcgg ccgccctgcg cggccgttca ctgtacgcat aagcaaataa 2760
gcagactgtc gtttgatata cggctgagca cctttaccct tgcgccatca tcaaggggat 2820
cccatgctca tcacgtatat cgtttccggt tttgccgtcg gcctgctggt cggcatgacc 2880
ggcgtgggcg gcggttccct gatgacgccc ctgctgaccc tgattttcgg ggtcccgccc 2940
tcggttgccg tcggcaccga cctcgctttc gcctccatca ccaaatcggc cggcgcgttt 3000
actcaccgcc tgcgcggcac ggtgcgctgg gacatcgtca agctgctgtg catcggcgcc 3060
ttgccggccg ccgtcgccac cgccctggcc ctcaagcagt acggcgccct tgacgcgagc 3120
atcggccagt tcatccgcta ttcgatcgcc ggttcggtgc tcctcaccgt cgtcgcgctc 3180
attttcaagg gcaagatgct ggcctggctg aacgcgcatc cggagcgcca gctgcagggc 3240
cgggcccttg atgccgccac cgtgttcgcc ggcctgggac tgggcgtgct ggtcaccatt 3300
tcctcgatcg gcgccggcgc catcggcgcc accctgctgg tcatgctgta tccgcgcctg 3360
tcggcggccg aagtggccgg caccgacatc gcctacgccg tgccgctgac cgccatcgcc 3420
gccttcggcc actggtggct gggctcgatc aactggacct tgctggccat gctgctggtc 3480
ggctcgctgc cgggcatcac cctcggttcc tggatcgcca agtcggtgcc ggaaaagttc 3540
ctgcgggtgc tgctggccat gaccctgacc ggcgtcgcgg ccaagctgat ctactaggcg 3600
ttttcctaat atcgttattc gtctatgtaa atgagaaaca gttcgtttcc tttatgacag 3660
tgtagtgcga ttattgagac ttcttagatc aaaatgtaat aagagggttt catgtcaatt 3720
cccccaccca aacgcgcgcc ttaccgggtc atgcccggtt tcggcctgtc gctcgggttc 3780
accatctttt acctggcgct gattgtcctg atcccgctgt cagcggtgtt cctcaagacc 3840
ttcaccatga cctgggacgc cttcgtcacg gccgtcacgt ccgaacgcgt gatggcgtcc 3900
taccgcctga ccttcggcgc ctcgctgatc gcggccatga tcaatgtgtt cttcggcggg 3960
atcgtggcct gggtgctggt gcgctaccag tttcccggca agcgcatcat cgatgccctg 4020
gtcgacctgc cattcgcact gccgaccgcg gtggccggca tcacgctgac cgccctgtat 4080
tcgaccaatg gctggatcgg gcgctacctc gacagcttcg gctggaaagt cgccttcacg 4140
ccggtcggcg tggtggtggc gctgaccttc atcggcctgc ctttcgtggt gcgcacggtg 4200
cagccggtgc tggaagacgc cgagcgcgaa ctggaagaag cggccgccag cctgggcgcc 4260
aattcgctgc agaccttcac ccgcatcatt ttcccgacca tcatgcccgc catgctgacc 4320
ggcttcgcgc tcgcttttgc acgcgccacc ggcgaatacg gctcggtcat tttcatcgcg 4380
ggtaacatgc cgatgatctc cgagatcacg ccgctgttca tcatcaccaa gctggaacag 4440
tacgactaca ccggcgccac cgcgatcgcg gtggtgatgc tgctggtgtc cttcgtgctg 4500
ctgctgacga ttaacctgct gcaggcgtgg acgcgcaaac gggcgggccg caaatgagcg 4560
ccatgaacaa acaagcttcc aatgtactgg agccggcctg ggtcaagctg ctgctgctgg 4620
tgatcgcctt cagcttcctg acgctgttcc tgttcgtgcc gctggtggcg gtattcgtcg 4680
aagcgttcaa gaagggcgcc ggcgcctact tcgccgccat caccgatccg gacgccgtct 4740
ccgccatcaa gctgaccctg atcgcggcgg tcatttcggt gccgctcaac ctggtgttcg 4800
gcctggccgc gtcgtgggcc atcgccaagc atgaatttcg cggcaagagc atcctgctca 4860
cgctgatcga cctgccgttt tcggtttcgc ccgtgatctc gggcctgatc tacgtgctgc 4920
tgttcggcgc ccagggctgg ttcggcccgt ggctgcagga gcacgacatc aagatcctgt 4980
tcgcggtgcc gggcattgtg ctggccacga tcttcatcac cttcccgttt gtggcgcgcg 5040
agctgatccc gctgatgcaa tcgcagggca acgaggaaga ggaggccgcg ctggtgctgg 5100
gggcctccgg ctggaagacc ttccgccacg tgacgctgcc gaacatcaaa tggggcctgc 5160
tgtacggcgt gatcctgtgt aatgcgcgcg ccatgggcga attcggtgcg gtgtcggtgg 5220
tgtcgggcca tatccgcggc gagaccaaca ccatgccact gcaggtggag atcctctaca 5280
acgagtacaa cttcgccgcg gcgttcgcgg tcgcctcgct gctcgcgctg ctggcgctgg 5340
tgaccctggc aatcaaatcc tttatcgaat ggcgtttgca ccagaccgac ccggtcgaag 5400
ctgaagcacg caaactggag cactgatcat gacgatcgaa gtcaagaaca tcaacaagcg 5460
tttcggcgaa ttcaccgcgc tcgataacgt gtccctgcaa tttccggcgg gcgaactgac 5520
cgcgctgctg gggccttcgg gctgcggcaa gaccacgctg ctgcgcatca tcgcgggcct 5580
ggagcatccc gattcgggcc aggtgctgct ggacgccgaa gacgcctcca gccgccacgt 5640
gcgcgagcgc caggtcggct tcgtgttcca gcactatgcg ctgtttcgcc acatgacggt 5700
gttcgagaac gtcgccttcg gcctgcgcgt gcgcccgcgc gccacgcggc cgtcggagac 5760
cgagatccgg gcccgcgtca aggaactgct ggagctggtg cagctcgact ggctggccga 5820
ccgcttcccg ccgcaactgt cgggcggaca gcgccagcgc atcgccctgg cgcgcgcgct 5880
ggcggtggag ccgcgcgtgc tgctgctcga cgagccgttc ggcgcgctcg acgccaaggt 5940
gcgcaaggaa ctgcggcgct ggctgcgccg cctgcacgac gacctgcatg tcaccagcat 6000
cttcgtcacc cacgaccagg aagaggcgct cgaagtggcc gaccaggtgg tcctgatgaa 6060
caaggggaag gtcgagcagc tcggcgcgcc gggcgacgtc tacaaccatc cggcttcgcc 6120
gtttgtgtac agctttctcg gcaacgtcaa cctgttccac ggccgcgtgc acgaaggcgt 6180
gctggccagc ggcgacgcca gcttcacggg tgcccgacca tgccgaggtg cagacgcgaa 6240
aggcatcgcc tatgtgcgtc cgcacgacct cgatgtggac cgctacacgc cgggcggcga 6300
gggcattgtg gtcaagctca aacgcgcgca cgccatcggt ccgctggccc agctggacct 6360
gcagcgcgcc gacaacgcgg agctgatcga agcggtcatt cccaacgagc gttttggcca 6420
gctgcagatc aaggaaggcg acaccctgct ggtgcgcccg cgccgcatgc acgtgtttgt 6480
cgaccaggga gcctcgatat gaacttccaa caattgcgct cgattcgcga aaccgcacgc 6540
cgcggctaca acctgaccga agtggccaat gcgctgttca cctcgcagcc cggcgtgagc 6600
cgccagatcc gtgagctgga agatgaactg ggcgtggtga ttttcgaacg caacggcaag 6660
cgcctgaccg gcatgaccga gccgggcaag ggcatcctca agatcatcga ccgcctgctg 6720
gtggaagccg aaaacctgca gcaggccagc atggactatg cgggccagaa cagcggcacc 6780
ctgaccatcg ccgctaccca cacccaggcg cgctatgcgc tgccgaaagt ggtgcagtcg 6840
ttccgccacg attttcccga cgtgcgcatc gcgctccagc aaagcgcgcc tgaccatatc 6900
gccgaatggg ttttatcggg caaggccgat atcggcatcg ccacggaggg cctgtcgcag 6960
ttcccggacc tggtgtcctt cccgtgctac cgctggagcc acctgatcgt ggtgccggac 7020
gggcacccgc tgctggcaca ttcgccgatc cggctggaag acctggcggc tttcccgctc 7080
attacctacg acgtgggctt cacgggccgc gggcatatcg acgccgcctt cgcgcaggcc 7140
ggcgtcaaga ccgacatcgt gctgaccgcg atggattcgg acgtgatcaa gcagtatgtg 7200
agcctggggc tgggcgtggg catcgtggcc tcgatggcct tcgaccatgg gcgcgacaag 7260
ggcctgcgcg cggtggaggc gtcgcacctg ttcgcgccca acgtgacccg gctggcggtg 7320
cggcgcggcg cctacctgcg cgcctacgcg tatcacttca tttcgcagtt tgcgccagaa 7380
ctgaagcgcg cggacatcga agcggcgatc ggggcggaag gctgacccgg ggcgggcgaa 7440
gcattagagg attttttcta aaccttcccg cctgggcctg cctcgaccgt tttagcggac 7500
ccggcaggcg tttaagtatt ttttgtgcaa taaatgctgc atcgcgtcat acgtttgtca 7560
cattcatccc gtttcgggat cgaccatctc cacgcttgat ttctgtttcc ccaacgcatt 7620
aattggtctt ccagacccgc ttgtcccgcc cgccggacct gcgctttcgc cgagtgaaaa 7680
agcttatgtt cgctatggga cataggctct ttcggcttgc ttctactatt tccctgttga 7740
aacagaatcc ccgcttacac ggcaatctgg tcttgtttat ctgccaactt tccgatgaca 7800
ttttcgtgac aatgatatgt acaccacgaa atcaattctg cgtaaacccc ttgtttctta 7860
aaaggttctt aacgtattcg ccaagcgaca aagttaaatt taagatttta ataacattga 7920
gtaagaagta aatttgcgat atagttatgt tgttgtttag caattaatcg ccgccggttt 7980
acagtcgccg tctccccctt cgccgcagtt tcgccgatcc cggcccacct gatcccggcg 8040
ggttttctgg acgtgagggg gctacgcact atgcggtaca ggacgtcttc aagagccccg 8100
gctgtgcggg aactgtcctg gcgcgggccg cggacagcag taatcgagcg ctaattgctg 8160
cggcgcacaa gagcgctcta ggcagcagca cgcaacacat ataacagcca caaaactaag 8220
gaaactgaca tgaacaatcc ctacaccgca gctgaaatgc aaaccatcgt gaacggcgta 8280
cttgccggcg tgcttggcgt cgacccgtcc gagatcgccg ccgacagcgc catcgtcgac 8340
gacttcggcg cggattcgct cgacttcgtc gagttcaaca ccacgctgga aaagaaactc 8400
aacatgtcga tgccgaaaaa aggtcccttg tcgcaggccg gcaaagccac cggcacgccc 8460
gagctgttct acagcggccg caccggcctg accgagcaag gcgtggacct gctgcgcaat 8520
agcctgtcgc agtacaccca gctgagcacc ggcatgaccg tgcacgatgt attcaacctg 8580
acctcggtcg gcaacatcgc ttcgctgtgc ctgaacctgt tcaaccacct gccggacacc 8640
tgcccggatt gcggccacgc tgaagcgaaa ctgtcggcgg ccggcaaagt ggtgtgcgcc 8700
tcgtgcagcg cgacggtgcg tccgctgcag ggcgacgagg ccgacgagcg ccacatccgc 8760
cagtacctcg ataccgcgct cgcccaggca gcctgaaatc atgaaaacgc aagtcgtcgt 8820
caccggcatc ggtgtcatct gcagccaggc ctcgtcggcc ggcgaactgt tcggacgcct 8880
gaaagatggc ttgtcgtccg tgcgtaacaa cgccaggatg gccgccagcg gcgtgtccaa 8940
tcccgcctgc gcgtacatcg acgagcatgt gtgggaccag ctcgaggccg agcaggccgg 9000
ccgcttcccg gaccatctcg gtccgcaagc gcgcctggcg ctgcatgcgg ccggccaggc 9060
cgtgcgccat gccggcatcg acctcggcgc cgtcgagcgc aagggactgt tcgtcgcgtc 9120
caacaagtac acgctcacca gcgagcacct gctgggcatc gggcgccatt acgacgccga 9180
cagcgccacg gtcaacctgg acagctacgt gcaggacgag cgccacgacg ccggcgccta 9240
cttccacaag cgccaggaca tggcggcgct gaccctggcg cagctgtacg gtttcgacga 9300
cgccgtcatg acgccgggcg acgcctgcgc cgccggcggc gtctcggtcg gcaccggctt 9360
tcgccatatc gcccacggcg agctcgatgt cgccctggtc ggcgccaccg aggcgatgag 9420
caactacgtg ccgctgatgg gcttttcgat cctgggcgcg tcggcgccgg atttcaacga 9480
cgacccagcc gctatcagcc gccccttcga caaggaccgc agcggtttcg tcatgggcga 9540
gggcagcgcc ttcctggtgc tcgagtcgct cgagcatgcg cagcggcgcg gggcgccgat 9600
cctggcgcgc gtgagcggct tcgccaagca ggtcgaggct taccgcatca ccgccagccc 9660
ggccgacggt tcccagtacg cgcgctgcat gcgcgccgcc ctcgacgacg ccggcctcga 9720
tgccgcctcc atcgaccatg tcaacgccca cggcacctcg acccagtcca acgacagctg 9780
cgaaagcgcg gccatcaagc aggtgttcgg agcgcgcgcg ccgcaggttc cggtcacggc 9840
caacaagtcg gccctgggcc actcgctggc tgccagcggc gccatcgaag cggtgctgtc 9900
ggtaatgtcg ctgcaggagc aggtgctgct gccgaccctg aacttcagcg agggcgacgc 9960
caataccgag ggcctggaca tcgtgcgcgc aacacgtccc gcgccggtcg cgcacatcat 10020
gtccaattct ttcggcttcg gcggacagaa ctgcgtcctg atcctgagca cgcactgacc 10080
cgggagcgat catgaaaacc aaggtctaca tcgacggcgg ctccgccctg tgcgccgccg 10140
gcgccggcat cgcgccgctg tggtccgcca tggcggcggg cgcgcgcaat ctgtccgcct 10200
tgccttgtcc cgctttcgac agctggccgt ggcccgaagt gttcctggtc gacgagcccg 10260
gcgcggccga gctcaaggtc gaccgcaagc tgctgcgcac catggaaaag caagccaagc 10320
tgaccctgct gggcgccgct gccgcgctgg cggcatgccc gccggccgtc gacgccgacc 10380
ccagccggat cggcctgtat ctcggcctgc cgacggtgga cgaggcggtg ccgccctggc 10440
cgctgctcga agccatgcac gaagcgggca gcacgcattt cgacagcgag atgctgcacc 10500
gcgaagtgcc cgccttcttc ggcctgtcga ccctgaacag caacgcctgc gcccatatcg 10560
cgggcacctt cggcatggcc ggctcgatgg gcgcctgttc gcctttcgcc gacgccggcc 10620
tggcggcctt gatcgaaggc gccctgtcgg tctgcaatgg cgagaacagc gaagccctgg 10680
tgggtggttg cagcgccaag atcaatccgc tgctgatgct gcagtacgag cacctgggct 10740
ggctggccga agcgggacgc attcccggtg aaggcgtggc cttcctcacc gtcggcgcgg 10800
ccagccggag cgagacggcg gtgcgcctgg ccggctatgc gcgcggcttc atcgcctccg 10860
aggtccaggc cgcggcggtc atcgcaccgg tggtcgagac cgcgctggcg atggccggca 10920
tcaccgcgca cgagctggac tgggtgctgc ccggggcctg cagcgacgcc gagatggcgc 10980
tgcttgcgcg cttggcggag ggcacgccgc tggtgcgcgc ctgcagcgcc gaggtgtgcg 11040
gcgcgctggg accggcggcg ccggtgctcg gcgtactgct ggcggcgcat gcgatccgca 11100
gcggcgcgcg cctgcgctac acggcgcccg gccagcccca gcgcgaagaa gcggcgcggg 11160
tgcgccatgt gctggtcacc gcgcgcggcc cggaagggca atacgccgcc gtagttgtat 11220
cgaaggagaa gtgcgatgag taaccgtgtc gtcatcaccg gcttgggcgt ggtcagcgcg 11280
ctgggctacg actgggagac cttctggaac gccctgttgg ccggcaagtc ggggatccgg 11340
ccctggcagc cggacgaagt cgaaggcttc ccggtgcagt atgcggcgcc ggtggacctg 11400
gccgatttcg agcgcacctt cgcgcgcgcc gcggaactgg cgcagccgat ggaaaggcgc 11460
agccgcttcg gcctgatggc cgcgcgcggc gcgctggccg acgccggcct ggcaggcaag 11520
gtccgtcaca acaccggcgt ggcggtcggc tccggcgtgc cggaacgctg cagcgccgac 11580
atgctgctgg cgctcggtcc cgccggcccg cgctgggaaa acctgtatgc gcgccgagcc 11640
gagctcaatg catccatgcg gccggggaac gaccacctgg cggcgctggt cgccaggagt 11700
tatggctgcg acggcccggt gctcaatttc agcaccgcct gcgccggcgc cgcgcatgca 11760
atcggcagca gtttccgcat gatccgcgac ggcgaaaccg actgcatgct ggccggcggc 11820
gccgattcgg tgctgaacct gatgaccatg ctgggcctga acctgatcgg cgcgccctcg 11880
acctcggaag accacggcga caagctgtgc cgcccgttcg acagcgcgcg cagcggcttc 11940
gtggcggccg agggcggcgc catgctggtg ctcgagagcg aacgccgcgc gcgcagccgg 12000
ggcgcccgca tttacgccga aatctgcggt ttcggcagtt cgctcgacgc ctaccgggtc 12060
acggcgccgc atccggaagg gcgcggcgcg gcgctcgcca tgcgcaaggc gctggccgac 12120
gccggcctgc agccgggtgc gatcggctac atcaatgccc acggcacctc gaccccgctc 12180
aacgacgtgg ccgaaacgcg ggccatcaag tcggtgtttg ccgacggtgg ccactatcgc 12240
aagctgatgg tcagcgccag caagtcgcag atcggccaca tgatcgcggc cgccggcgcc 12300
cccgaatgca tcgccacggt gctggcgctg catgccggcc atgtgccgcc caccctcaat 12360
ctggaccatc ccgatcccga atgcgatctc gattacgtgc cgcacctggc gcggcgcgcg 12420
ccgatccagg ccgcgctgtc gaattccttc ggcttcggcg gcctcaatgt gtcgctggcc 12480
ctgcgccgct accaggaata atcatgatga acacttcagc tgacaacacc attgtcatta 12540
ccggcaccgg ctgccttttg cccggcagtt ccacgcccgc gcaattctgg gaccgcctgg 12600
tgcaggggga aagcggcctg acgccctaca gcgacgagcg catcggctcg cgcctgatcg 12660
gccatttcgg ccatctcagc gccgagcagc gcgccgccgc cgccgaggcg gtaccgttca 12720
agctgcgccg cttcgcctcg agctgctcga tgtggggcgt gaaggccgcc accgatgcgc 12780
tggcccacgc cggcctcgac ctgaaaacca tacccgacga ccgctgcggg ctgttcaccg 12840
cccagggcga ctacctccat ccttcggtgc agtcgttcgc gaccggcctg ggtaacgccg 12900
tgccgaacga cttgccggcg ctgaccaggg aattcaccca ccaccgcggc atggagccct 12960
tcatggcgat caagagcctg gccaacaaca tgctggcgat ggccagcctg accctgggca 13020
cgcgcggcga ttgcggcgcc ttcgtccaga acaaaagcgc caccgtggcg gccttgcgca 13080
gtgccgcctt cagcctgcgc cacggctaca gcgattgcgc tttgctgatc tgctcgggca 13140
gctataacga ggtcctgacg ctggccgaac tgcagcgctc gggctacctg agcgccggcg 13200
ccggcggcgc gcgctcggtg cggcccttcg accgccgccg cgacggcacc atcgccggcg 13260
aaggcgcggt tgccttcgtc ctcgagaccg cggccaacgc ccgccgccgc ggcgccgccg 13320
tcctggccac gctgggcggc atcggtaacc tggtgcagca gccgggcgcg caagcgggca 13380
gcgacgccta ccgccgctgc gccgacaagg cgctggccgg ttccggcgtc gacttcggcg 13440
acatcggcgc catcgtggcg cgcggcaccg gcggccagtc gcacgacgcg catgaggcga 13500
gcctgctggc gcagctgcaa cagggccgcg gcggggtacc aatcacctgc gccacgccaa 13560
ttgtcggcag cgtgccggcc tgtccggtcg actggctcgc gtccatcggc atcctgcagg 13620
agggcgtggt gccgccgatc gccaacctgg aggacgctct cgacgccggc ctgcacttcg 13680
tgcatggcaa gccagagcag cgcgacgcgc gccacgtcct gtcgctgagc gccggctaca 13740
ccggtttcca ctcggccgtc cttttttccg cagcatcgca ctaggcacaa tccatgtcca 13800
attaccagca ctacgtcaaa acgcatttgt ccaagctgct cgccgcgctc ggactcgata 13860
tcagctacac gcgcgccgcc ggcgacacgc tctactaccg cgaccgccac ggcgaagaaa 13920
tccccgtgct cgacctgctg ggcggctacg gctcgctcat cttcggccac aaccacccgc 13980
agatcatggc caccgccacc gacctgatcg cgcagcaagt gccggtgcac gcccagttct 14040
cgctgcgcga gcgcgccggc gagctggcca ggcgcctgtc cgggatggtc cagcgcgaga 14100
gcggcagcga ggaagaattc aacgtcacct tcgccaacag cggcgccgag gcgatcgagg 14160
tggcgatcaa gcatgcggaa ctggaccgca tcctcaagct gcaaaccctg ctcgacgacg 14220
tcaccctcaa tatcgaacgg gtgcaaaagg ccatccgcaa cggcacggcc aaggtgccgg 14280
tcgacgtcta ccgccattcg ccgatccgcg agcaggtgtt cgacgtgcgc ggcttcgaag 14340
agctgatcgt cggcctggtg tcgcacaaca ctacccagct ggtgaagcgt cccattttcc 14400
tggtgctgga aaaatccttt cacggcaaac tgatcggcag cgtgcagctc acctacaaca 14460
agaatttccg gcgcccgttc cagtactttg gcctgaacac ccgcttcatt tcgccgcatg 14520
acccggacca gctgcggcgc gtgctggccg aggaacgcat cgtgctgtac gacctggacg 14580
tgcaggacgg cgtggtacgc gtcgtcgagc gcccgatccc gatcttcgcc gccttcctgg 14640
tcgagccgat ccagggcgag ggcggggtcc acatgctgga tgcagacttc gccaaactgg 14700
tgcgcaagac ctgcaacgaa ctcgattgcc cgctgatcgt cgacgagatc cagagcggca 14760
tggggcgctc gggcagcttc ctggccagca ccctgatccc gctcaagggc gactattaca 14820
cgctgtccaa gtcgctcggc ggcggcctgg ccaagatttc ggcgaccctg atccgcaaga 14880
gccgggtgcg caaggaattc agcctggtgc acagctccac cttcgccgag gacgacttct 14940
cgtcggggat cgcgctcaag gtgctcgaca tgctcgaagc ggacgatggc aaggcctacc 15000
atcaggtgca ggacagcgcg gccaagctgt ttgccgcctt cgagcgggtg cgcgccgcct 15060
tcccggacgt gatcaaggaa gtgcgcgggc agggcctgtt catcggcgtc gagttccaca 15120
gccaaaagaa cgccagctcg atcatcatcc gcggcagcgc ctacaacgat tccttcggct 15180
atctgctgtc gggctacctg ctgcaccagg agcggatccg catcgcgccg cccggcagcg 15240
cgccgaacgt gctgcgcatc gagccgtcga tgttcctgag cgatgcccag gtggcgcacg 15300
tggaagcggc cttcgggcgc ctgtgcgaca tcgtgcgcaa gcaggatgcg ctgcatttcg 15360
tgttcccgtt aacggcgtcc agccgcgcca agccgcgccg cgaggcgcag gacttcagcc 15420
aggcgttccc ggcgcagccg gccgcggaca gcaggttcga gccgacccgc ccggtgcgca 15480
agatcgcctt catcaaccac ctgatcaacc cgcagctgct gaccgaggtc gatccctcgc 15540
tggcggtgct cacggccgag gaactgcgcc agttcgtgct gaagatggac ccgaacaaga 15600
aggcggcccc gtatcccgcg gtgcgcatcc attcgccgct gggcagcgcg gtcgacttca 15660
tcctctatcc gctgtgcgtg agctcggagc agatgggcca gtacctcgcc gacggcaagc 15720
tcgatggcat ccgcgacgat atccaggacc gcatcaaggc cgcctccgag gacggctgcg 15780
agatcgccgg cctgggcatg tttacctcga tcgtgaccaa caactgcctg tcgctgcggg 15840
tgcccgacac cgcgctcacc accggcaacg ccttcaccgt cgccatggcg atcgatgcca 15900
tcgacaacgc ggtggccgcg gccggactgc cgatcgagga actcacggtg gtggtggtcg 15960
gcgccgcggg caacatcgcc agcacctacg cttcgctgct gagcgaaaaa accacgcgcc 16020
tgatcctgct gggcagcgag cgcaatggct cgctcagccg cctgaaccag accttgcaca 16080
gcatttacga cgacacctgg caggaaatct gcacgctgcc gcgcgagaaa ctgggccgcc 16140
tggcccagcg cctggtacgc gagccgctgg tggccgaatg gctggaagag ggcaccgcac 16200
cgcagcgcgg gcgcggcaag gccatcgccc agtacgtggc cgaacgccac ggccacgatc 16260
cttacattac ggtgtcgacc gaccgttcgc tgatcaggcg cggccacatc gtgctgtgcg 16320
ccgccaacag cgccgagccg ttcctgaccg gcgaggactt ccgcgagaac gccatcgtgt 16380
gcgatatcgc ggtgcccaac aatgtatgcg aaggcatcgg caaggatcgg ccggacgtgg 16440
tgtaccagca gggtggcatc gtggccacgc cgaatggcga aagcctgcat ccgggggcgc 16500
gcgcctttct cggcgccggc cagctgttcg cctgcatggc cgaaaccgtg atcatgggcc 16560
tggccggcat caaccgccac tactcctacg gcgccatctc caagcagcag gtgcgcgaaa 16620
tcgcggcgct cgggcgcgcg cacggcttca gcctggccga gtacaagacc ggcagctccc 16680
tctgacaaca aaggaatatg acagtgaaat tatcggatca ggtagcaatc gtgaccggcg 16740
ccagccgcgg catcgggcgc gcaatcgcgg tgctgttcgc ggaagagggc tgcgacgtgg 16800
ccatcaacta ccgcggcgac gaggccgggg cgctggagac cgcggcggcg gtcgaacagt 16860
tcggccgcaa ggccatgctg gtcaaggccg acgtctccag cttcgagcag tgcgaacgca 16920
tggccgatgc ggtcgccgag cgcttcggca agatcgacat cctcgtcaac aatgcgggca 16980
tcacgcgcga caacctgctg gtcagcatgg acgccgagga tatcgaagca gtcattcgca 17040
ccaacctgct gggcgtgatc tacccgacca aggcggtggc catgcacatg gtgcgcaagc 17100
gctcggggcg catcgtcaac atgtcttcgt cggcggcgtc caggccgggc aaaggccaat 17160
gcaactacgc cgcggccaag ggcggggtcg aatcgttcac gcgcgccatg gcggtcgagc 17220
tggcggcgcg caatgtgctg gtcaatgcgg tggcgcccgg cgtcatcatg accgacatgt 17280
cggagcagat ccgcgacatg ggcgacgagg aaatcaaggc gcgcctgctg ctcaagcgct 17340
atgcgcagcc gcgcgaggtg gccgacctgg tgctgcacct ggccagcccg gccaaccagt 17400
acatgaccgg cgaggtgctg cacctcaatg gcggcttgaa gatggcatga cgatgatgct 17460
cgacaccaaa gtcgccctcg tcaccggcgc cggcaacggc atcggcgccg ccgccgcccg 17520
cctgctgtgc gagcgcaaga tccacacgct gatcctgctg gacctgtcca ccgcggcgat 17580
cgacacgctc gcgaccgagc tgcaaggcag cggcacgcgc gtgctgtgct gcagcgccga 17640
catctccgac cgcgcggccc tgcgcgccgc cctcaagccg atcgtggcgc gcaccggcaa 17700
gatcgacatc ctggtcaaca gcgccggcat cgccgacgag aacgagccgg aacaggagga 17760
catctggcgc cgggtgctgg acgtgaatgt ccatggcact tatttcgtca cgctggaagc 17820
gctggacgcc atgccggacg gcggccgcat cgtcaacgtg gcctccatcc tcgggcgcgc 17880
gggcaatgtg cgcaacacgg cctattgcac ctccaagcac gccatgctcg gttttaccaa 17940
gagcctggcg ctggatgtgg ccagccgcaa gatcacggtc aacgcggtat tgccggcctg 18000
ggtcgatacg cccatgctgc gccgcgagat gggcctgcag gccgaaaaga tcggcgcgga 18060
gctggaccag atgctgcgca atgcccgcaa aaagatcccg ctgcgcagcc tggtgcaaag 18120
cggcgaggtg gcggccatga tcggctacct ggtatcggac gcggcgtcca gcgtgaccgc 18180
gcaaagcttc accatcgacg gcggcttcac atgcggcgtc tgaggctggc ggcggcgctg 18240
ctggcaggtt cgctatgcgg cgccgcgcag ggccaggagc ctgcgctcga tatcggcgtc 18300
tcggttgcgc tgcagtacgc ggcccacatc ggcgagaagc cccgcgcacg acccagcgcg 18360
gcggccagct caatgtcaag ttcgagcacg acggcggcgc gttccgggtc cgcggcgagg 18420
gccgcgtgcg ctggaacgac gcctaccgtg gcggcgtgta cagccgcgag gcgcgcgacg 18480
cctacgtgcg cagcgccgac tggcgcgagc tgtatatcgc aggcgaggct gcgggctgga 18540
acctgtcggc cggtttgcag caggtggtat ggggcaaggc cgacaacctg cgcgtggtcg 18600
acatggtcaa tccggtcgac ctgcgcgact tcatcctgcc cgagctgaac gactatcgca 18660
agccggtccc gatggtgcgc ggcacccgcg ccgtcggcga ctggcagctc gagctgttgt 18720
acctgccgcg cttcgtgccg acacgttacg cgcgtccggg cagcgaattc gacctggcgc 18780
agccagatcc cgagctgctc gcgagcgtcc agctgctgcc ggagcagcgt ccctcaaagt 18840
cgttcagggg tggcgaattg ggcatgcagg tctcgcgcag cttcggcgcg ctcgacctgt 18900
ccggctacct gttccatacc tgggatgaca atccggtgta ccgcttcctg cccgcgcagg 18960
atggcgccgg ccagccggct gttggcttgc agccggccta ccggcgccag tcgatggccg 19020
gcctgtcgct ggcccacgca atgggcaatg gcctggtgct gcgctccgaa ctggcctacg 19080
tgcccaattt tacctacatg gtcgcggcgg gcagcgaaga cggcctggca cgcagcgcca 19140
cgctcaccgg cctgctggga ctggactacg tgtggcgcga ctggctgctg tcggcgcagg 19200
tgaccgaccg ccatatcgat gcctgggacc gcagctacct gctgcgcaag cacgacccga 19260
tggtcaccct cgccgccacc ggcaccgcca tggccggcaa actcgattcg cgcctgtcgc 19320
tggcgcgctt cgccggcacg ggcggctacg tggcccaggc caggggcacc tggaagcccg 19380
acgacagctg ggcttacacc gccggggtcg acgtcttcgg cggcgacccg gccgggatct 19440
tcggacgctt ccgcaacaag gaccggctct ggttcgaact gaaataccac ttttaaaacc 19500
ataacaacac ctgatggagt atccgatgca agtgaaacga atcgtggcgg cagccctgct 19560
gatgctgtcg tcggcggcgg gggccacggc cctcagcgcc gaccagatcc tggaaaaagt 19620
gcgcaaccgc gccgacggcg ccgacatcct ggccgaagcc cagctggtgc tcaaggagag 19680
caacggcggc agccgcacgc gcaccctgct gttcttggaa aaggactacg gcaaggatga 19740
aaagctgacc ctggccttca ccggcccggc cgacgtcaag ggcgtggtcc tgcaaagcgt 19800
gaactacgac gaagcggcgg ccaaggagga cgaccagtgg atgtacttgc cggcctttcg 19860
ccaggtgagg cgcatcgccg ccaccgacaa gcgcggctcc ttcatgggca gccagttctc 19920
gtacatcgac ctggacaagc tgcgcgtggg cgactatcgc cagaagctgg taggcgagga 19980
gaccatcgac ggcaagccct gctacatgat cgaacgcaca cccgcatcgg aaagcgtgat 20040
caaccgcacc ggctatcaca agaacatggt gtgggtcgac aaggagacct tcgtcatcct 20100
caagcaaagc tacttcgatg cgcgcggcgt gcagttcaag tacttcctgg ccaaaaaggt 20160
cgagaagatc caagacatct ggaccgtgac ccacagcgaa atgcaggacg tggtcaacca 20220
gcgctcgtcg gccctgatct tcaacaaagt gcgctacaac gccggcctgg acgacgcggt 20280
attccaacaa aacatcatga aaacgggagt caatagtgga aacctacctg caattcgttg 20340
accgctggtc caaggccatc ctcgccgtcc tggcgctggt aacggccttc ttcgtggtcc 20400
agctgggcgc cctgaccaac gacagcaatc cctacctgct ggccgagtcg cacccggcgc 20460
gcaagtcgat cctcgacctg cagaaggaat tcaccggcac cttcgacgcg gcgatgatag 20520
tcgtgcacaa tccggccggc gtgttcaacc ggaccacgct ggacgcggtg ctggagatga 20580
ccacggcctc gcgcaagctg atgctggcca ccgagggcga tgcggcctac ctggaagggc 20640
tcaagcagcg ctatggcgcg gccaacccgg ccttcggcgc cgccatcgac gcggtcctcg 20700
ccaaaggcct ggagcagaac gactatttcg cggccgagaa gctgatcgaa ctgggtaaac 20760
cgctcgacct gtcgcatgcc gaaaccgcct tcctgtccta cctgccgcgc cgcctcaatc 20820
ccgtgaagga aatggccggc ctggcggcga ccgacaacat cctgaccaag gatggcacgc 20880
tggtcatcac caagagcctg caggacaaga ccacgccgcc ggcccagatc cgcgccgacg 20940
tgatgggcaa cgagatgctg atgaagagcg tcatctcgga cgacgaaaaa gtcaccatga 21000
tcacggtcga actgttcgtc aagcaggacg acgccgacgg ccaggtgcgc gcctacgacg 21060
ccatcaagaa aatcctcgac gactaccgca aggcccatcc ggagttcaag gacgaggtgt 21120
acatcgccgg caccccgatc ttcatcgccg agcagaagaa actgaccgac agcgaccttg 21180
gcaccctgct gccgctggtg atcggtgtcg tcggcgcgat cctgatcgtc tacttccgca 21240
ggccgctcgg cttcatcctg ccgatggtca atgtgatcat gtgcaccatc tggacgctgg 21300
gcgccatgag cctgatgcgg gtgccgatgg acctggtcac cagcgcgctg ccggtgttcc 21360
tgattaccat ctgcggcgcc gacgccatcc acatgatgag cgagtactac acccagaaga 21420
gcagcggcat cgacaccagg gaagcggtgc gccgcaccct gcgcgcaatg gtctcgccga 21480
ttgtactgac cactgtcacc acggtggccg gcttcctgtt ttcgaccgcc accaatatct 21540
ccagcatcca gtcgttcggc attttcatgg ccgtcggcct ggtcagcgcg cagatcatct 21600
cgctgctcct gatcccggcg tggatcaatc tgatgggtgg caaaaagcag gtcgccagcg 21660
ccagcggcga agtcgacgcc ggctggctcg gacgcgccct ggcctccgtg ttcgccgcgc 21720
tgatccgcaa gcgcaaggcg gcgctgctgg ccttcgccgt gctgatggtg ggcgcgggcc 21780
tgatggccac ccgcatctcg gtggacgatg ccggctcggc ctacttcctg cccgataacg 21840
agtaccgcaa gtccgatgaa ttcatcaacg gccacatcgc cggcaccagc cctggctgga 21900
tccgcatcga aggcgccggt ccgaacgcca tgctcaacgt cgagaccatg gtcttcatcg 21960
acaagctcga cgccttcctg ctgtcgcagc ccaaggtgac gtacacgtat tcgccggcca 22020
cctacgtcaa gcgcatgaac ctggcggtca acgacatgaa gccggaattc aaccgcctgc 22080
cgcgcaagag cgaaaccgt 22099
<210> 2
<211> 259
<212> PRT
<213> metagenome
<400> 2
Met Lys Ile Glu Thr Val Asp Ala Pro Lys Thr Ser Ile Gln Val Ile
1 5 10 15
Glu Arg Met Val Ala Leu Leu Asp Ala Leu Ala Asn Tyr Thr Asp Pro
20 25 30
Val Ser Leu Lys Glu Leu Ser Lys Val Ser Gly Leu His Pro Ser Thr
35 40 45
Ala His Arg Ile Leu Asn Asp Met Val Ile Thr Arg Phe Val Asp Arg
50 55 60
Val Glu Pro Gly Thr Tyr Arg Leu Gly Met Arg Leu Leu Glu Leu Gly
65 70 75 80
Asn Val Val Lys Ser Arg Leu Ser Val Arg Glu Ala Ala Leu Asp Phe
85 90 95
Met Arg Ala Leu His Lys Lys Thr Gln Gln Thr Ile Asn Leu Ser Val
100 105 110
Arg Gln Gly Asp Glu Ile Val Tyr Ile Asp Arg Ala Phe Ser Glu Arg
115 120 125
Ser Gly Met Gln Val Val Arg Ala Ile Gly Gly Arg Gly Pro Leu His
130 135 140
Leu Thr Ser Thr Gly Lys Leu Phe Leu Ser Val Asp Glu Pro Lys Ala
145 150 155 160
Ile Arg Ala Tyr Ala Thr Arg Thr Gly Leu Ala Gly His Asn Lys Asn
165 170 175
Ser Ile Thr Asp Leu Gly Lys Leu Glu Arg Glu Leu Ser Met Val Arg
180 185 190
Thr Arg Gly Tyr Ala Arg Asp Asn Glu Glu Leu Glu Leu Gly Val Arg
195 200 205
Cys Met Ala Ala Gly Ile His Asp Asp Ser Gly Lys Leu Val Ala Gly
210 215 220
Leu Ser Ile Ser Ala Pro Ala Asp Arg Leu Gln Glu Glu Trp Leu Glu
225 230 235 240
Asp Leu Val Gly Thr Ala Ala Gln Ile Ser Ala Thr Leu Gly Tyr Thr
245 250 255
Gly Ser Phe
<210> 3
<211> 308
<212> PRT
<213> metagenome
<400> 3
Met Asn Phe Gln Gln Leu Arg Ser Ile Arg Glu Thr Ala Arg Arg Gly
1 5 10 15
Tyr Asn Leu Thr Glu Val Ala Asn Ala Leu Phe Thr Ser Gln Pro Gly
20 25 30
Val Ser Arg Gln Ile Arg Glu Leu Glu Asp Glu Leu Gly Val Val Ile
35 40 45
Phe Glu Arg Asn Gly Lys Arg Leu Thr Gly Met Thr Glu Pro Gly Lys
50 55 60
Gly Ile Leu Lys Ile Ile Asp Arg Leu Leu Val Glu Ala Glu Asn Leu
65 70 75 80
Gln Gln Ala Ser Met Asp Tyr Ala Gly Gln Asn Ser Gly Thr Leu Thr
85 90 95
Ile Ala Ala Thr His Thr Gln Ala Arg Tyr Ala Leu Pro Lys Val Val
100 105 110
Gln Ser Phe Arg His Asp Phe Pro Asp Val Arg Ile Ala Leu Gln Gln
115 120 125
Ser Ala Pro Asp His Ile Ala Glu Trp Val Leu Ser Gly Lys Ala Asp
130 135 140
Ile Gly Ile Ala Thr Glu Gly Leu Ser Gln Phe Pro Asp Leu Val Ser
145 150 155 160
Phe Pro Cys Tyr Arg Trp Ser His Leu Ile Val Val Pro Asp Gly His
165 170 175
Pro Leu Leu Ala His Ser Pro Ile Arg Leu Glu Asp Leu Ala Ala Phe
180 185 190
Pro Leu Ile Thr Tyr Asp Val Gly Phe Thr Gly Arg Gly His Ile Asp
195 200 205
Ala Ala Phe Ala Gln Ala Gly Val Lys Thr Asp Ile Val Leu Thr Ala
210 215 220
Met Asp Ser Asp Val Ile Lys Gln Tyr Val Ser Leu Gly Leu Gly Val
225 230 235 240
Gly Ile Val Ala Ser Met Ala Phe Asp His Gly Arg Asp Lys Gly Leu
245 250 255
Arg Ala Val Glu Ala Ser His Leu Phe Ala Pro Asn Val Thr Arg Leu
260 265 270
Ala Val Arg Arg Gly Ala Tyr Leu Arg Ala Tyr Ala Tyr His Phe Ile
275 280 285
Ser Gln Phe Ala Pro Glu Leu Lys Arg Ala Asp Ile Glu Ala Ala Ile
290 295 300
Gly Ala Glu Gly
305
<210> 4
<211> 188
<212> PRT
<213> metagenome
<400> 4
Met Asn Asn Pro Tyr Thr Ala Ala Glu Met Gln Thr Ile Val Asn Gly
1 5 10 15
Val Leu Ala Gly Val Leu Gly Val Asp Pro Ser Glu Ile Ala Ala Asp
20 25 30
Ser Ala Ile Val Asp Asp Phe Gly Ala Asp Ser Leu Asp Phe Val Glu
35 40 45
Phe Asn Thr Thr Leu Glu Lys Lys Leu Asn Met Ser Met Pro Lys Lys
50 55 60
Gly Pro Leu Ser Gln Ala Gly Lys Ala Thr Gly Thr Pro Glu Leu Phe
65 70 75 80
Tyr Ser Gly Arg Thr Gly Leu Thr Glu Gln Gly Val Asp Leu Leu Arg
85 90 95
Asn Ser Leu Ser Gln Tyr Thr Gln Leu Ser Thr Gly Met Thr Val His
100 105 110
Asp Val Phe Asn Leu Thr Ser Val Gly Asn Ile Ala Ser Leu Cys Leu
115 120 125
Asn Leu Phe Asn His Leu Pro Asp Thr Cys Pro Asp Cys Gly His Ala
130 135 140
Glu Ala Lys Leu Ser Ala Ala Gly Lys Val Val Cys Ala Ser Cys Ser
145 150 155 160
Ala Thr Val Arg Pro Leu Gln Gly Asp Glu Ala Asp Glu Arg His Ile
165 170 175
Arg Gln Tyr Leu Asp Thr Ala Leu Ala Gln Ala Ala
180 185
<210> 5
<211> 425
<212> PRT
<213> metagenome
<400> 5
Met Lys Thr Gln Val Val Val Thr Gly Ile Gly Val Ile Cys Ser Gln
1 5 10 15
Ala Ser Ser Ala Gly Glu Leu Phe Gly Arg Leu Lys Asp Gly Leu Ser
20 25 30
Ser Val Arg Asn Asn Ala Arg Met Ala Ala Ser Gly Val Ser Asn Pro
35 40 45
Ala Cys Ala Tyr Ile Asp Glu His Val Trp Asp Gln Leu Glu Ala Glu
50 55 60
Gln Ala Gly Arg Phe Pro Asp His Leu Gly Pro Gln Ala Arg Leu Ala
65 70 75 80
Leu His Ala Ala Gly Gln Ala Val Arg His Ala Gly Ile Asp Leu Gly
85 90 95
Ala Val Glu Arg Lys Gly Leu Phe Val Ala Ser Asn Lys Tyr Thr Leu
100 105 110
Thr Ser Glu His Leu Leu Gly Ile Gly Arg His Tyr Asp Ala Asp Ser
115 120 125
Ala Thr Val Asn Leu Asp Ser Tyr Val Gln Asp Glu Arg His Asp Ala
130 135 140
Gly Ala Tyr Phe His Lys Arg Gln Asp Met Ala Ala Leu Thr Leu Ala
145 150 155 160
Gln Leu Tyr Gly Phe Asp Asp Ala Val Met Thr Pro Gly Asp Ala Cys
165 170 175
Ala Ala Gly Gly Val Ser Val Gly Thr Gly Phe Arg His Ile Ala His
180 185 190
Gly Glu Leu Asp Val Ala Leu Val Gly Ala Thr Glu Ala Met Ser Asn
195 200 205
Tyr Val Pro Leu Met Gly Phe Ser Ile Leu Gly Ala Ser Ala Pro Asp
210 215 220
Phe Asn Asp Asp Pro Ala Ala Ile Ser Arg Pro Phe Asp Lys Asp Arg
225 230 235 240
Ser Gly Phe Val Met Gly Glu Gly Ser Ala Phe Leu Val Leu Glu Ser
245 250 255
Leu Glu His Ala Gln Arg Arg Gly Ala Pro Ile Leu Ala Arg Val Ser
260 265 270
Gly Phe Ala Lys Gln Val Glu Ala Tyr Arg Ile Thr Ala Ser Pro Ala
275 280 285
Asp Gly Ser Gln Tyr Ala Arg Cys Met Arg Ala Ala Leu Asp Asp Ala
290 295 300
Gly Leu Asp Ala Ala Ser Ile Asp His Val Asn Ala His Gly Thr Ser
305 310 315 320
Thr Gln Ser Asn Asp Ser Cys Glu Ser Ala Ala Ile Lys Gln Val Phe
325 330 335
Gly Ala Arg Ala Pro Gln Val Pro Val Thr Ala Asn Lys Ser Ala Leu
340 345 350
Gly His Ser Leu Ala Ala Ser Gly Ala Ile Glu Ala Val Leu Ser Val
355 360 365
Met Ser Leu Gln Glu Gln Val Leu Leu Pro Thr Leu Asn Phe Ser Glu
370 375 380
Gly Asp Ala Asn Thr Glu Gly Leu Asp Ile Val Arg Ala Thr Arg Pro
385 390 395 400
Ala Pro Val Ala His Ile Met Ser Asn Ser Phe Gly Phe Gly Gly Gln
405 410 415
Asn Cys Val Leu Ile Leu Ser Thr His
420 425
<210> 6
<211> 383
<212> PRT
<213> metagenome
<400> 6
Met Lys Thr Lys Val Tyr Ile Asp Gly Gly Ser Ala Leu Cys Ala Ala
1 5 10 15
Gly Ala Gly Ile Ala Pro Leu Trp Ser Ala Met Ala Ala Gly Ala Arg
20 25 30
Asn Leu Ser Ala Leu Pro Cys Pro Ala Phe Asp Ser Trp Pro Trp Pro
35 40 45
Glu Val Phe Leu Val Asp Glu Pro Gly Ala Ala Glu Leu Lys Val Asp
50 55 60
Arg Lys Leu Leu Arg Thr Met Glu Lys Gln Ala Lys Leu Thr Leu Leu
65 70 75 80
Gly Ala Ala Ala Ala Leu Ala Ala Cys Pro Pro Ala Val Asp Ala Asp
85 90 95
Pro Ser Arg Ile Gly Leu Tyr Leu Gly Leu Pro Thr Val Asp Glu Ala
100 105 110
Val Pro Pro Trp Pro Leu Leu Glu Ala Met His Glu Ala Gly Ser Thr
115 120 125
His Phe Asp Ser Glu Met Leu His Arg Glu Val Pro Ala Phe Phe Gly
130 135 140
Leu Ser Thr Leu Asn Ser Asn Ala Cys Ala His Ile Ala Gly Thr Phe
145 150 155 160
Gly Met Ala Gly Ser Met Gly Ala Cys Ser Pro Phe Ala Asp Ala Gly
165 170 175
Leu Ala Ala Leu Ile Glu Gly Ala Leu Ser Val Cys Asn Gly Glu Asn
180 185 190
Ser Glu Ala Leu Val Gly Gly Cys Ser Ala Lys Ile Asn Pro Leu Leu
195 200 205
Met Leu Gln Tyr Glu His Leu Gly Trp Leu Ala Glu Ala Gly Arg Ile
210 215 220
Pro Gly Glu Gly Val Ala Phe Leu Thr Val Gly Ala Ala Ser Arg Ser
225 230 235 240
Glu Thr Ala Val Arg Leu Ala Gly Tyr Ala Arg Gly Phe Ile Ala Ser
245 250 255
Glu Val Gln Ala Ala Ala Val Ile Ala Pro Val Val Glu Thr Ala Leu
260 265 270
Ala Met Ala Gly Ile Thr Ala His Glu Leu Asp Trp Val Leu Pro Gly
275 280 285
Ala Cys Ser Asp Ala Glu Met Ala Leu Leu Ala Arg Leu Ala Glu Gly
290 295 300
Thr Pro Leu Val Arg Ala Cys Ser Ala Glu Val Cys Gly Ala Leu Gly
305 310 315 320
Pro Ala Ala Pro Val Leu Gly Val Leu Leu Ala Ala His Ala Ile Arg
325 330 335
Ser Gly Ala Arg Leu Arg Tyr Thr Ala Pro Gly Gln Pro Gln Arg Glu
340 345 350
Glu Ala Ala Arg Val Arg His Val Leu Val Thr Ala Arg Gly Pro Glu
355 360 365
Gly Gln Tyr Ala Ala Val Val Val Ser Lys Glu Lys Cys Asp Glu
370 375 380
<210> 7
<211> 421
<212> PRT
<213> metagenome
<400> 7
Met Ser Asn Arg Val Val Ile Thr Gly Leu Gly Val Val Ser Ala Leu
1 5 10 15
Gly Tyr Asp Trp Glu Thr Phe Trp Asn Ala Leu Leu Ala Gly Lys Ser
20 25 30
Gly Ile Arg Pro Trp Gln Pro Asp Glu Val Glu Gly Phe Pro Val Gln
35 40 45
Tyr Ala Ala Pro Val Asp Leu Ala Asp Phe Glu Arg Thr Phe Ala Arg
50 55 60
Ala Ala Glu Leu Ala Gln Pro Met Glu Arg Arg Ser Arg Phe Gly Leu
65 70 75 80
Met Ala Ala Arg Gly Ala Leu Ala Asp Ala Gly Leu Ala Gly Lys Val
85 90 95
Arg His Asn Thr Gly Val Ala Val Gly Ser Gly Val Pro Glu Arg Cys
100 105 110
Ser Ala Asp Met Leu Leu Ala Leu Gly Pro Ala Gly Pro Arg Trp Glu
115 120 125
Asn Leu Tyr Ala Arg Arg Ala Glu Leu Asn Ala Ser Met Arg Pro Gly
130 135 140
Asn Asp His Leu Ala Ala Leu Val Ala Arg Ser Tyr Gly Cys Asp Gly
145 150 155 160
Pro Val Leu Asn Phe Ser Thr Ala Cys Ala Gly Ala Ala His Ala Ile
165 170 175
Gly Ser Ser Phe Arg Met Ile Arg Asp Gly Glu Thr Asp Cys Met Leu
180 185 190
Ala Gly Gly Ala Asp Ser Val Leu Asn Leu Met Thr Met Leu Gly Leu
195 200 205
Asn Leu Ile Gly Ala Pro Ser Thr Ser Glu Asp His Gly Asp Lys Leu
210 215 220
Cys Arg Pro Phe Asp Ser Ala Arg Ser Gly Phe Val Ala Ala Glu Gly
225 230 235 240
Gly Ala Met Leu Val Leu Glu Ser Glu Arg Arg Ala Arg Ser Arg Gly
245 250 255
Ala Arg Ile Tyr Ala Glu Ile Cys Gly Phe Gly Ser Ser Leu Asp Ala
260 265 270
Tyr Arg Val Thr Ala Pro His Pro Glu Gly Arg Gly Ala Ala Leu Ala
275 280 285
Met Arg Lys Ala Leu Ala Asp Ala Gly Leu Gln Pro Gly Ala Ile Gly
290 295 300
Tyr Ile Asn Ala His Gly Thr Ser Thr Pro Leu Asn Asp Val Ala Glu
305 310 315 320
Thr Arg Ala Ile Lys Ser Val Phe Ala Asp Gly Gly His Tyr Arg Lys
325 330 335
Leu Met Val Ser Ala Ser Lys Ser Gln Ile Gly His Met Ile Ala Ala
340 345 350
Ala Gly Ala Pro Glu Cys Ile Ala Thr Val Leu Ala Leu His Ala Gly
355 360 365
His Val Pro Pro Thr Leu Asn Leu Asp His Pro Asp Pro Glu Cys Asp
370 375 380
Leu Asp Tyr Val Pro His Leu Ala Arg Arg Ala Pro Ile Gln Ala Ala
385 390 395 400
Leu Ser Asn Ser Phe Gly Phe Gly Gly Leu Asn Val Ser Leu Ala Leu
405 410 415
Arg Arg Tyr Gln Glu
420
<210> 8
<211> 425
<212> PRT
<213> metagenome
<400> 8
Met Asn Thr Ser Ala Asp Asn Thr Ile Val Ile Thr Gly Thr Gly Cys
1 5 10 15
Leu Leu Pro Gly Ser Ser Thr Pro Ala Gln Phe Trp Asp Arg Leu Val
20 25 30
Gln Gly Glu Ser Gly Leu Thr Pro Tyr Ser Asp Glu Arg Ile Gly Ser
35 40 45
Arg Leu Ile Gly His Phe Gly His Leu Ser Ala Glu Gln Arg Ala Ala
50 55 60
Ala Ala Glu Ala Val Pro Phe Lys Leu Arg Arg Phe Ala Ser Ser Cys
65 70 75 80
Ser Met Trp Gly Val Lys Ala Ala Thr Asp Ala Leu Ala His Ala Gly
85 90 95
Leu Asp Leu Lys Thr Ile Pro Asp Asp Arg Cys Gly Leu Phe Thr Ala
100 105 110
Gln Gly Asp Tyr Leu His Pro Ser Val Gln Ser Phe Ala Thr Gly Leu
115 120 125
Gly Asn Ala Val Pro Asn Asp Leu Pro Ala Leu Thr Arg Glu Phe Thr
130 135 140
His His Arg Gly Met Glu Pro Phe Met Ala Ile Lys Ser Leu Ala Asn
145 150 155 160
Asn Met Leu Ala Met Ala Ser Leu Thr Leu Gly Thr Arg Gly Asp Cys
165 170 175
Gly Ala Phe Val Gln Asn Lys Ser Ala Thr Val Ala Ala Leu Arg Ser
180 185 190
Ala Ala Phe Ser Leu Arg His Gly Tyr Ser Asp Cys Ala Leu Leu Ile
195 200 205
Cys Ser Gly Ser Tyr Asn Glu Val Leu Thr Leu Ala Glu Leu Gln Arg
210 215 220
Ser Gly Tyr Leu Ser Ala Gly Ala Gly Gly Ala Arg Ser Val Arg Pro
225 230 235 240
Phe Asp Arg Arg Arg Asp Gly Thr Ile Ala Gly Glu Gly Ala Val Ala
245 250 255
Phe Val Leu Glu Thr Ala Ala Asn Ala Arg Arg Arg Gly Ala Ala Val
260 265 270
Leu Ala Thr Leu Gly Gly Ile Gly Asn Leu Val Gln Gln Pro Gly Ala
275 280 285
Gln Ala Gly Ser Asp Ala Tyr Arg Arg Cys Ala Asp Lys Ala Leu Ala
290 295 300
Gly Ser Gly Val Asp Phe Gly Asp Ile Gly Ala Ile Val Ala Arg Gly
305 310 315 320
Thr Gly Gly Gln Ser His Asp Ala His Glu Ala Ser Leu Leu Ala Gln
325 330 335
Leu Gln Gln Gly Arg Gly Gly Val Pro Ile Thr Cys Ala Thr Pro Ile
340 345 350
Val Gly Ser Val Pro Ala Cys Pro Val Asp Trp Leu Ala Ser Ile Gly
355 360 365
Ile Leu Gln Glu Gly Val Val Pro Pro Ile Ala Asn Leu Glu Asp Ala
370 375 380
Leu Asp Ala Gly Leu His Phe Val His Gly Lys Pro Glu Gln Arg Asp
385 390 395 400
Ala Arg His Val Leu Ser Leu Ser Ala Gly Tyr Thr Gly Phe His Ser
405 410 415
Ala Val Leu Phe Ser Ala Ala Ser His
420 425
<210> 9
<211> 963
<212> PRT
<213> metagenome
<400> 9
Met Ser Asn Tyr Gln His Tyr Val Lys Thr His Leu Ser Lys Leu Leu
1 5 10 15
Ala Ala Leu Gly Leu Asp Ile Ser Tyr Thr Arg Ala Ala Gly Asp Thr
20 25 30
Leu Tyr Tyr Arg Asp Arg His Gly Glu Glu Ile Pro Val Leu Asp Leu
35 40 45
Leu Gly Gly Tyr Gly Ser Leu Ile Phe Gly His Asn His Pro Gln Ile
50 55 60
Met Ala Thr Ala Thr Asp Leu Ile Ala Gln Gln Val Pro Val His Ala
65 70 75 80
Gln Phe Ser Leu Arg Glu Arg Ala Gly Glu Leu Ala Arg Arg Leu Ser
85 90 95
Gly Met Val Gln Arg Glu Ser Gly Ser Glu Glu Glu Phe Asn Val Thr
100 105 110
Phe Ala Asn Ser Gly Ala Glu Ala Ile Glu Val Ala Ile Lys His Ala
115 120 125
Glu Leu Asp Arg Ile Leu Lys Leu Gln Thr Leu Leu Asp Asp Val Thr
130 135 140
Leu Asn Ile Glu Arg Val Gln Lys Ala Ile Arg Asn Gly Thr Ala Lys
145 150 155 160
Val Pro Val Asp Val Tyr Arg His Ser Pro Ile Arg Glu Gln Val Phe
165 170 175
Asp Val Arg Gly Phe Glu Glu Leu Ile Val Gly Leu Val Ser His Asn
180 185 190
Thr Thr Gln Leu Val Lys Arg Pro Ile Phe Leu Val Leu Glu Lys Ser
195 200 205
Phe His Gly Lys Leu Ile Gly Ser Val Gln Leu Thr Tyr Asn Lys Asn
210 215 220
Phe Arg Arg Pro Phe Gln Tyr Phe Gly Leu Asn Thr Arg Phe Ile Ser
225 230 235 240
Pro His Asp Pro Asp Gln Leu Arg Arg Val Leu Ala Glu Glu Arg Ile
245 250 255
Val Leu Tyr Asp Leu Asp Val Gln Asp Gly Val Val Arg Val Val Glu
260 265 270
Arg Pro Ile Pro Ile Phe Ala Ala Phe Leu Val Glu Pro Ile Gln Gly
275 280 285
Glu Gly Gly Val His Met Leu Asp Ala Asp Phe Ala Lys Leu Val Arg
290 295 300
Lys Thr Cys Asn Glu Leu Asp Cys Pro Leu Ile Val Asp Glu Ile Gln
305 310 315 320
Ser Gly Met Gly Arg Ser Gly Ser Phe Leu Ala Ser Thr Leu Ile Pro
325 330 335
Leu Lys Gly Asp Tyr Tyr Thr Leu Ser Lys Ser Leu Gly Gly Gly Leu
340 345 350
Ala Lys Ile Ser Ala Thr Leu Ile Arg Lys Ser Arg Val Arg Lys Glu
355 360 365
Phe Ser Leu Val His Ser Ser Thr Phe Ala Glu Asp Asp Phe Ser Ser
370 375 380
Gly Ile Ala Leu Lys Val Leu Asp Met Leu Glu Ala Asp Asp Gly Lys
385 390 395 400
Ala Tyr His Gln Val Gln Asp Ser Ala Ala Lys Leu Phe Ala Ala Phe
405 410 415
Glu Arg Val Arg Ala Ala Phe Pro Asp Val Ile Lys Glu Val Arg Gly
420 425 430
Gln Gly Leu Phe Ile Gly Val Glu Phe His Ser Gln Lys Asn Ala Ser
435 440 445
Ser Ile Ile Ile Arg Gly Ser Ala Tyr Asn Asp Ser Phe Gly Tyr Leu
450 455 460
Leu Ser Gly Tyr Leu Leu His Gln Glu Arg Ile Arg Ile Ala Pro Pro
465 470 475 480
Gly Ser Ala Pro Asn Val Leu Arg Ile Glu Pro Ser Met Phe Leu Ser
485 490 495
Asp Ala Gln Val Ala His Val Glu Ala Ala Phe Gly Arg Leu Cys Asp
500 505 510
Ile Val Arg Lys Gln Asp Ala Leu His Phe Val Phe Pro Leu Thr Ala
515 520 525
Ser Ser Arg Ala Lys Pro Arg Arg Glu Ala Gln Asp Phe Ser Gln Ala
530 535 540
Phe Pro Ala Gln Pro Ala Ala Asp Ser Arg Phe Glu Pro Thr Arg Pro
545 550 555 560
Val Arg Lys Ile Ala Phe Ile Asn His Leu Ile Asn Pro Gln Leu Leu
565 570 575
Thr Glu Val Asp Pro Ser Leu Ala Val Leu Thr Ala Glu Glu Leu Arg
580 585 590
Gln Phe Val Leu Lys Met Asp Pro Asn Lys Lys Ala Ala Pro Tyr Pro
595 600 605
Ala Val Arg Ile His Ser Pro Leu Gly Ser Ala Val Asp Phe Ile Leu
610 615 620
Tyr Pro Leu Cys Val Ser Ser Glu Gln Met Gly Gln Tyr Leu Ala Asp
625 630 635 640
Gly Lys Leu Asp Gly Ile Arg Asp Asp Ile Gln Asp Arg Ile Lys Ala
645 650 655
Ala Ser Glu Asp Gly Cys Glu Ile Ala Gly Leu Gly Met Phe Thr Ser
660 665 670
Ile Val Thr Asn Asn Cys Leu Ser Leu Arg Val Pro Asp Thr Ala Leu
675 680 685
Thr Thr Gly Asn Ala Phe Thr Val Ala Met Ala Ile Asp Ala Ile Asp
690 695 700
Asn Ala Val Ala Ala Ala Gly Leu Pro Ile Glu Glu Leu Thr Val Val
705 710 715 720
Val Val Gly Ala Ala Gly Asn Ile Ala Ser Thr Tyr Ala Ser Leu Leu
725 730 735
Ser Glu Lys Thr Thr Arg Leu Ile Leu Leu Gly Ser Glu Arg Asn Gly
740 745 750
Ser Leu Ser Arg Leu Asn Gln Thr Leu His Ser Ile Tyr Asp Asp Thr
755 760 765
Trp Gln Glu Ile Cys Thr Leu Pro Arg Glu Lys Leu Gly Arg Leu Ala
770 775 780
Gln Arg Leu Val Arg Glu Pro Leu Val Ala Glu Trp Leu Glu Glu Gly
785 790 795 800
Thr Ala Pro Gln Arg Gly Arg Gly Lys Ala Ile Ala Gln Tyr Val Ala
805 810 815
Glu Arg His Gly His Asp Pro Tyr Ile Thr Val Ser Thr Asp Arg Ser
820 825 830
Leu Ile Arg Arg Gly His Ile Val Leu Cys Ala Ala Asn Ser Ala Glu
835 840 845
Pro Phe Leu Thr Gly Glu Asp Phe Arg Glu Asn Ala Ile Val Cys Asp
850 855 860
Ile Ala Val Pro Asn Asn Val Cys Glu Gly Ile Gly Lys Asp Arg Pro
865 870 875 880
Asp Val Val Tyr Gln Gln Gly Gly Ile Val Ala Thr Pro Asn Gly Glu
885 890 895
Ser Leu His Pro Gly Ala Arg Ala Phe Leu Gly Ala Gly Gln Leu Phe
900 905 910
Ala Cys Met Ala Glu Thr Val Ile Met Gly Leu Ala Gly Ile Asn Arg
915 920 925
His Tyr Ser Tyr Gly Ala Ile Ser Lys Gln Gln Val Arg Glu Ile Ala
930 935 940
Ala Leu Gly Arg Ala His Gly Phe Ser Leu Ala Glu Tyr Lys Thr Gly
945 950 955 960
Ser Ser Leu
<210> 10
<211> 250
<212> PRT
<213> metagenome
<400> 10
Met Thr Val Lys Leu Ser Asp Gln Val Ala Ile Val Thr Gly Ala Ser
1 5 10 15
Arg Gly Ile Gly Arg Ala Ile Ala Val Leu Phe Ala Glu Glu Gly Cys
20 25 30
Asp Val Ala Ile Asn Tyr Arg Gly Asp Glu Ala Gly Ala Leu Glu Thr
35 40 45
Ala Ala Ala Val Glu Gln Phe Gly Arg Lys Ala Met Leu Val Lys Ala
50 55 60
Asp Val Ser Ser Phe Glu Gln Cys Glu Arg Met Ala Asp Ala Val Ala
65 70 75 80
Glu Arg Phe Gly Lys Ile Asp Ile Leu Val Asn Asn Ala Gly Ile Thr
85 90 95
Arg Asp Asn Leu Leu Val Ser Met Asp Ala Glu Asp Ile Glu Ala Val
100 105 110
Ile Arg Thr Asn Leu Leu Gly Val Ile Tyr Pro Thr Lys Ala Val Ala
115 120 125
Met His Met Val Arg Lys Arg Ser Gly Arg Ile Val Asn Met Ser Ser
130 135 140
Ser Ala Ala Ser Arg Pro Gly Lys Gly Gln Cys Asn Tyr Ala Ala Ala
145 150 155 160
Lys Gly Gly Val Glu Ser Phe Thr Arg Ala Met Ala Val Glu Leu Ala
165 170 175
Ala Arg Asn Val Leu Val Asn Ala Val Ala Pro Gly Val Ile Met Thr
180 185 190
Asp Met Ser Glu Gln Ile Arg Asp Met Gly Asp Glu Glu Ile Lys Ala
195 200 205
Arg Leu Leu Leu Lys Arg Tyr Ala Gln Pro Arg Glu Val Ala Asp Leu
210 215 220
Val Leu His Leu Ala Ser Pro Ala Asn Gln Tyr Met Thr Gly Glu Val
225 230 235 240
Leu His Leu Asn Gly Gly Leu Lys Met Ala
245 250
<210> 11
<211> 258
<212> PRT
<213> metagenome
<400> 11
Met Thr Met Met Leu Asp Thr Lys Val Ala Leu Val Thr Gly Ala Gly
1 5 10 15
Asn Gly Ile Gly Ala Ala Ala Ala Arg Leu Leu Cys Glu Arg Lys Ile
20 25 30
His Thr Leu Ile Leu Leu Asp Leu Ser Thr Ala Ala Ile Asp Thr Leu
35 40 45
Ala Thr Glu Leu Gln Gly Ser Gly Thr Arg Val Leu Cys Cys Ser Ala
50 55 60
Asp Ile Ser Asp Arg Ala Ala Leu Arg Ala Ala Leu Lys Pro Ile Val
65 70 75 80
Ala Arg Thr Gly Lys Ile Asp Ile Leu Val Asn Ser Ala Gly Ile Ala
85 90 95
Asp Glu Asn Glu Pro Glu Gln Glu Asp Ile Trp Arg Arg Val Leu Asp
100 105 110
Val Asn Val His Gly Thr Tyr Phe Val Thr Leu Glu Ala Leu Asp Ala
115 120 125
Met Pro Asp Gly Gly Arg Ile Val Asn Val Ala Ser Ile Leu Gly Arg
130 135 140
Ala Gly Asn Val Arg Asn Thr Ala Tyr Cys Thr Ser Lys His Ala Met
145 150 155 160
Leu Gly Phe Thr Lys Ser Leu Ala Leu Asp Val Ala Ser Arg Lys Ile
165 170 175
Thr Val Asn Ala Val Leu Pro Ala Trp Val Asp Thr Pro Met Leu Arg
180 185 190
Arg Glu Met Gly Leu Gln Ala Glu Lys Ile Gly Ala Glu Leu Asp Gln
195 200 205
Met Leu Arg Asn Ala Arg Lys Lys Ile Pro Leu Arg Ser Leu Val Gln
210 215 220
Ser Gly Glu Val Ala Ala Met Ile Gly Tyr Leu Val Ser Asp Ala Ala
225 230 235 240
Ser Ser Val Thr Ala Gln Ser Phe Thr Ile Asp Gly Gly Phe Thr Cys
245 250 255
Gly Val
Claims (8)
- 메타게놈으로부터 얻은 서열번호 1의 orf20 내지 orf39 까지의 항생활성 유전자 집단.
- 제1항에 있어서,상기 유전자 집단 중 항생활성의 발현에 직접적으로 관련되는 것을 특징으로 하는 orf29 내지 orf36 까지의 항생활성 유전자 집단.
- 제1항의 유전자 집단과 70% 이상의 상동성을 가진 유전자 집단.
- 제1항에 있어서,상기 유전자 집단 중 orf20 및 orf28는 항생활성 유전자의 발현을 조절하는 조절유전자인 것을 특징으로 하는 유전자 집단.
- 제4항의 조절유전자 orf20 및 orf28과 각각 70% 이상의 상동성을 가진 유전자.
- 서열번호 4 ~ 서열번호 11의 orf29 내지 orf36 까지의 항생활성 유전자가 코딩하는 단백질의 아미노산 서열.
- 서열번호 2 및 서열번호 3의 orf20 및 orf28 조절 유전자가 코딩하는 IclR response regulator 및 LysR family response regulator의 아미노산 서열.
- 제1항의 유전자 집단에 의해 형질전환되어 항생물질을 생산 가능한 대장균.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070098109A KR100952754B1 (ko) | 2007-09-28 | 2007-09-28 | 토양 메타게놈에서 유래한 항생 활성을 암호화하는유전자군 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070098109A KR100952754B1 (ko) | 2007-09-28 | 2007-09-28 | 토양 메타게놈에서 유래한 항생 활성을 암호화하는유전자군 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20090032676A true KR20090032676A (ko) | 2009-04-01 |
KR100952754B1 KR100952754B1 (ko) | 2010-04-14 |
Family
ID=40759443
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070098109A KR100952754B1 (ko) | 2007-09-28 | 2007-09-28 | 토양 메타게놈에서 유래한 항생 활성을 암호화하는유전자군 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100952754B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9456608B2 (en) | 2011-05-20 | 2016-10-04 | Korea Research Institute Of Bioscience And Biotechnology | Plant disease resistance-inducing gene from soil metagenome and uses thereof |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9074199B1 (en) * | 2013-11-19 | 2015-07-07 | President And Fellows Of Harvard College | Mutant Cas9 proteins |
-
2007
- 2007-09-28 KR KR1020070098109A patent/KR100952754B1/ko not_active IP Right Cessation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9456608B2 (en) | 2011-05-20 | 2016-10-04 | Korea Research Institute Of Bioscience And Biotechnology | Plant disease resistance-inducing gene from soil metagenome and uses thereof |
Also Published As
Publication number | Publication date |
---|---|
KR100952754B1 (ko) | 2010-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DK2271666T3 (da) | Nrps-pks-gengruppe og dens manipulation og anvendelighed | |
CN1277843C (zh) | 分枝杆菌比较基因组学作为鉴定分枝杆菌病的诊断、预防或治疗靶的工具 | |
KR101261870B1 (ko) | 폴리믹신 b 또는 e 생합성 효소 및 이를 코딩하는 유전자 군 | |
CN101784667A (zh) | 来自玉米的次生壁形成基因及其用途 | |
KR20070033979A (ko) | 플라디에놀라이드의 생합성에 관여하는 폴리펩티드를코딩하는 dna | |
AU2022200067A1 (en) | Improved productivity and bioproduct formation in phototropin knock/out mutants in microalgae | |
KR20100039443A (ko) | 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법 | |
KR20100049580A (ko) | 티오펩티드 전구체 단백질, 그를 코딩하는 유전자 및 그의 용도 | |
CN101818158B (zh) | Fr901464的生物合成基因簇 | |
KR100952754B1 (ko) | 토양 메타게놈에서 유래한 항생 활성을 암호화하는유전자군 | |
CN101691575B (zh) | 一种萨菲菌素的生物合成基因簇 | |
CN107794286B (zh) | 一种环脂肽类化合物生物合成基因簇及其激活方法与应用 | |
US20020164747A1 (en) | Gene cluster for ramoplanin biosynthesis | |
AU781788B2 (en) | Insertion sequence element derived from Ralstonia solanacearum | |
CN110857447B (zh) | 提高米尔贝霉素a3/a4或其衍生物产量的方法 | |
KR101189475B1 (ko) | 삼원환 화합물의 생합성을 담당하는 유전자와 단백질 | |
CN113528550B (zh) | 草欧菌素的生物合成基因簇及其应用 | |
CN114807207A (zh) | 一种三氯卡班代谢质粒pDCA-TCC及其应用 | |
CN102517309A (zh) | 一种手霉素类抗生素生物合成基因簇 | |
CN110997700A (zh) | 用于在杀真菌素链霉菌的基因工程菌株中增强恩拉霉素的生产的组合物和方法 | |
KR20140109922A (ko) | 연관된 방선균의 유전적 형질전환을 위한 플라스미드인 액티노플라네스 sp. SE50/110으로부터 유래한 신규한 방선균류 통합 및 접합 인자 | |
CN107164394B (zh) | 一种非典型角环素类化合物nenestatin A的生物合成基因簇及其应用 | |
US20030171562A1 (en) | Genes and proteins for the biosynthesis of polyketides | |
KR102017788B1 (ko) | 밀베마이신 d를 생산하는 재조합 미생물 및 밀베마이신 d 생산 방법 | |
KR101858046B1 (ko) | 토양 메타게놈 유래의 트리클로산 저항성 신규 유전자 FabL-h 및 이의 용도 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment | ||
LAPS | Lapse due to unpaid annual fee |