KR20050010053A - 자일라나제, 이를 암호화하는 핵산, 및 이의 제조 및 사용방법 - Google Patents

자일라나제, 이를 암호화하는 핵산, 및 이의 제조 및 사용방법 Download PDF

Info

Publication number
KR20050010053A
KR20050010053A KR10-2004-7020345A KR20047020345A KR20050010053A KR 20050010053 A KR20050010053 A KR 20050010053A KR 20047020345 A KR20047020345 A KR 20047020345A KR 20050010053 A KR20050010053 A KR 20050010053A
Authority
KR
South Korea
Prior art keywords
seq
nucleic acid
polypeptide
sequence
xylanase
Prior art date
Application number
KR10-2004-7020345A
Other languages
English (en)
Inventor
스티어브라이언
칼렌월터
힐리샤운
헤이즐우드지오프
우디
블럼데이빗
에스테그랄리인알리레자
Original Assignee
다이버사 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 다이버사 코포레이션 filed Critical 다이버사 코포레이션
Publication of KR20050010053A publication Critical patent/KR20050010053A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2477Hemicellulases not provided in a preceding group
    • C12N9/248Xylanases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2477Hemicellulases not provided in a preceding group
    • C12N9/248Xylanases
    • C12N9/2482Endo-1,4-beta-xylanase (3.2.1.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01008Endo-1,4-beta-xylanase (3.2.1.8)
    • DTEXTILES; PAPER
    • D21PAPER-MAKING; PRODUCTION OF CELLULOSE
    • D21CPRODUCTION OF CELLULOSE BY REMOVING NON-CELLULOSE SUBSTANCES FROM CELLULOSE-CONTAINING MATERIALS; REGENERATION OF PULPING LIQUORS; APPARATUS THEREFOR
    • D21C5/00Other processes for obtaining cellulose, e.g. cooking cotton linters ; Processes characterised by the choice of cellulose-containing starting materials
    • D21C5/005Treatment of cellulose-containing material with microorganisms or enzymes
    • DTEXTILES; PAPER
    • D21PAPER-MAKING; PRODUCTION OF CELLULOSE
    • D21HPULP COMPOSITIONS; PREPARATION THEREOF NOT COVERED BY SUBCLASSES D21C OR D21D; IMPREGNATING OR COATING OF PAPER; TREATMENT OF FINISHED PAPER NOT COVERED BY CLASS B31 OR SUBCLASS D21G; PAPER NOT OTHERWISE PROVIDED FOR
    • D21H17/00Non-fibrous material added to the pulp, characterised by its constitution; Paper-impregnating material characterised by its constitution
    • D21H17/005Microorganisms or enzymes
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Paper (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Fodder In General (AREA)

Abstract

본 발명은 자일라나제 및 자일라나제를 암호화하는 폴리뉴크레오티드에 관한 것이다. 또한, 본 발명은 신규 자일라나제의 구성 방법 및 이의 사용 방법도 제공한다. 자일라나제는 증가된 pH 및 온도에서 증가된 활성 및 안정성을 보유한다.

Description

자일라나제, 이를 암호화하는 핵산, 및 이의 제조 및 사용 방법{XYLANASES, NUCLEIC ACIDS ENCODING THEM AND METHODS FOR MAKING AND USING THEM}
자일라나제(예컨대, 엔도-1,4-베타-자일라나제, EC 3.2.1.8)는 자일란 내의 내부 β-1,4-자일로시드계 연결기를 가수분해하여, 보다 작은 분자량의 자일로스 및 자일로-올리고머를 생성시킨다. 자일란은 1,4-β-글리코시드가 연결된 D-자일로피라노즈로부터 형성된 다당류이다. 자일라나제는 상업적 가치가 상당하며, 제빵, 및 과일과 야채 가공을 위한 식품 산업, 농업용 폐기물의 파괴, 동물 사료의 제조 및 펄프 및 종이의 제조에서 사용된다. 자일라나제는 진균류 및 박테리아에 의해형성된다.
아라비노자일라나제는 다양성 및 성장 조건에 따라서 2.5 내지 7.1%w/w를 나타내는 곡류의 주요 비전분 다당류이다. 이 다당류는 산화적 조건 하에서 점성 용액을 생성시키거나, 심지어는 겔화하도록 하는 물리화학적 성질을 가진다. 게다가, 아라비노자일란은 높은 수분결합력을 가지고, 단백질 발포를 안정화시키는 역할을 할 수 있다. 이 모든 특징들은 양조, 제빵, 동물 영양섭취 및 제지를 포함하는 수가지 산업에 있어 문제를 제기한다. 양조 용도에 있어, 자일란의 존재는 맥아즙 여과성 및 헤이즈 형성 관련 문제를 초래한다. 제빵 용도(특히 쿠키 및 크래커의 용도)에 있어, 이 아라비노자일란은 비스킷 크기의 기계화 및 감소화를 어렵게 하는 끈적한 도우를 생성시킨다. 게다가, 이 탄수화물은 바삭거림을 실추시키고 저장 수명을 감소시키는 제빵 제품의 급속한 재함수와 관련이 있다. 곡류 식이법을 이용한 단위 동물의 사료 용도에서, 아라비노자일란은 장 내용물의 점도에 기여하는 주요 인자이기 때문에, 사료의 분해성 및 동물의 성장 속도에 악영향을 준다. 반추 동물의 경우, 이 다당류는 섬유소 섭취의 실질적인 성분을 나타내고, 아라비노자일란의 더욱 완전한 분해(digestion)는 보다 높은 사료 전환 효능을 촉진하게 된다.
자일라나제는 현재 수용성 아라비노자일란의 가수분해를 위한 도우 가공에서 첨가제(도우 컨디셔너)로서 사용된다. 제빵 용도(특히 쿠키 및 크래커 용도)에서, 아라비노자일란은 비스킷 크기의 기계화 및 감소화를 어렵게 하는 끈적한 도우를 생성시킨다. 게다가, 이 탄수화물은 바삭거림을 실추시키고 저장 수명을 감소시키는 제빵 제품의 급속한 재함수와 관련이 있다.
동물 사료에 있어 자일란 분해의 증진은 중요한 탄수화물 및 단백질 사료 영양소의 유용성 및 분해성을 향상시킬 수 있다. 곡류 식이법을 이용한 단위 동물의 사료 용도에서, 아라비노자일란은 장 내용물의 점도에 기여하는 주요 인자이기 때문에, 사료의 분해성 및 동물의 성장 속도에 악영향을 준다. 반추 동물의 경우, 이 다당류는 섬유소 섭취의 실질적인 성분을 나타내고, 아라비노자일란의 더욱 완전한 분해는 보다 높은 사료 전환 효능을 촉진하게 된다. 동물 사료 자일라나제는 동물의 위 내에서 활성적인 것이 바람직하다. 이는 사료 효소가, 37℃에서, 또한 단위 동물의 경우에는 낮은 pH(pH 2 내지 4)에서, 또한 반추 동물의 경우에는 중성 부근의 pH(pH 6.5 내지 7)에서 높은 활성을 가질 것을 요한다. 효소는 또한 동물 장의 자일라나제에 대한 내성, 및 사료 펠릿화와 관련된 고온에서의 안정성을 가져야 한다. 이로써, 당업계에서는 높은 특이적 활성, 35℃ 내지 40℃ 및 pH 2 내지 4에서의 활성, SGF 에서 30분 초과의 반감기 및 제형된 상태에서 85℃에서 5분 초과의 반감기를 가지는 단위동물 사료용 자일라나제 사료 첨가제가 필요하다. 반추동물 사료에서는, 높은 특이적 활성, 35℃ 내지 40℃ 및 pH 6.5 내지 7.0에서의 활성, SRF 에서의 30분 초과의 반감기 및 농축 건조 분말로서의 안정성을 갖는 자일라나제 사료 첨가제가 필요하다.
자일라나제는 또한 수많은 다른 용도들에서도 사용된다. 예를 들어, 자일라나제는 젖소의 우유 단백질 제조에 있어 양질을 향상시키고(예컨대, Kung, L. 등, J. Dairy Science, 2000년 1월, 83: 115-122 참고), 돼지의 위 및 소장에서의 가용성 당류의 양을 증가시키며(예컨대, van der Meulen, J. 등, Arch. Tierernahr,2001 54 : 101-115 참고), 닭의 달걀 생산 효능 및 달걀 수율을 향상시키는데(예컨대, Jaroni, D. 등, Poult. Sci., 1999 June 78: 841-847 참고) 사용된다. 부가적으로, 자일라나제는 화학적 펄프의 생물표백 및 처리(예컨대, U.S. 특허 No. 5,202,249 참고), 목재 또는 종이 펄프의 생물표백 및 처리(예컨대, U.S. 특허 No. 5,179,021, 5,116,746, 5,407,827, 5,405,769, 5,395,765, 5,369,024, 5,457,045, 5,434,071, 5,498,534, 5,591,304, 5,645,686, 5,725,732, 5,759,840, 5,834,301, 5,871,730 및 6,057,438 참고), 목재 내의 리그닌의 감소 및 목재 변형(예컨대, U.S. 특허 No. 5,486,468 및 5,770,012 참고)에 유용하고, 또한 분(flour), 도우 및 빵 향상제로서(예컨대, U.S. 특허 No. 5,108,765 및 5,306,633 참고), 상기 설명된 바와 같은 사료 첨가제 및/또는 보충물로서(예컨대, U.S. 특허 No. 5,432,074, 5,429,828, 5,612,055, 5,720,971, 5,981,233, 5,948,667, 6,099,844, 6,132,727 및 6,132,716) 유용하며, 셀룰로스 용액의 제조(예컨대, U.S. 특허 No. 5,760,211 참고)에 유용한 것으로 나타났다. 자일라나제 활성을 갖는 세제 조성물은 과일, 야채 및/또는 진흙 및 점토 화합물에 유용하다(예컨대, U.S. 특허 No. 5,786, 316 참고).
자일라나제는 또한 콕시듐증의 치료 및/또는 예방 제제를 제조하기 위한, 카르보하이드라제(당질분해효소) 및/또는 자일라나제의 사용 방법 및 조성물에서 유용하다. 제조된 제제는 곡류 기재의 동물 사료의 형태일 수 있다(예컨대, U.S. 특허 No. 5,624,678 참고). 자일라나제의 부가적 용도에는, 수용성 식이 섬유소의 제조(예컨대, U.S. 특허 No. 5,622,738 참고), 전분의 여과성, 분리 및 제조의 향상(예컨대, U.S. 특허 No. 4,960,705 및 5,023,176 참고), 및 음료 산업에서는 맥아즙 또는 맥주의 여과성의 향상(예컨대, U.S. 특허 No. 4,746,517 참고), 효소 조성물에서는 가축의 젖 분비 촉진 및 젖의 품질 향상(예컨대, U.S. 특허 No. 4,144,354 참고), 식물 물질의 점도 감소(예컨대, U.S. 특허 No. 5,874,274), 잼, 마아말레이드, 젤리, 쥬스, 페이스트, 스프, 살사 등과 같은 식품의 점도 또는 겔 강도의 증가(예컨대, U.S. 특허 No. 6,036,981 참고)에서의 용도들이 포함된다. 자일라나제는 또한 특히 셀룰로스의 존재 하에서 그 자일라나제가 선택성을 갖는 헤미셀룰로스의 가수분해에 사용될 수도 있다. 부가적으로, 셀룰라아제 풍부의 농축액(retentate)은 셀룰로스의 가수분해에 적당하다(예컨대, U.S. 특허 No. 4,725,544 참고).
자일라나제의 각종 용도들에는, 에탄올의 제조(예컨대, PCT 출원 No. WO0043496 및 WO8100857 참고), 에탄올을 생성하는 미생물의 형질전환(예컨대, PCT 출원 No. WO99/46362 참고), 포도주양조 탄닌 및 효소계 조성물의 제조(예컨대, PCT 출원 No. WO0164830 참고), 식물의 자연 방어의 자극(예컨대, PCT 출원 No.WO0130161 참고), 헤미셀룰로스 기재로부터의 당 제조(예컨대, PCT 출원 No. WO9203541 참고), 과일, 야채, 진흙 또는 점토 함유 토양의 세정(예컨대, PCT 출원 No. WO9613568 참고), 맥주 여과 막의 세정(예컨대, PCT 출원 No. WO9623579 참고), 미생물 세포의 살생 또는 억제 방법(예컨대, PCT 출원 No. WO9732480 참고) 및 2 가지 UV 흡수 측정값의 비를 이용하여 스펙트럼을 비교함에 의한 목재 펄프 표백으로부터의 가공수의 특성 결정(예컨대, PCT 출원 No. WO9840721 참고)의 용도들이포함된다.
종이 및 펄프 산업에 사용되는 자일라나제에 관해서는, 자일라나제를 많은 원(source)들로부터 분리시켜 왔다. 특히, 이에 대해 U.S. 특허 No. 6,083,733 및 6,140,095 및 6,346,407를 참고로 한다. 특히, U.S. 특허 No. 6,140,095는 알칼리 내성의 자일라나제에 관한 것으로 나타나 있다. 그러나, 당업계에서, 효소가 65℃ 내지 75℃의 온도 범위 및 약 pH 10에서 활성적인 종이 및 펄프 산업에 자일라나제가 사용될 필요가 여전히 있는 것으로 나타나 있다. 부가적으로 종이 및 펄프 산업에서 유용한 본 발명의 효소는 이산화염소와 같은 표백 화학물질의 필요를 감소시킬 것이다.
본원에 논의된 공보들은 본 출원의 출원일 이전에 단지 그 개시 내용만을 위해 제공된 것들이다. 본원에서는 그 어떠한 것도 본원이 종래 발명으로 인해 그와 같은 개시내용을 선행할 수 없도록 하는 승인으로서 간주되지 않도록 한다.
발명의 개요
본 발명은, 적어도 약 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500개, 또는 그 이상의 잔기의 부위 상에서, 본 발명의 예시적 핵산, 예컨대 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19,서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379에 대해, 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%,78%, 79%, 80%, 81%,82%, 83%, 84%, 85%,86%, 87%,88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상, 또는 완전(100%)의 서열 상동성을 갖는 핵산 서열을 포함하는 분리 또는 재조합 핵산으로서, 자일라나제 활성을 갖는 하나 이상의 폴리펩티드를 암호화하는 핵산을 제공하고, 여기에서 서열 상동성은 서열 비교 알고리즘을 이용하는 분석 또는 시각적 조사에 의해 결정된다.
또한 본 발명의 예시적 핵산에는 또한 서열 번호 2, 서열 번호 4, 서열 번호 6, 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18, 서열 번호 20, 서열 번호 22, 서열 번호 24, 서열 번호 26, 서열 번호 28, 서열 번호 30, 서열 번호 32, 서열 번호 34, 서열 번호 36, 서열 번호 38, 서열 번호 40, 서열 번호 42, 서열 번호 44, 서열 번호 46, 서열 번호 48, 서열 번호 50, 서열 번호 52, 서열 번호 54, 서열 번호 56, 서열 번호 58, 서열 번호 60, 서열 번호 62, 서열 번호 64, 서열 번호 66, 서열 번호 68, 서열 번호 70, 서열 번호 72, 서열 번호 74, 서열 번호 76, 서열 번호 78, 서열 번호 80, 서열 번호 82, 서열 번호 84, 서열 번호 86, 서열 번호 88, 서열 번호 90, 서열 번호 92, 서열 번호 94, 서열 번호 96, 서열 번호 98, 서열 번호 100, 서열 번호 102, 서열 번호 104, 서열 번호 106, 서열 번호 108, 서열 번호 110, 서열 번호 112, 서열 번호 114, 서열 번호 116, 서열 번호 118, 서열 번호 120, 서열 번호 122, 서열 번호 124, 서열 번호 126, 서열 번호 128, 서열 번호 130, 서열 번호 132, 서열 번호 134, 서열 번호 136, 서열 번호 138, 서열 번호 140, 서열 번호 142, 서열 번호 144, 서열 번호 146, 서열 번호 148, 서열 번호 150, 서열 번호 152, 서열 번호 154, 서열 번호 156, 서열 번호 158, 서열 번호 160, 서열 번호 162, 서열 번호 164, 서열 번호 166, 서열 번호 168, 서열 번호 170, 서열 번호 172, 서열 번호 174, 서열 번호176, 서열 번호 178, 서열 번호 180, 서열 번호 182, 서열 번호 184, 서열 번호 186, 서열 번호 188, 서열 번호 190, 서열 번호 192, 서열 번호 194, 서열 번호 196, 서열 번호 198, 서열 번호 200, 서열 번호 202, 서열 번호 204, 서열 번호 206, 서열 번호 208, 서열 번호 210, 서열 번호 212, 서열 번호 214, 서열 번호 216, 서열 번호 218, 서열 번호 220, 서열 번호 222, 서열 번호 224, 서열 번호 226, 서열 번호 228, 서열 번호 230, 서열 번호 232, 서열 번호 234, 서열 번호 236, 서열 번호 23 8, 서열 번호 240, 서열 번호 242, 서열 번호 244, 서열 번호 246, 서열 번호 248, 서열 번호 250, 서열 번호 252, 서열 번호 254, 서열 번호 256, 서열 번호 258, 서열 번호 260, 서열 번호 262, 서열 번호 264, 서열 번호 266, 서열 번호 268, 서열 번호 270, 서열 번호 272, 서열 번호 274, 서열 번호 276, 서열 번호 278, 서열 번호 280, 서열 번호 282, 서열 번호 284, 서열 번호 286, 서열 번호 288, 서열 번호 290, 서열 번호 292, 서열 번호 294, 서열 번호 296, 서열 번호 298, 서열 번호 300, 서열 번호 302, 서열 번호 304, 서열 번호 306, 서열 번호 308, 서열 번호 310, 서열 번호 312, 서열 번호 314, 서열 번호 316, 서열 번호 318, 서열 번호 320, 서열 번호 322, 서열 번호 324, 서열 번호 326, 서열 번호 328, 서열 번호 330, 서열 번호 332, 서열 번호 334, 서열 번호 336, 서열 번호 338, 서열 번호 340, 서열 번호 342, 서열 번호 334, 서열 번호 336, 서열 번호 338, 서열 번호 340, 서열 번호 342, 서열 번호 344, 서열 번호 346, 서열 번호 348, 서열 번호 350, 서열 번호 352, 서열 번호 354, 서열 번호 356, 서열 번호 358, 서열 번호 360, 서열 번호 362, 서열 번호 364, 서열 번호366, 서열 번호 368, 서열 번호 370, 서열 번호 372, 서열 번호 374, 서열 번호 376, 서열 번호 378 또는 서열 번호 380에 표시되는 서열, 및 그것의 서브서열을 갖는 폴리펩티드를 암호화하는 분리 또는 재조합 핵산 및 그것의 변이체도 포함된다. 한 측면에서, 폴리펩티드는 자일라나제 활성을 가진다.
한 측면에서, 본 발명은 또한 혼합 배양물로부터 유도된다는 공통된 신규성을 갖는 자일라나제를 암호화하는 핵산을 제공한다. 본 발명은, 적어도 약 50, 75, 100, 150, 200,250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150개 또는 그 이상의 서열 부위 상에서, 본 발명의 예시적 핵산, 예컨대 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 655 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 or 서열 번호 379에 대해, 적어도 약 10, 15, 20, 25, 30, 35, 40, 45, 50%, 51%, 52%,53%, 54%, 55%, 56%, 57%, 58%,59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%,82%, 83%,84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%,94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상, 또는 완전한(100%) 서열 상동성을 갖는 핵산 서열을 포함하는 혼합 배양물로부터 분리된 자일라나제를 암호화하는 핵산을 제공한다.
한 측면에서, 본 발명은 또한 환경적 원(source), 예컨대 혼합된 환경적 원, 박테리아 원 및/또는 원시세균 원으로부터 유도된다는 공통된 신규성을 갖는 자일라나제를 암호화하는 핵산을 제공하며, 이에 대해 표 3을 참고로 한다. 한 측면에서, 본 발명은 환경적 원, 예컨대 혼합된 환경적 원, 박테리아 원 및/또는 원시세균 원으로부터 분리된 자일라나제를 암호화하는 핵산으로서, 적어도 약 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200개 또는 그 이상의 잔기의 부위 상에서, 본 발명의 예시적 핵산에 대해, 적어도 약 10, 15, 20, 25, 30, 35, 40, 45, 50%, 51%, 52%, 53%,54%, 55%, 56%,57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%,66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%,82%, 83%, 84%, 85%, 86%, 87%,88%,89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%,98%, 99%, 또는 그 이상, 또는 완전한(100%) 서열 상동성을 갖는 핵산 서열을 포함하는 핵산을 제공하며, 여기에서 그 핵산은 자일라나제 활성을 갖는 하나 이상의 폴리펩티드를 암호화하고, 서열 상동성은 서열 비교 알고리즘을 이용하는 분석 또는 시각적 조사에 의해 결정된다.
한 측면에서, 본 발명은 또한 공통적인 글리코시다아제 부류, 예컨대 이하 표 5에 나와 있는 부류 5, 6, 8, 10, 11, 26 또는 30으로부터 유도된다는 공통된 신규성을 갖는 자일라나제를 암호화하는 핵산도 제공한다.
한 측면에서, 서열 비교 알고리즘은, 필터링 세팅은 -p blastp -d "nr pataa" -FF로 블라스트값을 설정하고, 다른 모든 옵션은 디폴트값으로 설정하는 BLAST 버전 2.2.2 알고리즘이다.
본 발명의 또 다른 측면은, 본 발명의 핵산 서열, 그와 실질적으로 동일한 서열 및 그것과 상보적인 서열의 10개 이상의 연속 염기들을 포함하는 분리 또는 재조합 핵산이다.
한 측면에서, 자일라나제 활성은 내부 β-l,4-자일로시드계 연결기의 가수분해에서 촉매 작용하는 것을 포함한다. 한 측면에서, 자일라나제 활성은 엔도-1,4-베타-자일라나제 활성을 포함한다.
한 측면에서, 자일라나제 활성은 자일란을 가수분해하여 보다 작은 분자량의 자일로스 및 자일로-올리고머를 생성하는 것을 포함한다. 한 측면에서, 자일란은수용성 아라비노자일란과 같은 아라비노자일란을 포함한다. 수용성 아라비노자일란은 반죽 또는 빵류 제품을 포함할 수 있다.
한 측면에서, 자일라나제 활성은 1,4-β-글리코시드가 연결된 D-자일로피라노즈를 포함하는 다당류를 가수분해하는 것을 포함한다. 한 측면에서, 자일라나제 활성은 헤미셀룰로스를 가수분해하는 것을 포함한다. 한 측면에서, 자일라나제 활성은 목재 또는 종이 펄프 또는 종이 제품에서 헤미셀룰로스를 가수분해하는 것을 포함한다. 한 측면에서, 본 발명은 목재 또는 목재품을 본 발명의 폴리펩티드와 접촉시키는 것을 포함하는 목재 또는 목재품 내의 리그닌을 감소시키는 방법을 제공한다.
한 측면에서, 자일라나제 활성은 음료 또는 사료 또는 식품 내의 자일란의 가수분해에 촉매작용하는 것을 포함한다. 사료 또는 식품은 곡류 기재의 동물 사료, 맥아즙 또는 맥주, 우유 또는 유제품, 과일 또는 야채를 포함할 수 있다. 한 측면에서, 본 발명은 본 발명의 폴리펩티드를 포함하는 식품, 사료 또는 음료 또는 음료 전구체를 제공한다. 식품은 반죽 또는 빵류 제품일 수 있다. 음료 또는 음료 전구체는 맥주 또는 맥아즙일 수 있다.
한 측면에서, 본 발명은 도우의 컨디셔닝에 충분한 조건 하에, 반죽 또는 빵류 제품을 본 발명의 하나 이상의 폴리펩티드와 접촉시키는 것을 포함하는 도우의 컨디셔닝 방법을 제공한다. 한 측면에서, 본 발명은 음료의 점도를 감소시키기에 충분한 조건 하에 음료 또는 음료 전구체에 본 발명의 폴리펩티드를 투여하는 것을 포함하는 음료의 제조 방법을 제공한다.
한 측면에서, 자일라나제 활성은 세포, 예컨대 식물 세포 또는 미생물 세포 내에서의 자일란의 가수분해에 촉매작용하는 것을 포함한다.
한 측면에서, 분리 또는 재조합 핵산은 열안정성의 자일라나제 활성을 갖는 폴리펩티드를 암호화한다. 폴리펩티드는 약 37℃ 내지 약 95℃, 약 55℃ 내지 약 85℃, 약 70℃ 내지 약 95℃, 또는 약 90℃ 내지 약 95℃의 온도 범위를 포함하는 조건 하에서 자일라나제 활성을 가질 수 있다.
또 다른 한 측면에서, 분리 또는 재조합 핵산은 내열성의 자일라나제 활성을 갖는 폴리펩티드를 암호화한다. 폴리펩티드는 37℃초과 내지 약 95℃범위의 온도, 또는 55℃초과 내지 약 85℃의 범위 내 임의의 온도에 노출된 후, 자일라나제 활성을 가질 수 있다. 폴리펩티드는 약 1℃ 내지 약 5℃, 약 5℃ 내지 약 15℃, 약 15℃ 내지 약 25℃, 약 25℃ 내지 약 37℃, 약 37℃ 내지 약 95℃의 범위, 약 55℃ 내지 약 85℃, 약 70℃ 내지 약 75℃, 또는 약 90℃ 내지 약 95℃, 또는 그 이상의 온도에 노출된 후에 자일라나제 활성을 가질 수 있다. 한 측면에서, 폴리펩티드는 pH 4.5에서 90℃초과 내지 약 95℃범위의 온도에 노출된 후, 자일라나제 활성을 보유한다.
본 발명은, 본 발명의 서열, 예컨대 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 2 1, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 13 5, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379에 표시되는 서열, 또는 그것의 절편 또는 서브서열을 포함하는 핵산에 대해 엄격한 조건 하에서 하이브리드화하는 서열을 포함하는 분리 또는 재조합 핵산을 제공한다. 한 측면에서, 핵산은 자일라나제 활성을 갖는 폴리펩티드를 암호화한다. 핵산은 적어도 약 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200개 또는 그 이상 잔기들의 길이, 또는 유전자 또는 전사체의 총길이를 가질 수 있다. 한 측면에서, 엄격한 조건은 약 15분간 약 65℃의 온도에서 0.2X SSC에서의 세척을 포함하는 세척 단계를포함한다.
본 발명은 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산을 동정하기 위한 핵산 프로브로서, 본 발명의 서열, 또는 그것의 절편 또는 서브서열의 적어도 약 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000개 또는 그 이상의 연속 염기를 포함하고, 결합 또는 하이브리드화에 의해 핵산을 동정하는 핵산 프로브를 제공한다. 프로브는 본 발명의 서열, 또는 그것의 절편 또는 서브서열을 포함하는 서열의 적어도 약 10 내지 50, 약 20 내지 60, 약 30 내지 70, 약 40 내지 80, 또는 약 60 내지 100의 연속 염기들을 포함하는 올리고뉴클레오티드를 포함할 수 있다.
본 발명은, 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산을 동정하기 위한 핵산 프로브로서, 본 발명의 핵산에 대해, 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%,69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%,82%,83%, 84%, 85%, 86%,87%,88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%,98%, 99%, 또는 그 이상, 또는 완전한(100%) 서열 상동성을 갖는, 적어도 약 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000개 또는 그 이상의 잔기를 갖는 서열을 포함하는 핵산을 포함하는 프로브를 제공하며, 여기에서 서열 상동성은 서열 비교 알고리즘을 이용하는 분석 또는 시각적 조사에 의해 결정된다.
프로브는 본 발명의 핵산 서열 또는 그것의 서브서열의 적어도 약 10 내지 50, 약 20 내지 60, 약 30 내지 70, 약 40 내지 80, 또는 약 60 내지 100의 연속 염기를 갖는 올리고뉴클레오티드를 포함할 수 있다.
본 발명은 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산을 증폭시키기 위한 증폭 프라이머 쌍으로서, 본 발명의 서열, 또는 그것의 절편을 포함하는 핵산을 증폭시킬 수 있는 증폭 프라이머 쌍을 제공한다. 증폭 프라이머 서열 쌍의 하나 또는 각 원은 서열의 적어도 약 10 내지 50개의 연속 염기, 또는 서열의 약 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30개 또는 그 이상의 연속 염기를 포함하는 올리고뉴클레오티드를 포함할 수 있다.
본 발명은 본 발명의 핵산의 대략 처음의(즉, 5' 말단으로부터) 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30개 또는 그 이상의 잔기에 의해 표시되는 서열을 갖는 제1 원, 및 그 제1 원의 상보 가닥의 대략 처음의(즉, 5' 말단으로부터) 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30개 또는 그 이상의 잔기에 의해 나타나는 서열을 갖는 제2 원을 포함하는 프라이머 쌍을 제공한다.
본 발명은, 본 발명의 증폭 프라이머 쌍을 이용하는, 증폭, 예컨대 폴리머라아제 연쇄 반응(PCR)에 의해 발생되는 자일라나제를 암호화하는 핵산을 제공한다. 본 발명은, 본 발명의 증폭 프라이머 쌍을 이용하는, 증폭, 예컨대 폴리머라아제 연쇄 반응(PCR)에 의해 발생되는 자일라나제를 제공한다. 본 발명은, 본 발명의 증폭 프라이머 쌍을 이용하는, 증폭, 예컨대 폴리머라아제 연쇄 반응(PCR)에 의한 자일라나제의 제조 방법을 제공한다. 한 측면에서, 증폭 프라이머 쌍은 라이브러리, 예컨대 환경적 라이브러리와 같은 유전자 라이브러리로부터 핵산을 증폭시킨다.
본 발명은, 본 발명의 핵산 서열, 또는 그것의 절편 또는 서브서열을 증폭시킬 수 있는 증폭 프라이머 서열 쌍을 이용하여, 주형 핵산을 증폭시키는 것을 포함하는, 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산의 증폭 방법을 제공한다.
본 발명은 본 발명의 핵산 또는 그것의 서브서열을 포함하는 발현 카세트를 제공한다. 한 측면에서, 발현 카세트 는 프로모터에 작동적으로 연결되는 핵산을 포함할 수 있다. 프로모터는 바이러스, 박테리아, 포유동물 또는 식물의 프로모터일 수 있다. 한 측면에서, 식물 프로모터는 감자, 벼, 옥수수, 밀, 담배 또는 보리 프로모터일 수 있다. 프로모터는 구성 프로모터일 수 있다. 구성 프로모터는 CaMV35S를 포함할 수 있다. 또 다른 측면에서, 프로모터는 유도성 프로모터일 수 있다. 한 측면에서, 프로모터는 조직-특이적 프로모터, 또는 환경적 제어 또는 발달적 제어 프로모터일 수 있다. 이에 따라, 프로모터는 예를 들어 씨-, 잎-, 뿌리-, 줄기-특이적 또는 이탈-유도적 프로모터일 수 있다. 한 측면에서, 발현 카세트는 식물 또는 식물 바이러스 발현 벡터를 추가로 포함할 수 있다.
본 발명은 본 발명의 발현 카세트(예컨대, 벡터) 또는 본 발명의 핵산을 포함하는 클로닝 비히클을 제공한다. 클로닝 비히클은 바이러스 벡터, 플라스미드, 파지, 파지미드, 코스미드, 포스미드, 박테리오파지 또는 인공 염색체일 수 있다. 바이러스 벡터는 아데노바이러스 벡터, 레트로바이러스 벡터 또는 아데노-관련 바이러스 벡터를 포함할 수 있다. 클로닝 비히클은 박테리아 인공 염색체(BAC), 플라스미드, 박테리오파지 P-1 유도 벡터(PAC), 효모 인공 염색체(YAC), 또는 포유동물 인공 염색체(MAC)를 포함할 수 있다.
본 발명은 본 발명의 핵산 또는 본 발명의 발현 카세트(예컨대, 벡터) 또는 본 발명의 클로닝 비히클을 포함하는 형질전환된 세포를 제공한다. 한 측면에서, 형질전환된 세포는 박테리아 세포, 포유동물 세포, 진균류 세포, 효모 세포, 곤충 세포 또는 식물 세포일 수 있다. 한 측면에서, 식물 세포는 곡류, 감자, 밀, 벼, 옥수수, 담배 또는 보리 세포일 수 있다.
본 발명은 본 발명의 핵산 또는 본 발명의 발현 카세트(예컨대, 벡터)를 포함하는 유전자이식 비인간 동물을 제공한다. 한 측면에서, 동물은 마우스이다.
본 발명은 본 발명의 핵산 본 발명의 발현 카세트(예컨대, 벡터)를 포함하는 유전자이식 식물을 제공한다. 유전자이식 식물은 곡류 식물, 옥수수 식물, 감자 식물, 토마토 식물, 밀 식물, 유종자 식물, 평지씨 식물, 대두 식물, 벼 식물, 보리 식물 또는 담배 식물일 수 있다.
본 발명은 본 발명의 핵산 본 발명의 발현 카세트(예컨대, 벡터)를 포함하는 유전자이식 씨를 제공한다. 유전자이식 씨는 곡류 식물, 옥수수 씨, 밀 커넬(낟알), 유종자, 평지씨, 대두 씨, 팜 커넬, 해바라기 씨, 참깨 씨, 땅콩 또는 담배 식물 씨일 수 있다.
본 발명은 본 발명의 핵산에 대해 상보적이거나 그것에 대해 엄격한 조건 하에 하이브리드화할 수 있는 핵산 서열을 포함하는 안티센스 올리고뉴클레오티드를제공한다. 본 발명은 본 발명의 핵산에 대해 상보적이거나 그것에 대해 엄격한 조건 하에 하이브리드화할 수 있는 핵산 서열을 포함하는 안티센스 올리고뉴클레오티드를 세포에 투여하거나 그것을 세포 내에서 발현시키는 것을 포함하는, 세포 내의 자일라나제 메시지의 번역을 억제하는 방법을 제공한다. 한 측면에서, 안티센스 올리고뉴클레오티드는 약 10 내지 50개, 약 20 내지 60개, 약 30 내지 70개, 약 40 내지 80개, 또는 약 60 내지 100개의 염기의 길이를 가질 수 있다.
본 발명은 본 발명의 핵산에 대해 상보적이거나 그것에 대해 엄격한 조건 하에 하이브리드화할 수 있는 핵산 서열을 포함하는 안티센스 올리고뉴클레오티드를 세포에 투여하거나 그것을 세포 내에서 발현시키는 것을 포함하는, 세포 내의 자일라나제 메시지의 번역을 억제하는 방법을 제공한다. 본 발명은 본 발명의 서열의 서브서열을 포함하는 이중가닥의 억제 RNA(RNAi) 분자를 제공한다. 한 측면에서, RNAi은 약 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25개 또는 그 이상의 이중구조 뉴클레오티드의 길이를 가진다. 본 발명은 이중가닥의 억제 RNA(iRNA)를 세포에 투여하거나, 그것을 세포 내에서 발현시키는 것을 포함하는, 세포 내의 자일라나제의 발현을 억제하는 방법을 제공하며, 여기에서 RNA는 본 발명의 서열의 서브서열을 포함한다.
본 발명은 적어도 약 25, 50, 75, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350개 또는 그 이상의 잔기의 부위 상에서, 또는 폴리펩티드의 전체 길이 상에서, 본 발명의 예시적 폴리펩티드 또는 펩티드에 대해, 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%,66%, 67%, 68%,69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상, 또는 완전한(100%) 서열 상동성을 갖는 아미노산 서열을 포함하는 분리 또는 재조합 폴리펩티드를 제공하며, 서열 상동성은 서열 비교 알고리즘을 이용하는 분석 또는 시각적 조사에 의해 결정된다. 본 발명의 예시적 폴리펩티드 또는 펩티드 서열에는, 서열 번호 2, 서열 번호 4, 서열 번호 6, 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18, 서열 번호 20, 서열 번호 22, 서열 번호 24, 서열 번호 26, 서열 번호 28, 서열 번호 30, 서열 번호 32, 서열 번호 34, 서열 번호 36, 서열 번호 38, 서열 번호 40, 서열 번호 42, 서열 번호 44, 서열 번호 46, 서열 번호 48, 서열 번호 50, 서열 번호 52, 서열 번호 54, 서열 번호 56, 서열 번호 58, 서열 번호 60, 서열 번호 62, 서열 번호 64, 서열 번호 66, 서열 번호 68, 서열 번호 70, 서열 번호 72, 서열 번호 74, 서열 번호 76, 서열 번호 78, 서열 번호 80, 서열 번호 82, 서열 번호 84, 서열 번호 86, 서열 번호 88, 서열 번호 90, 서열 번호 92, 서열 번호 94, 서열 번호 96, 서열 번호 98, 서열 번호 100, 서열 번호 102, 서열 번호 104, 서열 번호 106, 서열 번호 108, 서열 번호 110, 서열 번호 112, 서열 번호 114, 서열 번호 116, 서열 번호 118, 서열 번호 120, 서열 번호 122, 서열 번호 124, 서열 번호 126, 서열 번호 128, 서열 번호 130, 서열 번호 132, 서열 번호 134, 서열 번호 136, 서열 번호 138, 서열 번호 140, 서열 번호 142, 서열 번호 144, 서열 번호 146, 서열 번호 148, 서열 번호 150, 서열 번호 152, 서열 번호 154, 서열 번호156, 서열 번호 158, 서열 번호 160, 서열 번호 162, 서열 번호 164, 서열 번호 166, 서열 번호 168, 서열 번호 170, 서열 번호 172, 서열 번호 174, 서열 번호 176, 서열 번호 178, 서열 번호 180, 서열 번호 182, 서열 번호 184, 서열 번호 186, 서열 번호 188, 서열 번호 190, 서열 번호 192, 서열 번호 194, 서열 번호 196, 서열 번호 198, 서열 번호 200, 서열 번호 202, 서열 번호 204, 서열 번호 206, 서열 번호 208, 서열 번호 210, 서열 번호 212, 서열 번호 214, 서열 번호 216, 서열 번호 218, 서열 번호 220, 서열 번호 222, 서열 번호 224, 서열 번호 226, 서열 번호 228, 서열 번호 230, 서열 번호 232, 서열 번호 234, 서열 번호 236, 서열 번호 238, 서열 번호 240, 서열 번호 242, 서열 번호 244, 서열 번호 246, 서열 번호 248, 서열 번호 250, 서열 번호 252, 서열 번호 254, 서열 번호 256, 서열 번호 258, 서열 번호 260, 서열 번호 262, 서열 번호 264, 서열 번호 266, 서열 번호 268, 서열 번호 270, 서열 번호 272, 서열 번호 274, 서열 번호 276, 서열 번호 278, 서열 번호 280, 서열 번호 282, 서열 번호 284, 서열 번호 286, 서열 번호 288, 서열 번호 290, 서열 번호 292, 서열 번호 294, 서열 번호 296, 서열 번호 298, 서열 번호 300, 서열 번호 302, 서열 번호 304, 서열 번호 306, 서열 번호 308, 서열 번호 310, 서열 번호 312, 서열 번호 314, 서열 번호 316, 서열 번호 318, 서열 번호 320, 서열 번호 322, 서열 번호 324, 서열 번호 326, 서열 번호 328, 서열 번호 330, 서열 번호 332, 서열 번호 334, 서열 번호 336, 서열 번호 338, 서열 번호 340, 서열 번호 342, 서열 번호 344, 서열 번호 346, 서열 번호 348, 서열 번호 350, 서열 번호 352, 서열 번호 354, 서열 번호356, 서열 번호 358, 서열 번호 360, 서열 번호 362, 서열 번호 364, 서열 번호 366, 서열 번호 368, 서열 번호 370, 서열 번호 372, 서열 번호 374, 서열 번호 376, 서열 번호 378 또는 서열 번호 380, 및 그것의 서브서열 및 그것의 변이체가 포함된다. 예시적 폴리펩티드에는 또한 적어도 약 10,15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600개 또는 그 이상의 잔기들의 길이, 또는 효소의 총길이를 갖는 절편이 포함된다. 본 발명의 예시적 폴리펩티드 또는 펩티드 서열에는 본 발명의 핵산에 의해 암호화된 서열이 포함된다. 본 발명의 예시적 폴리펩티드 또는 펩티드 서열에는 본 발명의 항체에 의해 특이적으로 결합된 폴리펩티드 또는 펩티드가 포함된다. 한 측면에서, 본 발명의 폴리펩티드는 하나 이상의 자일라나제 활성을 가진다.
본 발명의 또 다른 측면은, 본 발명의 폴리펩티드 또는 펩티드 서열, 그것과 실질적으로 동일한 서열, 및 그것과 상보적인 서열의 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 100개, 또는 그 이상의 연속 염기를 포함하는 분리 또는 재조합 폴리펩티드 또는 펩티드를 제공한다. 펩티드는 예컨대 면역원성 절편, 모티브(예컨대, 결합 부위), 시그널 서열, 프리프로 서열 또는 활성 부위일 수 있다.
본 발명은 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 서열, 및 시그널 서열을 포함하는 분리 또는 재조합 핵산으로서, 본 발명의 서열을 포함하는 핵산을 제공한다. 시그널 서열은 또 다른 자일라나제 또는 비-자일라나제(이종) 효소로부터 유도될 수 있다. 본 발명은 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 서열을 포함하는 분리 또는 재조합 핵산으로서, 서열이 시그널 서열을 함유하지 않고 핵산이 본 발명의 서열을 포함하는 분리 또는 재조합 핵산을 제공한다.
한 측면에서, 자일라나제 활성은 내부 β-1,4-자일로시드계 연결기의 가수분해에서 촉매 작용하는 것을 포함한다. 한 측면에서, 자일라나제 활성은 엔도-1,4-베타-자일라나제 활성을 포함한다. 한 측면에서, 자일라나제 활성은 자일란을 가수분해하여, 보다 작은 분자량의 자일로스 및 자일로-올리고머를 생성시키는 것을 포함한다. 한 측면에서, 자일란은 수용성 아라비노자일란과 같은 아라비노자일란을 포함한다. 수용성 아라비노자일란은 반죽 또는 빵류 제품을 포함할 수 있다.
한 측면에서, 자일라나제 활성은 1,4-β-글리코시드가 연결된 D-자일로피라노즈를 포함하는 다당류의 가수분해를 포함한다. 한 측면에서, 자일라나제 활성은 헤미셀룰로스의 가수분해를 포함한다. 한 측면에서, 자일라나제 활성은 목재 또는 종이 펄프 또는 종이 제품 내의 헤미셀룰로스의 가수분해를 포함한다.
한 측면에서, 자일라나제 활성은 사료 또는 식품 내의 자일란의 가수분해에 촉매작용하는 것을 포함한다. 사료 또는 식품은 곡류 기재의 동물 사료, 맥아즙 또는 맥주, 우유 또는 유제품, 과일 또는 야채를 포함할 수 있다.
한 측면에서, 자일라나제 활성은 세포, 예컨대 식물 세포 또는 미생물 세포에 내의 자일란의 가수분해에 촉매작용하는 것을 포함한다.
한 측면에서, 자일라나제 활성은 열 안정성을 가진다. 폴리펩티드는 약 1℃ 내지 약 5℃, 약 5℃ 내지 약 15℃, 약 15℃ 내지 약 25℃, 약 25℃ 내지 약 37℃, 약 37℃ 내지 약 95℃, 약 55℃ 내지 약 85℃, 약 70℃ 내지 약 75℃, 또는 약 90℃ 내지 약 95℃, 또는 그 이상의 온도 범위를 포함하는 조건 하에서 자일라나제 활성을 보유할 수 있다. 또 다른 한 측면에서, 자일라나제 활성 내열성을 가질 수 있다. 폴리펩티드는 37℃초과 내지 약 95℃, 또는 55℃초과 내지 약 85℃범위의 온도에 노출된 후에 자일라나제 활성을 보유할 수 있다. 한 측면에서, 폴리펩티드는 pH 4.5에서 90℃초과 내지 약 95℃범위의 온도에 노출된 후에 자일라나제 활성을 보유할 수 있다.
한 측면에서, 분리 또는 재조합 폴리펩티드는 시그널 서열이 결여된 본 발명의 폴리펩티드를 포함할 수 있다. 한 측면에서, 분리 또는 재조합 폴리펩티드는 이종 자일라나제 또는 비-자일라나제 시그널 서열과 같은 이종 시그널 서열을 포함하는 본 발명의 폴리펩티드를 포함할 수 있다.
한 측면에서, 본 발명은 본 발명의 시그널 서열을 포함하는 제1 도메인 및 적어도 제2 도메인을 포함하는 키메라 단백질을 제공한다. 그 단백질은 융합 단백질일 수 있다. 제2 도메인은 효소를 포함할 수 있다. 효소는 자일라나제일 수 있다.
본 발명은 본 발명의 신호 펩티드(SP), 프리프로 서열 및/또는 촉매적 도메인(CD)을 포함하는 제1 도메인, 및 이종 폴리펩티드 또는 펩티드를 포함하는 적어도 제2 도메인을 포함하는 키메라 폴리펩티드로서, 상기 이종 폴리펩티드 또는 펩티드가 신호 펩티드(SP), 프리프로 서열 및/또는 촉매적 도메인(CD) 과 본래 연합되지 않는 키메라 폴리펩티드를 제공한다. 한 측면에서, 이종 폴리펩티드 또는 펩티드는 자일라나제가 아니다. 이종 폴리펩티드 또는 펩티드는 신호 펩티드(SP), 프리프로 서열 및/또는 촉매적 도메인(CD)의 양 말단에 있거나, 그에 대해 아미노 말단 또는 카르복시 말단일 수 있다.
본 발명은 키메라 폴리펩티드를 암호화하는 분리 또는 재조합 핵산으로서, 키메라 폴리펩티드가 본 발명의 신호 펩티드(SP), 프리프로 서열 및/또는 촉매적 도메인(CD)을 포함하는 제1 도메인, 및 이종 폴리펩티드 또는 펩티드를 포함하는 적어도 제2 도메인을 포함하고, 이종 폴리펩티드 또는 펩티드가 신호 펩티드(SP), 프리프로 서열 및/또는 촉매적 도메인(CD) 과 본래 연합되지 않는 분리 또는 재조합 핵산을 제공한다.
본 발명은 본 발명의 폴리펩티드의 잔기 1 내지 14, 1 내지 15, 1 내지 16, 1 내지 17, 1 내지 18, 1 내지 19, 1 내지 20, 1 내지 21, 1 내지 22, 1 내지 23, 1 내지 24, 1 내지 25, 1 내지 26, 1 내지 27, 1 내지 28, 1 내지 28, 1 내지 30, 1 내지 31, 1 내지 32, 1 내지 33, 1 내지 34, 1 내지 35, 1 내지 36, 1 내지 37, 1 내지 38, 1 내지 40, 1 내지 41, 1 내지 42, 1 내지 43 또는 1 내지 44에 표시되는 서열, 예컨대, 서열 번호 2, 서열 번호 4, 서열 번호 6, 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18, 서열 번호 20, 서열 번호 22, 서열 번호 24, 서열 번호 26, 서열 번호 28, 서열 번호 30, 서열 번호 32, 서열 번호 34, 서열 번호 36, 서열 번호 38, 서열 번호 40, 서열 번호 42, 서열 번호 44, 서열 번호 46, 서열 번호 48, 서열 번호 50, 서열 번호 52, 서열 번호 54, 서열 번호 56, 서열 번호 58, 서열 번호 60, 서열 번호 62, 서열 번호 64, 서열 번호 66, 서열 번호 68, 서열 번호 70, 서열 번호 72, 서열 번호 74, 서열 번호 76, 서열 번호 78, 서열 번호 80, 서열 번호 82, 서열 번호 84, 서열 번호 86, 서열 번호 88, 서열 번호 90, 서열 번호 92, 서열 번호 94, 서열 번호 96, 서열 번호 98, 서열 번호 100, 서열 번호 102, 서열 번호 104, 서열 번호 106, 서열 번호 108, 서열 번호 110, 서열 번호 112, 서열 번호 114, 서열 번호 116, 서열 번호 118, 서열 번호 120, 서열 번호 122, 서열 번호 124, 서열 번호 126, 서열 번호 128, 서열 번호 130, 서열 번호 132, 서열 번호 134, 서열 번호 136, 서열 번호 138, 서열 번호 140, 서열 번호 142, 서열 번호 144, 서열 번호 146, 서열 번호 148, 서열 번호 150, 서열 번호 152, 서열 번호 154, 서열 번호 156, 서열 번호 158, 서열 번호 160, 서열 번호 162, 서열 번호 164, 서열 번호 166, 서열 번호 168, 서열 번호 170, 서열 번호 172, 서열 번호 174, 서열 번호 176, 서열 번호 178, 서열 번호 180, 서열 번호 182, 서열 번호 184, 서열 번호 186, 서열 번호 188, 서열 번호 190, 서열 번호 192, 서열 번호 194, 서열 번호 196, 서열 번호 198, 서열 번호 200, 서열 번호 202, 서열 번호 204, 서열 번호 206, 서열 번호 208, 서열 번호 210, 서열 번호 212, 서열 번호 214, 서열 번호 216, 서열 번호 218, 서열 번호 220, 서열 번호 222, 서열 번호 224, 서열 번호 226, 서열 번호 228, 서열 번호 230, 서열 번호 232, 서열 번호 234, 서열 번호 236, 서열 번호 238, 서열 번호 240, 서열 번호 242, 서열 번호 244, 서열 번호 246, 서열 번호 248, 서열 번호 250, 서열 번호 252, 서열 번호 254, 서열 번호 256, 서열 번호 258, 서열 번호 260, 서열 번호 262, 서열 번호 264, 서열 번호 266, 서열 번호 268, 서열 번호 270, 서열 번호 272, 서열 번호 274, 서열 번호 276, 서열 번호278, 서열 번호 280, 서열 번호 282, 서열 번호 284, 서열 번호 286, 서열 번호 288, 서열 번호 290, 서열 번호 292, 서열 번호 294, 서열 번호 296, 서열 번호 298, 서열 번호 300, 서열 번호 302, 서열 번호 304, 서열 번호 306, 서열 번호 308, 서열 번호 310, 서열 번호 312, 서열 번호 314, 서열 번호 316, 서열 번호 318, 서열 번호 320, 서열 번호 322, 서열 번호 324, 서열 번호 326, 서열 번호 328, 서열 번호 330, 서열 번호 332, 서열 번호 334, 서열 번호 336, 서열 번호 338, 서열 번호 340, 서열 번호 342, 서열 번호 344, 서열 번호 346, 서열 번호 348, 서열 번호 350, 서열 번호 352, 서열 번호 354, 서열 번호 356, 서열 번호 358, 서열 번호 360, 서열 번호 362, 서열 번호 364, 서열 번호 366, 서열 번호 368, 서열 번호 370, 서열 번호 372, 서열 번호 374, 서열 번호 376, 서열 번호 378 또는 서열 번호 380으로 구성된 분리 또는 재조합 시그널 서열(예컨대, 신호 펩티드)을 제공한다.
한 측면에서, 자일라나제 활성은 약 37℃에서 약 1 내지 약 1200 단위/단백질 mg 범위, 또는 약 100 내지 약 1000 단위/단백질 mg 범위의 특이적 활성을 포함한다. 또 다른 한 측면에서, 자일라나제 활성은 약 100 내지 약 1000 단위/단백질 mg 범위, 또는 약 500 내지 약 750 단위/단백질 mg 범위의 특이적 활성을 포함한다. 대안적으로, 자일라나제 활성은 37℃에서 약 1 내지 약 750 단위/단백질 mg 범위, 또는 약 500 내지 약 1200 단위/단백질 mg 범위의 특이적 활성을 포함한다. 한 측면에서, 자일라나제 활성은 37℃에서 약 1 내지 약 500 단위/단백질 mg 범위, 또는 약 750 내지 약 1000 단위/단백질 mg 범위의 특이적 활성을 포함한다. 또 다른한 측면에서, 자일라나제 활성은 37℃에서 약 1 내지 약 250 단위/단백질 mg 범위의 특이적 활성을 포함한다. 대안적으로, 자일라나제 활성은 약 37℃에서 약 1 내지 약 100 단위/단백질 mg 범위의 특이적 활성을 포함한다. 또 다른 한 측면에서, 내열성은 승온으로 가열된 후에, 37℃에서 자일라나제의 특이적 활성의 반 이상을 보유하는 것을 포함한다. 대안적으로, 내열성은 승온으로 가열된 후에, 37℃에서 약 1 내지 약 1200 단위/단백질 mg 범위, 또는 약 500 내지 약 1000 단위/단백질 mg 범위의 특이적 활성을 보유하는 것을 포함할 수 있다. 또 다른 한 측면에서, 내열성은 승온으로 가열된 후에, 37℃에서 약 1 내지 약 500 단위/단백질 mg 범위의 특이적 활성을 보유하는 것을 포함할 수 있다.
본 발명은 하나 이상의 글리코실화 부위를 포함하는 본 발명의 분리 또는 재조합 폴리펩티드를 제공한다. 한 측면에서, 글리코실화는 N-연결의 글리코실화일 수 있다. 한 측면에서, 폴리펩티드는P. 파스토리스(pastoris)또는S. 폼베(pombe)에서 발현된 후에 글리코실화될 수 있다.
한 측면에서, 폴리펩티드는 약 pH 6.5, pH 6, pH 5.5, pH 5, pH 4.5 또는 pH 4를 포함하는 조건 하에서 자일라나제 활성을 보유할 수 있다. 또 다른 한 측면에서, 폴리펩티드는 약 pH 7, pH 7.5, pH 8.0, pH 8.5, pH 9, pH 9.5, pH 10, pH 10.5 또는 pH 11을 포함하는 조건 하에서, 자일라나제 활성을 보유할 수 있다. 한 측면에서, 폴리펩티드는 약 pH 6.5, pH 6, pH 5.5, pH 5, pH 4.5 또는 pH 4를 포함하는 조건에 노출된 후에, 자일라나제 활성을 보유할 수 있다. 또 다른 한 측면에서, 폴리펩티드는 약 pH 7, pH 7.5, pH 8.0, pH 8.5, pH 9, pH 9.5, pH 10, pH10.5 또는 pH 11을 포함하는 조건에 노출된 후에, 자일라나제 활성을 보유할 수 있다.
본 발명은 본 발명의 폴리펩티드를 포함하는 단백질 제제로서, 액체, 고체 또는 겔을 포함하는 단백질 제제를 제공한다.
본 발명은 본 발명의 폴리펩티드 및 제2 단백질 또는 도메인을 포함하는 이종이량체를 제공한다. 이종이량체의 제2 원은 상이한 인지질분해효소, 상이한 효소 또는 또 다른 단백질일 수 있다. 한 측면에서, 제2 도메인은 폴리펩티드일 수 있고, 이종이량체는 융합 단백질일 수 있다. 한 측면에서, 제2 도메인은 동위원소 또는 표지일 수 있다. 한 측면에서, 본 발명은 본 발명의 폴리펩티드를 포함하는 동종이량체를 제공한다.
본 발명은 자일라나제 활성을 갖는 고정화 폴리펩티드로서, 본 발명의 폴리펩티드, 본 발명의 핵산에 의해 암호화되는 폴리펩티드 또는 본 발명의 폴리펩티드를 포함하는 폴리펩티드, 및 제 도메인을 포함하는 고정화 폴리펩티드를 제공한다. 한 측면에서, 폴리펩티드는 세포, 금속, 수지, 중합체, 세라믹, 유리, 미세전극, 흑연 전극, 비이드, 겔, 플레이트, 어레이 또는 모세관 상에 고정화될 수 있다.
본 발명은 본 발명의 고정화 핵산을 포함하는 어레이를 제공한다. 본 발명은 본 발명의 항체를 포함하는 어레이를 제공한다.
본 발명은 본 발명의 폴리펩티드 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드에 특이적으로 결합하는 분리 또는 재조합 항체를 제공한다. 항체는 단일클론 또는 다중클론 항체일 수 있다. 본 발명은 본 발명의 항체, 예컨대 본 발명의폴리펩티드 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드에 특이적으로 결합하는 항체를 포함하는 하이브리도마를 제공한다.
본 발명은 하기 단계들을 포함하는, 자일라나제 활성을 갖는 폴리펩티드의 분리 또는 동정 방법을 제공한다:
(a) 본 발명의 항체를 제공하는 단계;
(b) 폴리펩티드를 포함하는 샘플을 제공하는 단계; 및
(c) 항체가 폴리펩티드에 특이적으로 결합할 수 있는 조건 하에, 단계(b)의 샘플과 단계(a)의 항체를 접촉시킴으로써, 자일라나제 활성을 갖는 폴리펩티드를 분리 또는 동정하는 단계.
본 발명은 체액성 면역 반응을 일으키기에 충분한 양의 본 발명의 핵산 또는 본 발명의 폴리펩티드 또는 그것의 서브서열을 비인간 동물에게 투여함으로써, 안티-자일라나제 항체를 제조하는 것을 포함하는, 안티-자일라나제 항체의 제조 방법을 제공한다. 본 발명은 면역 반응을 일으키기에 충분한 양의 본 발명의 핵산 또는 본 발명의 폴리펩티드 또는 그것의 서브서열을 비인간 동물에게 투여하는 것을 포함하는, 안티-자일라나제 면역의 제조 방법을 제공한다.
본 발명은 하기 단계들을 포함하는, 재조합 폴리펩티드의 제조 방법을 제공한다:
(a) 프로모터에 작동적으로 연결된 본 발명의 핵산을 제공하는 단계; 및
(b) 폴리펩티드의 발현을 허용하는 조건 하에서 단계(a)의 핵산을 발현시킴으로써, 재조합 폴리펩티드를 제조하는 단계. 한 측면에서, 본 방법은 숙주 세포를단계(a)의 핵산으로 형질변환시킨 후, 단계(a)의 핵산을 발현시킴으로써, 형질전환된 세포 내의 재조합 폴리펩티드를 제조함을 추가로 포함할 수 있다.
본 발명은 하기 단계들을 포함하는, 자일라나제 활성을 갖는 폴리펩티드의 동정 방법을 제공한다:
(a) 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 제공하는 단계;
(b) 자일라나제 기질을 제공하는 단계; 및
(c) 단계(a)의 폴리펩티드 또는 그것의 변이체를 단계(b)의 기질과 접촉시키고, 기질의 양의 감소 또는 반응 생성물의 양의 증가를 탐지하는 단계(여기에서, 기질의 양의 감소 또는 반응 생성물의 양의 증가는 자일라나제 활성을 갖는 폴리펩티드를 탐지함).
본 발명은 하기 단계들을 포함하는, 자일라나제 기질의 동정 방법을 제공한다:
(a) 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 제공하는 단계;
(b) 테스트 기질을 제공하는 단계; 및
(c) 단계(a)의 폴리펩티드와 단계(b)의 테스트 기질을 접촉시키고, 기질의 양의 감소 또는 반응 생성물의 양의 증가를 탐지하는 단계(여기에서, 기질의 양의 감소 또는 반응 생성물의 양의 증가 자일라나제 활성을 갖는 자일라나제 기질로서의 테스트 기질을 탐지함).
본 발명은 하기 단계들을 포함하는, 시험 화합물이 폴리펩티드에 특이적으로 결합하는지의 여부를 결정하는 방법을 제공한다:
(a) 핵산이 폴리펩티드로 번역되는 것을 허용하는 조건 하에, 핵산, 또는 핵산을 포함하는 벡터를 발현시킴(여기에서, 핵산은 본 발명의 핵산을 포함함), 또는 본 발명의 폴리펩티드를 제공하는 단계;
(b) 시험 화합물을 제공하는 단계;
(c) 폴리펩티드와 시험 화합물을 접촉시키는 단계; 및
(d) 단계(b)의 시험 화합물이 폴리펩티드에 특이적으로 결합하는지의 여부를 결정하는 단계.
본 발명은 하기 단계들을 포함하는, 자일라나제 활성의 조절자의 동정 방법을 제공한다:
(a) 본 발명의 폴리펩티드 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 제공하는 단계;
(b) 시험 화합물을 제공하는 단계;
(c) 단계(a)의 폴리펩티드와 단계(b)의 시험 화합물을 접촉시키고, 자일라나제의 활성을 측정하는 단계(여기에서, 시험 화합물의 부재 하에서와 대비하여, 시험 화합물의 존재 하에 측정된 자일라나제 활성의 변화는 시험 화합물이 자일라나제 활성을 조절한다는 결정을 제공함). 한 측면에서, 자일라나제 활성은 자일라나제 기질을 제공하고, 기질 양의 감소 또는 반응 생성물의 양의 증가, 또는 기질의 양의 증가 또는 반응 생성물의 양의 감소를 탐지함으로써 측정될 수 있다. 시험 화합물의 부재 하에서의 기질 또는 반응 생성물의 양과 대비하여, 시험 화합물의 존재 하에서의 기질 양의 감소 또는 반응 생성물의 양의 증가는 자일라나제 활성의 활성화제로서 시험 화합물을 동정한다. 시험 화합물의 부재 하에서의 기질 또는 반응 생성물의 양과 대비하여, 시험 화합물의 존재 하에서의 기질의 양의 증가 또는 반응 생성물의 양의 감소는 자일라나제 활성의 억제제로서 시험 화합물을 동정한다.
본 발명은 프로세서 및 데이터 저장 장치를 포함하는 컴퓨터 시스템으로서, 상기 데이터 저장 장치가 본 발명의 폴리펩티드 서열 또는 핵산 서열(예컨대, 본 발명의 핵산에 의해 암호화되는 폴리펩티드)을 저장하고 있는 컴퓨터 시스템을 제공한다. 한 측면에서, 컴퓨터 시스템은 서열 비교 알고리즘, 및 하나 이상의 참조 서열을 저장하고 있는 데이터 저장 장치를 추가로 포함할 수 있다. 또 다른 한 측면에서, 서열 비교 알고리즘은 다형성을 지적하는 컴퓨터 시스템을 포함한다. 한 측면에서, 컴퓨터 시스템은 상기 서열 내의 하나 이상의 특징(feature)을 확인하는 확인자를 추가로 포함할 수 있다. 본 발명은 본 발명의 폴리펩티드 서열 또는 핵산 서열을 저장하고 있는 컴퓨터 판독가능 매체를 제공한다. 본 발명은 하기 단계들을 포함하는 서열 내의 특징을 동정하는 방법을 제공한다:
(a) 서열 내의 하나 이상의 특징을 동정하는 컴퓨터 프로그램을 이용하여 서열을 판독하는 단계(여기에서, 서열은 본 발명의 폴리펩티드 서열 또는 핵산 서열을 포함함); 및
(b) 서열 내의 하나 이상의 특징을 컴퓨터 프로그램으로 확인하는 단계.
본 발명은 하기 단계들을 포함하는, 제1 서열 및 제2 서열을 비교하는 방법을 제공한다:
(a) 서열을 비교하는 컴퓨터 프로그램을 이용하여 제1 서열 및 제2 서열을 판독하는 단계(여기에서, 제1 서열은 본 발명의 폴리펩티드 서열 또는 핵산 서열을 포함함); 및
(b) 컴퓨터 프로그램을 이용하여 제1 서열 및 제2 서열 간의 차이를 결정하는 단계. 제1 서열 및 제2 서열 간의 차이를 결정하는 단계는 다형태를 동정하는 단계를 추가로 포함할 수 있다. 한 측면에서, 본 방법은 서열 내의 하나 이상의 특징을 동정하는 확인자를 추가로 포함할 수 있다. 또 다른 한 측면에서, 본 방법은 컴퓨터 프로그램을 이용하여 제1 서열을 읽고, 서열 내의 하나 이상의 특징을 동정하는 것을 포함할 수 있다.
본 발명은 하기 단계들을 포함하는, 환경적 샘플로부터 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산을 분리 또는 회수하기 위한 방법을 제공한다:
(a) 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산을 증폭시키기 위한 증폭 프라이머 서열 쌍을 제공하는 단계(여기에서, 프라이머 쌍은 본 발명의 핵산을 증폭시킬 수 있음);
(b) 환경적 샘플로부터 핵산을 분리하거나, 환경적 샘플을 샘플 내의 핵산이 증폭 프라이머 쌍에 대해 하이브리드화되기 용이하도록 처리하는 단계; 및
(c) 단계(b)의 핵산을 단계(a)의 증폭 프라이머 쌍과 조합하고, 환경적 샘플로부터 핵산을 증폭시킴으로써, 환경적 샘플로부터 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산을 분리 또는 회수하는 단계. 증폭 프라이머 서열 쌍의 하나 또는 각 원은 본 발명의 서열의 적어도 약 10 내지 50개의 연속 염기들을 갖는 올리고뉴클레오티드를 포함할 수 있다. 한 측면에서, 증폭 프라이머 서열 쌍은 본 발명의 증폭 쌍이다.
본 발명은 하기 단계들을 포함하는, 환경적 샘플로부터 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산을 분리 또는 회수하기 위한 방법을 제공한다:
(a) 본 발명의 핵산 또는 그것의 서브서열을 포함하는 폴리뉴클레오티드 프로브를 제공하는 단계;
(b) 환경적 샘플로부터 핵산을 분리하거나, 환경적 샘플을 샘플 내의 핵산이 단계(a)의 폴리뉴클레오티드 프로브에 대해 하이브리드화되기 용이하도록 처리하는 단계;
(c) 단계(b)의 분리된 핵산 또는 처리된 환경적 샘플을 단계(a)의 폴리뉴클레오티드 프로브와 조합하는 단계; 및
(d) 단계(a)의 폴리뉴클레오티드 프로브와 특이적으로 하이브리드화하는 핵산을 분리함으로써, 환경적 샘플로부터 핵산을 증폭시킴으로써, 환경적 샘플로부터 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산을 분리 또는 회수하는 단계. 환경적 샘플에는 물 샘플, 액체 샘플, 토양 샘플, 공기 샘플 또는 생물학적 샘플이 포함될 수 있다. 한 측면에서, 생물학적 샘플은 박테리아 세포, 원생동물문 세포, 곤충 세포, 효모 세포, 식물 세포, 진균류 세포 또는 포유동물 세포로부터 유도될 수 있다.
본 발명은 하기 단계들을 포함하는, 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산의 변이체를 발생시키는 방법을 제공한다:
(a) 본 발명의 핵산을 포함하는 주형 핵산을 제공하는 단계; 및
(b) 주형 서열 또는 그것의 조합물에서의 하나 이상의 뉴클레오티드를 변형, 결실 또는 부가하여, 주형 핵산의 변이체를 발생시키는 단계. 한 측면에서, 본 방법은 변이체 핵산을 발현시켜, 변이체 자일라나제 폴리펩티드를 발생시키는 것을 추가로 포함할 수 있다. 변형, 부가 또는 결실은 에러프론(error-prone) PCR, 셔플링, 올리고뉴클레오티드-지정 돌연변이, 어셈블리 PCR, 성별 PCR 돌연변이, 생체내 돌연변이, 카세트 돌연변이, 순환 앙상블(recursive ensemble) 돌연변이, 지수 앙상블(exponential ensemble) 돌연변이, 부위 특이적 돌연변이, 유전자 리어셈블리(예컨대, GeneReassemblyTM, 예컨대 U.S. 특허 No. 6,537,776 참고), 유전자 부위 포화 돌연변이(GSSMTM), 합성 접합 리어셈블리(SLR) 또는 그것의 조합물을 포함하는 방법에 의해 도입될 수 있다. 또 다른 한 측면에서, 변형, 부가 또는 결실은 재조합, 순환 서열 재조합, 포스포티오에이트-변형 DNA 돌연변이, 우라실 함유의 주형 돌연변이, 갭핑 이중(gapped duplex) 돌연변이, 점 부정합 쌍 수복 돌연변이, 수복-결핍 숙주 균주 돌연변이, 화학적 돌연변이, 방사능에 의한 돌연변이, 결실 돌연변이, 제한-선택 돌연변이, 제한-정제 돌연변이, 인공 유전자 합성, 앙상블 돌연변이, 키메라 핵산 다량체 생성 및 그것의 조합을 포함하는 방법에 의해 도입된다.
한 측면에서, 본 발명은 주형 핵산에 의해 암호화된 폴리펩티드에서 변형되거나 그와 상이한 활성, 또는 그 폴리펩티드에서 변형되거나 그와 상이한 안정성을 갖는 자일라나제가 제조될 때까지, 되풀이하여 반복될 수 있다. 한 측면에서, 변이체 자일라나제 폴리펩티드는 내열성을 가지고, 승온에 노출된 후에 약간의 활성을 보유한다. 또 다른 한 측면에서, 변이체 자일라나제 폴리펩티드는 주형 핵산에 의해 암호화된 자일라나제에 비해, 증가된 글리코실화를 가진다. 대안적으로, 변이체 자일라나제 폴리펩티드는 높은 온도에서 자일라나제 활성을 가지며, 여기에서 주형 핵산에 의해 암호화된 자일라나제는 높은 온도에서 활성을 가지지 않는다. 한 측면에서, 본 방법은 주형 핵산의 코돈 이용에서 변형된 코돈 이용을 갖는 자일라나제 암호화 서열이 제조될 때까지 되풀이하여 반복될 수 있다. 또 다른 한 측면에서, 본 방법은 주형 핵산의 경우보다 메시지 발현 또는 안정성의 수준이 더 높거나 더 낮은 자일라나제 유전자가 제조될 때까지 되풀이하여 반복될 수 있다.
한 측면에서, 본 발명은 하기 돌연변이들 중 하나 이상을 갖는 서열 번호 189에서 표시되는 서열을 포함하는 분리 또는 재조합 핵산을 제공한다: 위치 22 내지 24의 뉴클레오티드가 TTC이거나, 위치 31 내지 33의 뉴클레오티드가 CAC이거나, 위치 34 내지 36의 뉴클레오티드가 TTG이거나, 위치 49 내지 51의 뉴클레오티드가 ATA이거나, 위치 31 내지 33의 뉴클레오티드가 CAT이거나, 위치 67 내지 69의 뉴클레오티드가 ACG이고, 위치178 내지 180의 뉴클레오티드가 CAC이거나, 위치 190 내지 192의 뉴클레오티드가 TGT이거나, 위치 190 내지 192의 뉴클레오티드가 GTA이거나, 위치 190 내지 192의 뉴클레오티드가 GTT이거나, 위치 193 내지 195의 뉴클레오티드가 GTG이거나, 위치 202 내지 204의 뉴클레오티드가 GCT이거나, 위치 235 내지 237의 뉴클레오티드가 CCA이거나 위치 235 내지 237의 뉴클레오티드가 CCC 임. 한 측면에서, 본 발명은 상기 서열을 포함하는 핵산의 제조 방법으로서, 서열 번호 189에서의 돌연변이가 유전자 부위 포화 돌연변이(GSSMTM)에 의해 수득되는 방법을 제공한다.
한 측면에서, 본 발명은 하기 돌연변이들 중 하나 이상을 갖는 서열 번호 190 을 포함하는 분리 또는 재조합 핵산을 제공한다:
아미노산 위치 8의 아스파르트산이 페닐알라닌이거나, 아미노산 위치 11의 글루타민이 히스티딘이거나, 아미노산 위치 12의 아스파라긴이 류신이거나, 아미노산 위치 17의 글리신이 이소류신이거나, 아미노산 위치 23의 트레오닌이 야생형 코돈 이외의 코돈에 의해 암호화된 트레오닌이거나, 아미노산 위치 60의 글리신이 히스티딘이거나, 아미노산 위치 64의 프롤린이 시스테인이거나, 아미노산 위치 64의 프롤린이 발린이거나, 아미노산 위치 65의 세린이 발린이거나, 아미노산 위치 68의 글리신이 이소류신이거나, 아미노산 위치 68의 글리신이 알라닌이거나 아미노산 위치 79의 발린이 프롤린임.
본 발명은 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산 내의 코돈을 숙주 세포 내에서의 발현이 증가되도록 변형시키는 방법으로서, 하기 단계들을 포함하는 방법을 제공한다:
(a) 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 본 발명의 핵산을 제공하는 단계; 및
(b) 단계(a)의 핵산 내의 바람직하지 않거나 덜 바람직한 코돈을 동정하여, 그것을 바람직하거나 중간적으로 사용되는 코돈으로 대체하는 단계(여기에서, 바람직한 코돈은 숙주 세포 내의 유전자 내 서열을 암호화할 때 과다 표출되는 코돈이고, 바람직하지 않거나 덜 바람직한 코돈은 숙주 세포 내의 유전자의 서열을 암호화함에 있어 과소 표출되는 코돈임)으로써, 핵산을 숙주 세포 내에서의 발현이 증가되도록 변형시킴.
본 발명은 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산 내의 코돈을 변형시키는 방법으로서, 하기 단계들을 포함하는 방법을 제공한다:
(a) 본 발명의 핵산을 제공하는 단계; 및
(b) 단계(a)의 핵산 내의 코돈을 동정하여, 그것을 대체 코돈과 동일한 아미노산을 암호화하는 상이한 코돈으로 대체함으로써, 자일라나제를 암호화하는 핵산 내의 코돈을 변형시키는 단계.
본 발명은 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산 내의 코돈을 숙주 세포 내에서의 발현이 증가되도록 변형시키는 방법으로서, 하기 단계들을 포함하는 방법을 제공한다:
(a) 자일라나제 폴리펩티드를 암호화하는 본 발명의 핵산을 제공하는 단계; 및
(b) 단계(a)의 핵산 내의 바람직하지 않거나 덜 바람직한 코돈을 동정하여, 그것을 바람직하거나 중간적으로 사용되는 코돈으로 대체하는 단계(여기에서, 바람직한 코돈은 숙주 세포 내의 유전자 내 서열을 암호화할 때 과다 표출되는 코돈이고, 바람직하지 않거나 덜 바람직한 코돈은 숙주 세포 내의 유전자의 서열을 암호화함에 있어 과소 표출되는 코돈임)로서, 핵산을 숙주 세포 내에서의 발현이 증가되도록 변형시키는 것인 단계.
본 발명은 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산 내의 코돈을 숙주 세포 내에서의 발현이 감소되도록 변형시키는 방법으로서, 하기 단계들을 포함하는 방법을 제공한다:
(a) 본 발명의 핵산을 제공하는 단계; 및
(b) 단계(a)의 핵산 내의 하나 이상의 바람직한 코돈을 동정하여, 그것을 대체 코돈과 동일한 아미노산을 암호화하는 바람직하지 않거나 덜 바람직한 코돈으로 대체함으로써(여기에서, 바람직한 코돈은 숙주 세포 내의 유전자 내 서열을 암호화할 때 과다 표출되는 코돈이고, 바람직하지 않거나 덜 바람직한 코돈은 숙주 세포 내의 유전자의 서열을 암호화함에 있어 과소 표출되는 코돈임), 핵산을 숙주 세포 내에서의 발현이 감소되도록 변형시키는 단계. 한 측면에서, 숙주 세포는 박테리아 세포, 진균류 세포, 곤충 세포, 효모 세포, 식물 세포 또는 포유동물 세포일 수 있다.
본 발명은 제1 활성 부위 또는 제1 기질 결합 부위를 암호화하는 서열을 포함하는 제1 핵산으로부터 유도되는 복수의 변형된 자일라나제 활성 부위 또는 기질 결합 부위를 암호화하는 핵산의 라이브러리의 제조 방법으로서, 하기 단계들을 포함하는 방법을 제공한다:
(a) 제1 활성 부위 또는 제1 기질 결합 부위를 암호화하는 제1 핵산을 제공하는 단계(여기에서, 제1 핵산 서열은 본 발명의 핵산에 대해 엄격한 조건 하에 하이브리드화하는 서열을 포함하고, 핵산은 자일라나제 활성 부위 또는 자일라나제 기질 결합 부위를 암호화함);
(b) 제1 핵산 내의 복수의 표적 코돈에서 자연 발생적 아미노산 변이체를 암호화하는 한 세트의 돌연변이성 올리고뉴클레오티드를 제공하는 단계; 및
(c) 돌연변이성 올리고뉴클레오티드 세트를 이용하여, 돌연변이화된 각 아미노산 코돈에서 일정 범위의 아미노산 변형을 암호화하는 한 세트의 활성 부위-암호화 또는 기질 결합 부위-암호화의 변이체 핵산을 생성시킴으로써, 복수의 변형된 자일라나제 활성 부위 또는 기질 결합 부위를 암호화하는 핵산의 라이브러리를 생성하는 단계. 한 측면에서, 본 방법은 최적화 지정 전개 시스템, 유전자 부위-포화 돌연변이(GSSMTM), 합성 접합 리어셈블리(SLR), 에러 프론 PCR, 셔플링, 올리고뉴클레오티드-지정 돌연변이, 어셈블리 PCR, 성적 PCR 돌연변이, 생체내 돌연변이, 카세트 돌연변이, 순환 앙상블 돌연변이, 지수 앙상블 돌연변이, 부위-특이적 돌연변이, 유전자 리어셈블리(GeneReassemblyTM, U.S. 특허 No. 6,537,776), 유전자 부위 포화 돌연변이(GSSMTM), 합성 접합 리어셈블리(SLR) 및 그것의 조합 방법을 포함하는 방법에 의해, 단계(a)의 제1 핵산을 돌연변이화하는 것을 포함한다. 또 다른 한 측면에서, 재조합, 순환 서열 재조합, 포스포티오에이트-변형 DNA 돌연변이, 우라실 함유 주형 돌연변이, 갭핑 이중 돌연변이, 점 부정합 쌍 수복 돌연변이, 수복-결핍 숙주 균주 돌연변이, 화학적 돌연변이, 방사능에 의한 돌연변이, 결실 돌연변이, 제한-선택 돌연변이, 제한-정제 돌연변이, 인공 유전자 합성, 앙상블 돌연변이, 키메라 핵산 다량체 생성 및 그것의 조합 방법을 포함하는 방법에 의해 단계(a)의 제1 핵산 또는 변이체를 돌연변이화하는 것을 포함한다.
본 발명은 하기 단계들을 포함하는 작은 분자들의 제조 방법을 제공한다:
(a) 작은 분자를 합성 또는 변형시킬 수 있는 복수의 생합성 효소를 제공하는 단계(여기에서, 효소들 중 하나는 본 발명의 핵산에 의해 암호화되는 자일라나제 효소를 포함함);
(b) 단계(a)의 효소들 중 하나 이상을 위한 기질을 제공하는 단계; 및
(c) 복수의 생촉매적 반응을 촉진하는 조건 하에서 단계(b)의 기질을 효소와 반응시켜, 일련의 생촉매적 반응에 의해 작은 분자를 생성시키는 단계.
본 발명은 하기 단계들을 포함하는 작은 분자의 변형 방법을 제공한다:
(a) 자일라나제 효소를 제공하는 단계(여기에서, 효소는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드, 또는 그것의 서브서열을 포함함);
(b) 작은 분자를 제공하는 단계; 및
(c) 자일라나제 효소가 촉매 작용하는 효소 반응을 촉진하는 조건 하에서 단계(a)의 효소를 단계(b)의 작은 분자와 반응시킴으로써, 자일라나제 효소 반응에 의해 작은 분자를 변형시키는 단계. 한 측면에서, 본 발명은 단계(a)의 효소를 위한 복수의 작은 분자 기질을 포함함으로써, 자일라나제 효소가 촉매 작용하는 하나 이상의 효소 반응에 의해 생성되는 변형된 작은 분자의 라이브러리를 생성시킬 수있다. 한 측면에서, 본 방법은 효소에 의한 복수의 생촉매적 반응을 촉진하는 조건 하에서 복수의 부가적 효소들을 포함하여, 복수의 효소 반응에 의해 생성되는 변형된 작은 분자의 라이브러리를 형성시킬 수 있다. 또 다른 한 측면에서, 본 방법은 원하는 활성을 나타내는 특별한 변형된 작은 분자가 라이브러리 내에 존재하는지의 여부를 결정하기 위해 라이브러리를 시험하는 단계를 추가로 포함할 수 있다. 라이브러리의 시험 단계는, 원하는 활성을 갖는 특별한 변형된 작은 분자의 존재 또는 부재에 대해 변형된 작은 분자의 부분을 시험하고 원하는 활성을 갖는 특별한 변형된 작은 분자를 생성하는 하나 이상의 특이적 생촉매적 반응을 식별함으로써, 라이브러리 내의 복수의 변형된 작은 분자들을 생성시키는데 사용되는 생촉매적 반응들 중 하나를 제외한 모든 반응을 계통적으로 제거하는 단계를 추가로 포함할 수 있다.
본 발명은 하기 단계들을 포함하는, 자일라나제 효소의 기능적 절편을 결정하는 방법을 제공한다:
(a) 자일라나제 효소를 제공하는 단계(여기에서, 효소는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드, 또는 그것의 서브서열을 포함함); 및
(b) 단계(a)의 서열로부터 복수의 아미노산 잔기를 제거하고, 나머지 서브서열을 자일라나제 활성에 대해 시험함으로써, 자일라나제 효소의 기능적 절편을 결정하는 단계. 한 측면에서, 자일라나제 활성은 자일라나제 기질을 제공하고, 기질의 양의 감소 또는 반응 생성물의 양의 증가를 탐지함으로써 측정된다.
본 발명은 실시간 대사 흐름 분석을 이용함으로써 신규 또는 변형 표현형의 전체 세포 공학처리를 하는 방법으로서, 하기 단계들을 포함하는 방법을 제공한다:
(a) 세포의 유전 조성물을 변형시킴으로써 변형 세포를 제조하는 단계(여기에서, 유전 조성물은 본 발명의 핵산을 세포에 부가함으로써 변형됨);
(b) 변형 세포를 배양하여, 복수의 변형 세포를 생성시키는 단계;
(c) 실시간으로 단계(b)의 세포 배양물을 모니터함으로써, 세포의 하나 이상의 대사 파라미터를 측정하는 단계; 및
(d) 단계(c)의 데이터를 분석하여, 측정된 파라미터가 유사한 조건 하에서 변형 세포에서의 필적할만한 측정과 상이한지의 여부를 결정함으로써, 실시간 대사 흐름 분석을 이용하여 세포 내 공학처리된 표현형을 식별하는 단계. 한 측면에서, 세포의 유전 조성물은 서열의 결실, 또는 세포 내의 서열의 변형, 또는 유전자 발현의 정지를 포함하는 방법에 의해 변형될 수 있다. 한 측면에서, 본 방법은 새로이 공학처리된 표현형을 갖는 세포를 선택하는 것을 추가로 포함할 수 있다. 또 다른 한 측면에서, 본 방법은 선택된 세포를 배양함으로써, 새로이 공학처리된 표현형을 갖는 신규 세포 균주를 생성시킴을 포함할 수 있다.
본 발명은 자일라나제 폴리펩티드를 글리코실화하는 것을 포함하는, 자일라나제 폴리펩티드의 내열성 또는 열안정성을 증가시키는 방법으로서, 폴리펩티드가 본 발명의 폴리펩티드 또는 본 발명의 핵산 서열에 의해 암호화되는 폴리펩티드의 30개 이상의 연속 아미노산을 포함함으로써, 자일라나제 폴리펩티드의 내열성 또는 열안정성을 증가시키는 방법을 제공한다. 한 측면에서, 자일라나제 특이적 활성은약 37℃초과 내지 약 95℃범위의 온도에서 열안정성 또는 내열성을 가질 수 있다.
본 발명은 본 발명의 핵산 또는 본 발명의 핵산 서열을 갖는 핵산을 포함하는 벡터를 발현시키는 것을 포함하는, 세포 내의 재조합 자일라나제 폴리펩티드를 과다발현시키는 방법을 제공하며, 여기에서 서열 상동성은 서열 비교 알고리즘을 이용하는 분석 또는 시각적 조사에 의해 결정되며, 과다발현은 높은 활성 프로모터, 디시스트로닉 벡터의 이용, 또는 벡터의 유전자 증폭에 의해 행해진다.
본 발명은 하기 단계들을 포함하는 유전자이식 식물의 제조 방법을 제공한다:
(a) 이종 핵산 서열을 세포에 도입하는 단계(여기에서, 이종 핵산 서열은 본 발명의 핵산 서열을 포함함으로써, 형질전환된 식물 세포를 생성시킴); 및
(b) 형질전환된 세포로부터 유전자이식 식물을 제조하는 단계. 한 측면에서, 단계(a)는 식물 세포 원형질의 전기천공법 또는 미세주입법에 의해 이종 핵산 서열을 도입하는 것을 추가로 포함할 수 있다. 또 다른 한 측면에서, 단계(a)는 DNA 입자 충돌에 의해 이종 핵산 서열을 식물 조직에 직접적으로 도입하는 것을 추가로 포함할 수 있다. 대안적으로, 단계(a)는 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) 숙주를 이용하여, 이종 핵산 서열을 식물 세포 DNA에 도입하는 것을 추가로 포함할 수 있다. 한 측면에서, 식물 세포는 감자, 옥수수, 쌀, 밀, 담배 또는 보리 세포일 수 있다.
본 발명은 하기 단계들을 포함하는 식물 세포 내의 이종 핵산 서열을 발현시키는 방법을 제공한다:
(a) 프로모터에 작동적으로 연결된 이종 핵산 서열을 이용하여 식물 세포를 형질전환시키는 단계(여기에서, 이종 핵산 서열은 본 발명의 핵산을 포함함); 및
(b) 이종 핵산 서열이 식물 세포 내에서 발현되는 조건 하에서 식물을 성장시키는 단계.
본 발명은 하기 단계들을 포함하는 식물 세포 내의 이종 핵산 서열을 발현시키는 방법을 제공한다:
(a) 프로모터에 작동적으로 연결된 이종 핵산 서열을 이용하여 식물 세포를 형질전환시키는 단계(여기에서, 이종 핵산 서열은 본 발명의 핵산을 포함함); 및
(b) 이종 핵산 서열이 식물 세포 내에서 발현되는 조건 하에서 식물을 성장시키는 단계.
본 발명은 하기 단계들을 포함하는 자일란 함유의 조성물을 가수분해, 파괴 또는 붕괴시키는 방법을 제공한다:
(a) 자일라나제 활성을 갖는 본 발명의 폴리펩티드를 제공하는 단계;
(b) 자일란을 포함하는 조성물을 제공하는 단계; 및
(c) 자일라나제가 자일란 함유의 조성물을 가수분해, 분해 또는 붕괴시키는 조건 하에서, 단계(a)의 폴리펩티드를 단계(b)의 조성물과 접촉시키는 단계. 한 측면에서, 본 조성물은 식물 세포, 박테리아 세포, 효모 세포, 곤충 세포 또는 동물 세포를 포함한다. 이에 따라, 본 조성물은 임의의 식물 또는 식물 부분, 임의의 자일란 함유의 식품 또는 사료, 폐기물 등을 포함할 수 있다.
본 발명은 하기 단계들을 포함하는 자일란 함유의 조성물을 액화 또는 제거하는 방법을 제공한다:
(a) 자일라나제 활성을 갖는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 제공하는 단계;
(b) 자일란을 포함하는 조성물을 제공하는 단계; 및
(c) 자일라나제가 자일란 함유의 조성물을 제거, 연화 또는 액화시키는 조건 하에서, 단계(a)의 폴리펩티드를 단계(b)의 조성물과 접촉시키는 단계.
본 발명은 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 포함하는 세제 조성물로서, 폴리펩티드가 자일라나제 활성을 갖는 세제 조성물을 제공한다. 자일라나제는 비표면활성 자일라나제 또는 표면활성 자일라나제일 수 있다. 자일라나제는 비수성 액체 조성물, 캐스트 고체, 과립 형태, 미립 형태, 압착 정제, 겔 형태, 페이스트 또는 슬러리 형태로 제형화될 수 있다. 본 발명은 하기 단계들을 포함하는 목적물의 세정 방법을 제공한다:
(a) 자일라나제 활성을 갖는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 포함하는 조성물을 제공하는 단계;
(b) 목적물을 제공하는 단계; 및
(c) 조성물이 목적물을 세정하는 조건 하에서, 단계(a)의 폴리펩티드를 단계(b)의 목적물과 접촉시키는 단계.
본 발명은 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 포함하는, 예컨대 실 등의 텍스타일 또는 패브릭을 제공한다. 한 측면에서, 텍스타일 또는 패브릭은 자일란-함유의 섬유를 포함한다. 본 발명은 하기단계들을 포함하는 텍스타일 또는 패브릭의 처리(예컨대, 조성물로부터의 오염 제거) 방법을 제공한다:
(a) 자일라나제 활성을 갖는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 포함하는 조성물을 제공하는 단계;
(b) 자일란을 포함하는 텍스타일 또는 패브릭을 제공하는 단계; 및
(c) 텍스타일 또는 패브릭을 처리하는(예컨대, 오염을 제거하는) 조건 하에서, 단계(a)의 폴리펩티드를 단계(b)의 조성물과 접촉시키는 단계.
본 발명은 하기 단계들을 포함하는 패브릭의 피니쉬를 향상시키는 방법을 제공한다:
(a) 자일라나제 활성을 갖는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 포함하는 조성물을 제공하는 단계;
(b) 패브릭을 제공하는 단계; 및
(c) 폴리펩티드가 패브릭을 처리함으로써, 패브릭의 피니쉬를 향상시킬 수 있는 조건 하에서, 단계(a)의 폴리펩티드를 단계(b)의 패브릭과 접촉시키는 단계. 한 측면에서, 패브릭은 울 또는 실크이다.
본 발명은 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 포함하는 사료 또는 식품을 제공한다. 본 발명은 하기 단계들을 포함하는, 사료 또는 식품 내의 자일란을 동물에 의해 소비되기 전에 가수분해하는 방법을 제공한다:
(a) 본 발명의 자일라나제, 또는 본 발명의 핵산에 의해 암호화되는 자일라나제를 포함하는 사료 물질을 수득하는 단계; 및
(b) 자일란의 가수분해 및 처리된 식품 또는 사료의 형성을 일으키기에 충분한 시간 동안 충분한 양의 사료 또는 식품 물질에 단계(a)의 폴리펩티드를 첨가함으로써, 식품 또는 사료 내의 자일란을 동물에 의해 소비되기 전에 가수분해시키는 단계.
한 측면에서, 본 발명은 하기 단계들을 포함하는, 사료 또는 식물 내의 자일란을 동물에 의해 소비되기 전에 가수분해하는 방법을 제공한다:
(a) 본 발명의 자일라나제, 또는 본 발명의 핵산에 의해 암호화되는 자일라나제를 포함하는 사료 물질을 수득하는 단계;
(b) 단계(a)의 폴리펩티드를 사료 또는 식품 물질에 첨가하는 단계; 및
(c) 사료 또는 식품 물질을 동물에게 투여하는 단계(여기에서, 소비 후, 자일라나제는 동물의 소화관 내에서 사료 또는 식품 내의 자일란의 가수분해를 일으킴). 식품 또는 사료는 예컨대 곡류, 그레인, 옥수수 등일 수 있다.
본 발명은 본 발명의 폴리펩티드, 예컨대 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 포함하는 동물용 식품 또는 영양 보충물을 제공한다. 한 측면에서, 식품 또는 영양 보충물 내의 폴리펩티드는 가수분해될 수 있다. 본 발명은 본 발명의 폴리펩티드, 예컨대 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 포함하는 식용성 효소 전달 매트릭스를 제공한다.
한 측면에서, 전달 매트릭스는 펠릿을 포함한다. 한 측면에서, 폴리펩티드는 글리코실화될 수 있다. 한 측면에서, 자일라나제 활성은 내열성을 가진다. 또 다른한 측면에서, 자일라나제 활성은 열안정성을 가진다.
본 발명은 본 발명의 폴리펩티드를 포함하는 식품, 사료 또는 영양 보충물을 제공한다. 본 발명은 동물 식이요법에 있어 자일라나제를 영양 보충물로서 이용하는 방법으로서, 본 발명의 폴리펩티드의 30개 이상의 연속 아미노산을 포함하는 자일라나제 효소를 함유하는 영양 보충물을 제조함; 및 영양 보충물을 동물에게 투여하여, 동물에 의해 분해되는 사료 또는 식품 내에 함유된 자일란의 이용을 증가시킴을 포함하는 방법을 제공한다. 동물은 인간, 반추 동물 또는 단위 동물일 수 있다. 자일라나제 효소는 박테리아, 효모, 식물, 곤충, 진균류 및 동물로 구성된 군으로부터 선택되는 유기체 내의 자일라나제를 암호화하는 폴리뉴클레오티드의 발현에 의해 제조될 수 있다. 유기체는 에스. 폼베(S. pombe),에스. 세레비재(S. cerevisiae),피치아 파스토리스(Pichia pastoris),슈도모나스 종(Pseudomonas sp.),이. 콜라이(E.coli),스트렙토마이세스 종(Streptomyces sp.),바실러스 종(Bacillus sp.)및 락토바실러스 종(Lactobacillus sp.)으로 구성된 군으로부터 선택될 수 있다.
본 발명은 열안정성 재조합 자일라나제 효소를 포함하는 효소 전달 매트릭스, 예컨대 본 발명의 폴리펩티드를 포함하는 식용성 효소 전달 매트릭스를 제공한다. 본 발명은 자일라나제 보출물을 동물에게 전달하는 방법으로서, 그래뉼리트 식용성 담체 및 열안정성 재조합 자일라나제 효소를 포함하는 펠릿 형태의 식용성 효소 전달 매트릭스를 제조함(여기에서, 펠릿은 그 안에 함유된 자일라나제 효소를 용이하게 분산시킴), 및 식용성 효소 전달 매트릭스를 동물에게 투여함을 포함하는방법을 제공한다. 재조합 자일라나제 효소는 본 발명의 폴리펩티드를 포함할 수 있다. 과립성 식용 담체는 곡물 배아(germ), 오일이 제거된 곡물 배아, 건초, 알팔파, 티모시, 대두 껍질, 해바라기 씨분 및 밀 미드로 구성된 군으로부터 선택되는 담체를 포함할 수 있다. 식용성 담체는 오일이 소비된 곡물 배아를 포함할 수 있다. 자일라나제 효소는 글리코실화되어, 펠릿화 조건 하에서 열안정성을 제공할 수 있다. 전달 매트릭스는 곡물 배아 및 자일라나제를 포함하는 혼합물을 펠릿화함으로써 형성될 수 있다. 펠릿화 조건은 스팀의 적용을 포함할 수 있다. 펠릿화 조건은 약 5분간 약 80℃ 이상의 온도의 적용을 포함할 수 있고, 효소는 350 이상 내지 약 900 유닛/효소 mg의 특이적 활성을 보유한다.
본 발명은 하기 단계들을 포함하는 낙농 제품의 조직 및 풍미를 향상시키는 방법을 제공한다:
(a) 자일라나제 활성을 갖는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 자일라나제를 제공하는 단계;
(b) 유제품을 제공하는 단계; 및
(c) 자일라나제가 유제품의 조직 또는 풍미를 향상시킬 수 있는 조건 하에서, 단계(a)의 폴리펩티드를 단계(b)의 낙농 제품과 접촉시키는 단계. 한 측면에서, 낙농 제품은 치즈 또는 요구르트를 포함한다. 본 발명은 본 발명의 자일라나제를 포함하는 낙농 제품을 제공하거나, 본 발명의 핵산에 의해 암호화된다.
본 발명은 하기 단계들을 포함하는 오일 풍부 식물 물질로부터의 오일 추출을 향상시키는 방법을 제공한다:
(a) 자일라나제 활성을 갖는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 자일라나제를 제공하는 단계;
(b) 오일 풍부 식물 물질을 제공하는 단계; 및
(c) 단계(a)의 폴리펩티드를 오일 풍부 식물 물질과 접촉시키는 단계. 한 측면에서, 오일 풍부 식물 물질은 오일 풍부 씨를 포함한다. 오일은 대두 오일, 올리브 오일, 평지씨(카놀라) 오일 또는 해바라기 오일일 수 있다.
본 발명은 하기 단계들을 포함하는 과일 또는 야채 쥬스, 시럽, 퓨레 또는 추출물의 제조 방법을 제공한다:
(a) 자일라나제 활성을 갖는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 자일라나제를 제공하는 단계;
(b) 과일 또는 야채 물질을 포함하는 조성물 또는 액체를 제공하는 단계; 및
(c) 단계(a)의 폴리펩티드를 조성물과 접촉시킴으로써, 과일 또는 야채 쥬스, 시럽, 퓨레 또는 추출물을 제조하는 단계.
본 발명은 본 발명의 자일라나제, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 포함하는 종이 또는 종이 제품, 또는 종이 펄프를 제공한다. 본 발명은 하기 단계들을 포함하는, 종이, 또는 종이 또는 목재 펄프의 처리 방법을 제공한다:
(a) 자일라나제 활성을 갖는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 자일라나제를 제공하는 단계;
(b) 종이, 또는 종이 또는 목재 펄프를 포함하는 조성물을 제공하는 단계;및
(c) 자일라나제가 종이, 또는 종이 또는 목재 펄프를 처리할 수 있는 조건 하에서, 단계(a)의 폴리펩티드를 단계(b)의 조성물과 접촉시키는 단계. 한 측면에서, 약제학적 조성물은 분해 보조제 또는 항미생물제(예컨대, 살모넬라균(Salmonella)에 대한 미생물제) 로서 작용한다. 한 측면에서, 처리는 예방적이다. 한 측면에서, 본 발명은 자일라나제 활성을 갖는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 자일라나제를 포함하는 구강 케어 제품을 제공한다. 구강 케어 제품은 치약, 덴탈 크림, 겔 또는 치아 분말제, 치의, 구강청결제, 전- 또는 후-브러슁 린스 제형물, 츄잉검, 로젠지 또는 캔디를 포함할 수 있다. 본 발명은 자일라나제 활성을 갖는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 자일라나제를 포함하는 콘택트렌즈 클렌징 조성물을 제공한다.
한 측면에서, 본 발명은 본 발명의 폴리펩티드를 투여하는 것을 포함하는, 자일란을 갖는 미생물로부터 동물을 제거 또는 보호하는 방법을 제공한다. 미생물은 자일란을 포함하는 박테리아, 예컨대 살로넬라균일 수 있다.
본 발명은 서열 번호 189에 표시되는 서열, 및 서열 번호 189와 50% 이상의 서열 상동성을 갖는 상기 서열의 변이체를 가지고, 자일라나제 활성을 갖는 폴리펩티드를 코팅하는 분리 핵산을 제공한다. 한 측면에서, 폴리펩티드는 자일라나제 활성, 예컨대 열안정성을 갖는 자일라나제 활성을 가진다.
본 발명은, 하기 서열 변이체들 중 하나 이상, 또는 모두를 포함하는 서열 번호 189를 갖는 분리 또는 재조합 핵산을 제공한다: 위치 22 내지 24의 뉴클레오티드가 TTC이거나, 위치 22 내지 24의 뉴클레오티드가 TTT이거나, 위치 31 내지 33의 뉴클레오티드가 CAC이거나, 위치 31 내지 33의 뉴클레오티드가 CAT이거나, 위치 34 내지 36의 뉴클레오티드가 TTG이거나, 위치 34 내지 36의 뉴클레오티드가 TTA이거나, 위치 34 내지 36의 뉴클레오티드가 CTC이거나, 위치 34 내지 36의 뉴클레오티드가 CTT이거나, 위치 34 내지 36의 뉴클레오티드가 CTA이거나, 위치 34 내지 36의 뉴클레오티드가 CTG이거나, 위치 49 내지 51의 뉴클레오티드가 ATA이거나, 위치 49 내지 51의 뉴클레오티드가 ATT이거나, 위치 49 내지 51의 뉴클레오티드가 ATC이거나, 위치 178 내지 180의 뉴클레오티드가 CAC이거나, 위치 178 내지 180의 뉴클레오티드가 CAT이거나, 위치 190 내지 192의 뉴클레오티드가 TGT이거나, 위치 190 내지 192의 뉴클레오티드가 TGC이거나, 위치 190 내지 192의 뉴클레오티드가 GTA이거나, 위치 190 내지 192의 뉴클레오티드가 GTT이거나, 위치 190 내지 192의 뉴클레오티드가 GTC이거나, 위치 190 내지 192의 뉴클레오티드가 GTG이거나, 위치 193 내지 195의 뉴클레오티드가 GTG이거나, 위치 193 내지 195의 뉴클레오티드가 GTC이거나, 위치 193 내지 195의 뉴클레오티드가 GTA이거나, 위치 193 내지 195의 뉴클레오티드가 GTT이거나, 위치 202 내지 204의 뉴클레오티드가 ATA이거나, 위치 202 내지 204의 뉴클레오티드가 ATT이거나, 위치 202 내지 204의 뉴클레오티드가 ATC이거나, 위치 202 내지 204의 뉴클레오티드가 GCT이거나, 위치 202 내지 204의 뉴클레오티드가 GCG이거나, 위치 202 내지 204의 뉴클레오티드가 GCC이거나, 위치 202 내지 204의 뉴클레오티드가 GCA이거나, 위치 235 내지 237의 뉴클레오티드가 CCA이거나, 위치 235 내지 237의 뉴클레오티드가 CCC이거나, 위치 235 내지 237의 뉴클레오티드가 CCG 임.
본 발명은 하기 서열 변이체들 중 하나 이상, 또는 모두를 포함하는 서열 번호 190 을 갖는 분리 또는 재조합 폴리펩티드를 제공한다: 아미노산 위치8의 아스파르트산이 페닐알라닌이거나, 아미노산 위치 11의 글루타민이 히스티딘이거나, 아미노산 위치 12의 아스파라긴이 류신이거나, 아미노산 위치 17의 글리신이 이소류신이거나, 아미노산 위치 23의 트레오닌이 야행형 코돈 이외의 코돈에 의해 암호화되는 트레오닌이거나, 아미노산 위치 60의 글리신이 히스티딘이거나, 아미노산 위치 64의 프롤린이 시스테인이거나, 아미노산 위치 64의 프롤린이 발린이거나, 아미노산 위치 65의 세린이 발린이거나, 아미노산 위치68의 글리신이 이소류신이거나, 아미노산 위치 68의 글리신이 알라닌이거나, 아미노산 위치 79의 세린이 프롤린임. 한 측면에서, 폴리펩티드는 자일라나제 활성, 예컨대 열안정성을 갖는 자일라나제 활성을 가진다.
본 발명은 표 1 또는 표 2에서 표시되는 하나 이상, 또는 모든 서열 변형을 포함하는 서열 번호 189를 갖는 분리 또는 재조합 핵산을 제공한다. 본 발명은 표 1 또는 표 2에서 표시되는 하나 이상, 또는 모든 서열 변형을 포함하는 서열 번호 189를 갖는 분리 또는 재조합 폴리펩티드를 제공한다. 한 측면에서, 폴리펩티드는 자일라나제 활성, 예컨대 열안정성을 갖는 자일라나제 활성을 가진다.
본 발명은 하기 서열 변이체들 중 하나 이상, 또는 모두를 포함하는 서열 번호 379를 갖는 분리 또는 재조합 핵산을 제공한다: 위치 22 내지 24의 뉴클레오티드가 TTC이거나, 위치 31 내지 33의 뉴클레오티드가 CAC이거나, 위치 49 내지 51의뉴클레오티드가 ATA이거나, 위치178 내지 180의 뉴클레오티드가 CAC이거나, 위치 193 내지 195의 뉴클레오티드가 GTG이거나, 위치 202 내지 204의 뉴클레오티드가 GCT 임.
본 발명은 하기 서열 변이체들 중 하나 이상, 또는 모두를 포함하는 서열 번호 380 을 갖는 분리 또는 재조합 폴리펩티드를 제공한다: D8F, QllH, G17I, G60H, S65V 및/또는 G68A. 한 측면에서, 폴리펩티드는 자일라나제 활성, 예컨대 열안정성을 갖는 자일라나제 활성을 가진다.
본 발명의 분리 또는 재조합 핵산은 또한 "A 군 핵산 서열"이라고 칭해진다. 본 발명은 A 군 핵산 서열, 그것과 실질적으로 동일한 서열 및 그것과 상보적인 서열에서 표시되는 서열의 10개 이상의 연속 염기들을 포함하는 분리 핵산을 제공한다.
본 발명의 예시적 서열의 기능적 절편을 포함하는 본 발명의 분리 또는 재조합 폴리펩티드는 또한 "B 군 아미노산 서열"이라고 칭해진다. 본 발명의 또 다른 측면은, B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열의 10개 이상의 아미노산을 갖는 폴리펩티드를 암호화하는 분리 또는 재조합 핵산이다. 또 다른 측면에서, 본 발명은 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열을 갖는 정제된 폴리펩티드를 제공한다. 본 발명의 또 다른 측면은, B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열을 갖는 폴리펩티드에 특이적으로 결합하는 분리 또는 정제된 항체이다.
본 발명의 또 다른 측면은 B 군 아미노산 서열 및 그것과 실질적으로 동일한서열의 폴리펩티드들 중 하나의 10개 이상의 연속 아미노산을 갖는 폴리펩티드에 특이적으로 결합하는 분리 또는 정제된 항체, 또는 그것의 결합 절편이다.
본 발명의 또 다른 측면은 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열을 갖는 폴리펩티드의 제조 방법이다. 본 방법은 프로모터에 작동적으로 연결된, 폴리펩티드를 암호화하는 핵산을 숙주 세포에 도입하고, 핵산의 발현을 허용하는 조건 하에서 숙주 세포를 배양하는 것을 포함한다. 본 발명의 또 다른 측면은 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 10개 이상의 연속 아미노산을 갖는 폴리펩티드의 제조 방법이다. 본 방법은 프로모터에 작동적으로 연결된, 폴리펩티드를 암호화하는 핵산을 숙주 세포에 도입하고, 핵산의 발현을 허용하는 조건 하에서 숙주 세포를 배양함으로써, 폴리펩티드를 제조하는 것을 포함한다.
본 발명의 또 다른 측면은 A 군 핵산 서열, 그것과 실질적으로 동일한 서열, A 군 핵산 서열의 서열과 상보적인 서열, 상기 서열의 30개 이상의 연속 뉴클레오티드를 포함하는 절편에서 표시되는 서열을 갖는 핵산을 수득하고, 서열 내의 하나 이상의 뉴클레오티드를 또 다른 뉴클레오티드로 바꾸거나, 서열 내의 하나 이상의 뉴클레오티드를 결실시키거나, 서열 내의 하나 이상의 뉴클레오티드를 부가하는 것을 포함하는 변이체의 생성 방법이다.
본 발명의 또 다른 측면은 A 군 핵산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열, 또는 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열을 저장하고 있는 컴퓨터 판독가능한 매체이다.
본 발명의 또 다른 측면은 A 군 핵산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열, 또는 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열을 갖는 폴리펩티드를 저장하고 있는 데이터 저장 장치, 및 프로세서를 포함하는 컴퓨터 시스템이다.
본 발명의 또 다른 측면은 A 군 핵산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열, 또는 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티드 코드를 갖는 핵산인 제1 서열을 참조 서열과 비교하는 방법이다. 본 방법은 서열을 비교하는 컴퓨터 프로그램의 사용을 통해 제1 서열 및 참조 서열을 읽고, 컴퓨터 프로그램을 이용하여 제1 서열 및 참조 서열 간의 차이를 결정하는 것을 포함한다.
본 발명의 또 다른 측면은 A 군 핵산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열, 또는 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열을 갖는 폴리펩티드 내의 특징을 동정하는 방법으로서, 서열 내의 특징을 동정하는 컴퓨터 프로그램의 사용을 통해 서열을 읽음; 및 컴퓨터 프로그램을 이용하여 서열 내의 특징을 동정함을 포함하는 방법이다.
본 발명의 또 다른 측면은, 자일란 또는 그것의 유도체의 파괴에서 촉매 작용하는 방법으로서, 자일란의 파괴를 촉진하는 조건 하에서, 자일란 또는 그것의 유도체를 함유하는 샘플을 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티드를 접촉시키는 단계를 포함하는 방법이다.
본 발명의 또 다른 측면은 B 군 아미노산 서열 및 그것과 실질적으로 동일한서열의 폴리펩티드의 효소적 기능을 보유하는, B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 절편 또는 변이체를 동정하는 검정법이다. 그 검정법은 폴리펩티드 절편 또는 변이체가 기능하도록 하는 조건 하에서, B 군 아미노산 서열, 그것과 실질적으로 동일한 서열의 폴리펩티드, 또는 폴리펩티드 절편 또는 변이체를 기질 분자와 접촉시킴, 및 기질 수준의 감소 또는, 폴리펩티드 및 기질 간의 반응의 특이적 반응 생성물 수준의 증가를 탐지함으로써, 상기 서열의 절편 또는 변이체를 동정함.
본 발명의 또 다른 측면은 A 군 핵산 서열로 구성된 군으로부터 선택되는 핵산 서열의 핵산 표적 영역과 50% 이상 상보적이고, 온화한 조건 내지 매우 엄격 조건 하에서 핵산 표적 영역에 대해 하이브리드화하여, 탐지가능한 표적:프로브 이중체를 형성하는 10개 이상의 연속 뉴클레오티드의 한 세그먼트를 가지는, 약 10 내지 50개의 뉴클레오티드의 길이를 갖는 올리고뉴클레오티드의 핵산 프로브이다.
본 발명의 또 다른 측면은 A 군 핵산 서열 중 하나의 하나 이상의 절편과 동일하거나 그와 전부 상보적인 서열을 갖는 자일라나제 유전자의 분리 또는 동정을 위한 폴리뉴클레오티드 프로브이다.
또 다른 측면에서, 본 발명은 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열로부터 선택된 아미노산 서열을 갖는 폴리펩티드를 포함하는, 액체인 단백질 제제를 제공한다.
본 발명의 또 다른 측면은 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열로부터 선택된 아미노산 서열을 갖는 폴리펩티드를 포함하는, 고체인 단백질제제를 제공한다.
본 발명의 또 다른 측면은 A 군 핵산 서열, 그것과 실질적으로 동일한 서열 및 그것과 상보적인 서열로부터 선택되는 폴리뉴클레오티드에 의해 암호화되는 하나 이상의 폴리펩티드와 하나 이상의 작은 분자를 혼합하여, 하나 이상의 생촉매적 반응을 통해 하나 이상의 변형된 작은 분자를 제조하는 단계를 포함하는 작은 분자의 변형 방법으로서, 하나 이상의 폴리펩티드가 자일라나제 활성을 가지는 방법을 제공한다.
본 발명의 또 다른 측면은 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 서열의 클로닝 벡터로서, 상기 서열이 A 군 핵산 서열, 그것과 실질적으로 동일한 서열 및 그것과 상보적인 서열로부터 선택되는 클로닝 벡터이다.
본 발명의 또 다른 측면은 자일라나제 활성을 갖는 폴리펩티드를 코팅하는 서열을 포함하는 숙주 세포로서, 상기 서열이 A 군 핵산 서열, 그것과 실질적으로 동일한 서열 및 그것과 상보적인 서열로부터 선택되는 숙주 세포이다.
또 다른 측면에서, 본 발명은 A 군 핵산 서열, 그것과 실질적으로 동일한 서열, 그것과 상보적인 서열로부터 선택되는 서열을 갖는 폴리뉴클레오티드 및, 엄격함이 낮은 조건, 중간인 조건 및 높은 조건 하에서 상기 서열들 중 임의의 서열을 갖는 핵산에 대해 하이브리드화하는 분리된 핵산을 포함하는 숙주 세포에서 복제가능한 발현 벡터를 제공한다.
또 다른 한 측면에서, 본 발명은 도우를 컨디셔닝하기에 충분한 조건 하에서, 도우를 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 하나 이상의폴리펩티드와 접촉시키는 것을 포함하는 도우의 컨디셔닝 방법을 제공한다.
본 발명의 또 다른 측면은 맥아즙 또는 맥주의 점도를 감소시키기에 충분한 조건 하에서, B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 하나 이상의 폴리펩티드의 투여를 포함하는 음료 제조 방법이다.
본 발명의 자일라나제는 포유동물 사료 내의 고분자량의 아라비노자일란을 파괴하는데 사용된다. 본 발명의 자일라나제의 첨가는 분해성을 향상시킴으로써 성장 속도를 자극하고, 이는 또한 동물의 새끼의 품질을 향상시킨다. 자일라나제는 위장관을 통해, 장내 점도를 감소시키고, 췌장 효소의 확산을 증가시키는 기능을 한다. 부가적으로, 본 발명의 자일라나제는 사료 그레인 및 식물성 단백질의 배젖 세포벽의 처리에 사용될 수 있다. 본 발명의 한 측면에서, 본 발명의 신규 자일라나제를 동물에게 투여하여, 식품 내의 자일란의 유용을 증가시킨다. 본 발명의 자일라나제의 그러한 활성은 세포벽 내의 영양성분들을 유리시키면서 불용성 세포벽 물질을 파괴하여, 동물에게 유용될 수 있도록 한다. 그것은 또한 헤미셀룰로스를 영양 당으로 변화시켜, 세포벽 내에 이전에 포획된 영양성분들이 해리되도록 한다. 자일라나제는 또한 반추 미생물총을 위한 영양원일 수 있는 화합물을 생성시킨다.
본 발명의 또 다른 측면은 동물의 식이법에 있어서 자일라나제를 영양 보충물로 이용하는 방법으로서, B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 30개 이상의 연속 아미노산을 포함하는 재조합 자일라나제 효소를 갖는 영양 보충물을 제조함, 및 그 영양 보충물을 동물에게 투여하여, 동물에 의해 분해되는 식품 내에 함유된 자일란의 유용을 증가시킴을 포함하는 방법을 제공한다.
본 발명의 또 다른 측면에서, 동물에게 자일라나제 보충물을 전달하는 방법으로서, 그래뉼리트 식용성 담체 및 열안정성을 갖는 재조합 자일라나제 효소를 포함하는 펠릿 형태의 식용성 효소 전달 매트릭스를 제조함(여기에서 입자는, 수성 매질 내에 함유된 자일라나제 효소를 용이하게 분산시킴), 및 식용성 효소 전달 매트릭스를 동물에게 투여함을 포함하는 방법을 제공한다. 그래뉼리트 식용성 담체는 오일이 소비된 곡물 배아, 건초, 알팔파, 큰조아재비, 콩 꼬투리, 해바라기 씨분 및 보리 미드로 구성된 군으로부터 선택되는 담체를 포함할 수 있다. 자일라나제 효소는 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 아미노산 서열을 가질 수 있다.
또 다른 한 측면에서, 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 서열을 포함하는 분리된 핵산으로서, 서열이 A 군 핵산 서열, 그것과 실질적으로 동일한 서열 및 그것과 상보적인 서열로부터 선택되고, 서열이 시그널 서열을 함유하는 분리된 핵산을 제공한다. 본 발명은 또한 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 서열을 포함하는 분리된 핵산으로서, 서열이 A 군 핵산 서열, 그것과 실질적으로 동일한 서열 및 그것과 상보적인 서열로부터 선택되고, 서열이 또 다른 자일라나제로부터 시그널 서열을 함유하는 분리된 핵산을 제공한다. 부가적으로, 본 발명은 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 서열을 포함하는 분리된 핵산으로서, 서열이 A 군 핵산 서열, 그것과 실질적으로 동일한 서열 및 그것과 상보적인 서열로부터 선택되고, 서열이 시그널 서열을 함유하지 않는 분리된 핵산을 제공한다.
본 발명의 또 다른 측면은 서열 번호 189의 돌연변이인 분리된 핵산을 제공한다. 또 다른 측면은 서열 번호 190의 돌연변이인 아미노산 서열을 제공한다.
본 발명의 하나 이상의 구현예의 상세한 설명은 이하 첨부 도면 및 발명의 상세한 설명에 의해 설명된다. 본 발명의 다른 특성, 목적 및 이점은 발명의 상세한 설명 및 도면으로부터, 또한 특허청구범위로부터 명백해질 것이다.
본원에 인용된 모든 공보, 특허, 특허 출원, GenBank 서열 및 ATCC 수탁은 모든 목적을 위해 본원에 명시적으로 인용된다.
관련 출원 상호 참조
본 출원은 35 U.S.C. §119(e) 규정 하에 2002년 6월 14일에 출원된 미국 가출원 제60/389,299호를 기초로 하여 우선권을 주장한다. 상기 출원은 전체적으로 모든 목적을 위해 명백히 본원에 참조 인용된다.
본 발명은 효소, 그 효소를 암호화하는 폴리뉴클레오티드, 그러한 폴리뉴클레오티드 및 폴리펩티드의 용도, 더욱 상세하게는 자일라나제 활성을 갖는 효소, 예컨대 내부 β-1,4-자일로시드계 연결기 또는 엔도-β-1,4-글루카나제 연결기의 가수분해에서 촉매 작용하는 효소에 관한 것이다.
하기 도면은 본 발명의 측면들을 설명하기 위한 것으로서, 특허청구범위에 의한 본 발명의 범주를 제한하지 않는 것으로 한다.
특허 또는 출원 파일은 하나 이상의 칼라 도면을 포함한다.
칼라 도면(들)이 포함된 본 특허 또는 특허 출원 공보의 복사본은 요청 시에 필요한 비용을 청구함으로써 제공될 것이다.
도 1은 컴퓨터 시스템의 블록 다이어그램이다.
도 2는 새로운 서열 및 데이터베이스 내의 서열 간의 상동성 수준을 결정하기 위해, 새로운 뉴클레오티드 또는 단백질 서열을 서열의 데이터베이스와 비교하는 방법의 한 측면을 설명하는 플로우 다이어그램이다.
도 3은 2개의 서열이 상동성을 갖는지의 여부를 결정하기 위한 컴퓨터에서의 방법의 한 측면을 설명하는 플로우 다이어그램이다.
도 4는 서열 내의 특징의 존재를 탐지하기 위한 확인자 프로세스 300의 한측면을 설명하는 플로우 다이어그램이다.
도 5는 야생형 서열(서열 번호 189 및 190)와 8x 돌연변이(서열 번호 375 및 376), 표 1에서의 돌연변이체 D, F, H, I, S, V, X 및 AA의 조합체의 활성을 비교하는 그래프이다.
도 6A는 이하 실시예 5에서 상세히 설명되는 바와 같이, 서열 번호 190(서열 번호 189에 의해 암호화됨)의 유전자 부위 포화 돌연변이(GSSMTM)에 의해 생성되는 서열 번호 378(서열 번호 377 에 의해 암호화됨)의 9개의 단일 부위 아미노산 돌연변이체를 설명한다.
도 6B는 이하 실시예 5에서 상세히 설명되는 바와 같이, 각 효소에 대한 DSC 에 의해 결정되는 융점 전이 중간점(Tm)에서의 서열 번호 190 및 서열 번호 378의 풀림을 설명한다.
도 7A은 이하 실시예 5에서 상세히 설명되는 바와 같이, 효소 서열 번호 190 및 서열 번호 378에 대한 pH 및 온도 활성 프로파일을 설명한다.
도 7B은 이하 실시예 5에서 상세히 설명되는 바와 같이, 효소 서열 번호 190 및 서열 번호 378에 대한 속도/온도 활성 최적점을 설명한다.
도 7C은 이하 실시예 5에서 상세히 설명되는 바와 같이, 효소 서열 번호 190 및 서열 번호 378에 대한 내열성/잔류 활성을 설명한다.
도 8A은 이하 실시예 5에서 상세히 설명되는 바와 같이, 내열성 및 활성이 향상된 돌연변이체에 대해 구축되고 선별된 9 GSSMTM점돌연변이의 모든 가능한 조합의 GeneReassemblyTM라이브러리를 설명한다.
도 8B 이하 실시예 5에서 상세히 설명되는 바와 같이, 최적 온도 및 pH 6.0에서, 서열 번호 190("야생형")와 대비되는 "6X-2" 변이체 및 "9X" 변이체(서열 번호 378)의 상대적 활성을 설명한다.
도 9A는 이하 실시예 5에서 상세히 설명되는 바와 같이, 서열 번호 190("야생형") 및 "9X" 변이체(서열 번호 378) 효소에 의한 올리고자일란 (Xyl)3, (Xyl)4, (Xyl)5 및 (Xyl)6의 가수분해 후에 수득되는 지문을 설명한다.
도 9B는 이하 실시예 5에서 상세히 설명되는 바와 같이, 서열 번호 190("야생형") 및 "9X" 변이체(서열 번호 378) 효소에 의한 너도밤나무 자일란의 가수분해 후에 수득되는 지문을 설명한다.
도10A는 이하 실시예 5에서 상세히 설명되는 바와 같이, GSSMTM진화에 의해 수득되는 서열 번호 190("야생형")에 비한, 열안정성(Tm으로 표시)의 향상 수준을 설명하는 도시적 다이어그램이다.
도10B는 이하 실시예 5에서 상세히 설명되는 바와 같이, GSSMTM및 GeneReassemblyTM기술을 조합함으로써 수득되는 서열 번호 378 및 서열 번호 380의 형태의 효소 향상의 "적합성 다이어그램" 을 설명한다.
도 11은 이하 실시예 6에서 상세히 설명되는 바와 같이, 본 발명의 자일라나제가 종이 펄프를 예비 처리하는데 유용한지의 여부를 결정하기 위한 예시적 통상적 선별 프로토콜의 도시적 흐름 다이어그램을 설명한다.
각종 도면에서의 부호는 요소를 가리킨다.
본 발명은 자일라나제 및 그것을 암호화하는 폴리뉴클레오티드, 및 그것의 제조 및 사용 방법에 관한 것이다. 본 발명의 폴리펩티드의 자일라나제 활성은 가수분해효소 활성을 갖는 효소, 예를 들어 자일란 내에 존재하는 글리코시드계 연결기를 가수분해할 수 있는 효소, 예컨대 자일란, 예컨대, 내부 β-1,4-자일로시드계 연결기의 가수분해에서 촉매 작용하는 효소를 포괄한다. 본 발명의 자일라나제는 식품, 사료, 영양 보충물, 텍스타일, 세제 등을 제조하고/하거나 가공하는데 사용될 수 있다. 본 발명의 자일라나제는 약제학적 조성물 및 식이 보조제에서 사용될 수 있다. 본 발명의 자일라나제는 특히 제빵, 동물 사료, 음료 및 종이 가공에서 유용하다.
정의
용어 "항체"는 항원 또는 동위원소와 특이적으로 결합할 수 있는, 펩티드 또는, 면역글로불린 유전자로부터 유도되거나, 면역글로불린 유전자와 유사하게 모델링되거나, 면역글로불린 유전자에 의해 실질적으로 암호화된 폴리펩티드, 또는 그것의 절편을 포함하고, 이에 대해 예컨대 [Fundamental Immunology, 제3판, W. E. Paul 저, Raven Press, N.Y. (1993); Wilson (1994) J. Immunol. Methods 175: 267-273; Yarmush (1992) J. Biochem. Biophys. Methods 25: 85-97]를 참고로 한다. 용어 "항체"는, (i) Fab 절편, VL, VH, CL 및 CH1 도메인으로 구성된 단가 절편; (ii) F(ab') 2 절편, 힌지 영역에서 디술피드 다리 연결된 2 개의 Fab 절편을 포함하는 이가 절편; (iii) VH 및 CH1 도메인으로 구성된 Fd 절편; (iv) 항체의 단일 암의 VL 및 VH 도메인으로 구성되는 Fv 절편; (v) VH 도메인으로 구성되는 dAb 절편(Ward 등 (1989) Nature 341: 544-546); 및 (vi) 분리된 상보적 결정 영역(CDR)을 포함하는, 항원-결합 부분, 즉 항원 결합능을 보유하는 "항원 결합 부위"(예컨대, 절편, 서브서열, 상보적 결정 영역(CDR))를 포함한다. 단일 사슬 항체는 또한 용어 "항체"에서 참고로 포함된다.
본원에 사용된 용어 "어레이" 또는 "마이크로어레이", 또는 "바이오칩" 또는 "칩"은 이하 더욱 상세히 논의되는 바와 같이, 기질 표면의 일정 면적 상에 고정화된 하나 이상의 폴리펩티드(항체 포함) 또는 핵산을 일정량 각기 포함하는 복수의 표적 성분이다.
본원에 사용된 용어 "컴퓨터", "컴퓨터 프로그램" 및 "프로세서"는 그것의 최광의 일반적 문맥으로 사용되며, 이하 상세히 기술되는 것과 같은 장치들을 모두 포함한다. 특별한 폴리펩티드 또는 단백질"의 암호화 서열" 또는 특별한 폴리펩티드 또는 단백질을 "암호화하는 서열" 은, 적당한 조절 서열의 제어 하에 둘 때, 폴리펩티드 또는 단백질로 전사 및 번역되는 핵산 서열이다.
본원에 사용된 표현 "핵산" 또는 "핵산 서열"은 올리고뉴클레오티드, 뉴클레오티드, 폴리뉴클레오티드, 또는 이들 중 임의의 것의 절편, 단일 가닥 또는 이중 가닥일 수 있거나 센스 또는 안티센스 가닥일 수 있는 게놈 또는 합성 기원의 DNA 또는 RNA, 펩티드 핵산(PNA), 또는 천연 또는 합성 기원의 임의의 DNA-형 또는RNA-형 물질을 가리킨다. 표현 "핵산" 또는 "핵산 서열"은 올리고뉴클레오티드, 뉴클레오티드, 폴리뉴클레오티드, 또는 이들 중 임의의 것의 절편, 단일 가닥 또는 이중 가닥일 수 있거나 센스 또는 안티센스 가닥일 수 있는 게놈 또는 합성 기원의 DNA 또는 RNA (예컨대, mRNA, rRNA, tRNA, iRNA), 펩티드 핵산(PNA), 또는 천연 또는 합성 기원의 임의의 DNA-형 또는 RNA-형 물질, 예를 들면 iRNA, 리보뉴클레오 단백질(예컨대, iRNP 등의 이중 가닥 iRNA)을 포함한다. 그 용어는 핵산, 즉 천연 뉴클레오티드의 공지된 상동체를 포함하는 올리고뉴클레오티드를 포괄한다. 그 용어는 또한 합성 골격을 갖는 핵산-형 구조를 포괄하며, 이에 대해서는 예컨대 [Mata (1997) Toxicol. Appl. Pharmacol. 144: 189-197;Strauss-Soukup (1997) Biochemistry 36: 8692-8698; Samstag (1996) Antisense Nucleic Acid Drug Dev 6: 153-156]를 참고로 한다. "올리고뉴클레오티드"에는 화학적으로 합성될 수 있는 단일 가닥의 폴리데옥시뉴클레오티드 또는 2개의 상보적 폴리데옥시뉴클레오티드 가닥을 포함한다. 그러한 합성 올리고뉴클레오티드는 5' 인산염을 가지지 않고, 키나아제의 존재 하에서 ATP 를 갖는 인산염을 첨가하지 않고는 또 다른 올리고뉴클레오티드와 접합되지 않을 것이다. 합성 올리고뉴클레오티드는 탈인산화되지 않은 절편에 접합될 수 있다.
특별한 폴리펩티드 또는 단백질의 "암호화 서열" 또는 특별한 폴리펩티드 또는 단백질을 "암호화하는 뉴클레오티드 서열"은 적당한 조절 서열을 제어하는 경우에서는 폴리펩티드 또는 단백질로 전사 및 번역되는 핵산 서열이다.
용어 "유전자"는 폴리펩티드 사슬의 생성에 관여하는 DNA의 세그먼트를 의미하고; 그것은 적용가능한 경우에는 개별적인 암호화 세그먼트들(엑손) 간의 삽입 서열(인트론)을 비롯하여, 암호화 영역의 선행 및 후행 영역을 포함한다. 본원에 사용된 "작동적으로 연결된" 이라는 표현은 2개 이상의 핵산(예컨대, DNA) 세그먼트들 간의 기능적 관계를 가리킨다. 전형적으로, 그것은 전사된 서열에 대한 전사적 조절 서열의 기능적 관계를 가리킨다. 예를 들어, 프로모터는, 그것이 적당한 숙주 세포 또는 다른 발현 시스템 내의 암호화 서열의 전사를 자극 또는 조절할 경우, 본 발명의 핵산과 같은 암호화 서열에 작동적으로 연결된다. 일반적으로, 전사된 서열에 작동적으로 연결된 프로모터 전사적 조절 서열은 전사된 서열과 물리적으로 접해 있고, 즉 시스-작용한다. 그러나 인핸서와 같은 일부 전사적 조절 서열은 전사가 증진되는 암호화 서열에 물리적으로 접해있거나 매우 근접하게 위치할 필요가 없다.
본원에 사용된 용어 "발현 카세트"는 본 서열과 상용적인 숙주 내에서 구조적 유전자의 발현에 영향을 줄 수 있는 뉴클레오티드 서열(즉, 본 발명의 자일라나제와 같은 단백질 암호화 서열)을 가리킨다. 발현 카세트는 폴리펩티드 암호화 서열에, 또한 임의적으로는 전사 종결 시그널 등의 다른 서열에 작동적으로 연결된 하나 이상의 프로모터를 포함한다. 발현 수행에 필요하거나 도움이 되는 부가적인 인자, 예컨대 인핸서가 사용될 수 있다. 이에 따라서, 발현 카세트는 또한 플라스미드, 발현 벡터, 재조합 바이러스, 임의의 형태의 재조합 "네이키드 DNA" 벡터 등을 포함한다. "벡터"는 세포를 감염시키거나, 트랜스펙션시키거나, 일시적 또는 영구적으로 형질도입할 수 있는 핵산을 포함한다. 벡터는 네이키드 핵산, 또는 단백질이나 지질과 복합화된 핵산일 수 있음을 인지할 것이다. 벡터는 임의적으로 바이러스 및/또는 박테리아 핵산 및/또는 단백질, 및/또는 막(예컨대, 세포막,바이러스 지질 엔벨로프 등)을 포함한다. 벡터는 비제한적으로 DNA의 절편이 부착되거나 복제될 수 있는 레플리콘(예컨대, RNA 레플리콘, 박테리오파지)을 포함한다. 이에 따라, 벡터는 비제한적으로 RNA, 자동적 자기-복제의 원형 또는 선형 DNA 또는 RNA(예컨대, 플라스미드, 바이러스 등, 예컨대 U.S. 특허 No. 5,217,879 참고)을 포함하고, 발현 및 비발현 플라스미드를 모두 포함한다. 세포 배양물의 재조합 미생물이 "발현 벡터" 를 호스팅하는 것으로 기재할 경우, 이는 원형 및 선형 DNA, 및 숙주 염색체(들)에 혼입된 염색체 외부의 DNA를 모두 포함한다. 벡터가 숙주 세포에 의해 유지되고 있는 경우, 이 벡터는 자발적 구조로서의 유사분열 중에 세포에 의해 안정하게 복제되거나,혹은 숙주의 게놈 내에 혼입된다.
본원에 사용된 용어 "프로모터"는 세포 내의 암호화 서열의 전사를 유도할 수 있는 모든 세포들, 예컨대, 식물 세포를 포함한다. 이에 따라, 본 발명의 구성에 사용된 프로모터는 시스-작용 전사적 조절 성분 및, 유전자의 전사 시간 및/또는 속도를 조절 또는 제어하는 조절 서열을 포함한다. 예를 들어, 프로모터는 전사 조절에 관여하는, 인핸서, 프로모터, 전사 종결자, 복제 기원, 염색체 삽입 서열, 5' 및 3' 비번역 영역, 또는 인트론 서열을 포함하는, 시스-작용의 전사적 조절 성분일 수 있다. 이 시스-작용의 서열은 전형적으로 전사를 수행(작동/비작동, 조절, 제어 등) 하기 위해 단백질 또는 다른 생체분자들과 통상적으로 상호작용한다. "구성" 프로모터는 전개 또는 세포 분화의 대부분의 환경적 조건 및 상태 하에서 연속으로 발현을 유도하는 것들이다. "유도가능한" 또는 "제어가능한" 프로모터는 환경적 조건 또는 전개 조건의 영향 하에서 본 발명의 핵산의 발현을 주도한다. 유도성 프로모터에 의해 전사에 영향을 줄 수 있는 환경적 조건의 예는 혐기성 조건, 승온, 건조(수분 고갈), 또는 광 존재를 포함한다.
"조직-특이적" 프로모터는 예컨대 식물 또는 동물 내의 특별한 세포 또는 조직 또는 기관에서 단지 활성을 갖는 전사 조절 성분이다. 조직-특이적 조절은 주어진 조직에 특이적인 단백질을 암호화하는 유전자가 확실히 발현되도록 하는 특정한 고유 인자에 의해 달성될 수 있다. 그러한 인자는 포유동물 및 식물 내에 존재하여, 특정 조직의 엔벨로프를 허용하는 것으로 알려져 있다.
용어 "식물"은 식물의 전체, 식물의 부분(예컨대, 잎, 줄기, 꽃, 뿌리 등), 식물 원형질, 씨 및 식물 세포 및 그것의 자손을 포함한다. 본원의 방법에 사용될 수 있는 식물의 부류는 일반적으로 나자 식물 을 비롯하여 피자 식물(단자엽 및 쌍자엽 식물)을 포함하는, 형질전환 기술을 적용할 수 있는 고급 식물 부류와 같이 넓은 범위이다. 그것은 배수체, 이수체, 반수체 및 반접합자 상태를 포함하는 다양한 수체 수준의 식물을 포함한다. 본원에 사용된 용어 "유전자이식 식물"은 이종 핵산 서열이 삽입된 식물 또는 식물 세포, 예컨대, 본 발명의 핵산 및 각종 재조합 작제물(예컨대, 발현 카세트)을 포함한다.
"플라스미드"는 비제한적으로 시중 입수가능하고, 공개적으로 입수가능하거나, 공개된 절차에 따라 이용가능한 플라스미드로부터 구축될 수 있다. 그러한 것들과 동등한 플라스미드가 당업계에 알려져 있고, 당업자에게 명백하다.
본원에 사용된 "아미노산" 또는 "아미노산 서열"은 올리고펩티드, 펩티드, 폴리펩티드 또는 단백질 서열, 또는 그것들 중 임의의 것의 절편, 부분 또는 서브유니트, 및 천연 또는 합성 분자를 가리킨다.
"아미노산" 또는 "아미노산 서열"은 올리고펩티드, 펩티드, 폴리펩티드 또는 단백질 서열, 또는 그것들 중 임의의 것의 절편, 부분 또는 서브유니트, 및 천연 또는 합성 분자를 가리킨다. 본원에 사용된 용어 "폴리펩티드"는 펩티드 결합 또는 변형된 펩티드 결합에 의해 상호 연결된 아미노산, 즉 펩티드 등가근을 가리키고, 20개의 유전자로 암호화된 아미노산 이외의 변형된 아미노산을 함유할 수 있다. 폴리펩티드는 전사후 가공과 같은 천연 공정, 또는 당업계에 공지된 화학적 변형 기술에 의해 변형될 수 있다. 변형은 펩티드 골격, 아미노산 측쇄 및 아미노 또는 카르복실 말단을 포함하는, 폴리펩티드 내의 임의의 부분에서 일어날 수 있다. 동일한 유형의 변형이 주어진 폴리펩티드 내의 수개 부위에서 동일한 정도 또는 다양한 정도로 존재할 수 있음을 인지한다. 또한 주어진 폴리펩티드는 많은 유형의 변형을 가질 수 있다. 변형은 아세틸화, 아실화, ADP-리보실화, 아미드화, 플라빈의 공유 결합, 헴 단자의 공유 결합, 뉴클레오티드 또는 뉴클레오티드 유도체의 공유 결합, 지질 또는 지질 유도체의 공유 결합, 포스피티딜리노시톨의 공유 결합, 가교 고리화, 디술피드 결합 형성, 탈메틸화, 공유 가교결합의 형성, 시스테인의 형성, 파이로글루타메이트의 형성, 포르밀화, 감마-카르복실화, 글리코실화, GPI 앵커 형성, 히드록실화, 요오드화, 메틸화, 미리스토일화, 산화, 페길화, 자일란 가수분해효소 가공, 인산화, 프레닐화, 라세미화, 셀레노일화, 술페이트화 및, 아르기닐화와 같은, 단백질에 대한 아미노산의 전달-RNA 매개 부가를 포함한다[Creighton, T. E., Proteins-Structure and Molecular Properties 제2판, W. H. Freeman and Company, N.Y. (1993);Posttranslational Covalent Modification of Proteins, B. C. Johnson 저, Academic Press, N.Y., pp. 1-12 (1983) 참고]. 본 발명의 펩티드 및 폴리펩티드는 또한 이하 더욱 상세하게 기재되는, 모든 "미메틱" 및 "펩티도미메틱" 을 포함한다.
본원에 사용된 용어 "분리(된)"는 물질이 본래의 환경(예컨대, 천연 발생될 경우에는 천연 환경)에서 제거됨을 의미한다. 예를 들어, 살아있는 동물 내에 존재하는 천연 발생의 폴리뉴클레오티드 또는 폴리펩티드는 분리되지 않으나, 자연계 내에 공존하는 물질들 중 일부 또는 모두로부터 분리된 동일한 폴리뉴클레오티드 또는 폴리펩티드가 분리된다. 그러한 폴리뉴클레오티드는 벡터의 일부일 수 있고/있거나 및/또는 상기 폴리뉴클레오티드 또는 폴리펩티드는 조성물의 일부일 수 있고, 상기 벡터 또는 조성물은 그것의 천연 환경의 일부가 아님에 분리될 수 있다. 본원에 사용된 "정제(된)"는 절대적인 순수를 요하지 않으며, 상대적인 정의로 의도된다. 라이브러리로부터 수득된 개별적 핵산은 전기영동 상동성을 갖도록 통상적으로 정제화되었다. 이 클론으로부터 수득된 서열은 라이브러리 또는 총 인간 DNA 로부터 직접적으로 수득될 수 없었다. 본 발명의 정제된 핵산은 적어도 104내지 106배로 유기체 내의 나머지 게놈 DNA으로부터 정제되었다. 그러나, 용어 "정제(된)"는 또한 1 차원 이상의 등급, 전형적으로는 2 또는 3 차원, 더욱 통상적으로는4 또는 5 차원의 등급만큼, 나머지 게놈 DNA 또는 라이브러리 또는 다른 환경 내의 다른 서열로부터 정제된 핵산을 포함한다.
본원에 사용된 용어 "재조합" 은, 핵산이 천연 환경 내에서는 인접하지 않은 "골격" 핵산에 인접하고 있음을 의미한다. 부가적으로, 용어 "풍부"는 핵산이 핵산 골격 분자의 집단 중, 핵산 삽입부의 수가 5% 이상을 나타내는 것을 의미한다. 본 발명에 따른 골격 분자는 발현 벡터, 자기 복제 핵산, 바이러스, 일체화 핵산 및, 당 핵산 삽입부를 유지 또는 조작하는데 사용되는 다른 벡터 또는 핵산과 같은 핵산들을 포함한다. 통상적으로, 풍부 핵산은, 재조합 골격 분자의 집단 중 핵산 삽입부의 수가 15% 이상을 나타낸다. 더욱 통상적으로는, 재조합 골격 분자의 집단 중 핵산 삽입부의 수가 50% 이상을 나타낸다. 한 측면에서, 풍부 핵산은 재조합 골격 분자의 집단 중 핵산 삽입부의 수가 90% 이상을 나타낸다.
"재조합" 폴리펩티드 또는 단백질은 재조합 DNA 기술에 의해 제조된, 즉 원하는 폴리펩티드 또는 단백질을 암호화하는 외인성 DNA 작제물에 의해 형질전환된 세포로부터 제조된 폴리펩티드 또는 단백질을 가리킨다. "합성" 폴리펩티드 또는 단백질은 화학적 합성에 의해 제조된 것들이다. 고체상 화학적 펩티드 합성법은 또한 본 발명의 폴리펩티드 또는 절편을 합성하는데 사용될 수 있다. 그러한 방법은 1960년대 초반 이후로 당업계에 공지되어 왔고[Merrifield, R. B., J. Am. Chem. Soc., 85: 2149-2154,1963] (또한 Stewart, J. M. 및 Young, J. D., Solid Phase Peptide Synthesis, 제2판, Pierce Chemical Co., Rockford, Ill., pp.11-12) 참고), 시중 입수가능한 실험용 펩티드 설계 및 합성 키트(Cambridge ResearchBiochemicals)에 최근 이용되었다. 그러한 시중 입수가능한 실험용 키트는 일반적으로 [H. M. Geysen 등,Proc. Natl. Acad. Sci.미국, 81: 3998 (1984)] 의 교시 내용을 이용하였고, 단일 플레이트에 모두 연결되는 다수의 "로드(rod)" 또는 "핀"의 끝에 펩티드의 합성을 제공한다. 그러한 시스템을 이용할 경우, 로드 또는 핀의 플레이트를, 핀 또는 로드의 끝에 적당한 아미노산을 부착 또는 앵커시키기 위한 용액을 함유하는 상응하는 웰 또는 저장부의 두 번째 플레이트에 전환 및 삽입한다. 그러한 공정 단계, 즉 로드 및 핀의 끝을 적당한 용액에 전환 및 삽입하는 단계를 반복함으로써, 아미노산이 원하는데 펩티드에 구축된다. 게다가, 수많은 입수가능한 FMOC 펩티드 합성 시스템이 이용가능하다. 예를 들어, 폴리펩티드 또는 절편의 어셈브리를 어플라이드 바이오시스템사(Applied Biosystems, Inc.)의 모델 431A 자동화 펩티드 합성기를 이용하여 고체 지지체 상에 행할 수 있다. 그러한 장치는 직접적 합성, 또는 다른 공지된 기술들과 조합될 수 있는 일련의 절편 합성에 의해, 본 발명의 펩티드를 수득할 수 있게 한다.
프로모터 서열은 프로모터에서 전사를 개시하는 RNA 폴리머라아제는 암호화서열을 mRNA로 전사할 때, 암호화 서열에 "작동적으로 연결된다".
"플라스미드"는 대문자 및/또는 숫자에 의해 선행 및/또는 후행되는 소문자 "p"로 표시된다. 본원에서의 출발 플라스미드는 비제한적으로 시중 입수가능하고, 공개적으로 입수가능하거나, 공지된 절차에 따라 입수가능한 플라스미드로부터 구축될 수 있다. 게다가, 본원에 기재된 것들과 동등한 플라스미드가 당업계에 알려져 있고, 당업자에게 명백할 것이다.
DNA의 "분해" DNA 내의 특정 서열에서만 작용하는 제한 효소로 DNA의 촉매적 절단을 가리킨다. 본원에 사용된 각종 제한 효소들은 입수 가능하고, 그것들의 반응 조건, 조인자 및 다른 요건들은 당업자에게 공지된 바대로 이용된다. 분석적 목적을 위해, 통상 1 ㎍의 플라스미드 또는 DNA 절편을 약 20 ㎖의 완충액 내의 약 2 단위의 효소와 함께 사용된다. 플라스미드 구축을 위해 DNA 절편을 분리하기 위한 목적으로, 통상 5 내지 50 ㎍의 DNA를 더 큰 체적 내의 20 내지 250 단위의 효소로 분해한다. 특별한 제한 효소에 대한 적당한 완충액 및 기질 양은 제조업자에 의해 특정화된다. 37℃에서 약 1 시간의 배양 시간이 일반적으로 사용되나, 공급업자의 지시에 따라 다양할 수 있다. 분해 후에, 겔 전기영동을 수행하여, 원하는 절편을 분리할 수 있다.
2개의 핵산 또는 폴리펩티드에 관한 기재에서의 표현 "실질적으로 동일한"은 공지된 서열 비교 알고리즘들 중 하나를 이용하거나 시각적으로 조사하여 측정 시, 최대 대등성에 대해 비교하여 배열할 때, 예컨대 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%,87%,88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%,96%, 97%, 98%, 99%, 또는 그 이상의 뉴클레오티드 또는 아미노산 잔기(서열) 상동성을 갖는 2개 이상의 서열을 가리킨다. 통상적으로, 실질적인 상동성은 약 100개 이상의 잔기로 된 영역에 존재하고, 가장 통상적으로는 서열이 약 150 내지 200개 이상의 잔기들에서 실질적으로 동일하다. 일부 측면에서, 서열은 전체 길이의 암호화 영역에서 실질적으로 동일하다.
부가적으로, "실질적으로 동일한" 아미노산 서열은 하나 이상의 보존적 또는 비보존적 아미노산 치환, 결실 또는 삽입에 의해 참조 서열과 상이하게 된 서열로서, 특히 사익 치환이 분자의 활성 부위가 아닌 부위에서 일어날 때의 서열이며, 여기에서 단 폴리펩티드는 본질적으로 기능적 성질을 보유한다. 보존적 아미노산 치환은 예를 들어 하나의 아미노산을 동일 부류의 또 다른 아미노산으로 치환하는 것이다(예컨대, 소수성 아미노산, 예컨대 이소류신, 발린, 류신 또는 메티오닌의 또 다른 아미노산으로의 치환, 또는 하나의 극성 아미노산의 또 다른 아미노산으로의 치환, 예컨대 아르기닌의 리신으로의 치환, 글루탐산의 아스파르트산으로의 치환, 또는 글루타민의 아스파라긴으로의 치환). 하나 이상 아미노산은 예를 들어 자일라나제 폴리펩티드로부터 결실될 수 있고, 이에 생물학적 활성을 상당히 변경시키지 않으면서 폴리펩티드의 구조를 변형시킬 수 있다. 예를 들어, 자일라나제 생물학적 활성을 위해 필요하지 않은 아미노- 또는 카르복실-말단의 아미노산을 제거할 수 있다. 본 발명의 변형된 폴리펩티드 서열은, 변형된 폴리펩티드 서열을 자일라나제 기질과 접촉시키고, 변형된 폴리펩티드가 검정에서 특이적 기질의 양을 감소시키거나, 기능적 자일라나제 폴리펩티드와 기질의 효소적 반응의 생체생성물을 증가시키는지의 여부를 결정하는 것을 포함하는, 임의의 수의 방법들에 의해 자일라나제 생물학적 활성에 대해 검정될 수 있다.
본원에 사용된 "절편"은 2개 이상의 상이한 형태로 존재할 수 있는 천연 발생 단백질의 부분이다. 절편은 천연 발생 단백질과 동일하거나 실질적으로 동일한아미노산 서열을 가질 수 있다. 표현 "실질적으로 동일한"은, 아미노산 서열이 전적으로는 아니나 대체로 동일하고, 그와 관계된 서열의 하나 이상의 기능적 활성을 보유하는 것을 의미한다. 일반적으로, 2개의 아미노산 서열은, 그것들이 85% 이상 동일할 경우에, "실질적으로 동일하거나", "실질적으로 상동성을 가진다". 천연 발생 단백질로서 상이한 3차원 구조를 가지는 절편이 또한 포함된다. 그것의 한 예는, 절단에 의해 변형되어, 상당히 높은 활성을 갖는 성숙 효소를 생성시킬 수 있는 낮은 활성의 프로단백질과 같은 "프로형(pro-form)"의 분자이다.
"하이브리드화"는 핵산 가닥이 염기가 쌍을 지음으로써 상보적 가닥과 연합되는 공정을 가리킨다. 하이브리드화 반응은 당해 서열이 낮은 농도로 존재하고 있는 샘플 내에서도 동정될 수 있도록 민감하고 선택적이어야 한다. 적당하게, 엄격한 조건은 예를 들어 프리하이브리드화 및 하이브리드화 용액 내에서 염 또는 포름아미드의 농도에 의해, 또는 하이브리드화 온도에 의해 정의될 수 있고, 당업계에 공지되어 있다. 특히, 엄격성은 염의 농도를 감소시키고, 포름아미드의 농도를 증가시키거나, 하이브리드화 온도를 승온시킴으로써 증가될 수 있다. 대안적 측면에서, 본 발명의 핵산은 본원에 설명된, 엄격성이 다양한 조건(예컨대, 엄격성이 높거나, 중간이거나, 낮은 조건) 하에서 하이브리드화되는 능력에 의해 정의된다.
예를 들어, 엄격성이 높은 조건 하에서의 하이브리드화는 약 37℃ 내지 42℃에서 약 50% 포름아미드 내에서 일어날 수 있다. 하이브리드화는 약 30℃ 내지 35℃에서 약 35% 내지 25% 포름아미드 내에서 엄격성이 감소된 조건 하에서 일어날 수 있다. 특히, 하이브리드화는 42℃에서의 엄격성이 높은 조건 하에서, 50% 포름아미드, 5X SSPE, 0.3% SDS 및 200 n/ml 전단 및 변성 연어 정자 DNA 내에서 일어날 수 있다. 하이브리드화는 상기 기술한 바와 같은 엄격성이 감소된 조건 하에서, 단 35℃의 감소된 온도에서 35% 포름아미드 내에서 일어날 수 있다. 특별한 수준의 엄격성에 대응하는 온도 범위는, 당해 핵산의 퓨린:피리미딘의 비를 계산하고, 이에 따라 온도를 조정함으로써 더 좁아질 수 있다. 상기 범위 및 조건에서의 다양화는 당업계에 공지되어 있다.
용어 "변이체"는 본 발명의 자일라나제의 생물학적 활성을 여전히 보유하는, 하나 이상의 염기 쌍, 코돈, 인트론, 엑손 또는 아미노산 잔기에서(각기) 변형된 본 발명의 폴리뉴클레오티드 또는 폴리펩티드를 가리킨다. 변이체는 예를 들어 에러 프론 PCR, 셔플링, 올리고뉴클레오티드-지정 돌연변이, 어셈블리 PCR, 성적 PCR 돌연변이, 생체내 돌연변이, 카세트 돌연변이, 순환 앙상블 돌연변이, 지수 앙상블 돌연변이, 부위-특이적 돌연변이, 유전자 리어셈블리(예를 들어, GeneReassemblyTM, 예컨대 U.S. 특허 No. 6,537,776 참고), GSSMTM및 그것의 조합 방법을 포함하는 방법과 같은 임의의 수의 방법들에 의해 제조될 수 있다.
표 1 및 표 2는 GSSMTM에 의해 서열 번호 189(서열 번호 190 암호화)을 돌연변이화시킴으로써 수득되는 변이체들을 열거하고 있다 본 발명은 표 1 및 표 2에 표시된 서열들 중 하나 이상 또는 모두를 갖는 핵산, 즉 서열 번호 189의 변이체인 서열을 갖는 핵산 (여기에서, 변이체들은 표 1 및 표 2에 표시되어 있음), 및 이들 변이체에 의해 암호화되는 폴리펩티드를 제공한다.
(표 1 및 표 2에 나와 있는) 이들 GSSMTM변이체들에게 내열성에 대해 시험하였다 (이하 실시예 참고). 돌연변이체 D, F, G, H,I, J, K, S, T, U, V, W, X, Y, Z, AA, DD 및 EE는 표 1의 돌연변이체들 중 내열성이 가장 높은 것으로 나타났다. 돌연변이체들은 또한 조합되어, 보다 큰 돌연변이를 형성할 수 있다. 예를 들어, 표 1의 돌연변이체 D, F, H,I, S, V, X 및 AA를 조합하여, 서열 번호 375(폴리펩티드 암호화의 핵산) 및 서열 번호 376(아미노산 서열)에서 표시되는 서열을 갖는, "8x"라고 하는 보다 큰 돌연변이체를 형성한다. 도 5는 야생형 서열(서열 번호 189 및190)의 활성을 8x 돌연변이체(서열 번호 259 및 260)와 비교하는 그래프이다. 야생형 및 8x 돌연변이체의 비교 시, 양자의 최적 온도가 65℃이고, 양자의 최적 pH 가 5.5임이 밝혀졌다. 야생형 서열은 65℃에서 1분 미만 동안 안정성을 유지하는 것이 밝혀졌고, 반면 8x 돌연변이체(서열 번호 375 및 376)는 85도에서 10분 초과 동안 안정성을 유지한다는 것이 밝혀졌다. 사용된 기질은 AZO-AZO-자일란이었다. 한 측면에서, 8x 돌연변이체(서열 번호 375 및 376)는 GSSMTM에 의해 진화시켰다. 또 다른 한 측면에서, 야생형은 내열성 진화에 대해 GSSMTM모(parent)이다.
내열성에 있어 "야생형"(서열 번호 189)보다 "향상"되거나 최상으로 변형된 변이체 (서열 번호 189)를 생성시키는, 표 2에 나와 있는 코돈 변이체가 강조되었다. 상기 언급된 바와 같이, 본 발명은 핵산, 및 표 2 및 표1에 표시된 하나, 수개 또는 모두의 변이체들을 포함하고, 상기 핵산을 암호화하는 폴리펩티드를 제공한다.
한 측면에서, B 군 아미노산 서열들 중 아미노산 서열(서열 번호 208)의 아미노산 서열은 단일 아미노산 돌연변이에 의해 변형된다. 한 특정 측면에서, 돌연변이는 아스파라긴의 아스파르트산으로의 돌연변이이다. 수득된 아미노산 서열 및 대응하는 핵산 서열이 서열 번호 252 및 서열 번호 251에 각기 표시되어 있다. 서열 번호 208의 돌연변이와 같이, 효소의 최적 pH 가 향상된 단일 아미노산 돌연변이가 자일라나제에 대해 당업계에 알려져 있다(예컨대, Joshi, M., Sidhu, G., Pot, I., Brayer, G., Withers, S., McIntosh, L., J. Mol. Bio. 299, 255-279 (2000) 참고). 또한 상기 단일 아미노산 돌연변이에서, 서열의 일부를 서브클로닝 공정에서 제거될 수 있는 것으로 나타났다. 예를 들어, 서열 번호 207 및 서열 번호 251 은 서열이 배열된 영역 상에서, 단지 하나의 뉴클레오티드만이 상이하다. 그러나, 서브클로닝에서 서열 번호 207의 N-말단에 있는 78 뉴클레오티드 영역을 서열 번호 251의 N-말단으로부터 제거되는 것으로 나타났다. 부가적으로, 서열 번호 251 내의 첫 번째 3개의 뉴클레오티드를 ATG로 변경시킨 후, 서열 번호 251의 6 번째 뉴클레오티드에서 점돌연변이를 일으켰다.
용어 "포화 돌연변이", "유전자 부위 포화 돌연변이" 또는 "GSSMTM"는, 이하 상세하게 기술되는 바와 같은, 올리고뉴클레오티드 프라이머를 분해하여, 폴리뉴클레오티드에 점돌연변이를 도입하는 방법을 포함한다.
용어 "최적화 지정 진화 시스템" 또는 "최적화 지정 진화"는 이하 상세하게 설명되는 바와 같은, 관련 핵산 서열, 예컨대 관련 유전자의 절편을 리어셈블링하는 방법을 포함한다.
용어 "합성 접합 리어셈블리" 또는"SLR" 는 이하 상세하게 설명되는 바와 같은, 비-확률론적 양식으로 올리고뉴클레오티드 절편을 접합시키는 방법을 포함한다.
핵산의 생성 및 조작
본 발명은 본 발명의 폴리펩티드를 암호화하는, 발현 벡터와 같은 발현 카세트를 포함하는 핵산(예컨대, 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379; 서열 번호 2, 서열 번호 4, 서열 번호 6, 서열 번호 8,10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18, 서열 번호 20, 서열 번호 22, 서열 번호 24, 서열 번호 26, 서열 번호 28, 서열 번호 30, 서열 번호 32, 서열 번호 34, 서열 번호 36, 서열 번호 38, 서열 번호 40, 서열 번호 42, 서열 번호 44, 서열 번호 46, 서열 번호 48, 서열 번호 50, 서열 번호 52, 서열 번호 54, 서열 번호 56, 서열 번호 58, 서열 번호 60, 서열 번호 62, 서열 번호 64, 서열 번호 66, 서열 번호 68, 서열 번호 70, 서열 번호 72, 서열 번호 74, 서열 번호 76, 서열 번호 78, 서열 번호 80, 서열 번호 82, 서열 번호 84, 서열 번호 86, 서열 번호 88, 서열 번호 90, 서열 번호 92, 서열 번호 94, 서열 번호 96, 서열 번호 98, 서열 번호 100, 서열 번호 102, 서열 번호 104, 서열 번호 106, 서열 번호 108, 서열 번호 110, 서열 번호 112, 서열 번호 114, 서열 번호 116, 서열 번호 118, 서열 번호 120, 서열 번호 122, 서열 번호 124, 서열 번호 126, 서열 번호 128, 서열 번호 130, 서열 번호 132, 서열 번호 134, 서열 번호 136, 서열 번호 138, 서열 번호 140, 서열 번호 142, 서열 번호 144, 서열 번호 146, 서열 번호 148, 서열 번호 150, 서열 번호 152, 서열 번호 154, 서열 번호 156, 서열 번호 158, 서열 번호160, 서열 번호 162, 서열 번호 164, 서열 번호 166, 서열 번호 168, 서열 번호 170, 서열 번호 172, 서열 번호 174, 서열 번호 176, 서열 번호 178, 서열 번호 180, 서열 번호 182, 서열 번호 184, 서열 번호 186, 서열 번호 188, 서열 번호 190, 서열 번호 192, 서열 번호 194, 서열 번호 196, 서열 번호 198, 서열 번호 200, 서열 번호 202, 서열 번호 204, 서열 번호 206, 서열 번호 208, 서열 번호 210, 서열 번호 212, 서열 번호 214, 서열 번호 216, 서열 번호218, 서열 번호 220, 서열 번호 222, 서열 번호 224, 서열 번호 226, 서열 번호 228, 서열 번호 230, 서열 번호 232, 서열 번호 234, 서열 번호 236, 서열 번호 238, 서열 번호 240, 서열 번호 242, 서열 번호 244, 서열 번호 246, 서열 번호 248, 서열 번호 250, 서열 번호 252, 서열 번호 254, 서열 번호 256, 서열 번호 258, 서열 번호 260, 서열 번호 262, 서열 번호 264, 서열 번호266, 서열 번호 268, 서열 번호 270, 서열 번호 272, 서열 번호 274, 서열 번호 276, 서열 번호 278, 서열 번호 280, 서열 번호 282, 서열 번호 284, 서열 번호 286, 서열 번호 288, 서열 번호 290, 서열 번호 292, 서열 번호 294, 서열 번호 296, 서열 번호 298, 서열 번호 300, 서열 번호 302, 서열 번호 304, 서열 번호 306, 서열 번호 308, 서열 번호 310, 서열 번호 312, 서열 번호 314, 서열 번호 316. 서열 번호 318, 서열 번호 320, 서열 번호 322, 서열 번호 324, 서열 번호 326, 서열 번호 328, 서열 번호 330, 서열 번호 332, 서열 번호 334, 서열 번호 336, 서열 번호 338, 서열 번호 340, 서열 번호 342, 서열 번호 344, 서열 번호 346, 서열 번호 348, 서열 번호 350, 서열 번호 352, 서열 번호 354, 서열 번호 356, 서열 번호 358, 서열 번호 360, 서열 번호 362, 서열 번호 364, 서열 번호 366, 서열 번호 368, 서열 번호 370, 서열 번호 372, 서열 번호 374, 서열 번호 376, 서열 번호 378 또는 서열 번호 380에 표시된 폴리펩티드를 암호화하는 핵산)을 제공한다. 본 발명은 또한 본 발명의 핵산을 이용하여, 새로운 자일라나제 서열을 발견하는 방법을 포함한다. 본 발명은 또한 자일라나제 유전자의 발현, 전사, 및 본 발명의 핵산을 이용하는 폴리펩티드를 억제하는 방법을 포함한다. 또한 예컨대 합성 접합리어셈블리, 최적화 지정 진화 시스템 및/또는 포화 돌연변이에 의해, 본 발명의 핵산을 변형시키는 방법도 제공된다.
본 발명의 핵산은 예컨대, cDNA 라이브러리의 클로닝 및 발현, PCR에 의한 메시지 또는 게놈 DNA의 증폭 등에 의해 제조, 분리 및/또는 조작될 수 있다. 예를 들어, 하기 본 발명의 예시적 서열은 하기 원들로부터 초기에 유도되었다:
[표 3]
서열 번호 : 원(source)
1, 2 : 박테리아 원
101, 102 : 환경적 원
103, 104 : 박테리아 원
105, 106 : 환경적 원
107, 108 : 박테리아 원
109, 110 : 환경적 원
11, 12 : 환경적 원
111, 112 : 환경적 원
113, 114 : 환경적 원
115, 116 : 환경적 원
117, 118 : 환경적 원
119, 120 : 환경적 원
121, 122 : 환경적 원
123, 124 : 환경적 원
125, 126 : 환경적 원
127, 128 : 환경적 원
129, 130 : 박테리아 원
13, 14 : 환경적 원
131, 132 : 환경적 원
133, 134 : 환경적 원
135, 136 : 환경적 원
137, 138 : 환경적 원
139, 140 : 환경적 원
141, 142 : 환경적 원
143, 144 : 박테리아 원
145, 146 : 진핵세포 원
147, 148 : 환경적 원
149, 150 : 환경적 원
15, 16 : 환경적 원
151, 152 : 환경적 원
153, 154 : 환경적 원
155, 156 : 환경적 원
157, 158 : 환경적 원
159, 160 : 환경적 원
161, 162 : 환경적 원
163, 164 : 환경적 원
165, 166 : 환경적 원
167, 168 : 환경적 원
169, 170 : 환경적 원
17, 18 : 박테리아 원
171, 172 : 환경적 원
173, 174 : 환경적 원
175, 176 : 환경적 원
177, 178 : 환경적 원
179, 180 : 환경적 원
181, 182 : 환경적 원
183, 184 : 환경적 원
185, 186 : 환경적 원
187, 188 : 환경적 원
189, 190 : 환경적 원
19, 20 : 환경적 원
191, 192 : 환경적 원
193, 194 : 환경적 원
195, 196 : 환경적 원
197, 198 : 환경적 원
199, 200 : 환경적 원
201, 202 : 환경적 원
203, 204 : 환경적 원
205, 206 : 환경적 원
207, 208 : 환경적 원
209, 210 : 환경적 원
21, 22 : 환경적 원
211, 212 : 환경적 원
213, 214 : 환경적 원
215, 216 : 환경적 원
217, 218 : 환경적 원
219, 220 : 환경적 원
221, 222 : 환경적 원
223, 224 : 환경적 원
225, 226 : 환경적 원
227, 228 : 환경적 원
229, 230 : 환경적 원
23, 24 : 환경적 원
231, 232 : 박테리아 원
233, 234 : 환경적 원
235, 236 : 환경적 원
237, 238 : 환경적 원
239, 240 : 환경적 원
241, 242 : 환경적 원
243, 244 : 환경적 원
245, 246 : 환경적 원
247, 248 : 환경적 원
249, 250 : 환경적 원
25, 26 : 환경적 원
251, 252 : 환경적 원
253, 254 : 환경적 원
255, 256 : 환경적 원
257, 258 : 환경적 원
259, 260 : 환경적 원
261, 262 : 환경적 원
263, 264 : 환경적 원
265, 266 : 환경적 원
267, 268 : 박테리아 원
269, 270 : 환경적 원
27, 28 : 환경적 원
271, 272 : 환경적 원
273, 274 : 환경적 원
275, 276 : 환경적 원
277, 278 : 환경적 원
279, 280 : 환경적 원
281, 282 : 환경적 원
283, 284 : 환경적 원
285, 286 : 환경적 원
287, 288 : 환경적 원
289, 290 : 환경적 원
29, 30 : 원시세균 원
291, 292 : 환경적 원
293, 294 : 환경적 원
295, 296 : 환경적 원
297, 298 : 환경적 원
299, 300 : 환경적 원
3, 4 : 환경적 원
301, 302 : 환경적 원
303, 304 : 환경적 원
305, 306 : 박테리아 원
307, 308 : 환경적 원
309, 310 : 환경적 원
31, 32 : 환경적 원
311, 312 : 환경적 원
313, 314 : 박테리아 원
315, 316 : 환경적 원
317, 318 : 환경적 원
319, 320 : 환경적 원
321, 322 : 환경적 원
323, 324 : 환경적 원
325, 326 : 환경적 원
327, 328 : 환경적 원
329, 330 : 환경적 원
33, 34 : 환경적 원
331, 332 : 환경적 원
333, 334 : 환경적 원
335, 336 : 환경적 원
337, 338 : 환경적 원
339, 340 : 환경적 원
341, 342 : 환경적 원
343, 344 : 환경적 원
345, 346 : 환경적 원
347, 348 : 환경적 원
349, 350 : 환경적 원
35, 36 : 환경적 원
351, 352 : 환경적 원
353, 354 : 환경적 원
355, 356 : 환경적 원
357, 358 : 환경적 원
359, 360 : 환경적 원
361, 362 : 환경적 원
363, 364 : 환경적 원
365, 366 : 환경적 원
367, 368 : 환경적 원
369, 370 : 환경적 원
37, 38 : 환경적 원
371, 372 : 환경적 원
373, 374 : 환경적 원
375, 376 : 인공적 원
377, 378 : 인공적 원
39, 40 : 환경적 원
41, 42 : 환경적 원
43, 44 : 환경적 원
45, 46 : 환경적 원
47, 48 : 환경적 원
49, 50 : 환경적 원
5, 6 : 환경적 원
51, 52 : 환경적 원
53, 54 : 박테리아 원
55, 56 : 환경적 원
57, 58 : 환경적 원
59, 60 : 환경적 원
61, 62 : 환경적 원
63, 64 : 환경적 원
65, 66 : 환경적 원
67, 68 : 환경적 원
69, 70 : 환경적 원
7, 8 : 환경적 원
71, 72 : 환경적 원
73, 74 : 환경적 원
75, 76 : 환경적 원
77, 78 : 환경적 원
79, 80 : 환경적 원
81, 82 : 환경적 원
83, 84 : 환경적 원
85, 86 : 박테리아 원
87, 88 : 환경적 원
89, 90 : 박테리아 원
9, 10 : 환경적 원
91, 92 : 환경적 원
93, 94 : 환경적 원
95, 96 : 환경적 원
97, 98 : 환경적 원
99, 100 : 환경적 원
한 측면에서, 본 발명은 환경 원 또는 박테리아 원, 또는 원시세균 원으로부터 유도된다는 공통된 신규성을 갖는 자일라나제를 암호화하는 핵산을 제공한다.
본 발명의 방법을 수행할 때, 상동성 유전자는 본원에 기재된 바와 같이, 주형 핵산을 조작함으로써 변형될 수 있다. 본 발명은 과학 문헌 및 특허 문헌에 잘기재되어 있는, 당업계에 공지된 임의의 방법 또는 프로토콜 또는 장치를 이용하여 수행될 수 있다.
본 발명의 한 측면은, A 군 핵산 서열 및 그것과 실질적으로 동일한 서열, 그것과 상보적인 서열 중 하나, 또는 A 군 핵산 서열(또는 그것과 상보적인 서열)의 서열들 중 하나의 적어도 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 또는 500개의 연속 염기들을 갖는 절편을 포함하는 분리된 핵산이다. 분리된 핵산은 cDNA, 게놈 DNA 및 합성 DNA를 포함하는 DNA를 포함할 수 있다. DNA는 이중 가닥 또는 단일 가닥일 수 있고, 단일 가닥인 경우, 암호화 가닥 또는 비암호화(안티센스) 가닥일 수 있다. 대안적으로, 분리된 핵산은 RNA를 포함할 수 있다.
이하 보다 상세하게 논의되는 바와 같이, A 군 핵산 서열 및 그것과 실질적으로 동일한 서열 중 하나의 분리된 핵산은, B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티들 중 하나, 또는 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티드들 중 하나의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개의 연속 아미노산들을 포함하는 절편을 제조하는데 사용될 수 있다.
따라서, 본 발명의 또 다른 측면은 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티드들 중 하나, 또는 B 군 아미노산 서열의 폴리펩티드들 중 하나의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개의 연속 아미노산들을 포함하는 절편을 암호화하는 분리된 핵산이다. 이들 핵산의 암호화 서열은 A 군 핵산 서열 또는 그것의 절편의 핵산들 중 하나의 암호화 서열들 중 하나와 동일할 수 있거나, B 군 아미노산 서열, 그것과 실질적으로 동일한 서열의 폴리펩티드들 중 하나, 및 B 군 아미노산 서열의 폴리펩티드들 중 하나의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개의 연속 아미노산을 포함하는 절편 중 하나를 암호화하는 상이한 암호화 서열일 수 있으며, 이는 유전 코드의 풍부 또는 퇴화의 결과이다. 유전 코드는 당업자에게 공지되어 있고, 예컨대, [B. Lewin, Genes VI, 옥스포드 대학 출판부(Oxford University Press), 1997]의 제214면에서 수득될 수 있다.
B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티드들 중 하나를 암호화하는 분리된 핵산은, 비제한적으로 하기 것들을 포함할 수 있다: 단지, A 군 핵산 서열 및 그것과 실질적으로 동일한 서열 중 하나의 암호화 서열 및 부가적 암호화 서열, 예컨대 리더 서열 또는 프로단백질 서열 및 비-암호화 서열, 예컨대 암호화 서열의 인트론 또는 5' 및/또는 3' 비-암호화 서열. 본원에 사용된 용어 "폴리펩티드를 암호화하는 폴리뉴클레오티드"는 부가적 암호화 및/또는 비-암호화 서열을 포함하는 폴리뉴클레오티드를 비롯한, 폴리펩티드용 암호화 서열만을 포함하는 폴리뉴클레오티드를 포괄한다.
대안적으로, A 군 핵산 서열 및 그것과 실질적으로 동일한 서열의 핵산 서열은 통상적 기술, 예컨대 부위 지정 돌연변이, 또는 당업자에게 잘 알려진 다른 기술들을 이용하여 돌연변이화하여, A 군 핵산 서열 및 그것과 실질적으로 동일한 서열의 폴리뉴클레오티드에 침묵 변화를 도입할 수 있다. 본원에 사용된 "침묵 변화"는 예를 들어 폴리뉴클레오티드에 의해 암호화되는 아미노산 서열을 변형시키지 않는 변화를 포함한다. 그러한 변화는 숙주 유기체에 빈번하게 일어나는 코돈 또는 코돈 쌍을 도입함으로써, 폴리펩티드를 암호화하는 벡터를 함유하는 숙주 세포에 의해 생성되는 폴리펩티드의 수준을 증가시키기 위해 바람직할 수 있다.
본 발명은 또한 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티드에 있어, 아미노산 치환, 부가, 결실, 융합 및 절단을 가져오는, 뉴클레오티드 변화를 갖는 폴리뉴클레오티드에 관한 것이다. 그러한 뉴클레오티드 변화는 부위 지정 돌연변이, 무작위 화학적 돌연변이, 엑소뉴클레아제 III 결실 및 기타 재조합 재조합 DNA 기술과 같은 기술들을 이용하여 도입될 수 있다. 대안적으로, 그러한 뉴클레오티드 변화는, 본원에서 제공된 바와 같은 엄격성이 높거나 중간이거나 낮은 조건 하에서, A 군 핵산 서열 및 그것과 실질적으로 동일한 서열(또는 그것과 상보적인 서열)의 서열들 중 하나의 적어도 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 또는 500개의 연속 염기들을 포함하는 프로브에 대해 특이적으로 하이브리드화하는 핵산을 동정함으로써 분리되는 천연 발생적 대립유전자형질의 변이체일 수 있다.
일반 기술
본 발명에 사용되는 핵산은, 그것이 RNA, iRNA, 안티센스 핵산, cDNA, 게놈 DNA, 벡터, 바이러스 또는 그것의 하이브리드인지와 상관없이, 유전공학 처리, 증폭 및/또는 발현/재조합 생성되는 각종 원들로부터 분리될 수 있다. 상기 핵산들로부터 생성된 재조합 폴리펩티드(예컨대, 자일라나제)는 개별적으로 분리되거나 클로닝되어, 원하는 활성에 대해 시험한다. 박테리아, 포유동물, 효모, 곤충 또는 식물 세포 발현 시스템을 포함하는 임의의 재조합 발현 시스템이 사용될 수 있다.
대안적으로, 이들 핵산은 예컨대, [Adams(1983) J. Am. Chem. Soc. 105: 661; Belousov (1997) Nucleic Acids Res. 25: 3440-3444; renkel (1995) Free Radio. Biol. Med. 19: 373-380; Blommers (1994) Biochemistry 33:7886-7896; Narang (1979) Meth. Enzymol. 68: 90; Brown (1979) Meth. Enzymol. 68: 109; Beaucage (1981) Tetra. Lett. 22: 1859; U.S. 특허 No. 4,458,066]에 기재된 바와 같은 공지된 화학적 합성 기술에 의해 생체외 합성될 수 있다. 예컨대 서브클로닝, 프로브 라벨링(예컨대, 클레노우(Klenow) 폴리머라아제, 닉(nick) 번역, 증폭을 이용하는 무작위-프라이머 라벨링), 시퀀싱, 하이브리드화 등과 같은 핵산의 조작을 위한 기술이 과학 문헌 및 특허 문헌에 잘 기재되어 있으며, 이에 대해 예컨대, [Sambrook 저, MOLECULAR CLONING : A LABORATORY MANUAL(제2판), 제1-3권, Cold Spring Harbor Laboratory (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Ausubel 저, John Wiley & Sons, Inc., N.Y. (1997); LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY: HYBRIDIZATION WITH NUCLEIC ACID PROBES, 파트 I. Theory and Nucleic Acid Preparation, Tijssen 저, Elsevier, N.Y. (1993)]를 참고로 한다.
본 발명의 방법을 수행하는데 사용되는 핵산을 수득하여 조작하는 또 다른 유용한 수단은, 게놈 샘플로부터 클로닝하고, 원할 경우 예컨대, 게놈 클론 또는 cDNA 클론으로부터 분리 또는 증폭된 삽입부를 선별하여 재클로닝하는 것이다.
본 발명의 방법에 사용되는 핵산의 원은 예컨대, 포유동물 인공 염색체(MAC)에 함유된 게놈 또는 cDNA 라이브러리(예컨대, U.S. 특허 No. 5,721,118 및 6,025,155를 참고로 함); 인간 인공 염색체(예컨대, Rosenfeld (1997) Nat. Genet. 15: 333-335를 참고로 함); 효모 인공 염색체(YAC); 박테리아 인공 염색체(BAC); P1 인공 염색체(예컨대, Woon (1998) Genomics 50: 306-316를 참고로 함); PI-유도 벡터(PAC)(예컨대, Kern (1997) Biotechniques 23: 120-124를 참고로 함); 코스미드, 재조합 바이러스, 파지 또는 플라스미드를 포함한다.
한 측면에서, 본 발명의 폴리펩티드를 암호화하는 핵산을, 번역된 폴리펩티드 또는 그것의 절편의 분비를 주도할 수 있는 리더 서열을 이용하여 적당한 상에서 어셈블링한다.
본 발명은 융합 단백질 및 그것을 암호화하는 핵산을 제공한다. 본 발명의 폴리펩티드는 증가된 안정성 또는 단순화된 정제와 같은 원하는 특성을 부여하는 N-말단 동정 펩티드 등의 이종 펩티드 또는 폴리펩티드에 융합될 수 있다. 본 발명의 펩티드 및 폴리펩티드를 또한, 연결되어 있는 하나 이상의 부가적 도메인을 이용하여, 예컨대 더욱 면역원성을 갖는 펩티드를 생성시켜, 재조합 합성된 펩티드를 더욱 용이하게 분리하고, 이로써 항체 및 항체-발현 B 세포 등을 동정함으로써, 융합 단백질로서 합성 및 발현될 수 있다. 탐지 및 정제를 용이하게 하는 도메인은 예를 들어 금속 킬레이트화 펩티드, 예컨대 고정화된 금속 상의 정제를 허용하는 폴리히스티딘 관 및 히스티딘-트립토판 모듈, 고정화된 면역글로불린 상에 정제를 허용하는 단백질 A 도메인, 및 FLAGS 확장/친화성 정제 시스템(Immunex Corp., 미국 워싱턴주 시애틀 소재)에서 이용되는 도메인을 포함한다. 정제 도메인 및 모티브-포함의 펩티드 또는 폴리펩티드 간의 인자 Xa 또는 엔테로키나아제(Invitrogen, 미국 캘리포니아주 샌디에고 소재)와 같은 절단가능한 링커 서열을 포함한다. 예를 들어, 발현 벡터는 6 개의 히스티딘 잔기에 연결된 동위원소-암호화의 핵산 서열, 및 그 다음에는 티오레독신 및 엔테로키나아제 절단 부위를 포함할 수 있다(예컨대, Williams (1995) Biochemistry 34: 1787-1797; Dobeli (1998) Protein Expr. Purif. 12: 404-414을 참고로 한다). 히스티딘 잔기는 탐지 및 정제를 용이하게 하고, 한편 엔테로키나아제 절단 부위는 나머지 융합 단백질로부터 동위 원소를 정제하는 수단을 제공한다. 융합 단백질을 암호화하는 벡터 및 융합 단백질의 적용이 과학 문헌 및 특허 문헌에 잘 기재되어 있으며, 이는 예컨대 [Kroll (1993) DNA Cell. Biol., 12: 441-53]을 참고로 한다.
전사 및 번역 조절 서열
본 발명은 예컨대 프로모터 또는 인핸서와 같은 발현(예컨대, 전사 또는 번역) 조절 서열(들)에 작동적으로 연결되어, RNA 합성/발현을 주도 또는 조절하는 본 발명의 핵산(예컨대, DNA) 서열을 제공한다. 발현 조절 서열은 발현 벡터 내에 있을 수 있다. 발현 조절 서열은 발현 벡터 내에 있을 수 있다. 예시적 박테리아 프로모터는 lacI, lacZ, T3, T7, gpt, 람다 PR, PL 및 trp 를 포함한다. 예시적 진핵세포 프로모터는 조기 발현 CMV, HSV 티미딘 키나아제, 조기 및 후기 발현 SV40, 레트로바이러스로부터의 LTR 및 마우스 메탈로티오네인 I을 포함한다.
박테리아 내에서 폴리펩티드를 발현하는데 적당한 프로모터는 E. coli lac 또는 trp 프로모터, lacI 프로모터, lacZ 프로모터, T3 프로모터, T7 프로모터,gpt 프로모터, 람다 PR 프로모터, 람다 PL 프로모터, 3-포스포글리세레이트 키나아제(PGK)와 같은 당분해 효소를 암호화하는 오페론으로부터의 프로모터, 및 산 포스파타아제 프로모터를 포함한다. 진핵세포 프로모터는 조기 발현 CMV 프로모터, HSV 티미딘 키나아제 프로모터, 열 쇼크 프로모터, 조기 및 후기 SV40 프로모터, 레트로바이러스로부터의 LTR, 및 마우스 메탈로티오네인-I 프로모터를 포함한다. 원핵 또는 진핵 세포, 또는 그것의 바이러스 내의 유전자 발현을 조절하는 것으로 알려진 다른 프로모터가 또한 사용될 수 있다. 박테리아 내의 폴리펩티드 또는 그것의 절편을 발현하는데 적당한 프로모터는E. coli lac또는trp프로모터,lacI프로모터,lacZ프로모터,T3프로모터,T7프로모터,gpt프로모터,람다 P R 프로모터,람다 P L 프로모터, 3-포스포글리세레이트 키나아제(PGK)와 같은 당분해 효소를 암호화하는 오페론으로부터의 프로모터, 및 산 포스파타아제 프로모터를 포함한다 진균류 프로모터는 α인자 프로모터를 포함한다. 진핵세포 프로모터는 CMV 조기 발현 프로모터, HSV 티미딘 키나아제 프로모터, 열 쇼크 프로모터, 조기 및 후기 발현 SV40 프로모터, 레트로바이러스로부터의 LTR 및 마우스 메탈로티오네인-I 프로모터를 포함한다. 원핵 또는 진핵 세포, 또는 그것의 바이러스 내의 유전자 발현을 조절하는 것으로 알려진 다른 프로모터도 또한 사용될 수 있다.
조직-특이적 식물 프로모터
본 발명은 조직-특이적 방식으로 발현될 수 있는, 예컨대 조직-특이적 방식으로 본 발명의 자일라나제를 발현할 수 있는 발현 카세트를 제공한다. 본 발명은또한 조직-특이적 방식으로 본 발명의 자일라나제를 발현하는 식물 또는 씨를 제공한다. 조직-특이성은 씨, 줄기, 잎, 뿌리, 과실 등에 대한 특이성일 수 있다.
한 측면에서, 식물의 특정 부분 또는 씨 또는 식물 전체에 통해 발현하는데 CaMV 35S 프로모터와 같은 구성 프로모터를 사용할 수 있다. 예를 들어, 과다발현의 경우, 식물, 예컨대, 재생 식물과 같은 식물의 일부 또는 모든 조직들 내의 핵산의 발현을 주도하는 식물 프로모터 절편을 이용할 수 있다. 그러한 프로모터는 본원에서 "구성" 프로모터를 가리키며, 전개 또는 세포 분화의 대부분의 환경적 조건 및 상태 하에서 활성적이다. 구성 프로모터의 예는 꽃양배추 모자이크 바이러스(CaMV) 35S 전사 개시 영역, 아그로박테리움 투메파시엔의 T-DNA로부터 유도되는 1'- 또는 2'-프로모터, 및 당업자에 공지된 다양한 식물 유전자로부터의 다른 전사 개시 영역을 포함한다. 그러한 유전자는 예컨대, 아라비도프시스 유래의ACT11(Huang (1996)Plant Mol. Biol.33: 125-139);아라비도프시스(Arabidopsis)유래의Cat3(GenBank No. U43147, Zhong (1996)Mol. Gen. Genet.251: 196-203);브라시카 나푸스(Brassica napus)유래의 스테아로일-아실 담체 단백질 변성효소를 암호화하는 유전자(Genbank No. X74782, Solocombe (1994)Plant Physiol.104: 1167-1176); 옥수수 유래의GPcl(GenBank No. X15596; Martinez (1989)J. Mol. Biol.208: 551-565); 옥수수 유래의Gpc2(GenBank No. U45855, Manjunath (1997)Plant Mol. Biol.33: 97-112); U.S. 특허 No. 4,962,028; 5,633,440에 기재되어 있는 식물 프로모터를 포함한다.
본 발명은 예컨대, 토바모바이러스 서브게놈 프로모터를 포함할 수 있는 바이러스로부터 유도된 조직-특이적 또는 구성 프로모터(Kumagai (1995) Proc. Natl. Acad. Sci. USA 92: 1679-1683; 강한 체관부-특이적 리포터 유전자 발현을 유도하는 프로모터를 갖는, 감염된 쌀 식물에서 체관부 세포에서만 복제를 하는 쌀 텅그로 바실러스형 바이러스(RTBV); 혈관 성분, 잎살 세포 및 뿌리끝에서 최고의 활성을 갖는 카사바 엽맥 모자이크 바이러스(CVMV) 프로모터(Verdaguer(1996) Plant Mol. Biol. 31: 1129-1139)를 이용한다.
대안적으로, 식물 프로모터는 특정 조직, 기관 또는 세포 유형에서 자일라나제-발현 핵산을 주도할 수 있고(즉, 조직-특이적 프로모터), 그와 다르게는 더욱 정교한 환경적 또는 전개 조절 하에, 또는 유도성 프로모터의 조절 하에 놓일 수 있다. 전사에 영향을 줄 수 있는 환경적 조건의 예는 혐기성 조건, 승온, 광 존재, 또는 화학물질/호르몬의 분무를 포함한다. 예를 들어, 본 발명은 옥수수 유래의 건조-유도성 프로모터(Busk (1997) 이하 동일); 감자로부터 유도되는 저온, 건조 및 고염분 유도성 프로모터(Kirch (1997) Plant Mol. Biol. 33: 897-909). 을 포함한다.
조직-특이적 프로모터는 조직 내에서 전개 단계의 특정 시간 틀 내에서만 전사를 촉진할 수 있다. 예컨대,아라비도프시스(Arabidopsis)LEAFY 유전자 프로모터를 특징으로 하는 [Blazquez (1998) 식물 세포 10: 791-800]를 참고로 한다. 또한,A. 탈리아나(thaliana)꽃 정체성 결정 유전자 AP1의 프로모터 영역 내의 보존된 서열 모티브를 인식하는 전사 인자 SPL3 를 기재하고 있는 [Cardon (1997)Plant J12: 367-77]; 및 정체성 결정 프로모터 eIF4 를 기재하고 있는 [Mandel(1995) Plant Molecular Biology, Vol. 29, pp 995-1004]를 참고로 한다. 특별한 조직의 수명 사이클 전체에 걸쳐 활성적인 조직 특이적 프로모터를 사용할 수 있다. 한 측면에서, 본 발명의 핵산은 면섬유 세포 내에만 주로 활성적인 프로모터에 작동적으로 연결된다. 한 측면에서, 본 발명의 핵산은 [Rinehart (1996) 이하 동일]에 기재된 바와 같이, 면섬유 세포 신장의 단계 중에 주로 활성적인 프로모터에 작동적으로 연결된다. 핵산은 면섬유 세포(Ibid) 내에서 우선적으로 발현되는 Fbl2A 유전자 프로모터에 작동적으로 연결될 수 있다. 또한, 면섬유-특이적 프로모터, 유전자이식 면 식물의 구축 방법에 대해 기재하고 있는 [John (1997) Proc. Natl. Acad. Sci. USA 89: 5769-5773; John 등, U.S. 특허 No. 5,608,148 및 5,602,321]을 참고로 한다. 뿌리-특이적 프로모터는 본 발명의 핵산을 발현하는데 사용될 수 있다. 뿌리-특이적 프로모터의 예는, 알코올 탈수소화효소 유전자로부터의 프로모터를 포함한다[DeLisle (1990) Int. Rev. Cytol. 123: 39-60]. 본 발명의 핵산을 발현하는데 사용될 수 있는 다른 프로모터는 예컨대, 난세포-특이적, 배아-특이적, 배적-특이적, 외피-특이적, 씨 코트-특이적 프로모터, 또는 이들의 일부 조합 프로모터; 잎-특이적 프로모터(예컨대, 옥수수 내의 잎-특이적 프로모터에 대해 기재하고 있는 Busk (1997) Plant J. 11: 1285-1295 를 참고함);아그로박테리움 리조게네스(Agrobacterium rhizogenes)로부터의 ORF13 프로모터(뿌리에서 높은 활성을 나타냄, 예컨대 Hansen (1997) 이하 동일 참고); 옥수수 화분 특이적 프로모터(예컨대, Guerrero (1990) Mol. Gen. Genet. 224: 161-168 참고); 과실 노화 및 잎 이탈 및 보다 적은 정도의 꽃 이탈 중에 활성적인 토마토 프로모터(예컨대,Blume (1997) Plant J. 12: 731-746 참고); 감자 SK2 유전자로부터의 암술-특이적 프로모터(예컨대, Ficker (1997) Plant Mol. Biol. 35: 425431 참고); 외래 유전자를 활성적으로 성장하는 신초 또는 섬유의 표피층에 발현시키는 것을 목표로 하는 것을 유용한 도구로 만드는 유전자이식 알팔파의 성장 및 꽃 생장점의 표피 조직에서 활성적인 완두콩으로부터의 Blec4 유전자; 난세포-특이적 BEL1 유전자 (예컨대 Reiser (1995) Cell 83 : 735-742, GenBank No. U39944 참고); 및/또는 분열조직 및/또는 급속 분할 세포에서 높은 전사 수준을 부여할 수 있는 식물 프로모터 영역에 대해 기재하고 있는 Klee의 U.S. 특허 No. 5,589,583의 프로모터를 포함한다.
대안적으로, 옥신과 같은 식물 호르몬에 노출 시에 유도가능한 식물 프로모터를 본 발명의 핵산을 발현하는데 사용한다. 예를 들어, 본 발명은 대두(Glycine max L.) 내의 옥신-반응 원소 E1 프로모터 절편(AuxREs) (Liu (1997) Plant Physiol. 115: 397-407); 옥신-반응성아라비도프시스(Arabidopsis)GST6 프로모터 (또한 살리실산 및 과산화수소에 대해 반응성임) (Chen (1996) Plant J. 10: 955-966); 담배로부터의 옥신-유도성 parC 프로모터 (Sakai (1996) 37: 906-913); 식물 바이오틴 반응성 성분(Streit (1997) Mol. Plant Microbe Interact. 10: 933-937); 및 스트레스 호르몬 아브시스산에 대해 반응성인 프로모터(Sheen (1996) Science 274: 1900-1902)를 사용할 수 있다.
본 발명의 핵산은 또한, 제초제 또는 항생제와 같은 식물에 투여될 수 있는 화학적 시약에 대해 노출 시에 유도될 수 있는 식물 프로모터에 작동적으로 연결될 수 있다. 예를 들어, 벤젠술폰아미드 제초제 완화제에 의해 활성화된 옥수수 In2-2프로모터를 사용할 수 있고(De Veylder (1997) Plant Cell Physiol. 38: 568-577); 상이한 제초제 완화제의 적용은 뿌리, 배수조직 및 생장점 분열조직에서의 발현을 포함한 유전자 발현 패턴을 유도한다. 암호화 서열은, 아베나 사티바(Avena sativa) L. (귀리) 아르기닌 데카르복시나아제 유전자를 함유하는 유전자이식 담배 식물과 함께 기재된 바와 같은 예컨대 테트라사이클린-유도성 프로모터 (Masgrau (1997) Plant J. 11: 465-473); 또는 살리실산-반응성 성분 (Stange (1997) Plant J. 11: 1315-1324)의 조절 하에 있을 수 있다. 화학적-유도(예컨대, 호르몬- 또는 살충제-) 프로모터, 즉 당 기술분야에서 유전자이식 식물에 적용될 수 있는 화학 물질에 대해 반응성인 프로모터를 이용하여, 본 발명의 폴리펩티드의 발현을 식물의 특별한 전개 단계에서 유도할 수 있다. 이에 따라, 본 발명은 또한 작물의 임의의 전개 단계에서 유도가능하며, 숙주가 옥수수, 쌀, 보리, 밀, 감자 또는 다른 작물들과 같은 식물 종에 제한되지 않는 폴리펩티드를 위한 유도성 유전자 암호화를 갖는 유전자이식 식물을 제공한다.
당업자라면 조직-특이적 식물 프로모터가 표적 조직 외의 조직에서 작동적으로 연결된 서열의 발현을 유도할 수 있음을 인식할 것이다. 이에 따라, 조직-특이적 프로모터는 표적 조직 또는 세포 유형에서 우선적으로 발현을 유도하나, 다른 조직에서도 일부 발현을 초래할 수도 있는 것이다.
본 발명의 핵산은 또한 화학적 시약에 노출 시에 유도가능한 식물 프로모터에 작동적으로 연결될 수 있다. 이 시약은 예컨대, 유전자이식 식물에 분무되는 등, 그 적용이 가능한 제초제, 합성 옥신 또는 항생제를 포함한다. 본 발명의 자일라나제-생성 핵산의 유도성 발현은 사육자가 최적의 자일라나제 발현 및/또는 활성을 갖는 식물을 선택하도록 한다. 이에 따라, 식물 부분의 전개가 조절될 수 있다. 이러한 식으로, 본 발명은 식물 및 식물 부분의 수확을 용이하게 하는 수단을 제공한다. 예를 들어, 각종 구현예에서, 벤젠술폰아미드 제초제 완화제에 의해 활성화된 옥수수 In2-2 프로모터를 사용할 수 있고(De Veylder (1997) Plant Cell Physiol. 38: 568-577) ; 상이한 제초제 완화제의 적용은 뿌리, 배수조직 및 생장점 분열조직에서의 발현을 포함한 유전자 발현 패턴을 유도한다. 암호화 서열은,아베나 사티바(Avena sativa) L.(귀리) 아르기닌 데카르복시나아제 유전자를 함유하는 유전자이식 담배 식물과 함께 기재된 바와 같은 예컨대 테트라사이클린-유도성 프로모터(Masgrau(1997) Plant J. 11: 465-473); 또는 살리실산-반응성 성분(Stange (1997) Plant J. 11: 1315-1324)의 조절 하에 있을 수 있다.
일부 측면에서, 적절한 폴리펩티드 발현은 암호화 영역의 3'-말단에 폴리아데닐화 영역을 요할 수 있다. 폴리아데닐화 영역은 천연 유전자, 다양한 다른 식물(또는 동물 등) 유전자, 또는아그로박테리아(Agrobacterial)T-DNA 내의 유전자로부터 유도될 수 있다.
발현 벡터 및 클로닝 비히클
본 발명은 본 발명의 핵산, 예컨대 본 발명의 자일라나제를 암호화하는 서열을 포함하는 발현 벡터 및 클로닝 비히클을 제공한다. 본 발명의 발현 벡터 및 클로닝 비히클은 바이러스 입자, 바쿨로바이러스, 파지, 플라스미드, 파지미드, 코스미드, 포스미드, 박테리아 인공 염색체, 바이러스 DNA(예컨대, 우두, 아데노바이러스, 계두 바이러스, 가성 광견병 및 SV40의 유도체), PI-기재의 인공 염색체, 효모 플라스미드, 효모 인공 염색체 및, 당해 특정 숙주에 대해 특이적인 임의의 다른 벡터(예컨대, 바실러스, 아스퍼질러스 및 효모)를 포함할 수 있다. 본 발명의 벡터는, 염색체성, 비-염색체성 및 합성 DNA 서열을 포함할 수 있다. 많은 수의 적당한 벡터가 당업자에게 공지되어 있고, 시중 입수가능하다. 예시적 벡터는 하기 것들을 포함한다: 박테리아: pQE 벡터(Qiagen), pBluescript 플라스미드, pNH 벡터, 람다-ZAP 벡터 (Stratagene), ptrc99a, pKK223-3, pDR540, pRIT2T (Pharmacia); 진핵세포: pXTl, pSG5 (Stratagene), pSVK3, pBPV, pMSG, pSVLSV40 (Pharmacia). 그러나, 임의의 다른 플라스미드 또는 다른 벡터가, 그것이 숙주 내에서 복제가능하고 생존가능하다면 사용될 수 있다. 적은 복제 수 또는 큰 복제 수의 벡터를 본 발명에서 사용할 수 있다.
발현 벡터는 프로모터, 번역 개시를 위한 리보솜 결합 부위 및 전사 종결자를 포함할 수 있다. 벡터는 또한 발현 증폭을 위한 적당한 서열을 포함할 수 있다. 포유동물 발현 벡터는 복제 기원, 임의의 필요한 리보솜 결합 부위, 폴리아데닐화 부위, 스플라이스(접합) 도너 및 어셉터 부위, 전사 종결 서열 및 5' 측부 비-전사 서열을 포함할 수 있다. 일부 측면에서, SV40 스플라이스 및 폴리아데닐화 부위로부터 유도된 DNA 서열을 사용하여, 요구되는 비-전사 유전 요소를 제공할 수 있다.
한 측면에서, 발현 벡터는 통상적으로, 벡터를 함유하는 숙주 세포의 선택을 허용하기 위해, 하나 이상 선택가능한 마커 유전자를 함유한다. 그러한 선택가능한 마커는 디히드로폴레이트 환원효소를 암호화하는 유전자, 또는 진핵세포 배양물을위한 네오마이신 내성을 부여하는 유전자, E. coli 내에서 테트라사이클린 또는 암피실린 내성을 부여하는 유전자, 및S. 세레비지아에(cerevisiae)TRP1 유전자를 포함한다. 클로르암페시콜 전달효소(CAT) 벡터 또는 선택가능한 마커를 갖는 다른 벡터를 이용하여, 임의의 원하는 유전자로부터 프로모터 영역을 선택할 수 있다.
진핵세포 내에서 폴리펩티드 또는 그것의 절편을 발현하기 위한 벡터는 또한 발현 수준을 증가시키기 위해 인핸서를 함유할 수 있다. 인핸서는 전사를 증진하기 위해 프로모터 상에 작용하고, 길이가 통상 약 10 내지 약 300 bp인 DNA의 시스-작용 원소이다. 그 예는 복제 기원 bp 100 내지 270의 후측에 있는 SV40 인핸서, 사이토메갈로바이러스 조기 프로모터 인핸서, 복제 기원의 후측에 있는 폴리오마 인핸서, 및 아데노바이러스 인핸서를 포함한다.
핵산 서열은 다양한 절차들에 의해 벡터에 삽입될 수 있다. 일반적으로, 서열은 적당한 제한 엔도뉴클레아제로 삽입부 및 벡터를 분해한 후, 벡터 내에 원하는 위치에 접합된다. 대안적으로, 삽입부 및 벡터의 양자 모두의 블런트 말단이 접합될 수 있다. 다양한 클로닝 기술이, 당업계에 공지되어 있으며, 예컨대 Ausubel 및 Sambrook 등에 의해 공지되어 있다. 그러한 절차 및 기타 절차는 당업자의 범주 내에 포함되는 것으로 한다.
벡터는 플라스미드, 바이러스 입자 또는 파지의 형태일 수 있다. 다른 벡터는 염색체성, 비-염색체성 및 합성 DNA 서열, SV40의 유도체; 박테리아 플라스미드, 파지 DNA, 바쿨로바이러스, 효모 플라스미드, 플라스미드와 파지 DNA의 조합으로부터 유도된 벡터, 바이러스 DNA, 예컨대 우두, 아데노바이러스, 계두 바이러스및 가성 광견병을 포함한다. 원핵 및 진핵 생물계 숙주에 사용하기 위한 다양한 클로닝 및 발현 벡터가 예컨대 Sambrook 에 의해 기재되어 있다.
사용될 수 있는 특별한 박테리아 벡터는, 공지된 클로닝 벡터 pBR322 (ATCC 37017), pKK223-3 (Pharmacia Fine Chemicals, 스웨덴 우프살라 소재), GEM1 (Promega Biotec, 미국 위스콘신주 매디슨 소재) pQE70, pQE60, pQE-9 (Qiagen), pD10, psiX174 pBluescript II KS, pNH8A, pNH16a, pNH18A, pNH46A (Stratagene), ptrc99a, pKK223-3, pKK233-3, DR540, pRIT5 (Pharmacia), pKK232-8 및 pCM7 를 포함하는 유전 요소를 포함하는 시중 입수가능한 플라스미드를 포함한다. 특히 진핵세포 벡터는 pSV2CAT, pOG44, pXTl, pSG (Stratagene) pSVK3, pBPV, pMSG 및 pSVL(Pharmacia)를 포함한다. 그러나, 임의의 다른 벡터도 숙주 세포 내에서 복제가능하고 생존가능하다면 사용될 수 있다.
본 발명의 핵산은 발현 카세트, 벡터 또는 바이러스 내에서 발현될 수 있고, 식물 세포 및 씨 내에서 안정하게 발현될 수 있다. 한 예시적인 일시 발현 시스템은 유전자부체 발현 시스템, 예컨대 초고도 코일 DNA를 함유하는 유전자부체 미니-염색체의 전사에 의해 핵 내에서 생성된 꽃양배추 모자이크 바이러스(CaMV)의 바이러스 RNA 유전자를 이용하며, 이에 대해서는 예컨대, [Covey (1990) Proc. Natl. Acad. Sci. USA 87: 1633-1637]를 참고로 한다. 대안적으로, 암호화 서열, 즉 본 발명의 서열의 모두 또는 서브-절편을, 숙주 염색체 DNA의 일체적 일부가 되는 식물 숙주 세포 게놈에 삽입할 수 있다. 센스 또는 안티센스 전사가 이런 식으로 발현될 수 있다. 본 발명의 핵산으로부터의 서열(예컨대, 프로모터 또는 암호화 영역)을 포함하는 벡터는 식물 세포 또는 씨에 대해 선택가능한 표현형을 부여하는 마커 유전자를 포함할 수 있다. 예를 들어, 마커는 살생제 내성, 특히 항생 내성, 예컨대 카나마이신, G418, 블레오마이신, 하이그로마이신에 대한 내성, 또는 제초제 내성, 예컨대 클로로술푸론 또는 바스타(Basta)에 대한 내성을 암호화할 수 있다.
식물 내에서 핵산 및 단백질을 발현할 수 있는 발현 벡터가 당업계에 공지되어 있고, 이는, 예컨대아그로박테리움 spp., 감자 바이러스 X(예컨대, Angell (1997) EMBO J. 16: 3675-3684 참고), 담배 모자이크 바이러스(예컨대, Casper (1996) Gene 173: 69-73 참고), 토마토 부쉬 왜화 바이러스(예컨대, Hillman (1989) Virology 169: 42-50 참고), 담배 에취 바이러스(예컨대, Dolja (1997) Virology 234: 243-252참고), 강낭콩 금빛 누른 모자이크 바이러스(예컨대, Morinaga (1993) Microbiol. Immunol. 37: 471-476 참고), 꽃양배추 모자이크 바이러스(예컨대, Cecchini (1997) Mol. Plant Microbe Interact. 10: 1094-1101 참고), 옥수수 Ac/Ds 전위성 성분(예컨대, Rubin (1997) Mol. Cell. Biol. 17: 6294-6302; Kunze (1996) Curr. Top. Microbiol. Immunol. 204: 161-194 참고), 및 옥수수 억제자-변이자(Spm) 전위성 성분(예컨대, Schlappi (1996) Plant Mol. Biol. 32: 717-725 참고); 및 그것들의 유도체로부터의 벡터를 포함할 수 있다.
한 측면에서, 발현 벡터는 두 개의 유기체, 예를 들어 발현을 위한 포유동물 세포 또는 곤충 세포에서, 또한 클로닝 및 증폭을 위한 원핵세포 숙주 내에서 유지될 수 있도록 하는 2 개의 복제 시스템을 가질 수 있다. 또한, 발현 벡터의 일체화를 위해, 발현 벡터는 숙주 세포 게놈에 대해 상동성인 하나 이상의 서열을 가질 수 있다. 그것은 발현 작제물의 측면에 설수 있는 2 개의 상동성 서열을 가질 수 있다. 일체화 벡터는 벡터에 포함되기에 적당한 상동성 서열을 선택함으로써, 숙주 세포 내의 특이적 위치에 지정될 수 있다. 일체화 벡터를 위한 작제물이 당업계에 공지되어 있다.
본 발명의 발현 벡터는 또한 형질변환된 박테리아 균주의 선택을 허용하는 선택가능한 마커 유전자, 예컨대 박테리아가 암피실린, 클로로암페니콜, 에리트로마이신, 카나마이신, 네오마이신 및 테트라사이클린과 같은 약물에 대해 내성을 가질 수 있도록 하는 유전자를 포함할 수 있다. 선택가능한 마커는 또한 생합성 유전자, 예컨대 히스티딘, 트립토판 및 류신 생합성 경로에서의 생합성 유전자를 포함할 수 있다.
발현 벡터 내의 DNA 서열은 적당한 발현 조절 서열(들)(프로모터)에 작동적으로 연결되어, RNA 합성을 주도한다. 특히 박테리아 프로모터라고 하는 것은, lacI, lacZ, T3,T7, gpt, 람다 PR, PL및 trp을 포함한다. 진핵세포 프로모터는 조기 발현 CMV, HSV 티미딘 키나아제, 조기 및 후기 발현 SV40, LTR, 및 마우스 메탈로티오네인 I을 포함한다 적당한 벡터 및 프로모터의 선택은 당업자의 수준 내에 포함된다. 발현 벡터는 또한 번역 개시를 위한 리보솜 결합 부위 및 전자 종결자를 함유한다. 벡터는 또한 발현 증폭을 위해 적당한 서열을 포함할 수 있다. 프로모터 영역은 클로르암페니콜 전달효소(CAT) 벡터, 또는 선택가능한 마커를 갖는 기타 벡터를 이용하여 임의의 원하는 유전자로부터 선택될 수 있다. 게다가, 발현 벡터는 바람직하게 하나 이상의 선택가능한 마커 유전자를 함유하여, 예컨대 디히드로폴레이트 환원효소, 또는 진핵세포 배양물을 위한 네오마이신 내성, E. coli 내에서의 테트라사이클린 또는 암피실린 내성과 같은, 형질전환된 숙주 세포의 선택을 위한 표현형을 제공한다.
포유동물 발현 벡터는 또한 복제 기원, 임의의 필요한 리보솜 결합 부위, 폴리아데닐화 부위, 스플라이스 도너 및 어셉터 부위, 전사 종결 서열 및 5' 측부 비-전사 서열을 포함할 수 있다. 일부 측면에서, SV40 스플라이스 및 폴리아데닐화 부위로부터 유도된 DNA 서열을 사용하여, 요구되는 비-전사 유전 요소를 제공할 수 있다.
진핵세포 내에서 폴리펩티드 또는 그것의 절편을 발현하기 위한 벡터는 또한 발현 수준을 증가시키기 위해 인핸서를 함유할 수 있다. 인핸서는 전사를 증진하기 위해 프로모터 상에 작용하고, 길이가 통상 약 10 내지 약 300 bp인DNA의 시스-작용 원소이다. 그 예는 복제 기원 bp 100 내지 270의 후측에 있는 SV40 인핸서, 사이토메갈로바이러스 조기 프로모터 인핸서, 복제 기원의 후측에 있는 폴리오마 인핸서, 및 아데노바이러스 인핸서를 포함한다.
부가적으로, 발현 벡터는 통상적으로 벡터를 함유하는 숙주 세포의 선택을 허용하기 위해, 하나 이상 선택가능한 마커 유전자를 함유한다. 그러한 선택가능한 마커는 디히드로폴레이트 환원효소를 암호화하는 유전자, 또는 진핵세포 배양물을 위한 네오마이신 내성을 부여하는 유전자,E. coli내에서 테트라사이클린 또는 암피실린 내성을 부여하는 유전자, 및 에스. 세레비재 TRP1 유전자를 포함한다.
일부 측면에서, B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티드들 중 하나, 또는 그것의 적어도 약 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는150개 연속 아미노산을 포함하는 절편을 암호화하는 핵산을 적당한 상에서 번역된 폴리펩티드 또는 그것의 절편의 분비를 주도할 수 있는 리더 서열과 함께 어셈블링한다. 임의적으로, 핵산은 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티드들 중 하나, 또는 그것의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개 연속 아미노산을 포함하는 절편이 이종 펩티드 또는 폴리펩티드, 예컨대 증가된 안정성 또는 단순화된 정제와 같은 원하는 특성을 부여하는 N-말단 동정 펩티드에 융합된 융합 폴리펩티드를 암호화할 수 있다.
핵산 서열은 다양한 절차들에 의해 벡터에 삽입될 수 있다. 일반적으로, 서열은 적당한 제한 엔도뉴클레아제로 삽입부 및 벡터를 분해한 후, 벡터 내에 원하는 위치에 접합된다.
대안적으로, 삽입부 및 벡터의 양자 모두의 블런트 말단이 접합될 수 있다. 다양한 클로닝 기술이 [Ausubel 등의 Current Protocols in Molecular Biology, John Wiley 503 Sons, Inc. (1997) 및 Sambrook 등, Molecular Cloning: A Laboratory Manual 제2판, Cold Spring Harbor Laboratory Press (1989)]에 공지되어 있다. 그러한 절차 및 기타 절차는 당업자의 범주 내에 포함되는 것으로 한다.
벡터는 예를 들어 플라스미드, 바이러스 입자 또는 파지의 형태일 수 있다. 다른 벡터는 염색체성, 비-염색체성 및 합성 DNA 서열, SV40의 유도체; 박테리아플라스미드, 파지 DNA, 바쿨로바이러스, 효모 플라스미드, 플라스미드와 파지 DNA의 조합으로부터 유도된 벡터, 바이러스 DNA, 예컨대 우두, 아데노바이러스, 계두 바이러스 및 가성 광견병을 포함한다. 원핵 및 진핵 생물계 숙주에 사용하기 위한 다양한 클로닝 및 발현 벡터가 [Sambrook 등의 Molecular Cloning: A Laboratory Manual, 제2판, Cold Spring Harbor, N.Y. (1989)]에 기재되어 있다.
숙주 세포 및 형질전환된 세포
본 발명은 본 발명의 핵산 서열, 예컨대, 본 발명의 자일라나제 또는 본 발명의 벡터를 암호화하는 서열을 포함하는 형질전환된 세포를 제공한다. 숙주 세포는 당업자에게 잘 알려진 임의의 숙주 세포들일 수 있고, 이는 원핵 세포, 진핵 세포, 예컨대 박테리아 세포, 진균류 세포, 효모 세포, 포유동물 세포, 곤충 세포 또는 식물 세포를 포함한다. 예시적 박테리아 세포는 이. 콜라이(E. coli),스트렙토마이세스(Streptomyces),바실러스 섭틸리스(Bacillus subtilis),살모넬라 티피무리움(Salmonella typhimurium)및, 슈도모나스(Pseudomonas),스트렙토마이세스(Streptomyces)및 스타필로코쿠스(Staphylococcus)속에 속하는 각종 종들을 포함한다. 예시적 곤충 세포는 드로소필라(Drosophila) S2및 스포도프테라(Spodoptera) Sf9를 포함한다. 예시적 동물 세포는 CHO, COS 또는 바우스 흑색종(Bowes melanoma) 또는 임의의 마우스 또는 인간 세포주를 포함한다. 적당한 숙주의 선택은 당업자의 역량 내이다. 매우 다양한 고급 식물 종들의 형질전환 기술들이 공지되어 있고, 기술 및 과학 문헌에 기재되어 있다. 이에 대해, 예컨대 [Weising (1988) Ann. Rev. Genet. 22: 421-477; U.S. 특허 No. 5,750,870]를 참고로 한다.
벡터는 형질전환, 트랜스펙션, 형질도입, 바이러스 감염, 유전자 총 또는 Ti-매개 유전자 전달을 포함하는 다양한 기술들 중 임의의 기술을 이용하여 숙주 세포에 도입될 수 있다. 특별한 방법은 인산칼슘 트랜스펙션, DEAE-Dextran 매개 트랜스펙션, 리포펙션 또는 전기천공[Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology (1986)]을 포함한다.
한 측면에서, 본 발명의 핵산 또는 벡터를 선별을 위한 세포에 도입하여, 후속되는 핵산의 발현에 적당한 방식으로 핵산이 세포에 들어가게 된다. 도입 방법은 대체로 표적 세포 유형에 의해 정해진다. 예시적 방법은 CaPO4석출법, 리포솜 융합, 리포펙션(예컨대, LIPOFECTINTM), 전기천공, 바이러스 감염 등을 포함한다. 후보 핵산은 안정하게 숙주 세포의 게놈으로 일체화될 수 있거나(예를 들어, 레트로바이러스 도입을 이용), 세포질에 일시적으로 또는 안정하게 존재할 수 있다(즉, 표준 조절 서열, 선택 마커 등을 이용하여, 전통적인 플라스미드의 이용을 통해). 많은 약제학적으로 중요한 선별이 인간 또는 모델 포유동물 세포 표적을 필요로 하기 때문에, 그러한 표적을 트랜스펙션할 수 있는 레트로바이러스 벡터를 사용할 수 있다.
적당한 경우, 공학처리된 숙주 세포를, 프로모터의 활성화, 형질변이체의 선택 또는 본 발명의 유전자 증폭에 적당하게 변형된 통상적인 영양 배지에서 배양할 수 있다. 적당한 숙주 균주의 형질전환 및 적당한 세포 밀도에 대한 숙주 균주의성질에 따라, 선택된 프로모터는 적당한 수단(예컨대, 온도 이동 또는 화학적 유도)을 이용하여 유도될 수 있고, 세포는 원하는 폴리펩티드 또는 그것의 절편을 생성시키도록 하는 부가적 기간동안 배양될 수 있다.
세포는 원심분리 및 물리적 또는 화학적 수단에 의한 붕괴로써 수득될 수 있고, 이에 수득된 조질의 추출물을 추가 정제를 위해 보유한다. 단백질의 발현을 위해 이용되는 미생물 세포는 냉해동 사이클링, 초음파처리, 기계적 붕괴 또는 세포 분해제의 이용을 포함하는 임의의 통상적인 방법에 의해 붕괴될 수 있다. 그러한 방법은 당업자에게 공지되어 있다. 발현된 폴리펩티드 또는 그것의 절편은 황산암모늄 또는 에탄올 석출, 산 추출, 음이온 또는 양이온 교환 크로마토그래피, 포스포셀룰로스 크로마토그래피, 소수성 상호작용 크로마토그래피, 친수성 크로마토그래피, 히드록시라파타이트 크로마토그래피 및 레시틴 크로마토그래피를 포함하는 방법에 의해 재조합 세포 배양물로부터 회수 및 정제될 수 있다. 폴리펩티드의 형상(configuration)을 완성할 때, 필요한 경우, 단백질 재풀림 단계를 이용할 수 있다. 원할 경우, 고성능 액체 크로마토그래피(HPLC)를 최종 정제 단계를 위해 이용할 수 있다.
숙주 세포 내의 작제물을 통상적 방식으로 이용하여, 재조합 서열에 의해 암호화되는 유전자 산물을 생성할 수 있다. 재조합 생성 절차에서 이용되는 숙주에 따라, 벡터를 함유하는 숙주 세포에 의해 생성되는 폴리펩티드는 글리코실화되거나, 비-글리코실화될 수 있다. 본 발명의 폴리펩티드는 개시 메티오닌 아미노산 잔기를 포함하거나 포함하지 않을 수 있다.
세포-비함유 번역 시스템을 또한 이용하여, 본 발명의 폴리펩티드를 생성시킬 수 있다. 세포-비함유 번역 시스템은 폴리펩티드 또는 그것의 절편을 암호화하는 핵산에 작동적으로 연결된 프로모터를 포함하는 DNA 작제물로부터 전사된 mRNA를 사용할 수 있다. 일부 측면에서, DNA 작제물은 생체외 전사 반응을 수행하기 전에 선형화될 수 있다. 이어서, 전사된 mRNA를 토끼 망상적혈구 추출물과 같은 적당한 세포-비함유 번역 추출물과 함께 항온처리하여, 원하는 폴리펩티드 또는 그것의 절편을 생성시킨다.
발현 벡터는 하나 이상 선택가능성 마커 유전자를 함유하여, 디히드로폴레이트 환원효소 또는 진핵세포 배양물을 위한 네오마이신 내성,E. coli내에서 테트라사이클린 또는 암피실린 내성과 같은 형질전환된 숙주 세포의 선택을 위한 표현형을 제공할 수 있다.
당해 폴리뉴클레오티드, 예컨대 본 발명의 핵산을 함유하는 숙주 세포를, 프로모터의 활성화, 형질전환체의 선택 또는 유전자의 증폭에 적당하게 변형된 통상적인 영양 배지에서 배양할 수 있다. 배양 조건, 예컨대 온도, pH 등은 발현을 위해 선택된 숙주 세포에서 이전에 사용된 것들과 동일하고, 이는 당업자에게 명백할 것이다. 이어서, 특이화 효소 활성을 갖는 것으로 동정된 클론을 시퀀싱하여, 증진된 활성을 갖는 효소를 암호화하는 폴리뉴클레오티드 서열을 동정한다.
본 발명은 본 발명의 핵산, 예컨대, 약 100개 이상의 잔기로 된 영역 상에, 핵산 A 군 핵산 서열의 서열에 대해, 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%,62%,63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%,72%, 73%, 74%, 75%, 76%, 77%,78%, 79%,80%, 81%, 82%,83%, 84%, 85%,86%, 87%, 88%,89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 상동성을 갖는 핵산 서열을 포함하는 핵산(여기에서 서열 상동성은 서열 비교 알고리즘을 이용하는 분석 또는 시각적 조사에 의해 결정됨), 또는 A 군 핵산 서열, 또는 그것의 서브서열에서 표시되는 핵산 서열에 대해 엄격한 조건 하에 하이브리드화하는 핵산을 갖는 벡터를 발현하는 것을 포함하는 세포 내에서의 재조합 자일라나제을 과다발현시키는 방법을 제공한다. 과다발현은 임의의 수단, 예컨대 고활성 프로모터, 디시스트로닉 벡터 또는 벡터의 유전자 증폭을 이용하여 수행될 수 있다.
본 발명의 핵산은 임의의 생체내 또는 생체외 발현 시스템에서 발현될 수 있다. 임의의 세포 배양물 시스템을 이용하여, 박테리아, 곤충, 효모, 진균류 또는 포유동물 배양물을 포함하는 재조합 단백질을 발현 또는 과다발현시킬 수 있다. 과다발현은 프로모터, 인핸서, 벡터(예컨대, 레플리콘 벡터, 디시스트로닉 벡터의 이용) (예컨대, Gurtu (1996) Biochem. Biophys. Res. Commun. 229: 295-8 참고), 매질, 배양 시스템 등의 적당한 선택에 의해 수행될 수 있다. 한 측면에서, 세포계 내에서, 예컨대 글루타민 합성효소와 같은 선택 마커를 이용하는 유전자 증폭(예컨대, Sanders (1987) Dev. Biol. Stand. 66: 55-63 참고)을 이용하여, 본 발명의 폴리펩티드를 과다발현시킨다.
이러한 접근법에 관한 부가적인 상세한 설명이 공개된 문헌에 나와 있고/있거나, 당업자에게 알려져 있다. 특히 비제한적 예시, 예컨대 공개적으로 입수가능한 문헌은 EP 0659215(WO 9403612 Al) (Nevalainen 등); Lapidot, A., Mechaly, A., Shoham, Y., "바실러스 스테아로써모필러스T-6으로부터의 열안정성 자일라나제의 과다발현 및 단일단계 정제(Overexpression and single-step purification of a thermostable Xylanase fromBacillus stearothermophilusT-6)", J. Biotechnol. Nov 51: 259-64(1996); Luthi, E., Jasmat, N. B., Bergquist, P.L., "매우 호열성인칼도셀럼 사카로라이티쿰으로부터의 자일라나제(Xylanase from the extremely thermophilic bacteriumCaldocellum saccharolyticum):에쉐리키아 콜라이내의 유전자의 과다발현 및 유전자 산물의 특성화(overexpression of the gene inEscherichia coliand characterization of the gene product)", Appl. Environ. Microbiol. Sep 56: 2677-83(1990); 및 Sung, W.L., Luk, C.K., Zahab, D.M., Wakarchuk, W., "바실러스 섭틸리스의 과다발현 및에쉐리키아 콜라이내의 서큘란스 자일라나제(Overexpression of theBacillus subtilisandcirculansXylanase inEscherichia coli)", Protein Expr. Purif. Jun 4: 200-6 (1993)"]을 포함하며, 단 이 참고문헌들은 본원의 본 발명에 따른 효소를 교시하고 있지 않다.
숙주 세포는 원핵 세포, 진핵 세포, 포유동물 세포, 곤충 세포 또는 식물 세포를 포함하는 당업자에게 자명한 임의의 숙주 세포일 수 있다. 적당한 숙주의 전형적인 예로서, 박테리아 세포, 예컨대E. coli, 스트렙토마이세스(Streptomyces), 바실러스 섭틸리스(Bacillus subtilis), 살모넬라 티피무리움(Salmonella typhimurium)및,슈도모나스(Pseudomonas), 스트렙토마이세스(Streptomyces)스타필로코쿠스(Staphylococcus)속에 속하는 각종 종들, 진균류 세포, 예컨대 효모, 곤충 세포, 예컨대드로소필라(Drosophila) S2스포도프테라(Spodoptera) Sf9, 동물 세포, 예컨대 CHO, COS 또는 바우스 흑색종 및 아데노바이러스를 들 수 있다. 적당한 숙주의 선택은 당업자의 역량 내에 속한다.
벡터는 형질전환, 트랜스펙션, 형질도입, 바이러스 감염, 유전자 총 또는 Ti-매개 유전자 전달을 포함하는 다양한 기술들 중 임의의 기술을 이용하여 숙주 세포에 도입될 수 있다. 특별한 방법은 인산칼슘 트랜스펙션, DEAE-Dextran 매개 트랜스펙션, 리포펙션 또는 전기천공[Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology (1986)]을 포함한다.
적당한 경우, 공학처리된 숙주 세포를, 프로모터의 활성화, 형질변이체의 선택 또는 본 발명의 유전자 증폭에 적당하게 변형된 통상적인 영양 배지에서 배양할 수 있다. 적당한 숙주 균주의 형질전환 및 적당한 세포 밀도에 대한 숙주 균주의 성질에 따라, 선택된 프로모터는 적당한 수단(예컨대, 온도 이동 또는 화학적 유도)을 이용하여 유도될 수 있고, 세포는 원하는 폴리펩티드 또는 그것의 절편을 생성시키도록 하는 부가적 기간동안 배양될 수 있다.
세포는 원심분리 및 물리적 또는 화학적 수단에 의한 붕괴로써 수득될 수 있고, 이에 수득된 조질의 추출물을 추가 정제를 위해 보유한다. 단백질의 발현을 위해 이용되는 미생물 세포는 냉해동 사이클링, 초음파처리, 기계적 붕괴 또는 세포 분해제의 이용을 포함하는 임의의 통상적인 방법에 의해 붕괴될 수 있다. 그러한 방법은 당업자에게 공지되어 있다. 발현된 폴리펩티드 또는 그것의 절편은 황산암모늄 또는 에탄올 석출, 산 추출, 음이온 또는 양이온 교환 크로마토그래피, 포스포셀룰로스 크로마토그래피, 소수성 상호작용 크로마토그래피, 친수성 크로마토그래피, 히드록시라파타이트 크로마토그래피 및 레시틴 크로마토그래피를 포함하는 방법에 의해 재조합 세포 배양물로부터 회수 및 정제될 수 있다. 폴리펩티드의 형상(configuration)을 완성할 때, 필요한 경우, 단백질 재풀림 단계를 이용할 수 있다. 원할 경우, 고성능 액체 크로마토그래피(HPLC)를 최종 정제 단계를 위해 이용할 수 있다.
각종 포유동물 세포 배양 시스템을 또한 이용하여, 재조합 단백질을 발현시킬 수 있다. 포유동물 발현 시스템의 예는 원숭이 신장 섬유아세포의 COS-7 세포주 [Gluzman 기재, Cell, 23: 175 (1981)] 및 상용가능한 벡터로부터 단백질을 발현시킬 수 있는 기타 세포주, 예컨대 C127, 3T3, CHO, HeLa 및 BHK 세포주를 포함한다.
숙주 세포 내의 작제물을 통상적 방식으로 이용하여, 재조합 서열에 의해 암호화되는 유전자 산물을 생성할 수 있다. 재조합 생성 절차에서 이용되는 숙주에 따라, 벡터를 함유하는 숙주 세포에 의해 생성되는 폴리펩티드는 글리코실화되거나, 비-글리코실화될 수 있다. 본 발명의 폴리펩티드는 개시 메티오닌 아미노산 잔기를 포함하거나 포함하지 않을 수 있다.
대안적으로, B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티드, 또는 그것의 적어도5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개의 연속 아미노산들을 포함하는 절편을 통상적인 펩티드 합성기로써 합성 제조할 수 있다. 다른 측면에서, 폴리펩티드의 절편 또는 부분을 이용하여, 펩티드 합성에 의해 대응하는 전장 폴리펩티드를 생성시킬 수 있으므로, 절편을 전장 폴리펩티드의 제조를 위한 중간체로서 이용할 수 있다.
폴리펩티드를 암호화하는 핵산 또는 그것의 절편에 작동적으로 연결된 프로모터를 포함하는 DNA 작제물로부터 전사된 mRNA를 이용하여, B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티드, 또는 그것의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개의 연속 아미노산을 포함하는 절편 중 하나를 생성시키기 위해, 세포-비함유 번역 시스템을 또한 이용할 수 있다. 한 측면에서, DNA 작제물은 생체외 전사 반응을 수행하기 전에 선형화될 수 있다. 이어서, 전사된 mRNA를 토끼 망상적혈구 추출물과 같은 적당한 세포-비함유 번역 추출물과 함께 항온처리하여, 원하는 폴리펩티드 또는 그것의 절편을 생성시킨다.
핵산의 증폭
본 발명의 실행에 있어서, 본 발명의 핵산 및 본 발명의 자일라나제를 암호화하는 핵산, 또는 본 발명의 변형 핵산은 증폭에 의해 복제될 수 있다. 증폭은 본 발명의 핵산의 클로닝 또는 변형을 위해서도 사용될 수 있다. 따라서 본 발명은 본 발명의 핵산의 증폭을 위한 증폭용 프라이머 서열 쌍을 제공한다. 당 업계의 숙련자라면 일부 또는 전장의 이러한 서열을 위한 증폭용 프라이머 서열 상을 고안할 수 있다.
하나의 태양에 있어서, 본 발명은 본 발명의 프라이머쌍, 예를 들어 본 발명의 핵산의 대략 첫번째의 (5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개의 잔기, 및 상보성 가닥의 대략 첫번째의 (5') 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개의 잔기에 의해 나타내어지는 프라이머쌍에 의해 증폭되는 핵산을 제공한다.
본 발명은 자일라나제 활성을 가지는 폴리펩티드를 암호화하는 핵산을 증폭시키기 위한 증폭용 프라이머 서열 쌍을 제공하는데, 이 프라이머쌍은 본 발명의 서열, 또는 그의 단편 또는 서브서열을 포함하는 핵산을 증폭시킬 수 있다. 증폭용 프라이머 서열 쌍 중 하나 또는 그의 각각의 구성원은 이 서열의 적어도 약 10 내지 50개의 연속 염기, 또는 이 서열의 약 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개의 연속 염기를 포함하는 올리고뉴클레오티드를 포함할 수 있다. 본 발명은 본 발명의 핵산의 대략 첫번째 (5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개의 잔기에 의해 나타내어지는 서열을 가지는 제1 구성원과, 제1 구성원의 상보성 가닥의 대략 첫번째의 (5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개의 잔기에 의해 나타내어지는 서열을 가지는 제2 구성원을 포함하는 증폭용 프라이머쌍을 제공한다. 본 발명은 본 발명의 증폭용 프라이머쌍을 이용한 증폭, 예를 들어 폴리머라제 연쇄 반응 (PCR)에 의해 생성되는 자일라나제를 제공한다. 본 발명은 본 발명의 증폭용 프라이머쌍을 사용한 증폭, 예를 들어 폴리머라제 연쇄 반응 (PCR)에 의한 자일라나제의 제조 방법을 제공한다. 하나의 태양에 있어서, 증폭용 프라이머쌍은 라이브러리, 에를 들어 유전자 라이브러리, 예를 들어 환경적 라이브러리로부터 핵산을 증폭시킨다.
증폭 반응은 샘플 중 핵산의 양 (예를 들어 세포 샘플 중 메시지의 양)의 정량화, 핵산의 표지 (예를 들어 핵산을 어레이 또는 블롯에 적용하기 위한 것임),핵산의 검출, 또는 샘플 중 특정 핵산의 양의 정량화를 위하여 또한 사용될 수 있다. 본 발명의 하나의 태양에 있어서, 세포 또는 cDNA 라이브러리로부터 단리되는 메시지를 증폭시킨다.
숙련자라면 적합한 올리고뉴클레오티드 증폭용 프라이머를 선택 및 고안할 수 있다. 증폭 방법은 또한 당 업계에 잘 알려져 있으며, 예를 들어 폴리머라제 연쇄 반응, PCR (예를 들어 문헌[PCR PROTOCOLS, A GUIDE TO METHODS AND APPLICATIONS, ed. Innis, Academic Press, N.Y. (1990)] 및 문헌[PCR STRATEGIES (1995), ed. Innis, Academic Press, Inc., N.Y.] 참조), 리가제 연쇄 반응 (ligase chain reaction, LCR) (예를 들어 문헌[Wu (1989) Genomics 4: 560]; 문헌[Landegren (1988) Science 241: 1077]; 문헌[Barringer (1990) Gene 89: 117] 참조); 전사 증폭법 (예를 들어 문헌[Kwoh (1989) Proc. Natl. Acad. Sci. USA 86: 1173] 참조); 및 자가-지속성 (self-sustained) 서열 복제법 (예를 들어 문헌[Guatelli (1990) Proc. Natl. Acad. Sci. USA 87: 1874] 참조); Q Beta 레플리카제 증폭법 (예를 들어 문헌[Smith (1997) J. Clin. Microbiol. 35: 1477-1491] 참조), 자동화 Q-베타 레플리카제 증폭 분석법 (예를 들어 문헌[Burg (1996) Mol. Cell. Probes 10: 257-271] 참조) 및 기타 RNA 폴리머라제 매개 기술 (예를 들어 NASBA (Cangene, 미국 온타리오주 미시사우가 소재) 참조; 또한 문헌[Berger (1987) Methods Enzymol. 152: 307-316]; 문헌[Sambrook]; 문헌[Ausubel]; 미국 특허 제4,683,195호 및 동 제4,683,202호; 문헌[Sooknanan (1995) Biotechnology 13: 563-564]을 참조)을 포함한다.
서열 동일성 정도의 결정
본 발명은 본 발명의 예시적 핵산 (예를 들어 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 199, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379)에 대하여 적어도 약 50, 75, 100, 150, 200, 250, 300, 350, 400, 450,500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550개 이상의 잔기의 영역에 걸쳐 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그보다 큰, 또는 완전한 (100%) 서열 동일성을 가지는 서열을 포함하는 핵산을 제공한다. 본 발명은 본 발명의 예시적 폴리펩티드에 대하여 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78% 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그보다 큰, 또는 완전한 (100%) 서열 동일성을 가지는 서열을 포함하는 폴리펩티드를 제공한다. 서열 동일성의 정도 (상동성)는 본 명세서에 기술된 것을 비롯한 디폴트 파라미터를 가지는 BLAST 2.2.2 또는 FASTA 버전 3.Ot78을 포함하는 임의의 컴퓨터 프로그램 및 관련 파라미터를 사용하여 결정할 수 있다.
본 핵산 서열은 "그룹 A"의 핵산 서열로도 칭해지며, 이는 그에 실질적으로 동일한 서열과, 그룹 A의 핵산 서열에 상동성인 서열 및 그의 단편과 전술한 서열 모두에 상보성인 서열을 포함한다. 본 발명의 핵산 서열은 본 발명의 예시적 서열의 적어도 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, 또는 500개의 연속 뉴클레오티드 (예를 들어 그룹 A의 핵산 서열)와 그에 실질적으로 동일한 서열을 포함할 수 있다. 그룹 A의 핵산 서열의 상동성 서열 및 단편과 그에 실질적으로 동일한 서열은 이 서열에 적어도 99%, 98%, 97%, 96%, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50%의 상동성을 가지는 서열을 나타낸다. 상동성은 디폴트 파라미터를 가지는 FASTA 버전 3.Ot78을 비롯한 본 명세서에 기술된 컴퓨터 프로그램 및 파라미터 중 임의의 것을 사용하여 결정할 수 있다. 상동성 서열은 그룹 A의 핵산 서열에 나타낸 핵산 서열 중 우리딘이 티민을 대체한 RNA 서열도 포함한다. 상동성 서열은 본 명세서에 기술된 임의의 절차의 사용에 의해 수득될 수 있거나 서열 결정 오류의 보정에 의해 생길 수 있다. 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열이 전통적인 1문자 포맷 (문헌[Stryer, Lubert. Biochemistry, 3rd Ed., W. H Freeman & Co., New York.]의 뒤쪽 겉면 안쪽을 참조) 또는 뉴클레오티드의 실체(identity)를 서열로 기록하는 임의의 다른 포맷으로 표시될 수 있음을 알아야 한다.
본 특허 명세서의 다른 곳에서 확인되는 다양한 서열 비교 프로그램이 본 발명의 이러한 태양에서의 사용을 위하여 특별히 고려된다. 단백질 및/또는 핵산 서열 상동성은 당 업계에 공지된 다양한 서열 비교 알고리즘 및 프로그램 중 임의의 것을 사용하여 평가할 수 있다. 이러한 알고리즘 및 프로그램은 TBLASTN, BLASTP, FASTA, TFASTA 및 CLUSTALW를 포함하지만 그에 한정되는 것은 전혀 아니다 (문헌[Pearson and Lipman, Proc. NatI. Acad. Sci. USA 85 (8): 2444-2448, 1988]; 문헌[Altschul et al., J. Mol. Biol. 215 (3): 403-410, 1990]; 문헌[Thompson et al.. Nucleic Acids Res. 22 (2): 4673-4680, 1994]; 문헌[Higgins et al.,Methods Enzymol. 266:383-402, 1996]; 문헌[Altschul et al., J. Mol. Biol. 215 (3): 403-410, 1990]; 문헌[Altschul et al., Nature Genetics 3: 266-272, 1993]).
상동성 또는 동일성은 서열 분석 소프트웨어 (예를 들어 Sequence Analysis Software Package of the Genetics Computer Group, University of Wisconsin Biotechnology Center, 미국 53705 위스콘신주 매디슨 유니버시티 애비뉴 1710)의 사용에 의해 종종 측정된다. 이러한 소프트웨어는 다양한 결실, 치환 및 기타 변형에 대하여 상동성의 정도를 지정함으로써 유사한 서열을 매치시킨다. 2개 이상의 핵산 또는 폴리펩티드 서열의 정황에서 "상동성" 및 "동일성"이라는 용어는 임의의 갯수의 서열 비교 알고리즘을 사용하거나 수동 배열 및 육안 검사에 의해 측정되는 명시된 영역 또는 비교 창에서의 최대 상응성에 대한 비교 및 배열시 명기된 퍼센트의 동일한 아미노산 잔기 또는 뉴클레오티드를 가지거나 동일한 2개 이상의 서열 또는 서브서열을 나타낸다.
서열 비교에 있어서, 일반적으로 하나의 서열이 시험 서열이 비교되는 참조 서열로 작용한다. 서열 비교 알고리즘의 사용시 시험 및 참조 서열이 컴퓨터에 입력되며, 필요할 경우 서브서열 동등물 (coordinate)이 지정되며 서열 알고리즘 프로그램 파라미터가 지정된다. 디폴트 프로그램 파라미터가 이용될 수 있거나, 대안적인 파라미터가 지정될 수 있다. 이어서 서열 비교 알고리즘에 의해 프로그램 파라미터에 기초하여 참조 서열에 대한 시험 서열의 서열 동일성 퍼센트가 계산된다.
본 명세서에 사용되는 바와 같이 "비교 창"은 20 내지 600, 일반적으로는 약 50 내지 약 200, 더 일반적으로는 약 100 내지 약 150으로 구성된 군으로부터 선택되는 연속 위치의 갯수 중 임의의 하나의 절편에 대한 참조를 포함하는데, 여기서 서열은 2개의 서열을 최적으로 배열한 후 동일한 갯수의 연속 위치의 참조 서열과 비교할 수 있다. 비교를 위한 서열 배열 방법은 당 업계에 잘 알려져 있다. 비교를 위한 최적의 서열 배열은 예를 들어 문헌[Smith & Waterman, Adv. Appl. Math. 2:482, 1981]의 국소적 상동성 알고리즘, 문헌[Needleman & Wunsch, J. Mol. Biol 48:443, 1970]의 상동성 배열 알고리즘, 문헌[person & Lipman, Proc. Nafl. Acad. Sci. USA 85:2444, 1988]의 유사성 탐색 방법, 이러한 알고리즘의 컴퓨터화 도구 (Wisconsin Genetics Software Package의 GAP, BESTFIT, FASTA 및 TFASTA, Genetics Computer Group, 미국 위스콘신주 매디슨 사이언스 닥터. 575), 또는 수동 배열 및 육안 검사에 의해 행해질 수 있다. 다른 상동성 또는 동일성 결정 알고리즘은 예를 들어 BLAST 프로그램 (Basic Local Alignment Search Tool at the National Center for Biological Information) 외에도, ALIGN, AMAS (Analysis of Multiply Aligned Sequences), AMPS (Protein Multiple Sequence Alignment), ASSET (Aligned Segment Statistical Evaluation Tool), BANDS, BESTSCOR, BIOSCAN (Biological Sequence Comparative Analysis Node), BLIMPS (BLocks IMProved Searcher), FASTA, Intervals & Points, BMB, CLUSTAL V, CLUSTAL W. CONSENSUS, LCONSENSUS, WCONSENSUS, Smith-Waterman 알고리즘, DARWIN, Las Vegas 알고리즘, FNAT (Forced Nucleotide Alignment Tool), Framealign, Framesearch, DYNAMIC,FILTER, FSAP (Fristensky Sequence Analysis Package), GAP (Global Alignment Program), GENAL, GIBBS, GenQuest, ISSC (Sensitive Sequence Comparison), LALIGN (Local Sequence Alignment), LCP (Local Content Program), MACAW (Multiple Alignment Construction & Analysis Workbench), MAP (Multiple Alignment Program), MBLKP, MBLKN, PEVA (Pattern-Induced Multi-sequence Alignment), SAGA (Sequence Alignment by Genetic Algorithm) 및 WHAT-IF를 포함한다. 이러한 배열 프로그램은 게놈 데이터베이스를 스크리닝하여 실질적으로 동일한 서열을 가지는 폴리뉴클레오티드 서열을 확인하는 데에도 사용될 수 있다. 다수의 게놈 데이터베이스가 이용가능한데, 예를 들어 인간 게놈의 상당한 부분이 인간 게놈 서열 결정 프로젝트 (Human Genome Sequencing Project)의 일부로 이용가능하다(J. Roach, http://weber.u.Washington.edu/~roach/human_genome_progress 2.html) (Gibbs, 1995). 예를 들어 엠. 게니탈리움 (M genitalium) (Fraser et al., 1995), 엠, 잔나쉬이 (M. jannaschii) (Bult et al., 1996), 에이치. 인플루엔자에 (H. influenzae) (Fleischmann et aL, 1995), 이. 콜라이 (E. coli) (Blattner et al., 1997) 및 효소 (에스. 세레비지아에 (S. cerevisiae)) (Mewes et al., 1997) 및 디. 멜라노가스터 (D. melanogaster) (Adams et al., 2000)를 비롯한 적어도 21개의 다른 게놈이 이미 서열 결정되었다. 모델 유기체, 예를 들어 생쥐, 씨. 엘레간스 (C. elegans) 및 아라비돕시스 (Arabadopsis) sp.의 게놈의 서열 결정도 상당히 진행되었다. 일부 기능 상의 정보가 주석으로 달린 게놈 정보를 포함하는 여러 데이터베이스가 상이한 조직에 의해 유지되며 인터넷을 통하여 접근가능하다.
유용한 알고리즘의 일례로는 BLAST 및 BLAST 2.0 알고리즘이 있는데 이는 문헌[Altschul et al., Nuc. Acids Res. 25:3389-3402, 1977] 및 문헌[Altschul et al., J. Mol. Biol. 215:403-410, 1990]에 각각 기술되어 있다. BLAST 분석을 수행하기 위한 소프트웨어는 National Center for Biotechnology Information을 통하여 공식적으로 이용가능하다. 이러한 알고리즘은, 먼저 쿼리 (query) 서열에 있어서의 길이 W의 짧은 워드 (word)의 확인에 의해 고 스코어링 서열 쌍 (high scoring sequence pairs, HSPs)를 확인하는 것을 포함하는데, 상기 HSP는 데이터베이스 서열에 있어서 동일 길이의 워드와 배열될 경우 일부 양의 값의 역 (threshold) 스코어 T에 매치되거나 상기 T를 만족시킨다. T는 근접한 워드 스코어 역으로 칭해진다 (문헌[Altschul et al., supra]). 이러한 초기 근접 워드 히트 (hit)는 그를 포함하는 더 긴 HSP를 찾기 위한 탐색을 시작하기 위한 종자 (seed)로 작용한다. 워드 히트는 누적 배열 스코어가 증가될 수 있게 하는 한 각각의 서열을 따라 양 방향으로 연장된다. 누적 스코어는 뉴클레오티드 서열에 있어서 파라미터 M (매칭 잔기의 쌍의 보상 (reward) 스코어; 항상 >0)을 사용하여 계산한다. 아미노산 서열에 있어서, 스코어링 매트릭스를 사용하여 누적 스코어를 계산한다. 각 방향으로의 워드 히트의 연장은, 누적 배열 스코어가 그의 최대 성취 값으로부터 양 X만큼 감소될 경우; 하나 이상의 음의 스코어링의 잔기 배열의 축적으로 인하여 누적 스코어가 0 이하로 될 경우; 또는 어느 하나의 서열의 말단에 도달될 경우 정지된다. BLAST 알고리즘 파라미터 W, T 및 X는 이 배열의 민감성 및 속도를 결정한다. BLASTN 프로그램 (뉴클레오티드 서열의 경우)에서는 디폴트로서 11의 워드길이 (W), 10의 기대치 (E), M=5, N=-4 및 양 가닥의 비교가 이용된다. 아미노산 서열에 있어서, BLASTP 프로그램에서는 디폴트로서 3의 워드길이 및 10의 기대치 (E), BLOSUM62 스코어링 매트릭스 (문헌[Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915, 1989] 참조), 50의 배열 (B), 10의 기대치 (E), M=5, N= -4 및 양 가닥의 비교가 이용된다.
BLAST 알고리즘은 또한 두 서열간의 유사성의 통계학적 분석을 수행한다 (예를 들어 문헌[Karlin & Altschul, Proc. Natl. Acad. Sci. USA 90:5873, 1993] 참조). BLAST 알고리즘에 의해 제공되는 하나의 유사성 측도는 가장 작은 합의 확률 (P (N))인데, 이는 두 뉴클레오티드 또는 아미노산 서열간의 매치가 우연히 일어날 확률을 나타낸다. 예를 들어 시험 핵산의 참조 핵산과의 비교에 있어서 가장 작은 합의 확률이 약 0.2 미만, 더 바람직하게는 약 0.01 미만, 가장 바람직하게는 약 0.001 미만일 경우 핵산은 참조 서열에 유사한 것으로 생각된다.
하나의 태양에 있어서, 단백질 및 핵산 서열의 상동성은 Basic Local Alignment Search Tool ("BLAST")를 사용하여 평가한다. 특히 5가지의 특정 BLAST 프로그램을 사용하여 하기 과제를 수행한다:
(1) BLASTP 및 BLAST3은 단백질 서열 데이터베이스에 대하여 아미노산 쿼리 서열을 비교하며;
(2) BLASTN은 뉴클레오티드 서열 데이터베이스에 대하여 뉴클레오티드 쿼리 서열을 비교하며;
(3) BLASTX는 단백질 서열 데이터베이스에 대하여 쿼리 뉴클레오티드 서열 (양 가닥)의 6개의 프레임의 개념의 번역 산물을 비교하며;
(4) TBLASTN은 모든 6개의 판독 프레임에서 번역되는 (양 가닥) 뉴클레오티드 서열에 대하여 쿼리 단백질 서열을 비교하며;
(5) TBLASTX는 뉴클레오티드 서열 데이터베이스의 6개의 프레임의 번역에 대하여 뉴클레오티드 쿼리 서열의 6개의 프레임의 번역을 비교한다.
BLAST 프로그램에 의해 쿼리 아미노산 또는 핵산 서열과 바람직하게는 단백질 또는 핵산 서열 데이터베이스로부터 획득되는 시험 서열 사이의, 본 명세서에서 "높은 스코어링의 절편 쌍"으로 칭해지는 유사한 절편의 확인에 의해 상동성 서열을 확인한다. 높은 스코어링의 절편 쌍은 바람직하게는 스코어링 매트릭스에 의해 확인되는데 (즉, 배열됨), 이들 중 다수는 당 업계에 공지되어 있다. 바람직하게는, 사용되는 스코어링 매트릭스는 BLOSLTM62 매트릭스 (문헌[Gonnet et al., Science 256:1443-1445, 1992]; 문헌[Henikoff and Henikoff, Proteins 17:49-61, 1993])이다. 덜 바람직하게는 PAM 또는 PAM250 매트릭스도 사용될 수 있다 (예를 들어 문헌[Schwartz and Dayhoff, eds., 1978, Matricesfor Detecting Distance Relationships: Atlas ofProtein Sequence and Structure, Washington: National Biomedical Research Foundation] 참조). BLAST 프로그램은 미국 국립 의학 도서관 (U.S. National Library of Medicine)을 통하여 접근가능하다.
상기 알고리즘에 사용되는 파라미터는 연구되는 서열의 길이 및 상동성의 정도에 따라 수정될 수 있다. 일부 태양에 있어서, 파라미터는 사용자의 지시의 부재 하에서 알고리즘에 의해 사용되는 디폴트 파라미터일 수 있다.
컴퓨터 시스템 및 컴퓨터 프로그램 제품
컴퓨터 상에서 (in silico) 서열 동일성, 구조적 상동성, 모티프 등을 결정 및 확인하기 위하여 본 발명의 핵산 또는 폴리펩티드 서열을 컴퓨터에 의해 판독 및 접근될 수 있는 임의의 매체 상에서 저장, 기록 및 조작할 수 있다.
따라서, 본 발명은 본 발명의 핵산 및 폴리펩티드 서열이 기록되거나 저장된 컴퓨터, 컴퓨터 시스템, 컴퓨터 판독가능한 매체, 컴퓨터 프로그램 제품 등을 제공한다. 본 명세서에 사용되는 바와 같이, "기록되는" 및 "저장되는"이라는 용어는 컴퓨터 매체 상에 정보를 저장하는 프로세스를 나타낸다. 숙련자라면 컴퓨터 판독가능한 매체 상에 정보를 기록하는 임의의 공지된 방법을 손쉽게 수정하여 본 발명의 핵산 및/또는 폴리펩티드 서열 중 하나 이상을 포함하는 제품을 생성할 수 있다.
본 발명의 폴리펩티드는 그룹 B의 아미노산 서열의 폴리펩티드 서열, 본 발명의 예시적 서열, 및 그에 실질적으로 동일한 서열과, 전술한 서열 중 임의의 서열의 단편을 포함한다. 실질적으로 동일하거나 상동성인 폴리펩티드 서열은 본 발명의 예시적 서열, 예를 들어 그룹 B의 아미노산 서열의 폴리펩티드 서열에 대하여 적어도 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그보다 큰, 또는 완전한 (100%) 서열 동일성을가지는 폴리펩티드 서열을 나타낸다.
상동성은 디폴트 파라미터 또는 임의의 수정된 파라미터를 포함하는 FASTA 버전 3.Ot78을 비롯하여 본 명세서에 기술된 컴퓨터 프로그램 및 파라미터 중 임의의 것을 사용하여 결정할 수 있다. 상동성 서열은 본 명세서에 기술된 절차 중 임의의 것을 사용하여 수득될 수 있거나 서열 결정 오류의 보정으로부터 생길 수 있다. 본 폴리펩티드 단편은 그룹 B의 아미노산 서열 및 그에 실질적으로 동일한 서열의 폴리펩티드의 적어도 약 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500개 또는 그보다 많은 연속 아미노산을 포함한다. 그룹 B의 아미노산 서열 및 그에 실질적으로 동일한 서열에 나타낸 폴리펩티드 암호는 전통적인 1문자 포맷 또는 3문자 포맷 (문헌[Stryer, Lubert. Biochemisqy, 3rd Ed., W. H Freeman & Co., New York.]의 뒤쪽 겉면 안쪽을 참조) 또는 서열 형태의 폴리펩티드의 신원과 관련된 임의의 다른 포맷으로 표시될 수 있다.
본 발명의 핵산 또는 폴리펩티드 서열은 컴퓨터에 의해 판독 및 접근될 수 있는 임의의 매체 상에서 저장, 기록 및 조작될 수 있다. 본 명세서에 사용되는 바와 같이, "기록되는" 및 "저장되는"이라는 용어는 컴퓨터 매체 상에 정보를 저장하는 프로세스를 나타낸다. 숙련자라면 컴퓨터 판독가능한 매체 상에 정보를 기록하는 현재 공지된 방법 중 임의의 것을 손쉽게 수정하여 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열 중 하나 이상, 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그에 실질적으로 동일한 서열 중 하나 이상을포함하는 제품을 생성할 수 있다. 본 발명의 다른 태양은 그룹 A의 핵산 서열에 나타낸 적어도 2, 5, 10, 15, 또는 20개 이상의 핵산 서열 및 그에 실질적으로 동일한 서열이 기록된 컴퓨터 판독가능한 매체이다.
본 발명의 다른 태양은 그룹 A의 핵산 서열에 나타낸 핵산 서열 중 하나 이상과 그에 실질적으로 동일한 서열이 기록된 컴퓨터 판독가능한 매체이다. 본 발명의 다른 태양은 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 중 하나 이상과 그에 실질적으로 동일한 서열이 기록된 컴퓨터 판독가능한 매체이다. 본 발명의 다른 태양은 상기에 나타낸 서열 중 적어도 2, 5, 10, 15, 또는 20개 이상의 서열이 기록된 컴퓨터 판독가능한 매체이다.
컴퓨터 판독가능한 매체는 자기적으로 판독가능한 매체, 광학적으로 판독가능한 매체, 전자적으로 판독가능한 매체 및 자기/광학적 매체를 포함한다. 예를 들어 컴퓨터 판독가능한 매체는 하드 디스크, 플로피 디스크, 자기 테이프, CD-ROM, 디지털 다기능 디스크 (Digital versatile Disk, DVD), 임의 접근 기억 장치 (Random Access Memory, RAM), 또는 판독 전용 기억 장치 (Read Only Memory, ROM)와, 당 업계의 숙련자에게 공지된 다른 유형의 기타 매체일 수 있다.
본 발명의 태양은 시스템 (예를 들어 인터넷 기반의 시스템), 특히 본 명세서에 기술된 서열 정보를 저장 및 조작하는 컴퓨터 시스템을 포함한다. 컴퓨터 시스템 (100)의 일례가 도 1의 블럭도 형태로 도시되어 있다. 본 명세서에 사용되는 바와 같이 "컴퓨터 시스템"은 그룹 A의 핵산 서열에 나타낸 핵산 서열의 뉴클레오티드 서열 및 그에 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열의 분석에 사용되는 하드웨어 컴포넌트, 소프트웨어 컴포넌트 및 데이터 저장 컴포넌트를 나타낸다. 컴퓨터 시스템 (100)은 일반적으로 서열 데이터의 처리 (processing), 접근 및 조작을 위한 프로세서를 포함한다. 프로세서 (105)는 임의의 잘 알려진 유형의 중앙 처리 장치, 예를 들어 Intel Corporation제의 Pentium III, 또는 Sun, Motorola, Compaq, AMD 또는 International Business Machines제의 유사한 프로세서일 수 있다.
일반적으로 컴퓨터 시스템 (100)은 프로세서 (105)와 데이터를 저장하기 위한 하나 이상의 내부 데이터 저장 컴포넌트 (110)와 데이터 저장 컴포넌트 상에 저장된 데이터의 검색을 위한 하나 이상의 데이터 검색 장치를 포함하는 일반 용도의 시스템이다. 숙련자라면 현재 이용가능한 컴퓨터 시스템 중 임의의 것이 적합하다는 것을 손쉽게 인식할 수 있다.
하나의 특정 태양에 있어서, 컴퓨터 시스템 (100)은 주기억 장치 (115) (바람직하게는 RAM으로 제공됨)에 연결된 버스에 연결된 프로세서 (105) 및 하나 이상의 내부 데이터 저장 장치 (110), 예를 들어 데이터가 기록된 하드 드라이브 및/또는 기타 컴퓨터 판독가능한 매체를 포함한다. 일부 태양에 있어서, 컴퓨터 시스템 (100)은 내부 데이터 저장 장치 (110)에 저장된 데이터의 판독을 위한 하나 이상의 데이터 검색 장치 (118)을 더 포함한다.
데이터 검색 장치 (118)는 예를 들어 플로피 디스크 드라이브, 콤팩트 디스크 드라이브, 자기 테이프 드라이브, 또는 원격 데이터 저장 시스템 (예를 들어 인터넷을 통하여)에 연결될 수 있는 모뎀 등을 나타낼 수 있다. 일부 태양에 있어서, 내부 데이터 저장 장치 (110)는 제어 논리 및/또는 기록 데이터를 포함하는 분리성의 컴퓨터 판독가능한 매체, 예를 들어 플로피 디스크, 콤팩트 디스크, 자기 테이프 등이다. 컴퓨터 시스템 (100)은 데이터 검색 장치에 일단 삽입되면 데이터 저장 컴포넌트로부터 데이터 및/또는 제어 논리를 판독하는 적절한 소프트웨어를 포함하거나 상기 소프트웨어에 의해 프로그래밍될 수 있는 것이 유리하다.
컴퓨터 시스템 (100)은 출력을 컴퓨터 사용자에게 표시해 주는 데에 사용되는 디스플레이 (120)를 포함한다. 컴퓨터 시스템 (100)은 통신망 또는 광역 통신망에서 다른 컴퓨터 시스템 125a-c에 연결되어 컴퓨터 시스템 (100)에 중앙 집중형 접근을 제공할 수 있다는 것을 또한 알아야 한다.
그룹 A의 핵산 서열에 나타낸 핵산 서열의 뉴클레오티드 서열 및 그에 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그에 실질적으로 동일한 서열에 접근하여 이를 처리하기 위한 소프트웨어 (예를 들어 탐색 도구, 비교 도구 및 모델링 도구 등)가 실행 동안 주기억 장치 (115)에 존재할 수 있다.
일부 태양에 있어서, 컴퓨터 시스템 (100)은, 컴퓨터 판독가능한 매체 상에 저장된 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그에 실질적으로 동일한 서열을 컴퓨터 판독가능한 매체 상에 저장된 참조 뉴클레오티드 또는 폴리펩티드 서열 (들)과 비교하기 위한 서열 비교 알고리즘을 더 포함할 수 있다. "서열 비교 알고리즘"은 뉴클레오티드 서열을 데이터 저장 수단 내에 저장된 다른 뉴클레오티드 서열 및/또는 화합물과 비교하기 위하여 컴퓨터 시스템 (100) 상에서 (국소적으로 또는 원격으로) 구현되는 하나 이상의 프로그램을 나타낸다. 예를 들어 서열 비교 알고리즘은 컴퓨터 판독가능한 매체 상에 저장된 그룹 A의 핵산 서열에 나타낸 핵산 서열의 뉴클레오티드 서열 및 그에 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그에 실질적으로 동일한 서열을 컴퓨터 판독가능한 매체 상에 저장된 참조 서열과 비교하여 상동성 또는 구조적 모티프를 확인할 수 있다.
도 2는 새로운 서열 및 데이터베이스의 서열 사이의 상동성의 수준을 결정하기 위하여 새로운 뉴클레오티드 또는 단백질 서열을 데이터베이스의 서열과 비교하기 위한 프로세스 (200)의 하나의 태양을 도시하는 흐름도이다. 서열의 데이터베이스는 컴퓨터 시스템 (100) 내에 저장된 개인 데이터베이스, 또는 인터넷을 통하여 이용가능한 GENBANK와 같은 공공 데이터베이스일 수 있다.
프로세스 (200)는 시작 상태 (201)에서 시작하며, 이어서 비교할 새로운 서열을 컴퓨터 시스템 (100)의 기억 장치에 저장하는 상태 (202)로 이동한다. 상기에 논의된 바와 같이 기억 장치는 RAM 또는 내부 저장 장치를 비롯하여 임의의 유형의 기억 장치일 수 있다.
이어서 프로세스 (200)는 서열의 데이터베이스를 분석 및 비교를 위하여 여는 상태 (204)로 이동한다. 이어서 프로세스 (200)는 데이터베이스에 저장된 제1 서열을 컴퓨터 상의 기억 장치 내로 판독하는 상태 (206)로 이동한다. 이어서 비교를 상태 (210)에서 수행하여 제1 서열이 제2 서열과 동일한지를 결정한다. 이단계는 새로운 서열과 데이터베이스의 제1 서열 사이의 정확한 비교를 수행하는 것에 한정되는 것은 아님을 아는 것이 중요하다. 두 뉴클레오티드 또는 단백질 서열을, 심지어 이들이 동일하지 않다 해도 비교하기 위한 잘 알려진 방법이 숙련자에게 공지되어 있다. 예를 들어 갭이 두 시험 서열들 사이의 상동성 수준을 상승시키기 위하여 하나의 서열 내로 도입될 수 있다. 갭 또는 기타 특징이 비교 동안 서열 내로 도입되는지를 제어하는 파라미터가 컴퓨터 시스템의 사용자에 의해 보통 입력된다.
일단 두 서열의 비교가 상태 (210)에서 수행되면, 두 서열이 동일한지를 결정 상태 (210)에서 결정한다. 물론, "동일"이라는 용어는 절대적으로 동일한 서열에 한정되는 것은 아니다. 사용자에 의해 입력되는 상동성 파라미터 이내인 서열은 프로세스 (200)에서 "동일"로 나타낸다.
두 서열이 동일하다고 결정되면 프로세스 (200)는 데이터베이스로부터의 서열의 명칭이 사용자에게 표시되는 상태 (214)로 이동한다. 상기 상태는 사용자에게 표시된 명칭의 서열이 입력된 상동성 제약 조건을 만족시킨다는 것을 알려준다. 일단 저장된 서열의 명칭이 사용자에게 표시되면, 프로세스 (200)는 더 많은 서열이 데이터베이스에 존재하는지를 결정하는 결정 상태 (218)로 이동한다. 더이상의 서열이 데이터베이스에 존재하지 않으면 프로세스 (200)는 종료 상태 (220)에서 종결된다. 그러나 더 많은 서열이 데이터베이스에 존재하면 프로세스 (200)는 포인터 (pointer)가 데이터베이스 중의 다음 서열로 이동하여 새로운 서열과 비교될 수 있는 상태 (224)로 이동한다. 이러한 방식으로 새로운 서열은 배열되며 데이터베이스 중의 모든 서열과 비교된다.
결정 상태 (212)에서 서열이 상동성이지 않다고 결정되면 프로세스 (200)는 임의의 다른 서열이 비교를 위하여 데이터베이스에서 이용가능한지를 결정하기 위하여 결정 상태 (218)로 즉시 이동한다는 것을 알아야 한다.
따라서 본 발명의 하나의 태양은 프로세서, 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그에 실질적으로 동일한 서열이 저장된 데이터 저장 장치, 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그에 실질적으로 동일한 서열에 비교될 참조 뉴클레오티드 서열 또는 폴리펩티드 서열이 검색가능하게 저장된 데이터 저장 장치 및 비교를 수행하기 위한 서열 비교자를 포함하는 컴퓨터 시스템이다. 서열 비교자는 비교되는 서열간의 상동성 수준을 나타내거나 상기 그룹 A의 핵산 서열 및 그에 실질적으로 동일한 서열의 핵산 코드, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그에 실질적으로 동일한 서열에서 구조적 모티프를 확인할 수 있거나, 상기 핵산 코드 및 폴리펩티드 코드에 비교되는 서열에서 구조적 모티프를 확인할 수 있다. 일부 태양에 있어서, 데이터 저장 장치에는 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그에 실질적으로 동일한 서열 중 적어도 2, 5, 10, 15, 20, 25, 30 또는 40개 이상의 서열이 저장될 수 있다.
본 발명의 다른 태양은 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그에 실질적으로 동일한 서열과 참조 뉴클레오티드 서열 사이의 상동성의 수준을 결정하는 방법이다. 본 방법은 상동성 수준을 결정하는 컴퓨터 프로그램의 사용을 통하여 핵산 코드 또는 폴리펩티드 코드 및 참조 뉴클레오티드 또는 폴리펩티드 서열을 판독하는 단계 및 컴퓨터 프로그램을 이용하여 핵산 코드 또는 폴리펩티드 코드와 참조 뉴클레오티드 또는 폴리펩티드 서열 사이의 상동성을 결정하는 단계를 포함한다. 컴퓨터 프로그램은 본 명세서에서 구체적으로 열거된 것 (예를 들어 디폴트 파라미터를 가지거나 임의의 수정된 파라미터를 가지는 BLAST2N)을 비롯하여 상동성 수준 결정용의 다수의 컴퓨터 프로그램 중 임의의 것일 수 있다. 본 방법은 상기에 기술된 컴퓨터 시스템을 사용하여 구현된다. 본 방법은 컴퓨터 프로그램의 사용을 통하여 상기의 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그에 실질적으로 동일한 서열 중 적어도 2, 5, 10, 15, 20, 25, 30 또는 40개 이상을 판독하는 단계 및 핵산 코드 또는 폴리펩티드 코드 및 참조 뉴클레오티드 서열 또는 폴리펩티드 서열 사이의 상동성을 결정하는 단계에 의해 또한 수행될 수 있다.
도 3은 두 서열이 상동성인지를 결정하기 위한 컴퓨터에서 프로세스 (250)의 하나의 태양을 도시하는 흐름도이다. 프로세스 (250)는 시작 상태 (252)로부터 시작되며 이어서 비교될 제1 서열이 기억 장치에 저장되는 상태 (254)로 이동한다. 이어서 비교될 제2 서열이 상태 (256)에서 기억 장치에 저장된다. 이어서 프로세스 (250)는 제1 서열 중의 첫번째 문자가 판독되는 상태 (260)로 이동하며 이어서 제2 서열의 첫번째 문자가 판독되는 상태 (262)로 이동한다. 서열이 뉴클레이티드 서열이면 문자는 보통 A, T, C, G 또는 U라는 것을 알아야 한다. 서열이 단백질 서열이면 제1 및 서열 서열이 용이하게 비교될 수 있도록 1문자 아미노산 코드인 것이 바람직하다.
이어서 두 문자가 동일한지를 결정 상태 (264)에서 결정한다. 이들이 동일하다면 프로세스 (250)는 제1 및 제2 서열 중의 다음 문자가 판독되는 상태 (268)로 이동한다. 이어서 다음 문자가 동일한지를 결정한다. 이들이 동일하다면 프로세스 (250)는 두 문자가 동일하지 않을때까지 상기 루프를 계속한다. 다음의 두 문자가 동일하지 않다고 결정되면 프로세스 (250)는 결정 상태 (274)로 이동하여 임의의 더 많은 문자가 판독되는 어느 하나의 서열에 있는지를 결정한다.
다른 문자가 더이상 판독되지 않으면 프로세스 (250)는 제1 및 제2 서열 사이의 상동성의 수준이 사용자에게 표시되는 상태 (276)로 이동한다. 상동성의 수준은 제1 서열 중의 총 서열 갯수로부터 동일한 서열들 사이의 문자의 비율을 계산함으로써 결정한다. 따라서, 100개의 제1 뉴클레오티드의 서열 중 모든 문자가 제2 서열의 모든 문자와 배열되면, 상동성 수준은 100%이다.
대안적으로는, 본 컴퓨터 프로그램은, 본 발명에 나타낸 핵산 서열의 뉴클레오티드 서열을 하나 이상의 참조 뉴클레오티드 서열과 비교하여 그룹 A의 핵산 서열 및 그에 실질적으로 동일한 서열의 핵산 코드가 하나 이상의 위치에서 참조 핵산 서열과 다른지를 결정하는 컴퓨터 프로그램일 수 있다. 선택적으로는 이러한프로그램은 참조 폴리뉴클레오티드 또는 그룹 A의 핵산 서열에 나타낸 핵산 및 그에 실질적으로 동일한 서열 중 어느 하나의 서열에 대하여 삽입, 결실 또는 치환된 뉴클레오티드의 길이 및 신원을 기록한다. 하나의 태양에 있어서, 본 컴퓨터 프로그램은 그룹 A에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열이 참조 뉴클레오티드 서열에 대하여 단일 뉴클레오티드 다형성 (single nucleotide polymorphism, SNP)을 포함하는지를 결정하는 프로그램일 수 있다.
따라서, 본 발명의 다른 태양은 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열이 하나 이상의 뉴클레오티드에서 참조 뉴클레오티드 서열과 다른지를 결정하는 방법으로서 핵산 서열들 사이의 차이를 확인하는 컴퓨터 프로그램의 사용을 통하여 상기 핵산 코드와 참조 뉴클레오티드 서열을 판독하는 단계 및 이 핵산 코드와 참조 뉴클레오티드 서열 사이의 차이를 컴퓨터 프로그램을 이용하여 확인하는 단계를 포함한다. 일부 태양에 있어서, 본 컴퓨터 프로그램은 단일 뉴클레오티드 다형성을 확인하는 프로그램이다. 본 방법은 상기에 기술된 컴퓨터 시스템 및 도 3에 도시된 방법에 의해 구현될 수 있다. 본 방법은 컴퓨터 프로그램의 사용을 통하여 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열 중 2, 5, 10, 15, 20, 25, 30, 또는 40개 이상의 서열 및 참조 뉴클레오티드 서열을 판독하는 단계 및 핵산 코드와 참조 뉴클레오티드 서열 사이의 차이를 컴퓨터 프로그램을 이용하여 확인하는 단계에 의해서도 수행될 수 있다.
다른 태양에서, 컴퓨터 기반의 시스템은 그룹 A의 핵산 서열에 나타낸 핵산 서열 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그와 실질적으로동일한 서열 내의 특징을 확인하기 위한 확인자를 추가로 포함할 수도 있다.
"확인자"는 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그와 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 이와 실질적으로 동일한 서열내의 일부 특징을 확인하는 하나 이상의 프로그램을 말한다. 한 태양에서, 확인자는 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 이와 실질적으로 동일한 서열내의 개봉 판독 프레임을 확인하는 프로그램을 포함할 수도 있다.
도 4는 서열내의 특징의 존재를 검출하기 위한 확인자 프로세스 (300)의 한 태양을 예시하는 흐름도이다. 프로세스 (300)는 시작 상태 (302)에서 시작하여, 특징을 확인할 제1 서열이 컴퓨터 시스템 (100)내의 기억 장치 (115)에 저장되는 상태 (304)로 이동한다. 프로세스 (300)는 이어서 서열 특징의 데이터베이스가 공개되는 상태 (306)로 이동한다. 그러한 데이터베이스는 각 특징의 명칭과 함께 각 특징의 특성의 리스트를 포함할 것이다. 예를 들어, 특징 명칭은 "개시 코돈"일 수 있으며 특성은 "ATG"일 것이다. 다른 예는 특성 명칭은 "TAATAA 박스"이고 특징 특성은 "TAATAA"일 것이다. 그러한 데이터베이스의 예는 위스콘신 대학 유전학 컴퓨터 그룹에 의해 생산된다. 다르게는, 상기 특징들은 알파 헬릭스, 베타 시트와 같은 구조적 폴리펩티드 모티프, 또는 효소 활성 부위, 헬릭스-턴-헬릭스 모티프 또는 당 업계에 공지된 다른 모티프와 같은 기능적 폴리펩티드 모티프일 수 있다.
일단 특징의 데이터베이스가 상태 (306)에서 공개되면, 프로세스 (300)는 제 1 특징이 데이터베이스로부터 판독되는 상태 (308)로 이동한다. 이어서 제1 특징의 특성과 제1 서열의 비교가 상태 (310)에서 이루어진다. 이어서 상기 특징의 특성이 제 1 서열에서 발견되었는지 여부가 결정 상태 (316)에서 결정된다. 만일 특성이 발견되었으면, 프로세스 (300)는 발견된 특징의 명칭이 사용자에게 표시되는 상태 (318)로 이동한다.
이어서 프로세스 (300)는 데이터베이스에 더 이상의 특징이 존재하는지를 결정하는 결정 상태 (320)로 이동한다. 더 이상의 특징이 존재하지 않으면, 프로세스 (300)는 종료 상태 (324)에서 종결된다. 하지만, 더 이상의 특징이 데이터베이스에 존재하면, 프로세스 (300)는 상태 (326)에서 다음 서열 특징을 판독하고, 다음 특징의 특성이 제1 서열에 대하여 비교되는 상태 (310)으로 돌아간다. 만일 특징 특성이 결정 상태 (316)에서 제 1서열에서 발견되지 않으면 프로세스 (300)는 더 이상의 특징이 데이터베이스에 존재하는지를 결정하기 위하여 결정 상태 (320)로 직접 이동함을 주목해야 한다.
따라서, 본 발명의 다른 태양은 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 이와 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 또는 이와 실질적으로 동일한 서열의 특징을 확인하는 방법으로서, 서열 내의 특징을 확인하는 컴퓨터 프로그램을 이용하여 핵산 코드 또는 폴리펩티드 코드를 판독하는 단계 및 핵산 코드내의 특징을 컴퓨터 프로그램으로 확인하는 단계를 포함한다. 한 태양에서, 컴퓨터 프로그램은 개봉 판독 프레임을 확인하는 컴퓨터 프로그램을 포함한다. 상기 방법은 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 이와 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열및 이와 실질적으로 동일한 서열 중 단일 서열 또는 적어도 2, 5, 10, 15, 20, 25, 30, 또는 40개를 컴퓨터 프로그램을 이용하여 판독하고, 상기 핵산 코드 또는 폴리펩티드 코드내의 특징을 컴퓨터 프로그램으로 확인함으로써 수행될 수 있다.
그룹 A의 핵산 서열에 나타낸 핵산 서열 및 이와 실질적으로 동일한 서열, 또는 그룹 B 아미노산 서열에 나타낸 폴리펩티드 서열 및 이와 실질적으로 동일한 서열은 다양한 포맷의 다양한 데이터 프로세서 프로그램에 저장되고 조작될 수 있다. 예를 들어, 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 이와 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 이와 실질적으로 동일한 서열은 마이크로소프트 WORD (등록상표) 또는 WORDPERFECT (등록상표)와 같은 워드 프로세싱 파일내의 텍스트로서, 또는 DB2 (등록상표), SYBASE (등록상표), 또는 ORACLE (등록상표)과 같은 당 업계에 친숙한 다양한 데이터베이스 프로그램내의 ASCII 파일로서 저장될 수 있다. 또한, 많은 컴퓨터 프로그램과 데이터베이스가 서열 비교 알고리즘, 확인자, 또는 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 이와 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 이와 실질적으로 동일한 서열과 비교될 참조 뉴클레오티드 서열 또는 폴리펩티드 서열의 소스로 이용될 수 있다. 하기 목록은 본 발명을 한정하기 위한 것이 아니라 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 이와 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 이와 실질적으로 동일한 서열에서 유용한 프로그램과 데이터베이스에 대한 지침을 제공하기 위한 것이다.
이용될 수 있는 프로그램과 데이터베이스는 하기를 포함하지만 그에 한정되는 것은 아니다: MacPattem (EMBL), DiscoveryBase (Molecular Applications Group), GeneMine (Molecular Applications Group), Look (Molecular Applications Group), MacLook (Molecular Applications Group), BLAST와 BLAST2 (NCBI), BLASTN과 BLASTX (Altschul et al, J. Mol. Biol. 215. 403,1990), FASTA (Pearson and Lipman, Proc. Natl. Acad. Sci. USA, 85: 2444,1988), FASTDB (Brutlag et al. Comp. App. Biosci. 6:237-245, 1990), Catalyst (Molecular Simulations Inc.), Catalyst/SHAPE (Molecular Simulations Inc.), Cerius2.DBAccess (Molecular Simulations Inc.), HypoGen (Molecular Simulations Inc.), Insight II, (Molecular Simulations Inc.), Discover (Molecular Simulations Inc.), CHARMm (Molecular Simulations Inc.), Felix (Molecular Simulations Inc.), DelPhi, (Molecular Simulations Inc.), QuanteMM, (Molecular Simulations Inc.), Homology (Molecular Simulations Inc.), Modeler (Molecular Simulations Inc.), ISIS (Molecular Simulations Inc.), Quanta/Protein Design (Molecular Simulations Inc.), WebLab (Molecular Simulations Inc.), WebLab Diversity Explorer (Molecular Simulations Inc.), Gene Explorer (Molecular Simulations Inc.), SeqFold (Molecular Simulations Inc.), MDL Available Chemicals Directory database, MDL Drug Data Report data base, Comprehensive Medicinal Chemistry database, Derwents's World Drug Index database, BioByteMasterfiledatabase, Genbank database 및 Genseqn database. 많은 다른 프로그램과 데이터 베이스가 본 발명의 개시 내용에 비추어 당업자에게는 자명할 것이다.
상기 프로그램을 이용하여 검출될 수 있는 모티프는 루이신 지퍼를 암호화하는 서열, 헬릭스-턴-헬릭스 모티프, 글리코실화 부위, 유비퀴틴화 부위, 알파 헬릭스 및 베타 시트, 암호화 단백질의 분비를 지시하는 신호 펩티드를 암호화하는 시그널 서열, 호메오박스와 같은 전사 조절에 관여하는 서열, 산성 스트레치, 효소 활성 부위, 기질 결합 부위 및 효소 절단 부위를 포함한다.
핵산의 하이브리드화
본 발명은 본 발명의 예시적 서열 (예를 들어, 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 1 69, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379)에 엄격한 조건하에서 하이브리드화하는 분리된 또는 재조합 핵산을 제공한다. 엄격한 조건은 매우 엄격한 조건, 중간 엄격도 조건 및/또는 낮은 엄격도 조건일 수 있으며, 여기서 개시된 높은 엄격도 조건 및 감소된 엄격도 조건을 포함한다. 한 태양에서, 하기하는 바와 같이, 핵산이 본 발명 범위내인지를 결정하는 조건을 정하는 것은 세척 조건의 엄격도이다.
다른 태양에서, 엄격한 조건하에서 하이브리드화하는 그들의 능력에 의해 정의되는 본 발명의 핵산은 본 발명의 핵산의 약 5개의 잔기와 전장 사이일 수 있다; 예를 들어, 이들은 길이가 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 55, 60, 65, 70, 75, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000 또는 그 이상 잔기일 수 있다. 전장보다 짧은 핵산 또한 포함된다. 이들 핵산은 예를 들어, 하이브리드화 프로브, 표지화 프로브, PCR 올리고뉴클레오티드 프로브, iRNA (단일 또는 이중쇄), 안티센스 또는 항체 결합 펩티드 (에피토프)를 암호화하는 서열, 모티프, 활성 부위 등으로서 유용할 수 있다.
한 태양에서, 본 발명의 핵산은 약 37℃ 내지 42℃에서 약 50% 포름아미드의 조건을 포함하는 높은 엄격도하에서 그들이 하이브리드화하는 능력에 의해 정의된다. 한 태양에서, 본 발명의 핵산은 약 30℃ 내지 35℃에서 약 35% 내지 25% 포름아미드에서의 조건을 포함하는 감소된 엄격도하에서 그들이 하이브리드화하는 능력에 의해 정의된다.
다르게는, 본 발명의 핵산은 50% 포름아미드, 5X SSPE, 0.3% SDS, 및 cot-1 또는 연어 정자 DNA (예, 200 n/ml 전단되고 변성된 연어 정자 DNA)와 같은 반복 서열 차단 핵산에서 42℃의 조건을 포함하는 높은 엄격도하에서 그들이 하이브리드화하는 능력에 의해 정의된다. 한 태양에서, 본 발명의 핵산은 35℃의 감소된 온도에서 35% 포름아미드를 포함하는 감소된 엄격도 조건하에서 하이브리드화하는 능력에 의해 정의된다.
핵산 하이브리드화 반응에서, 특정 수준의 엄격도를 이루기 위해 이용된 조건은 하이브리드화될 핵산의 특성에 따라 다를 것이다. 예를 들어, 핵산의 하이브리드화 영역의 길이, 상보성의 정도, 뉴클레오티드 서열 조성 (예, GC 대 AT 함량) 및 핵산 유형 (예, RNA 대 DNA)이 하이브리드화 조건을 선택할 때 고려될 수 있다. 추가의 고려 사항은 핵산중 하나가 예를 들어 필터상에 고정되는 지 여부이다.
하이브리드화는 낮은 엄격도, 중간 엄격도 또는 높은 엄격도의 조건하에서 실시될 수 있다. 핵산 하이브리드화의 예로서, 고정된 변성 핵산을 함유한 중합체 막이 먼저 0.9 M NaCl, 50 mM NaH2PO4, pH 7.0, 5.0 mM Na2EDTA, 0.5% SDS, 1OX 덴하르트 및 0.5 mg/ml 폴리리보아데닐산으로 구성된 용액에서 45℃에서 30분동안 예비하이브리드화된다. 약 2 X 107cpm (비활성 4-9 X 108CPM/㎍)의32P 말단-표지된 올리고뉴클레오티드 프로브를 이어서 상기 용액에 첨가한다. 12-16시간동안 항온처리한 후, 상기 막을 실온에서 0.5% SDS를 함유한 1X SET (150 mM NaCl, 20 mM Tris 하이드로클로라이드, pH 7.8, 1 mM Na2EDTA)에서 30분간 세척하고, 이어서 올리고뉴클레오티드 프로브를 위한 Tm-10℃에서 새로운 1X SET에서 30분 세척한다. 이어서 상기 막을 하이브리드화 시그널의 검출을 위해 방사성 필름에 노출시킨다.
전술한 모든 하이브리드화는 높은 엄격도 조건하인 것으로 간주된다.
하이브리드화 후, 필터를 세척하여 임의의 비-특이적으로 결합된 검출가능한 프로브를 제거한다. 필터를 세척하기 위해 이용된 엄격도는 또한 하이브리드화될 핵산의 특성, 하이브리드화될 핵산의 길이, 상보성의 정도, 뉴클레오티드 서열 조성 (예, GC 대 AT 함량) 및 핵산 유형 (예, RNA 대 DNA)에 따라 달라질 것이다. 점차적으로 더 높은 엄격도 조건 세척의 예는 다음과 같다: 실온에서 15분간 2X SSC, 0.1% SDS (낮은 엄격도); 실온에서 30분 내지 1 시간동안 0.1X SSC, 0.5% SDS (중간 엄격도); 하이브리드화 온도와 68℃ 사이에서 15 내지 30분간 0.1X SSC, 0.5% SDS (높은 엄격도); 및 72℃에서 15분동안 0.15M NaCl (매우 높은 엄격도). 최종 낮은 엄격도 세척은 실온에서 0.1 X SSC에서 실시될 수 있다. 상기 예들은 필터를 세척하기 위해 이용될 수 있는 조건의 한 세트의 예시일 뿐이다. 당업자는 다른 엄격도 세척을 위한 많은 레시피가 있음을 알 것이다. 일부 다른 예가 하기에 주어진다.
프로브에 하이브리드화한 핵산은 방사선사진촬영 또는 기타 종래 기술로 확인된다.
상기 절차는 프로브 서열에 대해 감소된 상동성 정도를 갖는 핵산을 확인하기 위해 변형될 수도 있다. 예를 들어, 검출가능한 프로브에 대해 감소된 상동성의 핵산을 얻기 위해서는, 덜 엄격한 조건을 이용할 수 있다. 예를 들어, 하이브리드화 온도는 약 1M의 Na+ 농도를 갖는 하이브리드화 완충액에서 68℃에서 42℃로 5℃ 만큼씩 감소될 수 있다. 하이브리드화 후, 필터를 하이브리드화 온도에서 2X SSC, 0.5% SDS로 세척할 수 있다. 이들 조건은 50℃ 이상에서는 "온건한" 조건 그리고 50℃ 미만에서 "낮은" 조건으로 간주된다. "온건한" 하이브리드화 조건의 구체적인 예는 상기 하이브리드화가 55℃에서 실시될 때이다. "낮은 엄격도" 하이브리드화 조건의 구체적인 예는 상기 하이브리드화가 45℃에서 실시될 때이다.
다르게는, 하이브리드화는 42℃의 온도에서 포름아미드를 함유한 6X SSC와 같은 완충액에서 실시될 수 있다. 이 경우에, 하이브리드화 완충액내의 포름아미드의 농도는 프로브에 대해 감소하는 상동성을 갖는 클론들을 확인하기 위하여 50%에서 0% 로 5% 씩 감소될 수 있다. 하이브리드화 후, 필터는 50℃에서 6X SSC, 0.5% SDS로 세척될 수 있다. 이들 조건은 25% 이상 포름아미드에서는 "온건한" 조건으로, 그리고 25% 이하 포름아미드에서는 "낮은" 조건으로 간주된다. "온건한" 하이브리드화 조건의 구체적인 예는 상기 하이브리드화가 30% 포름아미드에서 실시될 때이다. "낮은 엄격도" 하이브리드화 조건의 구체적인 예는 상기 하이브리드화가 10% 포름아미드에서 실시될 때이다.
하지만, 하이브리드화 포맷의 선택은 중요하지 않다 - 핵산이 본 발명의 범위내인지를 결정하는 조건을 결정하는 것은 세척 조건의 엄격도이다. 본 발명 범위내의 핵산을 확인하기 위해 이용된 세척 조건은 예를 들어, pH 7에서 약 0.02 몰의 염 농도와 적어도 약 50℃ 또는 약 55℃ 내지 약 60℃의 온도; 또는 약 15분간 72℃에서 약 0.15M NaCl의 염 농도; 또는 약 15 내지 약 20분동안 적어도 약 50℃ 또는 약 55℃ 내지 약 60℃의 온도와 약 0.2 X SSC의 염 농도; 또는 하이브리드화 복합체를 0.1% SDS를 함유한 약 2X SSC의 염 농도를 갖는 용액으로 실온에서 15분간 두번 세척하고 이어서 0.1% SDS를 함유한 0.1 X SSC에 의해 68℃에서 15분간 세척하기; 또는 등가의 조건. SSC 완충액과 등가의 조건의 설명을 위해서는 Sambrook, Tijssen 및 Ausubel을 참고한다.
이들 방법은 본 발명의 핵산을 분리하기 위해 이용될 수 있다. 예를 들어, 상기 방법들은 그룹 A의 핵산 서열 및 이와 실질적으로 동일한 서열 중 하나 또는 그것의 적어도 약 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, 또는 500개의 연속 염기를 포함하는 단편 및 여기에 상보적인 서열로 구성된 군으로부터 선택되는 핵산 서열에 적어도 약 97%, 적어도 95%, 적어도 90%, 적어도 85%, 적어도 80%, 적어도 75%, 적어도 70%, 적어도 65%, 적어도 60%, 적어도 55%, 적어도 50% 상동성을 갖는 서열을 갖는 핵산을 분리하기 위해 이용될 수 있다. 상동성은 배열 알고리즘을 이용하여 측정될 수 있다. 예를 들어, 상동성 폴리뉴클레오티드는 여기서 개시된 암호화 서열 중 하나의 자연 발생 대립유전자 변이체인 암호화 서열을 가질 수 있다. 그러한 대립유전자 변이체는 그룹 A의 핵산 서열 또는 이와 상보적인 서열의 핵산과 비교할 때 하나 이상의 뉴클레오티드의 치환, 결실 또는 부가를 가질 수 있다.
부가적으로, 상기 절차는 그룹 B의 아미노산 서열과 이와 실질적으로 동일한 서열중 하나 또는 서열 배열 알고리즘 (예, 디폴트 파리미터를 이용한 FASTA 버젼 3.0t78 알고리즘)을 이용하여 결정할 때 상기 폴리펩티드의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150 연속인 아미노산을 포함하는 단편의 서열을 갖는 폴리펩티드와 적어도 약 99%, 95%, 적어도 90%, 적어도 85%, 적어도 80%, 적어도 75%, 적어도 70%, 적어도 65%, 적어도 60%, 적어도 55%, 또는 적어도 50% 상동성을 갖는 폴리펩티드를 암호화하는 핵산을 분리하기 위해 이용될 수 있다.
올리고뉴클레오티드 프로브와 이를 이용하는 방법
본 발명은 또한 예를 들어 자일라나제 활성을 갖는 폴리펩티드 또는 그 단편을 암호화하는 핵산 또는 자일라나제 유전자를 확인하기 위해 이용될 수 있는 핵산 프로브를 제공한다. 한 태양에서, 상기 프로브는 본 발명의 핵산의 적어도 10 연속 염기를 포함한다. 다르게는, 본 발명의 프로브는 본 발명의 핵산에서 기재된 서열의 적어도 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 110, 120, 130, 150 또는 약 10 내지 50, 약 20 내지 60, 약 30 내지 70개의 연속 염기일 수 있다. 상기 프로브는 결합 및/또는 하이브리드화에 의해 핵산을 확인한다. 상기 프로브는 예를 들어 모세관 어레이를 비롯한 본 발명의 어레이에 이용될 수 있다. 본 발명의 프로브는 또한 다른 핵산 또는 폴리펩티드를 분리하기 위해 이용될 수 있다.
그룹 A의 핵산 서열 및 이와 실질적으로 동일한 서열, 이에 상보적인 서열, 또는 그룹 A의 핵산 서열 및 이와 실질적으로 동일한 서열, 또는 이에 상보적인 서열 중 하나의 적어도 10, 15, 20, 25, 30, 35, 40, 50, 75, 100,150, 200, 300, 400, 또는 500 연속 염기를 포함하는 단편의 분리된 핵산은 또한 토양 샘플과 같은 생물학적 샘플이 본 발명의 핵산 서열을 갖는 유기체 또는 상기 핵산이 얻어진 유기체를 함유하는지를 결정하기 위해 프로브로서 이용될 수 있다. 그러한 절차에서, 상기 핵산이 분리된 유기체를 보유한 생물학적 샘플이 얻어지고 그 샘플로부터 핵산을 얻는다. 상기 핵산을 그안에 존재하는 임의의 상보성 서열에 프로브가 특이적으로 하이브리드화하도록 하는 조건하에서 프로브와 접촉시킨다.
필요할 경우, 프로브가 상보성 서열에 특이적으로 하이브리드화하도록 하는 조건은, 상보성 서열을 함유하는 것으로 알려진 샘플로부터의 상보성 서열 및 상보성 서열을 함유하지 않는 참조 서열과 프로브가 접촉하도록 함으로써 결정될 수 있다. 하이브리드화 완충액의 염 농도, 하이브리드화 완충액의 포름아미드 농도, 또는 하이브리드화 온도와 같은 하이브리드화 조건은 프로브가 상보성 핵산에 특이적으로 하이브리드화하도록 하는 조건을 확인하기 위해 변형될 수 있다.
만일 샘플이 상기 핵산이 분리된 유기체를 함유하면, 프로브의 특이적 하이브리드화가 검출된다. 하이브리드화는 방사성 동위원소, 형광 염료, 또는 검출가능한 생성물의 형성을 촉매할 수 있는 효소와 같은 검출가능한 제제로 프로브를 표지함으로써 검출될 수 있다.
샘플내의 상보성 핵산의 존재를 검출하기 위해 표지된 프로브를 이용하기 위한 많은 방법들이 당업자에게 잘 알려져 있다. 이들은 서던 블롯, 노던 블롯, 콜로니 하이브리드화 과정 및 돗 블롯을 포함한다. 이들 과정의 각각을 위한 프로토콜은 Ausubel et al. Current Protocols in Molecular Biology, John Wiley 503 Sons, Inc. (1997) 및 Sambrook et al., Molecular Cloning. A Laboratory Manual 2nd Ed., Cold Spring Harbor Laboratory Press (1989)에 제공된다.
다르게는, 샘플이 본 발명의 핵산 서열을 함유한 유기체 (예, 상기 핵산이 분리된 유기체)를 함유하는지를 결정하기 위하여 하나보다 많은 프로브 (핵산 샘플내에 존재하는 임의의 상보성 서열에 특이적으로 하이브리드화할 수 있는 적어도 하나)를 증폭 반응에 이용할 수 있다. 일반적으로, 상기 프로브는 올리고뉴클레오티드를 포함한다. 한 태양에서, 증폭 반응은 PCR 반응을 포함할 수 있다. PCR 프로토콜은 상기한 Ausubel과 Sambrook에 개시된다. 다르게는, 증폭은 리가제 연쇄 반응, 3SR, 또는 쇄 치환 반응을 포함할 수도 있다. (Barany, F., "The Ligase Chain Reaction in a PCR World", PCR Methods and Applications 1:5-16,1991; E. Fahy et al., "Selfsustained Sequence Replication (3SR): An Isothermal Transcription-based Amplification System Alternative to PCR", PCR Methods and Applications 1:25-33,1991; 및 Walker G.T. et al., "Strand Displacement Amplification-an Isothermal in vitro DNA Amplification Technique", Nucleic Acid Research 20:1691-1696, 1992 참고). 그러한 과정에서, 샘플내의 핵산은 프로브와 접촉되고, 증폭 반응이 실시되고 임의의 생성된 증폭 생성물이 검출된다.증폭 생성물은 반응 생성물에 대해 젤 전기영동을 실시하고 에티듐 브로마이드와 같은 인터킬레이터로 젤을 염색함으로써 검출될 수 있다. 다르게는, 프로브 중 하나 이상을 방사성 동위원소로 표지하여 방사성 증폭 생성물의 존재를 젤 전기영동 후 방사성사진에 의해 검출할 수 있다.
그룹 A의 핵산 서열의 서열 및 이와 실질적으로 동일한 서열의 말단 근처의 서열로부터 유래한 프로브는 또한 그룹 A의 핵산 서열의 서열 및 이와 실질적으로 동일한 서열의 근처에 위치한 게놈 서열을 함유한 클론을 확인하기 위해 염색체 워킹 과정에 이용될 수도 있다. 그러한 방법은 숙주 유기체로부터 추가의 단백질을 암호화하는 유전자의 분리를 가능하게 한다.
그룹 A의 핵산 서열 및 이와 실질적으로 동일한 서열, 이에 상보적인 서열, 또는 그룹 A의 핵산 서열 및 이와 실질적으로 동일한 서열, 또는 이에 상보적인 서열의 서열 중 하나의 적어도 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, 또는 500 연속 염기를 포함하는 단편의 분리된 핵산을 프로브로 이용하여 관련 핵산을 확인하고 분리할 수 있다. 일부 태양에서, 관련 핵산은 상기 핵산이 분리된 유기체와 다른 유기체로부터의 cDNA 또는 게놈 DNA일 수 있다. 예를 들어, 다른 유기체는 관련 유기체일 수도 있다. 그러한 과정에서, 핵산 샘플은 프로브가 관련 서열에 특이적으로 하이브리드화하도록 하는 조건하에서 프로브와 접촉된다. 관련 유기체로부터의 핵산 서열에의 프로브의 하이브리드화를 이어서 전술한 임의의 방법을 이용하여 검출한다.
검출가능한 프로브에 하이브리드화하는 cDNA 또는 게놈 DNA와 같은 핵산을확인하기 위해 이용된 하이브리드화 조건의 엄격도를 변화시킴으로써, 프로브에 대한 상동성의 정도가 다른 핵산들이 확인되고 분리될 수 있다. 엄격도는 프로브의 융점 이하의 변하는 온도에서 하이브리드화를 실시함으로써 변화될 수 있다. 융점 Tm은 표적 서열의 50%가 완전히 상보적인 프로브에 하이브리드화하는 온도 (한정된 이온 강도와 pH하에서)이다. 매우 엄격한 조건은 구체적 프로브를 위한 Tm과 동일하거나 약 5℃ 낮은 온도로 선택된다. 프로브의 융점은 하기 식을 이용하여 계산될 수 있다:
길이가 14 내지 70 뉴클레오티드인 프로브의 경우, 융점은 식 Tm=81.5+16.6 (log [Na+])+0.41 (G+C 분율)- (600/N) (이때 N은 프로브의 길이)을 이용하여 계산된다.
만일 하이브리드화가 포름아미드를 함유한 용액에서 실시되면, 융점은 식 Tm = 81.5+16.6 (log [Na+])+0.41 (G+C 분율)- (0.63% 포름아미드)- (600/N) (N은 프로브의 길이)을 이용하여 계산될 수 있다.
예비하이브리드화는 6X SSC, 5X 덴하르트 시약, 0.5% SDS, 100㎍ 변성된 단편화된 연어 정자 DNA, 50% 포름아미드에서 실시될 수 있다. SSC와 덴하르트 용액을 위한 식은 상기한 Sambrook 등에 열거된다.
하이브리드화는 검출가능한 프로브를 상기에서 열거한 예비하이브리드화 용액에 첨가함으로써 실시된다. 프로브가 이중쇄 DNA를 포함하는 경우, 프로브는 하이브리드화 용액에 첨가하기 전에 변성시킨다. 필터를 충분한 기간동안 하이브리드화 용액과 접촉시켜 프로브가 프로브에 상보적이거나 상동성인 서열을 함유하는cDNA 또는 게놈 DNA에 하이브리드화하도록 한다. 200 뉴클레오티드 길이가 넘는 프로브의 경우, 하이브리드화는 Tm보다 15-25℃ 낮은 온도에서 실시될 수 있다. 올리고뉴클레오티드 프로브와 같은 더 짧은 프로브의 경우, 하이브리드화는 Tm보다 5-10℃ 낮은 온도에서 실시될 수 있다. 일반적으로, 6X SSC에서의 하이브리드화의 경우, 하이브리드화는 약 68 ℃에서 실시된다. 대개, 50% 포름아미드 함유 용액에서의 하이브리드화의 경우, 하이브리드화는 약 42℃ 에서 실시된다.
자일라나제의 발현 억제
본 발명은 본 발명의 핵산, 예를 들어 자일라나제-암호 핵산에 상보적인 (예를 들어 안티센스 서열) 핵산을 제공한다. 안티센스 서열은 자일라나제-암호 유전자의 수송, 스플라이싱 또는 전사를 억제할 수 있다. 상기 억제는 게놈 DNA 또는 메신저 RNA를 표적화함으로써 이루어질 수 있다. 표적화된 핵산의 전사 또는 기능은 예를 들어 하이브리드화 및/또는 절단에 의해 억제될 수 있다. 본 발명에 의해 제공되는 한 가지 특히 유용한 억제제 세트는 자일라나제 유전자 또는 메시지에 결합할 수 있는 올리고뉴클레오티드를 포함하며, 자일라나제의 생산 또는 기능을 막거나 억제한다. 상기 연합은 서열 특이적 하이브리드화를 통해서일 수 있다. 다른 유용한 억제제 부류는 자일라나제 메시지의 불활성화 또는 절단을 야기하는 올리고뉴클레오티드를 포함한다. 올리고뉴클레오티드는 리보자임과 같은, 그러한 절단을 야기하는 효소 활성을 가질 수 있다. 올리고뉴클레오티드는 화학적으로 변형되거나, 상보성 핵산 서열을 절단할 수 있는 효소 또는 조성물에 결합될 수 있다. 많은 다른 그러한 올리고뉴클레오티드의 풀을 원하는 활성을 갖는 것들에 대해 검사할 수 있다. 따라서, 본 발명은 핵산 및/또는 단백질 수준에서 자일라나제 발현의 억제를 위한 다양한 조성물을 제공하며, 예를 들어 본 발명의 자일라나제 서열을 포함하는 안티센스, iRNA 및 리보자임 및 본 발명의 항-자일라나제 항체가 있다.
자일라나제 발현의 억제는 다양한 산업적 적용을 가질 수 있다. 예를 들어, 자일라나제 발현의 억제는 부패를 늦추거나 막을 수 있다. 부패는 다당류, 예를 들어 구조 다당류가 효소적으로 분해될 때 발생할 수 있다. 이것은 과일 및 야채의 품질이 저하되거나 썩게 할 수 있다. 한 태양에서, 자이라나제의 발현 및/또는 활성을 억제하는 본 발명의 조성물, 예를 들어 항체, 안티센스 올리고뉴클레오티드, 리보자임 및 RNAi의 이용은 부패를 늦추거나 막기 위해 이용된다. 따라서, 한 태양에서, 본 발명은 부패를 늦추거나 막기 위해 본 발명의 항체, 안티센스 올리고뉴클레오티드, 리보자임 및 RNAi를 식물 또는 식물 생성물 (예, 시리얼, 곡물, 과일, 종자, 뿌리, 잎, 등)에 적용하는 것을 포함한 방법 및 조성물을 제공한다. 이들 조성물은 또한 식물 (예, 트랜스제닉 식물) 또는 다른 유기체 (예, 본 발명의 자일라나제 유전자로 형질전환된 박테리아 또는 다른 미생물)에 의해 발현될 수 있다.
자일라나제 발현의 억제를 위한 본 발명의 조성물 (예, 안티센스, iRNA, 리보자임, 항체)은 약학 조성물, 예를 들어 항-병원균 제제로서 또는 다른 치료, 예를 들어 살모넬라를 위한 항균제로서 사용될 수 있다.
안티센스 올리고뉴클레오티드
본 발명은 mRNA를 표적화함으로써 자일란 하이드롤라제 활성 (예, 내부 β-1,4-자일로시드 결합의 가수분해를 촉매)을 억제할 수 있는, 자일라나제 메시지에 결합할 수 있는 안티센스 올리고뉴클레오티드를 제공한다. 안티센스 올리고뉴클레오티드를 고안하기 위한 전략은 과학 문헌 및 특허 문헌에 잘 개시되어 있으며, 당업자는 본 발명의 신규한 시약을 이용하여 그러한 자일라나제 올리고뉴클레오티드를 고안할 수 있다. 예를 들어, 효과적인 안티센스 올리고뉴클레오티드를 스크리닝하기 위한 유전자 워킹/RNA 맵핑 프로토콜이 당업계에 공지되어 있으며, 예를 들어 가능한 안티센스 서열 선별을 위한 쉽고 믿을만한 방법을 제공하기 위한 표준 분자 기술에 기초한 RNA 맵핑 분석을 개시한 Ho (2000) Methods Enzymol. 314:168-183을 참고한다. 또한 Smith (2000) Eur. J. Pharm. Sci. 11: 191을 참고한다.
자연 발생 핵산이 안티센스 올리고뉴클레오티드로 이용된다. 안티센스 올리고뉴클레오티드는 임의의 길이일 수 있으며, 예를 들어 다른 태양에서, 안티센스 올리고뉴클레오티드는 약 5 내지 100, 약 10 내지 80, 약 15 내지 60, 약 18 내지 40사이이다. 적절한 길이는 일반적인 스크리닝에 의해 결정될 수 있다. 안티센스 올리고뉴클레오티드는 임의의 농도로 존재할 수 있다. 적절한 농도는 일반적인 스크리닝에 의해 결정될 수 있다. 가능한 문제를 해결할 수 있는 광범위한 합성, 비자연 발생 뉴클레오티드 및 핵산 유사체가 공지되어 있다. 예를 들어, N- (2-아미노에틸)글리신 유닛과 같은 비이온성 백본을 함유한 펩티드 핵산 (PNAs)이 이용될 수 있다. WO 97/0321 1; WO 96/39154; Mata (1997) Toxicol Appl Pharmacol 144:189-197; Antisense Therapeutics, ed. Agrawal (Humana Press, Totowa, N.J.,1996)에 개시된 대로, 포스포로티오에이트 결합을 가진 안티센스 올리고뉴클레오티드가 또한 이용될 수 있다. 본 발명에 의해 제공된 합성 DNA 백본 유사체를 갖는 안티센스 올리고뉴클레오티드는 또한 전술한 대로, 포스포로-디티오에이트, 메틸포스포네이트, 포스포르아미데이트, 알킬 포스포트리에스테르, 설파메이트, 3'-티오아세탈, 메틸렌 (메틸이미노), 3'-N-카르바메이트, 및 모르폴리노 카르바메이트 핵산을 포함할 수 있다.
조합 화학 방법을 이용하여, 본 발명의 센스 및 안티센스 자일라나제 서열과 같은, 임의의 표적에 대하여 적절한 결합 친화도와 특이성을 갖는 특정 올리고뉴클레오티드를 위해 신속하게 스크리닝될 수 있는 방대한 수의 올리고뉴클레오티드를 생성할 수 있다. (예, Gold (1995) J. of Biol. Chem. 270.13581-13584 참고)
억제성 리보자임
본 발명은 자일라나제 메시지에 결합할 수 잇는 리보자임을 제공한다. 이들 리보자임은 예를 들어 mRNA를 표적화함으로써 자일라나제 활성을 억제할 수 있다. 리보자임을 고안하고 표적화를 위한 자일라나제-특이적 안티센스 서열을 선별하기 위한 전략은 과학 및 특허 문헌에 잘 개시되어 있으며, 당업자는 본 발명의 신규한 시약을 이용하여 그러한 리보자임을 고안할 수 있다. 리보자임은 표적 RNA를 절단하는 RNA의 효소 부분에 인접한 리보자임의 표적 RNA 결합 부분을 통해 표적 RNA에 결합함으로써 작용한다. 따라서, 리보자임은 상보성 염기-쌍형성을 통해 표적 RNA를 인식하고 결합하며, 일단 정확한 부위에 결합되면, 표적 RNA를 효소적으로 절단하여 불활성화시킨다. 그러한 방식으로 표적 RNA를 절단하면, 그 절단이 암호화서열에 발생한 경우 RNA가 암호화 단백질의 합성을 지시하는 능력을 파괴할 것이다. 리보자임이 그 RNA 표적에 결합하여 절단한 후, 리보자임은 그 RNA로부터 유리되어 새로운 표적에 반복하여 결합하고 절단할 수 있다.
일부 경우에, 리보자임의 효소 특성은 치료를 하기 위해 필요한 리보자임의 효과적인 농도가 안티센스 올리고뉴클레오티드의 농도보다 낮을 수 있으므로, 안티센스 기법 (이 경우 핵산 분자는 단지 표적 핵산에 결합하여 핵산의 전사, 번역 또는 다른 분자와의 결합을 차단함)과 같은 다른 기술에 비하여 유익할 수 있다. 이 잠재적인 효과는 리보자임이 효소적으로 작용하는 능력을 반영한다. 따라서, 단일 리보자임 분자는 표적 RNA 분자 다수를 절단할 수 있다. 또한, 리보자임은 일반적으로 결합의 염기 쌍 형성 기작뿐만 아니라 이 분자가 그것이 결합하는 RNA의 발현을 억제하는 기작에 의존하는 억제 특이성을 갖는, 매우 특이적인 억제제이다. 즉, 상기 억제는 RNA 표적의 절단에 의해 야기되며, 따라서 특이성은 비-표적 RNA의 절단 속도에 대한 표적 RNA의 절단 속도의 비율로 정의된다. 이 절단 기작은 염기 쌍 형성에 관련된 것에 더하여 부가적인 요소들에 의존한다. 따라서, 리보자임의 작용의 특이성은 동일한 RNA 부위에 결합하는 안티센스 올리고뉴클레오티드보다 더 클 수 있다.
본 발명의 리보자임, 예를 들어 효소적 리보자임 RNA 분자는 해머해드 모티프, 헤어핀 모티프, 간염 델타 바이러스 모티프, 그룹 I 인트론 모티프 및/또는 RNA 가이드 서열과 연합된 RNaseP-유사 RNA로 형성될 수 있다. 해머해드 모티프의 예는 예를 들어, Rossi (1992) Aids Research and Human Retroviruses 8:183에 개시되고; 헤어핀 모티프는 Hampel (1989) Biochemistry 28:4929, 및 Hampel (1990) Nuc. Acids Res. 18:299에 개시되며; 간염 델타 바이러스 모티프는 Perrotta (1992) Biochemistry 31:16에 개시되며; RNaseP 모티프는 Guerrier-Takada (1983) Cell 35:849에 개시되며; 그리고 그룹 I 인트론은 Cech의 미국 특허 4,987,071호에 개시된다. 이들 특정 모티프의 언급은 제한의 의도가 아니다. 당업자는 본 발명의 리보자임, 예를 들어 본 발명의 효소적 RNA 분자가 표적 유전자 RNA 영역 중 하나 이상에 상보적인 특이적인 기질 결합 부위를 가질 수 있음을 인식할 것이다. 본 발명의 리보자임은 상기 기질 결합 부위내 또는 그 주위에 상기 분자에 RNA 절단 활성을 부여하는 뉴클레오티드 서열을 가질 수 있다.
RNA 간섭 (RANi)
한 태양에서, 본 발명은 본 발명의 자일라나제 서열을 포함하는, RNA 억제 분자, 소위 "RNAi" 분자를 제공한다. 상기 RNAi 분자는 이중쇄 RNA (dsRNA) 분자를 포함한다. RNAi는 자일라나제 유전자의 발현을 억제할 수 있다. 한 태양에서, RNAi는 약 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 또는 그 이상 길이의 이중쇄 뉴클레오티드이다. 본 발명이 어느 특정 작용 기작에 의해 제한되지 않음에도 불구하고, RNAi는 세포에 들어가 내인성 mRNA를 비롯한 유사한 또는 동일한 서열의 단일쇄 RNA (ssRNA)의 분해를 야기할 수 있다. 세포가 이중쇄 RNA (dsRNA)에 노출될 경우, 상동성 유전자로부터의 mRNA는 RNA 간섭 (RNAi)로 불리는 과정에 의해 선택적으로 분해된다. RNAi의 가능한 기본 기작은 특정 유전자 서열에 매치하는 이중쇄 RNA (dsRNA)를 짧은 간섭 RNA로 불리는 작은 조각들로 분해하여, 그 서열에 매치하는 mRNA의 분해를 야기하는 것이다. 한 태양에서, 본 발명의 RNAi는 유전자-사일런싱 치료에 이용되며, 예를 들어, Shuey (2002) Drug Discov. Today 7:1040-1046을 참고한다. 한 태양에서, 본 발명은 본 발명의 RNAi를 이용하여 RNA를 선택적으로 분해하는 방법을 제공한다. 이 방법은 시험관내, 생체외 또는 생체내에서 실시될 수 있다. 한 태양에서, 본 발명의 RNAi 분자는 세포, 기관 또는 동물에서 기능 상실 돌연변이를 생성시키기 위해 이용될 수 있다. RNA를 선택적으로 분해시키기 위해 RNAi 분자를 만들고 이용하는 방법은 당업계에 공지되어 있으며, 예를 들어, 미국 특허 제6,506,559호; 동 제6,511,824호; 동 제6,515,109호; 동 제6,489,127호를 참고한다.
핵산의 변형
본 발명은 본 발명의 핵산, 예를 들어 자일라나제를 암호화하는 핵산의 변이체를 생성하는 방법을 제공한다. 이들 방법은 다양한 조합으로 반복되거나 이용되어 주형 핵산에 의해 암호화되는 자일라나제와 비교하여 변형되거나 상이한 활성 또는 변형되거나 상이한 안정성을 갖는 자일라나제를 생성할 수 있다. 이들 방법은 또한 예를 들어, 유전자/메시지 발현, 메시지 번역 또는 메시지 안정성에서 변화를 생성하기 위해 다양한 조합으로 반복되거나 이용될 수 있다. 다른 태양에서, 세포의 유전적 조성은 예를 들어 상동성 유전자의 생체외 변형 및 이것을 세포내로 삽입함으로써 변형될 수 있다.
본 발명의 핵산은 임의의 수단에 의해 변형될 수 있다. 예를 들어, 임의의 또는 확률적인 방법, 또는, 비-확률적인, 또는 "지시된 진화" 방법이 있으며, 예를들어 미국 특허 6,361,974호를 참고한다. 유전자의 임의 돌연변이 방법은 공지되어 있으며, 예를 들어 미국 특허 5,830,696호를 참고한다. 예를 들어, 뮤타젠을 이용하여 유전자를 임의로 돌연변이시킬 수 있다. 뮤타젠은 예를 들어, 단독 또는 조합된, 자외선 또는 감마선, 또는 화학적 뮤타젠, 예, 미토마이신, 질산, 광활성화된 프소라렌을 포함하며 재조합에 의해 회복가능한 DNA 파괴를 유도한다. 다른 화학적 뮤타젠은 예를 들어, 소듐 비설파이트, 질산, 하이드록실아민, 하이드라진 또는 포름산을 포함한다. 다른 뮤타젠은 뉴클레오티드 전구체의 유사체, 예를 들어 니트로소구아니딘, 5-브로모우라실, 2-아미노퓨린, 또는 아크리딘이다. 이들 제제는 뉴클레오티드 전구체 대신 PCR 반응에 첨가되어 서열을 돌연변이시킬 수 있다. 프로플라빈, 아크리플라빈, 퀴나크린 등과 같은 인터킬레이트제 또한 이용될 수 있다.
분자 생물학의 임의의 기법, 예를 들어, 임의 PCR 돌연변이유발법이 이용될 수 있으며, 예를 들어 Rice (1992) Proc. Natl. Acad. Sci. USA 89:5467-5471를 참고하며; 또는 조합 다중 카세트 돌연변이유발법이 이용될 수 있으며, 예를 들어 Crameri (1995) Biotechniques 18:194-196을 참고한다. 다르게는, 핵산, 예를 들어 유전자는 임의, 또는 "확률적" 단편화 후에 재조립될 수 있으며, 예를 들어 미국 특허 6,291,242호; 6,287,862호; 6,287,861호; 5,955,358호; 5,830,721호; 5,824,514호; 5,811,238호; 및 5,605,793호를 참고한다. 다른 태양에서, 에러-프론 PCR, 셔플링, 올리고뉴클레오티드-지시된 돌연변이유발법, 조립 PCR, 성적 PCR 돌연변이유발법, 생체내 돌연변이유발법, 카세트 돌연변이유발법, 반복 앙상블 돌연변이유발법, 지수 앙상블 돌연변이유발법, 부위-특이적 돌연변이유발법, 유전자 재조립 (예, GeneReassembly (등록상표), 예를 들어 미국 특허 6.537,776호 참고), 유전자 부위 포화 돌연변이유발법 (GSSM (등록상표)), 합성 라이게이션 재조립 (SLR), 재조합, 반복성 서열 재조합, 포스포티오에이트-변형된 DNA 돌연변이유발법, 우라실-함유 주형 돌연변이유발법, 갭을 가진 이중쇄 돌연변이유발법, 점 미스매치 회복 돌연변이유발법, 회복-결핍 숙주 균주 돌연변이유발법, 화학적 돌연변이유발법, 방사능에 의한 돌연변이유발법, 결실 돌연변이유발법, 제한-선별 돌연변이유발법, 제한-정제 돌연변이유발법, 인공 유전자 합성, 앙상블 돌연변이유발법, 키메릭 핵산 다량체 생성, 및/또는 이들 및 다른 방법의 조합에 의해 변형, 부가 또는 결실이 도입된다.
하기 문헌은 본 발명의 방법에 통합될 수 있는 다양한 반복성 재조합 과정 및/또는 방법을 개시한다: Stemmer (1999) "Molecular breeding of viruses for targeting and other clinical properties" Tumor Targeting 4:1-4; Ness (1999) Nature Biotechnology 17:893 -896; Chang (1999) "Evolution of a cytokine using DNA family shuffling" Nature Biotechnology 17:793-797; Minshull (1999) "Protein evolution by molecular breeding" Current Opinion in Chemical Biology 3:284-290; Christians (1999) "Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shuffling" Nature Biotechnology 17:259-264; Crameri (1998) "DNA shuffling of a family of genes from diverse species accelerates directed evolution" Nature 391:288-291; Crameri (1997) "Molecularevolution of an arsenate detoxification pathway by DNA shuffling," Nature Biotechnology 15:436-438; Zhang (1997) "Directed evolution of an effective fucosidase from a galactosidase by DNA shuffling and screening" Proc. Natl. Acad. Sci. USA 94:4504-4509; Patten et al. (1997) "Applications of DNA Shuffling to Pharmaceuticals and Vaccines" Current Opinion in Biotechnology 8:724-733; Crameri et al. (1996) "Construction and evolution of antibody-phage libraries by DNA shuffling" Nature Medicine 2:100-103; Gates et al. (1996) "Affinity selective isolation of ligands from peptide libraries through display on a lac; repressor 'headpiece dimer, " Journal of Molecular Biology 255:373-386; Stemmer (1996) "Sexual PCR and Assembly PCR" In: The Encyclopedia of Molecular Biology. VCH Publishers, New York. pp 457; Crameri and Stemmer (1995) "Combinatorial multiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes" BioTechniques 18: 194-195; Stemmer et al. (1995) "Single-step assembly of a gene and entire plasmid form large numbers of oligodeoxyribonucleotides" Gene, 164:49-53; Stemmer (1995) "The Evolution of Molecular Computation" Science 270: 1510; Stemmer (1995) "Searching Sequence Space" Bio/Technology 13:549-553; Stemmer (1994) "Rapid evolution of a protein in vitro by DNA shuffling" Nature 370:389-391; 및 Stemmer (1994) "DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution." Proc. Natl. Acad. Sci. USA91:10747-10751.
다양성을 생성하는 돌연변이 방법은 예를 들어, 부위-지시된 돌연변이유발법 (Ling et al. (1997) "Approaches to DNA mutagenesis: an overview" Anal Biochem. 254 (2): 157-178; Dale et al. (1996) "Oligonucleotide-directed random mutagenesis using the phosphorothioate method" Methods Mol. Biol. 57:369-374; Smith (1985) "In vitro mutagenesis" Ann. Rev. Genet. 19:423-462; Botstein & Shortle (1 985) "Strategies and applications of in vitro mutagenesis" Science 229:1193-1201; Carter (1986) "Site-directed mutagenesis" Biochem. J. 237:1-7; 및 Kunkel (1987) "The efficiency of oligonucleotide directed mutagenesis" in Nucleic Acids & Molecular Biology (Eckstein, F. and Lilley, D. M. J. eds., Springer Verlag, Berlin)); 우라실 함유 주형을 이용하는 돌연변이 (Kunkel (1985) "Rapid and efficient site-specific mutagenesis without phenotypic selection" Proc. Natl. Acad. Sci. USA 82:488-492; Kunkel et al. (1987) "Rapid and efficient site-specific mutagenesis without phenotypic selection" Methods in Enzymol. 154, 367-382; 및 Bass et al. (1988) "Mutant Tip repressors with new DNA-binding specificities" Science 242:240-245); 올리고뉴클레오티드-지시된 돌연변이유발법 (Methods in Enzymol. 100: 468-500 (1983); Methods in Enzymol. 154: 329-350 (1987); Zoller (1982) "Oligonucleotide-directed mutagenesis using M13 -derived vectors: an efficient and general procedure for the production of point mutations in anyDNA fragment" Nucleic Acids Res. 10:6487-6500; Zoller & Smith (1983) "Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors" Methods in Enzymol. 100:468-500; 및 Zoller (1987) Oligonucleotide-directed mutagenesis: a simple method using two oligonucleotide primers and a single-stranded DNA template" Methods in Enzymol. 154:329-350); 포스포로티오에이트-변형된 DNA 돌연변이유발법 (Taylor (1985) "The use of phosphorothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA" Nucl. Acids Res. 13: 8749-8764; Taylor (1985) "The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA" Nucl. Acids Res. 13: 8765-8787 (1985); Nakamaye (1986) "Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide-directed mutagenesis" Nucl. Acids Res. 14: 9679-9698; Sayers (1988) "Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis" Nucl. Acids Res. 16:791-802; 및 Sayers et al. (1988) "Strand specific cleavage of phosphorothioate containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide" Nucl. Acids Res. 16: 803-814); 갭을 가진 이중쇄 DNA를 이용한 돌연변이 (Kramer et al. (1984) "The gapped duplex DNA approach to oligonucleotide-directed mutation construction" Nucl. Acids Res. 12: 9441-9456; Kramer & Fritz (1987) Methods in Enzymol. "Oligo-nucleotide-directed construction of mutations via gapped duplex DNA" 154:350-367; Kramer (1988) "Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction of mutations" Nucl. Acids Res. 16: 7207; 및 Fritz (1988) "Oligonucleotide-directed construction of mutations: a gapped duplex DNA procedure without enzymatic reactions in vitro" Nucl. Acids Res. 16: 6987-6999)를 포함한다.
본 발명을 실시하기 위해 이용될 수 있는 추가의 프로토콜은 점 미스매치 회복 (Kramer (1984) "Point Mismatch Repair" Cell 38:879-887), 회복-결핍 숙주 균주를 이용한 돌연변이유발법 (Carter et al. (1985) "Improved oligonucleotide site directed mutagenesis using M13 vectors" Nucl. Acids Res. 13: 4431-4443; 및 Carter (1987) "Improved oligonucleotide-directed mutagenesis using M13 vectors" Methods in Enzymol. 154. 382-403), 결실 돌연변이유발법 (Eghtedarzadeh (1986) "Use of oligonucleotides to generate large deletions" Nucl. Acids Res. 14: 5115), 제한-선별 및 제한-선별과 제한-정제 (Wells et al. (1986) "Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin" Phil. Trans. R. Soc. Lond. A 317. 415-423), 전체 유전자 합성에 의한 돌연변이유발법 (Nambiar et al. (1984) "Total synthesis and cloning of a gene coding for the ribonuclease S protein" Science 223: 1299-1301; Sakarriar and Khorana (1988) "Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-bindingprotein (transducin) " Nucl. Acids Res. 14: 6361-6372; Wells et al. (1985) "Cassette mutagenesis: an efficient method for generation of multiple mutations at defined sites" Gene 34:315-323; 및 Grundstrom et al. (1985) "Oligonucleotide-directed mutagenesis by microscale 'shot-gun' gene synthesis" Nucl. Acids Res. 13: 3305-3316), 이중쇄 파괴 회복 (Mandecki (1986); Arnold (1993) "Protein engineering for unusual environments" Current Opinion in Biotechnology 4:450 "Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli: a method for site-specific mutagenesis" Proc. Natl. Acad. Sci. USA, 83:7177-7181)을 포함한다. 상기 방법의 다수에 대한 추가의 상세 사항은 다양한 돌연변이유발 방법의 문제점을 위한 유용한 조절법을 개시하는 Methods in Enzymology Volume 154에 개시되어 있다.
본 발명을 실시하기 위해 이용될 수 있는 프로토콜은 Stemmer의 미국 특허 제5,605,793호 (1997년 2월 25일), "Methods for In Vitro Recombination"; Stemmer 등의 미국 특허 5,811,238호 (1998년 9월 22) "Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination"; Stemmer 등의 미국 특허 제5,830,721호 (1998년 11월 3), "DNA Mutagenesis by Random Fragmentation and Reassembly;" Stemmer 등의 미국 특허 제5,834,252호 (1998년 11월 10) "End-Complementary Polymerase Reaction;" Minshull 등의 미국 특허 5,837,458호 (1998년 11월 17), "Methods and Compositions for Cellular and Metabolic Engineering"; Stemmer와 Crameri의 WO95/22625호, "Mutagenesis by Random Fragmentation and Reassembly"; Stemmer와 Lipschutz의 WO 96/33207호 "End Complementary Polymerase Chain Reaction"; Stemmer와 Crameri의 WO 97/20078호 "Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination"; Minshull 과 Stemmer의 WO 97/35966호 "Methods and Compositions for Cellular and Metabolic Engineering"; Punnonen 등의 WO 99/41402호 "Targeting of Genetic Vaccine Vectors"; Punnonen 등의 WO 99/41383호 "Antigen Library Immunization"; Punnonen 등의 WO 99/41368호 "Optimization of Immunomodulatory Properties of Genetic Vaccines"; Stemmer와 Crameri의 EP 752008호 "DNA Mutagenesis by Random Fragmentation and Reassembly"; Stemmer의 EP 0932670호 "Evolving Cellular DNA Uptake by Recursive Sequence Recombination"; Stemmer 등의 WO 99/23107호 "Modification of Virus Tropism and Host Range by Viral Genomes Shuffling"; Apt 등의 WO 99/21979호 "Human Papillomavirus Vectors"; Cardayre 등의 WO 98/31837호 "Evolution of Whole Cells and Organisms by Recursive Sequence Recombination"; Patten 및 Stemmer의 WO 98/27230호 "Methods for Optimization of Gene Therapy by Recursive Sequence Shuffling and Selection"; WO 00/00632호, "Methods for Generating Highly Diverse Libraries", WO 00/09679, "Methods for Obtaining in Vitro Recombined Polynucleotides Sequence Banks and Resulting Sequences"; Arnold 등의 WO 98/42832호 "Recombination of Polynucleotide Sequence Using Random or Defined Primers"; Arnold 등의 WO99/29902호 "Method for Creating Polynucleotide and Polypeptide Sequences"; Vind 의 WO 98/41653호 "An in Vitro Method for Construction of a DNA Library", Borchert 등의 WO 98/41622호, "Method for Constructing a Library Using DNA Shuffling," 및 Pati와 Zarling의 WO 98/42727호, "Sequence Alterations using Homologous Recombination."에 개시된다.
본 발명을 실시하기 위해 이용될 수 있는 프로토콜은 (다양한 다양성 생성 방법에 관한 상세 사항을 제공함) 예를 들어 1999년 9월 28일에 출원된 Patten 등의 미국 특허 출원 (USSN) 제09/407,800호, "SHUFFLING OF CODON ALTERED GENES" ; del Cardayre 등의 미국 특허 제6,379,964호, "EVOLUTION OF WHOLE CELLS AND ORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION"; Crameri 등의 "OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION", 미국 특허 제6,319,714호; 동 제6,368,861호; 동 제6,376,246호; 동 제6,423,542호; 동 제6,426,224호 및 PCT/US00/01203호; Welch 등의 "USE OF CODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETIC SHUFFLING", 미국 특허 제6,436,675호; 2000년 1월 18일에 Selifonov 등이 출원한 "METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS" (PCT/US00/01202) 및 예를 들어, 2000년 1월 18일에 Selifonov 등이 출원한 "METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS" (미국 특허 출원 제09/618,579호); 2000년 1월 18일에 Selifonov와 Stemmer가 출원한 "METHODS OF POPULATING DATA STRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS" (PCT/US00/01138); 및2000년 9월 6일에 Afffiolter가 출원한 "SINGLE-STRANDED NUCLEIC ACID TEMPLATEMEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENT ISOLATION" (미국 특허 출원 제09/656,549호); 및 미국 특허 제6,177,263호; 동 제6,153,410호에 개시된다.
비-확률적, 또는 "지시된 진화" 방법은 예를 들어 포화 돌연변이 유발법 (GSSMTM), 합성 라이게이션 재조립 (SLR), 또는 그 조합을 이용하여 본 발명의 핵산을 변형시켜 새로운 또는 변형된 특성 (예, 매우 산성 또는 염기성 조건, 높거나 낮은 온도 하에서의 활성 등)을 갖는 자일라나제를 생성한다. 변형된 핵산에 의해 암호화되는 폴리펩티드는 자일란 가수분해 또는 다른 활성에 대해 시험하기 전에 활성에 대해 스크리닝될 수 있다. 예를 들어 모세관 어레이 플랫폼을 이용하는 것과 같은 임의의 시험 양식 또는 프로토콜을 이용할 수 있다. 예를 들어, 미국 특허 제6,361,974호; 동 제6,280,926호; 동 제5,939,250호를 참고한다.
포화 돌연변이유발, 또는 GSSM TM
일 측면에서, 축퇴성 N,N,G/T 서열을 포함하는 코돈 프라이머를 사용하여 점 돌연변이를 폴리뉴클레오티드, 예컨대 크실라나제 또는 본 발명의 항체에 도입하여, 전범위의 단일 아미노산 치환이 각 아미노산 위치, 예컨대 변형하고자 하는 표적화된 리간드 결합 부위 또는 효소 활성 부위 내의 아미노산 잔기에 나타나는 자손 폴리펩티드 세트를 형성한다. 이들 올리고뉴클레오티드는 인접한 제1 상동성 서열, 축퇴성 N,N,G/T 서열 및 경우에 따라 제2 상동성 서열을 포함할 수 있다.N,N,G/T 서열의 축퇴성은 모든 20개 아미노산에 대한 코돈을 포함하기 때문에, 그러한 올리고뉴클레오티드의 사용으로 얻은 하류 자손 전사 생성물은 폴리펩티드를 따라 각 아미노산 부위에서의 모든 가능한 아미노산 변화를 포함한다. 일 측면에서, 그러한 축퇴성 올리고뉴클레오티드(예컨대 하나의 축퇴성 N,N,G/T 카세트를 포함함)는 어버이 폴리뉴클레오티드 주형의 각각의 본래 코돈을 전체 범위의 코돈 치환시키는 데 사용된다. 또 다른 측면에서, 어버이 폴리뉴클레오티드 주형 내의 2개 이상의 본래 코돈을 전범위의 코돈 치환시키기 위해 2개 이상의 축퇴성 카세트가- 동일한 올리고뉴클레오티드 내인지 여부와 관련없이- 사용된다. 예를 들어, 하나 이상의 N,N,G/T 서열을 하나의 올리고뉴클레오티드에 포함시켜 하나 이상의 부위에 아미노산 돌연변이를 도입할 수 있다. 다수의 N,N,G/T 서열은 직접 인접하고 있거나, 또는 하나 이상의 추가의 뉴클레오티드 서열(들)에 의해 분리되어 있을 수 있다. 또 다른 측면에서, 삽입 및 결실을 도입하기 위해 사용가능한 올리고뉴클레오티드를 단독으로, 또는 N,N,G/T 서열을 함유하는 코돈과 함께 사용하여 아미노산 삽입, 결실 및/또는 치환의 임의의 조합 또는 순열을 도입할 수 있다.
일 측면에서, 2개 이상의 인접하는 아미노산 위치의 동시 돌연변이유발은 인접하는 N,N,G/T 트리플릿, 즉 축퇴성 (N,N,G/T)n 서열을 포함하는 올리고뉴클레오티드를 사용하여 실시한다. 또 다른 측면에서, N,N,G/T 서열보다 축퇴성이 적은 축퇴성 카세트가 사용된다. 예를 들어, 일부 예에서 하나의 N만을 포함하는 축퇴성 트리플릿 서열을 (예컨대 올리고뉴클레오티드 중에) 사용하는 것이 바람직할 수 있으며, 여기서 상기 N은 트리플릿의 제1, 제2 또는 제3 위치내에 있을 수 있다. 임의의 조합 및 순열을 비롯한 임의의 다른 염기를 트리플릿의 남은 2개 위치에 사용할 수 있다. 대안적으로, 일부 예에서는 축퇴성 N,N,N 트리플릿 서열을 (예컨대 올리고뉴클레오티드 중에서) 사용하는 것이 바람직할 수 있다.
일 측면에서, 축퇴성 트리플릿(예, N,N,G/T 트리플릿)을 사용하면 (총 20개 아미노산에 대한) 가능한 전범위의 천연 아미노산을 폴리펩티드 내의 각각의 모든 아미노산 위치로 체계적이고 수월하게 형성할 수 있다(대안적인 측면에서, 이 방법은 아미노산 잔기 또는 코돈, 위치당 모든 가능한 치환보다 적은 형성을 포함한다). 예를 들어, 100 아미노산 폴리펩티드의 경우, 2000개의 특징적인 종(즉, 위치당 20개의 가능한 아미노산 X 100 아미노산 위치)이 형성될 수 있다. 축퇴성 N,N,G/T 트리플릿을 포함하는 올리고뉴클레오티드 또는 올리고뉴클레오티드 세트를 사용하면, 32개의 각 서열은 20개의 가능한 모든 천연 아미노산을 암호화할 수 있다. 따라서, 하나 이상의 그러한 올리고뉴클레오티드를 사용하여 어버이 폴리뉴클레오티드 서열을 포화 돌연변이유발시키는 반응 용기에서, 20개의 특징적인 폴리펩티드를 암호화하는 32개의 특징적인 자손 폴리뉴클레오티드가 형성된다. 대조적으로, 부위 지향적 돌연변이유발에서 비축퇴성 올리고뉴클레오티드의 사용은 반응 용기당 오직 한개의 자손 폴리펩티드 산물을 유도한다. 비축퇴성 올리고뉴클레오티드는 경우에 따라서 개시된 축퇴성 프라이머와 함께 사용될 수 있다; 예를 들어, 비축퇴성 올리고뉴클레오티드를 사용하여 작용 폴리뉴클레오티드 내의 특이적 점 돌연변이를 형성할 수 있다. 이것은 특이적 침묵 점 돌연변이, 상응하는 아미노산 변화를 초래하는 점 돌연변이, 및 종지 코돈의 형성과 폴리펩티드 단편의 상응하는 발현을 유발하는 점 돌연변이를 형성하는 수단을 제공한다.
일 측면에서, 각각의 포화 돌연변이유발 반응 용기는, 어버이 폴리뉴클레오티드에서 돌연변이유발된 코돈 위치에 상응하는 하나의 특이적 아미노산 위치에서 모든 20개의 천연 아미노산이 나타나도록 20개 이상의 자손 폴리펩티드(예, 크실라나제) 분자를 암호화하는 폴리뉴클레오티드를 포함한다(다른 측면에서는 모든 20개 천연 조합 미만을 이용한다). 각 포화 돌연변이유발 반응 용기로부터 형성된 32배 축퇴성 자손 폴리펩티드를 클론 증폭시키고(예컨대, 발현 벡터를 사용하여 적절한 숙주(예, 이.콜리 숙주)로 클로닝시킴), 발현 스크리닝한다. 스크리닝으로 바람직한 성질 변화(어버이 폴리펩티드와 비교하여, 예컨대 알칼리 또는 산성 조건 하에 크실란 가수분해 활성 증가)를 나타내는 각 자손 폴리펩티드가 확인되면, 그 내부에 포함된 상응하게 바람직한 아미노산 치환을 확인하기 위해 서열 결정할 수 있다.
일 측면에서, 본 명세서에 개시된 바와 같이 포화 돌연변이유발을 사용하여 어버이 폴리펩티드 내의 각각의 모든 아미노산 위치를 돌연변이시키면, 하나 이상의 아미노산 위치에서 바람직한 아미노산 변화가 확인될 수 있다. 바람직한 아미노산 치환 전체 또는 일부의 조합을 포함하는 하나 이상의 신규한 자손 분자를 형성할 수 있다. 예를 들어, 2 특이적인 바람직한 아미노산 변화가 폴리펩티드 중 3 아미노산 위치 각각에서 확인되는 경우, 순열은 각 위치(본래 아미노산으로부터의 변화가 없는 경우, 및 2가지 바람직한 변화 각각) 및 3개 위치에서 3가지 가능성을 포함한다. 따라서, 미리 시험된 6개의 단일 점 돌연변이(즉, 3개 위치 각각에서 2개) 및 임의의 위치에서의 무변화인 7 경우를 비롯하여 전체 가능성은 3 x 3 x 3, 즉 27이다.
또 다른 측면에서, 스크리닝과 병행하여, 부위 포화 돌연변이유발을 셔플링, 키메라, 재조합 및 기타 돌연변이유발 과정과 함께 사용할 수 있다. 본 발명은 포화 돌연변이유발을 비롯한 임의의 돌연변이유발 과정(들)을 반복적 방식으로 이용한다. 한가지 적례에서, 임의의 돌연변이유발 과정(들)의 반복적 사용을 스크리닝과 조합하여 이용한다.
또한 본 발명은 전범위의 단일 아미노산 치환이 각 아미노산 위치에서 나타나는(유전자 부위 포화된 돌연변이유발(GSSMTM)) 자손 폴리펩티드 세트를 형성하기 위해서, 점 돌연변이를 폴리뉴클레오티드로 도입하기 위한 (축퇴성 N,N,N 서열을 포함하는) 독점의 코돈 프라이머의 용도를 제공한다. 사용된 올리고뉴클레오티드는 제1 상동성 서열, 축퇴성 N,N,N 서열 및 바람직하지만 필수적인 것은 아닌 제2 상동성 서열을 인접한 상태로 포함한다. N,N,N 서열의 축퇴성은 모든 20개 아미노산에 대한 코돈을 포함하기 때문에, 그러한 올리고뉴클레오티드의 사용으로부터 생긴 하류 자손 번역 생성물은 폴리펩티드를 따라 각 아미노산 부위에서 모든 가능한 아미노산 변화를 포함한다.
일 측면에서, 그러한 하나의 축퇴성 올리고뉴클레오티드(하나의 축퇴성 N,N,N 카세트를 포함함)는 어버이 폴리뉴클레오티드 주형 내의 각각의 본래 코돈을 전범위 코돈 치환시키는 데 사용된다. 또 다른 측면에서, 어버이 폴리뉴클레오티드주형 내의 2개 이상의 본래 코돈을 전범위의 코돈 치환시키기 위해 2개 이상의 축퇴성 N,N,N 카세트가- 동일한 올리고뉴클레오티드 내인지 여부와 관련없이- 사용된다. 따라서, 하나 이상의 N,N,N 서열을 하나의 올리고뉴클레오티드에 포함시켜 하나 이상의 부위에 아미노산 돌연변이를 도입할 수 있다. 다수의 N,N,N 서열은 직접 인접하고 있거나, 또는 하나 이상의 추가의 뉴클레오티드 서열(들)에 의해 분리되어 있을 수 있다. 또 다른 측면에서, 삽입 및 결실을 도입하기 위해 사용가능한 올리고뉴클레오티드를 단독으로, 또는 N,N,N 서열을 함유하는 코돈과 함께 사용하여 아미노산 삽입, 결실 및/또는 치환의 임의의 조합 또는 순열을 도입할 수 있다.
특정 적례에서, 인접하는 N,N,N 트리플릿, 즉 축퇴성 (N,N,N)n서열을 포함하는 올리고뉴클레오티드를 사용하여 2 이상의 인접한 아미노산 위치를 동시에 돌연변이시킬 수 있다.
또 다른 측면에서, 본 발명은 N,N,N 서열보다 축퇴성이 적은 축퇴성 카세트의 사용을 포함한다. 예를 들어, 일부 예에서 하나의 N만을 포함하는 축퇴성 트리플릿 서열을 (예컨대 올리고뉴클레오티드 중에) 사용하는 것이 바람직할 수 있으며, 여기서 상기 N은 트리플릿의 제1, 제2 또는 제3 위치내에 있을 수 있다. 임의의 조합 및 순열을 비롯한 임의의 다른 염기를 트리플릿의 남은 2개 위치에 사용할 수 있다. 대안적으로, 일부 예에서는 축퇴성 N,N,N 트리플릿 서열, N,N.G/T 또는 N,N,G/C 트리플릿 서열을 (예컨대 올리고뉴클레오티드 중에서) 사용하는 것이 바람직할 수 있다.
그러나, 본 명세서 중에 개시된 축퇴성 트리플릿(예, N,N,G/T 또는 N,N,G/C 트리플릿 서열)의 사용은 몇몇 이유로 유리할 것으로 예상된다. 일 측면에서, 본 발명은 (총 20개의 아미노산에 대한) 전범위의 가능한 아미노산의 치환을 폴리펩티드의 각각의 모든 아미노산 위치에 체계적으로 꽤 수월하게 형성하는 수단을 제공한다. 따라서, 100 아미노산 폴리펩티드에 대하여, 본 발명은 2000개의 별개의 종(즉, 위치당 20개의 가능한 아미노산 X 100개 아미노산 위치)을 체계적으로 매우 수월하게 형성하는 방법을 제공한다. 축퇴성 N,NG/T 또는 N,N,G/C 트리플릿 서열을 포함하는 올리고뉴클레오티드를 사용하면 20개의 가능한 아미노산에 대해 암호화하는 32개의 개별 서열이 제공된다. 따라서, 그러한 올리고뉴클레오티드를 사용하여 어버이 폴리뉴클레오티드 서열을 포화 돌연변이유발시키는 반응 용기에서, 20개의 별개의 폴리펩티드를 암호화하는 32개의 별개의 자손 폴리뉴클레오티드가 형성된다. 대조적으로, 부위 지정 돌연변이유발법에서의 비-축퇴성 올리고뉴클레오티드의 사용은 반응 용기당 단 하나의 자손 폴리펩티드 생성물을 유도한다.
본 발명은 또한 개시된 축퇴성 프라이머와 함께 경우에 따라 사용될 수 있는 비축퇴성 올리고뉴클레오티드의 사용에 관한 것이다. 일부 상황에서 작용 폴리뉴클레오티드 내에 특이적 점 돌연변이를 형성하기 위해 비축퇴성 올리고뉴클레오티드를 사용하는 것이 유리할 것으로 예상된다. 이것은 특이적인 침묵 점 돌연변이, 상응하는 아미노산 변화를 초래하는 점 돌연변이 및 종지 코돈의 형성과 폴리펩티드 단편의 상응하는 발현을 유발하는 점 돌연변이를 형성하는 수단을 제공한다.
본 발명의 일 측면에서, 각 포화 돌연변이유발 반응 용기는 적어도 20개의자손 폴리펩티드 분자를 암호화하는 폴리뉴클레오티드를 포함하여 어버이 폴리뉴클레오티드에서 돌연변이된 코돈 위치에 상응하는 하나의 특이적 아미노산 위치에 모든 20개 아미노산이 나타나도록 한다. 각 포화 돌연변이유발 반응 용기로부터 형성된 32배 축퇴성 자손 폴리펩티드를 클론 증폭시키고(예컨대, 발현 벡터를 사용하여 적절한 이.콜리 숙주로 클로닝시킴), 발현 스크리닝한다. 스크리닝으로 (어버이 폴리펩티드와 비교하여) 바람직한 성질 변화를 나타내는 각 자손 폴리펩티드가 확인되면, 그 내부에 포함된 상응하게 바람직한 아미노산 치환을 확인하기 위해 서열 결정할 수 있다.
일 측면에서, 본 명세서에 개시된 바와 같이 포화 돌연변이유발을 사용하여 어버이 폴리펩티드 내의 각각의 모든 아미노산 위치를 돌연변이시키면, 하나 이상의 아미노산 위치에서 바람직한 아미노산 변화가 확인될 수 있다. 바람직한 아미노산 치환 전체 또는 일부의 조합을 포함하는 하나 이상의 신규한 자손 분자를 형성할 수 있다. 예를 들어, 2 특이적인 바람직한 아미노산 변화가 폴리펩티드 중 3 아미노산 위치 각각에서 확인되는 경우, 순열은 각 위치(본래 아미노산으로부터의 변화가 없는 경우, 및 2가지 바람직한 변화 각각) 및 3개 위치에서 3가지 가능성을 포함한다. 따라서, 미리 시험된 6개의 단일 점 돌연변이(즉, 3개 위치 각각에서 2개) 및 임의의 위치에서의 무변화인 7 경우를 비롯하여 전체 가능성은 3 x 3 x 3, 즉 27이다.
따라서, 비제한적인 적례에서, 본 발명은 2 이상의 관련 폴리뉴클레오티드가 적절한 숙주 세포 내로 도입되어 하이브리드 폴리뉴클레오티드가 재조합 및 감법재분류에 의해 형성되는 방법과 같은 추가의 돌연변이화 방법과 함께 포화 돌연변이유발법을 사용하는 것을 제공한다.
전체 유전자 서열을 따라 돌연변이유발시키는 것 외에, 본 발명에서는 폴리뉴클레오티드 서열 내의 임의의 수의 염기 각각을 치환하는 데 돌연변이유발법을 사용할 수 있으며, 이 때 돌연변이화하려는 염기의 수는 바람직하게는 15∼100,000의 모든 정수이다. 따라서, 분자를 따라 모든 위치에서 돌연변이시키는 대신에, 모든 또는 이산된 수의 염기(바람직하게는 총 15∼100,000의 서브세트)를 돌연변이유발시킬 수 있다. 바람직하게는, 폴리뉴클레오티드 서열을 따라 각 위치 또는 위치군을 돌연변이유발하는 데 별도의 뉴클레오티드를 사용한다. 돌연변이하고자 하는 3위치군은 코돈일 수 있다. 돌연변이성 카세트라고도 하는 이종성 카세트를 포함하는 돌연변이성 프라이머를 사용하여 돌연변이를 도입하는 것이 바람직하다. 예시적 카세트는 1∼500 염기를 가질 수 있다. 그러한 이종성 카세트 내의 각 뉴클레오티드 위치는 N, A, C, G, T, A/C, A/G, A/T, C/G, C/T, G/T, C/G/T, A/G/T, A/C/T, A/C/G 또는 E이며, 여기서 E는 A, C, G 또는 T가 아닌 임의의 염기이다(E는 디자이너 올리고뉴클레오티드라고도 언급될 수 있음).
일반적인 의미에서, 포화 돌연변이유발은 돌연변이시키고자 하는 규명된 폴리뉴클레오티드(이 때 돌연변이시키고자 하는 서열은 바람직하게는 약 15∼100,000 염기 길이임) 내의 돌연변이성 카세트의 완전한 세트(이 때, 각 카세트는 바람직하게는 약 1∼500 염기 길이임)를 돌연변이시키는 것을 포함한다. 따라서, 돌연변이군(1∼100 돌연변이)을 돌연변이시키고자 하는 각 카세트에 도입한다. 하나의 카세트 내로 도입하고자 하는 돌연변이의 그룹핑은, 포화 돌연변이 1회 적용 과정에서 제2 카세트로 도입하고자 하는 돌연변이의 제2 그룹핑과 상이하거나 또는 동일할 수 있다. 그러한 그룹핑의 예는 결실, 첨가, 특정 코돈의 그룹핑 및 특정 뉴클레오티드 카세트의 그룹핑이다.
돌연변이시키고자 하는 규명된 서열은 전체 유전자, 경로, cDNA, 전체 오픈 리딩 프레임(ORF) 및 전체 프로모터, 인헨서, 리프레서/트랜스액티베이터, 복제 기점, 인트론, 오퍼레이터 또는 임의의 폴리뉴클레오티드 작용기를 포함한다. 일반적으로, 이러한 목적의 "소정 서열"은 임의의 폴리뉴클레오티드, 즉 15염기 폴리뉴클레오티드 서열과 15∼15,000 염기의 폴리뉴클레오티드 서열일 수 있다(본 발명은 구체적으로 그 사이의 모든 정수를 포함한다). 코돈의 그룹핑을 선택하는 데 있어서의 고려 사항으로는 축퇴성 돌연변이 카세트가 암호화하는 아미노산의 유형이 포함된다.
돌연변이성 카세트로 도입할 수 있는 돌연변이의 그룹핑의 일례에서, 본 발명은 각 위치에서 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 및 20 아미노산에 대해 암호화하는 (축퇴성 올리고뉴클레오티드를 사용한) 축퇴성 코돈 치환 및 이에 의해 암호화되는 폴리펩티드의 라이브러리를 제공한다.
합성 연결 재조립(SLR)
본 발명은 신규하거나 변형된 성질을 갖는 폴리펩티드, 예컨대 크실라나제 또는 본 발명의 항체를 형성하는 "유도성 진화 과정"인 "합성 연결 재조립" 또는 간단히 "SLR"이라고 하는 비확률론적인 유전자 변형 시스템을 제공한다.
SLR은 비확률론적으로 올리고뉴클레오티드 단편을 함께 연결시키는 방법이다. 이 방법은 핵산 빌딩 블록이 셔플링, 농축 또는 무작위하게 키메라화되지 않는다는 점에서 확률론적인 올리고뉴클레오티드 셔플링과는 다르며, 오히려 비확률론적으로 조립된다. 예컨대 "Synthetic Ligation Reassembly in Directed Evolution"이라는 명칭으로 1999년 6월 14일에 출원된 미국 특허 출원(USSN) 09/332,835호 ("USSN 09/332,835호") 참조. 일 측면에서, SLR은 하기의 단계들을 포함한다: (a) 상동성 유전자를 암호화하는 서열을 포함하는 주형 폴리뉴클레오티드를 제공하는 단계; (b) 소정의 서열에서 주형 폴리뉴클레오티드와 교차 재조립하도록 고안되고, 주형 폴리뉴클레오티드의 측면에 있는 변종 서열에 상동성인 서열 및 상동성 유전자 변종인 서열을 포함하는 다수의 빌딩 블록 폴리뉴클레오티드를 제공하는 단계; (c) 빌딩 블록 폴리뉴클레오티드를 주형 폴리뉴클레오티드와 조합하여 빌딩 블록 폴리뉴클레오티드를 주형 폴리뉴클레오티드와 교차 재조립하여 상동성 유전자 서열 변이체를 포함하는 폴리뉴클레오티드를 형성하는 단계.
SLR은 재배열하고자 하는 폴리뉴클레오티드 사이의 높은 레벨의 상동성의 존재에 따라 좌우되지 않는다. 따라서, 이 방법을 사용하여 10100이상의 상이한 키메라를 포함하는 자손 분자의 라이브러리(또는 세트)를 비확률론적으로 형성할 수 있다. SLR을 이용하여 101000이상의 상이한 자손 키메라를 포함하는 라이브러리를 형성할 수 있다. 따라서, 본 발명의 측면들은 디자인에 의해 선택된 전체 조립 순서로 축소된 최종 키메라 핵산 분자 세트를 생성하는 비확률론적인 방법을 포함한다.이 방법은 사용가능한 상호 상용성 연결성 말단을 갖는 다수의 특이적 핵산 빌딩 블록을 디자인으로 형성하는 단계, 및 이들 핵산 빌딩 블록을 조립하는 단계를 포함하여 디자인된 전체 조립 순서를 실현한다.
조립하고자 하는 핵산 빌딩 블록의 상호 상용성 연결성 말단은, 소정 순서로 빌딩 블록을 커플링시킬 수 있는 경우 이러한 유형의 순서에 따른 조립에 대해 '사용가능한' 것으로 간주된다. 따라서, 핵산 빌딩 블록이 커플링될 수 있는 전체 조립 순서를 연결성 말단의 디자인으로 특정한다. 하나 이상의 조립 단계를 사용하는 경우, 핵산 빌딩 블록이 커플링될 수 있는 전체 조립 순서는 조립 단계(들)의 순차적인 순서에 의해 특정된다. 일 측면에서, 어닐링된 빌딩 조각을 효소, 예컨대 리가제(예, T4 DNA 리가제)로 처리하여 빌딩 조각의 공유 결합을 형성한다.
일 측면에서, 올리고뉴클레오티드 빌딩 블록의 디자인은 최종 키메라 폴리뉴클레오티드의 자손 세트를 생성하는 베이스로서 작용하는 선조 핵산 서열 주형의 세트를 분석하여 얻는다. 따라서, 이들 어버이 올리고뉴클레오티드 주형은 돌연변이시키고자 하는, 예컨대 키메라화 또는 셔플링시키고자 하는 핵산 빌딩 블록의 디자인을 보조하는 서열 정보원으로서 작용한다. 본 발명의 일 측면에서, 다수의 어버이 핵산 주형의 서열을 정렬시켜 하나 이상의 분계점(demarcation point)을 선택한다. 분계점은 상동성 영역에 위치할 수 있으며, 하나 이상의 뉴클레오티드를 포함한다. 이들 분계점은 선조 주형 중 2개 이상과 공유되는 것이 바람직하다. 분계점을 사용하여 어버이 폴리뉴클레오티드를 재배열하기 위해 형성하고자 하는 올리고뉴클레오티드 빌딩 블록의 경계를 정할 수 있다. 선조 분자 내에서 확인 및 선택된 분계점은 최종 키메라 자손 분자의 조립시 유효 키메라점으로서 작용한다. 분계점은 2 이상의 어버이 폴리뉴클레오티드 서열에 의해 공유되는 상동성 영역(하나 이상의 상동성 뉴클레오티드 염기를 포함함)일 수 있다. 대안적으로, 분계점은 어버이 폴리뉴클레오티드 서열의 적어도 1/2에 의해 공유되는 상동성 영역이거나, 또는 어버이 폴리뉴클레오티드 서열의 적어도 2/3에 의해 공유되는 상동성 영역일 수 있다. 더욱 더 바람직하게는 작용가능한 분계점은 어버이 폴리뉴클레오티드 서열의 적어도 3/4에 의해 공유되는 상동성 영역이거나, 또는 거의 모든 어버이 폴리뉴클레오티드 서열에 의해 공유될 수 있다. 일 측면에서, 분계점은 모든 어버이 폴리뉴클레오티드 서열에 의해 공유되는 상동성 영역이다.
일 측면에서, 자손 키메라 폴리뉴클레오티드의 남김없는 라이브러리를 형성하기 위해서 연결 재조립 과정을 철저히 실시한다. 즉, 핵산 빌딩 블록의 모든 가능한 순서의 조합이 최종 키메라 핵산 분자 세트 내에 나타난다. 동시에, 또 다른 측면에서, 각 조합의 조립 순서(즉, 각 최종 키메라 핵산의 5' → 3' 서열에서 각 빌딩 블록의 조립 순서)는 전술한 바와 같이 디자인에 의한다(즉, 비확률론적임). 본 발명의 비확률론적 특성으로 인하여, 원하지 않는 부산물의 가능성이 크게 감소된다.
또 다른 측면에서, 연결 조립 방법은 체계적으로 실시한다. 예를 들어, 자손 분자의 체계적으로 구획화된 라이브러리를 형성하기 위해서 이 방법을 실시하는 데, 구획은 예컨대 하나씩 체계적으로 스크리닝될 수 있다. 다시 말하면, 본 발명에 따르면, 순차적 단계의 조립 반응의 선별적이고 적절한 사용과 함께, 특이적 핵산빌딩 블록의 선별적이고 적절한 사용을 통해 특정 자손 생성물 세트가 일부 반응 용기 각각에서 제조되는 디자인을 실현할 수 있다. 이로 인하여 체계적 조사 및 스크리닝 절차가 실시 가능해진다. 따라서, 이들 방법에서는 잠재적으로 매우 많은 수의 자손 분자를 더 적은 군에서 체계적으로 검사할 수 있게 된다. 매우 융통성이 있지만 철저하고 체계적인 방법으로 키메라화를 실시하는 능력으로 인하여, 특히 선조 분자들 사이의 상동성 레벨이 낮은 경우, 이들 방법은 다수의 자손 분자를 포함하는 라이브러리(또는 세트)를 형성한다. 본 연결 재조립 발명의 비확률론적인 특성으로 인하여, 생성된 자손 분자는 디자인에 의해 선택된 전체 조립 순서를 갖는 최종 키메라 핵산 분자의 라이브러리를 포함하는 것이 바람직하다. 또한, 포화 돌연변이유발 및 최적화된 유도성 진화 방법을 사용하여 상이한 자손 분자 종을 형성할 수 있다. 본 발명은 분계점의 선택, 핵산 빌딩 블록의 크기 및 수, 그리고 커플링의 크기 및 디자인에 관해 자유로히 선택하고 조절할 수 있을 것으로 기대된다. 또한, 본 발명의 작동능을 위한 분자간 상동성에 대한 요건은 매우 완화될 것으로 예상된다. 실제로, 분계점은 분자간 상동성이 거의 또는 전혀 없는 영역에서 선택할 수 있다. 예를 들어, 코돈 동요, 즉 코돈의 축퇴성으로 인하여, 상응하는 선조 주형에서 본래 암호화된 아미노산을 변경하지 않고 뉴클레오티드 치환을 핵산 빌딩 블록 내로 도입할 수 있다. 대안적으로, 본래의 아미노산에 대한 암호가 변경되도록 코돈을 변경할 수 있다. 본 발명은 그러한 치환을 핵산 빌딩 블록 내에 도입하여 분자간 상동성 분계점의 발생을 증가시키고, 따라서 빌딩 블록 중에서 증가된 수의 커플링을 실현할 수 있으며, 이는 더 많은 수의 자손 키메라 분자를 형성할 수 있게 한다.
합성 유전자 재조립
일 측면에서, 본 발명은 합성 유전자 재조립(예, GeneReassemblyTM, 예컨대 미국 특허 제6,537,776호 참조)라고 하는 비확률론적 방법을 제공하는 데, 이 방법은 핵산 빌딩 블록이 셔플링되거나 농축되거나 또는 무작위적으로 키메라화되지 않는다는 점에서 확률론적인 셔플링과는 다르며, 그 보다는 비확률론적으로 조립된다.
합성 유전자 재조립법은 셔플링하고자 하는 폴리뉴클레오티드 사이의 높은 레벨의 상동성의 존재에 따라 달라지지 않는다. 본 발명을 이용하여 10100이상의 상이한 키메라를 포함하는 자손 분자의 라이브러리(또는 세트)를 비확률론적으로 형성할 수 있다. 생각할 수 있는 바로는, 합성 유전자 재조립을 이용하여 101000이상의 상이한 자손 키메라를 포함하는 라이브러리를 형성할 수 있다.
따라서, 일 측면에서, 본 발명은 디자인에 의해 선택된 전체 조립 순서를 갖는 최종 키메라 핵산 분자 세트를 생성하는 비확률론적인 방법을 제공하는 데, 이 방법은 상호 상용성 연결성 말단을 갖는 다수의 특이적 핵산 빌딩 블록을 디자인에 의해 형성하는 단계, 및 이들 핵산 빌딩 블록을 조립하는 단계를 포함하여, 디자인된 전체 조립 순서를 실현한다.
일 측면에서, 합성 유전자 재조립은 1) 하나 이상의 조상 또는 어버이 세대 주형(들)으로부터, 돌연변이시켜 하나 이상의 점 돌연변이, 삽입, 결실 및/또는 키메라화를 실시한 (폴리뉴클레오티드 서열을 포함하는 분자, 예컨대 폴리펩티드 암호 서열을 포함하는 분자를 비롯한) 자손 세대의 분자(들)를 제조하는 단계, 2) 예컨대 고 처리량 방법을 이용하여 주목되는 하나 이상의 성질(예, 효소 활성의 개선)에 대해 자손 세대 분자(들)를 스크리닝하는 단계; 3) 경우에 따라서, 어버이 및/또는 자손 세대 분자에 관한 구조 및/또는 기능 정보를 얻고/또는 분류하는 단계; 4) 경우에 따라 1) 내지 3) 중 임의의 단계를 반복하는 단계의 방법을 포함한다. 일 측면에서, "코돈 부위 포화 돌연변이유발"시 (예컨대 어버이 폴리뉴클레오티드 주형으로부터) 자손 세대의 폴리뉴클레오티드가 형성되며, 각각은 3개 이하의 인접 점 돌연변이(즉 새로운 코돈을 포함하는 상이한 염기들)의 세트를 하나 이상 갖고 있어서, 모든 코돈(또는 동일한 아미노산을 암호화하는 축퇴성 코돈의 모든 패밀리)이 각 코돈 위치에 나타난다. 이러한 자손 세대 폴리뉴클레오티드에 상응하고 이에 의해 암호화된 자손 폴리펩티드 세트가 형성되며, 이들 각각은 하나 이상의 단일 아미노산 점 돌연변이를 갖는다. 일 측면에서, "아미노산 부위 포화 돌연변이유발"시 폴리펩티드를 따라 각각의 모든 아미노산 위치에서 19개의 자연적으로 암호화된 폴리펩티드 형성 알파 아미노산 치환 각각에 대해 그러한 돌연변이 폴리펩티드 1개가 형성된다. 이는, 어버이 폴리펩티드를 따라 각각의 모든 아미노산 위치에 대해, 본래의 아미노산을 비롯한 총 20개의 별개의 자손 폴리펩티드, 또는 20개의 자연적으로 암호화된 아미노산 대신에 또는 이와 함께 부가의 아미노산이 사용된 경우 가능하게는 21개 이상의 별개의 자손 폴리펩티드를 형성한다.
따라서, 일 측면에서, 20개의 자연적으로 암호화된 폴리펩티드 형성 알파 아미노산 외에 및/또는 이와 조합하여, 기타의 희소한 및/또는 자연적으로 암호화되지 않는 아미노산 및 아미노산 유도체를 포함하는 돌연변이를 형성하는 데 이 방법이 이용가능하다. 또 다른 측면에서, 적절한 숙주의 천연 또는 비변형된 코돈 인식 시스템 외에 및/또는 이와 조합하여, (하나 이상의 변형된 tRNA 분자를 갖는 숙주 세포 내에서와 같이) 변형된 코돈, 돌연변이된 코돈 및/또는 디자이너 코돈 인식 시스템을 사용하여 돌연변이를 형성하는 데 이 방법을 이용할 수 있다.
또 다른 측면에서, 본 발명은 재조합에 관한 것이며, 더욱 구체적으로, 부분 상동성 영역을 포함하는 폴리뉴클레오티드의 생체내 재분류 방법으로 폴리펩티드를 암호화하는 폴리뉴클레오티드를 준비하고, 폴리뉴클레오티드를 조립하여 하나 이상의 폴리뉴클레오티드를 형성하며, 유용한 성질을 갖는 폴리펩티드(들)를 생성하기 위한 폴리뉴클레오티드를 스크리닝하는 방법에 관한 것이다.
또 다른 일 측면에서, 본 발명은 임의의 분자 성질(예, 효소 활성) 또는 현행 방법에 의해 허용되는 성질들의 조합에 대하여 실현된 임의의 돌연변이 변화 효과(예, 특히 포화 돌연변이유발)를 분석 및 분류하는 데 본 발명을 이용할 수 있다. 따라서, 어버이 폴리펩티드 중 각 아미노산을 19개 이상의 가능한 치환 각각으로 변화시킨 효과를 측정하기 위해서 포괄적인 방법이 제공된다. 이 방법으로 어버이 폴리펩티드내의 각 아미노산을 폴리펩티드의 측정가능한 성질에 대한 가능한 효과 범위에 따라 특성화 및 분류할 수 있다.
일 측면에서, 인트론을 핵산 빌딩 블록에 의해 키메라 자손 분자로 도입할 수 있다. 종종 인트론은 작동하게 되기 위해서 양 말단에 공통 서열을 보유한다.인트론은 유전자 스플라이싱을 가능하게 하는 것 외에, 상동성 부위를 다른 핵산에 제공하여 상동성 재조합을 가능하게 하는 부가적인 목적에 사용될 수 있다. 이러한 목적 및 유효한 기타 목적을 위해서, 인트론을 도입하기 위한 거대한 핵산 빌딩 블록을 형성하는 것이 때로 바람직할 수 있다. 그 크기가 지나치게 커서 2개의 1본쇄 올리고뉴클레오티드의 직접적인 화학 합성에 의해 쉽게 형성할 수 있는 경우, 그러한 전문화된 핵산 빌딩 블록은, 2개 이상의 1본쇄 올리고뉴클레오티드의 직접적인 화학적 합성에 의해 또는 폴리머라제계 증폭 반응을 이용하여 형성할 수 있다.
조립하고자 하는 핵산 빌딩 블록의 상호 상용성 연결성 말단은, 소정 순서로 빌딩 블록을 커플링시킬 수 있는 경우 이러한 유형의 순서에 따른 조립에 대해 '사용가능한' 것으로 간주된다. 따라서, 일 측면에서 핵산 빌딩 블록이 커플링될 수 있는 전체 조립 순서를 연결성 말단의 디자인으로 특정하고, 하나 이상의 조립 단계를 사용하는 경우, 핵산 빌딩 블록이 커플링될 수 있는 전체 조립 순서는 조립 단계(들)의 순차적인 순서에 의해 특정된다. 일 측면에서, 어닐링된 빌딩 조각을 효소, 예컨대 리가제(예, T4 DNA 리가제)로 처리하여 빌딩 조각의 공유 결합을 실현한다.
관여하는 돌출부 중 모든 뉴클레오티드를 이용하지 않는 방식으로 커플링이 일어날 수 있다. 커플링이 리가제 효소 처리로 보강되어 "갭 연결" 또는 "갭형 연결"이라고 것을 형성하는 경우, 이 커플링은 특히 (예컨대 형질전환된 숙주에서) 강하게 잔존한다. 이러한 종류의 커플링은 원하지 않는 배경 생성물(들)의 형성에 기여할 수 있지만, 이를 이용하여 디자인된 연결 재조립에 의해 형성된 자손 라이브러리의 다양성을 유리하게 증가시킬 수 있다. 일부 돌출부는 회문식 커플링을 형성하기 위해 자가 커플링을 진행할 수 있다. 리가제 효소를 이용한 처리에 의해 커플링이 보강되는 경우, 이는 실질적으로 강화된 것이다. 돌출부에서의 5' 포스페이트 결핍을 이용하여 이러한 종류의 회문식 자가 연결을 유리하게 예방할 수 있다. 따라서, 본 발명에서는 5' 포스페이트기가 결핍된 핵산 빌딩 블록을 화학적으로 제조(또는 순서대로 제조)한다. 대안적으로, 예컨대 송아지 장 알칼리 포스파타제(CIAP)와 같은 포스파타제 효소를 이용한 처리에 의해 핵산 빌딩 블록을 제거하여, 연결 재조립 과정에서 회문식 자가 연결을 예방할 수 있다.
또 다른 측면에서, 최종 키메라 핵산 분자의 자손 세트를 생성하는 베이스로서 작용하는 선조 핵산 주형 세트의 서열을 분석하면 핵산 빌딩 블록의 디자인이 얻어진다. 따라서, 이들 선조 핵산 주형은 돌연변이시키고자 하는, 예컨대 키메라화 또는 셔플링시키고자 하는 핵산 빌딩 블록의 디자인을 보조하는 서열 정보원으로서 사용된다.
일례에서, 본 발명은 관련 유전자의 패밀리 및 관련된 생성물의 암호화된 패밀리의 키메라화를 위해 제공된다. 특정 예에서, 암호화된 생성물은 효소이다. 본 발명의 크실라나제를 본 명세서에 개시된 방법에 따라 돌연변이시킬 수 있다.
본 발명의 일 측면에 따라서, 다수의 선조 핵산 주형의 서열(예, 그룹 A 핵산 서열의 폴리뉴클레오티드)을 정렬하여 하나 이상의 분계점을 선택하며, 분계점은 상동성 영역에 배치될 수 있다. 분계점을 이용하여 생성하고자 하는 핵산 빌딩 블록의 경계를 정할 수 있다. 따라서, 선조 분자에서 확인 및 선택된 분계점은 자손 분자의 조립체 내의 유효 키메라 점으로서 기능한다.
통상적으로, 사용가능한 분계점은 2개 이상의 선조 주형에 의해 공유되는 (하나 이상의 상동성 뉴클레오티드 염기를 포함하는) 상동성 영역이지만, 분계점은 선조 주형의 적어도 1/2, 선조 주형의 적어도 2/3, 선조 주형의 적어도 3/4, 바람직하게는 거의 모든 선조 주형에 의해 공유되는 상동성 영역일 수 있다. 더욱 더 바람직하게는, 사용가능한 분계점은 모든 선조 주형에 의해 공유되는 상동성 영역이다.
일 측면에서, 유전자 재조립 과정을 철저히 실시하여 남김없이 라이브러리를 형성한다. 즉, 핵산 빌딩 블록의 모든 가능한 순서의 조합이 최종 키메라 핵산 분자 세트 내에 나타난다. 동시에, 각 조합의 조립 순서(즉, 각 최종 키메라 핵산의 5' → 3' 서열에서 각 빌딩 블록의 조립 순서)는 디자인에 의한다(즉, 비확률론적임). 본 발명의 비확률론적 특성으로 인하여, 원하지 않는 부산물의 가능성이 크게 감소된다.
또 다른 측면에서, 본 방법에 따라 유전자 재조립 방법을 체계적으로 실시하여, 예를 들어 체계적으로 구획화된 라이브러리를 형성하는 데, 구획은 예컨대 하나씩 체계적으로 스크리닝될 수 있다. 다시 말하면, 본 발명에 따르면, 순차적 단계의 조립 반응의 선별적이고 적절한 사용과 함께, 특이적 핵산 빌딩 블록의 선별적이고 적절한 사용을 통해 특정 자손 생성물 세트가 일부 반응 용기 각각에서 제조되는 실험 디자인을 실현할 수 있다. 이로 인하여 체계적 조사 및 스크리닝 절차가 실시 가능해진다. 따라서, 이들 방법은 잠재적으로 매우 많은 수의 자손 분자를더 적은 군에서 체계적으로 검사할 수 있게 한다.
매우 융통성이 있지만 철저하고 체계적인 방법으로 키메라화를 실시하는 능력으로 인하여, 특히 선조 분자들 사이의 상동성 레벨이 낮은 경우, 본 방법은 다수의 자손 분자를 포함하는 라이브러리(또는 세트)의 형성을 제공한다. 본 유전자 재조립 발명의 비확률론적인 특성으로 인하여, 생성된 자손 분자는 바람직하게는 디자인에 의해 선택된 전체 조립 순서를 갖는 최종 키메라 핵산 분자의 라이브러리를 포함하는 것이 바람직하다. 특정 측면에서, 형성된 그러한 라이브러리는 103이상 내지 101000이상의 상이한 자손 분자 종을 포함한다.
일 측면에서, 개시된 바와 같이 생성된 최종 키메라 핵산 분자의 세트는 폴리펩티드를 암호화하는 폴리뉴클레오티드를 포함한다. 일 측면에 따라서, 이 폴리펩티드는 유전자이며, 이 유전자는 인공 유전자일 수 있다. 또 다른 측면에 따르면, 이 폴리뉴클레오티드는 유전자 경로로서, 인공 유전자 경로일 수 있다. 본 발명에 따르면 본 발명에 의해 형성된 하나 이상의 인공 유전자를 인공 유전자 경로, 예컨대 진핵 유기체(예, 식물)에서 작동가능한 경로에 도입할 수 있다.
또 다른 적례에서, 빌딩 블록이 형성되는 단계의 합성 특성으로 인하여 이후에 시험관내 과정(예컨대 돌연변이유발) 또는 생체내 과정(예컨대, 숙주 유기체의 유전자 스플라이싱 능력 이용)으로 임의 제거될 수 있는 뉴클레오티드(예, 하나 이상의 뉴클레오티드, 이 뉴클레오티드는 예를 들면 코돈 또는 인트론 또는 조절 서열일 수 있음)의 디자인 및 도입이 가능해진다. 여러 예에서, 사용가능한 분계점을형성하는 잠재적인 잇점 외에도 여러 가지 다른 이유로 인하여 이들 뉴클레오티드의 도입이 바람직할 수 있을 것으로 기대된다.
따라서, 또 다른 측면에 따르면, 본 발명은 핵산 빌딩 블록을 사용하여 인트론을 도입할 수 있음을 규정한다. 따라서, 본 발명에 따르면 기능성 인트론을 본 발명의 인공 유전자에 도입할 수 있다. 또한, 본 발명에 따라 기능성 인트론을 본 발명의 인공 유전자 경로에 도입할 수 있다. 따라서, 본 발명은 인공적으로 도입된 하나(또는 그 이상)의 인트론(들)을 포함하는 인공 유전자인 키메라 폴리뉴클레오티드의 형성을 위해 제공된다.
따라서, 본 발명은 또한 인공적으로 도입된 하나(또는 그 이상)의 인트론(들)을 포함하는 인공 유전자 경로인 키메라 폴리뉴클레오티드의 형성을 위해 제공된다. 바람직하게는, 인공적으로 도입된 인트론(들)은, 자연 발생적 인트론이 유전자 스플라이싱에 있어서 기능적으로 작용하는 방식으로 유전자 스플라이싱을 위해 하나 이상의 숙주 세포에서 기능한다. 본 발명은 재조합 및/또는 스플라이싱을 위해 숙주 유기체 내로 도입하고자 하는 인공 인트론 함유 폴리뉴클레오티드의 제조 방법을 제공한다.
본 발명을 이용하여 생성된 인공 유전자는 또 다른 핵산과의 재조합을 위한 기질로서 작용할 수 있다. 유사하게, 본 발명을 이용하여 형성된 인공 유전자 경로는 또 다른 핵산과의 재조합을 위한 기질로서 작용할 수 있다. 일 측면에서, 인공의 인트론 함유 유전자와 재조합쌍으로서 기능하는 핵산 사이의 상동성 영역에 의해 재조합이 촉진되거나, 또는 그 영역에서 재조합이 일어난다. 일 측면에서, 재조합쌍은 또한 인공 유전자 또는 인공 유전자 경로를 비롯하여 본 발명에 의해 생성된 핵산일 수 있다. 인공 유전자 내에 인공적으로 도입된 하나(또는 그 이상)의 인트론(들)에 존재하는 상동성 영역에 의해 재조합이 촉진되거나, 또는 이 영역에서 재조합이 일어날 수 있다.
본 발명의 합성 유전자 재조립 방법에서는 다수의 핵산 빌딩 블록을 이용하며, 이들 각각은 2개의 연결성 말단을 갖는 것이 바람직하다. 각 핵산 빌딩 블록 상에서의 2개의 연결성 말단은 2개의 평활 말단(즉, 각각 0 뉴클레오티드의 돌출부를 가짐)이거나, 또는 바람직하게는 하나의 평활 말단 및 하나의 돌출 말단이거나, 또는 더욱 바람직하게는 2개의 돌출 말단일 수 있다.
이러한 목적으로 유용한 돌출부는 3' 돌출부 또는 5' 돌출부일 수 있다. 따라서, 핵산 빌딩 블록은 3' 돌출부 또는, 대안적으로 5' 돌출부 또는, 대안적으로 2개의 3' 돌출부 또는, 대안적으로 2개의 5' 돌출부를 가질 수 있다. 최종 키메라 핵산 분자를 형성하기 위해 핵산 빌딩 블록이 조립된 전체 순서는 의도한 실험 디자인에 의해 결정되는 것이며, 무작위한 것이 아니다.
일 측면에서, 2개의 1본쇄 핵산(1본쇄 올리고뉴클레오티드라고도 함)을 화학적으로 합성하고, 이들이 어닐링되도록 접촉시켜 2본쇄 핵산 빌딩 블록을 형성함으로써 핵산 빌딩 블록을 형성한다.
2본쇄 핵산 빌딩 블록은 가변 크기의 것일 수 있다. 빌딩 블록의 크기는 작거나 클 수 있다. 예시적인 빌딩 블록의 크기는 1 염기쌍(임의의 돌출부를 포함하지 않음) 내지 100,000 염기쌍(임의의 돌출부를 포함하지 않음) 범위이다. 다른 예시적인 크기 범위, 즉 1 bp 내지 10,000 bp(이 사이의 모든 정수값 포함)의 하한값과 2 bp 내지 100,000 bp(이 사이의 모든 정수값 포함)의 상한값을 갖는 범위도 제공된다.
본 발명에서 이용가능한 2본쇄 핵산 빌딩 블록이 형성될 수 있는 여러 가지 방법이 존재하며; 이들 방법은 당업계에 공지되어 있으며, 당업자가 용이하게 실시할 수 있다.
한 관점에 따라, 이본쇄 핵산 빌딩 블록은 먼저 일본쇄 핵산을 생성하고, 생성된 일본쇄 핵산을 어닐링하여 이본쇄 핵산 빌딩 블록을 형성함으로써 생성한다. 이본쇄 핵산 빌딩 블록의 두 스트랜드는 돌출부(overhang)를 형성하는 임의의 뉴클레오티드 이외의 모든 뉴클레오티드에서 상보적일 수 있으며; 따라서, 임의의 돌출부(들) 이외에 부정합을 함유하지 않는다. 다른 관점에서, 이본쇄 핵산 빌딩 블록의 두 스트랜드는 돌출부를 형성하는 임의의 뉴클레오티드 이외의 모든 뉴클레오티드 보다 더 적은 뉴클레오티드가 상보적이다. 따라서, 이 관점에서, 이본쇄 핵산 빌딩 블록을 이용하여 코돈 축퇴성을 도입할 수 있다. 코돈 축퇴성은 본원에 개시된 부위-포화 돌연변이유발법을 이용하여 도입하는 것이 바람직한데, 이때 하나 이상의 N,N,G/T 카세트 또는 대안으로 하나 이상의 N,N,N 카세트를 이용한다.
본 발명의 생체내 재조합법은 특이적인 폴리뉴클레오티드 또는 서열의 미지 하이브리드 또는 대립유전자 풀에 대해 맹검 방식으로 수행할 수 있다. 그러나, 특이적인 폴리뉴클레오티드의 실질적인 DNA 또는 RNA 서열을 알 필요는 없다.
유전자의 혼합 군집내 재조합을 이용하는 방법은 임의의 유용한 단백질, 예를 들어 인터류킨 I, 항체, tPA 및 성장 호르몬의 생성을 위해 유용할 수 있다. 이 방법은 변경된 특이성 또는 활성을 보유하는 단백질을 생성하는 데 사용할 수 있다. 또한, 이 방법은 하이브리드 핵산 서열, 예를 들어 프로모터 영역, 인트론, 엑손, 인핸서 서열, 유전자의 31 미번역된 영역 또는 51 미번역된 영역의 생성을 위해 유용할 수 있다. 따라서, 이 방법은 증가된 발현 속도를 보유하는 유전자를 생성하는 데 사용할 수 있다. 또한, 이 방법은 반복 DNA 서열의 연구에 유용할 수 있다. 최종적으로, 이 방법은 리보자임 또는 압타머(aptamer)를 돌연변이시키는 데 유용할 수 있다.
한 관점에서, 본 발명은 매우 복잡한 선형 서열, 예를 들어 DNA, RNA 또는 단백질의 유도된 분자 진화를 가능하게 하는 환원성 재분류, 재조합 및 선택의 반복 사이클의 이용에 관한 것이다.
최적화된 유도 진화 시스템
본 발명은 새로운 특성 또는 변경된 특성을 보유하는 폴리펩티드, 예를 들어 본 발명의 자일라나제 또는 항체를 생성하는 "최적화된 유도 진화 시스템"이라 칭하는 비확률적 유전자 변경 시스템을 제공한다. 최적화된 유도 진화는 재조합을 통한 핵산의 유도된 분자 진화를 가능하게 하는 환원성 재분류, 재조합 및 선택의 반복 사이클의 이용에 관한 것이다. 최적화된 유도 진화는 진화된 키메라 서열의 대형 군집의 생성을 가능하게 하는데, 이때 생성된 군집은 미리설정된 수의 교차 현상을 보유하는 서열이 상당히 풍부하다.
교차 현상은 서열 내의 이동이 하나의 모(母) 변이체로부터 다른 모 변이체로 일어나는 키메라 서열내의 점(point)이다. 이러한 점은 보통 두개의 모 변이체로부터 유래한 올리고뉴클레오티드가 함께 연결되어 단일 서열을 형성하는 접합부이다. 이 방법은 올리고뉴클레오티드 서열의 올바른 농도의 계산을 가능하게 하여 서열의 최종 키메라 군집에 선택된 수의 교차 현상이 풍부하도록 한다. 이는 미리설정된 수의 교차 현상을 보유하는 키메라 변이체를 선택하는 것에 대한 조절을 제공한다.
또한, 이 방법은 다른 시스템과 비교하여 상당량의 가능한 단백질 변이체 공간을 탐색하는 편리한 수단을 제공한다. 이전에는, 예를 들어 한 반응중에 1013개의 키메라 분자가 생성되는 경우, 특정 활성에 대해 그렇게 많은 수의 키메라 변이체를 테스트하는 것은 매우 어려웠다. 더구나, 후대 군집의 상당 부분은 특정 활성의 증가된 수준을 보유하는 것으로 덜 생각되는 단백질을 생성하는 매우 큰 수의 교차 현상을 보유한다. 이들 방법을 이용함으로써, 키메라 분자의 군집은 특정 수의 교차 현상을 보유하는 이들 변이체가 풍부할 수 있다. 따라서, 반응중 1013개의 키메라 분자가 생성될 수 있지만, 추가 분석을 위해 선택된 각각의 분자는 예를 들어 단지 3개의 교차 현상을 보유하는 것으로 생각된다. 생성된 후대 군집은 미리설정된 수의 교차 현상을 보유하는 것으로 왜곡될 수 있기 때문에, 키메라 분자들간의 기능적인 다양성에 대한 경계는 감소된다. 이는 원래의 모 폴리뉴클레오티드로부터 유래한 어떤 올리고뉴클레오티드가 특정 성질에 영향을 줄 수 있는가를 알아보는 경우 더 관리가능한 수의 변수를 제공한다.
키메라 후대 폴리뉴클레오티드 서열을 생성하는 한 방법은 각각의 모 서열의 단편 또는 부분에 상응하는 올리고뉴클레오티드를 생성하는 것이다. 각각의 올리고뉴클레오티드는 독특한 중첩 영역을 포함하여 올리고뉴클레오티드의 혼합이 올바른 순서로 어셈블링된 각각의 올리고뉴클레오티드 단편을 보유하는 새로운 변이체를 생성하도록 하는 것이 바람직하다. 또한, 이에 대한 추가 정보는 예를 들어 USSN 09/332,835; 미국 특허 6,361,974에서 확인할 수 있다.
각각의 모 변이체에 대해 생성된 올리고뉴클레오티드의 수는 궁극적으로 생성된 키메라 분자내의 생성된 교차의 총 수와 일정 관계를 갖는다. 예를 들어, 3개의 모 뉴클레오티드 서열 변이체는 연결 반응을 수행하기 위해 제공하여 예를 들어 고온에서 더 큰 활성을 보유하는 키메라 변이체를 확인하는 것이 가능하다. 한 예로서, 각각의 모 변이체의 각 부분에 상응하는 50개의 올리고뉴클레오티드 서열로 이루어진 세트를 생성할 수 있다. 따라서, 연결 재어셈블리 과정중, 각각의 키메라 서열내 50개 이하의 교차 현상이 존재할 수 있다. 생성된 각각의 키메라 폴리뉴클레오티드가 교대로 각각의 모 변이체로부터 유래한 올리고뉴클레오티드를 함유할 가능성은 매우 낮다. 각각의 올리고뉴클레오티드 단편이 동일한 몰량으로 연결 반응에 존재하는 경우, 몇몇 위치에서 동일한 모 폴리뉴클레오티드로부터 유래한 올리고뉴클레오티드는 서로 인접하여 연결될 것이고, 따라서 교차 현상은 일어나지 않는다. 각각의 모 폴리뉴클레오티드로부터 유래한 각각의 올리고뉴클레오티드의 농도가 본 실시예의 임의의 연결 반응중 일정하게 유지되는 경우, 동일한 모 변이체로부터 유래한 올리고뉴클레오티드가 키메라 서열 내에서 연결되어 교차되지 않을 1/3의 가능성(3개의 모 폴리뉴클레오티드를 추정함)이 존재한다.
따라서, 확률밀도함수(PDF)를 결정하여 주어진 세트 수의 모 변이체, 각각의 변이체에 상응하는 다수의 올리고뉴클레오티드 및 연결 반응에서 각각의 단계중 각 변이체의 농도에서 연결 반응중 각각의 단계에서 일어나는 것으로 생각되는 교차 현상의 집단을 예상할 수 있다. 이하, PDF 결정 이면의 통계학 및 수학을 기술한다. 이들 방법을 이용함으로써, 이러한 확률 밀도 함수를 계산할 수 있고, 따라서 특정 연결 반응에 기인하는 미리설정된 수의 교차 현상에 대해 키메라 후대 군집을 풍부하게 할 수 있다. 더구나, 교차 현상의 표적 수는 미리 설정할 수 있으며, 이어서 상기 시스템은 미리설정된 수의 교차 현상에 대해 중앙에 위치하는 확률 밀도 함수를 생성하는, 연결 반응에서 각각의 단계중 각각의 모 올리고뉴클레오티드의 출발 양을 계산한다. 이들 방법은 재조합을 통해 폴리펩티드를 암호화하는 핵산의 유도된 분자 진화를 가능하게 하는 환원성 재분류, 재조합 및 선택의 반복 사이클의 이용에 관한 것이다. 이 시스템은 진화된 키메라 서열의 대형 군집의 생성을 가능하게 하는데, 이때 생성된 군집은 미리설정된 수의 교차 현상을 보유하는 서열이 현저히 풍부하다. 교차 현상은 서열 내의 이동이 하나의 모(母) 변이체로부터 다른 모 변이체로 일어나는 키메라 서열내의 점이다. 이러한 점은 보통 두개의 모 변이체로부터 유래한 올리고뉴클레오티드가 함께 연결되어 단일 서열을 형성하는 접합부이다. 이 방법은 올리고뉴클레오티드 서열의 올바른 농도의 계산을 가능하게 하여 서열의 최종 키메라 군집이 선택된 수의 교차 현상이 풍부하도록 한다. 이는 미리설정된 수의 교차 현상을 보유하는 키메라 변이체를 선택하는 것에 대한 조절을제공한다.
또한, 이들 방법은 다른 시스템과 비교하여 상당량의 가능한 단백질 변이체 공간을 탐색하는 편리한 수단을 제공한다. 이들 방법을 이용함으로써, 키메라 분자의 군집은 특정 수의 교차 현상을 보유하는 이들 변이체가 풍부할 수 있다. 따라서, 반응중 1013개의 키메라 분자가 생성될 수 있지만, 추가 분석을 위해 선택된 각각의 분자는 예를 들어 단지 3개의 교차 현상을 보유하는 것으로 생각된다. 생성된 후대 군집은 미리설정된 수의 교차 현상을 보유하는 것으로 왜곡될 수 있기 때문에, 키메라 분자들간의 기능적인 다양성에 대한 경계는 감소된다. 이는 원래의 모 폴리뉴클레오티드로부터 유래한 어떤 올리고뉴클레오티드가 특정 성질에 영향을 줄 수 있는가를 알아보는 경우 더 관리가능한 수의 변수를 제공한다.
한 관점에서, 상기 방법은 각각의 모 서열의 단편 또는 부분에 상응하는 올리고뉴클레오티드를 생성함으로써 키메라 후대 폴리뉴클레오티드 서열을 생성한다. 각각의 올리고뉴클레오티드는 독특한 중첩 영역을 포함하여 올리고뉴클레오티드의 혼합이 올바른 순서로 어셈블링된 각각의 올리고뉴클레오티드 단편을 보유하는 새로운 변이체를 생성하도록 하는 것이 바람직하다. USSN 09/332,835를 참조할 수 있다.
교차 현상의 결정
본 발명의 관점들은 입력값으로서 소정 교차 확률 밀도 함수(PDF), 재어셈블링되는 모 유전자의 수 및 재어셈블리에서 단편의 수를 수용하는 시스템 및 소프트웨어를 포함한다. 이 프로그램의 출력값은 재어셈블링된 유전자 및 이들 유전자의 추산된 교차 PDF를 생성하기 위한 방법을 결정하는데 사용할 수 있는 "단편 PDF"이다. 본원에 기술한 프로세싱은 MATLAB(상표명)(The Mathworks, Natick, Massachusetts) 프로그래밍 언어 및 기술적 계산을 위해 개발된 환경에서 수행하는 것이 바람직하다.
반복 과정
본 발명을 실시하기 위해, 이들 과정은 되풀이하여 반복할 수 있다. 예를 들어, 변경된 또는 새로운 자일라나제 표현형의 원인인 핵산(또는 상기 핵산)은 동정하고, 재분리하고, 다시 변경하고, 활성에 대해 재테스트한다. 이 과정은 소정 표현형이 조작될 때까지 되풀이하여 반복할 수 있다. 예를 들어, 전체적인 생화학적 동화 경로 또는 이화 경로를 세포 내로 도입하도록 조작하여 예를 들어 자일라나제 활성을 부여할 수 있다.
유사하게, 특정 올리고뉴클레오티드가 소정 특성(예를 들어, 새로운 자일라나제 표현형)에 대해 전혀 영향을 미치지 못하는 것으로 결정된 경우, 제거한 서열을 포함하는 더 큰 모 올리고뉴클레오티드를 합성하므로써 변수로서 제거할 수 있다. 더 큰 서열 내로 서열을 혼입하는 것은 임의의 교차 현상을 예방하기 때문에, 후대 폴리뉴클레오티드내 이 서열의 변이는 더 이상 존재하지 않을 것이다. 어떤 올리고뉴클레오티드가 소정 특성에 가장 관련되어 있고, 어떤 올리고뉴클레오티드가 관련되어 있지 않은가를 결정하기 위한 상기 반복 실시는 특정 특성 또는 활성을 제공할 수 있는 가능한 단백질 변이체 모두의 더 효과적인 탐색을 가능하게 한다.
생체내 셔플링
분자의 생체내 셔플링은 본 발명의 폴리펩티드의 변이체, 예를 들어 항체, 자일라나제 등을 제공하는 본 발명의 방법에서의 용도이다. 생체내 셔플링은 재조합 다량체에 대한 세포의 자연적인 특성을 이용하여 수행할 수 있다. 생체내 재조합이 분자 다양성에 대한 중요한 자연적인 경로를 제공하지만, 유전자 재조합은 (1) 상동성의 인식; (2) 스트랜드 절단, 스트랜드 침입 및 재조합 키아즈마의 생성을 유도하는 대사 단계; 및 (3) 최종적으로, 키아즈마의 불연속 재조합 분자로의 분해를 포함하는 상대적으로 복잡한 과정이다. 키아즈마의 형성은 상동 서열의 인식을 필요로한다.
다른 관점에서, 본 발명은 적어도 제1 뉴클레오티드 및 제2 뉴클레오티드로부터 하이브리드 폴리뉴클레오티드를 생성하는 방법에 관한 것이다. 본 발명은 적합한 숙주 세포 내로 적어도 제1 폴리뉴클레오티드 및 부분적인 서열 상동성(예를 들어, 서열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157, 159, 161, 163, 165, 167, 169, 171, 173, 175, 177, 179, 181, 183, 185, 187, 189, 191, 193, 195, 197, 199, 201, 203, 205, 207, 209, 211, 213, 215, 217, 219, 221, 223, 225,227, 229, 231, 233, 235, 237, 239, 241, 243, 245, 247, 249, 251, 253, 255, 257 및 이의 조합)의 적어도 한 영역을 공유하는 제2 폴리뉴클레오티드를 도입함으로써 하이브리드 폴리뉴클레오티드를 생성하는 데 사용할 수 있다. 부분 서열 상동성 영역은 하이브리드 폴리뉴클레오티드를 생성하는 서열 인식을 초래하는 과정을 촉진시킨다. 본원에 사용한 용어 "하이브리드 폴리뉴클레오티드"는 본 발명의 방법에 기인한 임의의 뉴클레오티드 서열이며, 적어도 두개의 원래 폴리뉴클레오티드 서열을 함유한다. 이러한 하이브리드 폴리뉴클레오티드는 DNA 분자 사이의 서열 통합을 촉진하는 분자간 재조합 현상에 기인할 수 있다. 또한, 이러한 하이브리드 폴리뉴클레오티드는 DNA 분자내 뉴클레오티드 서열을 변경시키는 반복 서열을 이용하는 분자내 환원성 재분류 과정에 기인할 수 있다.
생체내 재분류는 총괄적으로 박테리아에서 "RecA-의존성" 현상으로서 고찰되는 "재조합"이라 칭하는 "분자간" 과정에 집중된다. 본 발명은 서열을 재조합 또는 재분류하는 숙주 세포의 재조합 과정 또는 결실에 의해 세포 내에서 준-반복 서열의 복잡성을 감소시키기 위한 환원성 과정을 매개할 수 있는 세포의 능력에 의존할 수 있다. 상기한 "환원성 재분류" 과정은 "분자내" RecA-의존성 과정에 의해 일어난다.
따라서, 본 발명의 다른 관점에서, 신규 폴리뉴클레오티드는 환원성 재분류 과정에 의해 생성될 수 있다. 상기 방법은 연속 서열(원래의 암호화 서열)을 함유하는 작제물의 생성, 적합한 벡터 내로 상기 작제물의 도입 및 적합한 숙주 세포 내로의 후속 도입을 포함한다. 개별적인 분자 실체의 재분류는 상동성 영역을 보유하는 작제물내 연속 서열 사이 또는 준-반복 단위 사이의 조합 과정에 의해 일어난다. 재분류 과정은 반복 서열의 복잡성과 정도를 재조합 및/또는 감소시키며 신규 분자 종의 생성을 초래한다. 여러가지 처리를 적용하여 재분류 비율을 높일 수 있다. 이들은 자외선, 또는 DNA 손상 화학물질 및/또는 "유전자 불안정성"의 증가된 수준을 나타내는 숙주 세포주를 이용하는 처리를 포함할 수 있다. 따라서, 재분류 과정은 자신의 진화를 유도하기 위한 준-반복 서열의 자연적인 특성 또는 상동성 재조합을 포함할 수 있다.
반복 서열 또는 "준-반복" 서열은 유전자 불안정성에서 일정 역할을 수행한다. 본 발명에서, "준-반복"은 그들의 원래 단위 구조에 제한되지 않는 반복부이다. 준-반복 단위는 작제물내 서열의 어레이, 즉 유사 서열의 연속 단위로서 존재할 수 있다. 일단 연결되면, 연속 서열 사이의 접합부는 본질적으로 보이지 않게 되고, 생성된 작제물의 준-반복 특성은 현재 분자 수준에서 연속성이다. 생성된 작제물의 복잡성을 감소시키기 위해 세포가 수행하는 결실 과정은 준-반복 서열 사이에서 진행된다. 준-반복 유닛은 미끄러짐 현상(slippage event)이 일어날 수 있는 주형의 실질적으로 무제한 레파토리를 제공한다. 따라서, 준-반복부를 함유하는 작제물은 결실(및 가능하게는 삽입) 현상이 실질적으로 준-반복 단위내 어디에서나 발생할 수 있는 충분한 분자 탄성을 효과적으로 제공한다.
준-반복 서열이 모두 동일한 배향, 예를 들어 머리-꼬리 또는 그 역으로 연결되는 경우, 세포는 개개의 단위를 구별할 수 없다. 결과적으로, 환원성 과정은 서열 전체에서 일어날 수 있다. 대조적으로, 예를 들어 상기 단위가 머리-꼬리 보다는 머리-머리로 존재하는 경우, 역전은 결실부 형성이 불연속 유닛의 상실을 옹호하도록 인접 단위의 종말점을 나타낸다. 따라서, 본 발명의 경우, 서열이 동일한 배향으로 존재하는 것이 바람직하다. 준반복 서열의 무작위 배향은 재분류 효율의 상실을 초래하는 반면, 서열의 일관된 배향은 높은 효율을 제공할 것이다. 그러나, 동일한 배향에서 더 적은 연속 서열을 보유하는 경우 상기 효율을 감소시키지만, 이는 신규 분자의 효과적인 회수를 위한 충분한 탄성을 여전히 제공할 수 있다. 작제물은 더 높은 효율을 가능하게 하는 동일한 배향으로 준-반복 서열을 이용하여 제조할 수 있다.
서열은 하기 방법을 포함하는 여러가지 방법중 임의의 방법을 이용하여 머리-꼬리 배향으로 어셈블링할 수 있다:
(a) 일본쇄로 제조되는 경우 배향을 제공하는 폴리-A 머리 및 폴리-T 꼬리를 포함하는 프라이머를 사용할 수 있다. 이는 RNA로 제조된 프라이머의 최초 몇몇 염기를 보유함으로써 달성되며, 따라서 RNAseH로 용이하게 제거된다.
(b) 독특한 제한 절단 부위를 포함하는 프라이머를 사용할 수 있다. 다중 부위, 독특한 서열 배터리 및 반복 합성 단계와 연결 단계가 필요하다.
(c) 상기 프라이머의 몇몇 내부 염기는 티올화될 수 있으며, 엑소뉴클레아제는 적절하게 꼬리잘린 분자를 생성하기 위해 사용한다.
재분류된 서열의 회수는 감소된 반복 지수(RI)를 갖는 클로닝 벡터의 동정에 의존한다. 이어서, 상기 재분류된 암호화 서열은 증폭에 의해 회수할 수 있다. 생성물은 재클로닝하고 발현시킨다. 감소된 RI를 보유하는 클로닝 벡터의 회수는 하기 사항에 의해 영향받을 수 있다:
(1) 벡터의 이용은 단지 작제물의 복잡성이 감소되는 경우에 안정하게 유지된다.
(2) 물리적인 과정에 의해 짧아진 벡터의 물리적인 회수. 이 경우, 클로닝 벡터는 표준 플라스미드 분리 절차 및 아가로즈 겔, 또는 표준 절차를 이용하는 저분자량 컷오프 컬럼 상에서의 크기 분별에 의해 회수한다.
(3) 삽입물 크기가 감소하는 경우 선택할 수 있는 삽입된 유전자를 함유하는 벡터의 회수.
(4) 발현 벡터 및 적합한 선택을 이용하는 직접 선택 기법의 이용.
관련된 유기체로부터 유래한 암호화 서열(예를 들어, 유전자)은 높은 정도의 상동성을 나타낼 수 있으며, 상당히 다양한 단백질 생성물을 암호화할 수 있다. 이들 서열 타입은 준-반복부로서 본 발명에서 특히 유용하다. 그러나, 후술하는 실시예들은 거의 동일한 원래의 암호화 서열(준-반복부)의 재분류를 나타내지만, 이 방법은 그러한 거의 동일한 반복부에 제한되는 것은 아니다.
하기 실시예는 본 발명을 예시한다. 세개(3)의 독특한 종으로부터 유래한 암호화 핵산 서열(준-반복부)을 기술한다. 각각의 서열은 구별되는 세트의 특성을 가진 단백질을 암호화한다. 각각의 서열은 서열내의 독특한 위치에서 단일 염기쌍 또는 몇몇 염기쌍에 차이가 있다. 준-반복 서열은 개별적으로 또는 총괄적으로 증폭되고, 무작위 어셈블리 내로 연결되어 모든 가능한 순열 및 조합이 연결된 분자 집단에서 가능하도록 한다. 준-반복 단위의 수는 어셈블리 조건에 의해 제어할 수 있다. 작제물내 준-반복 단위의 평균 수는 반복 지수(RI)로서 정의한다.
일단 형성되면, 작제물은 공지된 프로토콜에 따라 아가로즈 겔 상에서 크기 분별, 클로닝 벡터내로의 삽입 및 적합한 숙주 세포로의 형질감염을 수행할 수도 있고, 수행하지 않을 수도 있다. 이어서, 세포는 번식시키고, "환원성 재분류"를 수행한다. 환원성 재분류 과정의 속도는 필요에 따라 DNA 손상의 도입에 의해 촉진시킬 수 있다. RI의 감소가 반복 서열 사이에서 "분자내" 메카니즘에 의한 결실부 형성에 의해 매개되는지 또는 "분자간" 메카니즘을 통한 재조합 유사 현상에 의해 매개되는지 여부는 중요하지 않다. 최종 결과는 모든 가능한 조합으로의 분자의 재분류이다.
필요에 따라, 상기 방법은 셔플링된 풀의 라이브러리 구성원을 스크리닝하여 미리설정된 거대분자, 예를 들어 단백질성 수용체, 올리고사카라이드, 비리온 또는 다른 미리설정된 화합물 또는 구조와의 결합 또는 상호작용 또는 특정 반응(예를 들어, 환자의 촉매 도메인)을 가능하게 할 수 있는 능력을 보유하는 개개의 셔플링된 라이브러리 구성원을 동정하는 추가 단계를 포함한다.
이러한 라이브러리로부터 동정된 폴리펩티드는 치료 목적, 진단 목적, 연구 목적 및 관련 목적(예를 들어, 촉매, 수용액의 삽투압을 증가시키기 위한 용질 등)을 위해 사용할 수 있고/있거나, 셔플링 및/또는 선택의 하나 이상의 추가 사이클에 이용할 수 있다.
다른 관점에서, 재조합 또는 재분류 이전 또는 과정 중에, 본 발명의 방법에 의해 생성된 폴리뉴클레오티드는 원래의 폴리뉴클레오티드내로의 돌연변이의 도입을 촉진하는 제제 또는 과정에 이용할 수 있다. 이러한 돌연변이의 도입은 생성된 하이브리드 폴리뉴클레오티드 및 그로부터 암호화된 폴리펩티드의 다양성을 증가시킨다. 돌연변이유발을 촉진하는 제제 또는 과정의 예로는 (+)-CC-1065, 또는 합성 유사체, 예를 들어 (+)-CC-1065-(N3-아데닌(참조: Sun and Hurley, (1992)); DNA 합성을 억제할 수 있는 N-아세틸화 또는 탈아세틸화 4'-플루오로-4-아미노비페닐 부가반응생성물(참조: 예를 들어, van de Poll et al. (1992)); 또는 DNA 합성을 억제할 수 있는 N-아세틸화 또는 탈아세틸화 4-아미노비페닐 부가반응생성물(참조: van de Poll et al. (1992), pp. 751-758); DNA 복제를 억제할 수 있는 3가 크롬, 3가 크롬염, 다환 방향족 탄화수소(PAH) DNA 부가반응생성물, 예를 들어 7-브로모메틸벤즈[a]안트라센("BMA"), 트리스(2,3-디브로모프로필)포스페이트("Tris-BP"), 1,2-디브로모-3-클로로프로판("DBCP"), 2-브로모아크롤레인(2BA), 벤조[a]피렌-7,8-디히드로디올-9-10-에폭사이드("BPDE"), 백금(II) 할로겐 염, N-히드록시-2-아미노-3-메틸아미다조[4,5-t-퀴놀린("N-히드록시-IQ") 및 N-히드록시-2-아미노-1-메틸-6-페닐이미다조[4,5-fl-피리딘("N-히드록시-PhIP")를 들 수 있으나, 이로 제한되는 것은 아니다. PCR 증폭을 둔화시키거나 정지시키는 수단의 예로는 자외선 (+)-CC-1065 및 (+)-CC-1065-(N3-아데닌)을 들 수 있다. 특히 포함되는 수단은 DNA 부가반응생성물 또는 폴리뉴클레오티드 또는 폴리뉴클레오티드 풀로부터 DNA 부가반응생성물을 포함하는 폴리뉴클레오티드인데, 이는 추가 처리 이전에 폴리뉴클레오티드를 포함하는 용액을 가열하는 단계를 포함하는 방법에 의해 방출 또는 제거될 수 있다
다른 관점에서, 본 발명은 하이브리드 또는 재분류된 폴리뉴클레오티드의 생성을 제공하는 본 발명의 조건 하에서 야생형 단백질을 암호화하는 이본쇄 주형 폴리뉴클레오티드를 포함하는 샘플을 처리함으로써 생물학적 활성을 보유하는 재조합 단백질을 제조하는 방법에 관한 것이다.
서열 변이체의 제조
또한, 본 발명은 본 발명의 핵산(예를 들어, 자일라나제) 서열의 서열 변이체를 제조하는 추가 방법을 제공한다. 또한, 본 발명은 본 발명의 핵산 및 폴리펩티드를 이용하여 자일라나제를 분리하기 위한 추가의 방법을 제공한다. 한 관점에서, 본 발명은 본 발명의 자일라나제 암호 서열(예를 들어, 유전자, cDNA 또는 메세지)의 변이체를 제공하는데, 이는 상기한 바와 같은 무작위적 또는 확률적 방법, 또는 비확률적 또는 "직접 진화" 방법을 포함하는 임의의 수단에 의해 변경될 수 있다.
분리된 변이체는 자연발생할 수 있다. 또한, 변이체는 시험관 내에서 생성할 수도 있다. 변이체는 유전 공학 기법, 예를 들어 부위 지정 돌연변이유발법, 무작위 화학적 돌연변이유발법, 엑소뉴클레아제 III 결실 과정, 및 표준 클로닝 기법을 이용하여 생성할 수 있다. 대안으로, 이러한 변이체, 단편, 유사체 또는 유도체는 화학 합성 또는 변경 절차를 이용하여 생성할 수 있다. 또한, 변이체를 제조하는 다른 방법은 당업자에게 매우 친숙한 방법들이다. 이들은 천연 분리체로부터 얻은 핵산 서열을 변경하여 산업적으로 또는 실험실에서 사용하기에 적합한 가치를 증대시킨 특성을 보유하는 폴리펩티드를 암호화하는 핵산을 생성하는 방법을 포함한다.이러한 과정에서, 천연 분리체로부터 얻은 서열에 대해 하나 이상의 뉴클레오티드 차이를 보유하는 다수의 변이체 서열이 생성되고 그 특징을 규명한다. 이들 뉴클레오티드 차이는 천연 분리체에서 유래한 핵산에 의해 암호화된 폴리펩티드에 대해 아미노산 변화를 초래할 수 있다.
예를 들어, 변이체는 에러 프론 PCR을 이용하여 생성할 수 있다. 에러 프론 PCR에서, PCR은 DNA 폴리머라제의 복제 신뢰도가 낮은 조건하에서 수행하여 높은 비율의 점 돌연변이가 PCR 생성물의 전체 길이를 따라 얻어지도록 한다. 에러 프론 PCR은 예를 들어 문헌(참조: Leung, D. W., et al., Technique, 1: 11-15, 1989 및 Caldwell, R. C. & Joyce G. F. , PCR Methods Applic. , 2: 28-33, 1992)에 기재되어 있다. 개략적으로 이러한 절차에서, 돌연변이유발시키려는 핵산은 전체 길이의 PCR 생성물을 따라 높은 비율의 점 돌연변이를 획득하기 위해 PCR 프라이머, 반응 버퍼, MgCl2, MnCl2, Taq 폴리머라제 및 적합한 농도의 dNTPs와 혼합한다. 예를 들어, 상기 반응은 돌연변이유발시키려는 핵산 20 fmole, 각각의 PCR 프라이머 30 pmol, 반응 버퍼(50 mM KC1, lO mM Tris HCl(pH 8.3) 및 0.01% 겔라틴을 함유함), 7 mM MgCl2, 0.5 mM MnCl2, Taq 폴리머라제 5 유닛, 0.2 mM dGTP, 0.2 mM dATP, 1 mM dCTP 및 1 mM dTTP를 이용하여 수행한다. PCR은 94℃에서 1분, 45℃에서 1분 및 72℃에서 1분의 30 사이클로 수행한다. 그러나, 이들 매개변수는 적절히 변경시킬 수 있는 것으로 이해될 것이다. 돌연변이유발된 핵산은 적합한 벡터 내로 클로닝하고, 돌연변이유발된 핵산에 의해 암호화된 폴리펩티드의 활성을 평가한다.
또한, 변이체는 임의의 클로닝된 소정의 DNA에서 부위-특이성 돌연변이를 생성하는 올리고뉴클레오티드 지정된 돌연변이유발법을 이용하여 생성할 수 있다. 올리고뉴클레오티드 돌연변이유발법은 문헌(참조: 예를 들어, Reidhaar-Olson (1988) Science 241: 53-57)에 기재되어 있다. 개략적으로, 이러한 절차에서, 클로닝된 DNA내로 도입하려는 하나 이상의 돌연변이를 보유하는 다수의 이본쇄 올리고뉴클레오티드를 합성하고, 돌연변이유발시키려는 클로닝된 DNA 내로 삽입한다. 돌연변이유발된 DNA를 함유하는 클론은 회수하고, 이들이 암호화한 폴리펩티드의 활성을 평가한다.
변이체를 생성하는 다른 방법은 어셈블리 PCR이다. 어셈블리 PCR은 작은 DNA 단편의 혼합물로부터 PCR 생성물의 어셈블리를 포함한다. 다수의 상이한 PCR 반응이 동일한 바이알 내에서 병렬적으로 일어나는데, 한 반응의 생성물은 다른 반응의 생성물을 프라이밍한다. 어셈블리 PCR은 예를 들어 미국 특허 5,965,408에 기술되어 있다.
변이체를 생성하는 또 다른 방법은 성별 PCR 돌연변이유발법이다. 성별 PCR 돌연변이유발법에서, 시험관 내에서 상이하나 매우 관련된 DNA 서열의 DNA 분자들 사이에 집중 상동 재조합이 일어나며, 그 결과 서열 상동성에 기초한 DNA 분자의 무작위 단편화가 일어나며, 이어서 PCR 반응에서 프라이머 연장에 의해 교차의 고정이 일어난다. 성별 PCR 돌연변이유발법은 예를 들어 문헌(참조: Stemmer (1994) Proc. Natl. Acad. Sci. USA 91: 10747-10751)에 기재되어 있다. 개략적으로, 이러한 절차에서, 재조합하려는 다수의 핵산은 DNase로 분해하여 평균 크기가 50∼200개의 뉴클레오티드를 보유하는 단편을 생성한다. 소정 평균 크기의 단편은 정제하고 PCR 생성물 중에 재현탁시킨다. PCR은 핵산 단편들의 재조합을 용이하게 하는 조건 하에서 수행한다. 예를 들어, PCR은 0.2 mM 각 dNTP, 2.2 mM MgCl2, 50 mM KCl, lO mM Tris HCl, pH 9.0 및 0.1% 트리톤 X-100의 용액중 10∼30 ng/㎕ 농도로 정제된 단편을 재현탁시킴으로써 수행할 수 있다. 반응 혼합물 100 ㎕당 Taq 폴리머라제 2.5 유닛을 첨가하고, PCR은 다음과 같은 방법으로 수행한다: 94℃에서 60초, 94℃에서 30초, 50∼55℃에서 30초, 72℃에서 30초(30∼45회) 및 72℃에서 5분. 그러나, 이들 매개변수는 적절히 변경할 수 있는 것으로 이해될 것이다. 몇몇 관점에서, 올리고뉴클레오티드는 PCR 반응물에 포함될 수 있다. 다른 관점에서, DNA 폴리머라제 I의 클리나우 단편은 첫번째 세트의 PCR 반응에서 사용할 수 있고, Taq 폴리머라제는 후속 세트의 PCR 반응에서 사용할 수 있다. 재조합 서열은 분리하고, 이들이 암호화하는 폴리펩티드의 활성을 평가한다.
또한, 변이체는 생체내 돌연변이유발법에 의해 생성할 수 있다. 몇몇 관점에서, 소정 서열 내의 무작위 돌연변이는 박테리아 균주, 예를 들어 하나 이상의 DNA 수복 경로내에 돌연변이를 보유하는 이. 콜라이 균주 내에서 소정 서열을 전파시킴으로써 생성된다. 이러한 "돌연변이자(mutator)" 균주는 야생형 모 균주의 랜덤 돌연변이 비율 보다 더 큰 무작위 돌연변이 비율을 보유한다. 이들 균주중 하나 내에서 DNA의 전파는 상기 DNA 내에 무작위 돌연변이를 실질적으로 생성할 것이다. 생체내 돌연변이유발법에 사용하기에 적합한 돌연변이자 균주는 "Methods forPhenotype Creation from Multiple Gene Populations" 라는 명칭의 1991년 10월 31일 공개된 WO 91/16427호에 기재되어 있다.
또한, 변이체는 카세트 돌연변이유발법으로 생성할 수 있다. 카세트 돌연변이유발법에서, 이본쇄 DNA 분자의 작은 영역은 천연 서열과는 상이한 합성 올리고뉴클레오티드 "카세트"로 대체된다. 종종, 올리고뉴클레오티드는 완전히 및/또는 부분적으로 무작위화된 천연 서열을 함유한다.
또한, 반복 앙상블 돌연변이유발법을 사용하여 변이체를 생성할 수도 있다. 반복 앙상블 돌연변이유발법은 구성원들의 아미노산 서열이 상이한 표현형적으로 관련된 돌연변이체들의 다양한 군집을 생성하기 위해 개발된 단백질 조작(단백질 돌연변이유발)을 위한 알고리즘이다. 이 방법은 연속 라운드의 조합 카세트 돌연변이유발을 제어하기 위해 피드백 메카니즘을 이용한다. 반복 앙상블 돌연변이유발법은 문헌(참조: Arkin, A. P. and Youvan, D. C. , PNAS, USA, 89: 7811-7815, 1992)에 기재되어 있다.
몇몇 관점에서, 변이체는 지수 앙상블 돌연변이유발법을 이용하여 생성한다. 지수 앙상블 돌연변이유발법은 고비율의 독특하고 기능적인 돌연변이체를 갖는 조합 라이브러리를 생성하는 과정인데, 이때 잔기의 작은 기는 병렬적으로 무작위화되어 각각의 변경된 위치에서 기능적인 단백질을 유도하는 아미노산을 확인한다. 지수 앙상블 돌연변이유발법은 문헌(참조: Delegrave, S. and Youvan, D. C. , Biotechnology Research, 11 : 1548-1552,1993)에 기재되어 있다. 무작위 돌연변이유발법 및 부위-지정 돌연변이유발법은 문헌(참조: Arnold, F. H. , CurrentOpinion in Biotechnology, 4: 450-455, 1993)에 기재되어 있다.
몇몇 관점에서, 변이체는 셔플링 절차를 이용하여 생성하는데, 이때 뚜렷한 폴리펩티드를 암호화하는 다수의 핵산의 일부가 함께 융합되어 문헌(참조: "Method of DNA Reassembly by Interrupting Synthesis"라는 명칭의 1996년 7월 9일 출원된 미국 특허 5,965,408 및 "Production of Enzymes Having Desired Activities by Mutagenesis"라는 명칭의 1996년 5월 22일 출원된 미국 특허 5,939,250)에 기재된 키메라 폴리펩티드를 암호화하는 키메라 핵산 서열을 생성한다.
B 그룹 아미노산 서열로 이루어진 폴리펩티드의 변이체는 B 그룹 아미노산 서열로 이루어진 폴리펩티드의 아미노산 잔기중 하나 이상이 보존 및 비보존 아미노산 잔기(바람직하게는 보존된 아미노산 잔기)로 치환되고, 치환된 아미노산 잔기가 유전 코드에 의해 암호화되는 것이거나 암호화되지 않는 변이체일 수 있다.
보존성 치환은 폴리펩티드내 소정 아미노산을 유사 특성의 다른 아미노산으로 치환하는 것을 의미한다. 전형적으로, 보존성 치환의 예로는 하기 치환을 들 수 있다: 지방족 아미노산, 예를 들어 알라닌, 발린, 루신 및 이소루신의 다른 지방족 아미노산으로의 치환; 세린의 트레오닌으로의 치환 또는 이의 역; 산성 잔기, 예를 들어 아스파르트산 및 글루탐산의 다른 산성 잔기로의 치환; 아미드 잔기를 보유하는 잔기, 예를 들어 아스파라긴 및 글루타민의 아미드기를 보유하는 다른 잔기로의 치환; 염기성 잔기, 예를 들어 라이신과 아르기닌의 다른 염기성 잔기로의 치환; 및 방향족 잔기, 예를 들어 페닐알라닌, 티로신의 다른 방향족 잔기로의 치환을 들 수 있다.
다른 변이체는 B 그룹 아미노산 서열로 이루어진 폴리펩티드의 아미노산 잔기중 하나 이상이 치환기를 포함하는 것이다.
또 다른 변이체는 폴리펩티드가 다른 화합물, 예를 들어 상기 폴리펩티드의 반감기를 증가시키는 화합물(예를 들어, 폴리에티렌 글리콜)과 결합된 것이다.
다른 변이체는 추가의 아미노산 서열, 예를 들어 리더 서열, 분비 서열, 프로단백질 서열 또는 폴리펩티드의 정제, 농축 또는 안정화를 용이하게 하기 위한 서열이 융합된 것을 말한다.
몇몇 관점에서, 단편, 유도체 및 유사체는 B 그룹 아미노산 서열로 이루어진 폴리펩티드 및 이 폴리펩티드에 실질적으로 동일한 서열과 동일한 생물학적 기능 또는 활성을 보유한다. 다른 관점에서, 단편, 유도체 또는 유사체는 프로단백질을 포함하여, 상기 단편, 유도체 또는 유사체는 활성 폴리펩티드를 생성하기 위해 프로단백질 부분의 절단에 의해 활성화될 수 있다.
숙주 세포 내에서 높은 수준의 단백질 발현을 달성하기 위한 코돈 최적화
본 발명은 코돈 용법을 변경하기 위해 자일라나제-암호화 핵산을 변형시키는 방법을 제공한다. 한 관점에서, 본 발명은 숙주 세포 내에서 자일라나제 발현을 증가 또는 감소시키기 위해 자일라나제를 암호화하는 핵산내 코돈을 변경하는 방법을 제공한다. 또한, 본 발명은 숙주 세포 내에서 자일라나제의 발현을 증가시키기 위해 변경된 자일라나제를 암호화하는 핵산, 그렇게 변경된 자일라나제 및 변경된 자일라나제를 제조하는 방법을 제공한다. 상기 방법은 자일라나제-암호화 핵산내 "바람직하지 않은" 또는 "덜 바람직한" 코돈을 확인하는 단계; 이들 바람직하지 않은또는 덜 바람직한 코돈중 하나 이상을 대체된 코돈과 동일한 아미노산을 암호화하는 "바람직한 코돈"으로 대체하는 단계를 포함하며, 상기 핵산중 하나 이상의 바람직하지 않은 코돈 또는 덜 바람직한 코돈은 동일한 아미노산을 암호화하는 바람직한 코돈에 의해 대체된다. 바람직한 코돈은 숙주 세포내의 유전자내 암호 서열내에서 과도하게 나타나는 코돈이며, 바람직하지 않거나 덜 바람직한 코돈은 숙주 세포 내에서 유전자내 암호 서열에서 과소하게 나타나는 코돈이다.
본 발명의 핵산을 발현하는 숙주 세포, 발현 카세트 및 벡터는 박테리아, 효모, 균류, 식물 세포, 곤충 세포 및 포유류 세포이다. 따라서, 본 발명은 이들 모든 세포에서 코돈 용법을 최적화하는 방법, 코돈 변경된 핵산 및 상기 코돈 변경된 핵산에 의해 암호화된 폴리펩티드를 제공한다. 숙주 세포의 예로는 그람 음성 박테리아, 예를 들어 에스케리치아 콜라이(Escherichia coli) 및 슈도모나스 플루오레센스(Pseudomonas fluorescens); 그람 양성 박테리아, 예를 들어 스트렙토마이세스 다이버사(Streptomyces diversa), 락토바실러스 가세리(Lactobacillus gasseri), 락토바실러스 락티스(Lactococcus lactis), 락토바실러스 크레모리스(Lactococcus cremoris), 바실러스 섭틸러스(Bacillus subtilis)를 들 수 있다. 또한, 숙주 세포로는 진핵 유기체도 사용할 수 있는데, 이의 예로는 여러가지 효모, 예를 들어 사카로마이세스 세레비재(Saccharomyces cerevisiae), 스키조사크로마이세스 폼브(Schizosaccharomyces pombe), 피치아 파스토리스(Pichia pastoris) 및 클루이베로마이세스 락티스(Kluyveromyces lactis), 한세눌라 폴리모르파(Hansenula polymorpha), 아스퍼길러스 나이저(Aspergillus niger)를 포함하는 사카로마이세스종(Saccharomyces sp.) 및 포유동물 세포 및 세포주 및 곤충 세포 및 세포주를 들 수 있다. 따라서, 본 발명은 이들 유기체 및 종에서 발현을 위해 최적화된 핵산 및 폴리펩티드를 포함한다.
예를 들어, 박테리아 세포로부터 분리된 자일라나제를 암호화하는 핵산의 코돈은 상기 핵산이 상기 자일라나제가 유도된 박테리아와는 다른 박테리아 세포, 효모, 진균, 식물 세포, 곤충 세포 또는 포유류 세포에서 최적 발현되도록 변경할 수 있다. 코돈 최적화 방법은 업계에 공지되어 있으며, 예를 들어 미국 특허 5,795,737; Baca (2000) Int. J. Parasitol. 30: 113-118; Hale (1998) Protein Expr. Purif. 12: 185-188; Narum (2001) Infect. Immun. 69: 7250-7253를 참조할 수 있다. 또한, 문헌(참조: Narum (2001) Infect. Immun. 69: 7250-7253, describing optimizing codons in mouse systems; Outchkourov (2002) Protein Expr. Purif. 24: 18-24, describing optimizing codons in yeast; Feng (2000) Biochemistry 39: 15399-15409, describing optimizing codons in E. coli ; Humphreys (2000) Protein Expr. Purif. 20: 252-264, describing optimizing codon usage that affects secretion in E. coli)을 참고할 수도 있다..
트랜스게닉 비인간 동물
본 발명은 본 발명의 핵산, 폴리펩티드(예, 자일라나제), 발현 카셋트 또는 벡터 또는 형질감염 또는 형질전환된 세포를 포함하는 트랜스게닉 비인간 동물을 제공한다. 본 발명은 또한 트랜스게닉 비인간 동물의 제조 방법 및 사용 방법을 제공한다.
트랜스게닉 비인간 동물은 예컨대, 본 발명의 핵산을 포함하는 염소, 토끼, 양, 돼지, 소, 랫트 및 마우스일 수 있다. 이들 동물들은 예컨대, 자일라나제 활성을 연구하는 생체내 모델, 또는 생체내 자일라나제 활성을 변화시키는 작용제를 스크리닝하기 위한 모델로서 사용될 수 있다. 트랜스게닉 비인간 동물에서 발현되는 폴리펩티드에 대한 코딩 서열은 연속적이거나, 또는 조직-특이적, 발달-특이적 또는 유도성 전사 조절 인자의 조절하에 있도록 디자인될 수 있다. 트랜스게닉 비인간 동물은 본 기술 분야에 공지된 방법에 의해 디자인 및 생성할 수 있다; 예컨대, 형질전환된 세포 및 수정란, 및 트랜스게닉 마우스, 랫트, 토끼, 양, 돼지 및 소를 제조하고 사용하는 방법에 대하여 서술하고 있는 미국 특허 제6,211,428호; 제6,187,992호; 제6,156,952호; 제6,118,044호; 제6,111,166호; 제6,107,541호; 제5,959,171호; 제5,922,854호; 제5,892,070호; 제5,880,327호; 제5,891,698호; 제5,639,940호; 제5,573,933호; 제5,387,742호; 제5,087,571호를 참조하라. 또한, 예컨대, 트랜스게닉 낙농 동물의 우유에서 재조합 단백질의 생산에 대해 서술하는 [Pollock (1999) J. Immunol. Methods 231: 147-157]; 및 트랜스게닉 염소에 대해 서술하고 있는 [Baguisi (1999) Nat. Biotechnol. 17: 456-461]을 참고하라. 미국 특허 출원 제6,211,428호는 DNA 서열을 포함하는 뇌 핵산 작제물에서 발현되는 트랜스게닉 비인간 동물의 제조 및 사용에 대해 서술한다. 미국 특허 제6,211,428호는 클로닝된 재조합 또는 합성 DNA 서열을 수정된 마우스 수정란에 주입하고, 주입된 수정란을 가임신 수컷에게 착상시켜, 트랜스게닉 마우스 세포가 알츠하이머 병의 병리학과 연관된 단백질을 발현하도록 하는 것에 대해 서술한다. 미국 특허 제6,187,992호는 마우스의 게놈이 아밀로이드 전구체 단백질(APP)을 코딩하는 유전자의 파괴를 포함하는 트랜스게닉 마우스의 제조 및 사용에 대해 서술한다.
"넉아웃 동물"은 또한 본 발명의 방법을 수행하는 데 사용될 수 있다. 예컨대, 한 양태에서, 본 발명의 트랜스게닉 또는 개질된 동물은 "넉아웃 동물", 예컨대, 본 발명의 자일라나제 또는 본 발명의 자일라나제를 포함하는 융합 단백질을 발현하는 유전자로 대체되어진 내인성 유전자를 발현하지 않도록 조작된 "넉아웃 마우스"를 포함한다.
트랜스게닉 식물 및 종자
본 발명은 본 발명의 핵산, 폴리펩티드(예, 자일라나제), 발현 카셋트 또는 벡터 또는 형질감염된 또는 형질전환된 세포를 포함하는 트랜스게닉 식물 및 종자를 제공한다. 본 발명은 또한 본 발명의 핵산 및/또는 폴리펩티드(예, 자일라나제)를 포함하는 식물 산물들, 예컨대, 오일, 종자, 잎, 추출물 등을 제공한다. 트랜스게닉 식물은 쌍떡잎 식물(디콧)이거나 외떡잎 식물(모노콧)일 수 있다. 본 발명은 또한 이들 트랜스게닉 식물 및 종자의 제조 및 사용 방법을 제공한다. 본 발명의 폴리펩티드를 발현하는 트랜스게닉 식물 또는 식물 세포는 본 기술 분야에 공지된 어떠한 방법에 따라 작제될 수 있다. 예컨대, 미국 특허 제6,309,872호를 참조하라.
본 발명의 핵산 및 발현 작제물은 어떠한 수단에 의해 식물 세포로 도입될 수 있다. 예컨대, 핵산 및 발현 작제물은 소정의 식물 숙주의 게놈으로 도입될 수 있거나, 또는 핵산 또는 발현 작제물은 에피좀일 수도 있다. 소정의 식물의 게놈으로의 도입은 숙주의 자일라나제 생산이 내인성 전사 또는 번역 조절 요소에 의해 조절되도록 할 수 있다. 본 발명은 또한 예컨대, 상동적 재조합에 의해 일어난 유전자 서열의 삽입이 내인성 유전자의 발현을 파괴하는 "넉아웃 식물"을 제공한다. "넉아웃" 식물을 생성하는 수단은 본 기술 분야에 잘 알려져 있다. 예컨대, [Strepp (1998) Proc Natl. Acad. Sci. USA 95: 4368-4373; Miao (1995) Plant J 7: 359-365]를 참조하라. 이하, 트랜스게닉 식물에 대한 서술을 참조하라.
본 발명의 핵산은 어떠한 식물, 예컨대, 감자, 밀, 쌀, 보리 등과 같은 전분을 생산하는 식물에 본질적으로 소정의 특성을 부여하는 데 사용될 수 있다. 본 발명의 핵산은 숙주의 자일라나제 발현을 최적화하거나 변화시키기 위해, 식물의 대사 경로를 조작하는 데 사용될 수 있다. 이는 식물에서 자일라나제 활성을 변화시킬 수 있다. 선택적으로, 본 발명의 자일라나제는 그 식물에 의해 원래 생산되지 않는 화합물을 생산하기 위해, 트랜스게닉 식물을 제조하는 데 사용될 수 있다. 이는 생산 비용이 적거나, 신규한 산물을 생성하게 할 수 있다.
한 양태에서, 트랜스게닉 식물을 제조하는 첫 단계는 식물 세포에서 발현하는 발현 작제물을 제조하는 것을 포함한다. 이들 기술은 본 기술 분야에 잘 공지되어 있다. 여기에는 프로모터의 선별 및 클로닝, 리보좀이 mRNA에 효율적으로 결합하는 것을 용이하게 하는 코딩 서열의 선별 및 클로닝, 및 적절한 유전자 종결자 서열의 선별이 포함될 수 있다. 하나의 대표적인 연속적 프로모터는 식물에서 과량 발현을 일반적으로 초래하는 콜리플라워 모자이크 바이러스 유래의 CaMV35S이다. 다른 포로모터는 식물 내부 또는 외부 환경의 신호에 더욱 특이하게 반응한다. 대표적인 광유도성 프로모터는 주된 엽록소 a/b 결합 단백질을 코딩하는 cab 유전자의 단백질이다.
한 양태에서, 핵산은 식물 세포에서 더욱 과량의 발현을 얻기위해 개질된다. 예컨대, 본 발명의 서열은 식물에서 관찰되는 서열에 비교하여 높은 %의 A-T 뉴클레오티드 쌍을 가질 수 있으며, 일부의 경우는 G-C 뉴클레오티드 쌍의 %가 더 높다. 따라서, 코딩 서열내 A-T 뉴클레오티드는 식물 세포에서 유전자 산물의 생산을 강화시키기 위해 아미노산 서열의 두드러진 변화없이도 G-C 뉴클레오티드로 대체될 수 있다.
선별적 마커 유전자는 연속적으로 트랜스유전자에 삽입된 식물 세포 또는 조직을 확인하기 위해 유전자 작제물에 첨가될 수 있다. 이는 식물 세포내에 유전자의 삽입 및 발현이 드문 일이며, 표적화된 조직 또는 세포의 몇 %에서만 발생하므로 필수적일 수 있다. 선별적 마커 유전자는 식물에 일반적으로 독성인 약제에 내성을 제공하는 단백질, 예컨대, 항생제 또는 제초제를 코딩한다. 삽입된 선별적 마커 유전자를 갖는 식물 세포만이 적절한 항생제나 제초제를 함유하는 배지에서 배양시 생존할 것이다. 다른 삽입된 유전자를 위해, 마커 유전자는 또한 더 나은 기능을 갖는 프로모터 및 종결 서열을 요구한다.
한 양태에서, 트랜스게닉 식물 또는 종자를 제조하는 것은 본 발명의 서열, 및 임의적으로 마커 유전자를 표적 발현 작제물(예, 플라스미드)에 프로모터 및 종결자 서열의 위치에 따라 삽입하는 것을 포함한다. 이에는 개질된 유전자를 적절한 방법을 통해 식물에 전달시키는 것을 포함할 수 있다. 예컨대, 작제물은 전기충격및 식물 세포 프로토플라스트의 미세주입과 같은 기술들을 사용하여, 식물 세포의 게놈 DNA에 직접 도입되거나, 또는 작제물은 DNA 입자 포격과 같은 탄도 방법을 사용하여 식물 조직에 직접 도입될 수 있다. 예컨대, 입자 포격을 사용하여 밀에 트랜스유전자를 도입하는 것에 대해 서술하는 [Christou (1997) Plant Mol. Biol. 35: 197-203; Pawlowski (1996) Mol. Biotechnol. 6: 17-30; Klein (1987) Nature 327: 70-73; Takumi (1997) Genes Genet. Syst. 72: 63-69] 및 입자 포격을 사용하여 YAC을 식물 세포에 도입하는 것에 대해 서술하고 있는 [Adam (1997) supra]를 참조하라. 예컨대, [Rinehart (1997) supra]는 입자 포격을 사용하여 트랜스게닉 코튼 식물을 생성하였다. 입자를 가속화시키는 장치는 미국 특허 제5,015,580호에 서술되어 있으며, BioRad (Biolistics) PDS-2000 입자 가속화 기기가 시판중이며, 또한 겉씨 식물의 입자-매개 형질전환에 대해 서술하고 있는 John의 미국 특허 제 5,608,148호 및 Ellis의 미국 특허 제5,681,730호를 참조하라.
한 양태에서, 프로토플라스트는 고정되고, 핵산, 예컨대, 발현 작제물이 주입될 수 있다. 프로토플라스트 유래의 식물 재발생이 곡식에는 용이하지 않음에도, 식물 재발생은 프로토플라스트 유래된 캘러스의 체세포 배형성을 사용하여, 콩과 식물에서는 가능하다. 유기된 조직은 DNA를 텅스텐 미세발사물로 코팅하며, 이 때 발사체는 세포 크기의 1/100 크기이고, 이로 인해 DNA가 세포 및 조직으로 운반되는 유전자 총 기술을 사용하여, 네이키드 DNA로 형질전환될 수 있다. 그 후, 형질전환된 조직은 체세포 배형성에 의해 일반적으로 재발생될 수 있다. 이 기술은 옥수수 및 쌀을 비롯한 여러 곡식 종에서 성공되어 왔다.
핵산, 예컨대, 발현 작제물은 또한 재조합 바이러스를 사용하여 식물 세포에 도입될 수 있다. 식물 세포는 담배 모자이크 바이러스에서 유래된 벡터와 같은 바이러스 벡터를 사용하여 형질전환될 수 있다(Rouwendal (1997) Plant Mol. Biol. 33: 989-999), Porta (1996) "Use of viral replicons for the expression of genes in plants", Mol. Biotechnol. 5: 209-221 참조).
선택적으로, 핵산, 예컨대, 발현 작제물은 적절한 T-DNA 플랭킹 부위와 조합되어, 종래의 아그로박테리엄 투메파시엔스(Agrobacterium tumefaciens) 숙주 벡터로 도입될 수 있다. 아그로박테리엄 투메파시엔스 숙주의 병독성 기능은 세포가 박테리아로 감염시, 작제물 및 인접한 마커가 식물 세포 DNA로 삽입되는 것을 가능케 한다. 무력화되고 바이너리 벡터의 사용을 포함하는 아그로박테리엄 투메파시엔스-매개된 형질전환 기술은 과학 문헌에 잘 서술되어 있다. 예컨대, [Horsch (1984) Science 233: 496-498; Fraley (1983) Proc. Natl. Acad. Sci. USA 80: 4803 (1983); Gene Transfer to Plants, Potrykus, ed. (Springer-Verlag, Berlin 1995)]를 참조하라. 아그로박테리엄 투메파시엔스 세포의 DNA는 Ti(종양-유도) 플라스미드로 알려져 있는 기타 구조내에는 물론 박테리아 염색체 내에 함유된다. Ti 플라스미드는 감염 과정시 식물 세포로 전이되는 T-DNA(~20 kb 길이) 및 감염 과정을 초래하는 일련의 vir(병독성) 유전자로 일컬어 지는 DNA를 함유한다. 아그로박테리엄 투메파시엔스는 단지 상처를 통해서만 식물에 감염될 수 있다: 식물 뿌리 또는 줄기가 상처를 입으면, 여기서 어떠한 화학적 신호를 내게 되고, 이 신호에 반응하여, 아그로박테리엄 투메파시엔스의 vir 유전자는 활성화되어 Ti-플라스미드의 T-DNA를 식물의 염색체로 전이시키는 데 필요한 일련의 과정들을 초래하게 된다. 그 후, T-DNA는 상처 부위를 통해 식물 세포로 들어간다. T-DNA는 식물 DNA가 복제되거나 전사될 때까지 기다린 후, 노출된 식물 DNA에 그 자신을 삽입시킨다고 추정된다. 아그로박테리엄 투메파시엔스를 트랜스유전자 벡터로 사용하기 위해서, T-DNA의 종양-유도 부위는 제거되어야만 하며, 반면에 T-DNA 경계 부위 및 vir 유전자는 유지되어야만 한다. 트랜스유전자는 그 후 T-DNA 경계 부위들 사이에 삽입되어, 식물 세포로 전이되어 식물의 염색체에 삽입되게 될 것이다.
본 발명은 본 발명의 핵산을 사용한 중요한 곡식을 포함하는 외떡잎 식물의 형질전환을 제공한다. [Hiei (1997) Plant Mol. Biol. 35: 205-218]을 참조하라. 또한, 예컨대, 게놈 DNA에 T-DNA의 삽입에 대해 서술하고 있는 [Horsch, Science(1984) 233: 496; Fraley (1983) Proc. Natl. Acad. Sci USA 80: 4803; Thykjaer (1997) supra; Park (1996) Plant Mol. Biol. 32: 1135-1148]를 참조하라. 또한, 곡식 또는 기타 외떡잎 식물의 세포에서 작동하는 유전자를 포함하는 DNA의 안정적 삽입 방법에 대해 서술하고 있는 D'Halluin의 미국 특허 제5,712,135호를 참조하라.
한 양태에서, 세번째 단계는 통합된 표적 유전자를 다음 세대까지 전달할 수 있는 전체 식물의 선별 및 재발생을 포함할 수 있다. 이러한 재발생 기술은 조직 배양 성장 배지에서 어떠한 피토호르몬을 조작하는 것에 의존하며, 전형적으로 소정의 뉴클레오티드 서열과 함께 도입된 살생물제 및/또는 제초제 마커에 의존한다. 배양된 프로토플라스트로부터의 식물 재발생은 [Evans et al., ProtoplastsIsolation and Culture, Handbook of Plant Cell Culture, pp.124-176, MacMillilan Publishing Company, New York, 1983; 및 Binding, Regeneration of Plants, Plant Protoplasts, pp. 21-73, CRC Press, Boca Raton, 1985]에 서술되어 있다. 재발생은 또한 식물 캘러스, 외식편, 기관 또는 이들의 부분에서 얻을 수 있다. 이러한 재발생 기술은 일반적으로 [Klee (1987) Ann. Rev. of Plant Phys. 38: 467-486]에 서술되어 있다. 비성숙된 배아와 같은 트랜스게닉 조직에서 전체 식물을 얻기 위해서, 이들은 조직 배양으로 알려진 영양소 및 호르몬을 함유하는 일련의 배지에서 조절되는 환경 조건하에 성장될 수 있다. 일단 전체 식물이 생성되고 종자를 생산하면, 자손의 평가가 시작된다.
발현 카셋트가 트랜스게닉 식물에 안정적으로 통합된 후, 이는 교배에 의해 다른 식물로 도입될 수 있다. 여러 표준 육종 기술 중 어떠한 것들이 교배될 종에 따라 사용될 수 있다. 본 발명의 핵산의 트랜스게닉 발현이 표현형 변화를 초래하기 때문에, 본 발명의 재조합 핵산을 포함하는 식물은 제2 식물과 교배되어 최종 산물을 얻을 수 있다. 따라서, 본 발명의 종자는 본 발명의 2개의 트랜스게닉 식물의 교배를 통해 유래되거나, 본 발명의 식물과 다른 식물과의 교배에 의해 유래될 수 있다. 소정의 효과(예, 본 발명의 폴리펩티드의 발현이 개화 양식이 변화된 식물을 생산함)가 양쪽 부모 식물이 본 발명의 폴리펩티드(예, 자일라나제)를 발현하는 경우 강화될 수 있다. 소정의 효과는 표준 증식 수단에 의해 미래의 식물 세대로 전달될 수 있다.
본 발명의 핵산 및 폴리펩티드는 어떠한 식물 또는 종자에서 발현되거나 이에 삽입된다. 본 발명의 트랜스게닉 식물은 쌍떡잎 식물 또는 외떡잎 식물일 수 있다. 본 발명의 외떡입 트랜스게닉 식물의 예는 풀, 예컨대, 왕포아풀(파란 풀, 포아(Poa)), 마초 풀, 예컨대, 페스투카, 로리엄, 템퍼레이트(temperate) 풀, 예컨대, 아그로스티스(Agrostis) 및 곡식, 예컨대, 밀, 귀리, 호밀, 보리, 쌀, 사탕수수 및 옥수수(콘)이 있다. 본 발명의 쌍떡잎 트랜스게닉 식물의 예는 담배, 콩과 식물, 예컨대, 루핀, 감자, 사탕무, 완두, 콩 및 대두, 및 겨자과 식물(브라시카세아(Brassicaceae) 패밀리)), 예컨대, 콜리플라워, 평지 종자, 및 밀접하게 관련된 모델 유기체인 아라비돕시스 탈리아나(Arabidopsis thaliana)가 있다. 따라서, 본 발명의 트랜스게닉 식물 및 종자는 아나카리듐(Anacardium), 아라치스(Arachis), 아스파라거스(Asparagus), 아트로파(Atropa), 아베나(Avena), 브라시카(Brassica), 시트러스(Citrus), 시트럴러스(Citrullus), 캡시컴(Capsicum), 카르타머스(Carthamus), 코코스(Cocos), 코피아(Coffea), 쿠쿠미스(Cucumis), 쿠쿠르비타(Cucurbita), 다우커스(Daucus), 엘라에시스(Elaeis), 프라가리아(Fragaria), 글라이신(Glycine), 고시피엄(Gossypium), 헬리안터스(Helianthus), 헤테로칼리스(Heterocallis), 호르테우튼(Hordeutn), 하이오시아머스(Hyoscyamus), 락투카(Lactuca), 린넘(Linum), 로리엄(Lolium), 루피너스(Lupinus), 리코퍼시콘(Lycopersicon), 말러스(Malus), 만니호트(Manihot), 메이요라나(Majorana), 메디카고(Medicago), 니코티아나(Nicotiana), 올레아(Olea), 오리자(Oryza), 페니엄(Panieum), 파니세텀(Pannisetum), 페르지아(Persea), 파세올러스(Phaseolus), 피스타치아(Pistachia), 피섬(Pisum), 피러스(Pyrus), 프루너스(Prunus), 라파너스(Raphanus), 리치너스(Ricinus), 세케일(Secale), 세네시오(Senecio), 시나피스(Sinapis), 솔라넘(Solanum), 소르클라엄(Sorglaum), 를제오브로머스(Tlzeobromus), 트리고넬라(Trigonella), 트리티컴(Triticum), 비시아(Vicia), 비티스(Vitis), 비그나(Vigna) 및 지아(Zea) 속에서 유래된 종들을 포함하나, 이로 제한되지 않는 광범위한 식물을 포함한다.
선택적 구체예에서, 본 발명의 핵산은 섬유 세포를 함유하는 식물, 예컨대, 코튼, 실크 코튼 나무(Kapok, Ceiba pentandra), 사막 버드나무, 크레오소트 덤블, 윈터팻, 발사, 라미, 양마, 삼, 로젤, 황마, 사이잘 삼 및 아마에서 발현된다. 선택적 구체예에서, 본 발명의 트랜스게닉 식물은 어떠한 고시피엄 종, 예컨대, 고시피엄 아르보레엄(G. arboreum); 고시피엄 헤르바세엄(G. herbaceum), 고시피럼 바르바덴스(G. barbadense) 및 고시피엄 히르서텀(G. hirsutum)의 멤버를 포함하는 고시피엄(Gossypium) 속의 구성원일 수 있다.
본 발명은 또한 많은 양의 본 발명의 폴리펩티드(예, 자일라나제 또는 항체)를 생산하는 데 사용되는 트랜스게닉 식물을 제공한다. 예컨대, [Palmgren (1997) Trends Genet. 13:348; Chong (1997) Transgenic Res. 6: 289-296]를 참조하라(옥신-유도성, 양방향 만노파인 신테타제(mas 1', 2') 프로모터를 사용하여, 아그로박테리엄 투메파시엔스-매개된 잎 디스크 형질전환 방법으로, 트랜스게닉 감자에서 인간 우유 단백질인 베타-카제인을 생산함).
공지된 과정들을 사용하여, 당업자는 트랜스게닉 식물에서 트랜스유전자 mRNA나 단백질의 증가 또는 감소를 검출하여 본 발명의 식물을 스크린할 수 있다.mRNA나 단백질의 검출 및 정량화 수단은 본 기술 분야에 잘 알려져 있다.
폴리펩티드 및 펩티드
한 양태에서, 본 발명은 본 발명의 대표적 서열과 서열 동일성(예, 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%,73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%,81%, 82%, 83%, 84%, 85%, 86%, 87%,88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상, 또는 완전한(100%) 서열 동일성)을 갖는 완전히(100%) 분리되거나 재조합된 폴리펩티드를 제공한다. 예컨대, 서열 번호 2, 서열 번호 4, 서열 번호 6, 서열 번호 8, SEQ I : D NO : 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18, 서열 번호 20, 서열 번호 22, 서열 번호 24, 서열 번호 26, 서열 번호 28, 서열 번호 30, 서열 번호 32, 서열 번호 34, 서열 번호 36, 서열 번호 38, 서열 번호 40, 서열 번호 42, 서열 번호 44, 서열 번호 46, 서열 번호 48, 서열 번호 50, 서열 번호 52, 서열 번호 54, 서열 번호 56, 서열 번호 58, 서열 번호 60, 서열 번호 62, 서열 번호 64, 서열 번호 66, 서열 번호 68, 서열 번호 70, 서열 번호 72, 서열 번호 74, 서열 번호 76, 서열 번호 78, 서열 번호 80, 서열 번호 82, 서열 번호 84, 서열 번호 86, 서열 번호 88, 서열 번호 90, 서열 번호 92, 서열 번호 94, 서열 번호 96, 서열 번호 98, 서열 번호 100, 서열 번호 102, 서열 번호 104, 서열 번호 106, 서열 번호 108, 서열 번호 110, 서열 번호 112, 서열 번호 114, 서열 번호 116, 서열 번호 118, 서열 번호 120, 서열 번호 122, 서열 번호 124, 서열 번호 126, 서열 번호 128, 서열 번호 130, 서열 번호132; 서열 번호 134; 서열 번호 136; 서열 번호 138; 서열 번호 140; 서열 번호 142; 서열 번호 144; 서열 번호 146, 서열 번호 148, 서열 번호 150, 서열 번호 152, 서열 번호 154, 서열 번호 156, 서열 번호 158, 서열 번호 160, 서열 번호 162, 서열 번호 164, 서열 번호 166, 서열 번호 168, 서열 번호 170, 서열 번호 172, 서열 번호 174, 서열 번호 176, 서열 번호 178, 서열 번호 180, 서열 번호 182, 서열 번호 184, 서열 번호 186, 서열 번호 188, 서열 번호 190, 서열 번호 192, 서열 번호 194, 서열 번호 196, 서열 번호 198, 서열 번호 200, 서열 번호 202, 서열 번호 204, 서열 번호 206, 서열 번호 208, 서열 번호 210, 서열 번호 212, 서열 번호 214, 서열 번호 216, 서열 번호 218, 서열 번호 220, 서열 번호 222, 서열 번호 224, 서열 번호 226, 서열 번호 228, 서열 번호 230, 서열 번호 232, 서열 번호 234, 서열 번호 236, 서열 번호 238, 서열 번호 240, 서열 번호 242, 서열 번호 244, 서열 번호 246, 서열 번호 248, 서열 번호 250, 서열 번호 252, 서열 번호 254, 서열 번호 256, 서열 번호 258, 서열 번호 260, 서열 번호 262, 서열 번호 264, 서열 번호 266, 서열 번호 268, 서열 번호 270, 서열 번호 272, 서열 번호 274, 서열 번호 276, 서열 번호 278, 서열 번호 280, 서열 번호 282, 서열 번호 284, 서열 번호 286, 서열 번호 288, 서열 번호 290, 서열 번호 292, 서열 번호 294, 서열 번호 296, 서열 번호 298, 서열 번호 300, 서열 번호 302, 서열 번호 304, 서열 번호 306, 서열 번호 308, 서열 번호 310, 서열 번호 312, 서열 번호 314, 서열 번호 316, 서열 번호 318, 서열 번호 320, 서열 번호 322, 서열 번호 324, 서열 번호 326, 서열 번호 328, 서열 번호 330, 서열 번호332, 서열 번호 334, 서열 번호 336, 서열 번호 338, 서열 번호 340, 서열 번호 342, 서열 번호 344, 서열 번호 346, 서열 번호 348, 서열 번호 350, 서열 번호 352, 서열 번호 354, 서열 번호 356, 서열 번호 358, 서열 번호 360, 서열 번호 362, 서열 번호 364, 서열 번호 366, 서열 번호 368, 서열 번호 370, 서열 번호 372, 서열 번호 374, 서열 번호 376, 서열 번호 378 또는 서열 번호 380으로 나타낸 서열을 갖는 단백질이다. 한 양태에서, 폴리펩티드는 자일라나제 활성을 가지며, 예컨대, 다당류(예, 자일란)내 글리코시딕 결합을 가수분해할 수 있다. 한 양태에서, 폴리펩티드는 내부 β-1,4-자일로시딕 결합의 가수분해를 촉매화할 수 있는 자일라나제 활성을 가진다. 한 양태에서, 자일라나제 활성은 엔도-1,4-베타-자일라나제 활성을 포함한다. 한 양태에서, 자일라나제 활성은 자일란을 가수분해하여, 더 소분자량의 자일로즈 및 자일로-올리고머를 생산하는 것을 포함한다. 한 양태에서, 자일란은 아라비노자일란, 예컨대, 수용성 아라비노자일란을 포함한다.
본 발명의 폴리펩티드는 자일라나제를 활성 형태 또는 비활성 형태로 포함한다. 예컨대, 본 발명의 폴리펩티드는 프로단백질이 전환되어 "활성" 성숙한 단백질을 생성하는, 예컨대, 프로단백질-가공 효소에 의한 "성숙화" 또는 프리프로 서열의 가공 이전의 프로단백질을 포함한다. 본 발명의 폴리펩티드는 예컨대, 엔도- 또는 엑소-펩티다제 또는 프로테나제 작용, 인산화 반응, 아미드화, 당화 또는 황화, 다이머화 반응 등과 같은 후-번역 과정에 의해 "활성화"되기 이전인, 다른 이유로 비활성 형태인 자일라나제를 포함한다. 본 발명의 폴리펩티드는 자일라나제의 활성 서브서열, 예컨대, 촉매 도메인 또는 활성 부위를 포함하는, 모든 활성 형태를 포함한다.
"프리프로" 도메인 서열 및 신호 서열을 확인하는 방법은 본 기술 분야에 잘 공지되어 있다. 예컨대, [Van de Ven (1993) Crit. Rev. Oncog. 4 (2): 115-136]를 참조하라. 예컨대, 프리프로 서열을 확인하기 위해서는, 단백질을 세포외 공간에서 정제하고, N-말단 단백질 서열을 결정하고 비가공된 형태와 비교한다.
본 발명은 신호 서열 및/또는 프리프로 서열이 포함되거나 포함되지 않은 폴리펩티드를 포함한다. 본 발명은 이질적 신호 서열 및/또는 프리프로 서열이 포함된 폴리펩티드를 포함한다. 프리프로 서열(이질적 프리프로 도메인으로 사용된 본 발명의 서열 포함)은 단백질의 아미노 말단 또는 카르복시 말단에 위치할 수 있다. 본 발명은 또한 분리되거나 재조합된 신호 서열, 프리프로 서열 및 본 발명의 서열을 포함하는 촉매 도메인(예, "활성 부위")을 포함한다.
% 서열 동일성은 폴리펩티드 전체 길이에 걸쳐 존재하거나, 또는 동일성이 적어도 약 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 또는 그 이상의 잔기 부위에 걸쳐 존재할 수 있다. 본 발명의 폴리펩티드는 또한 대표적인 폴리펩티드의 전체 길이보다 더 짧을 수 있다. 선택적 양태에서, 본 발명은 약 5 내지 전체 폴리펩티드, 예컨대, 자일라나제와 같은 효소길이의 크기 범위를 갖는 폴리펩티드(펩티드, 단편)를 제공하며, 대표적인 크기는 약 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 또는 그 이상의 잔기, 예컨대, 본 발명의 대표적인 자일라나제의 연속 잔기의 범위이다.
본 발명의 펩티드(예, 본 발명의 대표적인 폴리펩티드의 서브서열)는 예컨대, 표지된 프로브, 항원, 톨러라젠, 모티프, 자일라나제 활성 부위(예, "촉매 도메인"), 신호 서열 및/또는 프리프로 도메인으로 유용할 수 있다.
본 발명의 폴리펩티드 및 펩티드는 천연원에서 분리되거나 합성되거나, 또는 재조합적으로 발생된 폴리펩티드일 수 있다. 펩티드 및 단백질은 시험관내 또는 생체내에서 재조합적으로 발현될 수 있다. 본 발명의 펩티드 및 폴리펩티드는 본 기술 분야에 공지된 방법을 사용하여 제조 및 분리될 수 있다. 본 발명의 폴리펩티드 및 펩티드는 또한 본 기술 분야에 잘 알려진 화학적 방법을 사용하여 전체적으로 또는 부분적으로 합성될 수 있다. 예컨대, [Caruthers(1980) Nucleic Acids Res. Symp. Ser. 215-223; Horn (1980) Nucleic Acids Res. Symp. Ser.225-232; Banga, A. K., Therapeutic Peptides and Proteins, Formulation, Processing and Delivery Systems (1995) Technomic Publishing Co., Lancaster, PA]을 참조하라. 예컨대, 펩티드 합성은 다양한 고체상 기술을 사용하여 수행될 수 있으며(예, Roberge (1995) Science 269: 202; Merrifield (1997) Methods Enzymol. 289: 3-13 참조), 자동화된 합성도 제조자에 의해 제공되는 지시에 따라, 예컨대, ABI 431A 펩티드 합성기(Perkin Elmer)를 사용하여 성취될 수 있다.
본 발명의 펩티드 및 폴리펩티드는 또한 당화될 수 있다. 당화는 후-번역적으로 화학적 또는 세포내 생합성 메카니즘에 의해 첨가될 수 있으며, 후자의 경우는 서열에 네이티브 하거나, 또는 펩티드로 첨가되거나 핵산 코딩 서열로 첨가될수 있는 공지된 당화 모티프의 사용을 포함한다. 당화는 0-결합되거나 N-결합될 수 있다.
전술된 바와 같이, 본 발명의 펩티드 및 폴리펩티드는 모든 "의태체" 및 "펩티도의태체" 형태를 포함한다. 용어 "의태체" 및 "펩티도의태체"는 본 발명의 폴리펩티드와 실질적으로 동일한 구조적 및/또는 기능적 특징을 가지는 합성 화학 화합물을 나타낸다. 의태체는 아미노산의 합성된 비천연 유사체로 구성되거나, 부분적으로 천연 펩티드 아미노산 및 부분적으로 아미노산의 비천연 유사체의 키메릭 분자일 수 있다. 의태체는 또한 치환이 의태체의 구조 및/또는 활성을 실질적으로 변화시키지 않는 한, 일정한 양의 천연 아미노산 보존적 대체를 포함할 수 있다. 구조적 변형체인 본 발명의 폴리펩티드 아미노산으로, 일상적 실험은 의태체가 본 발명의 범위 이내임을, 즉, 의태체의 구조 및/또는 기능이 실질적으로 변화되지 않았음을 확인할 것이다. 따라서, 한 양태에서, 의태체 조성은 만약 의태체 조성이 자일라나제 활성을 갖는다면 본 발명의 범위 이내이다.
본 발명의 폴리펩티드 의태체 조성은 비천연 구조적 성분들의 어떠한 조합을 포함할 것이다. 선택적 양태에서, 본 발명의 의태체 조성은 이하 세가지 구조적 군의 하나 또는 전부를 포함한다: a) 천연 아미드 결합("펩티드 결합")이 아닌 다른 잔기 결합 군; b) 천연적으로 발생하는 아미노산 잔기를 대신하는 비천연 잔기; 또는 c) 2차 구조적 의태체를 유도하는, 즉, 2차 구조, 예컨대, 베타 턴, 감마 턴, 베타 쉬트, 알파 헬릭스 구성 등을 유도하거나 안정화시키는 잔기. 예컨대, 본 발명의 폴리펩티드는 이 잔기들의 전부 또는 일부가 천연 펩티드 결합이 아닌 다른화학적 수단으로 연결되는 경우, 의태체로 특징화될 수 있다. 개별적인 펩티도의태체 잔기는 펩티드 결합, 기타 화학적 결합 또는 커플링 수단, 예컨대, 글루타알데히드, N-히드록시숙시니미드 에스터, 이중작용성 말레이미드, N,N'-디시클로헥실카르보디이미드(DCC) 또는 N,N'-디이소프로필카르보디이미드(DIC)에 의해 연결될 수 있다. 전통적인 아미드 결합("펩티드 결합")을 대체할 수 있는 결합 기에는 예컨대, 케토메틸렌(예, -C(=O)-NH-의 경우 -C(=O)-CH2-), 아미노메틸렌(CH2-NH), 에틸렌, 올레핀(CH=CH), 에테르(CH2-O), 티오에테르(CH2-S), 테트라졸(CN4-), 티아졸, 레트로아미드, 티오아미드, 또는 에스터가 포함된다(예, Spatola(1983) in Chemistry and Biochemistry of Amino Acids, Peptides and Proteins, Vol. 7, pp 267-357, "Peptide Backbone Modifications", Marcell Dekker, NY).
본 발명의 폴리펩티드는 또한 천연적으로 발생하는 아미노산 잔기를 대신하는 비천연 잔기의 전부 또는 일부를 함유하는 의태체로 특징화될 수 있다. 비천연 잔기는 과학 문헌 및 특허 문허에 잘 서술되어 있다; 천연 아미노산 잔기의 의태체로 유용한 대표적인 비천연 조성의 일부 및 이에 대한 가이드라인은 이하 서술된다. 방향족 아미노산의 의태체는 예컨대, D- 또는 L-나필알라닌; D- 또는 L-페닐글라이신; D- 또는 L-2 티에네일알라닌; D- 또는 L-1-, 2-, 3-, 또는 4-피레네일알라닌; D- 또는 L-3 티에네일알라닌; D- 또는 L- (2-피리디닐)-알라닌; D- 또는 L-(3-피리디닐)-알라닌; D- 또는 L-(2-피라지닐)-알라닌; D- 또는 L-(4-이소프로필)-페닐글라이신; D-(트리플루오로메틸)-페닐글라이신; D-(트리플루오로메틸)-페닐알라닌; D-p-플루오로-페닐알라닌; D- 또는 L-p-비페닐페닐알라닌; D- 또는 L-p-메톡시-비페닐페닐알라닌; D- 또는 L-2-인돌(알킬)알라닌; 및 D- 또는 L-알킬알라닌으로 대체 함으로써 발생될 수 있으며, 여기서, 알킬은 치환된 또는 비치환된 메틸, 에틸, 프로필, 헥실, 부틸, 펜틸, 이소프로필, 이소-부틸, sec-이소틸, 이소-펜틸, 또는 비산성 아미노산일 수 있다. 비천연 아미노산의 방향족 고리에는 예컨대, 티아졸릴, 티오페닐, 피라졸릴, 벤지미다졸릴, 나프틸, 푸라닐, 피롤릴 및 피리딜 방향족 고리를 포함한다.
산성 아미노산의 의태체는 예컨대, 음성 전하는 유지하면서 비-카르복실레이트 아미노산; (포스포노)알라닌; 황화 트레오닌을 대체함으로써 발생될 수 있다. 카르복실 측면 기(예, 아스파르틸 또는 글루타밀)는 또한 카르보디이미드(R'-N-C-N-R'), 예컨대, 1-시클로헥실-3(2-모르폴리닐-(4-에틸) 카르보디이미드 또는 1-에틸-3(4-아조니아-4,4-디메톨펜틸) 카르보디이미드와의 반응으로 선택적으로 개질될 수 있다. 아스파르틸 또는 글루타밀은 또한 암모늄 이온과의 반응으로 아스파라기닐 및 글루타미닐 잔기로 전환될 수 있다. 염기성 아미노산의 의태체는 예컨대, (라이신 및 아르기닐에 부가하여), 아미노산 오르니틴, 시트룰린, 또는 (구아니디노)-아세트산, 또는 (구아니디노)알킬-아세트산과의 치환으로 발생될 수 있으며, 여기서 알킬은 상기 정의된 바와 같다. 니트릴 유도체(예, COOH 대신 CN-부분을 함유)는 아스파라긴 또는 글루타민을 대체할 수 있다. 아스파라기닐 및 글루타미닐 잔기는 대응되는 아스파틸 또는 글루타밀 잔기로 탈아민화될 수 있다. 아르기닌 잔기 의태체는 아르기닐을 예컨대, 하나 이상의 종래의 시약들(예, 페닐글리옥살,2,3-부탄디온, 1,2-시클로-헥산디온, 또는 닌히드린)과 함께 바람직하게는 알칼리 조건하에 반응함으로써 발생될 수 있다. 티로신 잔기 의태체는 티로실을 예컨대, 방향족 디아조니엄 화합물 또는 테트라니트로메탄과 반응함으로써 발생될 수 있다. N-아세틸이미디졸 및 테트라니트로메탄은 0-아세틸 티로실 종 및 3-니트로 유도체를 형성하는 데 각각 사용될 수 있다. 시스테인 잔기 의태체는 시스테이닐 잔기를 예컨대, 알파-할로아세테이트, 예컨대, 2-클로로아세트산 또는 클로로아세타미드 및 대응되는 아민과 반응시킴으로써, 카르보시메틸 또는 카르복시아미도메틸 유도체를 형성함으로써, 발생될 수 있다. 시스테인 잔기 의태체는 또한 시스테이닐 잔기를 예컨대, 브로모-트리플루오로아세톤, 알파-브로모-베타-(5-이미도조일) 프로피온산; 클로로아세틸 포스페이트, N-알킬말레이미드, 3-니트로-2-피리딜 디설피드; 메틸 2-피리딜 디설피드; p-클로로머큐리벤조에이트; 2-클로로머큐리-4 니트로페놀; 또는, 클로로-7-니트로벤조-옥사-1,3-디아졸과 반응시킴으로써 발생될 수 있다. 라이신 의태체는 라이시닐을 예컨대, 카르복실산 무수화물과 반응시킴으로써, 발생되거나 (및 아미노 말단 잔기는 변화될) 수 있다. 라이신 및 기타 알파-아미노-함유 의태체는 또한 이미도에스터, 예컨대, 메틸 피콜린이미데이트, 피리독살 포스페이트, 피리독살, 클로로보로히드리드, 트리니트로-벤젠술폰산, O-메틸이소우레아, 2,4-펜탄디온과의 반응, 및 글리옥실레이트와의 트랜스아미다제-촉매화 반응에 의해 발생될 수 있다. 메티오닌 의태체는 예컨대, 메티오닌 설폭시드와의 반응으로 발생될 수 있다. 프롤린 의태체에는 예컨대, 피페콜산, 티아졸리딘 카르복실산, 3- 또는 4-히드록시 프롤린, 데히드로프롤린, 3- 또는 4-메틸프롤린, 또는 3,3-디메틸프롤린이 포함된다. 히스티딘 잔기 의태체는 히스티딜을 예컨대, 디에틸프로카보네이트 또는 파라-브로모펜아크릴 브로마이드와 반응시킴으로써 발생될 수 있다. 기타 의태체에는 예컨대, 프롤린 및 라이신의 히드록실화; 세릴 또는 트레오닐 잔기의 히드록실 기의 인산화; 라니신, 아르기닌 및 히스티딘의 알파-아미노기의 메틸화; N-말단 아민의 아세틸화; 주된 사슬 아미드 잔기의 메틸화 또는 N-메틸 아미노산으로의 치환; 또는 C-말단 카르복실기의 아미드화에 의해 발생된 것들이 포함된다.
본 발명의 폴리펩티드의 잔기, 예컨대, 아미노산은 또한 반대 키랄리티의 아미노산(또는 펩티도의태체 잔기)을 대체함으로써 대체될 수 있다. 따라서, L-배위로 천연적으로 발생하는 어떠한 아미노산(화학적 엔티티의 구조에 따라 R 또는 S로도 언급될 수 있음)은 D-아미노산으로 언급되는, 동일한 화학 구조의 유형 또는 펩티도의태체이나 반대 키랄리티를 갖는 아미노산으로 대체될 수 있으며, 이 또한 R- 또는 S-형태로 언급될 수 있다.
본 발명은 또한 후-번역 가공(예, 인산화, 아실화 등)과 같은 천연 과정, 또는 화학적 개질 기술에 의해 본 발명의 폴리펩티드를 개질하는 방법을 제공하며, 결과적으로 개질된 폴리펩티드를 제공한다. 개질은 펩티드 백본, 아미노산 측사슬 및 아미노 말단 및 카르복시 말단을 포함하는 폴리펩티드의 어떠한 부위에서도 일어날 수 있다. 동일한 유형의 개질이 주어진 폴리펩티드에서 여러 분위에 동일하거나 다양한 정도로 존재할 수 있음을 이해될 것이다. 또한, 주어진 폴리펩티드는 여러 유형의 개질을 포함할 수 있다. 개질에는 아세틸화, 아실화, ADP-리보실화, 아미드화, 플라빈의 공유 결합, 헴 부분의 공유 결합, 뉴클레오티드 또는 뉴클레오티드 유도체의 공유 결합, 지질 또는 지질 유도체의 공유 결합, 포스파티딜이노시톨의 공유 결합, 교차 결합 시클화, 디설피드 결합 형성, 탈메틸화, 공유 교차 결합의 형성, 시스테인의 형성, 피로글루타메이트의 형성, 포밀화, 감마-카르복실화, 당화, GPI 앵커 형성, 히드록실화, 요오드화, 메틸화, 미리스톨화, 산화, 페닐화, 프로테올리틱 가공, 인산화, 프레닐화, 라세미화, 셀레노일화, 황화, 및 단백질에 아미노산의 트랜스퍼 RNA 매개된 첨가, 예컨대, 아르기닐화가 포함된다. 예컨대, [ Creighton, T. E., Proteins-Structure and Molecular Properties 2nd Ed. , W. H. Freeman and Company, New York(1993); Posttranslational Covalent Modification of Proteins, B. C. Johnson, Ed., Academic Press, New York, pp. 1-12 (1983)]를 참조하라.
고체상 화학적 펩티드 합성 방법은 또한 본 발명의 폴리펩티드 또는 단편을 합성하는 데 사용될 수 있다. 이러한 방법은 1960년대 이래로 본 기술 분야에 공지되어 왔으며(Merrifield, R. B. , J. Am. Chem. Soc. , 85: 2149-2154, 1963. 또한, Stewart, J. M. and Young, J. D., Solid Phase Peptide Synthesis, 2nd Ed., Pierce Chemical Co., Rockford, Ill., pp. 11-12를 참조하라), 최근에는 시판되는 실험실 펩티드 디자인 및 합성 키트로 사용되고 있다(Cambridge Research Biochemicals). 이러한 시판중인 실험실 킷트는 [H. M. Geysen et al, Proc. Natl. Acad. Sci., USA, 81: 3998 (1984)]의 기술을 일반적으로 사용하며, 다수의 "로드" 또는 "핀"으로 펩티드를 합성하는 방법을 제공하며, 이들 모두는 단일 플레이트에연결된다. 이러한 시스템이 사용되는 경우, 로드 또는 핀의 플레이트는 인버팅되고, 핀 또는 로드의 팁에 적절한 아미노산을 부착 또는 앵커링시키는 용액을 함유하고 있는 대응되는 웰 또는 레저부아의 제2 플레이트로 전환된다. 이러한 과정들을 반복함으로써, 즉, 인버팅하고, 로드 및 핀의 팁을 적절한 용액으로 삽입함으로써, 아미노산은 소정의 펩티드가 된다. 덧붙여, 여러 이용 가능한 FMOC 펩티드 합성 시스템이 이용가능하다. 예컨대, 폴리펩티드 또는 단편의 어셈블리는 고체 지지체 상에서, Applied Biosystems, Inc. Model 431A™자동화된 펩티드 합성기를 사용하여 수행될 수 있다. 이러한 장비는 다른 공지된 기술을 사용하여 커플될 수 있는 일련의 단편들을 합성하거나 직접 합성함으로써, 본 발명의 펩티드에 대한 용이한 접근을 제공한다.
본 발명은 신호의 존재 또는 부존재하에 본 발명의 자일라나제를 포함한다. 본 발명의 신호 서열을 포함하는 폴리펩티드는 본 발명의 자일라나제 또는 다른 자일라나제 또는 다른 효소 또는 다른 폴리펩티드일 수 있다.
본 발명은 고정화된 자일라나제, 항-자일라나제 항체 및 이들의 단편을 포함한다. 본 발명은 예컨대, 본 발명의 우성 음성 돌연변이체 또는 항-자일라나제 항체를 사용하여, 자일라나제 활성을 저해하는 방법을 제공한다. 본 발명은 본 발명의 자일라나제를 포함하는 헤테로복합체, 예컨대, 융합 단백질, 헤테로다이머 등을 포함한다.
본 발명의 폴리펩티드는 다양한 조건하에, 예컨대, 극단적인 pH, 및/또는 온도, 산화제 등의 존재하에 자일라나제 활성을 가질 수 있다. 본 발명은 예컨대, 온도, 산화제 및 세척 조건의 변화에 대해 상이한 촉매적 효율 및 안정성을 갖는 변화된 자일라나제 제조를 초래하는 방법을 제공한다. 한 양태에서, 자일라나제 변이체는 사이트-다이렉티드 돌연변이 유발 및/또는 랜덤 돌연변이 유발의 기술을 사용하여, 유도될 수 있다. 한 양태에서, 직접적인 진화는 선택적인 특이성 및 안정성을 갖는 매우 다양한 자일라나제 변이체를 생성하는 데 사용될 수 있다.
본 발명의 단백질은 또한 자일라나제 조절자, 예컨대, 자일라나제 활성의 활성제 또는 저해제를 확인하는 데 탐구 시약으로서 유용할 수 있다. 간단하게, 시험 샘플(화합물, 배지, 추출물 등)을 자일라나제 분석에 첨가하여, 이들의 기질 절단을 저해하는 활성을 결정한다. 이와 같은 방식으로 확인된 저해제는 산업적으로 사용될 수 있으며, 바람직하지 않은 프로테올리스를 감소 또는 예방하는 데 연구되어 진다. 자일라나제와 같이, 저해제는 활성의 범위를 증가시키도록 조합될 수 있다.
본 발명의 효소는 또한 단백질을 분해하고 단백질 서열 분석에 이용되는 탐구 시약으로 유용할 수 있다. 예컨대, 자일라나제는 예컨대, 자동화된 서열 분석기를 사용한 서열 분석시, 서열 분석을 위한 더 작은 단편으로 폴리펩티드를 잘라주는 데 사용될 수 있다.
본 발명은 또한 본 발명의 핵산, 폴리펩티드 및 항체를 사용하여 새로운 자일라나제를 발견하는 방법을 제공한다. 한 양태에서, 파아지미드 라이브러리는 자일라나제의 발현에 기초한 발견을 위해 스크리닝된다. 다른 양태에서, 람다 파아지 라이브러리는 자일라나제의 발현에 기초한 발견을 위해 스크리닝된다. 파아지 또는 파아지미드 라이브러리의 스크리닝은 독성 유전자의 검출, 기질에 대한 개선된 접근성; 라이브러리의 매스 절단으로 초래되는 어떠한 바이어스의 잠재성을 통과시킴으로써, 필요한 숙주 조작의 감소; 및 낮은 클론 밀도에서 빠른 성장을 가능케 할 수 있다. 파아지 또는 파아지미드 라이브러리의 스크리닝은 액체 상태 또는 고체 상태에서 일어날 수 있다. 한 양태에서, 본 발명은 액체 상태에서의 스크리닝을 제공한다. 이는 고체 상태의 스크리닝 보다, 분석 조건; 추가적인 기질 유연성; 약한 클론에 대해 더 높은 선택성; 및 자동화의 용이함에서 더욱 유동적이다.
본 발명은 본 발명의 단백질 및 핵산을 사용하여, 높은 수치의 정확성 및 재현성은 물론, 짧은 시간에 걸쳐(예, 하루당) 수천개의 생촉매적 반응 및 스크리닝 분석을 평가할 수 있는 로보트화된 자동화된 스크리닝 방법을 제공한다(이하, 어레이에 대한 서술을 참고). 결과적으로, 유도체 화합물의 라이브러리는 몇 주일만에 생산될 수 있다. 소분자를 포함한 분자들의 개질에 대해 보다 자세히는 PCT/US94/09174를 참조하라.
본 발명의 다른 양태는 군 A 핵산 서열 및 이와 실질적으로 동일한 서열 중 하나의 서열을 포함하는 분리된거나 정제된 폴리펩티드, 또는 이들의 적어도 약 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속적 아미노산을 포함하는 분리된거나 정제된 단편이다. 전술된 바와 같이, 이러한 폴리펩티드는 벡터에 폴리펩티드를 코딩하는 핵산을 삽입함으로써 얻어지며, 이 때, 코딩 서열이 적절한 숙주 세포에서 코딩된 폴리펩티드의 발현을 유도할 수 있는 서열에 작동적으로 연결된다. 예컨대, 발현 벡터는 프로모터, 번역 개시를 위한 리보좀 결합 부위, 및 전사 종결자를 포함할 수 있다. 벡터는 또한 발현을 증폭시키는 적절한 서열을 포함할 수 있다.
본 발명의 다른 양태는 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 이들의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속적 아미노산을 포함하는 단편 중 적어도 하나에 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 또는 약 95% 이상의 상동성을 갖는 폴리펩티드 또는 단편이다. 상동성은 폴리펩티드 또는 단편을 정렬하여, 이들을 서로 비교하고 아미노산 동일성 또는 유사성의 정도를 결정하는 전술된 어떠한 프로그램을 사용하여 결정될 수 있다. 아미노산 "상동성"은 전술된 것들과 같은 보존적 아미노산 대체를 포함한다는 것은 이해될 것이다.
B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 이들의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속적 아미노산을 포함하는 단편 중 적어도 하나에 상동성을 갖는 폴리펩티드 또는 단편은 전술된 기술을 사용하여 이들을 코딩하는 핵산을 분리함으로써 얻어질 수 있다.
선택적으로, 상동적인 폴리펩티드 또는 단편은 생화학적 농축 또는 정제 과정을 통해 얻어질 수도 있다. 잠재적으로 상동적인 폴리펩티드 또는 단편의 서열은 자일란 히드롤라제 분해, 겔 전기영동 및/또는 마이크로 서열 분석에 의해 결정될 수 있다. 예기되는 상동적인 폴리펩티드 또는 단편의 서열은 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 이들의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속적 아미노산을 포함하는 단편중 하나와 비교될 수 있다.
본 발명의 다른 양태는 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 효소적 기능을 보유하고 있는, B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 단편 및 변형체를 확인하는 분석법이다. 예컨대, 상기 폴리펩티드의 단편 또는 변형체는 생화학적 반응을 촉매화하는 데 사용될 수 있으며, 이는 단편 및 변형체가 B 군 아미노산 서열의 폴리펩티드의 효소적 활성을 보유함을 의미한다.
변형체의 단편이 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드의 효소적 활성을 보유하는지 여부를 결정하는 분석법은 하기의 단계를 포함한다: 폴리펩티드 단편 또는 변형체가 기능할 수 있는 조건에서 폴리펩티드 단편 또는 변형체를 기질 분자와 접촉시키는 단계, 및 기질의 수치의 감소 또는 폴리펩티드와 서열간의 반응에 의한 특이적 반응 산물의 수치의 증가를 검출하는 단계.
B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 이들의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속적 아미노산을 포함하는 단편은 다양한 적용에 사용될 수 있다. 예컨대, 폴리펩티드 및 이들의 단편은 생화학적 반응을 촉매화하는 데 사용될 수 있다. 본 발명의 한 양태에 따라, B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 글리코시딕 결합을 가수분해하기 위해 이러한 폴리펩티드를 코딩하는 폴리뉴클레오티드를 사용하는 방법이 제공된다. 이러한 과정에서, 글리코시딕 결합을 함유하는 물질(예, 전분)은 글리코시딕 결합의 가수분해를 용이하게 하는 조건하에서, B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드 중 하나와접촉한다.
본 발명은 효소의 유일한 촉매적 성질을 사용한다. 화학적 변형시 생촉매의 사용(즉, 정제된 또는 원 효소, 죽어있는 또는 살아있는 세포)은 특정 개시 화합물과 반응하는 특정 생촉매의 확인을 요구하는 반면, 본 발명은 소분자와 같은 여러 개시 화합물에 존재하는 작용기에 특이적인 반응 촉매 및 선택적인 생촉매를 사용한다. 각각의 생촉매는 하나의 작용기 또는 여러 관련된 작용기에 특이적이며, 작용기를 함유하는 여러 개시 화합물들과 반응할 수 있다.
생촉매 반응는 단일 개시 화합물 유래의 유도체 집단을 생성한다. 이들 유도체들은 다른 라운드의 생촉매 반응을 겪어 유도체 화합물의 제2 집단을 생성한다. 오리지날 소분자 또는 화합물의 수천개의 변형체들은 생촉매성 유도체화의 각각의 반복에 의해 생성될 수 있다.
효소들은 나머지 분자들에 영향을 주지 않으면서 개시 화합물의 특정 부위에서 반응하며, 이 과정은 전통적인 화학적 방법을 사용하여 성취하기에는 매우 어렵다. 이러한 생촉매성 특이성의 높은 정도는 라이브러리 이내에서 단일 활성 화합물을 확인하는 수단을 제공한다. 라이브러리는 소위 "생합성 히스토리"로 불리우는 이를 생산하는 데 사용되는 일련의 생촉매성 반응에 의해 특징지워 진다. 생물학적 활성에 대해 라이브러리를 스크리닝하는 것 및 생합성 히스토리를 트레이싱하는 것은 활성 화합물을 생성하는 특이적 반응 서열을 확인하는 것이다. 반응 서열은 반복되며, 합성된 화합물의 구조는 결정된다. 이 확인 양식은 다른 합성 및 스크리닝 접근법과 달리, 고정화 기술을 요구하지 않으며, 화합물은 실질적으로 어떠한 유형의 스크리닝 분석법을 사용하여, 용액이 아닌 곳에서도 합성 및 시험될 수 있다. 작용기에 대한 효소 반응의 고도의 특이성은 생촉매적으로 생산된 라이브러리를 구성하는 특이적 효소 반응의 "트랙킹"을 가능케 함을 주의해야 한다.
여러 과정적 단계들은 높은 수치의 정확성 및 재현성은 물론, 하루당 수천개의 생촉매적 반응 및 스크리닝 분석을 평가할 수 있는 로보트화된 자동화에 의해 수행된다. 이 결과로서, 유도체 화합물의 라이브러리는 현재 화학적 방법 사용시 수년이 걸리던 것을 수 주일만에 생성할 수 있다.
특정 양태에서, 본 발명은 본 명세서에서 서술된 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드 또는 효소적으로 활성 있는 이들의 단편을 소분자와 접촉하여 개질된 소분자를 생성하는 단계를 포함하는 소분자의 개질 방법을 제공한다. 개질된 소분자의 라이브러리는 개질된 소분자가 소정의 활성을 나타내는 라이브러리 이내에 존재하는지 여부가 시험된다. 소정의 활성을 갖는 개질된 소분자를 생성하는 특이적 생촉매성 반응은 라이브러리의 일부분을 제조하는 데 사용되는 각각의 생촉매성 반응을 제거한 후, 소정의 활성을 갖는 개질된 소분자의 존재 또는 부재하에 라이브러리의 일부분을 제조하는 데 사용된 소분자를 시험함으로써 확인된다. 소정의 활성을 갖는 개질된 소분자를 생성하는 특이적 생촉매성 반응은 임의적으로 반복된다. 생촉매성 반응은 소분자의 구조 이내에서 발견되는 구별되는 구조적 부분과 반응하는 한 군의 생촉매와 수행되며, 각각의 생촉매는 하나의 구조적 부분 또는 한 군의 관련된 구조적 부분에 특이적이고, 각각의 생촉매는 별개의 구조적 부분을 함유하는 여러 상이한 소분자들과 반응한다.
자일라나제 신호 서열, 프리프로 및 촉매 도메인
본 발명은 자일라나제 신호 서열(예, 신호 펩티드(SP)), 프리프로 도메인 및 촉매 도메인(CD)을 제공한다. 본 발명의 SP, 프리프로 도메인 및/또는 CD는 분리되며, 재조합 펩티드는 예컨대, 키메릭 단백질의 이질적 도메인으로서 융합 단백질의 일부일 수 있다. 본 발명은 촉매 도메인(CD), 프리프로 도메인 및 신호 서열(SP, 예, 본 발명의 폴리펩티드의 아미노 말단 잔기를 포함하는/구성되는 서열을 갖는 펩티드)을 코딩하는 핵산을 제공한다. 한 양태에서, 본 발명은 잔기 1 내지 15, 1 내지 16, 1 내지 17, 1 내지 18, 1 내지 19,1 내지 20, 1 내지 21, 1 내지 22, 1 내지 23, 1 내지 24, 1 내지 25, 1 내지 26, 1 내지 27, 1 내지 28, 1 내지 28, 1 내지 30, 1 내지 31, 1 내지 32, 1 내지 33, 1 내지 34, 1 내지 35, 1 내지 36, 1 내지 37, 1 내지 38, 1 내지 39, 1 내지 40, 1 내지 41, 1 내지 42, 1 내지 43, 1 내지 44의 본 발명의 폴리펩티드로 서술되는 서열을 포함하는/구성되는 펩티드를 포함하는 신호 서열을 제공한다.
한 양태에서, 본 발명은 이하 표 4에 나타낸 서열을 포함하는/구성되는 펩티드를 포함하는 신호 서열을 제공한다. 예컨대, 표 4에서, 본 발명은 서열 번호 102(서열 번호 101에 의해 코딩됨)의 1 내지 23 잔기를 포함하는/구성되는 신호 서열, 서열 번호 104(서열 번호 103에 의해 코딩됨)의 1 내지 41 잔기를 포함하는/구성되는 신호 서열, 등을 제공한다.
표 4: 본 발명의 대표적인 신호 서열
신호 서열 번호; 신호 서열(아미노산 위치)
101, 102 1-23
103, 104 1-41
105, 106 1-22
109, 110 1-26
11, 12 1-28
113, 114 1-28
119, 120 1-33
121, 122 1-20
123, 124 1-20
131, 132 1-26
135, 136 1-25
139, 140 1-24
141, 142 1-25
143, 144 1-32
147, 148 1-28
149, 150 1-18
15, 16 1-20
151, 152 1-21
153, 154 1-16
155, 156 1-21
157, 158 1-29
159, 160 1-23
161, 162 1-32
163, 164 1-26
165, 166 1-23
167, 168 1-36
169, 170 1-24
17, 18 1-31
171, 172 1-29
173, 174 1-22
175, 176 1-27
177, 178 1-26
179, 180 1-19
181, 182 1-25
183, 184 1-32
185, 186 1-27
187, 188 1-28
19, 20 1-29
191, 192 1-27
193, 194 1-21
195, 196 1-23
197, 198 1-28
199, 200 1-30
203, 204 1-30
205, 206 1-29
207, 208 1-27
209, 210 1-25
21, 22 1-28
211, 212 1-29
215, 216 1-31
217, 218 1-29
219, 220 1-23
221, 222 1-24
223, 224 1-28
225, 226 1-25
227, 228 1-39
229, 230 1-28
23, 24 1-29
231, 232 1-41
233, 234 1-26
235, 236 1-28
237, 238 1-32
239, 240 1-30
241, 242 1-28
243, 244 1-33
245, 246 1-32
249, 250 1-33
253, 254 1-24
255, 256 1-51
259, 260 1-24
261, 262 1-26
263, 264 1-29
267, 268 1-30
27, 28 1-27
271, 272 1-22
273, 274 1-74
277, 278 1-19
279, 280 1-22
283, 284 1-28
287, 288 1-23
289, 290 1-22
295, 296 1-26
299, 300 1-24
301, 302 1-28
303, 304 1-74
305, 306 1-32
309, 310 1-20
311, 312 1-33
313, 314 1-22
315, 316 1-28
319, 320 1-27
325, 326 1-27
327, 328 1-29
329, 330 1-35
33, 34 1-23
331, 332 1-28
333, 334 1-30
335, 336 1-50
339, 340 1-23
341, 342 1-45
347, 348 1-20
349, 350 1-20
351, 352 1-73
353, 354 1-18
355, 356 1-21
357, 358 1-25
359, 360 1-31
361, 362 1-26
365, 366 1-65
367, 368 1-23
369, 370 1-27
39, 40 1-24
41, 42 1-37
45, 46 1-25
47, 48 1-26
5, 6 1-47
51, 52 1-30
53, 54 1-37
55, 56 1-24
57, 58 1-22
59, 60 1-21
63, 64 1-20
65, 66 1-22
67, 68 1-28
69, 70 1-25
7, 8 1-57
73, 74 1-21
75, 76 1-22
77, 78 1-27
79, 80 1-36
83, 84 1-30
87, 88 1-29
89, 90 1-40
9, 10 1-36
95, 96 1-24
99, 100 1-33
본 발명의 자일라나제 신호 서열(SP) 및/또는 프리프로 서열은 예컨대, 융합(키메릭) 단백질로서, 다른 자일라나제 또는 비자일라나제 폴리펩티드에 인접한 서열 또는 분리된 펩티드일 수 있다. 한 양태에서, 본 발명은 본 발명의 자일라나제 신호 서열을 포함하는 폴리펩티드를 제공한다. 한 양태에서, 본 발명의 자일라나제신호 서열 SP 및/또는 프리프로를 포함하는 폴리펩티드는 본 발명의 자일라나제에 이질적인 서열을 포함한다(예, 본 발명의 SP 및/또는 프리프로, 및 다른 자일라나제 또는 비자일라나제 단백질의 서열을 포함하는 융합 단백질). 한 양태에서, 본 발명은 이질적인 SP 및/또는 프리프로 서열, 예컨대, 효모 신호 서열과 함께 본 발명의 자일라나제를 제공한다. 본 발명의 자일라나제는 벡터에서, 예컨대, pPIC 시리즈 벡터(Invitrogen, Carlsbad, CA)에서 이질적 SP 및/또는 프리프로를 포함할 수 있다.
한 양태에서, 본 발명의 SP 및/또는 프리프로 서열은 이하 신규한 자일라나제 폴리펩티드를 확인하기 위해 사용된다. 단백질이 분류되고 이들의 적절한 위치로 이동되는 경로를 종종 단백질 표적화 경로로 언급된다. 이들 표적화 시스템의 모두에서 가장 중요한 요소들 중 하나는 신호 서열이라고 불리우는 새로 합성된 폴리펩티드의 아미노 말단의 짧은 아미노산 서열이다. 이 신호 서열은 단백질이 세포 내에서 적절한 위치로 이동되도록 하고, 이의 최종 목적지에 도달한 경우 또는는 전송 과정 중에 제거된다. 대부분의 라이소조말, 멤브레인 또는 분비 단백질은 소포체의 루멘으로 위치시켜주는 아미노 말단 신호 서열을 가진다. 이 군의 단백질의 100개 이상의 신호 서열이 결정되었다. 신호 서열은 13 내지 36개의 아미노산 잔기의 길이로 다양할 수 있다. 신호 서열의 다양한 인식 방법은 본 기술 분야의 당업자에게 공지되어 있다. 예컨대, 한 양태에서, 신규한 자일라나제 신호 펩티드는 SignalP라고 언급되는 방법에 의해 확인된다. SignalP는 신호 펩티드 및 이들의 절단 부위 모두를 인식하는 조합된 신경 네트워크를 사용한다(Nielsen, et al.,"Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites. "Protein Engineering, vol. 10, no. 1, p. 1-6 (1997)).
본 발명의 일부 양태의 자일라나제는 SP 및/또는 프리프로 서열, 또는 "도메인"을 갖지 않을 것이라는 것을 이해해야만 한다. 한 양태에서, 본 발명은 SP 및/또는 프리프로 도메인의 전부 또는 일부를 결여한 본 발명의 자일라나제를 제공한다. 한 양태에서, 본 발명은 상이한 자일라나제의 핵산 서열에 작동적으로 결합된 하나의 자일라나제 유래의 신호 서열(SP) 및/또는 프리프로, 또는, 임의적으로, 바람직할 수 있는 비자일라나제 단백질 유래의 신호 서열(SP) 및/또는 프리프로를 코딩하는 핵산 서열을 제공한다.
본 발명은 또한 본 발명의 신호 서열(SP), 프리프로 도메인 및/또는 촉매 도메인(CD) 및 이질적 서열을 포함하는 분리된 또는 재조합된 폴리펩티드를 제공한다. 이질적 서열은 SP, 프리프로 도메인 및/또는 CD와 천연적으로 연관되지 않는 서열이다(예, 자일라나제에 대해). SP, 프리프로 도메인 및/또는 CD가 천연적으로 연관되지 않는 서열은 SP, 프리프로 도메인 및/또는 CD의 아미노산 말단, 카르복시 말단 및/또는 SP 및/또는 CD의 양쪽 말단에 위치할 수 있다. 한 양태에서, 본 발명은 그것이 (예컨대, 자일라나제에 대해) 천연적으로 연관되지 않은 어떠한 서열과 연관되지 않는다는 가정하에, 본 발명의 신호 서열(SP), 프리프로 도메인 및/또는 촉매 도메인(CD)을 포함하는 폴리펩티드를 포함하는(또는 구성되는) 분리된 또는 재조합된 폴리펩티드를 제공한다. 유사하게, 한 양태에서, 본 발명은 이들 폴리펩티드를 코딩하는 분리된 또는 재조합된 핵산을 제공한다. 따라서, 한 양태에서, 본 발명의 분리된 또는 재조합된 핵산은 본 발명의 신호 서열(SP), 프리프로 도메인 및/또는 촉매 도메인(CD), 및 이질적 서열(즉, 본 발명의 신호 서열(SP), 프리프로 도메인 및/또는 촉매 도메인(CD)과 천연적으로 연관되지 않은 서열)에 대한 코딩 서열을 포함한다. 이질적 서열은 3' 말단, 5' 말단, 및/또는 SP, 프리프로 도메인 및/또는 CD 코딩 서열의 양쪽 말단에 위치한다.
하이브리드(키메릭) 자일라나제 및 펩티드 라이브러리
한 양태에서, 본 발명은 본 발명의 서열을 포함하는 펩티드 라이브러리를 포함한 하이브리드 자일라나제 및 융합 단백질을 제공한다. 본 발명의 펩티드 라이브러리는 자일라나제 기질, 수용체, 효소와 같은 표적의 펩티드 조절자(예, 활성제 또는 저해제)를 분리하기 위해 사용될 수 있다. 본 발명의 펩티드 라이브러리는 리간드, 예컨대, 사이토카인, 호르몬 등과 같은 표적의 정식적 결합 파트너를 확인하는 데 사용될 수 있다. 한 양태에서, 본 발명은 본 발명의 신호 서열(SP), 프리프로 도메인 및/또는 촉매 도메인(CD), 또는 이들의 조합, 및 또는 이질적인 서열(상기 참조)을 포함하는 키메릭 단백질을 제공한다.
한 양태에서, 본 발명의 융합 단백질(예, 펩티드 부분)은 표적에 대한 높은 결합 친화도를 제공하도록 구조적으로 안정하다(선형 펩티드에 비하여). 본 발명은 본 발명의 자일라나제 및 공지된 및 랜덤 펩티드를 포함하는 기타 펩티드의 융합을 제공한다. 이들은 자일라나제의 기질이 현저하게 교란되지 않아, 펩티드가 대사적으로 또는 구조적으로 안정화되는 방식으로 융합될 수 있다. 이는 세포내에서 이의존재 및 이의 정량 모두를 쉽게 모니터링하는 펩티드 라이브러리의 생성을 가능케 한다.
본 발명의 아미노산 서열 변형체는 변형체의 예측되는 성질(자일라나제 서열의 대립형질 또는 종간 변형체와 같은 천연적으로 발생하는 형태로 상이하게 서술되는 특징)에 의해 특징화될 수 있다. 한 양태에서, 본 발명의 변형체는 천연적으로 발생하는 유사체와 동일한 정량적인 생물학적 활성을 나타낸다. 선택적으로, 변형체는 개질된 특징을 갖도록 선별될 수 있다. 한 양태에서, 아미노산 변형체가 도입된 부위 또는 위치가 미리 예측되는 반면, 요구되는 돌연변이는 예측될 수 없다. 예컨대, 주어진 위치에서의 돌연변이 수행을 최적화하기 위해, 랜던 돌연변이 유발이 표적 코돈 또는 그 부위에서 수행될 수 있으며, 발현된 자일라나제 변형체는 소정의 활성의 최적 조합에 대해 스크리닝된다. 알려진 서열을 갖는 DNA에서 예측된 부위를 돌연변이로 대체시키는 기술은 본 명세서에 서술한 바와 같이, 잘 알려져 있다(예컨대, M13 프라이머 돌연변이 유발 및 PCR 돌연변이 유발). 돌연변이체의 스크리닝은 예컨대, 자일라나제 가수분해 분석법을 사용하여 수행될 수 있다. 선택적 양태에서, 아미노산 치환은 단일 잔기에 일어날 수 있다; 상당히 더 큰 삽입이 행해질 수 있음에도 불구하고, 삽입은 1 내지 20개의 아미노산에서 일어날 수 있다. 결실은 약 1 내지 약 20, 30, 40, 50, 60, 70 잔기 또는 그 이상일 수 있다. 최적의 성질을 갖는 최종 유도체를 얻기 위해서, 치환, 결실, 삽입 또는 이들의 어떠한 조합이 사용될 수 있다. 일반적으로, 이들 변화들은 분자의 변화를 최소화하기 위해 몇개의 아미노산에서만 행해진다.
본 발명은 폴리펩티드 백본의 구조, 2차 또는 3차 구조, 예컨대, 알파-헬리칼 또는 베타-쉬트 구조가 개질된 자일라나제를 제공한다. 한 양태에서, 전하 또는 소수성이 개질된다. 한 양태에서, 측면 사슬의 벌크가 개질되었다. 기능이나 면역학적 동일성의 실질적 변화가 더욱 두드러진 효과를 만들 수 있다: 변화부에서 폴리펩티드 백본의 구조, 예컨대, 알파-헬리칼 또는 베타-쉬트 구조; 활성 부위에 존재할 수 있는 분자의 전하 또는 소수성 부위; 또는 측면 사슬. 본 발명은 (a) 친수성 잔기, 예컨대, 세릴 또는 트레오닐이 소수성 잔기, 예컨대, 루실, 이소루실, 페닐알라닐, 발릴 또는 알라닐로(또는 이에 의해) 치환되거나; (b) 시스테인 또는 프롤린이 다른 어떠한 잔기들로(또는 이에 의해) 치환되거나; (c) 전기양성 측면 사슬을 갖는 잔기, 예컨대, 라이실, 아르기닐 또는 히스티딜이 전기음성 잔기, 예컨대, 글루타밀 또는 아스파틸로(또는 이에 의해) 치환되거나; 또는 (d) 벌키 측면 사슬을 갖는 잔기, 예컨대, 페닐알라닌이 측면 사슬을 갖지 않는 잔기, 예컨대, 글라이신으로(또는 이에 의해) 치환되는 본 발명의 폴리펩티드의 치환을 제공한다. 변형체가 사용된 자일라나제의 특징을 개질하도록 선택될 수 있음에도 불구하고, 변형체는 동일한 정량적 생물학적 활성(즉, 자일라나제 활성)을 나타낼 수 있다.
한 양태에서, 본 발명의 자일라나제는 에피토프, 또는 정제 태그, 신호 서열 또는 기타 융합 서열 등을 포함한다. 한 양태에서, 본 발명의 자일라나제는 랜덤 펩티드와 융합되어, 융합 폴리펩티드를 형성할 수 있다. 본 명세서에서 "융합된" 또는 "작동적으로 연결된"은 자일라나제 활성을 보유하도록 자일라나제 구조의 안정성의 파괴를 최소화하는 방식으로, 랜덤 펩티드 및 자일라나제가 서로 연결되어있음을 의미한다. 융합 단백질(또는 융합 폴리펩티드를 코딩하는 융합 폴리뉴클레오티드)은 다중 루프에서 다중 펩티드를 포함하여 추가적 성분들을 포함할 수 있다.
한 양태에서, 펩티드 및 이들을 코딩하는 핵산은 완전히 램덤화 또는 이들의 랜더화시 바이어스되어, 예컨대, 일반적으로 위치당 핵산/잔기 빈도로 램덤화될 수 있다. "랜덤화된"은 각각의 핵산 및 펩티드가 랜덤 뉴클레오티드 및 아미노산으로 각각 필수적으로 구성됨을 의미한다. 한 양태에서, 펩티드를 초래하는 핵산은 화학적으로 합성되며, 따라서 어떠한 뉴클레오티드로 어떠한 위치에 통합될 수 있다. 따라서, 핵산이 발현되어 펩티드를 형성하는 경우, 어떠한 아미노산 잔기는 어떠한 위치에 통합될 수 있다. 합성 과정은 핵산을 랜덤화하도록 디자인될 수 있으며, 이는 핵산의 전체 길이에 걸쳐 가능한 조합의 모두 또는 대부분을 형성하게 하며, 랜덤화된 핵산의 라이브러리를 형성한다. 라이브러리는 랜덤화된 발현 산물의 충분히 구조적으로 다양한 집단을 제공하여, 세포의 반응에 가능성있는 충분한 범위로 영향을 주며, 소정의 반응을 나타내는 하나 이상의 세포를 제공한다. 따라서, 본 발명은 이의 적어도 하나의 멤버가 일부 분자, 단백질 또는 기타 인자에 친화도를 부여하는 구조를 가지도록 충분히 큰 상호작용 라이브러리를 제공한다.
자일라나제는 임의적으로 신호 펩티드, 탄수화물 결합 모듈, 자일라나제 활성 도메인, 링커 및/또는 기타 촉매 도메인으로 구성되는 다중도메인 효소이다.
본 발명은 생물학적으로 활성 있는 하이브리드 폴리펩티드(예, 하이브리드 자일라나제)를 코딩할 수 있는 키메릭 폴리펩티드를 생성하는 수단을 제공한다. 한양태에서, 오리지날 폴리뉴클레오티드는 생물학적으로 활성 있는 폴리펩티드를 코딩한다. 본 발명의 방법은 오리지날 폴리펩티드의 서열에 삽입되는 세포 과정을 사용하여 새로운 하이브리드 폴리펩티드를 생산하며, 결과적인 하이브리드 폴리뉴클레오티드는 오리지날 생물학적으로 활성 있는 폴리펩티드로부터 유래된 활성을 나타내는 폴리펩티드를 코딩한다. 예컨대, 오리지날 폴리뉴클레오티드는 상이한 미생물에서 특정 효소를 코딩할 수 있다. 한 개체 또는 변이체 유래의 제1 폴리뉴클레오티드에 의해 코딩되는 효소는 예컨대, 특정 환경 조건하에서, 예컨대, 고 염도 조건하에서 효과적으로 작용할 수 있다. 상이한 개체 또는 변이체 유래의 제2 폴리뉴클레오티드에 의해 코딩되는 효소는 상이한 환경 조건 하에서, 예컨대, 극단적으로 높은 온도에서 효과적으로 작용할 수 있다. 제1 및 제2 오리지날 폴리뉴클레오티드 유래의 서열을 함유하는 하이브리드 폴리뉴클레오티드는 오리지날 폴리펩티드에 의해 코딩되는 양 효소의 특징을 나타내는 효소를 코딩할 수 있다. 따라서, 하이브리드 폴리뉴클레오티드에 의해 코딩되는 효소는 제1 및 제2 폴리뉴클레오티드에 의해 코딩되는 효소들 각각에 의해 공여되는 환경 조건 하에서, 예컨대, 고 염도 및 극단적인 온도에서 효과적으로 작용할 수 있다.
본 발명의 폴리뉴클레오티드에 의해 코딩되는 효소는 자일라나제와 같은 히드롤라제를 포함하나, 이로 제한되지 않는다. 글리코시다제 히드롤라제는 1991년에 처음으로 패밀리로 분류되었다. 예컨대, [Henrissat (1991) Biochem. J. 280: 309-316]를 참조하라. 이 이후로, 분류는 연속적으로 업데이트되어 왔다. 예컨대, [Henrissat (1993) Biochem. J. 293: 781-788; Henrissat (1996) Biochem. J. 316:695-696; Henrissat (2000) Plant Physiology 124: 1515-1519]를 참조하라. 글리코시다제 히드롤라제에는 87가지의 확인된 패밀리가 존재한다. 한 양태에서, 본 발명의 자일라나제는 패밀리 8, 10, 11, 26 및 30으로 분류될 수 있다. 한 양태에서, 본 발명은 또한 통상적인 패밀리, 예컨대, 표 5에 서술된 패밀리 5, 6, 8, 10, 11, 26 또는 30에서 유래된 통상의 신규성을 갖는 자일라나제-코딩 핵산을 제공한다.
표 5
서열 확인 번호 패밀리
9, 10 8
1, 2 8
5, 6 8
7, 8 8
99, 100 10
11, 12 10
127, 128 10
27, 28 10
97, 98 10
45, 46 10
141, 142 10
107, 108 10
129, 130 10
93, 94 10
63, 64 10
25, 26 10
49, 50 10
67, 68 10
85, 86 10
29, 30 10
51, 52 10
35, 36 10
147, 148 10
119, 120 10
123, 124 10
249, 250 10
149, 150 10
83, 84 10
43, 44 10
133, 134 10
113, 114 10
105, 106 10
75, 76 10
111, 112 10
117, 118 10
115, 116 10
125, 126 10
137, 138 10
135, 136 10
69, 70 10
89, 90 10
31, 32 10
13, 14 10
65, 66 10
57, 58 10
77, 78 10
73, 74 10
109, 110 10
59, 60 10
71, 72 10
139, 140 10
55, 56 10
15, 16 10
131,132 10
95, 96 10
101, 102 10
39, 40 10
143, 144 10
103, 104 10
17, 18 10
53, 54 10
21, 22 10
151, 152 10
23, 24 10
121, 122 10
41, 42 10
47, 48 10
247, 248 10
33, 34 10
19, 20 10
87, 88 10
81, 82 10
91, 92 10
61, 62 10
37, 38 10
79, 80 10
231, 232 11
157, 158 11
189, 190 11
167, 168 11
207, 208 11
251, 252 11
213, 214 11
177, 178 11
187, 188 11
205, 206 11
211, 212 11
197, 198 11
209, 210 11
185, 186 11
229, 230 11
223, 224 11
179, 180 11
193, 194 11
173, 174 11
217, 218 11
153, 154 11
219, 220 11
183, 184 11
253, 254 11
199, 200 11
255, 256 11
155, 156 11
169, 170 11
195,196 11
215, 216 11
191, 192 11
175, 176 11
161, 162 11
221, 222 11
225, 226 11
163, 164 11
159, 160 11
233, 234 11
171, 172 11
203, 204 11
181, 182 11
227, 228 11
165, 166 11
257, 258 26
237, 238 30
241, 242 30
239, 240 30
245, 246 30
235, 236 30
313, 314 30
345, 346 10
321, 322 10
323, 324 10
315, 316 10
201, 202 10
265, 266 10
145, 146 10
287, 288 10
293, 294 10
351, 352 10
311, 312 10
279, 280 10
289, 290 10
283, 284 10
373, 374 10
337, 338 10
371, 372 10
291, 292 10
3, 4 10
307, 308 10
343, 344 10
349, 350 10
329, 330 10
355, 356 10
339, 340 10
295, 296 10
333, 334 10
281, 282 10
361, 362 10
347, 348 10
319, 320 10
357, 358 10
365, 366 10
273, 274 10
277, 278 10
271, 272 10
285, 286 10
259, 260 10
325, 326 10
331, 332 10
359, 360 10
303, 304 10
363, 364 10
305, 306 10
341, 342 10
375, 376 11
377, 378 11
379, 380 11
301, 302 11
309, 310 11
263, 264 11
269, 270 11
353, 354 11
299, 300 11
367, 368 11
261, 262 11
369, 370 11
267, 268 11
317, 318 11
297, 298 11
327, 328 5
275, 276 6
본 발명의 방법에 의해 초래된 하이브리드 폴리펩티드는 오리지날 효소에서는 나타나지 않던 특정화된 효소 활성을 보일 수 있다. 예컨대, 히드롤라제 활성을 코딩하는 폴리펩티드의 이하 재조합 및/또는 감소된 재분류는 결과적인 하이브리드 폴리뉴클레오티드에 의해 코딩되는 하이브리드 폴리펩티드가 오리지날 효소의 각각에서 얻어진 특정화된 히드롤라제 활성, 즉, 히드롤라제가 작용하는 결합의 유형및 히드롤라제가 작용하는 온도에 대해 스크리닝될 수 있다. 따라서, 예컨대, 히드롤라제는 오리지날 히드롤라제에서 하이브리드 히드롤라제를 구별하는 화학적 작용성, 예컨대, (a) 아미드(펩티드 결합), 즉, 자일라나제; (b) 에스터 결합, 즉, 에스터라제 및 리파아제; (c) 아세탈, 즉, 글리코시다제, 및 예컨대, 하이브리드 폴리펩티드가 작용하는 온도, pH 또는 염 농도을 확인하기 위해 스크리닝될 수 있다.
오리지날 폴리뉴클레오티드원은 개별적인 개체("분리체", 정의된 배지에서 성장하는 개체들의 집합체("강화 배양") 또는 배양되지 않은 개체("환경적 샘플")에서 분리될 수 있다. 환경 샘플에서 신규한 생활성을 코딩하는 폴리뉴클레오티드를 유도하는 배양-비의존적 접근법의 사용은 생체다양성을 갖는 자원들의 확인이 가능하므로 가장 바람직하다.
"환경적 라이브러리"는 환경적 샘플에서 발생되며, 적절한 원핵세포 숙주에서 증식될 수 있는 클로닝 벡터에서 얻어지는 천연적으로 발생하는 개체의 집합적 게놈을 대표한다. 클로닝된 DNA가 환경 샘플로부터 직접 초기에 추출되므로, 라이브러리는 순수 배양시 성장할 수 있는 원핵 세포의 적은 분획으로 제한되지 않는다. 부가적으로, 이들 샘플들에 존재하는 환경적 DNA의 정규화는 오리지날 샘플에 존재하는 모든 종들의 DNA의 더욱 동일한 대표를 가능케 한다. 이는 우성 종에 비해 여러 등급만큼 큰 대표될 수 있는 샘플의 소수 구성 유래의 흥미있는 유전자를 발견하는 효율을 극적으로 증가시킬 수 있다.
예컨대, 하나 이상의 배양되지 않은 미생물에서 발생된 유전자 라이브러리는 흥미있는 활성에 대해 스크리닝된다. 흥미있는 생활성 분자를 코딩하는 잠재적인경로는 유전자 발현 라이브러리의 형태로 원핵 세포내에서 먼저 캡쳐된다. 흥미있는 활성을 코딩하는 폴리뉴클레오티드는 이러한 라이브러리에서 분리되어, 숙주 세포로 도입된다. 숙주 세포는 재조합 및/또는 감소된 재분류를 촉진하여 신규하거나 강화된 활성을 갖는 잠재적으로 활성 있는 생체분자를 생성하는 조건 하에서 배양된다.
부가적으로, 서브클로닝은 흥미있는 서열의 추가적 분리를 위해 수행될 수 있다. 서브클로닝시, 일부분의 DNA는 증폭, 일반적으로 제한 효소에 의해 분해되어 소정의 서열을 절단하며, 소정의 서열은 수용 벡터에 결찰되어 증폭된다. 서브클로닝시 각각의 단계에서, 일부분은 구조적 단백질을 코딩하는 DNA가 배제되지 않았는지를 확인하기 위해, 흥미있는 활성에 대해 조사된다. 결찰부는 서브클로닝의 각 단계마다, 예컨대, 겔 전기영동에 의해 벡터로 결찰되기 이전에 정제될 수 있으며, 수용 벡터를 함유하는 세포 및 수용 벡터를 함유하지 않은 세포는 예컨대, 수용 벡터를 함유하지 않는 세포를 죽이는 항생제를 함유하는 선택적 배지에 둔다. cDNA 결찰부를 벡터에 서브클로닝하는 방법은 본 기술 분야에 잘 알려져 있다(Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press (1989)). 다른 양태에서, 본 발명의 효소는 서브클론이다. 이러한 서브클론은 예컨대, 길이, 돌연변이, 태그 또는 표지에 있어 모 클론과 상이할 수 있다.
한 양태에서, 본 발명의 신호 서열은 이하 신규한 자일라나제 폴리펩티드를 확인하기 위해 사용된다. 단백질이 분류되고 이들의 적절한 위치로 이동되는 경로를 종종 단백질 표적화 경로로 언급된다. 이들 표적화 시스템의 모두에서 가장 중요한 요소들 중 하나는 신호 서열이라고 불리우는 새로 합성된 폴리펩티드의 아미노 말단의 짧은 아미노산 서열이다. 이 신호 서열은 단백질이 세포 내에서 적절한 위치로 이동되도록 하고, 이의 최종 목적지에 도달한 경우 또는는 전송 과정 중에 제거된다. 대부분의 라이소조말, 멤브레인 또는 분비 단백질은 소포체의 루멘으로 위치시켜주는 아미노 말단 신호 서열을 가진다. 이 군의 단백질의 100개 이상의 신호 서열이 결정되었다. 신호 서열은 13 내지 36개의 아미노산 잔기의 길이로 다양할 수 있다. 신호 서열의 다양한 인식 방법은 본 기술 분야의 당업자에게 공지되어 있다. 한 양태에서, 신규한 자일라나제 신호 펩티드는 SignalP라고 언급되는 방법에 의해 확인된다. SignalP는 신호 펩티드 및 이들의 절단 부위 모두를 인식하는 조합된 신경 네트워크를 사용한다. 예컨대, [Nielsen, et al.,"Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites. "Protein Engineering, vol. 10, no. 1, p. 1-6 (1997)]를 참조하라. 본 발명의 자일라나제의 일부는 신호 서열을 함유하거나 함유하지 않을 수 있다는 것을 이해해야만 한다. 상이한 자일라나제의 핵산 서열에 작동적으로 연결된 하나의 자일라나제 유래의 신호 서열을 코딩하는 핵산 서열, 또는 임의적으로 바람직할 수 있는 비자일라나제 단백질 유래의 신호 서열을 포함하는 것이 바람직할 수 있다.
폴리뉴클레오티드가 준비될 수 있는 미생물에는 원핵세포 미생물, 예컨대, 유박테리아(Eubacteria) 및 아케박테리아(Archaebacteria), 및 하등 진핵세포 미생물, 예컨대, 진균, 일부 조류 및 원생동물이 포함된다. 폴리뉴클레오티드는 핵산이하나 이상의 배양된 개체로부터 회수되거나 개체의 배양없이 회수될 수 있는 경우에는 환경 샘플에서 분리될 수 있다. 한 양태에서, 이러한 미생물은 익스트리모파일, 예컨대, 하이퍼써모파일, 사이크로파일, 사이크로트로프, 할로파일, 바로파일 및 아시도파일일 수 있다. 익스티리모파일 미생물에서 분리된 효소를 코딩하는 폴리뉴클레오티드가 사용될 수 있다. 이러한 효소는 지질 온천 및 심해 열공에서의 100℃ 이상의 온도 및 북극 물에서의 0℃ 이하, 사해의 포화된 염 환경, 석탄 매장 및 기하열 황 풍부 온천에서의 0에 까까운 pH 값, 또는 오수 슬러지의 11 이상의 pH 값에서도 작용할 수 있다. 예컨대, 익스트리모파일 개체에서 클로닝되고 발현된 여러 에스터라제 및 리파아제는 광범위한 온도 및 pH에 걸쳐 높은 활성을 나타낸다.
전술된 바와 같이 선별 및 분리된 폴리뉴클레오티드는 적절한 숙주 세포에 도입된다. 적절한 숙주 세포는 재조합 및/또는 감소된 재분류를 촉진할 수 있는 어떠한 세포이다. 선택된 폴리뉴클레오티드는 적절한 조절 서열을 포함하는 벡터에 이미 존재하는 것이 바람직하다. 숙주 세포는 고등 진핵 세포, 예컨대, 포유동물 세포, 또는 하등 진핵 세포, 예컨대, 효모 세포일 수 있으며, 또는 바람직하게는 원핵 세포, 예컨대, 박테리아 세포인 것이 바람직하다. 작제물의 숙주 세포로의 도입은 인산 칼슘 형질감염, DEAE-덱스트란 매개된 형질감염, 또는 전기충격이 효과적일 수 있다(Davis et al., 1986).
적절한 숙주의 대표적인 예로서, 이하가 언급될 수 있다: 박테리아 세포, 예컨대, 대장균(E.coli), 스트렙토마이세스(Streptomyces), 살모넬라 티피무리엄(Salmonella typhimurium); 진균 세포, 예컨대, 효모; 곤충 세포, 예컨대, 드로소필라(Drosophila)S2및 스포돕테라(Spodoptera)Sf9; 동물 세포, 예컨대, CHO, COS 또는 보웨스 멜라노마(Bowes melanoma); 아데노바이러스; 및 식물 세포. 적절한 숙주의 선별은 본 명세서에 나타낸 사항으로부터 본 기술 분야의 당업자의 범위 이내에서 예정된다.
재조합 단백질을 발현하는 데 사용될 수 있는 다양한 포유동물 세포 배양 시스템에 관해서는, 포유동물 발현 시스템의 예에는 "SV40-transformed simian cells support the replication of earlySV40 mutants"(Gluzman,1981)에 서술된 원숭이 신장 선유아세포에서 유래된 COS-7 세포주, 및 양립가능한 벡터를 발현할 수 있는 기타 세포주, 예컨대, C127, 3T3, CHO, HeLa 및 BHK 세포주가 포함된다. 포유동물 발현 벡터는 복제 오리진, 적절한 프로모터 및 인헨서, 또한 필요한 리보좀 결합 부위, 폴리아데닐화 부위, 스플라이스 도너 및 어셉터 부위, 전사 종결 서열 및 5' 플랭킹 비전사 서열을 포함할 것이다. SV40 스플라이싱 및 폴리아데닐화 부위로부터 유래된 DNA 서열은 요구되는 비전사된 유전 요소를 제공하는 데 사용될 수 있다.
다른 양태에서, 본 발명의 방법은 하나 이상의 오페론 또는 유전자 다발 또는 이들의 일부분 유래의 생화학적 경로를 코딩하는 신규한 폴리뉴클레오티드를 생성하는 데 사용될 수 있음이 증명된다. 예컨대, 박테리아 및 여러 원핵 세포는 유전자의 산물이 관련된 과정에 포함되는 유전자를 조절하는 통합된 메카니즘을 가지고 있다. 유전자는 단일 염색체 상에 "유전자 다발"이라고 불리우는 구조로 다발져있으며, 전체 다발의 전사를 개시하는 단일 프로모터를 포함하는 단일 조절 서열의 조절 하에 함께 전사된다. 따라서, 유전자 다발은 일반적으로 이들의 기능이 동일하거나 관련된, 인접한 유전자의 군으로 존재한다. 유전자 다발에 의해 코딩되는 생화학적 경로의 예는 폴리케티드이다.
유전자 다발 DNA는 상이한 개체에서 분리되어, 벡터에 결찰될 수 있으며, 특히, 결찰된 유전자 다발 유래의 검출가능한 단백질 또는 단백질-관련된 정렬 활성의 생산을 조절 및 통제할 수 있는 발현 조절 서열을 함유하는 벡터에 결찰되는 것이 바람직하다. 예외적으로 매우 큰 외인성 DNA 도입이 가능한 벡터의 사용은 특히 이러한 유전자 다발에 사용하기 적절하며, 본 명세서에 서술된 예시 수단에 의해 서술되며, 대장균의 f-인자(또는 수정 인자)를 포함한다. 대장균의 f-인자는 콘주게이션 동안 이 인자 자체의 고빈도의 전이에 영향을 주는 플라스미드이며, 혼합된 미생물 샘플에서 유전자 다발과 같은 큰 DNA 단편을 안정하게 증식시키며 이를 얻는 데 이상적이다. 본 발명의 한 양태는 "포스미드"로 언급되는 클로닝 벡터 및 박테리아 인공 염색체(BAC) 벡터를 사용한다. 이들은 게놈 DNA의 큰 단편이 안정적으로 삽입가능한 대장균 f-인자에서 유래된 것이다. 혼합된 배양되지 않은 환경 샘플 유래의 DNA가 삽입시, 이는 안정한 "환경적 DNA 라이브러리"의 형태로 큰 게놈 단편을 얻는 것을 가능하게 한다. 본 발명에 사용되는 다른 유형의 벡터는 코스미드 벡터이다. 코스미드 벡터는 게놈 DNA의 큰 단편을 증식 및 클로닝하도록 최초에 디자인되었다. 코스미드 벡터로의 클로닝은 [Sambrook et al., Molecular Cloning : A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press (1989)]에서술되어 있다. 적절한 벡터에 결찰된 후, 상이한 폴리케티드 신테타제 유전자 다발을 함유하고 있는 2개 이상의 벡터들은 적절한 숙주 세포에 도입될 수 있다. 유전자 다발에 의해 공여되는 부분적 서열 상동상 부위는 하이브리드 유전자 다발에서 초래되는 서열 재구성을 초래하는 과정을 촉진할 것이다. 그 후, 신규한 하이브리드 유전자 다발은 오리지날 유전자 다발에서 발견되지 않는 증강된 활성에 대해 스크리닝된다.
따라서, 한 양태에서, 본 발명은 하기 단계들에 의해, 생물학적으로 활성 있는 하이브리드 폴리펩티드를 제조하는 방법 및 강화된 활성을 갖는 폴리펩티드를 스크리닝 하는 방법에 관한 것이다:
1) 작동적으로 연결된 적어도 제1 폴리뉴클레오티드 및 작동적으로 연결된 제2 폴리뉴클레오티드를 적절한 숙주 세포에 도입하는 단계로서, 적어도 제1 폴리뉴클레오티드 및 제2 폴리뉴클레오티드는 적어도 한 부분의 부분적 서열 상동성을 공여하는 것인 단계;
2) 상기 숙주 세포를 서열 재구성을 촉진하는 조건 하에서 배양하여, 작동적으로 연결된 하이브리드 폴리뉴클레오티드를 초래하는 단계;
3) 상기 하이브리드 폴리뉴클레오티드에 의해 코딩되는 하이브리드 폴리펩티드를 발현하는 단계;
4) 강화된 생물학적 활성의 확인을 촉진하는 조건 하에서 상기 하이브리드 폴리펩티드를 스크리닝하는 단계; 및
5) 상기 하이브리드 폴리펩티드를 코딩하는 폴리뉴클레오티드를 분리하는 단계.
다양한 효소 활성을 스크리닝하는 방법은 본 기술 분야의 당업자에게 공지되어 있으며, 본 명세서를 통해 서술되어 있다. 이러한 방법은 본 발명의 폴리펩티드 및 폴리뉴클레오티드의 분리시 사용될 수 있다.
스크리닝 방법론 및 "온라인" 모니터링 장치
본 발명의 방법 수행시, 다양한 장치 및 방법론이 예컨대, 자일라나제 활성을 갖는 폴리펩티드를 스크리닝하기 위해(예, 자이모그람에서 카제인 가수분해, 젤라틴에서 형광물질의 방출, 또는 다양한 작은 펩티드 기질에서 p-니트로아날리드의 방출과 같은 분석법), 자일라나제 활성의 잠재적 조절자(예, 활성제 또는 저해제)인 화합물을 스크리닝하기 위해, 본 발명의 폴리펩티드에 결합하는 항체를 스크리닝하기 위해, 본 발명의 핵산에 하이브리드화되는 핵산을 스크리닝하기 위해, 본 발명의 폴리펩티드를 발현하는 세포를 스크리닝하기 위해, 본 발명의 폴리펩티드 및 핵산과 함께 사용될 수 있다. 이하 샘플링에 대해 상세히 서술된 어레이 포멧에 덧붙여, 선택적인 포멧 또한 본 발명의 방법을 실행하는 데 사용될 수 있다. 이러한 포멧에는 예컨대, 매스 스펙트로미터, 크로마토그패프, 예컨대, 고-트루풋 HPLC 및 기타 액체 크로마토그래피의 형태가 포함되며, 더 작은 포멧에는 예컨대, 1536-웰 플레이트, 384-웰 플레이드 등이 포함된다. 하이 트루풋 스크리닝 장치는 본 발명의 방법의 실행에 사용되며 적용될 수 있다. 예컨대, 미국 특허 출원 제20020001809호를 참조하라.
모세관 어레이
본 발명의 핵산 및 폴리펩티드는 어레이에 고정화 되거나 어레이에 적용될 수 있다. 어레이는 본 발명의 핵산 또는 폴리펩티드의 활성을 조절하기 위해 또는 이에 결합하여 이들의 활성을 갖는 조성물(예, 소분자, 항체, 핵산 등)의 라이브러리를 모니터링하거나 스크리닝하는 데 사용된다. 모세관 어레이, 예컨대, GIGAMATRIXTM( Diversa Corporation, San Diego, CA) 및 예컨대, 미국 특허 출원 제20020080350호 Al; WO 0231203 A; WO 0244336 A에 서술된 어레이는 샘플을 유지 및 스크리닝하는 선택적 장치를 제공한다. 한 양태에서, 모세관 어레이는 인접한 모세관의 어레이에 형성된 다수의 모세관을 포함하며, 이 때, 각각의 모세관은 샘플을 보유하는 루멘으로 정의되는 적어도 하나의 벽을 포함한다. 벽이 액체 또는 샘플의 보유를 위해 루멘을 형성하는 한, 루멘은 원통, 구형, 헥사고날형 또는 어떠한 기타 기하학적 형태일 수 있다. 모세관 어레이의 모세관은 매우 근접하게 함께 위치하여 평면 구조를 형성할 수 있다. 모세관은 면끼리 융합(예, 모세관이 유리로 제조됨), 글루, 결합 또는 클램프함으로써, 함께 결합될 수 있다. 부가적으로, 모세관 어레이는 어레이내 인접한 모세관 등 사이에 놓여진 간극 물질을 포함할 수 있으며, 이에 따라 다수의 트루-홀을 함유하는 고체 평면 장치를 형성한다.
모세관 어레이는 예컨대, 100 내지 4,000,000개의 모세관들의 범위인 어떠한 수의 개별적인 모세관들로 형성될 수 있다. 추가적으로, 약 100,000 또는 그 이상의 개별적인 모세관을 가진 모세관 어레이는 표준 실험실 장비에 피트되는 Microtiter?플레이트의 표준 크기 및 형태로 형성될 수 있다. 루멘은 얇은 바늘을사용한 미세주입 또는 모세관 작용을 사용하여 자동적으로 또는 수동적으로 충전된다. 흥미있는 샘플은 그 후 추가 분석 또는 특징화를 위해 개별적인 모세관에서 제거될 수 있다. 예컨대, 얇은, 바늘 유사 프로브는 선택된 모세관과 함께 유체 연통적으로 위치하여, 루멘으로부터 물질을 첨가하거나 철회시킨다.
단일-포트 스크리닝 분석법에서, 이 분석 성분은 모세관 어레이에 삽입되기 이전에 혼합되어 흥미있는 용액을 초래한다. 루멘은 적어도 일부분의 어레이가 흥미있는 용액에 함침되는 경우 모세관 작용으로 충전된다. 각각의 모세관에서의 화학적 또는 생물학적 반응 및/또는 활성은 검출가능한 경우 모니터링된다. 검출가능하다는 것은 종종 "힛트"로 언급되며, 이는 광학 검출에 의해 모세관을 생성하는 "비-힛트"와 일반적으로 구분될 수 있다. 따라서, 모세관 어레이는 "힛트"의 묵중하게 평행인 검출을 가능케 한다.
다중-포트 스크리닝 분석법에서, 폴리펩티드 또는 핵산, 예컨대, 리간드는 제1 성분에 도입될 수 있으며, 이는 모세관 어레이의 적어도 일부분의 모세관에 도입된다. 공기 버블은 그 후 제1 성분 뒤의 모세관으로 도입될 수 있다. 제2 성분은 그 후 모세관으로 도입될 수 있으며, 여기서 제2 성분이 제1 성분과 공기 버블에 의해 분리된다. 제1 및 제2 성분은 그 후 모세관 어레이의 버블과 충돌하도록 양 측면에 히드로스태틱 압력을 가함으로써 혼합될 수 있다. 모세관 어레이는 그 후 검출 가능한 것에 대해 모니터링되고, 두 성분들의 반응 또는 비반응의 결과를 낳는다.
결합 스크리닝 분석법에서, 흥미있는 샘플은 검출가능한 입자로 표지된 제1액체로서 모세관 어레이의 모세관에 도입될 수 있으며, 이 때, 모세관의 루멘은 검출 가능한 입자를 루멘에 결합시키는 결합 물질로 코팅된다. 그 후, 제1 액체는 모세관 튜브에서 제거될 수 있으며, 이 때, 결합된 검출 가능한 입자는 모세관 이내에 유지되고, 제2 액체는 모세관 튜브에 도입될 수 있다. 그 후, 모세관은 검출 가능한 것에 대해 모니터링되고, 입자의 제2 액체와의 반응 또는 비반응의 결과를 낳는다.
어레이 또는 "바이오칩"
본 발명의 핵산 또는 폴리펩티드는 어레이에 고정화되거나 또는 어레이에 적용된다. 어레이는 본 발명의 핵산 또는 폴리펩티드의 활성을 조절하기 위해 또는 이에 결합하여 이들의 활성을 갖는 조성물(예, 소분자, 항체, 핵산 등)의 라이브러리를 모니터링하거나 스크리닝하는 데 사용된다. 예컨대, 본 발명의 한 양태에서, 모니터링된 변수는 자일라나제 유전자의 전사 활성이다. 하나 이상의 또는 모든 세포의 전사체는 세포의 전사체, 또는 세포의 전사체를 대표하거나 이에 상보적인 핵산을 포함하는 샘플을 하이브리드화함으로써 측정될 수 있거나, 또는 어레이 또는 "바이오칩" 상에 고정화된 핵산을 하이브르드화 함으로써 측정될 수 있다. 마이크로칩 상의 핵산의 "어레이"를 사용함으로써, 일부 또는 모두의 세포의 전사체들은 동시에 분석된다. 선택적으로, 게놈 핵산을 포함하는 어레이는 또한 본 발명의 방법에 의해 제조된 새로 가공된 균주의 유전자형을 결정하는 데 사용될 수 있다. "폴리펩티드 어레이"는 또한 다수의 단백질을 동시에 분석하는 데 사용될 수 있다. 본 발명은 어떠한 공지된 "어레이"(또한 "마이크로어레이" 또는 "핵산 어레이" 또는 "폴리펩티드 어레이" 또는 "항체 어레이" 또는 "바이오칩"으로 알려짐) 또는 이들의 변형체로 수행될 수 있다. 어레이는 다수의 "스팟" 또는 "표적 성분"을 가지며, 각각의 표적 성분은 샘플 분자, 예컨대, mRNA 전사체에 특이적으로 결합하는 기질 표면의 정의된 면적 상에 고정된, 정의된 양의 하나 이상의 생물학적 분자, 예컨대, 올리고뉴클레오티드를 포함한다.
본 발명의 방법 시행시, 어떠한 공지된 어레이 및/또는 어레이를 사용 및 제조하는 방법 또는 이들의 변형체들이 전체적으로 또는 부분적으로 통합될 수 있으며, 이는 예컨대, 미국 특허 제6,277,628호; 제6,277,489호; 제6,261,776호; 제6,258,606호; 제6,054,270호; 제6,048,695호; 제6,045,996호; 제6,022,963호; 제6,013,440호; 제5,965,452호; 제5,959,098호; 제5,856,174호; 제5,830,645호; 제5,770,456호; 제5,632,957호; 제5,556,752호; 제5,143,854호; 제5,807,522호; 제5,800,992호; 제5,744,305호; 제5,700,637호; 제5,556,752호; 제5,434,049호에 서술되어 있다. 또한, 예컨대, WO 99/51773; WO 99/09217; WO 97/46313; WO 96/17958을 참조하라. 또한 예컨대, [Johnston (1998) Curr. Biol.8 :R171-R174; Schummer (1997) Biotechniques 23: 1087-1092; Kern (1997) Biotechniques 23: 120-124; Solinas-Toldo (1997) Genes, Chromosomes & Cancer 20: 399-407; Bowtell (1999) Nature Genetics Supp. 21: 25-32]를 참조하라. 또한, 공개된 미국 특허 출원 제20010018642호; 제20010019827호; 제20010016322호; 제20010014449호; 제20010014448호; 제20010012537호; 제20010008765호를 참조하라.
항체 및 항체에 기초한 스크리닝 방법
본 발명은 본 발명의 자일라나제에 특이적으로 결합하는 분리되거나 또는 재조합된 항체를 제공한다. 이들 항체들은 본 발명의 자일라나제 또는 관련된 폴리펩티드의 분리, 확인 또는 정량화에 사용된다. 이들 항체들은 본 발명의 범위 이내인 기타 폴리펩티드 또는 기타 관련된 자일라나제를 분리하는 데 사용될 수 있다. 항체는 자일라나제의 활성 부위에 결합하도록 디자인 될 수 있다. 따라서, 본 발명은 본 발명의 항체들을 사용하여, 자일라나제를 저해하는 방법을 제공한다(본 발명의 항-자일라나제 조성에 대한 상기 서술을 참조).
본 발명은 본 발명의 폴리펩티드의 면역적 단편을 포함하여 본 발명의 효소의 단편을 제공한다. 본 발명은 본 발명의 폴리펩티드 또는 펩티드 및 어주번트 또는 담체 등을 포함하는 조성물을 제공한다.
항체는 면역침전, 염색, 면역친화성 컬럼 등에 사용될 수 있다. 소정의 경우, 특정 항원을 코딩하는 핵산 서열은 폴리펩티드 또는 핵산을 분리하고, 증폭 또는 클로닝한 후, 폴리펩티드를 본 발명의 어레이 상에 고정함으로써 면역화되어 발생될 수 있다. 선택적으로, 본 발명의 방법은 개질될 세포에 의해 생산되는 항체의 구조를 변형시키는 데 사용될 수 있으며, 예컨대, 항체의 친화도는 증가 또는 감소될 수 있다. 더욱이, 항체를 개질 또는 제조하는 능력은 본 발명의 방법에 의해 세포로 가공된 표현형일 수 있다.
면역화, 항체의 생산 및 분리 방법(폴리클로날 및 모노클로날)은 본 기술 분야의 당업자에게 공지되어 있으며, 과학 및 특허 문헌에 서술되어 있다. 예컨대, [Coligan, CURRENT PROTOCOLS IN IMMUNOLOGY, Wiley/Greene, NY(1991); Stites(eds. ) BASIC AND CLINICAL IMMUNOLOGY (7th ed. ) Lange Medical Publications, Los Altos, CA ("Stites"); Goding, MONOCLONAL ANTIBODIES : PRINCIPLES AND PRACTICE (2d ed. ) Academic Press, New York, NY (1986); Kohler (1975) Nature 256: 495; Harlow(1988) ANTIBODIES, A LABORATORY MANUAL, Cold Spring Harbor Publications, New York]를 참조하라. 항체는 또한 동물을 사용한 전통적인 생체내 방법에 덧붙여, 예컨대, 파아지 디스플레이 라이브러리가 발현하는 재조합 항체 결합 부위를 사용하여, 시험관내에서 발생될 수 있다. 예컨대, [Hoogenboom (1997) Trends Biotechnol. 15: 62-70; Katz (1997) Annu. Rev. Biophys. Biomol. Struct. 26: 27-45]를 참조하라.
B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 이들의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속적 아미노산을 포함하는 단편은 또한 폴리펩티드 또는 단편에 특이적으로 결합하는 항체를 생성하는 데 사용될 수 있다. 결과적인 항체는 면역친화성 크로마토그래피 과정에서 사용되어, 폴리펩티드를 분리 또는 정제하거나, 또는 생물학적 샘플내에 폴리펩티드가 존재하는지의 여부를 결정할 수 있다. 이러한 과정에서, 단백질 제제, 예컨대, 추출물 또는 생물학적 샘플은 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 이들의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속적 아미노산을 포함하는 단편 중 하나에 특이적으로 결합할 수 있는 항체와 접촉한다.
면역친화성 과정에서, 항체는 고체 지지체, 예컨대, 비드 또는 기타 컬럼 매트릭스에 부착한다. 단백질 제제는 항체가 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 이들의 단편 중 하나에 특이적으로 결합하는 조건하에서 항체와 접촉된다. 세척하여 비 특이적으로 결합된 단백질을 제거한 후, 특이적으로 결합된 폴리펩티드를 용출한다.
항체에 결합하는 생물학적 샘플내 단백질의 능력은 본 기술 분야의 당업자에게 공지된 다양한 과정들 중 어떤 것을 사용하여 결정될 수 있다. 예컨대, 결합은 형광제, 효소적 표지 또는 방사성동위원소와 같은 검출 가능한 표지로 항체를 표지함으로써 결정될 수 있다. 선택적으로, 항체의 샘플로의 결합은 검출가능한 표지를 갖는 제2 항체를 사용하여 검출될 수 있다. 특정 분석법에는 ELISA 분석법, 샌드위치 분석법, 방사면역분석법 및 웨스턴 블롯이 포함된다.
B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 이들의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속적 아미노산을 포함하는 단편에 대해 발생된 폴리클로날 항체는 동물, 예컨대, 비인간에게 폴리펩티드를 투여함으로써, 또는 동물에게 폴리펩티드를 직접 주입함으로써 얻어질 수 있다. 이렇게 얻어진 항체는 그 후, 폴리펩티드 그 자체에 결합할 것이다. 이 방식으로, 폴리펩티드의 단편만을 코딩하는 서열 조차도 전체 천연 폴리펩티드에 결합할 수 있는 항체를 생성하는 데 사용될 수 있다. 이러한 항체들은 그 후 폴리펩티드를 발현하는 세포로부터 폴리펩티드를 분리하는 데 사용될 수 있다.
모노클로날 항체의 제조를 위해, 연속적 세포주 배양에 의해 생산되는 항체를 제공하는 어떠한 기술들이 사용될 수 있다. 예로는 하이브리도마 기술(Kohlerand Milstein, Nature, 256: 495-497,1975), 트리오마 기술, 인간 B-세포 하이브리도마 기술(Kozbor et al., Immunology Today 4: 72, 1983) 및 EBV-하이브리도마 기술(Cole, et al., 1985, in Monoclonal Antibodies and Cancer Therapy, Alan R. Liss, Inc., pp. 77-96)을 들 수 있다.
단일 사슬 항체의 제조에 대해 서술한 기술(미국 특허 제4,946,778호)은 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 이들의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속적 아미노산을 포함하는 단편에 대한 단일 사슬 항체를 제조하는 데 적용될 수 있다.
B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 이들의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속적 아미노산을 포함하는 단편에 대해 발생된 항체들은 기타 개체 및 샘플 유래의 유사한 폴리펩티드를 스크리닝하는 데 사용될 수 있다. 이러한 기술에서, 개체의 폴리펩티드는 항체와 접촉되며, 항체에 특이적으로 결합하는 폴리펩티드가 검출된다. 전술된 과정들 중 어떠한 것도 항체 결합을 검출하는 데 사용될 수 있다. 이러한 스크리닝 분석법 중 하나는 문헌[참조: "Methods for Measuring Cellulase Activities", Methods in Enzymology, Vol 160, pp. 87-116]에 서술되어 있다.
키트
본 발명은 이하의 성분, 예컨대, 핵산, 발현 카세트, 벡터, 세포, 유전자전이 종자 또는 식물 또는 식물의 부분, 폴리펩티드 (예컨대, 자일라나제) 및/또는 본 발명의 항체를 포함하는 키트를 제공한다. 키트는 또한 사용 방법 및 본원에 기재된 본 발명의 산업상 용도를 안내하는 설명서를 포함할 수 있다.
전체 세포 조작 및 대사 파라미터의 측정
본 발명의 방법은, 세포의 유전자 조성을 변형시킴으로써, 신규한 표현형, 예컨대, 신규하거나 또는 변형된 자일라나제 활성을 갖는 신규한 세포 스트레인으로의 세포의 전체 세포 진화, 또는 전체 세포 조작을 제공한다. 유전자 조성은 본 발명의 핵산, 예컨대, 본 발명의 효소에 대한 암호화 서열을 세포에 첨가함으로써 변형될 수 있다. 예컨대, W00229032; W00196551 참조.
신규한 표현형을 검출하기 위해, 변형된 세포의 1 이상의 파라미터가 세포에서 "실시간"으로 또는 "온라인" 시간 프레임으로 모니터링된다. 하나의 양태에서, 세포 배양물과 같은 복수의 세포가 "실시간"으로 또는 "온라인"으로 모니터링된다. 하나의 양태에서, 복수의 대사 파라미터가 "실시간"으로 또는 "온라인"으로 모니터링된다. 대사 파라미터는 본 발명의 자일라나제를 사용하여 모니터링될 수 있다.
대사 플럭스 분석 (MFA)은 공지의 생화학 프레임워크를 기초로 한다. 세포내 대사체에 대한 질량 보존의 법칙 및 유사-정상 상태 가설 (PSSH)를 기초로 선형 독립 대사 매트릭스가 구축되었다. 본 발명의 방법을 수행하는데 있어, 다음과 같은 대사 네트워트가 확립되었다:
모든 경로 기질, 생성물 및 중간 대사체의 확인
경로 대사체를 상호변환시키는 모든 화학 반응, 경로 반응의 화학양론의 확인,
반응을 촉매하는 모든 효소, 효소 반응 동력학의 확인,
경로 성분 사이의 조절성 상호작용, 예컨대 알로스테릭 상호작용, 효소-효소 상호작용 등,
효소 또는 다른 효소의 거대분자성 조직의 세포내 구획, 그리고,
대사체, 효소 또는 이펙터(effector) 분자 또는 그들의 운동에 대한 확산 장벽(diffusion barriers) 중에 임의의 농도 구배의 존재.
주어진 스트레인에 대해 일단 대사 네트워크가 구축되고, 만약 온라인 메타볼롬(metabolome) 데이타가 유용하다면, 매트릭스 개념으로 수학적 소개가 세포간 대사 플럭스를 추정하는데 도입될 수 있다. 대사 표현형은 세포 안에서 전체 대사 네트워크의 변화에 의존적이다. 대사 표현형은 환경적 조건, 유전자적 조절, 발달 상태 및 유전자형, 등에 관해서 경로 활용의 변화에 의존적이다. 본 발명의 방법의 하나의 양태에서, 온라인 MFA 계산 이후, 세포의 다이나믹 행동, 그들의 표현형 및 다른 성질이 경로 활용을 조사함으로써 분석된다. 예컨대, 만약 효모 발효 동안 글루코스 공급이 증가하고 그리고 산소가 감소한다면, 호흡 경로의 활용이 감소 및/또는 정지하게 될 것이며, 발효 경로의 활용이 우세하게 될 것이다. 세포 배양물의 생리적 조절은 경로 분석 이후 가능하게 될 것이다. 본 발명의 방법은, 바람직한 방향을 따라 이동하는 세포의 생리적 상태를 조절하기 위해, 기질 공급, 온도, 인듀서의 사용 등이 어떻게 변화하는지 측정함으로써 발효를 어떻게 조작하는지 측정하는 것을 도울 수 있다. 본 발명의 방법을 수행함에 있어, MFA 결과는, 대사성 조작 또는 유전자 셔플링(shuffling) 등에 대한 실험 및 프로토콜을 디자인하기 위해 트랜스크립톰(transcriptome) 및 프로테옴(proteome) 데이타와 또한 비교될 수 있다.
본 발명의 방법을 수행하는데 있어, 임의의 변형되거나 또는 신규한 표현형이 언급되고 검출될 수 있으며, 이는 세포의 신규하거나 또는 향상된 특성을 포함한다. 대사 또는 성장의 어떤 양태라도 모니터링될 수 있다.
mRNA 전사체의 발현 모니터링
본 발명의 하나의 양태에서, 조작된 표현형은 mRNA 전사체 (예컨대, 자일라나제 메세지)의 발현을 증가시키거나 또는 감소시키는 것 또는 세포에서 신규한 (예컨대, 자일라나제) 전사체를 발생시키는 것을 포함한다. 이 증가되거나 또는 감소된 발현은 본 발명의 자일라나제의 존재에 대해 테스트함으로써 또는 자일라나제 활성 분석으로 추적될 수 있다. mRNA 전사체, 또는 메세지는, 또한 예컨대, 노던 블랏(Northern blots), 정량적 증폭 반응, 배열에 대한 혼성, 등을 포함하는 본 기술 분야에서 공지된 임의의 방법으로 검출되고 정량화될 수 있다. 정량적 증폭 반응은, 예컨대, 정량적 역전사 폴리머라제 체인 반응, 또는 RT-PCR을 포함하는 정량적 PCR; 정량적 실시간 RT-PCR, 또는 "실시간 동력학적 RT-PCR"을 포함한다 (예컨대, Kreuzer (2001) Br. J. Haematol. 114: 313-318; Xia (2001) Transplantation 72: 907-914 참조).
본 발명의 하나의 양태에서, 조작된 표현형이 상동 유전자의 넉 아웃(knocking out) 발현에 의해 발생된다. 유전자의 암호화 서열 또는 1 또는 그 이상의 전사 제어 성분, 예컨대, 프로모터 또는 인핸서가 넉 아웃될 수 있다. 따라서, 전사체의 발현은 완전히 제거되거나 또는 단지 감소될 수 있다.
본 발명의 하나의 양태에서, 조작된 표현형은 상동 유전자의 발현의 증가를 포함한다. 이는, 시스- 또는 트랜스-로 작용하는 전사 조절 성분을 포함하거나, 또는, 파지티브 제어 성분을 돌연변이화시키는 네가티브 제어 성분을 넉 아웃시킴으로써 영향을 받을 수 있다. 1 또는 그 이상, 또는 세포의 모든 전사체가 세포의 전사체를 포함하는 시료, 또는, 대표적인 또는 세포의 전사체에 상보적인 핵산의 혼성에 의해, 배열 상에 부동화된 핵산에 대한 혼성으로 측정될 수 있다.
폴리펩티드, 펩티드 및 아미노산의 발현 모니터링
본 발명의 하니의 양태에서, 조작된 표현형은 세포에서 폴리켑티드 (예컨대, 자일라나제)의 발현을 증가시키거나 또는 감소시키는 것 또는 새로운 폴리펩티드를 발생시키는 것을 포함한다. 이 증가되거나 또는 감소된 발현은 본 발명의 자일라나제 함량을 측정함으로써 또는 자일라나제 활성 분석에 의해 추적될 수 있다. 폴리펩티드, 펩티드 및 아미노산은 또한, 예컨대, 핵 자기 공명 (NMR), 분광학, 방사선사진법 (단백질 방사선 라벨링), 전기영동, 모세관 전기영동, 고성능 액체 크로마토그래피 (HPLC), 박층 크로마토그래피 (TLC), 초과 확산 크로마토그래피, 다양한 면역학적 방법, 예컨대 면역 침전, 면역 확산, 면역-전기영동, 방사선 면역 분석 (RIAs), 효소-결합 면역 흡착 분석 (ELISAs), 면역-형광 분석, 젤 전기영동 (예컨대, SDS-PAGE), 항체에 의한 스테이닝, 형광 활성화 세포 분류기 (FACS), 열분해 질량 분광학, 푸리에-전이 적외선 분광학, 라만 분광학, GC-MS, 및 LC-전기분무 및 캡-LC-탠덤-전기분무 질량 분광학, 등을 포함하는 본 기술분야에서 공지된 임의의 방법으로 검출되고 정량화될 수 있다. 또한 새로운 생체활성이 미국 특허6,057,103에 기재된 방법, 또는 그것의 변형을 사용하여 스크리닝될 수 있다. 게다가, 이하에 상세히 기재된 바와 같이, 1 또는 그 이상, 또는, 세포의 모든 폴리펩티드가 단백질 배열을 사용하여 측정될 수 있다.
산업상 응용
본 발명의 자일라나제 효소는 촉매에 상당히 선택적일 수 있다. 그들은 종래의 합성 화학과 견줄데 없는 정교한 입체-선택성, 위치-선택성 및 화학-선택성으로 반응을 촉매화할 수 있다. 게다가, 효소는 현저하게 다재다능하다. 본 발명의 자일라나제 효소는, 유기 용매에서 작용하고, 극단적인 pH (예컨대, 높은 pH 및 낮은 pH) 극단적인 온도 (예컨대, 고온 및 저온), 극단적인 염도 레벨 (예컨대, 고염도 및 저염도)에서 작동하고 그리고 그들의 자연적, 생리학적 기질과 구조적으로 무관한 화합물들과의 반응을 촉매하도록 맞춤될 수 있다.
세정 조성물
본 발명은 1 또는 그 이상의 본 발명의 폴리펩티드 (예컨대, 자일라나제)를 포함하는 세정 조성물, 및 이들 조성물의 제조 및 사용 방법을 제공한다. 본 발명은 세정 조성물의 모든 제조 및 사용 방법을 포함한다, 예컨대, 미국 특허 6,413,928; 6,399,561; 6,365,561; 6,380,147 참조. 세정 조성물은 1 및 2 부 수성 조성물, 비수성 액체 조성물, 캐스트 고체, 과립형, 소립자형, 압축 정제, 젤 및/또는 페이스트 및 슬러리형일 수 있다. 본 발명의 자일라나제는 또한 고체 또는 액체 형 중에 세제 첨가제 생성물로서 사용될 수 있다. 그런 첨가제 생성물은 종래의 세정 조성물의 성능을 보충하거나 강화시킬 것으로 기대되며 세척 과정의 임의의스테이지에 첨가될 수 있다.
실질적인 활성 효소 함량은 세정 조성물의 제조 방법에 좌우되며, 세제 용액이 목적하는 효소 활성을 갖는다는 것을 가정하는데 있어 중요하지는 않다. 하나의 양태에서, 최종 용액 중 본 발명의 자일라나제 함량은 세정 조성물 그랭 당 약 0.001 mg 내지 0.5 mg 범위이다. 본 발명의 방법 및 생성물에 사용하기 위해 선택된 특정 효소는 생성물의 물리적 형태, 사용 pH, 사용 온도, 및 분해되거나 또는 변형되는 토양의 유형을 포함하여, 최종 사용 조건에 좌우된다. 효소는 임의의 소정 사용 조건의 세트에 대해 최적 활성 및 안정성을 제공하도록 선택될 수 있다. 하나의 양태에서, 본 발명의 자일라나제는 pH 범위 약 4 내지 약 12 그리고 온도 범위 약 20℃ 내지 약 95℃에서 활성이다. 본 발명의 세제는 양이온성, 반극성 비이온성 또는 양쪽성 이온성 계면활성제 또는 그들의 혼합물을 포함한다.
본 발명의 자일라나제는 pH 4.0과 12.0 사이에서 약 0.01 내지 약 5 중량% (바람직하게는 0.1% 내지 0.5%)의 레벨로 분말 및 액체 세제 내에서 제제화될 수 있다. 이들 세정 조성물은 자일라나제, 셀룰라제, 리파제 또는 엔도글리코시다제, 엔도-베타-1,4-글루카나제, 베타-글루카나제, 엔도-베타-1,3(4)-글루카나제, 쿠티나제, 퍼옥시다제, 락카제(laccases), 아밀라제, 글루코아밀라제, 펙티나제, 리덕타제, 옥시다제, 페놀옥시다제, 리그니나제, 풀루라나제, 아라비나나제, 헤미셀룰라제, 만나나제, 자일로글루카나제, 자일라나제, 펙틴 아세틸 에스테라제, 람노갈락투로난 아세틸 에스테라제, 폴리갈락투로나제, 람노갈락투로나제, 갈락타나제, 펙틴 라이아제, 펙틴 메틸에스테라제, 셀로비오히드롤라제 및/또는 트랜스들루타밀라제와 같은 다른 표소를 포함할 수 있다. 이들 세정 조성물은 또한 빌더(builder) 및 안정화제를 포함할 수 있다.
본 발명의 자일라나제를 종래의 세척 조성물에 첨가하는 것은 임의의 특별한 사용 제한을 만들어 내지 않는다. 다시 말하면, 효소가, 사용하고자 하는 그 pH 및/또는 온도에서 활성이거나 또는 문제점이 없는 한, 세제에 적절한 임의의 온도 및 pH는 또한 본 발명의 조성물에 대해서도 적절하다. 게다가, 본 발명의 자일라나제는 세제 없이, 다시 말하면 단독으로 또는 빌더 및 안정화제와 조합되어 세척 조성물 중에 사용될 수 있다.
본 발명은, 단단한 표면을 세척하기 위한 세정 조성물, 직물을 세척하기 위한 세정 조성물, 식기세척용 조성물, 경구용 세척 조성물, 치아 세척 조성물, 및 콘택트 렌즈 세척 용액을 포함하는 세척 조성물을 제공한다.
하나의 양태에서, 본 발명은 세척하기에 충분한 조건 하에서 본 발명의 폴리펩티드와 대상을 접촉시키는 것을 포함하는 대상의 세척 방법을 제공한다. 본 발명의 자일라나제는 세제 첨가제로서 포함될 수 있다. 본 발명의 세정 조성물은, 예컨대, 본 발명의 폴리펩티드를 포함하는, 손 또는 기계 세탁 세정 조성물로서 제제화될 수 있다. 얼룩진 직물의 사전 처리를 위해 적당한 세탁 첨가제는 본 발명의 폴리펩티드를 포함할 수 있다. 직물 유연제 조성물은 본 발명의 자일라나제를 포함할 수 있다. 대안적으로, 본 발명의 자일라나제는 일반적으로 가정용 단단한 표면 세척 작용으로 사용하기 위한 세정 조성물로서 제제화될 수 있다. 대안적 양태에서, 본 발명의 세제 첨가제 및 세정 조성물은, 자일라나제, 리파제, 쿠티나제, 다른 자일라나제, 카보하이드라제, 셀룰라제, 펙티나제, 만나나제, 아라비나제, 갈락타나제, 자일라나제, 옥시다제, 예컨대, 락타제, 및/또는 퍼옥시다제 (상기 참조)와 같은 1 또는 그 이상의 다른 효소를 포함할 수 있다. 본 발명의 효소(들)의 특성은 선택된 세제와 양립할 수 있도록 선택되며 (즉 pH-최적, 다른 효소 및 비효소 성분들 등과의 양립가능성) 그리고 효소(들)는 유효량으로 존재한다. 하나의 양태에서, 본 발명의 자일라나제 효소는 직물로부터 악취 물질을 제거하는데 사용된다. 본 발명을 수행하는데 있어 사용될 수 있는 다양한 세정 조성물 및 이들의 제조 방법은, 예컨대, 미국 특허 6,333,301; 6,329,333; 6,326,341; 6,297,038; 6,309,871; 6,204,232; 6,197,070; 5,856,164에 기재되어 있다.
세탁기 세척 방법에 사용되기에 적절한 조성물로서 제제화될 때, 본 발명의 자일라나제는 계면활성제 및 빌더 화합물을 둘 다 포함할 수 있다. 그들은 추가적으로 1 또는 그 이상의 세제 성분, 예컨대, 유기 중합체 화합물, 표백제, 추가 효소, 거품 억제제, 분산제, 라임-비누 분산제, 토양 현탁액 및 재석출 방지제 및 부식 억제제를 포함할 수 있다. 본 발명의 세탁 조성물은 부가적 세제 성분으로서 유연제를 또한 포함할 수 있다. 탄수화물을 함유하는 그런 조성물은 세탁 세정 조성물로서 제제화될 때 직물 세척, 얼룩 제거, 백색 유지, 연화, 착색 외관, 염료 전이 억제 및 위생을 제공할 수 있다.
본 발명의 세탁 세정 조성물의 밀도는 조성물의 약 200 내지 1500 g/리터, 또는, 약 400 내지 1200 g/리터, 또는, 약 500 내지 950 g/리터, 또는, 600 내지 800 g/리터 범위일 수 있으며; 이는 약 20℃에서 측정될 수 있다.
본 발명의 세탁 세정 조성물의 "압축"형은, 밀도로 그리고, 조성물의 측면에서, 무기 충진 염의 함량으로 최선 반영된다. 무기 충진 염은 분말형 세정 조성물의 통상적인 성분이다. 종래의 세정 조성물에서, 충진 염은 실질적인 양, 구체적으로 총 조성물의 17% 내지 35중량%로 존재한다. 압축 조성물의 하나의 양태에서, 충진 염은 총 조성물의 15%를 초과하지 않는 양, 또는, 10%를 초과하지 않는 양, 또는, 조성물의 5 중량%를 초과하지 않는 양으로 존재한다. 무기 충진 염은 설페이트 및 클로라이드의 알칼리 및 알칼리 토금속 염, 예컨대, 황산 나트륨으로부터 선택될 수 있다.
본 발명의 액체 세정 조성물은 또한 "농축형"일 수 있다. 하나의 양태에서, 액체 세정 조성물은 종래의 액체 세제에 비해 소량의 물을 함유할 수 있다. 대안적 양태에서, 농축 액체 세제의 물 함량은 세정 조성물의 40% 이하, 또는, 30% 이하, 또는, 20 중량% 이하이다. 본 발명의 세제 화합물은 WO 97/01629에 기재된 것과 같은 제제를 포함할 수 있다.
본 발명의 자일라나제는 다양한 세척 조성물을 제제화하는데 유용할 수 있다. 몇가지 공지된 화합물은, 예컨대, 미국 특허 4,404,128; 4,261,868; 5,204,015에 개시된 것으로서 사용될 수 있는, 비이온성, 음이온성, 양이온성, 또는 양쪽성이온성 세제를 포함하는 적절한 계면활성제이다. 게다가, 자일라나제는, 예컨대, 막대 또는 액체 비누 제품, 식기 보호 제제, 콘택트 렌즈 세척 용액 또는 생성물, 펩티드 가수분해, 폐기물 처리, 직물 제품, 단백질 합성에 있어서 융합-절단 효소, 등으로 사용될 수 있다. 자일라나제는 다른 세제 자일라나제에 비해 세정 조성물중에서 향상된 성능을 제공할 수 있다. 즉, 효소군은, 표준 세척 사이클 이후 일반적인 평가에 의해 측정되는 것으로서 풀 또는 혈액과 같은 특정 효소 민감성 얼룩의 세척을 증가시킬 수 있다. 자일라나제는 pH 6.5와 12.0 사이를 갖는 공지의 분말 및 액체 세제 내로 약 0.01 내지 약 5 중량% (예컨대, 약 0.1% 내지 0.5%)의 레벨로 제제화될 수 있다. 이들 세제 세척 조성물은 공지의 자일라나제, 자일라나제, 아밀라제, 셀룰라제, 리파제 또는 엔도글리코시다제, 뿐 아니라 빌더 및 안정화제화 같은 다른 효소를 포함할 수 있다.
하나의 양태에서, 본 발명은 과일, 야채 및/또는 진흙 및 점토 화합물과 사용하기 위한 자일라나제 활성 (본 발명의 자일라나제)을 갖는 세정 조성물을 제공한다 (예컨대, 미국 특허 5,786,316 참조).
섬유 및 직물 처리
본 발명은 1 또는 그 이상의 본 발명의 자일라나제를 사용하여 섬유 또는 직물의 처리 방법을 제공한다. 자일라나제는 본 기술 분야에서 공지된 임의의 섬유- 또는 직물-처리 방법에 사용될 수 있다. 예컨대, 미국 특허 6,261,828; 6,077,316; 6,024,766; 6,021,536; 6,017,751; 5,980,581; US 특허 공개 20020142438 A1 참조. 예컨대, 본 발명의 자일라나제는 섬유 및/또는 직물 크기감소(desizing)에 사용될 수 있다. 하나의 양태에서, 용액 중 본 발명의 자일라나제와 섬유를 접촉시키는 것을 포함하는 방법에 의해 섬유의 촉감 및 외관이 향상된다. 하나의 양태에서, 가압하에서 용액으로 직물이 처리된다. 예컨대, 본 발명의 자일라나제는 얼룩의 제거에 사용될 수 있다.
본 발명의 자일라나제는, 섬유 (예컨대, 면, 삼, 아마 또는 린넨으로부터의 섬유), 재봉된 및 재봉되지 않은 직물, 예컨대, 면으로부터 얻은 니트, 부직포, 데님, 실, 및 타올, 면 혼방 또는 천연 또는 합성 셀룰로스 물질 (예컨대 목재 펄프와 같은 것으로부터 얻은 자일란-함유 셀룰로스로부터 유래하는 것) 또는 그들의 혼방을 포함하는 임의의 셀룰로스계 물질을 처리하는데 사용될 수 있다. 혼방의 예는 면 또는 레이온/비스코스와 1 또는 그 이상의 모, 합성 직물 (예컨대 폴리아미드 섬유, 아크릴계 섬유, 폴리에스테르 섬유, 폴리비닐 알콜 섬유, 염화 폴리비닐 섬유, 염화 폴리비닐리덴 섬유, 폴리우레탄 섬유, 폴리우레아 섬유, 아라미드 섬유), 및 셀룰로스-함유 섬유 (예컨대 레이온/비스코스, 모시, 삼, 아마/린넨, 황마, 셀룰로스 아세테이트 섬유, 리오셀)와 같은 동반 물질과의 혼방이다 .
(본 발명의 자일라나제를 사용하는) 본 발명의 직물 처리 과정은 다른 직물 처리, 예컨대, 스커링(scouring) 및 표백과 관련하여 사용될 수 있다. 스커링은 면 섬유로부터 비-셀룰로스계 물질, 예컨대, (주로 왁스로 구성된) 큐티클(cuticle) 및 (주로 펙틴, 단백질 및 자일로글루칸으로 구성된) 1차 세포벽을 제거하는 것이다. 높은 습윤성을 얻기 위해 적절한 왁스 제거가 필요하다. 이것은 염색을 위해 필요하다. 본 발명의 방법에 의한 1차 세포벽의 제거는 왁스 제거를 향상시키고 그리고 더 확실한 염색을 보장한다. 본 발명의 방법에 의한 직물 처리는 표백 과정에서 백색 정도를 향상시킨다. 스커링에 사용되는 주된 화학물은 소농도 및 고온의 염화 나트륨이다. 표백은 직물을 산화시키는 것을 포함한다. 완전히 표백된 (백색) 직물 또는 염료의 깨끗한 채색을 얻기 위해, 표백은 특히 산화제로서 과산화수소의사용을 포함한다.
본 발명은 또한 알칼리성 자일라나제 (알칼리 조건 하에서 활성인 자일라나제)를 제공한다. 이들은 직물 공정, 식물 섬유의 검질 제거 (예컨대, 식물 인피 섬유), 펙틴질 폐수의 처리, 제지, 및 커피 및 차의 발효에서 광범위로 응용된다. 예컨대, Hoondal (2002) Applied Microbiology and Biotechnology 59: 409-418 참조.
식품 및 식품 가공의 처리
본 발명의 자일라나제는 식품 가공 산업에서 많이 응용된다. 예컨대, 하나의 양태에서, 본 발명의 자일라나제는 오일이 풍부한 식물성 물질, 예컨대, 오일이 풍부한 씨앗으로부터, 예컨대, 대두로부터 대두유, 올리브로부터 올리브유, 평지씨로부터 평지씨유 및/또는 해바라기씨로부터 해바라기 오일의 추출을 향상시키는데 사용된다.
본 발명의 자일라나제는 식물 세포 물질의 성분을 분리하기 위해 사용될 수 있다. 예컨대, 본 발명의 자일라나제는 자일란 풍부 물질 (예컨대, 식물 세포)을 성분으로 분리하는데 사용될 수 있다. 하나의 양태에서, 본 발명의 자일라나제는 자일란 풍부- 또는 오일-풍부 작물로부터 가치있는 단백질 및 오일 및 헐(hull) 분율로 분리하는데 사용될 수 있다. 분리 과정은 본 기술 분야에서 공지된 방법을 사용함으로써 수행될 수 있다.
본 발명의 자일라나제는 과일 또는 야채 주스, 시럽, 추출물 등의 제조에 있어 수득율을 증가시키는데 사용될 수 있다. 본 발명의 자일라나제는 다양한 식물 세포벽 유도 물질 또는 폐기물, 예컨대 씨리얼, 그레인, 와인 또는 주스 제조, 또는 식물피, 대두피, 사탕무 펄프, 올리브 펄프, 감자 펄프, 등과 같은 농업상 잔류물의 효소 처리에 사용될 수 있다 (예컨대, 자일란 함유 식물 물질의 가수분해). 본 발명의 자일라나제는 가공된 과일 또는 야채의 밀도(consistency) 및 외관을 변형하는데 사용될 수 있다. 본 발명의 자일라나제는, 음식을 포함하여 식물 물질의 가공을 촉진하기 위해, 식물 성분의 정제 또는 추출을 촉진하기 위해 식물 물질을 처리하는데 사용될 수 있다. 본 발명의 자일라나제는, 사료가(feed value)를 향상시키는데, 물 결합능을 감소시키는데, 폐수 식물에서 분해성을 감소시키는데 및/또는 식물 물질의 저장물로의 전환을 향상시키는데, 등등 사용될 수 있다.
하나의 양태에서, 본 발명의 자일라나제는 베이킹 응용, 예컨대, 쿠키 및 크래커에, 장치가 어렵지 않으면서 비스킷 크기를 감소시키지 않으면서, 아라비노자일란을 가수분해시키는데 그리고 끈끈하지 않은 반죽을 만들어내는데 사용될 수 있다. 본 발명의 자일라나제를 아라비노자일란을 가수분해하는데 사용하는 것은 구워낸 제품의 빠른 재수화로 인하여 바삭거림의 손실 및 감소된 유효 보존기간을 방지하는데 사용된다. 하나의 양태에서, 본 발명의 자일라나제는 반죽(dough) 과정에서 첨가제로 사용된다. 하나의 양태에서, 본 발명의 자일라나제는 반죽의 컨디셔닝에 사용되며, 여기서 하나의 양태로 자일라나제는 약 25-35℃ 온도 범위 및 거의 중성 pH (7.0-7.5)에 걸쳐 높은 활성을 가진다. 하나의 양태에서, 반죽 컨디셔닝 효소는 베이킹의 극단적인 온도에서 불활성될 수 있다 (> 500℉).
하나의 양태에서, 본 발명의 자일라나제는 반죽 pH 및 온도 조건을 최적으로 수행하기 위해 반죽 과정에서 첨가제로서 사용된다. 하나의 양태에서, 본 발명의효소는 반죽 컨디셔닝을 위해 사용된다. 하나의 양태에서, 본 발명의 자일라나제는 온도 범위 25-35℃ 및 거의 중성 pH (7.0-7.5)에 걸쳐 높은 활성을 가진다. 하나의 양태에서, 효소는 베이킹의 극단적인 온도, 예컨대, > 500℉에서 불활성화된다.
종이 또는 펄프 처리
본 발명의 자일라나제는 종이 또는 펄프 처리 또는 종이의 잉크 제거에 사용될 수 있다. 예컨대, 하나의 양태에서, 본 발명은 본 발명의 자일라나제를 사용하는 종이 처리 방법을 제공한다. 하나의 양태에서, 본 발명의 자일라나제는 이산화염소와 같은 화학적 표백제의 필요를 감소시키는데, 그리고 높은 알칼리성 및 고온 환경에서 적용할 수 있다. 하나의 양태에서, 본 발명의 자일라나제는, 0.5% 이하의 펄프 손실률로 크래프트 펄프의 이산화염소 요구에 있어서 25% 이상의 감소로 영향을 미칠 수 있는 내열성 알칼리성 엔도자일라나제이다. 하나의 양태에서, 한계 파라미터는 pH 10, 65-85℃ 및 효소 로딩 0.001 wt% 이하에서 60분 이하의 처리 시간이다. 자일라나제의 풀(pool)은 예컨대, pH 10 및 60℃에서 염료-라벨링된 자일란을 가수분해하는 능력에 대해 테스트될 수 있다. 이들 조건 하에서 파지티브로 테스트된 효소는 이후, 예컨대 pH 10 및 70℃에서 평가될 수 있다. 대안적으로, 효소는 pH 8 및 pH 10, 70℃에서 테스트될 수 있다. 펄프 및 종이 산업 연구실에서 목적하는 자일라나제의 발견은 고온 또는 높은 알칼리성 환경을 타겟으로 하였다. 특히, 이들 연구실은 알칼리성 pH 및 대략 45℃의 온도에서 작용하는 효소를 스크리닝하였다. 다른 양태에서, 본 발명의 자일라나제는, 리그닌을 방출하기 위해 리그닌 헤미셀룰로스 결합의 분해에 있어서 종이 및 펄프 산업에 유용하다.
동물 사육 및 식품 또는 사료 첨가제
본 발명은 본 발명의 자일라나제를 사용하여 동물 사료 및 식품 및 식품 또는 사료 첨가제를 처리하는 방법을 제공하며, 동물은 포유동물 (예컨대, 인간), 새, 물고기 등을 포함한다. 본 발명은 본 발명의 자일라나제를 함유하는 동물 사료, 식품, 및 첨가제를 제공한다. 하나의 양태에서, 본 발명의 자일라나제를 사용하여 동물 사료, 식품 및 첨가제를 처리하는 것은 동물 사료 첨가제 중에 영양분, 예컨대, 전분, 단백질, 등의 이용률에 도움이 될 수 있다. 소화되기 어려운 단백질 또는 직접 또는 간접으로 마스킹되지 않은 전분 (또는 다른 영양분)을 분해시킴으로써, 자일라나제가 영양분으로 하여금 다른 내인성 또는 외인성 효소에 더 잘 접근할 수 있게 한다. 자일라나제는 또한 용이하게 소화될 수 있고 그리고 용이하게 흡수되는 영양분 및 당의 방출을 간단히 유발시킬 수 있다.
동물 사료에 첨가될 때, 본 발명의 자일라나제는 장관의 점도를 감소시키는 것에 의해 식물 세포벽 물질의 부분적인 생체내 분해를 향상시키며 (예컨대, Bedford et al., Proceedings of the 1st Symposium on Enzyme in Animal Nutrition, 1993, pp. 73-77), 그럼으로써 동물에 의한 식물 영양분의 더 나은 활용을 얻게 한다. 따라서, 사료에 본 발명의 자일라나제를 사용함으로써 동물의 성장 속도 및/또는 사료 전환률 (즉 늘어난 체중에 상대적인 섭취된 사료의 중량)이 향상된다.
본 발명의 동물 사료 첨가제는 사료 성분과 용이하게 혼합될 수 있는 과립화된 효소 생성물일 수 있다. 대안적으로, 본 발명의 사료 첨가제는 프리믹스(pre-mix)의 성분을 형성할 수 있다. 본 발명의 과립화된 효소 생성물은 코팅되거나 또는 코팅되지 않을 수 있다. 효소 과립의 입자 크기는 사료 및 프리믹스 성분의 것과 양립가능할 수 있다. 이는 사료 내로 효소 도입의 안전하고 용이한 수단을 제공한다. 대안적으로, 본 발명의 동물 사료 첨가제는 안정화된 액체 조성물일 수 있다. 이는 수성 또는 오일계 슬러리일 수 있다. 예컨대, 미국 특허 6,245,546 참조.
본 발명의 자일라나제는, 동물 사료 또는 식품의 변형시, 시험관내 (사료 또는 식품의 성분을 가공함으로써) 또는 생체내에서 식품 또는 사료를 가공할 수 있다. 자일라나제는 고함량의 자일란을 함유하는 동물 사료 또는 식품 조성물에 첨가될 수 있으며, 예컨대 식물 물질 함유 사료 또는 식품은 씨리얼, 그레인 등으로부터 얻는다. 자일라나제를 식품 또는 사료에 첨가할 때 자일란 함유 물질, 예컨대, 식물 세포벽의 생체내 분해가 현저하게 향상되며, 그럼으로써 동물 (예컨대, 인간)에 의한 식물 영양분의 더 나은 활용이 얻어진다. 하나의 양태에서, 동물의 성장 속도 및/또는 사료 전환률 (즉, 늘어난 체중에 상대적인 섭취된 사료의 중량)이 향상된다. 예컨대 부분적으로 또는 소화될 수 없는 자일란-함유 단백질이, 예컨대 다른 효소, 예컨대, 베타-갈락토시다제와 조합된 본 발명의 자일라나제에 의해, 펩티드 및 갈락토스 및/또는 갈락토올리고머로 완전히 또는 부분적으로 분해된다. 이들 효소 소화 생성물은 동물에 의해 더 잘 소화될 수 있다. 따라서, 본 발명의 자일라나제는 사료 또는 식품의 가용 에너지에 기여할 수 있다. 또한, 자일란 함유 단백질의 분해에 기여함으로써, 본 발명의 자일라나제는 탄수화물 및 단백질, 지방 및 미네랄과 같은 비-탄수화물 사료 또는 식품 성분의 소화가능성 및 섭취를 향상시킬수 있다.
다른 양태에서, 본 발명의 자일라나제는 그레인, 씨리얼, 옥수수, 대두, 평지씨, 루핀 등과 같은 유전자 전이 작물에서 직접 (예컨대, 유전자 전이 식물, 종자 등으로서) 발현시킴으로써 공급될 수 있다. 전술한 바와 같이, 본 발명은 본 발명의 폴리펩티드를 암호화하는 핵산 서열을 포함하는 유전자 전이 식물, 식물의 부분 및 식물 세포를 제공한다. 하나의 양태에서, 본 발명의 자일라나제가 복구 가능한 양으로 생성되도록 핵산이 발현된다. 자일라나제는 임의의 식물 또는 식물의 부분으로부터 복구될 수 있다. 대안적으로, 재조합 폴리펩티드를 함유하는 식물 또는 식물의 부분은 식품 또는 사료의 질을 향상시키기 위해, 예컨대, 영양가, 맛, 및 유동학적 성질를 향상시키는데, 또는 영양분 파괴 팩터를 분해시키기 위해 사용될 수 있다.
하나의 양태에서, 본 발명은 본 발명의 자일라나제를 사용하여 동물 개체에 의해 소비되기에 앞서 시료로부터 올리고사카리드를 제거하는 방법을 제공한다. 이 과정에서 사료는 증가된 대사가능한 에너지 값을 갖도록 형성된다. 본 발명의 자일라나제 뿐 아니라, 갈락토시다제, 셀룰라제 및 그것들의 조합이 사용될 수 있다. 하나의 양태에서, 효소가 사료 물질의 약 0.1%와 1중량% 사이와 동등한 양으로 첨가된다. 하나의 양태에서, 사료는 씨리얼, 밀, 그리엔, 대두 (예컨대, 그라인딩된 대두) 물질이다. 예컨대, 미국 특허 6,399,123 참조.
다른 양태에서, 본 발명은 아미노산 서열 B군의 아미노산이 적어도 30개 인접하는 아미노산을 포함하는 재조합 자일라나제 효소를 함유하는 영양분을 제조함으로써, 그리고 동물에 의해 섭취되는 식품에 함유된 자일란의 활용을 증가시키기 위해 동물에 영양분을 투여함으로써 동물의 식이에 영양분으로써 자일라나제를 활용하기 위한 방법을 제공한다.
또 다른 양태에서, 본 발명은 동물에게 예컨대 영양분으로서, 자일라나제를 공급하기 위한 식용 펠릿화된 효소 공급 매트릭스 및 사용 방법을 제공한다. 효소 공급 매트릭스는, 예컨대, 동물의 소화액과 같은 수성 매질에서 아미노산 서열 B군의 아미노산 서열, 또는 그것들의 적어도 30개의 인접한 아미노산을 갖도록 용이하게 자일라나제 효소를 방출한다. 본 발명의 효소 공급 매트릭스는 그레인 배아와 같은 성분으로부터 선택된 입자화된 식용 담체로부터 제조되며, 그것은 수성 매질 내로 그것에 함유된 재조합 효소를 용이하게 분산시키는 오일, 건초, 알팔파(alfalfa), 티모시(timothy), 대두피, 해바라기 씨 분말, 밀 미드(wheat midd), 등을 소비한다. 사용시, 동물에게 자일라나제를 공급하기 위해 식용 펠릿화된 효소 공급 매트릭스가 동물에게 투여된다. 밀, 옥수수, 대두, 수수, 알팔파, 보리 등과 같은 적절한 그레인계 기질을 함유하거나 또는 임의의 적절한 식용 그레인으로부터 유도된다. 예시적 그레인계 기질은 옥수수계 기질이다. 기질은 그레인의 임의의 적절한 부분으로부터 유도될 수 있지만, 바람직하게는, 습식 또는 건식 밀링 과정으로 얻어진 옥수수 배아와 같이 동물 사료 용도로 승인된 그레인 배아이다. 바람직하게는 그레인 배아는 스펜트 배아(spent germ)를 함유하며, 여기서 그레인 배아는, 예컨대 압착시킴으로써 또는 헥산 또는 다른 용매 추출에 의해 오일을 제거한 것이다. 대안적으로, 그레인 배아는 축출기로 추출되며, 즉 압착시킴으로써 오일이제거되었다.
본 발명의 효소 공급 매트릭스는 별개로 된 복수의 입자, 펠릿 또는 과립의 형태이다. "과립"은 매트릭스로부터 물을 제거하기 위해 펠릿화, 압출에 의해, 또는 유사하게 압축시킴으로써 압착되거나 압축된 입자를 의미한다. 입자의 그런 압착 또는 압축은 또한 입자의 입자내 응집을 향상시킨다. 예컨대, 펠릿 밀에서 그레인계 기질을 펠릿화함으로써 과립이 제조될 수 있다. 그렇게 제조된 펠릿을 그라인딩하거나 또는 부수어서 동물 사료에서 애쥬반트(adjuvant)로서 사용하기에 적절한 과립 크기가 되게 한다. 매트릭스 그 자체가 동물 사료로 사용하도록 승인되기 때문에, 그것은 동물 사료 중에 효소의 공급을 위해 희석제로서 사용될 수 있다.
바람직하게는, 효소 공급 매트릭스는 과립 크기 약 4 내지 약 400 메시 (USS); 더 바람직하게는, 약 8 내지 약 80 메시; 및 가장 바람직하게는 약 14 내지 약 20 메시 범위를 갖는 과립의 형태이다. 만약 그레인 배아가 용매 추출을 경유하여 소비된다면, 옥수수 오일과 같은 광택제의 사용이 펠릿화 장비에 필수적일 수 있지만, 만약 배아가 축출기로 추출된다면 그런 광택제는 일반적으로 필요하지 않다. 본 발명의 다른 양태에서, 다른 압축 및 압착 과정에 의해, 예컨대, 압출물의 다이 및 그라인딩을 통해 그레인계 기질을 추출시킴으로써 적절한 과립 크기로 매트릭스가 제조된다.
효소 공급 매트릭스는 매트릭스 과립의 응집성을 향상시키기 위해 응집제로서 폴리사카리드 성분을 더 함유할 수 있다. 응집제는 매트릭스 과립 내의 그레인 단백질 사이의 결합을 향상시키는 추가의 하이드록실 기를 제공하는 것으로 여겨진다. 또한 전분 및 다른 단백질에 대한 단백질의 수소 결합을 강화시킴으로써 추가의 하이드록실 기가 작용하게 되는 것으로 여겨진다. 응집제는 효소 공급 매트릭스의 과립의 응집을 향상시키는데 적절한 임의의 양으로 존재할 수 있다. 적절한 응집제는 1 또는 그 이상의 덱스트린, 말토덱스트린, 전분, 예컨대 옥수수 전분, 분말(flours), 셀룰로스 물질, 헤미셀룰로스 물질, 등을 포함한다. 예컨대, 그레인 배아 및 응집제의 매트릭스 중 (효소를 함유하지 않는) 퍼센트는 78% 옥수수 배아 분말 및 20중량%의 옥수수 전분이다.
본 발명의 효소-방출 매트릭스는 생물 분해 가능 물질로부터 만들어지기 때문에, 매트릭스는, 예컨대 몰딩으로써 부패의 대상이 될 수 있다. 그런 몰딩을 막거나 또는 방지하기 위해, 매트릭스는 프로피오네이트 염과 같은 몰딩 억제제를 함유할 수 있으며, 이는 효소-방출 매트릭스의 몰딩을 억제하기에 충분한 임의의 양으로 존재할 수 있으며, 따라서 공급 매트릭스로 하여금 냉장을 요하지 않는 안정한 제제로 존재하게끔 제공된다.
본 발명의 효소 공급 매트릭스 및 방법에 포함된 자일라나제 효소는 바람직하게는, 전술한 것으로서, 제조 동안 자일라나제의 불활성을 방지하도록 내열성 자일라나제이며, 여기서 상승 온도 및/또는 기류가 펠릿화된 효소 공급 매트릭스를 제조하는데 사용될 수 있다. 본 발명의 효소 공급 매트릭스를 함유하는 사료의 소화 동안, 수성 소화액이 활성 효소의 방출을 초래할 수 있다. 다른 종류의 내열성 효소 및 내열성인 영양분이 또한 임의의 종류의 수성 조건 하에서 방출되기 위해 공급 매트릭스 중에 도입될 수 있다.
동물 사료에 맛 또는 영양분을 추가하기 위해, 위와 같은 조건에서 동물 사료의 영양분과 효소의 방출을 지연시키기 위한 것 등과 같이 다양한 상이한 목적으로 본 발명의 효소 매트릭스 입자에 코팅이 적용될 수 있다. 또는 예컨대, 매트릭스 입자로부터 효소를 느리게 방출하거나 또는 효소가 방출되게 되는 조건 하에서 조절되는 것이 바람직한 때에는 언제라도, 기능적 목적을 얻기 위해 코팅이 적용될 수 있다. 코팅재의 조성물은 그것이 민감한 것 (예컨대 열, 산 또는 염기, 효소 또는 다른 화학물질)으로서 시약에 의해 선택적으로 분해되는 그런 것일 수 있다. 대안적으로, 상이한 분해 시약에 민감한 2 또는 그 이상의 코팅이 매트릭스 입자에 연속하여 적용될 수 있다.
본 발명은 또한 효소-방출 매트릭스를 제조하는 방법에 관한 것이다. 본 발명에 따라, 그 방법은 효소-방출 매트릭스로서 사용되기에 적절한 입자 크기로 그레인계 기질의 별개의 복수의 입자를 제공하는 것을 포함하며, 여기서 그 입자는 아미노산 서열 B군의 아미노산 서열 또는 그것의 적어도 30개의 인접하는 아미노산에 의해 암호화된 자일라나제 효소를 함유한다. 바람직하게는, 그 방법은 효소-방출 매트릭스의 입자를 과립으로 압축 또는 압착하는 것을 포함하며, 가장 바람직하게는 펠릿화에 의해 수행된다. 몰딩 억제제 및 응집제는, 사용되는 경우, 임의의 적절한 시간에 첨가될 수 있으며, 그리고 바람직하게는 그레인계 기질의 펠릿화에 앞서 소정의 분율로 그레인계 기질과 혼합된다. 펠릿 밀(mill) 사료 중에 수분 함량은 바람직하게는 최종 생성물 중에 수분 함량에 맞춰 전술한 범위이며, 바람직하게는 약 14-15%이다. 바람직하게는, 이 수분 함량을 갖도록 효소의 수성 제제의 형태로 공급원료에 수분이 첨가된다. 펠릿 밀의 온도는 바람직하게는 증기로서 약 82℃로 공급된다. 펠릿 밀은 공급원료가 펠릿을 제공하도록 충분한 작업에 참여하는 임의의 조건 하에서 작동될 수 있다. 펠릿화 과정 그 자체는 효소-함유 조성물로부터 물을 제거하기 위한 비용-효율적 과정이다.
하나의 양태에서, 펠릿 밀은 1/8 in. × 2 in. 다이로 100 lb./min 압력에서 82℃에서 작동하여 펠릿을 제공하며 이후 펠릿 밀 크럼블러(crumbler)에서 부숴져서 8 메시 스크린을 통과할 수 있지만 20 메시 스크린에는 남게 되는 입자 크기를 갖는 분리된 복수의 입자를 제공한다.
내열성의 본 발명의 자일라나제는 본 발명의 펠릿에 사용될 수 있다. 그들은 효소 반응이 여기 언급되지 않은 온도에서 수행되는 것이 가능할 수 있도록 최적 온도 및 최고 열 내성을 가질 수 있다. 본 발명에 따른 자일라나제를 암호화하는 유전자 (예컨대 A군 핵산 서열 중에 임의의 서열로 기재된 것)는 B군 아미노산 서열의 자일라나제와는 상이한 특성 (최적 pH, 최적 온도, 열 내성, 용매에 대한 안정성, 특정 활성, 기질에 대한 친화도, 분비 능력, 번역 속도, 전사 제어 등)을 갖는 자일라나제의 제조에 사용될 수 있다 (예컨대 전술한 GSSMTM사용). 또한, A군 핵산 서열의 폴리뉴클레오티드는, 그들이 향상되거나 또는 변형된 내열성 또는 열안정성과 같은 목적하는 성질을 갖는지 측정하기 위해 본원에 기재된 방법으로 제조된 다양한 자일라나제의 스크리닝을 위해 사용될 수 있다. 예컨대, 미국 특허 5,830,732는 자일라나제의 내열성을 측정하기 위한 스크리닝 분석을 기재하고 있다.
폐기물 처리
본 발명의 자일라나제는 다양한 다른 산업 응용, 예컨대, 폐기물 처리에 사용될 수 있다. 예컨대, 하나의 양태에서, 본 발명은 본 발명의 자일라나제를 사용하는 고체 폐기물 분해 과정을 제공한다. 그 방법은 실질적으로 처리되지 않은 고체 폐기물의 질량과 부피를 감소시키는 것을 포함할 수 있다. 고체 폐기물은 (본 발명의 자일라나제를 함유하는) 효소 용액의 존재 하에서 조절된 온도로 효소적 분해 과정으로 처리될 수 있다. 이는 추가되는 미생물로부터 감지할 수 있는 박테리아 발효가 없는 반응을 초래한다. 고체 폐기물은 액화 폐기물 및 임의의 잔류 고체 폐기물로 전환된다. 만들어진 액화 폐기물은 상기 임의의 잔류 고체화된 폐기물로부터 분리될 수 있다. 예컨대, 미국 특허 5,709,796 참조.
구강 보호 제품
본 발명은 본 발명의 자일라나제를 함유하는 구강 보호 제품을 제공한다. 예시적 구강 보호 제품은 치약, 치과용 크림, 젤 또는 치분, 치아(odontics), 구강 세척제, 양치 전후 세정 제제, 츄잉 검, 로젠지, 또는 캔디를 포함한다. 예컨대, 미국 특허 6,264,925 참조.
양조 및 발효
본 발명은 본 발명의 자일라나제를 함유하는 맥주의 양조 (예컨대, 발효) 맥주 방법을 제공한다. 하나의 예시적 방법에서, 전분 함유 원재료가 분해되고 가공되어 몰트(malt)를 형성한다. 본 발명의 자일라나제는 발효 과정 중 임의의 시점에사용된다. 예컨대, 본 발명의 자일라나제는 보리 몰트의 가공 중에 사용될 수 있다. 맥주 양조의 주된 원재료는 보리 몰트이다. 이것은 3단계 과정일 수 있다. 먼저, 보리 그레인을, 예컨대, 약 40% 부근으로 수분 함량이 증가하도록 담글 수 있다. 두번째, 지베렐린의 조절 하에서 효소 합성이 자극될 때, 그레인을 15 내지 25℃에서 3 내지 6일 동안 인큐베이션함으로써 발아시킬 수 있다. 하나의 양태에서, 본 발명의 자일라나제가 과정 중 이 단계 (또는 임의의 다른 단계)에 첨가된다. 본 발명의 자일라나제는, 예컨대, 미국 특허 5,762,991; 5,536,650; 5,405,624; 5,021,246; 4,788,066에 기재된 방법으로 제조된 임의의 맥주 또는 알콜성 음료에 사용될 수 있다.
하나의 양태에서, 본 발명의 효소는 여과성 및 맥아즙 점도를 향상시키기 위해 그리고 배유 성분의 더 완전한 가수분해를 얻기 위해 사용된다. 본 발명의 효소의 사용은 또한 추출 수득률을 증가시킨다. 양조의 과정은 보리 그레인의 발아 (몰팅, malting) 이어서 저장된 탄수화물의 추출 및 분해로 효모에 의해 알콜 발효를 위해 사용되는 간단한 당을 얻는 것을 포함한다. 보리 배유 및 양조 부가물 중에 존재하는 예비적 탄수화물의 효율적인 분해는 몇가지 상이한 효소의 활성을 요한다.
하나의 양태에서, 본 발명의 효소는 약산성 pH (예컨대, 5.5-6.0), 예컨대, 40℃ 내지 70℃ 온도 범위에서 활성을 가지며; 그리고, 하나의 양태에서, 95℃에서 불활성이다. 그런 조건 하에서 활성은 최적이지만, 효율성에 필수적인 요구사항은 아니다. 하나의 양태에서, 본 발명의 효소는 40-75℃ 사이, 및 pH 5.5-6.0에서 활성을 가지며; 70℃에서 적어도 50분 동안 안정하며, 그리고, 하나의 양태에서, 96-100℃에서 불활성이다. 본 발명의 효소는 다른 효소, 예컨대, 베타-1,4-엔도글루카나제 및 아밀라제와 함께 사용될 수 있다.
의학 및 연구 응용
본 발명의 자일라나제는 그들의 박테리아 분해 성질에 의해 항미생물제로서 사용될 수 있다. 본 발명의 자일라나제는, 예컨대, PCT 출원 WO0049890 및 WO9903497에 기재된 바와 같이 살모넬라로부터 동물을 보호하거나 그것을 제거하는데 사용될 수 있다.
다른 산업상 응용
아미노산 서열 B군이 광범위한 식품, 동물 사료 및 음료 응용에 사용되는 것을 포함하여, 본 발명의 자일라나제가 사용될 수 있다. 다양하게 중온성 및 적당히 고온성 위치 뿐 아니라 소화성 식물군, 동물 폐기물 중의 미생물, 토양 박테리아 및 높은 알칼리성 거주물을 포함하는 목적하는 공급원으로 구축된 기존 라이브러리 및 DNA 라이브러리를 스크리닝함으로써 신규한 자일라나제가 발견되었다. 1차적 동물 사료 물질의 아라비노자일란 기질 및/또는 불용성 폴리사카리드 분율을 사용하는 생물학적 트랩 및 1차적 농축 전략이 또한 유용하다.
두개의 스크리닝 포맷 (활성 기초 및 서열 기초)이 신규한 자일라나제를 발견하는데 사용되었다. 활성 기초 접근은 아조-자일란(AZO-xylan, Megazyme)과 같은 기질을 사용하여 아가(agar) 플레이트에서 자일라나제 활성에 대한 직접 스크리닝하는것이다. 대안적으로 서열 기초 접근이 사용될 수 있으며, 이는 혼성 및 생물패닝(biopanning)에 대한 프로브(probe)를 디자인하기 위한 생물 정보학 및 분자 생물학에 좌우된다. 예컨대, 미국 특허 6,054,267, 6,030,779, 6,368,798, 6,344,328 참조. 기본적인 생화학적 성질을 위해, 스크리닝으로부터 히트(hit)가 정제되고, 서열화되고, 특성화되고 (예컨대, 퇴적 특이성, 온도 및 pH의 측정), 생물 정보학을 사용하여 분석되고, 서브클로닝되고 그리고 발현된다. 이들 방법은, 반죽 컨디셔닝 및 동물 사료 첨가제 효소를 포함하는 무수한 응용에 유용한 자일라나제에 대한 스크리닝에 사용될 수 있다.
스크리닝으로부터 얻은 효소를 특성화하는데 있어, 반죽 가공 및 베이킹 응용시 예시적 사용이 평가될 수 있다. 특성화는, 예컨대, 기질 특이성 (자일란, 아라비노자일란, CMC, BBG), 온도 및 pH 안정성 및 특정 활성의 측정을 포함할 수 있다. 상업상 구입할 수 있는 효소가 기준점으로서 사용될 수 있다. 하나의 양태에서, 본 발명의 효소는 pH > 7 및 25-35℃에서 명백한 활성을 가지며, 불용성 자일란 상에서 불활성이며, 50-67% 수크로스에서 안정하고 활성이다.
다른 양태에서, 후보 효소의 특성화로부터 사료 첨가제로서의 활용이 평가될 수 있다. 특성화는, 예컨대, 기질 특이성 (자일란, 아라비노자일란, CMC, BβG), 온도 및 pH 안정성, 특정 활성 및 위장관 활성의 측정을 포함할 수 있다. 하나의 양태에서 사료는 단일 위 동물에 대해 디자인되며 그리고 다른 양태에서 사료는 반추 동물에 대해 디자인되었다. 하나의 양태에서, 본 발명의 효소는 pH 2-4 및 35-40℃에서 맹백한 활성, 소화 유체에서 30분 이상의 반감기, 85℃에서 5분 이상의 제제 (완충액 또는 세포에서) 반감기를 가지며 단일 위 동물 사료 첨가제로서 사용된다. 다른 양태에서, 본 발명의 효소는 1 또는 그 이상의 다음의 성질을 가진다: pH 6.5-7.0 및 35-40℃에서 명백한 활성, 반추(rumen) 유체에서 30분 이상의 반감기, 건조 분말로서 안정하고 반추 동물 사료 첨가제로서 사용되는 제제 안정성.
효소는 광범위한 천연 및 합성(unnatural) 기질에 대해 반응성이며, 따라서 임의의 유기 납 화합물을 실질적으로 변형시키는 것이 가능하다. 게다가, 종래의 화학 촉매와 달리, 효소는 상당히 거울상 이성질체-특이적 및 위치-특이적이다. 효소에 의해 나타내어지는 높은 수준의 작용기 특이성은 신규한 화합물을 유도하는 합성 서열에서 각 반응의 트랙을 유지하는 것을 가능하게 한다. 효소는 또한 본래 그들의 생리적 작용과 무관한 많은 다양한 반응을 촉매할 수 있다. 예컨대, 퍼옥시다제는 과산화수소에 의한 페놀의 산화를 촉매한다. 퍼옥시다제는 또한 그 효소의 본래 작용과 관련이 없는 수소화 반응을 촉매할 수 있다. 다른 예는 폴리펩티드의 분해를 촉매하는 자일라나제이다. 유기 용액에서 어떤 자일라나제는 또한 이들 효소의 본래 작용과 무관한 기능으로서 설탕을 아실레이트화 할 수 있다.
본 발명은 효소의 유일한 촉매적 성질을 개발하였다. 화학적 변이에서 생물 촉매 (즉, 정제되거나 또는 조 효소, 무생물 또는 생물 세포)의 사용은 특정 출발 화합물과 반응하는 특정 생물촉매의 인식을 정상적으로 필요로 하는 반면, 본 발명은 다양한 출발 화합물에 존재하는 작용기에 특이적인 반응 조건 및 선택된 생물촉매를 사용한다. 각 생물촉매는 하나의 작용기 또는 여러개의 관련 작용기에 특이적이고 그리고 이 작용기를 함유하는 많은 출발 화합물과 반응할 수 있다. 생물촉매 반응은 하나의 출발 화합물로부터 다수의 유도체를 제조해낸다. 이들 유도체는 다음 라운드의 생물촉매 반응의 대상이 될 수 있으며 유도체 화합물의 2차 집단을 제조해낸다. 생물촉매 유도체화가 각각 반복되어 본래 화합물의 수천가지 유도체가 제조될 수 있다.
효소는 분자의 나머지에 영향을 미치지 않으면서 출발 화합물의 특정 부위에서 반응하며, 그 과정은 종래의 화학적 방법을 사용하여서는 얻기 상당히 어렵다. 이런 높은 수준의 생물촉매적 특이성은 라이브러리 내에서 단일 활성 화합물을 인식하는 수단을 제공한다. 라이브러리는, 소위 "생물 합성 히스토리"라고 불리는 것을 만들어내기 위해 사용되는 일련의 생물촉매 반응으로 특성화된다. 생물학적 활성에 대한 라이브러리의 스크리닝 및 생물 합성 히스토리의 추적은 활성 화합물을 제조해내는 특정 반응 서열을 확인한다. 그 반응 서열이 반복되고 그리고 합성된 화합물의 구조가 결정된다. 이런 인식 모드는, 다른 합성 및 스크리닝 접근과 달리, 고정화 기술을 필요로 하지 않으며 실질적으로 임의의 유형의 스크리닝 분석을 사용하여 용액에서 화합물들이 자유롭게 합성되고 테스트될 수 있다. 작용기에 대한 효소 반응의 높은 수준의 특이성이, 생물 촉매적으로 제조된 라이브러리를 메이크업하는 특정 효소 반응의 "트랙킹(tracking)"을 허용한다는 것이 중요하다.
하루 동안에 생물촉매 반응 및 스크리닝 분석을 수행하는 것을 가능하게 하며 게다가 높은 수준의 정밀도 및 재현성을 보장하는 로보트 자동화를 이용하여 많은 과정의 단계가 수행되었다. 결과적으로, 현재의 화학적 방법으로 수년이 걸리게 되는 유도체 화합물의 라이브러리가 몇 주 만에 이루어질 수 있다. (소형 분자를 포함하는 분자의 변형에 대한 추가의 교시는 PCT/US94/09174 참조).
본 발명은 이하의 실시예를 참조로 더 설명될 것이지만; 다만, 그런 실시예가 본 발명을 제한하지 않는 것으로 이해되어야 한다.
실시예 1: 플레이트를 기초로 한 엔도글리코시다제 효소 발견: 발현 스크리닝
람다 라이브러리(Lambda Library)의 역가(titer) 측정: 1.0 ㎕의 람다 Zap 발현 증폭 라이브러리 스탁을 600㎕ 대장균(E.coli) MRF' 세포 (OD600=1.0)에 첨가하였다. MRF' 스탁을 10mM MgS04로 희석하였다. 혼합물을 37℃에서 15분 동안 배양하고, 이후 현탁액을 5-6mL의 NZY 탑 아가(top agar)로 50℃에서 이동시키고 부드럽게 혼합하였다. 아가 용액을 즉시 대형 (150mm) NZY 배지 플레이트에 쏟아붓고 그리고 탑 아가를 완전히 고형화되도록 방치하였다 (대략 30분).
플레이트를 돌려놓았다. 플레이트를 39℃에서 8-12시간 동안 배양하였다(플라그의 갯수를 추정하였다. 50,000 pfu/플레이트가 되도록 파지 역가를 측정하였다. 필요하다면 라이브러리 파지의 분취량을 SM 완충액으로 희석하였다.).
기질 스크리닝: 증폭된 라이브러리로부터 얻은 람다 Zap Express (50,000pfu)를 600㎕의 대장균 MRF' 세포 (OD600=1.0)에 첨가하고 37℃에서 15분 동안 배양하였다. 파지/세포 현탁액을 배양하는 동안, 1.OmL의 목적하는 폴리사카리드 염료-라벨링된 기질 (일반적으로 1-2% w/v)을 50℃에서 5.0mL NZY 탑 아가에 첨가하고 완전히 혼합하였다. (필요할 대까지 용액을 50℃로 유지하였다.) 세포 현탁액을 기질/탑 아가 용액으로 옮기고 부드럽게 혼합하였다. 용액을 대형 (150mm) NZY 배지 플레이트에 즉시 쏟아부었다. 탑 아가를 완전히 고형화되도록 방치하고 (대략 30분), 이후 플레이트를 돌려놓았다. 플레이트를 39℃에서 8-12시간 동안 배양하였다. 플라그 주변의 청정 영역 (헤일로, halo)에 대해 플레이트를 관찰하였다. 코어 플라그와 헤일로를 아가로부터 걷어내고 무균 마이크로 튜브에 이동시켰다. (대형 입구의 200㎕ 피펫 팁으로 목적하는 플라그를 함유하는 아가 플러그 (코어)로부터 제거하는 것이 용이하다. 파지를 500㎕의 SM 완충액에 재현탁시켰다. 20㎕의 클로로포름을 첨가하여 임의의 추가의 세포 성장을 억제하였다.
순수 클론의 분리: 5㎕의 재현탁된 파지 현탁액을 500㎕의 대장균 MRF' 세포 (OD600=1.0)에 첨가하였다. 37℃에서 15분 동안 배양하였다. 파지/세포 현탁액이 배양되는 동안, 600㎕의 목적하는 폴리사카리드 염료-라벨링된 기질 (일반적으로 1-2% w/v)을 3.0mL NZY 탑 아가에 50℃에서 첨가하고 완전히 혼합하였다. (필요할 때까지 용액을 50℃로 유지하였다.) 세포 현탁액을 기질/탑 아가 용액으로 옮기고 부드럽게 혼합하였다. 용액을 소형 (90mm) NZY 배지 플레이트에 즉시 쏟아부었으며 탑 아가를 완전히 고형화되도록 방치하고 (대략 30분), 이후 플레이트를 돌려놓았다. 플레이트를 39℃에서 8-12시간 동안 배양하였다. 단일 플라그 (순수 클론) 주변의 청정 영역 (헤일로)에 대해 플레이트를 관찰하였다. (만약 단일 플라그가 분리될 수 없다면, 역가를 맞추고 파지 현탁액을 재플레이팅한다.) 파지를 500㎕의SM 완충액에 재현탁시켰으며 20㎕의 클로로포름을 첨가하여 임의의 추가의 세포 성장을 억제하였다.
순수 클론의 절단: 실온에서 2 내지 3시간 동안 또는 4℃에서 밤새 배양되도록 순수 파지 현탁액을 방치하였다. 100㎕의 순수 파지 현탁액을 200㎕의 대장균 MRF' 세포 (OD600=1.0)에 첨가하였다. 1.O㎕의 ExAssist 헬퍼 파지 (> 1 × 106pfu/mL; Stratagene)을 첨가하였다. 현탁액을 37℃에서 15분 동안 배양하였다. 3.0 mL의 2 × YT 배지를 세포 현탁액에 첨가하였다. 37℃에서 2-2.5시간 동안 진동시키면서 배양하였다. 튜브를 70℃로 20분 동안 이동시켰다. 50-100 ㎕의 파지미드(phagemid) 현탁액을 200㎕의 대장균 Exp 505 세포 (OD600=1.0)를 함유하는 마이크로 튜브로 이동시켰다. 현탁액을 37℃에서 45분 동안 배양하였다. 100㎕의 세포 현탁액을 LBkan 50배지 (카나마이신 50㎍/mL을 갖는 LB 배지) 상에 플레이팅하였다. 현탁액을 37℃에서 8-12시간 동안 배양하였다. 콜로니에 대해 플레이트를 관찰하였다. 성장하는 임의의 콜로니는 순수 파지미드를 함유한다. 콜로니를 들어올리고 소형 (3-lOmL) 액체 배양물로 8-12시간 동안 성장시켰다. 배양 배지는 LBkan 50이다.
활성 검증: 1.OmL의 액체 배양물을 무균의 마이크로 팁으로 옮겼다. 13200 rpm (16000 g)에서 1분 동안 원심분리하였다. 상청액을 버리고 200㎕의 인산 완충액 pH 6.2를 첨가하였다. 얼음 상에서 마이크로 팁을 사용하여 5 내지 10초 동안 초음파처리하였다. 200㎕의 적절한 기질을 첨가하고, 부드럽게 혼합하고 37℃에서1.5-2시간 동안 배양하였다. 단지 버퍼와 기질만을 함유하는 음성 대조군을 또한 작동시켰다. 1.OmL의 무수 에탄올 (200도)을 현탁액에 첨가하고 혼합하였다. 13200 rpm에서 10분 동안 원심분리하였다. 상청액의 색을 관찰하였다. 착색량은 다양할 수 있지만, 임의의 튜브에 대해서도 활성에 대해 양성으로 고려되는 대조군보다 더 착색되었다. 만약 목적하거나 또는 필요하다면 이 단계에서 분광분석기가 사용될 수 있다. (아조-자일란, Megazyme, 590nm에서 읽음).
몇가지 라이브러리로부터 얻은 순수 클론의 RFLP: 1.OmL의 액체 배양물을 무균의 마이크로 튜브로 옮겼다. 13200 rpm (16000 g)에서 1분 동안 원심분리하였다. 플라스미드 분리를 위한 QIAprep 스핀 미니 키트 (Qiagen) 프로토콜이 이어졌으며 용출 완충액으로 40㎕의 성수가 사용되었다. 10㎕의 플라스미드 DNA를 무균의 마이크로 튜브로 옮겼다. 1.5 ㎕의 완충액 3 (New England Biolabs), 1.5㎕ 100× BSA 용액 (New England Biolabs) 및 2.0㎕ 성수를 첨가하였다. 여기에 1.O㎕ Not 1 및 1.0㎕ Pst 1 제한 엔도뉴틀레아제 (New England Biolabs)를 첨가하였다. 1.5시간 동안 37℃에서 배양하였다. 3.0㎕의 6× 로딩 버퍼 (Invitrogen)를 첨가하였다. 15㎕의 분해된 시료를 1.0% 아가로스 젤 상에 1-1.5시간 동안 120 볼트에서 전개시켰다. 젤 이미지 출력기로 젤을 관찰하였다. 상이한 분해 패턴으로 모든 클론 상에서 서열 분석을 수행하였다.
표 6은 본 발명의 예시적 효소의 다양한 특성을 기재한 것이다.
* 기질로서 AZO-AZO-자일란을 사용하는 초기 속력에 의해 결정된 최적 pH 또는 온도
** 효소가 명백한 활성 (대략 > 50%)을 유지하는 열 안정성, 시간
*** 반죽 컨디셔닝
**** 동물 사료 응용에 대한 내열성 발달에 대한 GSSMTM페어런트
***** -공지의 지식을 기초로- 낮은 pH 활성의 증가하도록 이루어진 N35D 돌연변이 - 돌연변이 효소의 상대적 활성이 pH 4에서 현저하게 증가하였다
****** 반죽 컨디셔닝
실시예 2: 내열성 돌연변이체에 대한 GSSM TM 스크린
이하의 실시예는 내열성 효소에 대한 예시적 스크리닝 방법을 기재한 것이다.
마스터 플레이트: 96 웰 플레이트를 라벨링함으로써 및 200 ㎕ LB Amp100을 각 웰로 분취함으로써 콜로니 수확기(picker)에 대한 플레이트를 제조하였다. (96 웰 플레이트 당 ~20ml 필요). 수확기로부터 플레이트를 되돌려보낸 이후, 플레이트 A로부터 6열로부터 배지를 제거하였다. 서열 번호 189의 배양물로 대치하였다. 37℃ 습윤 인큐베이터에서 밤새 방치하였다.
분석 플레이트: 신선한 96 웰 플레이트 내에서 배양물을 찍어내었다 (200㎕/웰 LB Amp 100). 플라스틱 커버를 제거하고 기체 투과성 밀봉으로 대치하였다. 습윤 인큐베이터에서 밤새 방치하였다. 밀봉을 제거하고 플라스틱 뚜껑으로 대치하였다. 배양물을 테이블 상에서 하향 회전시키고 3000 rpm에서 10분 동안 원심분리하였다. 종이 타올 상에서 전환시킴으로써 상청액을 제거하였다. 45㎕ Cit-Phos-KCl 버퍼 pH 6을 각 웰 내로 분취하였다. 플라스틱 뚜껑을 알루미늄 플레이트 밀봉으로 대치하였다. 롤러를 사용하여 우수한 밀봉을 얻었다. 세포를 플레이트 진동기에서 6-7 레벨로 ~30초 동안 재현탁시켰다.
96 웰 플레이트를 80℃ 인큐베이터에 20분 동안 위치시켰다. 겹치지 않게 한다. 이후, 즉시 플레이트를 제거하고 얼음물로 몇초 동안 냉각시켰다. 알루미늄 밀봉을 제거하고 플라스틱 뚜껑으로 대치하였다. 30㎕의 2% 아조-자일란을 첨가하였다. 플레이트 진동기 상에 올리기 이전에 혼합하였다. 37℃에서 습윤 인큐베이터에서 밤새 배양하였다.
200㎕ 에탄올을 각 웰에 첨가하고 수회 피펫을 들어올렸다 내렸다 하면서 혼합하였다. 대안으로서 각 회마다 팁을 교환하고, 에탄올 세척으로 세정하고 종이 타올로 닦아냄으로써 건조시켰다. 플레이트를 3000 rpm에서 10분 동안 회전시켰다. 신선한 96 웰 플레이트에서 100㎕의 상청액을 제거하였다. OD590을 읽었다.
실시예 3: 내열성 돌연변이체의 히트 검증을 위한 GSSM TM 분석
이하의 실시예는 내열성 효소를 분석하는 예시적 방법을 기재하고 있다.
이중의 96 웰 플레이트 내에서 배양물을 찍어내거나 또는 들어올렸다 (200㎕/웰 LB Amp 100). 플라스틱 커버를 제거하고 기체 투과성 밀봉으로 대치하였다. 습윤 인큐베이터에서 밤새 방치하였다. 밀봉을 제거하고 플라스틱 뚜껑으로 대치하였다. 고형 아가로 클론을 찍어내었다. 배양물을 테이블 상에서 하향 회전시키고 3000 rpm에서 10분 동안 원심분리하였다. 종이 타올 상에서 전환시킴으로써 상청액을 제거하였다. 25㎕ BPER/리소자임/DNase 용액 (이하 참조)을 각 웰 내로 분취하였다. 세포를 플레이트 진동기에서 6-7 레벨로 ~30초 동안 재현탁시켰다.
얼음 상에서 15분 동안 배양하였다. 20㎕의 Cit-Phos-KCl 버퍼 pH 6을 각 웰내로 첨가하였다. 플라스틱 뚜껑을 알루미늄 플레이트 밀봉으로 대치하였다. 롤러를 사용하여 우수한 밀봉을 얻었다. 세포를 플레이트 진동기에서 6-7 레벨로 ~30초 동안 혼합하였다.
하나의 96 웰 플레이트를 80℃ 인큐베이터에 다른 것은 37℃에서 20분 동안 위치시켰다. 겹치지 않게 한다. 즉시 플레이트를 제거하고 얼음물로 몇초 동안 냉각시켰다 (필요하다면 대형 플라스틱 트레이를 사용한다). 알루미늄 밀봉을 제거하였다. 30㎕의 2% 아조-자일란을 첨가하였다. 플라스틱 기체 투과성 밀봉으로 밀봉하였다. 플레이트 진동기 상에 올리기 이전에 혼합하였다. 37℃ 및 80℃ 플레이트 세트를 습윤 인큐베이터에서 37℃에서 2시간 동안 나머지는 4시간 동안 배양하였다.
배양 이후, 플레이트를 ~5분 동안 실온에 방치시켰다. 200㎕ 에탄올을 각 웰에 첨가하고 수회 피펫을 들어올렸다 내렸다 하면서 혼합하였다. 각 회마다 팁을 교환하는 대신, 에탄올 세척으로 세정하고 종이 타올로 닦아냄으로써 건조시켰다. 플레이트를 3000 rpm에서 10분 동안 회전시켰다. 다만, 각 클론에 대해 새로운 세트의 팁을 사용하였다. 3000rpm에서 10분 동안 플레이트를 회전시켰다. OD590을 읽었다.
BPER/리소자임/DNase 용액 (총 4.74 mL):
4.5 mL BPR
200 ㎕ 10 mg/mL 리소자임 (pH 6 Cit-phos-버퍼로 신선하게 만들어짐)
40 ㎕ 5 mg/mL DNase I (pH 6 Cit-phos-버퍼로 신선하게 만들어짐)
실시예 4: 기질로서 밀 아라비노자일란을 사용한 자일라나제 분석
이하의 실시예는, 본 발명의 범위 내에서 예컨대, 효소를 측정하기 위해 사용될 수 있는 예시적 자일라나제 분석을 기재하고 있다.
SEQ ID NOS: 11, 12, 69, 70, 77, 78, 113, 114, 149, 150, 159, 160, 163, 164, 167, 168, 181, 182, 197, 및 198이 pH 8 (Na-인산 버퍼) 및 70℃에서 밀 아라비노자일란을 기질로서 사용하는 분석의 대상이 되었다. 효소는 표 7에 기재된 바와 같이 특성화되었다.
* 각 시료에 1 mL의 물을 첨가하는 것에 기초함.
단위는 환원당 분석을 기초로 분 당 방출된 μ몰 자일로스이다.
실시예 5: 본 발명의 예시적 자일라나제의 제조
이하의 실시예는 "9×" 변이체 또는 돌연변이체 (서열 번호 377로 기재된 핵산, 서열 번호 378로 기재된 폴리펩티드 서열)로서 표시되는 유전자 부위-포화 돌연변이 유도 (GSSMTM) 기술을 사용하여 본 발명의 예시적 자일라나제의 제조를 기재하고 있다.
(서열 번호 189에 의해 암호화된) 예시적 서열 번호 190, "야생형" 자일라나제에서 점 돌연변이의 포괄 라이브러리(comprehensive library)를 제조하는데 있어 GSSMTM이 사용되었다. 전술한 자일라나제 내열성 스크린은 야생형 효소에 비해 향상된 내열성을 갖는 9개의 단일 부위 아미노산 돌연변이를 확인시켜 주었다 (도 6A) (D8F, Q11H, N12L, G17I, G60H, P64V, S65V, G68A & S79P) (80℃에서 20분 동안 이하의 열 자극으로 측정됨). 야생형 효소 및 모든 9개의 단일 부위 아미노산 돌연변이체는 대장균에서 생성되었으며 N-말단 헥사히스티딘 택(tag)을 이용하여 정제되었다. 택에 의한 활성의 차이는 감지할 수 없었다.
도 6은 "변이체 9×", 또는, (서열 번호 189에 의해 암호화되는) 예시적 서열 번호 190 "야생형" 효소의 유전자 부위 포화 돌연변이 유도 (GSSMTM)에 의해 발생된 것으로서 (서열 번호 377에 의해 암호화되는) 서열 번호378로 기재된 것인 9개의 단일 부위 아미노산 돌연변이체를 도시하고 있다. 도 6A는 "야생형" 유전자 (서열 번호 189에 의해 암호화된 서열 번호 190)의 내열성 점 돌연변이에 대한 위치, 번호 및 아미노산 변화를 도시하는 개략도이다. 유전자에서 모든 아미노산 위치마다 전체 64 코돈의 라이브러리가 생성되었으며 (~13,000 돌연변이체) 내열성이 증가된 돌연변이체를 스크리닝하였다. 9개의 단일 부위 돌연변이체를 하나의 효소로 조합함으로써 "9×" 변이체가 생성되었다. 각 돌연변이체 효소에 대해 대응하는융점 온도 전이 중간지점 (Tm)은 DSC에 의해 측정되었으며 "9×" (서열 번호 378) 변이체를 오른쪽에 보였다. 도 6B는 폴딩되지 않은 "야생형" (서열 번호 190) "9×" (서열 번호 378)를 도시하였다. "변이체/돌연변이체" 효소가 DSC에 의해 주사 속도 1℃/min으로 모니터링되었다. 베이스라인을 감안한 DSC 데이타가 단백질 농도에 대해 표준화되었다.
자일라나제 활성 분석
550㎕의 CP (시트레이트-포스페이트) 버퍼, pH 6.0 지시된 온도에서 400㎕의 2% 아조-자일란을 기질로써 사용하여 효소 활성이 측정되었다. pH의 함수로서 활성의 측정은 50 mM Britton 및 Robinson 버퍼 용액 (pH 3.0, 5.0, 6.0, 7.0, 8.0 및 9.0)을 사용하여 측정되었으며 이는 0.1 M 인산 용액, 0.1M 붕산 및 0.1 M 아세트산을 혼합하으로써 이어서 1 M 수산화 나트륨으로 pH를 조정함으로써 제조되었다. 50㎕의 0.1 mg/ml 정제된 효소를 첨가함으로써 반응이 개시되었다. 0부터 15분까지시간 지점을 취하였으며 여기서 50 ㎕의 반응 혼합물을 200 ㎕의 침전 용액 (100% 에탄올)에 첨가하였다. 모든 시간 지점을 다 취한 후에, 시료를 혼합하고, 10분 동안 배양하고 4℃ 3000 g에서 10분 동안 원심분리하였다. 상청액 (150 ㎕)을 신선한 96 웰 플레이트로 분취하고 590 nm에서 흡광도를 측정하였다. A590값을 시간에 대해 플롯하고 직선의 기울기로부터 초기 속력을 측정하였다.
시차주사 열량법 (Differential Scanning Calorimetry, DSC).
데이타 수집을 위해 DSCRun 소프트웨어 패키지, 분석을 위해 CpCalc, 마이크로와트로부터 몰 열용량으로의 전환을 위해 CpConvert 그리고 계산을 위해 CpDeconvolute를 사용하는 Model 6100 Nano II DSC 장비 (Calorimetry Sciences Corporation, American Fork, UT)를 사용하여 열량법이 수행되었다. 20 mM 인산 칼륨 (pH 7.0) 및 100 mM KCl 중의 1mg/ml 재조합 단백질로 주사 속도 1℃/min으로 분석이 수행되었다. 가열에 의한 용액의 가능한 탈기체화를 막기 위해 전체 DSC 실험 동안 5 atm의 일정한 압력이 유지되었다. 버퍼로 충진된 두 세포로 실험 이전에 일반적으로 장비 베이스라인을 기록하였다. 최초 작동의 냉각 이후 즉시 열량계 세포에서 용액을 재가열함으로써 열 유도 전이의 가역성이 테스트되었다.
내열성 측정.
20 mM 인산 칼륨 (pH 7.0) 및 100 mM KCl 중에서 내열성에 대하여 전체 효소를 80℃에서 분석하였다. 효소를 80℃에서 0,5, 10 또는 30분 동안 얇은-벽 튜브에서 가열하였으며 얼음 상에서 냉각하였다. 아조-자일란을 기질로써 활성 측정에 대해 전술한 분석을 사용하여 잔류 활성이 측정되었다.
폴리사카리드 지문(Fingerprinting)
탄수화물 젤 전기영동(PACE)을 사용하는 폴리사카리드 분석에 의해 폴리사카리드 지문이 측정되었다. 비치우드(Beechwood) 자일란 (0.1 mg/mL, 100 ㎕, Sigma, Poole, Dorset, UK) 또는 자일로올리고사카리드 (1 mM, 20 ㎕, Megazyme, Wicklow, Ireland)를 총 부피 250 ㎕에서 16시간 동안 효소 (1-3 ㎍)로 처리하였다. 반응을 0.1 M 암모늄 아세테이트 pH 5.5로 완충시켰다. 효소, 폴리사카리드/올리고사카리드 또는 라벨링 시약 중에 임의의 불특정 화합물을 확인하기 위해, 기질 또는 효소가 없는 대조군으로 동일한 조건 하에서 수행하였다. 20분 동안 끓임으로써 반응을 정지시켰다. 각 조건에 대해 적어도 2회 개별적으로 분석을 수행하였다. ANTS (8-아미노나프탈렌-1,3,6-트리설폰산, Molecular Probes, Leiden, The Netherlands)를 이용하는 유도체화, 전기영동 및 이미지화를 기재된 바대로 수행하였다 (Goubet, F., Jackson, P., Deery, M. and Dupree, P. (2002) Anal. Biochem. 300, 53-68).
적합성 계산(Fitness Calculation).
변성 온도 전이 중간지점 (Tm)의 증가 및 모든 변이체를 가로지르는 각 파라미터에서 가장 큰 차이에 대하여 상대적인 효소 활성의 증가 (또는 감소)를 동등하게 비중을 둠으로써 주어진 효소 변이체에 대한 적합성 (Fn), n이 계산되었다: Fn= FTn+ FVn이고, 여기서 FTn= 변이체의 Tm적합성 팩터이고 그리고 FVn= 변이체의 활성 적합성 팩터이다. 각각 (Tm및 활성)의 적합성 팩터는 Tm또는 모든 변이체를 가로지르는 속도에서 가장 큰 차이에 상대적이다. FTn= (Tm- TmL) / (TmH- TmL)이고 여기서 Tmn은 주어진 변이체, n에 대한 Tm이고, 그리고 TmL은 모든 변이체를 가로지르는 가장 낮은 Tm이고 그리고 TmH는 모든 변이체를 가로지르는 가장 높은 Tm이고 FVn= (Vn- VL) / (VH- VL)이고 여기서 Vn은 주어진 변이체, n에 대한 상대 속도이고, 그리고 VL은 모든 변이체를 가로지르는 가장 낮은 속도이고 그리고 VH는 모든 변이체를 가로지르는 가장 높은 속도이다.
GSSM TM 방법에 의한 진화.
예시적 본 발명의 자일라나제 서열 번호 378 (서열 번호 377에 의해 암호화되는)를 포함하는 예시적 본 발명의 자일라나제 서열 번호 190 (서열 번호 189에 의해 암호화되는) 중에서 점 돌연변이의 포괄 라이브러리를 제작하는데 있어 GSSMTM기술이 사용되었다. 전술한 자일라나제 내열성 스크린은, 80℃에서 20분 동안 열 자극에 이어 측정된 것으로써, 예시적 "야생형" 효소 서열 번호 190 (서열 번호 189에 의해 암호화되는)에 비해 향상된 내열성을 갖는 9개의 단일 부위 아미노산 돌연변이 (도 6A), D8F, Q11H, N12L, G17I, G60H, P64V, S65V, G68A & S79P를 확인시켜주었다. 야생형 효소 및 모든 9개의 단일 부위 아미노산 돌연변이체는 대장균에서 생성되었으며 N-말단 헥사히스티딘 택을 이용하여 정제되었다. 택에 의한 활성의 차이는 감지할 수 없었다.
효소 활성에 대한 단일 아미노산 돌연변이의 효과를 측정하기 위해, 9개의 모든 돌연변이체를 정제하였으며 그들의 자일라나제 활성 (야생형 최적 온도, 70℃에서 초기 속도)이 예시적 서열 번호 190 "야생형" 효소에 대해 비교되었다. 야생형 (초기 속도를 1.0으로 표준화됨)에 대해 D8F, N12L, G17I, G60H, P64V, S65V G68A 및 S79P 돌연변이체 (상대적 초기 속도 각각 0.65, 0.68, 0.76, 1.1, 1.0, 1.2, 0.98 및 0.84)의 효소 활성이 비교되었으며 이는 이들 돌연변이가 그들의 효소 활성을 현저하게 바꾸지 않는 것을 확인시켜 주었다. 초기 속도는 3 또는 그 이상의 시간에서 측정되었으며 그리고 편차는 전형적으로 10 % 이하였다. 이들 8개의돌연변이체와는 대조적으로, 최선 내열성의 단일 부위 돌연변이체, Q11H (상대적 초기 속도 0.35)에 대해 효소 활성에 있어 현저한 감소가 관찰되었다.
"야생형" 및 내열성 단일 부위 아미노산 돌연변이체 효소의 융점 온도(T m ).
정제된 서열 번호 190 "야생형" 자일라나제 및 9개의 내열성 단일 부위 아미노산 돌연변이체가 시차 주사 열량법 (DSC)을 사용하여 분석되었다. 그것의 열 변성에 대한 DSC 트레이스에서 어깨 부분에 의해 증명되는 것으로서 야생형 효소에 대해 응집이 명백하다, 도 6B 참조. 진화된 돌연변이체 효소는 응집의 증거를 보이지 않았다. 모든 효소에 대해, 열 유도 변성은 비가역적이며 시료의 두번째 주사에서 식별할 수 있는 전이가 관찰되지 않았다. 변성의 비가역성 때문에, 단지 겉보기 Tm(융점 온도)만이 계산될 수 있다 (예컨대, Sanchez-Ruiz (1992) Biophys. J. 61: 921-935; Beldarrain (2000) Biotechnol. Appl. Biochem. 31: 77-84에 기재된 바와 같이). 야생형 효소의 Tm은 61℃이며 모든 점 돌연변이체에서 증가하였으며 64℃ 내지 70℃ 범위이었다 (도 6A). 야생형에 대해 Q11H 돌연변이가 가장 큰 증가 (Tm= 70℃)를 도입하였으며 이어서 P64V (69℃), G17I (67℃) 및 D8F (67℃)이었다.
"9×" 조합 GSSMTM예시적 효소 서열 번호 378
부위-지향 돌연변이 유도 (도 6A)에 의한 9개의 내열성 상승 돌연변이체의 단일 부위 변화를 조합함으로써 "9×" 효소 (서열 번호 378)가 구축되었다. "9×" (서열 번호 378) 효소가 대장균에서 발현되었으며 균질하도록 정제되었다. 융점 온도를 측정하기 위해 DSC가 수행되었다. "9×" 효소의 Tm은 서열 번호 190, "야생형" 효소보다 34도 높았으며, 이는 그것의 열적 안정성의 엄청난 전이를 보여주는 것이다 (도 6B).
효소의 생화학적 성질에 대한 조합된 돌연변이 및 융점 온도의 상승의 효과를 평가하기 위해, pH 및 온도 프로파일이 구축되었으며 서열 번호 190, "야생형" 효소와 비교되었다. 도 7은 "야생형" 및 "진화된" 9× 돌연변이체 효소의 생화학적 특성을 도시하고 있다. 도 7A는 야생형 및 진화된 9× 돌연변이체 효소에 대한 활성의 pH-의존성을 도시하고 있다. 자일라나제 활성이 37℃ 각 pH에서 측정되었으며 초기 속력(rate)을 측정하기 위해 초기 속도(velocity)가 590 nm에서의 흡광도에 대해 플롯되었다. 도 7B는 야생형 및 진화된 9× 돌연변이체 효소에 대한 활성의 온도-의존성을 도시하고 있다. 야생형 및 진화된 9× 돌연변이체 효소의 최적 온도는 25-100℃ 온도 범위에서 pH 6.0에서 측정되었으며 5분에 걸친 초기 속도를 기초로 한다. 도 7C는 야생형 및 진화된 9× 돌연변이체 효소의 열 안정성을 도시하고 있다. 야생형 및 진화된 9× 돌연변이체 효소의 활성의 열 의존도는 먼저 효소를 각각의 지시된 온도에서 5분 동안 가열함으로써 이어서 실온으로 냉각함으로써 그리고 잔류 활성 (37℃, pH 6.0에서 초기 속도)을 측정함으로써 측정되었다. 모든 실험에서 초기 속도는 2 또는 그 이상 측정되었으며 편차는 10 % 이하이었다.
서열 번호 190 및 서열 번호 378 ("9×" 돌연변이체) 효소는 pH 5와 6 사이에서 가장 높은 활성으로 비교할만한 pH/활성 프로파일을 갖는다 (도 7A). 두 효소는 70℃에서 최적의 유사한 초기 속도/온도를 갖지만, 그렇지만, 서열 번호 190, "야생형" 효소가 더 낮은 온도 (25-50℃)에서 더 높은 활성을 가지며, 서열 번호 378 ("9×" 돌연변이체)은 기질의 존재하에서 100℃까지 그것의 활성의 60% 이상을 유지한다 (초기 속도에 의해 결정됨) (도 7B). 서열 번호 190, "야생형" 효소의 활성은 70℃ 이상의 온도에서 검출할 수 없엇다.
효소 내열성에 대한 9개의 조합된 돌연변이의 효과를 측정하기 위해, 잔류 활성이 측정되었으며 서열 번호 190, "야생형" 효소에 대해 비교되었다. 각 온도 (37, 50, 60, 70, 80 및 90℃)에서 5분 동안 열 자극에 의해 이어서 37℃에서 활성 측정으로 잔류 활성이 측정되었다. 서열 번호 190은 70℃ 이상에서 완전히 불활성화되었으며 진화된 9× 돌연변이체는 70, 80 및 심지어 90℃로 가열한 이후에도 현저한 활성을 나타내었다 (도 7C). 또한, 온도가 증가함에 따라 비록 야생형 효소의 활성이 감소하였지만, 9× 변이체는 온도를 60℃까지 가열함으로써 어느정도 활성화되었다.
유전자 재조립(GeneReassembly) TM 기술을 이용한 조합 GSSM TM 변이체 제조.
9개의 단일 부위 아미노산 돌연변이체의 조합 변이체를 확인하기 위해 추가적으로 구축된 서열 번호 378 ("9×" 변이체)에 대해 최대 내열성 및 활성이 비교되었으며, 모든 가능한 돌연변이체 조합 (29)의 유전자 재조합 라이브러리 (미국 특허 6,537,776)가 구축되었으며 스크리닝되었다. 확인된 9개 돌연변이의 33개의 독특한 조합의 스크리닝 기준으로써 내열성을 사용하는 것이 본래 9× 변이체인 것으로 확인되었다. 진화된 9×보다 더 높은 활성/발현을 갖는 변이체를 선택하기 위해 2차적 스크린이 수행되었다. 이런 스크린은, 본래 단일 돌연변이의 6과 8 사이에서 다양한 조합으로 가공되는 서열을 갖는 10 변이체를 제조해 내었으며, 도 8A에 도시되었다. 도 8은 유전자 재조립TM기술을 사용하여 확인된 조합 변이체를 도시하고 있다. 도 8A는 9개의 GSSMTM점 돌연변이의 모든 가능한 조합의 유전자 재조립TM라이브러리를 도시하고 있으며 이는 향상된 내열성 및 활성을 갖는 변이체에 대해 구축되고 스크리닝된 것이다. 9× 변이체를 포함하여 11개의 변이체가 얻어졌다. 도에 보여지는 바와 같이, 변이체는 점 돌연변이의 다양한 조합으로 6, 7, 8, 또는 9를 갖는다. 각 변이체의 DSC에 의해 측정된 대응하는 융점 온도 전이 중간지점 (Tm)을 오른쪽에 보였다. 도 8B는 최적 온도 (70℃) 및 pH 6.0에서 야생형에 비교된 6×-2 및 9× 변이체의 상대적 활성을 도시한 것이다 (5분 시간 지점에 걸쳐 초기 속도가 측정되었다). 에러 바는 3회 측정에 대한 초기 속도의 범위를 나타낸다.
각 조합 변이체의 융점 온도 (Tm)는 야생형보다 적어도 28℃ 이상이었으며 (도 8A) 그리고 모든 재조립 변이체는 9× 효소보다 상대적으로 더 높은 활성을 보였다. 하나의 변이체, 특히 6×-2의 활성은, 야생형 효소보다 컸으며 9× 효소보다 현저히 컸다 (1.7×) (도 8B). 재조립 변이체의 서열 비교는 적어도 6개의, 증가된 열 안정성 (> 20도)이 요구되었던 돌연변이를 확인시킨다. 초기 열 안정성 스크린에서 발견된 모든 33개의 독특한 변이체는 그들의 내열성에 중요한 두개의 Q11H 및G17I 돌연변이 표시를 포함하였다.
야생형 및 변이체 폴리사카리드 생성물 지문의 분석.
"야생형, "6×-2 및 9× 변이체에 의해 제조된 생성물이 탄수화물 젤 전기영동 (PACE)을 사용하는 폴리사카리드 분석에 의해 비교되었다. 자일라나제에 의한 가수분해에 대해 상이한 기질 (올리고사카리드 및 폴리사카리드)이 시험되었다. 테스트된 3 자일라나제의 소화 생성물은 도 9에 도시된 바와 같이 매우 유사하였다. 모든 3 효소가 (Xyl)6및 (Xyl)5를, 주로 (Xyl)3및 (Xyl)2로 가수분해하고, 그리고 (Xyl)4를 (Xyl)2로 가수분해하였다 (도 9A). (Xyl)3의 (Xyl)2및 Xyl로의 단지 소량의 가수분해가 관찰되었으며 이는 (Xyl)3이 효소에 대한 상대적으로 나쁜 기질임을 의미한다. (Xyl)2상에서는 활성이 검출되지 않았다. 글루쿠로노실 잔기를 함유하는 비치우드 자일란은 모든 세가지 효소에 의해 주로 (Xyl)2및 (Xyl)3으로 가수분해되지만, 올리고자일란 밴드 사이로 이동된 다른 밴드가 검출되었다 (도 9B). PACE 분석에서, 각 올리고사카리드는 당 조성물 및 중합화 정도에 좌우되는 특정 이동을 가지며 (Goubet, F., Jackson, P., Deery, M. and Dupree, P. (2002) Anal. Biochem. 300, 53-68), 따라서, 이들 밴드는 올리고글루쿠로노자일란에 유사하게 대응한다. 이후, 진화된 효소는 "야생형" 효소의 기질 특이성을 보유한다.
전술한 바와 같이, 도 9는 PACE에 의해 측정된 것으로서 (서열 번호 189에 의해 암호화되는) "야생형" 서열 번호190, 6×-2 (서열 번호 379에 의해 암호화되는 서열 번호380) 및 서열 번호 378 ("9×" 돌연변이체) 효소 변이체의 생성물 지문을 도시한 것이다. 도 9A는 "야생형" 및 변이체 효소에 의한 올리고자일란 (Xyl)3, (Xyl)4, (Xyl)5및 (Xyl)6의 가수분해 이후 얻어진 지문을 도시하고 있다. 대조 레인은 효소의 부재시 분석 조건 하에서 배양된 올리고사카리드를 함유한다. 도 9B는 야생형 및 변이체 효소에 의한 비치우드 자일란의 가수분해 이후 얻어진 지문을 도시하고 있다. 표준은 (Xyl)2, (Xyl)3, (Xyl)4를 함유한다. 모든 분석은 37℃ 및 pH 5.5에서 수행되었다.
다수의 산업상 시장 응용시 제조 양립가능성에 대해 최적인 높은 활성, 열적 안정한 자일라나제를 신속하게 제조해내기 위해 실험실 유전자 진화 전략의 조합이 사용되었다. 예시적 "야생형" 자일라나제 (서열 번호 189에의해 암호화되는) 서열 번호 190의 전체 서열을 스캔하는데 그리고 내열성을 향상시키는 9개의 점 돌연변이를 확인하는데 있어 GSSMTM방법론이 사용되었다. 비록 그것이 효소의 가수분해 생성물 프로파일에 대해서는 감지할 수 있는 효과가 없지만, 도 9에 도시된 바와 같이, 단백질 서열에 9개 돌연 변이의 첨가는 서열 번호 190 ("야생형")의 최적 온도 70℃에서의 효소 특이적 활성의 적당한 감소를 초래하였다, 도 9B 참조. 유전자 재조립TM방법을 사용하여 9개의 단일 부위 아미노산 돌연변이체의 조합 라이브러리를 생성시켰으며, 활성에 있어서 이런 감소가 극복되었다. "9×" 변이체 보다 더 나은 활성을 갖는 10개의 열 안정성 변이체 (Tm89℃와 94℃ 사이)가 유전자 재조립TM라이브러리 스크리닝으로부터 발견되었다. Tm90℃를 가지며, 야생형을 능가하는 효소 특이적 활성 및 생성물 지문이 바뀌지 않았으며 서열 번호 190 ("야생형")에 비해, (SEQID NO: 380, 서열 번호 379에 의해 암호화되는) 6×-2 변이체가 특히 눈에 띈다. 우리의 지식으로 이들 변이체에 대해 얻어진 Tm이동은 진화 기술에 대한 응용으로부터 가장 큰 증가로 보고된 것이다.
서열 번호 380 (6×-2 변이체)는, 서열 번호 190 ("야생형"): D8F에 비해 다음의 변화를 포함한다, Q11H, G17I, G60H, S65V 및 G68A. 서열 번호 379는, "야생형" 서열 번호 189에 비해 다음의 뉴클레오티드 변화를 포함한다: 뉴클레오티드 위치 22 내지 24가 TTC, 뉴클레오티드 위치 31 내지 33이 CAC, 뉴클레오티드 위치 49 내지 51이 ATA, 뉴클레오티드 위치 178 내지 180이 CAC, 뉴클레오티드 위치 193 내지 195가 GTG, 뉴클레오티드 위치 202 내지 204가 GCT.
목적하는 표현형에 대한 점 돌연변이체의 첨가에 대한 조합 혼합의 유효성을 평가하기 위해, 효소 활성 및 열안정성에서 변화로부터 기여를 조합한 적합성 파라미터가 각 돌연변이체에 대해 계산되었다. 본원에 기재된 용어 적합성은 다른 효소에 비교될 수 있는 객관적인 측정은 아니지만, 이 특정 자일라나제를 향한 진화에 대한 성공의 측정을 허용하는 용어이다. 효소 적합성, F는 이 세트의 변이체에 대해 Tm및 효소 활성에서 동등한 비중을 차지하는 변화에 의해 계산되기 때문에, 최대 허용 적합성 값은 2 이다 (FT≤ 1 및 FV≤ 1, 상기 참조). 달리 말하면, 만약최대 활성을 갖는 변이체가 또한 가장 높은 Tm을 갖는다면, 그것의 적합성 값은 2가 될 것이다. 적합성 값이 거의 2인 경우 (도 10B 참조), 6×-2 변이체 (서열 번호 380, 서열 번호 379에 의해 암호화되는)가 열 안정성 및 효소 활성의 가능한 가장 최선의 조합을 갖는 것에 가깝다. 가장 높은 적합성 값을 제공하는 단일 부위 돌연변이는 S65V이다. 비록 S65V 돌연변이체의 Tm이 Q11H 돌연변이체의 것보다 더 낮지만 (각각 66℃ 대 70℃), 그것의 특정 활성이 야생형에 비해 감소되지 않았기 때문에 그것은 더 높은 적합성 값을 갖는다.
도 10A는 GSSMTM진화에 의해 얻어진 "야생형"에 대한 열 안정성 (Tm으로 대표되는) 향상의 레벨을 도시하는 개략도이다. 가장 높은 열 안정성을 갖는 단일 부위 아미노산 돌연변이체 및 조합 변이체 (각각 Q11H 및 "9×" (서열 번호 378))를 야생형에 비교하여 보였다. 도 10B는 GSSMTM및 유전자 재조립TM기술을 조합함으로써 얻어진 효소의 "적합성 다이아그램" 향상을 도시한 것이다. 화학식 F = FT + FV를 사용하여 적합성이 정의되었으며 여기서 적합성 (F)은 전술한 내열성 적합성 (FT) 및 상대적 활성 적합성 (FV)을 동등하게 비중을 둠으로써 계산된다. 가장 큰 적합성 (S65V)을 제공하는 점 돌연변이가 보였다. 모든 9개의 점 돌연변이를 조합하는 것은 또한 적합성이 향상되었다 (서열 번호 378, "9×"변이체). 그렇지만, 적합성에 있어서 가장 큰 향상은 최선의 변이체, 6×-2를 얻기 위한 GSSMTM및 유전자 재조립TM방법을 조합함으로써 얻어졌다 (서열 번호380).
유전자 재조립TM방법은 또한 향상된 열 안정성에 대한 절대적 필요성을 드러내는 중요한 잔기의 확인을 허용한다. 2개의 중요한 잔기 Q11H 및 G17I가 내열성을 기초로 확인된 모든 유전자 재조립TM변이체에 존재한다 (도 6A 참조). 단백질의 열 안정성에 대한 구조적 결정 인자는 연구되었으며, 예컨대, Kinjo (2001) Eur. Biophys. J. 30: 378-384; Britton (1999) J. Mol. Biol. 293: 1121-1132; Ladenstein (1998) Adv. Biochem. Eng. Biotechnol. 61: 37-85; Britton (1995) Eur. J. Biochem. 229: 688-695; Tanner (1996) Biochemistry 35: 2597-2609; Vetriani (1998) Proc. Natl. Acad. Sci. USA 95: 2300-2305에 의해 몇가지 이론이 정립되었다. 비록 단백질 안정성에 대한 각각의 기여가 완전히 이해되지는 않았지만, 수소 결합 패턴, 이온성 상호작용, 소수성 패킹 및 표면 루프(loop)의 감소된 길이가 그 중 중요한 팩터이다. 모든 가능한 단일 아미노산 치환은 상대적으로 극성, 하전되거나 또는 작은 (글리신) 잔기를 더 큰 소수성 잔기로 대치하는 것에 관여하는 것을 테스트하는 것으로부터 대부분의 유익한 점 치환이 확인된다는 것으로부터, 소수성 상호작용이 이 단백질의 열 안정성을 강화시키는데 있어 가장 현저힌 역할을 담당한다는 것을 추측할 수 있다. 심지어 내열성을 향상시키기 위한 최적의 상호작용에 대해 잘 이해한다고 해도, 그런 상호작용을 소개하는 돌연변이가 어디서 만들어지는지에 대한 예상은 직선적이지 않다. 그렇지만, GSSMTM방법을 사용하는 합리적이지 않은 접근은, 단백질 구조 내에서 모든 위치의 사이드체인의 신속한 샘플링을 허용한다. 그런 접근은 지금까지 발견된 바 없는 작용기 상호작용을소개하는 아미노산 치환의 발견을 초래하였다.
실시예 6: 본 발명의 자일라나제를 이요한 종이 펄프의 전처리
하나의 양태에서, 본 발명의 자일라나제는 종이 펄프의 전처리에 사용될 수 있다. 본 실시예는 자일라나제가 종이 펄프의 전처리에 유용한지 여부; 예컨대, 크래프트 (Kraft) 종이 펄프에 사용될 때 표백 화학물질의 사용을 감소시키는지 (예컨대, 이산화염소, ClO2)를 결정하기 위해 일반적인 예시적 스크리닝 프로토콜을 기재한다.
스크리닝 프로토콜은 두개의 대안적인 테스트 파라미터를 갖는다: 산소 탈리그닌화 단계 (포스트(post)-O2펄프) 이후 장일라나제 처리 충격; 및, 산소 탈목질화를 포함하지 않는 과정 중에 자일라내제의 충격 (프리(pre)-O2브라운스탁).
산업상 환경, 예컨대, 공장에서 반응 조건을 자극하는 펄프 처리 조건: pH 8.0; 70℃; 60 분 기간.
도 11의 흐름도에서 그 과정을 개략적으로 도시하였다.
이들 조건 하에서 활성인 20개의 자일라나제가 생화학적 테스트에 의해 확인되었다. 20개의 자일라나제 중에서, 그것이 화학적으로 표백되기 전에 크래프트 펄프 전처리에 그들이 사용될 때, 6개가 명백하게 ClO2요구량을 현저하게 감소시킬 수 있었다. 6개는: 서열 번호 182 (서열 번호 181에 의해 암호화되는) ; 서열 번호 160 (서열 번호 159); 서열 번호 198 (서열 번호 197에 의해 암호화되는); 서열 번호 168 (서열 번호 167에 의해 암호화되는); 서열 번호 216 (서열 번호 215에 의해암호화되는); 서열 번호 260 (서열 번호 259에 의해 암호화되는)이다. 나머지는 약간의 활성을 보였지만 우수하지는 않았다. 자일라나제 서열 번호 182 (서열 번호181에 의해 암호화되는) 그리고 서열 번호 160 (서열 번호 159에 의해 암호화되는)는 모듈 방식이며 탄수화물 결합 모듈 뿐 아니라 자일라나제 촉매 도메인을 함유한다. 단지 촉매 도메인 만을 함유하는 이들 2 자일라나제의 끝이 잘린 유도체가 본 응용에 더 효과적인 것으로 설명되었다. 최고의 자일라나제, 서열 번호 160 (서열 번호 159에 의해 암호화되는)를 더 포괄적으로 연구하였다. 결과는 다음과 같이 요약될 수 있다:
- 2 단위/g의 서열 번호 160 (서열 번호 159에 의해 암호화되는)에 의한 포스트-O2스프루스(spruce)/소나무/전나무 (SPF) 펄프의 전처리는 이어지는 ClO2사용을 22%로 감소시켰으며 65% GE 광도를 얻었다;
- 0.5 단위/g 서열 번호 160 (서열 번호 159에 의해 암호화되는)에 의한 프리-O2브라운스탁 SPF의 전처리는 이어지는 ClO2사용을 13%로 감소시켰으며 65% GE 광도를 얻었다;
- 0.5 단위/g 서열 번호 160 (서열 번호 159에 의해 암호화되는)에 의한 프리-O2아스펜(Aspen) 펄프의 전처리는 ClO2사용을 적어도 22%로 감소시킨다;
- 0.5 단위/g 서열 번호 160 (서열 번호 159에 의해 암호화되는)에 의한 프리-O2Douglas Fir/Hemlock 펄프의 전처리는 ClO2사용을 적어도 22%로 감소시킨다;
- 처리 조건 하에서 수행될 때, 동일한 카파 팩터에서 표백되었지만 자일라나제로는 처리되지 않았을 때와 비교된 때, 자일라나제 처리로부터 수득률 감소는 펄프에 비해 0.5%를 초과하지 않았다;
- 포스트-O2SPF 펄프를 SEQ ID NOS: 159, 160로 처리하기 위한 최적 조건은, pH 6-7, 효소량 0.3 단위/g, 처리 시간 20-25분이다. 이들 조건 하에서, 28%의 ClO2사용의 감소사 가능하며 69% GE 광도에 도달하였다.
추가의 실험에서:
서열 번호 159에 의해 암호화되는 서열 번호 160 (XYLA) = 야생형 자일라나제의 전체 길이:
·XYLA (E.c) = 단지 대장균에서 발현된 자일라나제 촉매 도메인을 포함하는 SEQ ID NOS: 159, 160의 끝이 잘린 변이체
·XYLA (P.f) = 상기와 동일하지만 P. 플루오레센(P. fluorescens)에서 발현되었다.
서열 번호 182 (서열 번호181에 의해 암호화되는) = 야생형 자일라나제의 두번째 전체 길이:
·XYLB (E.c) = 끝이 잘린 변이체 etc, etc 대장균에서 발현되었다
·XYLB (P.f) = 상기와 동일하지만 P. 플루오레센에서 발현되었다
프리-O 2 브라운스탁에 대한 리드(lead) 자일라나제의 투약량 반응 데이타
자일라나제 스테이지 (X-스테이지)에 대한 조건은 다음과 같다:
pH 8
온도70℃
시간 60분
카파 팩터 0.24
비-효소 조절군에 대한, 카파 팩터는 0.30
결과는 이산화염소 (ClO2)의 낮은 하전에서 자일라나제-처리된 시료의 광도가 투약량에 의존적으로 증가한다는 것을 보여주었다 (Kf 0.24 vs Kf 0.30).
각 경우에서, 끝이 잘린 유도체가 완전-길이 자일라나제보다 더 효과적인 것으로 드러났다. 최적 자일라나제 투약량은 0.6 내지 0.7 U/g 펄프 부근으로 드러났다.
최선의 4 자일라나제에 의한 대륙간 프리-O 2 브라운스탁의 전처리
Do에서 ClO2투약량 반응의 측정
실험 개요
·프리-O2브라운스탁
o 초기 카파 31.5
·X 스테이지 조건
o 자일라나제 하전 0.7 U/gm
o 온도70℃
o pH 8
o 처리 시간 1시간
o 펄프 밀도 10%
·표백 배열 XDEp
o 카파 팩터 0.22, 0.26 및 0.30 (펄프 상에서 %D: 2.63, 3.12 및 3.60)
3-스테이지 표백 배열 이후 최종 광도 대 카파 팩터 (ClO 2 하전):
·XYLB - 61.5 최종 광도에서, X-스테이지는 ClO2사용을 3.89 kg/ton 펄프로 감소시킬 수 있다.
·XYLB (E.c) - 61.5 최종 광도에서, X-스테이지는 ClO2하전을 4.07 kg/ton 펄프로 감소시킬 수 있다.
·XYLA - 61.5 최종 광도에서, X-스테이지는 ClO2사용을 4.07 kg/ton 펄프로 감소시킬 수 있다.
· XYLA (E.c) - 61.5 최종 광도에서, X-스테이지는 ClO2사용을 4.90 kg/ton 펄프로 감소시킬 수 있다.
Do에서 ClO 2 투약량 반응의 측정:
효소 Do에서 ClO2감소(kg/ton OD) Do에서 Kf 감소
XYLB 3.89 11.7%
XYLB (E.c) 5.08 15.8%
XYLA 4.07 12.2%
XYLA (E.c) 4.90 14.7%
자일라나제 0.7 U/g, pH 8.0, 70℃, 1시간
펄프: 프리-O2브라운스탁, 초기 카파 31.5
ClO2의 퍼센트 감소는 산업상 거의 현저하지 않은 것이다. 그들의 1차적인 관심은 ton OD 펄프 당 필요한 ClO2의 lbs이다. 낮은 퍼센트 감소가 감소된 ClO2의 lbs 측면에서 타겟 광도에 도달하는데 있어 더 낮은 ClO2의 총 하전을 요구하게 되는 낮은 초기 카파 펄프에 대한 더 높은 퍼센트 감소보다 더 가치있을 수 있는 높은 초기 카파 브라운스탁을 갖는 것으로 보여졌다는 것을 고려할 때에는 이것도 일리가 있다.
표백된 대조 펄프에 대한 광도, 수득률 및 카파 팩터의 상호관계:
결과는 더 높은 타겟 광도를 얻기 위해 ClO2의 투약량을 증가시키면서 표백시키는 것은 펄프 수득률의 손실의 증가를 초래한다는 것을 보여주었다. 이는 본 과정의 이 스테이지에서 펄프가 톤 당 거의 $400의 가치 및 셀룰로스 손실 비용을 갖기 때문에 문제가 된다.
자일라나제 (예컨대, 본 발명의 자일라나제)의 장점은, 자일라나제 자체의 작용이 수득한 것을 취소시키지 않는 한, 낮은 ClO2투약량으로 수득률 손실을 감소시킬 수 있다는 것이다.
자일라나제 XYLB (P.f)로 프리-O 2 브라운스탁의 전처리에 대한 투약량 반응 데이타:
실험 개요
·노스우드(Northwood) 프리-O2브라운스탁
- 초기 카파 28.0
- 초기 밀도 32.46%
- 초기 광도 28.37
·X 스테이지 조건
- 자일라나제 하전 0 내지 2.70 U/gm
- 온도 58℃ 내지 61℃
- pH 8.2 내지 8. 5
- 처리 시간 1시간
·표백 배열 XDEp
- 카파 팩터 0.24
·ClO2감소는 0.24와 0.30 사이의 카파 팩터에 대해 계산되었다
본 실험의 목적은 세척되지 않은 SPF 브라운스탁 상에서 4 자일라나제 중 최선을 평가하기 위함이다. 결과는, 낮은 Kf 0.24에서 자일라나제의 존재시 얻어진 광도를 가지며, 더 높은 Kf 0.30에서 얻어진 광도에 점근적으로 접근하면서, XYLB (E.c)로 처리된 펄프에 대한 최종 광도의 투약량-의존적 증가를 보여주었다.
자일라나제 XYLB (E.c) 및 이산화염소 감소의 투약량 사이의 상호관계 (프리-O2브라운스탁) :
ClO2감소% OD 펄프 ClO2감소kg/ton 펄프 자일라나제 투약량U/gm
0.299% 2.99 0.31
0.363% 3.63 0.51
0.406% 4.06 0.71
0.439% 4.39 0.91
0.483% 4.83 1.26
0.523% 5.32 1.80
0.587% 5.87 2.70
최적 자일라나제 투약량은 0.5 및 0.9 U/gm이다.
최적 투약량은 0.5 내지 0.9 U/g 범위에 놓여있다. 이 투약량 이상에서는 자일라나제의 단위 증가 당 회복이 감소하였다. 이 크기로 처리된 펄프의 톤 당 이산화염소 투약량의 감소는 상업상 현저한 것이다.
3-스테이지 생물 표백 과정
펄프 밀 표백 공장에서 실질적인 표백 작동에 유사하게 가장된 3-스테이지 생물 표백 과정이 개발되었다 (도 1). 이 표백 배열은 (X)DoEp로 표시되며, 여기서X는 자일라나제 처리 스테이지,D는 이산화염소 표백 스테이지, 그리고Ep는 알칼리성 과산화물 추출 스테이지를 나타낸다. 본 발명자들의 응용에 사용된 1차적 공급원료는 서던 소프트우드 크래프트(Southern Softwood Kraft) 브라운스탁 (산소 탈목질화 없는)이다. 생물 표백 분석에서 높은 화학적 표백 감소 전위를 보이는 대부분의 효과적인 자일라나제 후보가 하드우드 크래프트 펄프 (maple 및 aspen)의 두 종 상에서 또한 테스트되었다. 각 생물 표백 라운드의 완료에 따라, TAPPI (펄프 및 종이 산업의 기술 연합) - 표준 핸드시트를 만들어내는데 계속하여 펄프가 사용되었다. 각 시트의 GE% 광도가 측정되었으며, 각 효소가 효소적 전처리 스테이지 (X) 동안 펄프 상에서 얼마나 잘 수행되는 지에 대하여 광도 값이 지시로써 사용되었다.
결과:
(X)DoEp 생물 표백 서열을 사용하여 스크리닝되었던 대략 110 자일라나제 중, 4 효소, 즉, XYLA (P.f); XYLB (P.f); SEQ ID N0 216 (서열 번호 215에 의해 암호화되는); 서열 번호 176 (서열 번호 175에 의해 암호화되는) 만이 표백 화학물질의 사용을 감소시키기 위한 가장 큰 잠재력을 보여주었다. XYLA (P.f) 및 XYLB (P.f)는 동등한 높은 성능을 보였으며 (4개의 우수한 성능 중에서 최고), XYLA (P.f)는 XYLB (P.f)보다 더 나은 pH 내성을 보였다. 결과는 다음과 같이 요약될 수 있다:
·다음의 네가지 효소로 이하에 나열한 로딩 레벨에서 서던 소프트우드 크래프트 브라운스탁의 전처리를 포함하는 3-스테이지 표백 배열 [(X)DoEp]을 사용하여 60 (GE%)의 시트 광도를 얻는 것이 가능하였다 (pH=8, 65℃ & 1시간):
o XYLA (P.f) 0.55 U/g 펄프
o XYLB (P.f) 0.75 U/g 펄프
o SEQ ID NOS : 215, 216 1.80 U/g 펄프
o SEQ ID NOS : 175, 176 1.98 U/g 펄프
·2 U/g 펄프의 XYLA (P.f)를 이용한 서던 소프트우드 크래프트 브라운스탁의 전처리는 ClO2사용을 18.7%로 감소시키고 최종 GE% 광도 61을 얻었다.
·XYLA (P.f)는 더 높은 pH에서 우수한 내성을 나타내며 효소 전처리 스테이지가 pH = 10에서 작동할 때 14% 이상의 화학물질 감소를 제공한다.
·2 U/g 펄프의 XYLB (P.f)를 이용한 서던 소프트우드 크래프트 브라운스탁의 전처리는 ClO2사용을 16.3%로 감소시키고 최종 GE% 광도 60.5을 얻었다.
·2 U/g 펄프의 XYLA (P.f) 및 XYLB (P.f)를 이용한 아스펜 크래프트 펄프의 전처리는 ClO2사용을 35%로 감소시키고 최종 GE% 광도 77을 얻었다.
·2 U/g 펄프의 XYLA (P.f) 및 XYLB (P.f)를 이용한 메이클 크래프트 펄프의 전처리는 ClO2사용을 38%로 감소시키고 최종 GE% 광도 79를 얻었다.
·두개의 최고 성능 자일라나제, 즉 XYLA (P.f) 및 XYLB (P.f)는, 단지 촉매 도메인을 포함하는 끝이 잘린 효소이며 슈도모나스 플루오레센스(Pseudomonas fluorescens)에서 생성되었다.
본 발명이 그것의 바람직한 특정 양태를 참고로 상세히 기재되었으며, 변형 및 응용은 여기 기재되고 청구된 것들의 범위 및 사상 내에 포함된다는 것을 이해하여야 할 것이다.
SEQUENCE LISTING <110> Steer, Brian Callen, Walter Healey, Shaun Hazlewood, Geoff Wu, Di Blum, David Esteghlalian, Alireza <120> XYLANASES, NUCLEIC ACIDS ENCODING THEM AND METHODS FOR MAKING AND USING THEM <130>56446-20079.40_290WO1_D1680-2WO <140> not assigned <141> 2003-03-16 <150> US 60/389,299 <151> 2002-06-14 <160> 380 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 1128 <212> DNA <213> Bacteria <400> 1 atgaccgacc acaacgcttc cgaaaccagc ctgttcgaac agtgcggcta cagccgcgag 60 gccatccagg cccgcctgga gcgcaactgg tatgagatgt tcgaaggccc ggacaagatt 120 tactgggaga acgacgaagg cctggggtac gtgatggaca ccggcaacca cgacgtgcgc 180 accgagggca tgagctacgc gatgatgatc gccgtgcagt acggccgcaa ggacgtgttc 240 gacaagctgt ggggttgggt catgaaatac atgttcatga ccgagggcct gcaccagggc 300 tacttcgcct ggtctgtgga ccccagcggc gtaccgaacg ccgacggtcc ggccccggac 360 ggcgaggaat acttcgcgat ggacctgttc ctggcctccg cgcgatgggg cgacggcgaa 420 ggcgtgtacg agtactcccg ccacgcccgc tcgatcctcc acacctgcgt gcaccagggc 480 gaggacggtg aaggctatcc gatgtggaac ccggagaacc atctgatcaa gttcatcccg 540 gaaaccgaat ggaccgaccc gtcctaccat ctgccgcact tctacgaggt gttcgccgag 600 cgcgccgacg aggccgaccg tccgttctgg gcgcaggccg ccaaggcgag ccgcgagtac 660 ctggtcaccg cctgccaccc gcagaccggc atgaaccccg aatactcaaa ctatgatggc 720 acgccgcacg tcgacgagcg cgaccactgg catttctact ccgacgccta ccgcaccgcc 780 ggcaacatcg ggctggactg cctgtggaac ggcgtcgtgc cggaactgtg cgatgcgaat 840 gcgcgtctgc agcgtttctt cctcgaacac gaccgcacct gcgtgtatgc gatcgacggc 900 acgccggtgg acgagaccgt gctgcacccg gtcggcttca tcgccgccac cgccgaaggc 960 tcgctcgccg cgatgcactc gcaggagccg gacgcgctcg acaacgcgat ccgctgggtg 1020 cgcctgctgt gggacacccc gatccgcacc ggcacgcgcc gctactacga caacttcctc 1080 tacgccttcg cgttcctggc gctggcgggg gagtaccgca cctggtga 1128 <210> 2 <211> 375 <212> PRT <213> Bacteria <400> 2 Met Thr Asp His Asn Ala Ser Glu Thr Ser Leu Phe Glu Gln Cys Gly 1 5 10 15 Tyr Ser Arg Glu Ala Ile Gln Ala Arg Leu Glu Arg Asn Trp Tyr Glu 20 25 30 Met Phe Glu Gly Pro Asp Lys Ile Tyr Trp Glu Asn Asp Glu Gly Leu 35 40 45 Gly Tyr Val Met Asp Thr Gly Asn His Asp Val Arg Thr Glu Gly Met 50 55 60 Ser Tyr Ala Met Met Ile Ala Val Gln Tyr Gly Arg Lys Asp Val Phe 65 70 75 80 Asp Lys Leu Trp Gly Trp Val Met Lys Tyr Met Phe Met Thr Glu Gly 85 90 95 Leu His Gln Gly Tyr Phe Ala Trp Ser Val Asp Pro Ser Gly Val Pro 100 105 110 Asn Ala Asp Gly Pro Ala Pro Asp Gly Glu Glu Tyr Phe Ala Met Asp 115 120 125 Leu Phe Leu Ala Ser Ala Arg Trp Gly Asp Gly Glu Gly Val Tyr Glu 130 135 140 Tyr Ser Arg His Ala Arg Ser Ile Leu His Thr Cys Val His Gln Gly 145 150 155 160 Glu Asp Gly Glu Gly Tyr Pro Met Trp Asn Pro Glu Asn His Leu Ile 165 170 175 Lys Phe Ile Pro Glu Thr Glu Trp Thr Asp Pro Ser Tyr His Leu Pro 180 185 190 His Phe Tyr Glu Val Phe Ala Glu Arg Ala Asp Glu Ala Asp Arg Pro 195 200 205 Phe Trp Ala Gln Ala Ala Lys Ala Ser Arg Glu Tyr Leu Val Thr Ala 210 215 220 Cys His Pro Gln Thr Gly Met Asn Pro Glu Tyr Ser Asn Tyr Asp Gly 225 230 235 240 Thr Pro His Val Asp Glu Arg Asp His Trp His Phe Tyr Ser Asp Ala 245 250 255 Tyr Arg Thr Ala Gly Asn Ile Gly Leu Asp Cys Leu Trp Asn Gly Val 260 265 270 Val Pro Glu Leu Cys Asp Ala Asn Ala Arg Leu Gln Arg Phe Phe Leu 275 280 285 Glu His Asp Arg Thr Cys Val Tyr Ala Ile Asp Gly Thr Pro Val Asp 290 295 300 Glu Thr Val Leu His Pro Val Gly Phe Ile Ala Ala Thr Ala Glu Gly 305 310 315 320 Ser Leu Ala Ala Met His Ser Gln Glu Pro Asp Ala Leu Asp Asn Ala 325 330 335 Ile Arg Trp Val Arg Leu Leu Trp Asp Thr Pro Ile Arg Thr Gly Thr 340 345 350 Arg Arg Tyr Tyr Asp Asn Phe Leu Tyr Ala Phe Ala Phe Leu Ala Leu 355 360 365 Ala Gly Glu Tyr Arg Thr Trp 370 375 <210> 3 <211> 2196 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 3 atgttcaaag aatggggaaa gaccgactcg gaaattacca caaaagtaaa caccgcgtgg 60 aacaaactgt ttgttaacgg ggtggaatcc ggagataatg ccgaaagaat ctatgtagag 120 actggaagcg acatggcgta catccatacc tttgacagca acgacgtgcg ctccgaagga 180 atgtcctacg gcatgatgat gtgcgtacag atgaacgatc agacaagatt taacaaactc 240 tggaaatggg caagaaccta tatgtacaat gaaacagacg ccggcagtaa ttccaggggc 300 tatttctcat ggcagtgcag tacaagcggc tcaaaaatgg ataagggccc cgctcctgac 360 ggcgaggaat actttattac ggcgctgttg ttcgcgcacg cccgctgggg gagcgcgtcc 420 ggtactacaa acataaacaa ttacgcgcag caagcaaggc agattatcta tgacttaacg 480 cgccgcaaac cggggaacgg agatccttac ggcgagcctt caatgtttaa tgtagacaac 540 tatatggtta gattcgccac acttggaaat tccgccacct ttacagaccc ctcataccat 600 ttaccggcat tctatgatgt ttgggcgctg gaattacagg cggactatga taatagtaaa 660 ctctacggta tctgggctga taaggctgac ttgaaaaaag acattgatta ctttaaacaa 720 gcggcgacca caagccgttc attctttgca aaaacgacaa acggtacaac cggacttgga 780 ccggattatg ccggctttga cggaacgcct aaaaatgaag gggatcacaa gtatttcgag 840 tatgacgcgt ggcgtatcgc gatgaacata ggtatggact acgcgtggtt cgcgaaagat 900 tcctggcaga agacatttgc cgacagaatt caggcgttct ttgtcagcaa gggagtcact 960 tcttacggaa accgctggac attggacggg actcaaaggg gagcggatca ctcgccgggt 1020 cttgtcggct gtaacgcggt cgcctctctc gcggcgacaa acgcgaacgc gtggaaattt 1080 atcgaagact tctggaacat cagcatgacg aaaggcaaat accgttacta tgacggatgt 1140 ctgtatatga tgagcatgct gcacttaagc ggcaacttta aggcgtatct ttctacaaat 1200 accacgcccg ccaacagttc cagcattacc ccgacaaccg cgtctttcga caagaagaca 1260 agcgcacaag ccgacattgc cgtaacagtg acgcttaacg ggaatacatt ctcaagtatc 1320 acaaacaacg gtacagccct tacaagcggc acagactact cagtgagtgg aacaaagtat 1380 acgataaaga aagaatacct tgcaaaacag cctgtaggaa caacgaagct cgcattcaac 1440 ttcagtgccg gaggaactcc ggaacttaca gttactataa cggacacggg cagctccagc 1500 atcagcccga caaccgcgac attcgacaaa aagaccggag cgcaagccga catcgccgta 1560 accatgacgc ttaatgggaa tactttgtcg aacatcaaaa acggttctgc acaacttaca 1620 agcggaactg actactcaac gagcggcagt acggtaacga ttaaaaaaga atacctggca 1680 aagcaggcta acggcacagt aacgcttacc ttcacattca gcgcaggcgc ggcccaaact 1740 attgacatca cggtaaaaga tacaaccggc ggagcggcgg gaataaaata caacttcgca 1800 actgacaacc tgcccaacgg gtacccgaag tacagttcaa gtgatatatc cgcgacaata 1860 accggaggag ctttggtaat aaccaaaacc ggaaataatt cgtccccgaa gattacattg 1920 ccctttagtg taacaggtaa cctttccggt tatacaggca taaagataaa tgtaaaggga 1980 gtatccggag atttcactta taaagtattg aatgccgcaa taggttctac aaatctcggc 2040 agcgtaaata acgccccaat accaaacggc tcatttggag acgtaacaat accaataacc 2100 ggcggtacaa acaccggaga tttagatata tcgttctggc tcaataacac aaatgcttac 2160 gttattgaga ttaagagcat agagctggta aaatga 2196 <210> 4 <211> 711 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 4 Met Phe Lys Glu Trp Gly Lys Thr Asp Ser Glu Ile Thr Thr Lys Val 1 5 10 15 Asn Thr Ala Trp Asn Lys Leu Phe Val Asn Gly Val Glu Ser Gly Asp 20 25 30 Asn Ala Glu Arg Ile Tyr Val Glu Thr Gly Ser Asp Met Ala Tyr Ile 35 40 45 His Thr Phe Asp Ser Asn Asp Val Arg Ser Glu Gly Met Ser Tyr Gly 50 55 60 Met Met Met Cys Val Gln Met Asn Asp Gln Thr Arg Phe Asn Lys Leu 65 70 75 80 Trp Lys Trp Ala Arg Thr Tyr Met Tyr Asn Glu Thr Asp Ala Gly Ser 85 90 95 Asn Ser Arg Gly Tyr Phe Ser Trp Gln Cys Ser Thr Ser Gly Ser Lys 100 105 110 Met Asp Lys Gly Pro Ala Pro Asp Gly Glu Glu Tyr Phe Ile Thr Ala 115 120 125 Leu Leu Phe Ala His Ala Arg Trp Gly Ser Ala Ser Gly Thr Thr Asn 130 135 140 Ile Asn Asn Tyr Ala Gln Gln Ala Arg Gln Ile Ile Tyr Asp Leu Thr 145 150 155 160 Arg Arg Lys Pro Gly Asn Gly Asp Pro Tyr Gly Glu Pro Ser Met Phe 165 170 175 Asn Val Asp Asn Tyr Met Val Arg Phe Ala Thr Leu Gly Asn Ser Ala 180 185 190 Thr Phe Thr Asp Pro Ser Tyr His Leu Pro Ala Phe Tyr Asp Val Trp 195 200 205 Ala Leu Glu Leu Gln Ala Asp Tyr Asp Asn Ser Lys Leu Tyr Gly Ile 210 215 220 Trp Ala Asp Lys Ala Asp Leu Lys Lys Asp Ile Asp Tyr Phe Lys Gln 225 230 235 240 Ala Ala Thr Thr Ser Arg Ser Phe Phe Ala Lys Thr Thr Asn Gly Thr 245 250 255 Thr Gly Leu Gly Pro Asp Tyr Ala Gly Phe Asp Gly Thr Pro Lys Asn 260 265 270 Glu Gly Asp His Lys Tyr Phe Glu Tyr Asp Ala Trp Arg Ile Ala Met 275 280 285 Asn Ile Gly Met Asp Tyr Ala Trp Phe Ala Lys Asp Ser Trp Gln Lys 290 295 300 Thr Phe Ala Asp Arg Ile Gln Ala Phe Phe Val Ser Lys Gly Val Thr 305 310 315 320 Ser Tyr Gly Asn Arg Trp Thr Leu Asp Gly Thr Gln Arg Gly Ala Asp 325 330 335 His Ser Pro Gly Leu Val Gly Cys Asn Ala Val Ala Ser Leu Ala Ala 340 345 350 Thr Asn Ala Asn Ala Trp Lys Phe Ile Glu Asp Phe Trp Asn Ile Ser 355 360 365 Met Thr Lys Gly Lys Tyr Arg Tyr Tyr Asp Gly Cys Leu Tyr Met Met 370 375 380 Ser Met Leu His Leu Ser Gly Asn Phe Lys Ala Tyr Leu Ser Thr Asn 385 390 395 400 Thr Thr Pro Ala Asn Ser Ser Ser Ile Thr Pro Thr Thr Ala Ser Phe 405 410 415 Asp Lys Lys Thr Ser Ala Gln Ala Asp Ile Ala Val Thr Val Thr Leu 420 425 430 Asn Gly Asn Thr Phe Ser Ser Ile Thr Asn Asn Gly Thr Ala Leu Thr 435 440 445 Ser Gly Thr Asp Tyr Ser Val Ser Gly Thr Lys Tyr Thr Ile Lys Lys 450 455 460 Glu Tyr Leu Ala Lys Gln Pro Val Gly Thr Thr Lys Leu Ala Phe Asn 465 470 475 480 Phe Ser Ala Gly Gly Thr Pro Glu Leu Thr Val Thr Ile Thr Asp Thr 485 490 495 Gly Ser Ser Ser Ile Ser Pro Thr Thr Ala Thr Phe Asp Lys Lys Thr 500 505 510 Gly Ala Gln Ala Asp Ile Ala Val Thr Met Thr Leu Asn Gly Asn Thr 515 520 525 Leu Ser Asn Ile Lys Asn Gly Ser Ala Gln Leu Thr Ser Gly Thr Asp 530 535 540 Tyr Ser Thr Ser Gly Ser Thr Val Thr Ile Lys Lys Glu Tyr Leu Ala 545 550 555 560 Lys Gln Ala Asn Gly Thr Val Thr Leu Thr Phe Thr Phe Ser Ala Gly 565 570 575 Ala Ala Gln Thr Ile Asp Ile Thr Val Lys Asp Thr Thr Gly Gly Ala 580 585 590 Ala Gly Ile Lys Tyr Asn Phe Ala Thr Asp Asn Leu Pro Asn Gly Tyr 595 600 605 Pro Lys Tyr Ser Ser Ser Asp Ile Ser Ala Thr Ile Thr Gly Gly Ala 610 615 620 Leu Val Ile Thr Lys Thr Gly Asn Asn Ser Ser Pro Lys Ile Thr Leu 625 630 635 640 Pro Phe Ser Val Thr Gly Asn Leu Ser Gly Tyr Thr Gly Ile Lys Ile 645 650 655 Asn Val Lys Gly Val Ser Gly Asp Phe Thr Tyr Lys Val Leu Asn Ala 660 665 670 Ala Ile Gly Ser Thr Asn Leu Gly Ser Val Asn Asn Ala Pro Ile Pro 675 680 685 Asn Gly Ser Phe Gly Asp Val Thr Ile Pro Ile Thr Gly Gly Thr Asn 690 695 700 Thr Gly Asp Leu Asp Ile Ser 705 710 <210> 5 <211> 2106 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 5 atgcaaaacc tatttaagcg tgtgtttttc catcttctct tgcttgcctt gctggcaggc 60 tgtgctggcc cttctcccgt aacaccggag ccgaccgaaa tgccgaccca ggtccctaca 120 ccaacgccta gtcttggcgc ctacgagagc ggcgagtatc gcaacctgtt cgccgaggcg 180 cttggcaaat cggatgccga aattcaggcc aaaatcgatg ccgctttcca acaacttttc 240 tacggcgacg atgtttctga gcgcgtctat tacccggttg gcagcgacat gggctatatg 300 ctcgacaccg gcaacgacga tgtgcgctcc gagggcatgt cctacggcat gatgattgcc 360 gtccagatga acaagaagga agaattcgac cgcatctgga agtggaccaa aacctacatg 420 taccagaccg aaggtggtta caaaggttat tttgcctggc acgctaaaac ggacggcacc 480 caactggccg ccaacccggc ctctgacggt gaagtctggt ttgtgatggc gctcttcttt 540 gccgatgcgc gttggggcag cggcgaagga atttataact accgcgccca agcccaggaa 600 attctcgatg tggccttgaa cgccaaagaa ttgggcggca acctggcgac caacctgttc 660 gacccggaga ccaaacaggt cgtttttgtg ccgcagttgg gcaataactc gaaatttacc 720 gacgcttcgt accacatgcc ccatttctac gagttgtggg cgcgttgggc cgataaaaat 780 aacgactttt gggccgaagc cgctaccgtt agccgcgagt tcctgcctac tgccgttcac 840 cccgaaaccg gcctggcccc taactattcc tacttcgatg gccgccctta caatgacgag 900 tatcacggcc agttccgcta cgacgctttc cgcgtgggcg cgaacatcgg catggattat 960 gtctggtttc acccctctga atggtatcgg gaacaagcca accgccaatt atctttcttc 1020 gcatcccagg gcatcgatga ttatgttgcc gaatattccc tggatggaaa accgctggcc 1080 gggcatcgcg ctacggggtt gattgccacc aatgctgtcc tggcctacgc cgcagacccc 1140 gaaattggtc aacccttcgt ccaggccctg tgggatgcag agcctccgac tggcaggtat 1200 cgctactatg acggcctgct ctacatgatg ggcctgctgc aagccagcgg caacttccgt 1260 atttacgagc cgggtattac gcctcgcgct gagttgccgc ccccgccgcc tcgcgccatc 1320 gagggccgct tcgcgcccat taccgggcgg gccttgcttc tgattggccc gaatgcggat 1380 ggcgtcaacg cttacttcga caaactggtg acagcgccgg gcggcgtgaa tgtcgaacta 1440 tcgctcaaat cgcctgattt ggaagcgctc gacgccctgg cgaggaaata tcccaacagc 1500 acgctttcgg tcgggttgtc gctggatggc ccggtaacag aggcggatgc gcgggtggga 1560 gaattgctcg acgcgttggc tgtttatccg cgcccggtct tcctgcgcat cgggccggaa 1620 tttgatttgg cggcgagcgg ccaggggccg gaggaatatg tcgcggcctg gaaaacgctc 1680 cataacgaga ttcaggcgcg gggtagttcg aatatcgccc tggtgtggca tagcgccgca 1740 gcctgcgagt cgccctttgg cggtcatccg ctcgaagcgt ggtatcccgg tgatgagttt 1800 gtggattggg tggccgtttc gcgcactgcg cagtctgccg attgcgaggg gcagtccgtt 1860 gaggccgtct tgcagtttgc gcgtgagcga tacaaaccgg ttgtgttggt tgcatcgcca 1920 gcagaggaca tcttcgagtt cgtttacgcc aacaacgacg tgattcgcgc cctgctgtat 1980 ctgaacaccg agccgggcct gttcgacacc cccgaatttt tgagcggctg gaaggccgaa 2040 atcggtcagc agttctggct gcgcggcggc ccggcgcttt tttcgacact cggattggat 2100 gagtaa 2106 <210> 6 <211> 701 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(47) <400> 6 Met Gln Asn Leu Phe Lys Arg Val Phe Phe His Leu Leu Leu Leu Ala 1 5 10 15 Leu Leu Ala Gly Cys Ala Gly Pro Ser Pro Val Thr Pro Glu Pro Thr 20 25 30 Glu Met Pro Thr Gln Val Pro Thr Pro Thr Pro Ser Leu Gly Ala Tyr 35 40 45 Glu Ser Gly Glu Tyr Arg Asn Leu Phe Ala Glu Ala Leu Gly Lys Ser 50 55 60 Asp Ala Glu Ile Gln Ala Lys Ile Asp Ala Ala Phe Gln Gln Leu Phe 65 70 75 80 Tyr Gly Asp Asp Val Ser Glu Arg Val Tyr Tyr Pro Val Gly Ser Asp 85 90 95 Met Gly Tyr Met Leu Asp Thr Gly Asn Asp Asp Val Arg Ser Glu Gly 100 105 110 Met Ser Tyr Gly Met Met Ile Ala Val Gln Met Asn Lys Lys Glu Glu 115 120 125 Phe Asp Arg Ile Trp Lys Trp Thr Lys Thr Tyr Met Tyr Gln Thr Glu 130 135 140 Gly Gly Tyr Lys Gly Tyr Phe Ala Trp His Ala Lys Thr Asp Gly Thr 145 150 155 160 Gln Leu Ala Ala Asn Pro Ala Ser Asp Gly Glu Val Trp Phe Val Met 165 170 175 Ala Leu Phe Phe Ala Asp Ala Arg Trp Gly Ser Gly Glu Gly Ile Tyr 180 185 190 Asn Tyr Arg Ala Gln Ala Gln Glu Ile Leu Asp Val Ala Leu Asn Ala 195 200 205 Lys Glu Leu Gly Gly Asn Leu Ala Thr Asn Leu Phe Asp Pro Glu Thr 210 215 220 Lys Gln Val Val Phe Val Pro Gln Leu Gly Asn Asn Ser Lys Phe Thr 225 230 235 240 Asp Ala Ser Tyr His Met Pro His Phe Tyr Glu Leu Trp Ala Arg Trp 245 250 255 Ala Asp Lys Asn Asn Asp Phe Trp Ala Glu Ala Ala Thr Val Ser Arg 260 265 270 Glu Phe Leu Pro Thr Ala Val His Pro Glu Thr Gly Leu Ala Pro Asn 275 280 285 Tyr Ser Tyr Phe Asp Gly Arg Pro Tyr Asn Asp Glu Tyr His Gly Gln 290 295 300 Phe Arg Tyr Asp Ala Phe Arg Val Gly Ala Asn Ile Gly Met Asp Tyr 305 310 315 320 Val Trp Phe His Pro Ser Glu Trp Tyr Arg Glu Gln Ala Asn Arg Gln 325 330 335 Leu Ser Phe Phe Ala Ser Gln Gly Ile Asp Asp Tyr Val Ala Glu Tyr 340 345 350 Ser Leu Asp Gly Lys Pro Leu Ala Gly His Arg Ala Thr Gly Leu Ile 355 360 365 Ala Thr Asn Ala Val Leu Ala Tyr Ala Ala Asp Pro Glu Ile Gly Gln 370 375 380 Pro Phe Val Gln Ala Leu Trp Asp Ala Glu Pro Pro Thr Gly Arg Tyr 385 390 395 400 Arg Tyr Tyr Asp Gly Leu Leu Tyr Met Met Gly Leu Leu Gln Ala Ser 405 410 415 Gly Asn Phe Arg Ile Tyr Glu Pro Gly Ile Thr Pro Arg Ala Glu Leu 420 425 430 Pro Pro Pro Pro Pro Arg Ala Ile Glu Gly Arg Phe Ala Pro Ile Thr 435 440 445 Gly Arg Ala Leu Leu Leu Ile Gly Pro Asn Ala Asp Gly Val Asn Ala 450 455 460 Tyr Phe Asp Lys Leu Val Thr Ala Pro Gly Gly Val Asn Val Glu Leu 465 470 475 480 Ser Leu Lys Ser Pro Asp Leu Glu Ala Leu Asp Ala Leu Ala Arg Lys 485 490 495 Tyr Pro Asn Ser Thr Leu Ser Val Gly Leu Ser Leu Asp Gly Pro Val 500 505 510 Thr Glu Ala Asp Ala Arg Val Gly Glu Leu Leu Asp Ala Leu Ala Val 515 520 525 Tyr Pro Arg Pro Val Phe Leu Arg Ile Gly Pro Glu Phe Asp Leu Ala 530 535 540 Ala Ser Gly Gln Gly Pro Glu Glu Tyr Val Ala Ala Trp Lys Thr Leu 545 550 555 560 His Asn Glu Ile Gln Ala Arg Gly Ser Ser Asn Ile Ala Leu Val Trp 565 570 575 His Ser Ala Ala Ala Cys Glu Ser Pro Phe Gly Gly His Pro Leu Glu 580 585 590 Ala Trp Tyr Pro Gly Asp Glu Phe Val Asp Trp Val Ala Val Ser Arg 595 600 605 Thr Ala Gln Ser Ala Asp Cys Glu Gly Gln Ser Val Glu Ala Val Leu 610 615 620 Gln Phe Ala Arg Glu Arg Tyr Lys Pro Val Val Leu Val Ala Ser Pro 625 630 635 640 Ala Glu Asp Ile Phe Glu Phe Val Tyr Ala Asn Asn Asp Val Ile Arg 645 650 655 Ala Leu Leu Tyr Leu Asn Thr Glu Pro Gly Leu Phe Asp Thr Pro Glu 660 665 670 Phe Leu Ser Gly Trp Lys Ala Glu Ile Gly Gln Gln Phe Trp Leu Arg 675 680 685 Gly Gly Pro Ala Leu Phe Ser Thr Leu Gly Leu Asp Glu 690 695 700 <210> 7 <211> 1539 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 7 atggcacgtt taatcaccta ttgcttgatc ggcgtcttac tcgtgatgcc agtccttgcc 60 gcttgcagca cagcacctac gccaacgctg atgagccagc caacttccac gccgcaaccg 120 gccctgcaac cgacgccacc accgacgagc gtcccccggt cgatcggggc gtttgagtcc 180 ggtcagtatc gtaatctctt cacggaatta ctgggcaaga gcgaggccga gattcagcag 240 aagatcgatc aggcgtgggc gcagttgttc tacggcgaca acgacacgca gcgcgtttac 300 tatcccgtgg gtcgcgacag ggcctacatc aaagacatcg gcaacaatga tgtgcgcagt 360 gagggtatgt cgtacggtat gatgctggcg gtgcagctgg acaagcagga agagttcaac 420 aaattgtgga agtgggcgca cacctatatg ctgcaaaagg atggcccgta caaaggctat 480 tttgcgtggc atgccaatga gaacggtgaa cagctggatg cgggtcccgc ctccgatggc 540 gaagagtggt ttgtcatggc actgctcttc gcggcaaatc gctggggcaa cggtgaaggc 600 atctttaatt atcaggccga ggcgcagaag atcctggatg tgatgctgca taagagcgaa 660 gaggacaacg gtctcgccac cagcatgttc gatccggaca cgaagcaggt ggtgtttgtg 720 ccggccgggc gccaggccac attcaccgat ccgtcttatc acttgcccgc gttctatgaa 780 ctgtgggcgc gctgggctga caaggataac gatttttgga aagaagcggc gcaggccagc 840 cgcgaatttt ggaagaaggc ggcgcatccg gaaacgggcc tgatgtctga ctacgccgag 900 tttgacggca gaccccaggc cgattctgaa cacaaggatt ttcgctatga cgcgttccgt 960 gtggcgtcca atgtggcgct cgattgggcc tggttcgccg ccgatccgtg ggaggtggaa 1020 cagagcaatc ggttgttgga tttcttccgt tcacaaggca tggataagta tccgagtcta 1080 tacaacatcg atggcacgcc gttatccact aatcgctcgc cgggtttgat cgccatgaac 1140 gccacagctg gactcgcggc tgatccggaa aagagcaagg actttgtgca ggcgctatgg 1200 gatctggaaa ttcccagcgg acaatggcgc tattacgatg gggtgctgta tttcctggcg 1260 ctgttgcaag ccagcggcaa ctatcgcatc tacacgcccg atatgcccaa ggtggtgcgg 1320 cccacaccta cgcccgatcc gatcacgcaa gcgaaatttg cacccggcga tgacgcggtg 1380 ctgttcagtg tggaaacaga tgcactcgac gaatatgtga cggcgacggg ctttgagccg 1440 ggcggcgtga tgttgaacac tactttggac agcgcctctt ttgacgcacc actgcctgac 1500 agcgctctgc tgatcggatt ggacgtcagc gatcaataa 1539 <210> 8 <211> 512 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(57) <400> 8 Met Ala Arg Leu Ile Thr Tyr Cys Leu Ile Gly Val Leu Leu Val Met 1 5 10 15 Pro Val Leu Ala Ala Cys Ser Thr Ala Pro Thr Pro Thr Leu Met Ser 20 25 30 Gln Pro Thr Ser Thr Pro Gln Pro Ala Leu Gln Pro Thr Pro Pro Pro 35 40 45 Thr Ser Val Pro Arg Ser Ile Gly Ala Phe Glu Ser Gly Gln Tyr Arg 50 55 60 Asn Leu Phe Thr Glu Leu Leu Gly Lys Ser Glu Ala Glu Ile Gln Gln 65 70 75 80 Lys Ile Asp Gln Ala Trp Ala Gln Leu Phe Tyr Gly Asp Asn Asp Thr 85 90 95 Gln Arg Val Tyr Tyr Pro Val Gly Arg Asp Arg Ala Tyr Ile Lys Asp 100 105 110 Ile Gly Asn Asn Asp Val Arg Ser Glu Gly Met Ser Tyr Gly Met Met 115 120 125 Leu Ala Val Gln Leu Asp Lys Gln Glu Glu Phe Asn Lys Leu Trp Lys 130 135 140 Trp Ala His Thr Tyr Met Leu Gln Lys Asp Gly Pro Tyr Lys Gly Tyr 145 150 155 160 Phe Ala Trp His Ala Asn Glu Asn Gly Glu Gln Leu Asp Ala Gly Pro 165 170 175 Ala Ser Asp Gly Glu Glu Trp Phe Val Met Ala Leu Leu Phe Ala Ala 180 185 190 Asn Arg Trp Gly Asn Gly Glu Gly Ile Phe Asn Tyr Gln Ala Glu Ala 195 200 205 Gln Lys Ile Leu Asp Val Met Leu His Lys Ser Glu Glu Asp Asn Gly 210 215 220 Leu Ala Thr Ser Met Phe Asp Pro Asp Thr Lys Gln Val Val Phe Val 225 230 235 240 Pro Ala Gly Arg Gln Ala Thr Phe Thr Asp Pro Ser Tyr His Leu Pro 245 250 255 Ala Phe Tyr Glu Leu Trp Ala Arg Trp Ala Asp Lys Asp Asn Asp Phe 260 265 270 Trp Lys Glu Ala Ala Gln Ala Ser Arg Glu Phe Trp Lys Lys Ala Ala 275 280 285 His Pro Glu Thr Gly Leu Met Ser Asp Tyr Ala Glu Phe Asp Gly Arg 290 295 300 Pro Gln Ala Asp Ser Glu His Lys Asp Phe Arg Tyr Asp Ala Phe Arg 305 310 315 320 Val Ala Ser Asn Val Ala Leu Asp Trp Ala Trp Phe Ala Ala Asp Pro 325 330 335 Trp Glu Val Glu Gln Ser Asn Arg Leu Leu Asp Phe Phe Arg Ser Gln 340 345 350 Gly Met Asp Lys Tyr Pro Ser Leu Tyr Asn Ile Asp Gly Thr Pro Leu 355 360 365 Ser Thr Asn Arg Ser Pro Gly Leu Ile Ala Met Asn Ala Thr Ala Gly 370 375 380 Leu Ala Ala Asp Pro Glu Lys Ser Lys Asp Phe Val Gln Ala Leu Trp 385 390 395 400 Asp Leu Glu Ile Pro Ser Gly Gln Trp Arg Tyr Tyr Asp Gly Val Leu 405 410 415 Tyr Phe Leu Ala Leu Leu Gln Ala Ser Gly Asn Tyr Arg Ile Tyr Thr 420 425 430 Pro Asp Met Pro Lys Val Val Arg Pro Thr Pro Thr Pro Asp Pro Ile 435 440 445 Thr Gln Ala Lys Phe Ala Pro Gly Asp Asp Ala Val Leu Phe Ser Val 450 455 460 Glu Thr Asp Ala Leu Asp Glu Tyr Val Thr Ala Thr Gly Phe Glu Pro 465 470 475 480 Gly Gly Val Met Leu Asn Thr Thr Leu Asp Ser Ala Ser Phe Asp Ala 485 490 495 Pro Leu Pro Asp Ser Ala Leu Leu Ile Gly Leu Asp Val Ser Asp Gln 500 505 510 <210> 9 <211> 1311 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 9 atgtttccac gtctttcacc aagccgcttc aggcaagtta ccttaacctt gctcacgctc 60 ggccttgtgt cactgaccgg ttgtgcaggt aacagcaagc cggatgcaga caccagtact 120 gctggtgccg ttgctaccgg cgagtaccgc aatctgtttg ccgaaatcgg aaaaagcgaa 180 atagacatcc agcgcaaaat tgacgaggcg tttcagcact tgttttatgg cgacgcgaaa 240 gatgcagctg tctactatca agcgggtgga aacgagaatg gtccactcgc atatgtttac 300 gatgtgaaca gcaatgacgt gcgctcagaa ggcatgagct acggcatgat gattactgtt 360 caaatggaca aaaaagccga gttcgatgca atctggaact gggcgaaaac ctatatgtat 420 caagactccc ccacgcatcc agcgtttggt tactttgcct ggtccatgcg ccgcgatggt 480 gtcgccaatg acgatatgcc agcgccagat ggcgaggaat atttcgtgac cgctctctat 540 ttcgccgccg cccgctgggg taatggcgaa ggtattttca actaccaaca ggaagcggac 600 accattttga gccgcatgcg ccaccgccag gtgatcaccg gcccaaccaa tcgcggagta 660 atgactgcga ccaatctgtt ccacccggaa gaggcgcaag tgcgcttcac gcccgacatc 720 aataatgctg atcatacaga cgcgtcttac catctgccct cgttctatga aatttgggca 780 cgtgtcgcgc cgcaagaaga tcgcgcgttt tgggccaaag cggccgatgt gagccgcgac 840 tattttgcca aagccgccca ccctgtcact gcgttaacac cggactacgg taattttgat 900 ggcaccccgt gggcggcatc ctggcggccg gagtcggtag attttcgata cgatgcctgg 960 cgttccgtca tgaactggtc catggactat gcctggtggg gcaaagattc aggcgcacct 1020 gcgcgcagtg ataaattact cgcgttcttc gaaacccagg aaggcaaaat gaaccacctc 1080 tatagcctgg atggcaaacc gctgggtggt ggaccgaccc tcggcctaat ttccatgaat 1140 gcaacggcag ctatggcagc tactgatccc cgctggcaca attttgtgga aaagctctgg 1200 caacaacaac cccccacagg gcaataccgg tactacgacg gtgttctata cctgatggcg 1260 ctgctacatt gcgctgggga gtacaaagcg tggatccccg acggggaata a 1311 <210> 10 <211> 436 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(36) <400> 10 Met Phe Pro Arg Leu Ser Pro Ser Arg Phe Arg Gln Val Thr Leu Thr 1 5 10 15 Leu Leu Thr Leu Gly Leu Val Ser Leu Thr Gly Cys Ala Gly Asn Ser 20 25 30 Lys Pro Asp Ala Asp Thr Ser Thr Ala Gly Ala Val Ala Thr Gly Glu 35 40 45 Tyr Arg Asn Leu Phe Ala Glu Ile Gly Lys Ser Glu Ile Asp Ile Gln 50 55 60 Arg Lys Ile Asp Glu Ala Phe Gln His Leu Phe Tyr Gly Asp Ala Lys 65 70 75 80 Asp Ala Ala Val Tyr Tyr Gln Ala Gly Gly Asn Glu Asn Gly Pro Leu 85 90 95 Ala Tyr Val Tyr Asp Val Asn Ser Asn Asp Val Arg Ser Glu Gly Met 100 105 110 Ser Tyr Gly Met Met Ile Thr Val Gln Met Asp Lys Lys Ala Glu Phe 115 120 125 Asp Ala Ile Trp Asn Trp Ala Lys Thr Tyr Met Tyr Gln Asp Ser Pro 130 135 140 Thr His Pro Ala Phe Gly Tyr Phe Ala Trp Ser Met Arg Arg Asp Gly 145 150 155 160 Val Ala Asn Asp Asp Met Pro Ala Pro Asp Gly Glu Glu Tyr Phe Val 165 170 175 Thr Ala Leu Tyr Phe Ala Ala Ala Arg Trp Gly Asn Gly Glu Gly Ile 180 185 190 Phe Asn Tyr Gln Gln Glu Ala Asp Thr Ile Leu Ser Arg Met Arg His 195 200 205 Arg Gln Val Ile Thr Gly Pro Thr Asn Arg Gly Val Met Thr Ala Thr 210 215 220 Asn Leu Phe His Pro Glu Glu Ala Gln Val Arg Phe Thr Pro Asp Ile 225 230 235 240 Asn Asn Ala Asp His Thr Asp Ala Ser Tyr His Leu Pro Ser Phe Tyr 245 250 255 Glu Ile Trp Ala Arg Val Ala Pro Gln Glu Asp Arg Ala Phe Trp Ala 260 265 270 Lys Ala Ala Asp Val Ser Arg Asp Tyr Phe Ala Lys Ala Ala His Pro 275 280 285 Val Thr Ala Leu Thr Pro Asp Tyr Gly Asn Phe Asp Gly Thr Pro Trp 290 295 300 Ala Ala Ser Trp Arg Pro Glu Ser Val Asp Phe Arg Tyr Asp Ala Trp 305 310 315 320 Arg Ser Val Met Asn Trp Ser Met Asp Tyr Ala Trp Trp Gly Lys Asp 325 330 335 Ser Gly Ala Pro Ala Arg Ser Asp Lys Leu Leu Ala Phe Phe Glu Thr 340 345 350 Gln Glu Gly Lys Met Asn His Leu Tyr Ser Leu Asp Gly Lys Pro Leu 355 360 365 Gly Gly Gly Pro Thr Leu Gly Leu Ile Ser Met Asn Ala Thr Ala Ala 370 375 380 Met Ala Ala Thr Asp Pro Arg Trp His Asn Phe Val Glu Lys Leu Trp 385 390 395 400 Gln Gln Gln Pro Pro Thr Gly Gln Tyr Arg Tyr Tyr Asp Gly Val Leu 405 410 415 Tyr Leu Met Ala Leu Leu His Cys Ala Gly Glu Tyr Lys Ala Trp Ile 420 425 430 Pro Asp Gly Glu 435 <210> 11 <211> 1224 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 11 atgcggaacg tcgtgcgtaa accattgaca atcggactcg ctttaacact attattgccc 60 atgggaatga cggcaacatc agcgaagaat gcagattcct atgcgaaaaa acctcacatc 120 agcgcattga atgccccaca attggatcaa cgctacaaaa acgagttcac gattggtgcg 180 gcagtagaac cttatcaact acaaaatgaa aaagacgtac aaatgctaaa gcgccacttc 240 aacagcattg ttgccgagaa cgtaatgaaa ccgatcagca ttcaacctga ggaaggaaaa 300 ttcaattttg aacaagcgga tcgaattgtg aagttcgcta aggcaaatgg catggatatt 360 cgcttccata cactcgtttg gcacagccaa gtacctcaac ggttctttct tgacaaggaa 420 ggtaagccaa tggtcaatga aacagatcca gtgaaacgtg aacaaaataa acaactgctg 480 ttaaaacgac ttgaaactca tattaaaacg atcgtcgagc ggtacaaaga tgacattaag 540 tactgggacg ttgtaaatga ggttgtgggg gacgacggaa aactgcgcaa ctctccatgg 600 tatcaaatcg ccggcatcga ttatattaaa gtggcattcc aagcagctag aaaatatggc 660 ggagacaaca ttaagcttta catgaatgat tacaatacag aagtcgaacc gaagcgaacc 720 gctctttaca atttagtcaa acaactgaaa gaagagggtg ttccgatcga cggcatcggc 780 catcaatccc acatccaaat cggctggcct tctgaagcag aaatcgagaa aacgattaac 840 atgttcgccg ctttcggttt agacaaccaa atcactgagc ttgatgtgag catgtacggt 900 tggccgccgc gcgcttaccc gacgtatgac gccattccaa aacaaaagtt tttggatcag 960 gcagcgcgct atgatcgttt gttcaaactg tatgagaagt tgagcgataa aattagcaac 1020 gtcaccttct ggggcatcgc cgacaatcat acgtggctcg acagccgtgc ggatgtgtac 1080 tatgacgcca acgggaatgt tgtggttgac ccgaacgctc cgtacgcaaa agtggaaaaa 1140 gggaaaggaa aagatgcgcc gttcgttttt ggaccggatt acaaagtcaa acccgcatat 1200 tgggctatta ttgaccacaa atag 1224 <210> 12 <211> 407 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(28) <400> 12 Met Arg Asn Val Val Arg Lys Pro Leu Thr Ile Gly Leu Ala Leu Thr 1 5 10 15 Leu Leu Leu Pro Met Gly Met Thr Ala Thr Ser Ala Lys Asn Ala Asp 20 25 30 Ser Tyr Ala Lys Lys Pro His Ile Ser Ala Leu Asn Ala Pro Gln Leu 35 40 45 Asp Gln Arg Tyr Lys Asn Glu Phe Thr Ile Gly Ala Ala Val Glu Pro 50 55 60 Tyr Gln Leu Gln Asn Glu Lys Asp Val Gln Met Leu Lys Arg His Phe 65 70 75 80 Asn Ser Ile Val Ala Glu Asn Val Met Lys Pro Ile Ser Ile Gln Pro 85 90 95 Glu Glu Gly Lys Phe Asn Phe Glu Gln Ala Asp Arg Ile Val Lys Phe 100 105 110 Ala Lys Ala Asn Gly Met Asp Ile Arg Phe His Thr Leu Val Trp His 115 120 125 Ser Gln Val Pro Gln Arg Phe Phe Leu Asp Lys Glu Gly Lys Pro Met 130 135 140 Val Asn Glu Thr Asp Pro Val Lys Arg Glu Gln Asn Lys Gln Leu Leu 145 150 155 160 Leu Lys Arg Leu Glu Thr His Ile Lys Thr Ile Val Glu Arg Tyr Lys 165 170 175 Asp Asp Ile Lys Tyr Trp Asp Val Val Asn Glu Val Val Gly Asp Asp 180 185 190 Gly Lys Leu Arg Asn Ser Pro Trp Tyr Gln Ile Ala Gly Ile Asp Tyr 195 200 205 Ile Lys Val Ala Phe Gln Ala Ala Arg Lys Tyr Gly Gly Asp Asn Ile 210 215 220 Lys Leu Tyr Met Asn Asp Tyr Asn Thr Glu Val Glu Pro Lys Arg Thr 225 230 235 240 Ala Leu Tyr Asn Leu Val Lys Gln Leu Lys Glu Glu Gly Val Pro Ile 245 250 255 Asp Gly Ile Gly His Gln Ser His Ile Gln Ile Gly Trp Pro Ser Glu 260 265 270 Ala Glu Ile Glu Lys Thr Ile Asn Met Phe Ala Ala Phe Gly Leu Asp 275 280 285 Asn Gln Ile Thr Glu Leu Asp Val Ser Met Tyr Gly Trp Pro Pro Arg 290 295 300 Ala Tyr Pro Thr Tyr Asp Ala Ile Pro Lys Gln Lys Phe Leu Asp Gln 305 310 315 320 Ala Ala Arg Tyr Asp Arg Leu Phe Lys Leu Tyr Glu Lys Leu Ser Asp 325 330 335 Lys Ile Ser Asn Val Thr Phe Trp Gly Ile Ala Asp Asn His Thr Trp 340 345 350 Leu Asp Ser Arg Ala Asp Val Tyr Tyr Asp Ala Asn Gly Asn Val Val 355 360 365 Val Asp Pro Asn Ala Pro Tyr Ala Lys Val Glu Lys Gly Lys Gly Lys 370 375 380 Asp Ala Pro Phe Val Phe Gly Pro Asp Tyr Lys Val Lys Pro Ala Tyr 385 390 395 400 Trp Ala Ile Ile Asp His Lys 405 <210> 13 <211> 1053 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 13 atgaaagacg cgctccagtg ctctcccctt ttcaaagcct atgaaaaata cttccgcatc 60 ggcgcggcgg ttagcagctt catgaccttt gatcccgctt accgcgccct gatccgccgc 120 cattacaatt ccctgacggc ggacaaccag atgaagccgg aaagcgtgtt ggatcgcacc 180 gcgaccctgg cgaagggcga cctgctccac gctgcggtgg atttcacccg tgtggacgcg 240 ctgatgtact ttgcacggga caacgggatc cccatgcggt atcacaccct ggcctggcac 300 aaccagacgc cccgctggtt cttcgcgaag gactggagcg acgcggaaag cgccgaaccc 360 gcctcaaagg aaaccatgct tgcccgtctg gaaaactata tcctggatgt catgaaccat 420 gtgaatacca agtttcccgg tctggtttac acctgggacg tggtaaacga agccattgag 480 ccagagctga aagccccggg attgtaccgg acctggagcc cctggttcaa aacctgcgga 540 gaagatttcc tctttaccgc tttccgggcc gcccgcaagg gacaggcgcc cggtcagacc 600 ctttgctata acgactataa cgccttcgag cccgtcaagc gggacgcgat tatcgatctg 660 ctgaagaagc tgcaggcgga aaacctggtg gataccatgg gtatgcaggg gcattatgtc 720 atggactgga tgaacatctc gctctgcgaa gaggccgccc gcgcctatgc cgccctgggc 780 ctgaaggtcc aggtcaccga gctggatatc cactgcaaca gcgacgatga agcccacagc 840 caaaagctgg cgcagcttta cggcgattat ttcgccatgc tgaagaagct gaaggaggaa 900 ggcgtcgaca tcgaagccgt caccttctgg ggcgtcaccg accaggacag ctggctcacc 960 ggtttccgta aagagacaag ctatcccctc ctcttcgacc gcgccaagca ggccaaggat 1020 gcctatgacg ccgtcatgaa agccgcggaa taa 1053 <210> 14 <211> 350 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 14 Met Lys Asp Ala Leu Gln Cys Ser Pro Leu Phe Lys Ala Tyr Glu Lys 1 5 10 15 Tyr Phe Arg Ile Gly Ala Ala Val Ser Ser Phe Met Thr Phe Asp Pro 20 25 30 Ala Tyr Arg Ala Leu Ile Arg Arg His Tyr Asn Ser Leu Thr Ala Asp 35 40 45 Asn Gln Met Lys Pro Glu Ser Val Leu Asp Arg Thr Ala Thr Leu Ala 50 55 60 Lys Gly Asp Leu Leu His Ala Ala Val Asp Phe Thr Arg Val Asp Ala 65 70 75 80 Leu Met Tyr Phe Ala Arg Asp Asn Gly Ile Pro Met Arg Tyr His Thr 85 90 95 Leu Ala Trp His Asn Gln Thr Pro Arg Trp Phe Phe Ala Lys Asp Trp 100 105 110 Ser Asp Ala Glu Ser Ala Glu Pro Ala Ser Lys Glu Thr Met Leu Ala 115 120 125 Arg Leu Glu Asn Tyr Ile Leu Asp Val Met Asn His Val Asn Thr Lys 130 135 140 Phe Pro Gly Leu Val Tyr Thr Trp Asp Val Val Asn Glu Ala Ile Glu 145 150 155 160 Pro Glu Leu Lys Ala Pro Gly Leu Tyr Arg Thr Trp Ser Pro Trp Phe 165 170 175 Lys Thr Cys Gly Glu Asp Phe Leu Phe Thr Ala Phe Arg Ala Ala Arg 180 185 190 Lys Gly Gln Ala Pro Gly Gln Thr Leu Cys Tyr Asn Asp Tyr Asn Ala 195 200 205 Phe Glu Pro Val Lys Arg Asp Ala Ile Ile Asp Leu Leu Lys Lys Leu 210 215 220 Gln Ala Glu Asn Leu Val Asp Thr Met Gly Met Gln Gly His Tyr Val 225 230 235 240 Met Asp Trp Met Asn Ile Ser Leu Cys Glu Glu Ala Ala Arg Ala Tyr 245 250 255 Ala Ala Leu Gly Leu Lys Val Gln Val Thr Glu Leu Asp Ile His Cys 260 265 270 Asn Ser Asp Asp Glu Ala His Ser Gln Lys Leu Ala Gln Leu Tyr Gly 275 280 285 Asp Tyr Phe Ala Met Leu Lys Lys Leu Lys Glu Glu Gly Val Asp Ile 290 295 300 Glu Ala Val Thr Phe Trp Gly Val Thr Asp Gln Asp Ser Trp Leu Thr 305 310 315 320 Gly Phe Arg Lys Glu Thr Ser Tyr Pro Leu Leu Phe Asp Arg Ala Lys 325 330 335 Gln Ala Lys Asp Ala Tyr Asp Ala Val Met Lys Ala Ala Glu 340 345 350 <210> 15 <211> 1110 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 15 atgaaacgtc ctctagtcaa tctcctgaca accgcctgcc tcctcgttgc cgcaaatgct 60 gcagaaccca ccctccgcga agcctacgaa aagcactttg ccgtgggtgt cgcactcaat 120 accgctcaag tgactggtcg aaacaaagcc gcaggcgaac tcgccgcgaa gcagttcaat 180 tccatcaccg ctgagaatga catgaagtgg caatcgcttc atccagagct cgatacctac 240 cgctttgaat cggccgatgc ctatatcgac tttgccaaaa agaatgagat ggaagtcata 300 ggccacactc tcgtctggca cagccagacc cctcagtggg tgttccaagg cgacgatggc 360 aaacccgcga cacgggaaga acttctcaag cggatgcgcg atcacattca caaggtcgcc 420 ggccgataca agggtaaggt caagggctgg gacgtcgtca atgaggcgct ctccgacgga 480 ggtcaggaca ttctacgcga atctccgtgg cggcgaatca tcggagacga tttcatcgat 540 cacgctttcc gctacgcccg cgaagccgac ccaaaggcag aactttacta caacgactac 600 aacctcgaaa tccctcgcaa acgcgagaac tgcatcaagc tcgtcaaggg catgcttgag 660 cgcggcgtcc ccatcgacgg cattggaacg caatcccatt ttcagcttgg cttcccatcg 720 ctggaagatg tcgagaccac gattgaagag tttggaaaac tcggccttaa ggtcatgatt 780 accgaactcg atgtggatgt cctccctcgc aataacccag gcgtcgccga catcagtcag 840 cgcgagcaag gtagcaatcc ctacactgag ggcctgcccg aggatgttca aaagcagctt 900 acgaaacgct acgaagacat cttcaagatc tacctaaagc accagaaaac ggtcacccgc 960 gtgaccttct ggggcctcga tgatggtcaa tcatggttga atggctttcc tgttagaggc 1020 cgcaccaatc acccgctact tttcgatcgt gaactcaaac cgaagcccgt tcttccagtc 1080 ttgatagagc tcggcaagaa gaagcgataa 1110 <210> 16 <211> 369 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(20) <400> 16 Met Lys Arg Pro Leu Val Asn Leu Leu Thr Thr Ala Cys Leu Leu Val 1 5 10 15 Ala Ala Asn Ala Ala Glu Pro Thr Leu Arg Glu Ala Tyr Glu Lys His 20 25 30 Phe Ala Val Gly Val Ala Leu Asn Thr Ala Gln Val Thr Gly Arg Asn 35 40 45 Lys Ala Ala Gly Glu Leu Ala Ala Lys Gln Phe Asn Ser Ile Thr Ala 50 55 60 Glu Asn Asp Met Lys Trp Gln Ser Leu His Pro Glu Leu Asp Thr Tyr 65 70 75 80 Arg Phe Glu Ser Ala Asp Ala Tyr Ile Asp Phe Ala Lys Lys Asn Glu 85 90 95 Met Glu Val Ile Gly His Thr Leu Val Trp His Ser Gln Thr Pro Gln 100 105 110 Trp Val Phe Gln Gly Asp Asp Gly Lys Pro Ala Thr Arg Glu Glu Leu 115 120 125 Leu Lys Arg Met Arg Asp His Ile His Lys Val Ala Gly Arg Tyr Lys 130 135 140 Gly Lys Val Lys Gly Trp Asp Val Val Asn Glu Ala Leu Ser Asp Gly 145 150 155 160 Gly Gln Asp Ile Leu Arg Glu Ser Pro Trp Arg Arg Ile Ile Gly Asp 165 170 175 Asp Phe Ile Asp His Ala Phe Arg Tyr Ala Arg Glu Ala Asp Pro Lys 180 185 190 Ala Glu Leu Tyr Tyr Asn Asp Tyr Asn Leu Glu Ile Pro Arg Lys Arg 195 200 205 Glu Asn Cys Ile Lys Leu Val Lys Gly Met Leu Glu Arg Gly Val Pro 210 215 220 Ile Asp Gly Ile Gly Thr Gln Ser His Phe Gln Leu Gly Phe Pro Ser 225 230 235 240 Leu Glu Asp Val Glu Thr Thr Ile Glu Glu Phe Gly Lys Leu Gly Leu 245 250 255 Lys Val Met Ile Thr Glu Leu Asp Val Asp Val Leu Pro Arg Asn Asn 260 265 270 Pro Gly Val Ala Asp Ile Ser Gln Arg Glu Gln Gly Ser Asn Pro Tyr 275 280 285 Thr Glu Gly Leu Pro Glu Asp Val Gln Lys Gln Leu Thr Lys Arg Tyr 290 295 300 Glu Asp Ile Phe Lys Ile Tyr Leu Lys His Gln Lys Thr Val Thr Arg 305 310 315 320 Val Thr Phe Trp Gly Leu Asp Asp Gly Gln Ser Trp Leu Asn Gly Phe 325 330 335 Pro Val Arg Gly Arg Thr Asn His Pro Leu Leu Phe Asp Arg Glu Leu 340 345 350 Lys Pro Lys Pro Val Leu Pro Val Leu Ile Glu Leu Gly Lys Lys Lys 355 360 365 Arg <210> 17 <211> 1035 <212> DNA <213> Bacteria <400> 17 atgtcccggc acgtcatcgc cctgtccgcc gccgtctgcc tcgcggccgg cctcgccgcc 60 gcgcccgcga gcgccgagcc gcgtccccgg acgctcggcg aactggccaa gaagcaccac 120 aagtacttcg gctcggccac cgacaacccc gagttcaccg acgccgccta tctgaagctc 180 ctcggcagcg agttcgggca gaccaccccc ggcaacgcca tgaagtggta cgccaccgaa 240 cccgcgcccg gcgtcttcga cttcaccgcg ggcgacgagg tcgtggcctt cgccaaggcc 300 catcaccaga aggtccgcgg ccacaccctc gtctggcaca gccagctccc cgcctggctc 360 accgagcgca gctggaccgc cgcggaactg cgccccgtcc tcaagaatca catccagaag 420 gtggcccggc actacaaggg caaggtcatc cactgggacg tcgtcaacga ggccttcaac 480 gaggacggca cctaccgcga gtcggtcttc tacaagacgc tcggccccgg ctacatcgcc 540 gacgccctgc gctgggccca cgaggccgac ccgcacgcca agctgtacct caacgactac 600 aacgtcgacg ggatcggccc caagagcgac gcctactacc gcctgatcaa gcagctgaag 660 gccgacggcg tcccggtgga gggcttcggc atccaggggc acctggcgct ccagtacggc 720 ttccccgccg acgtcaagca gaacatgcag cgcttcgccg acctcggcgt cgaggtcgcg 780 gtcaccgagc tcgacatccg gatgaacctc ccggcgaccc cttcgatgct cgccacccag 840 gccacctggt acgccgacta cgtcaaggcc tgcctggagg tcaggaagtg cgtcggcgtc 900 accatctggg actacaccga caagtactcg tggatcccct ccgtcttccc cggtgagggc 960 gccgcgctgc cctacgacga gaacctggcg cccaagcccg cctaccacgc gatcaggaag 1020 gtgctgggcg gatga 1035 <210> 18 <211> 344 <212> PRT <213> Bacteria <220> <221> SIGNAL <222> (1)...(31) <400> 18 Met Ser Arg His Val Ile Ala Leu Ser Ala Ala Val Cys Leu Ala Ala 1 5 10 15 Gly Leu Ala Ala Ala Pro Ala Ser Ala Glu Pro Arg Pro Arg Thr Leu 20 25 30 Gly Glu Leu Ala Lys Lys His His Lys Tyr Phe Gly Ser Ala Thr Asp 35 40 45 Asn Pro Glu Phe Thr Asp Ala Ala Tyr Leu Lys Leu Leu Gly Ser Glu 50 55 60 Phe Gly Gln Thr Thr Pro Gly Asn Ala Met Lys Trp Tyr Ala Thr Glu 65 70 75 80 Pro Ala Pro Gly Val Phe Asp Phe Thr Ala Gly Asp Glu Val Val Ala 85 90 95 Phe Ala Lys Ala His His Gln Lys Val Arg Gly His Thr Leu Val Trp 100 105 110 His Ser Gln Leu Pro Ala Trp Leu Thr Glu Arg Ser Trp Thr Ala Ala 115 120 125 Glu Leu Arg Pro Val Leu Lys Asn His Ile Gln Lys Val Ala Arg His 130 135 140 Tyr Lys Gly Lys Val Ile His Trp Asp Val Val Asn Glu Ala Phe Asn 145 150 155 160 Glu Asp Gly Thr Tyr Arg Glu Ser Val Phe Tyr Lys Thr Leu Gly Pro 165 170 175 Gly Tyr Ile Ala Asp Ala Leu Arg Trp Ala His Glu Ala Asp Pro His 180 185 190 Ala Lys Leu Tyr Leu Asn Asp Tyr Asn Val Asp Gly Ile Gly Pro Lys 195 200 205 Ser Asp Ala Tyr Tyr Arg Leu Ile Lys Gln Leu Lys Ala Asp Gly Val 210 215 220 Pro Val Glu Gly Phe Gly Ile Gln Gly His Leu Ala Leu Gln Tyr Gly 225 230 235 240 Phe Pro Ala Asp Val Lys Gln Asn Met Gln Arg Phe Ala Asp Leu Gly 245 250 255 Val Glu Val Ala Val Thr Glu Leu Asp Ile Arg Met Asn Leu Pro Ala 260 265 270 Thr Pro Ser Met Leu Ala Thr Gln Ala Thr Trp Tyr Ala Asp Tyr Val 275 280 285 Lys Ala Cys Leu Glu Val Arg Lys Cys Val Gly Val Thr Ile Trp Asp 290 295 300 Tyr Thr Asp Lys Tyr Ser Trp Ile Pro Ser Val Phe Pro Gly Glu Gly 305 310 315 320 Ala Ala Leu Pro Tyr Asp Glu Asn Leu Ala Pro Lys Pro Ala Tyr His 325 330 335 Ala Ile Arg Lys Val Leu Gly Gly 340 <210> 19 <211> 1152 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 19 atgaagatgt taaaaactat tgttgtggct gtagcagcct tactatccag tcctactgct 60 tcagccactt tacagaacct gaagcgggct cctgattcat tgaccttgaa agatgcattt 120 gagggtaagt tttatatagg aacagcatta aaccttgatc agatatggga gcgcgatcag 180 gctgcggtcg cggtggtcaa aacgcagttc aactccatag ttgctgagaa ttgtatgaaa 240 agtatgtttt tgcaaccaag ggaaggtgag tttgatttta gggatgcgga ccgttttgtc 300 gcgtttggag aaaaaaataa aatgcaaatt atcggtcata cgctgatttg gcattcgcag 360 acaccagctt ggttttttgt cgataaaaat gggaaagagg tcacccgaga ggtacttatc 420 gagcgcatgc ggaagcatat acaaaccgtt gtttcccgct ataagggaag ggtgtttggt 480 tgggatgtgg tgaacgaagc catattggat aatggagaat ggcgtaaaag caaattctac 540 cagattatcg ggccacaatt tattgaattg gccttcaaat ttgcgcatga cgcagatcca 600 aatgcagaat tatattataa cgattattca actgctatcc ccgaaaaaag aaaggggatt 660 atgcgcatgg tgcagcaggt aaaggctgcc ggtgggcagg tcactggaat tggtatgcag 720 gaacacaacg cattggacaa tccaccggtc gatgaagtcg aaaaaaccat actcggattt 780 gcaagccttg gtgcgaaggt aatggttacg gaaatggata tttcggtcct gccgcatgta 840 cgtcccaata tgggcgcaga aataggggag cgtcatgcct acagtaaagc gatgaatccg 900 tacgaaaaag gacttcctgt aacgaaaatg aacgagttgg gagcgagata tgtagcgttt 960 tttaatttat atctcaaaca tcgggataaa atatcgcgtg tgacattgtg gggtgttggc 1020 gatggagatt catggaagaa tggttggcct attcccggac gtacagacta tccattgtta 1080 ttcgatcgga attaccaacc caaacctttt gtaaaagata ttattgcgtt gactcaaaaa 1140 aaaaagaaat aa 1152 <210> 20 <211> 383 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(29) <400> 20 Met Lys Met Leu Lys Thr Ile Val Val Ala Val Ala Ala Leu Leu Ser 1 5 10 15 Ser Pro Thr Ala Ser Ala Thr Leu Gln Asn Leu Lys Arg Ala Pro Asp 20 25 30 Ser Leu Thr Leu Lys Asp Ala Phe Glu Gly Lys Phe Tyr Ile Gly Thr 35 40 45 Ala Leu Asn Leu Asp Gln Ile Trp Glu Arg Asp Gln Ala Ala Val Ala 50 55 60 Val Val Lys Thr Gln Phe Asn Ser Ile Val Ala Glu Asn Cys Met Lys 65 70 75 80 Ser Met Phe Leu Gln Pro Arg Glu Gly Glu Phe Asp Phe Arg Asp Ala 85 90 95 Asp Arg Phe Val Ala Phe Gly Glu Lys Asn Lys Met Gln Ile Ile Gly 100 105 110 His Thr Leu Ile Trp His Ser Gln Thr Pro Ala Trp Phe Phe Val Asp 115 120 125 Lys Asn Gly Lys Glu Val Thr Arg Glu Val Leu Ile Glu Arg Met Arg 130 135 140 Lys His Ile Gln Thr Val Val Ser Arg Tyr Lys Gly Arg Val Phe Gly 145 150 155 160 Trp Asp Val Val Asn Glu Ala Ile Leu Asp Asn Gly Glu Trp Arg Lys 165 170 175 Ser Lys Phe Tyr Gln Ile Ile Gly Pro Gln Phe Ile Glu Leu Ala Phe 180 185 190 Lys Phe Ala His Asp Ala Asp Pro Asn Ala Glu Leu Tyr Tyr Asn Asp 195 200 205 Tyr Ser Thr Ala Ile Pro Glu Lys Arg Lys Gly Ile Met Arg Met Val 210 215 220 Gln Gln Val Lys Ala Ala Gly Gly Gln Val Thr Gly Ile Gly Met Gln 225 230 235 240 Glu His Asn Ala Leu Asp Asn Pro Pro Val Asp Glu Val Glu Lys Thr 245 250 255 Ile Leu Gly Phe Ala Ser Leu Gly Ala Lys Val Met Val Thr Glu Met 260 265 270 Asp Ile Ser Val Leu Pro His Val Arg Pro Asn Met Gly Ala Glu Ile 275 280 285 Gly Glu Arg His Ala Tyr Ser Lys Ala Met Asn Pro Tyr Glu Lys Gly 290 295 300 Leu Pro Val Thr Lys Met Asn Glu Leu Gly Ala Arg Tyr Val Ala Phe 305 310 315 320 Phe Asn Leu Tyr Leu Lys His Arg Asp Lys Ile Ser Arg Val Thr Leu 325 330 335 Trp Gly Val Gly Asp Gly Asp Ser Trp Lys Asn Gly Trp Pro Ile Pro 340 345 350 Gly Arg Thr Asp Tyr Pro Leu Leu Phe Asp Arg Asn Tyr Gln Pro Lys 355 360 365 Pro Phe Val Lys Asp Ile Ile Ala Leu Thr Gln Lys Lys Lys Lys 370 375 380 <210> 21 <211> 1119 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 21 atgcggattc actggctggg gctcagctca cgcgcaagcc tgatgacggc ggcgctcctg 60 gctgtcacag gcaccaccaa atccgaggac tcgcccgcaa ctttgaaaga cgccttcaag 120 gattgtttcc ggatcggggt cgcgctcaac cagcggcaat ttaccgagca agataccaac 180 ggcgcgacgt tggtgaaacg gcagttcaac gccatctcac ccgaaaacgt gatgaagtgg 240 gcgaacattc atccccgacc cgggcccgat gggtataact tcgaggcggc tgaccgttac 300 gtcgagtttg gcgagaagaa cggaatgttc atcgtcggcc atacgctcgt ttggcacttc 360 caaacgccgc gctgggtact ccagggcgat ggcactaacg cggcgacgcg cgagctgctg 420 ctgcagcgga tgcgcgatca catccacacg gtcgtaggcc ggtacaaagg gcggatcaag 480 gcttgggacg tggtcaacga agcgctgaac gaagatggca ctctgcggcg gtcgcagtgg 540 taccggatca tcggcgaaga ctacatcgtc aaggctttcg aatatgcgca tgaggccgat 600 ccgtccgcgg aattgcgata caacgattac gccatcgaga atgagcggaa gcgcgacggc 660 gtaatcgcgc tcgtgaagaa acttcaggcg cagaaggtcc cacttggggg gctgggctcg 720 cagacgcatg ccaacctgac ctggcctaac gccgaatcgc tggacaccgc cctcacggcc 780 ttcaccgaac tgggtatccc gatctcaatc acggaactgg atgtgaccgc ctcgcaacgc 840 ggtcagctca accagagcgc cgaggtgtcg cagaatggac aggcggggga gggaggcgtg 900 gtggacgggg cgaatcagaa gctcgccgag cagtacgcca acttcttccg cgtctttctg 960 aagcatcgca aaaacattga gctcgtgacg ttttggggcg tcacggatcg tgactcctgg 1020 cggcgcattg gcaaaccgct gctatttaac gcagaatggc aacccaagcc ggcctttcac 1080 gccgtcatcg ccgaggcgaa aaagatcagt gggcaatga 1119 <210> 22 <211> 372 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(28) <400> 22 Met Arg Ile His Trp Leu Gly Leu Ser Ser Arg Ala Ser Leu Met Thr 1 5 10 15 Ala Ala Leu Leu Ala Val Thr Gly Thr Thr Lys Ser Glu Asp Ser Pro 20 25 30 Ala Thr Leu Lys Asp Ala Phe Lys Asp Cys Phe Arg Ile Gly Val Ala 35 40 45 Leu Asn Gln Arg Gln Phe Thr Glu Gln Asp Thr Asn Gly Ala Thr Leu 50 55 60 Val Lys Arg Gln Phe Asn Ala Ile Ser Pro Glu Asn Val Met Lys Trp 65 70 75 80 Ala Asn Ile His Pro Arg Pro Gly Pro Asp Gly Tyr Asn Phe Glu Ala 85 90 95 Ala Asp Arg Tyr Val Glu Phe Gly Glu Lys Asn Gly Met Phe Ile Val 100 105 110 Gly His Thr Leu Val Trp His Phe Gln Thr Pro Arg Trp Val Leu Gln 115 120 125 Gly Asp Gly Thr Asn Ala Ala Thr Arg Glu Leu Leu Leu Gln Arg Met 130 135 140 Arg Asp His Ile His Thr Val Val Gly Arg Tyr Lys Gly Arg Ile Lys 145 150 155 160 Ala Trp Asp Val Val Asn Glu Ala Leu Asn Glu Asp Gly Thr Leu Arg 165 170 175 Arg Ser Gln Trp Tyr Arg Ile Ile Gly Glu Asp Tyr Ile Val Lys Ala 180 185 190 Phe Glu Tyr Ala His Glu Ala Asp Pro Ser Ala Glu Leu Arg Tyr Asn 195 200 205 Asp Tyr Ala Ile Glu Asn Glu Arg Lys Arg Asp Gly Val Ile Ala Leu 210 215 220 Val Lys Lys Leu Gln Ala Gln Lys Val Pro Leu Gly Gly Leu Gly Ser 225 230 235 240 Gln Thr His Ala Asn Leu Thr Trp Pro Asn Ala Glu Ser Leu Asp Thr 245 250 255 Ala Leu Thr Ala Phe Thr Glu Leu Gly Ile Pro Ile Ser Ile Thr Glu 260 265 270 Leu Asp Val Thr Ala Ser Gln Arg Gly Gln Leu Asn Gln Ser Ala Glu 275 280 285 Val Ser Gln Asn Gly Gln Ala Gly Glu Gly Gly Val Val Asp Gly Ala 290 295 300 Asn Gln Lys Leu Ala Glu Gln Tyr Ala Asn Phe Phe Arg Val Phe Leu 305 310 315 320 Lys His Arg Lys Asn Ile Glu Leu Val Thr Phe Trp Gly Val Thr Asp 325 330 335 Arg Asp Ser Trp Arg Arg Ile Gly Lys Pro Leu Leu Phe Asn Ala Glu 340 345 350 Trp Gln Pro Lys Pro Ala Phe His Ala Val Ile Ala Glu Ala Lys Lys 355 360 365 Ile Ser Gly Gln 370 <210> 23 <211> 1137 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 23 atgaggacaa aacaagtttt taaattaacc acgctcgctt tattattaac agcagttgtt 60 agtagctgtt ctgccccaaa agcggcaaaa gaagatacgc ttaaagatgc cctccaggga 120 aaattcttta ttggtgctgc tgttaatgtt gaccaaatgg caggaaagga ttctcttgca 180 attgaagttg ttaaaaagaa ctttagctca attgtggccg agaattgcat gaaaatggaa 240 aacatccatc ctgtaaaagg tgaatttttc ttcgatgaag ccgatgcata tgttgaattt 300 ggcgaaaaaa acaacatgaa aatcattggt cacacattga tttggcattc acaagccgcc 360 aaatgggcat ttgttgatga tgaaggcaaa gatgtatcgc gcgaagaatt aattgaacgg 420 atgcgcaacc acatccatac cattgtaggc cgctataaag gtcgtgtaca tggctgggac 480 gttgttaatg aggctattct ggataacggc gaatggcgtc agagcaaatg gtataccatt 540 attggacccg aatttgttca gcttgctttt gagtttgccc acgaagccga ccccaacgct 600 gaattgtatt acaacgacta caacgagtgg attccggcta aaagagacgg catttacaac 660 atggttaagg atttaatcga caaaggcgtt aaagttgatg gaattggcct acagggtcac 720 attgctcttg actctcccag catcgaactt tacgaagaag ccattgtaaa atatgcaagt 780 ctgggtgtgc aaacaatggt taccgaactc gatatcactg ttttaccatg gccatcgcag 840 caagttacag ccgatatatc ttttagtgca gagctatcaa ccgaatacaa tccatttgtt 900 aatggtttac ccgattcggt tagcgttgaa cttaccaacc gttttgccag tttcttcgag 960 ttgtttttga aacatcagga taaaattgac cgcgttactc tatggggtgt acacgatggt 1020 caatcatgga aaaacaactg gcccatcagg ggacgtaaag attatccgtt gttattcgac 1080 aggcaatatc agtccaaacc tgccgttcag cgcataatcg aattggctaa acaataa 1137 <210> 24 <211> 378 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(29) <400> 24 Met Arg Thr Lys Gln Val Phe Lys Leu Thr Thr Leu Ala Leu Leu Leu 1 5 10 15 Thr Ala Val Val Ser Ser Cys Ser Ala Pro Lys Ala Ala Lys Glu Asp 20 25 30 Thr Leu Lys Asp Ala Leu Gln Gly Lys Phe Phe Ile Gly Ala Ala Val 35 40 45 Asn Val Asp Gln Met Ala Gly Lys Asp Ser Leu Ala Ile Glu Val Val 50 55 60 Lys Lys Asn Phe Ser Ser Ile Val Ala Glu Asn Cys Met Lys Met Glu 65 70 75 80 Asn Ile His Pro Val Lys Gly Glu Phe Phe Phe Asp Glu Ala Asp Ala 85 90 95 Tyr Val Glu Phe Gly Glu Lys Asn Asn Met Lys Ile Ile Gly His Thr 100 105 110 Leu Ile Trp His Ser Gln Ala Ala Lys Trp Ala Phe Val Asp Asp Glu 115 120 125 Gly Lys Asp Val Ser Arg Glu Glu Leu Ile Glu Arg Met Arg Asn His 130 135 140 Ile His Thr Ile Val Gly Arg Tyr Lys Gly Arg Val His Gly Trp Asp 145 150 155 160 Val Val Asn Glu Ala Ile Leu Asp Asn Gly Glu Trp Arg Gln Ser Lys 165 170 175 Trp Tyr Thr Ile Ile Gly Pro Glu Phe Val Gln Leu Ala Phe Glu Phe 180 185 190 Ala His Glu Ala Asp Pro Asn Ala Glu Leu Tyr Tyr Asn Asp Tyr Asn 195 200 205 Glu Trp Ile Pro Ala Lys Arg Asp Gly Ile Tyr Asn Met Val Lys Asp 210 215 220 Leu Ile Asp Lys Gly Val Lys Val Asp Gly Ile Gly Leu Gln Gly His 225 230 235 240 Ile Ala Leu Asp Ser Pro Ser Ile Glu Leu Tyr Glu Glu Ala Ile Val 245 250 255 Lys Tyr Ala Ser Leu Gly Val Gln Thr Met Val Thr Glu Leu Asp Ile 260 265 270 Thr Val Leu Pro Trp Pro Ser Gln Gln Val Thr Ala Asp Ile Ser Phe 275 280 285 Ser Ala Glu Leu Ser Thr Glu Tyr Asn Pro Phe Val Asn Gly Leu Pro 290 295 300 Asp Ser Val Ser Val Glu Leu Thr Asn Arg Phe Ala Ser Phe Phe Glu 305 310 315 320 Leu Phe Leu Lys His Gln Asp Lys Ile Asp Arg Val Thr Leu Trp Gly 325 330 335 Val His Asp Gly Gln Ser Trp Lys Asn Asn Trp Pro Ile Arg Gly Arg 340 345 350 Lys Asp Tyr Pro Leu Leu Phe Asp Arg Gln Tyr Gln Ser Lys Pro Ala 355 360 365 Val Gln Arg Ile Ile Glu Leu Ala Lys Gln 370 375 <210> 25 <211> 978 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 25 gtggatccaa agaattcctt acgcgcctta gctcaaaagc gaggaattgg gtttgggacg 60 gcagtttggg ttgagcctct gtctaacgat tcgagatatc ggacggtgtt ggcgcaggag 120 ttcaatatgg tgacgccaga gaatgagatg aagtttgagc cgacgcatcc agaacgggag 180 cgctacgatt ttacagcagc cgataccctt gttgactttg ccaagaacca taacatgcag 240 gtgcgcggac ataccctggt ttggcatgaa agtctccccg attggctaac gactcaaacg 300 tggacgcgtg aggagttgat gtccatctta gaagaacaca tcaatacagt tgtcgatcgc 360 tatcgggggc aattagttgc ctgggatgtg gtgaatgaag cgatcgccaa cgataaaaac 420 gcactcagag atacgatttg gctgcgaaca atcgggccag agtatataga gaaggcattt 480 cgctgggcgc atgcagccga ccctcaagca cgtttatttt acaacgatta tggcggcgag 540 gaagtggggg gaaagtctga ggccatctat ggcatgctta aagatttgct gcaacagggt 600 gtcccgattc acggggttgg cttgcaaatg cacgttagta taaaaaaccc tcccaatccc 660 gaaaaagtgg cggcaaatat caagcgcctg aacgatctgg gattggaagt gcatataact 720 gagatggatg tgaaaacctg ggatggcatc ggtacgaagc agcaacgact tgcggctcag 780 gcacaagtgt atcggaacat gatgcaggtg tgtttggaag ctgagaactg taaggcgttt 840 tcgttgtggg gggtaagcga tcgctattct tggattcccc ggatttttaa gaagccggat 900 gcaccactga tttttgatga tttagggcgt ccgaaacccg cttacaatgc cctgaaagaa 960 gtcctcaagc ggcgttaa 978 <210> 26 <211> 325 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 26 Val Asp Pro Lys Asn Ser Leu Arg Ala Leu Ala Gln Lys Arg Gly Ile 1 5 10 15 Gly Phe Gly Thr Ala Val Trp Val Glu Pro Leu Ser Asn Asp Ser Arg 20 25 30 Tyr Arg Thr Val Leu Ala Gln Glu Phe Asn Met Val Thr Pro Glu Asn 35 40 45 Glu Met Lys Phe Glu Pro Thr His Pro Glu Arg Glu Arg Tyr Asp Phe 50 55 60 Thr Ala Ala Asp Thr Leu Val Asp Phe Ala Lys Asn His Asn Met Gln 65 70 75 80 Val Arg Gly His Thr Leu Val Trp His Glu Ser Leu Pro Asp Trp Leu 85 90 95 Thr Thr Gln Thr Trp Thr Arg Glu Glu Leu Met Ser Ile Leu Glu Glu 100 105 110 His Ile Asn Thr Val Val Asp Arg Tyr Arg Gly Gln Leu Val Ala Trp 115 120 125 Asp Val Val Asn Glu Ala Ile Ala Asn Asp Lys Asn Ala Leu Arg Asp 130 135 140 Thr Ile Trp Leu Arg Thr Ile Gly Pro Glu Tyr Ile Glu Lys Ala Phe 145 150 155 160 Arg Trp Ala His Ala Ala Asp Pro Gln Ala Arg Leu Phe Tyr Asn Asp 165 170 175 Tyr Gly Gly Glu Glu Val Gly Gly Lys Ser Glu Ala Ile Tyr Gly Met 180 185 190 Leu Lys Asp Leu Leu Gln Gln Gly Val Pro Ile His Gly Val Gly Leu 195 200 205 Gln Met His Val Ser Ile Lys Asn Pro Pro Asn Pro Glu Lys Val Ala 210 215 220 Ala Asn Ile Lys Arg Leu Asn Asp Leu Gly Leu Glu Val His Ile Thr 225 230 235 240 Glu Met Asp Val Lys Thr Trp Asp Gly Ile Gly Thr Lys Gln Gln Arg 245 250 255 Leu Ala Ala Gln Ala Gln Val Tyr Arg Asn Met Met Gln Val Cys Leu 260 265 270 Glu Ala Glu Asn Cys Lys Ala Phe Ser Leu Trp Gly Val Ser Asp Arg 275 280 285 Tyr Ser Trp Ile Pro Arg Ile Phe Lys Lys Pro Asp Ala Pro Leu Ile 290 295 300 Phe Asp Asp Leu Gly Arg Pro Lys Pro Ala Tyr Asn Ala Leu Lys Glu 305 310 315 320 Val Leu Lys Arg Arg 325 <210> 27 <211> 1173 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 27 atgaaatcct taacaaatca atccttcatg aaactcataa tctgtctggc attgccagtc 60 gcactactca gcatttcatg caaaaaaccc gccgaaccac tgaaaccggt tgaaggctta 120 aaagacagct tcaaagacaa gtttctcatg ggtgtggcgc tgaataaagc acagattctg 180 ggaagagata cattggtaca tgcttttaca gtacagcatt ttaattccat tactgcagaa 240 aacgaaatga agtgggaacg catccacccg cagcctgatg tatatgattt cacggttccg 300 gacagcctga ttgcttttgg cgaacgcaac ggcatgttta tagtcgggca tacactcgta 360 tggcactccc aggtgcccga ttgggttttc accgatgaga agggaaagcc tctgacccgc 420 gatgctctgc tccaacgcat gaaggatcat atttatgccg ttgtcggccg gtataagggc 480 aaggtggatg gctgggatgt ggtaaatgaa gcattggatg aagacggaca gctgcgcaaa 540 tccaggtggc atgaaatcat cggtgatgat tacattcaga aagcctttga gttcacccgg 600 gaggcagatc ccggtgcaga gctttattac aatgattaca acatagaact caaaaaaaag 660 cgggagggtg ctgtcaggct gctacaggaa ctgcagcaaa aaggcattaa aatcgacgga 720 gtgggcattc agggacattg gcacctgcac tcacctgatc tgcaagagat tgattcaagt 780 cttcaggcat acggacaact tggtctgaag gtcatgatca ccgaactgga tgttaacgtc 840 attcccgaac cttcaggtat tattggcgcc gatgttgcac agcgggcgga ttatcagagc 900 cagctgaatc catggcctga aagttttccc gattccatgc agcaggttct ggccagccgg 960 tatgccgaac tgttcggatt gttcctgaag cacagcgata aggtaagccg ggtgaccttc 1020 tggggaattc acgatggcta ttcctggaag aacaactggc caataccggg ccgaacaact 1080 tatcccctcc tttttgaccg gaattaccag cctaaacctg cgtatgatgc tgtcattgaa 1140 ttgaccaaaa tacagccgga agccagtaac tga 1173 <210> 28 <211> 390 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(27) <400> 28 Met Lys Ser Leu Thr Asn Gln Ser Phe Met Lys Leu Ile Ile Cys Leu 1 5 10 15 Ala Leu Pro Val Ala Leu Leu Ser Ile Ser Cys Lys Lys Pro Ala Glu 20 25 30 Pro Leu Lys Pro Val Glu Gly Leu Lys Asp Ser Phe Lys Asp Lys Phe 35 40 45 Leu Met Gly Val Ala Leu Asn Lys Ala Gln Ile Leu Gly Arg Asp Thr 50 55 60 Leu Val His Ala Phe Thr Val Gln His Phe Asn Ser Ile Thr Ala Glu 65 70 75 80 Asn Glu Met Lys Trp Glu Arg Ile His Pro Gln Pro Asp Val Tyr Asp 85 90 95 Phe Thr Val Pro Asp Ser Leu Ile Ala Phe Gly Glu Arg Asn Gly Met 100 105 110 Phe Ile Val Gly His Thr Leu Val Trp His Ser Gln Val Pro Asp Trp 115 120 125 Val Phe Thr Asp Glu Lys Gly Lys Pro Leu Thr Arg Asp Ala Leu Leu 130 135 140 Gln Arg Met Lys Asp His Ile Tyr Ala Val Val Gly Arg Tyr Lys Gly 145 150 155 160 Lys Val Asp Gly Trp Asp Val Val Asn Glu Ala Leu Asp Glu Asp Gly 165 170 175 Gln Leu Arg Lys Ser Arg Trp His Glu Ile Ile Gly Asp Asp Tyr Ile 180 185 190 Gln Lys Ala Phe Glu Phe Thr Arg Glu Ala Asp Pro Gly Ala Glu Leu 195 200 205 Tyr Tyr Asn Asp Tyr Asn Ile Glu Leu Lys Lys Lys Arg Glu Gly Ala 210 215 220 Val Arg Leu Leu Gln Glu Leu Gln Gln Lys Gly Ile Lys Ile Asp Gly 225 230 235 240 Val Gly Ile Gln Gly His Trp His Leu His Ser Pro Asp Leu Gln Glu 245 250 255 Ile Asp Ser Ser Leu Gln Ala Tyr Gly Gln Leu Gly Leu Lys Val Met 260 265 270 Ile Thr Glu Leu Asp Val Asn Val Ile Pro Glu Pro Ser Gly Ile Ile 275 280 285 Gly Ala Asp Val Ala Gln Arg Ala Asp Tyr Gln Ser Gln Leu Asn Pro 290 295 300 Trp Pro Glu Ser Phe Pro Asp Ser Met Gln Gln Val Leu Ala Ser Arg 305 310 315 320 Tyr Ala Glu Leu Phe Gly Leu Phe Leu Lys His Ser Asp Lys Val Ser 325 330 335 Arg Val Thr Phe Trp Gly Ile His Asp Gly Tyr Ser Trp Lys Asn Asn 340 345 350 Trp Pro Ile Pro Gly Arg Thr Thr Tyr Pro Leu Leu Phe Asp Arg Asn 355 360 365 Tyr Gln Pro Lys Pro Ala Tyr Asp Ala Val Ile Glu Leu Thr Lys Ile 370 375 380 Gln Pro Glu Ala Ser Asn 385 390 <210> 29 <211> 2331 <212> DNA <213> Archaea <400> 29 atgacgatgc agagaaagta ctcatccgac gcgaacacac agtatgagtg gataaaatca 60 gctactgtac catctggtca gtgggtacag ctctctggaa cgtacacgat cccggccgga 120 gttaccgtgg aagatctcac gctttacttc gaatctcaaa atccaaccct tgagttctac 180 gtggatgacg tgaagatagt ggatacaact tccgcagaga taaagattga aatggaacct 240 gaaaaagaga tacctgctct gaaagaagta ctgaaagatt acttcaaagt cggagttgca 300 ctgccgtcca aggtcttcct caacccgaag gacatagaac tcatcacgaa acacttcaac 360 agcatcaccg cagaaaacga gatgaaaccg gatagtctgc tcgcgggcat cgaaaacggt 420 aagctgaagt tcaggtttga aacagcagac aaatacattc agttcgtcga ggaaaacggc 480 atggttataa gaggtcacac actggtgtgg cacaaccaga cacccgactg gttcttcaaa 540 gacgaaaacg gaaacctcct ctccaaagaa gcgatgacgg aaagactcaa agagtacatc 600 cacaccgttg tcggacactt caaaggaaaa gtctacgcat gggacgtggt gaacgaagcg 660 gtcgatccga accagccgga tggactgaga agatcaacct ggtaccagat catggggcct 720 gactacatag aactcgcctt caagttcgca agagaggcag atccagatgc aaaactcttc 780 tacaacgact acaacacatt cgatcccaga aagagagaca tcatctacaa cctcgtgaag 840 gatctcaaag agaagggact catcgatggc ataggaatgc agtgtcacat cagtcttgca 900 acagacatca aacagatcga agaggccatc aaaaagttca gcaccatacc cggtatagaa 960 attcacatca cagaactcga tatgagtgtc tacagagatt ccagttccaa ctacccagag 1020 gcaccgagga cggcactcat cgaacaggct cacaaaatga tgcagctctt tgagatcttc 1080 aagaagcaca gcaacgtgat cacgaacgtc acattctggg gtctcaagga cgattactcc 1140 tggagagcaa caagaagaaa cgactggccg ctcatcttcg acaaagatca ccaggcgaaa 1200 ctcgcttact gggcgatagt ggcacctgag gtccttccac cacttccaaa agaaagcagg 1260 atctccgaag gcgaagcagt ggtagtgggg atgatggacg actcgtacct gatgtcgaag 1320 ccgatagaga tccttgacga agaagggaac gtgaaggcaa cgatcagggc agtgtggaaa 1380 gacagcacga tctacatcta cggagaggta caggacaaga caaagaaacc agcagaagac 1440 ggagtggcca tattcatcaa cccgaacaac gaaagaacac cctatctgca gcctgatgac 1500 acctacgttg tgctgtggac gaactggaag acggaggtca acagagaaga cgtacaggtg 1560 aagaaattcg ttgggcctgg ctttagaaga tacagcttcg agatgtcgat cacgataccg 1620 ggtgtggagt tcaagaaaga cagctacata ggatttgacg ttgcggtgat agacgacggg 1680 aagtggtaca gctggagcga cacgacgaac agccagaaga cgaacacgat gaactacgga 1740 acgctgaagc tcgaaggaat aatggtagcg acagcaaaat acggaacacc ggtcatcgat 1800 ggagagatcg atgagatctg gaacacgaca gaggagatag agacgaaagc ggtggctatg 1860 ggatcgcttg acaagaatgc gacagcgaaa gtgagggtgc tgtgggacga gaactacctg 1920 tacgtacttg cgatcgtgaa agagcccgtt ctgaacaaag acaacagcaa cccgtgggag 1980 caggattccg tggagatctt cgtggatgag aacaaccaca agacaggata ctacgaagac 2040 gacgacgcgc agttcagggt gaactacatg aacgagcaga cctttggaac gggaggaagt 2100 ccagcgaggt tcaagacagc ggtgaagctg atcgaaggag gatacatagt tgaggcagcg 2160 atcaagtgga agacgatcaa gccaacaccg aacacagtga taggattcaa catccaggtg 2220 aacgatgcga acgagaaagg gcagagggtc ggtatcatct cctggagcga tcccacaaac 2280 aacagctggc aagatccttc aaagttcggt aacctcagac tcatcaagtg a 2331 <210> 30 <211> 776 <212> PRT <213> Archaea <400> 30 Met Thr Met Gln Arg Lys Tyr Ser Ser Asp Ala Asn Thr Gln Tyr Glu 1 5 10 15 Trp Ile Lys Ser Ala Thr Val Pro Ser Gly Gln Trp Val Gln Leu Ser 20 25 30 Gly Thr Tyr Thr Ile Pro Ala Gly Val Thr Val Glu Asp Leu Thr Leu 35 40 45 Tyr Phe Glu Ser Gln Asn Pro Thr Leu Glu Phe Tyr Val Asp Asp Val 50 55 60 Lys Ile Val Asp Thr Thr Ser Ala Glu Ile Lys Ile Glu Met Glu Pro 65 70 75 80 Glu Lys Glu Ile Pro Ala Leu Lys Glu Val Leu Lys Asp Tyr Phe Lys 85 90 95 Val Gly Val Ala Leu Pro Ser Lys Val Phe Leu Asn Pro Lys Asp Ile 100 105 110 Glu Leu Ile Thr Lys His Phe Asn Ser Ile Thr Ala Glu Asn Glu Met 115 120 125 Lys Pro Asp Ser Leu Leu Ala Gly Ile Glu Asn Gly Lys Leu Lys Phe 130 135 140 Arg Phe Glu Thr Ala Asp Lys Tyr Ile Gln Phe Val Glu Glu Asn Gly 145 150 155 160 Met Val Ile Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro Asp 165 170 175 Trp Phe Phe Lys Asp Glu Asn Gly Asn Leu Leu Ser Lys Glu Ala Met 180 185 190 Thr Glu Arg Leu Lys Glu Tyr Ile His Thr Val Val Gly His Phe Lys 195 200 205 Gly Lys Val Tyr Ala Trp Asp Val Val Asn Glu Ala Val Asp Pro Asn 210 215 220 Gln Pro Asp Gly Leu Arg Arg Ser Thr Trp Tyr Gln Ile Met Gly Pro 225 230 235 240 Asp Tyr Ile Glu Leu Ala Phe Lys Phe Ala Arg Glu Ala Asp Pro Asp 245 250 255 Ala Lys Leu Phe Tyr Asn Asp Tyr Asn Thr Phe Asp Pro Arg Lys Arg 260 265 270 Asp Ile Ile Tyr Asn Leu Val Lys Asp Leu Lys Glu Lys Gly Leu Ile 275 280 285 Asp Gly Ile Gly Met Gln Cys His Ile Ser Leu Ala Thr Asp Ile Lys 290 295 300 Gln Ile Glu Glu Ala Ile Lys Lys Phe Ser Thr Ile Pro Gly Ile Glu 305 310 315 320 Ile His Ile Thr Glu Leu Asp Met Ser Val Tyr Arg Asp Ser Ser Ser 325 330 335 Asn Tyr Pro Glu Ala Pro Arg Thr Ala Leu Ile Glu Gln Ala His Lys 340 345 350 Met Met Gln Leu Phe Glu Ile Phe Lys Lys His Ser Asn Val Ile Thr 355 360 365 Asn Val Thr Phe Trp Gly Leu Lys Asp Asp Tyr Ser Trp Arg Ala Thr 370 375 380 Arg Arg Asn Asp Trp Pro Leu Ile Phe Asp Lys Asp His Gln Ala Lys 385 390 395 400 Leu Ala Tyr Trp Ala Ile Val Ala Pro Glu Val Leu Pro Pro Leu Pro 405 410 415 Lys Glu Ser Arg Ile Ser Glu Gly Glu Ala Val Val Val Gly Met Met 420 425 430 Asp Asp Ser Tyr Leu Met Ser Lys Pro Ile Glu Ile Leu Asp Glu Glu 435 440 445 Gly Asn Val Lys Ala Thr Ile Arg Ala Val Trp Lys Asp Ser Thr Ile 450 455 460 Tyr Ile Tyr Gly Glu Val Gln Asp Lys Thr Lys Lys Pro Ala Glu Asp 465 470 475 480 Gly Val Ala Ile Phe Ile Asn Pro Asn Asn Glu Arg Thr Pro Tyr Leu 485 490 495 Gln Pro Asp Asp Thr Tyr Val Val Leu Trp Thr Asn Trp Lys Thr Glu 500 505 510 Val Asn Arg Glu Asp Val Gln Val Lys Lys Phe Val Gly Pro Gly Phe 515 520 525 Arg Arg Tyr Ser Phe Glu Met Ser Ile Thr Ile Pro Gly Val Glu Phe 530 535 540 Lys Lys Asp Ser Tyr Ile Gly Phe Asp Val Ala Val Ile Asp Asp Gly 545 550 555 560 Lys Trp Tyr Ser Trp Ser Asp Thr Thr Asn Ser Gln Lys Thr Asn Thr 565 570 575 Met Asn Tyr Gly Thr Leu Lys Leu Glu Gly Ile Met Val Ala Thr Ala 580 585 590 Lys Tyr Gly Thr Pro Val Ile Asp Gly Glu Ile Asp Glu Ile Trp Asn 595 600 605 Thr Thr Glu Glu Ile Glu Thr Lys Ala Val Ala Met Gly Ser Leu Asp 610 615 620 Lys Asn Ala Thr Ala Lys Val Arg Val Leu Trp Asp Glu Asn Tyr Leu 625 630 635 640 Tyr Val Leu Ala Ile Val Lys Glu Pro Val Leu Asn Lys Asp Asn Ser 645 650 655 Asn Pro Trp Glu Gln Asp Ser Val Glu Ile Phe Val Asp Glu Asn Asn 660 665 670 His Lys Thr Gly Tyr Tyr Glu Asp Asp Asp Ala Gln Phe Arg Val Asn 675 680 685 Tyr Met Asn Glu Gln Thr Phe Gly Thr Gly Gly Ser Pro Ala Arg Phe 690 695 700 Lys Thr Ala Val Lys Leu Ile Glu Gly Gly Tyr Ile Val Glu Ala Ala 705 710 715 720 Ile Lys Trp Lys Thr Ile Lys Pro Thr Pro Asn Thr Val Ile Gly Phe 725 730 735 Asn Ile Gln Val Asn Asp Ala Asn Glu Lys Gly Gln Arg Val Gly Ile 740 745 750 Ile Ser Trp Ser Asp Pro Thr Asn Asn Ser Trp Gln Asp Pro Ser Lys 755 760 765 Phe Gly Asn Leu Arg Leu Ile Lys 770 775 <210> 31 <211> 1134 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 31 gtggaaaccg tcggagcacc ggagctgagc tatgaaatcc ggaatttccg ggtggtggca 60 ccggacggag tgccggatat acagcccaca gccgcaccgg aagcgcaggc tgttccggaa 120 ggggagatgc cttccctgaa ggatgtatac gcgggcaaat tcgacttcgg tacggcgctg 180 ccccggaatg cattcaatga tatccagctg ctgagactgg tgaaggacca gttcaacatc 240 ctgacaccgg aaaatgagat gaaaccggat gcaatcctgg atgtgtacgg cagcaaaaaa 300 ctggcggaaa aggacgagac agcggtggct gtccggtttg aagcatgcaa gacgctgctt 360 cggttcgcac agtccaacgg cctgaaggtg cacggccata cgctgctgtg gcacaaccag 420 accccggaag cccttttcca cgaaggttat gacaccacca agccgatggc cggccgggaa 480 gtgatgttgg gccggatgga gaattacatc cgcgaagtgc tgacctggac cgaagaaaat 540 tatccgggcg tgatcgtttc ctgggacgtg gtgaatgaag caatcgacga cggaacgaac 600 cagctgcgca ccggtgccaa ctggtataag acggtcggac cggactacct ggcacgcgcg 660 tttgaatatg cccggaaata cgcggcggaa ggcgtgctgc tgtactacaa cgattacaat 720 accgcatacg gcggtaagct gtatgggatt gtggatctgc tggagagcct gattgccgag 780 ggcaatattg acggatacgg attccagatg caccacagcc tgggagaacc ttccatggat 840 atgattaccc gggcagtaga gaaaatagcc tcgctgggac tccggctgcg tgtgagcgaa 900 ctggacatca acgccggcaa ggcgacagag aaaaatttcg aagcccagaa gaacaagtac 960 aaacaggtga tgaagctgat gctccggttc aaggaccaga ctgaagcggt ccaggtgtgg 1020 ggcgtgacgg acatcatgag ctggcgcagg gacggatatc cgctgctgtt tgacaagaac 1080 atgaatccga aacccgcgtt cttcggtgtg atcgaagccg gaatggaaga ctga 1134 <210> 32 <211> 377 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 32 Val Glu Thr Val Gly Ala Pro Glu Leu Ser Tyr Glu Ile Arg Asn Phe 1 5 10 15 Arg Val Val Ala Pro Asp Gly Val Pro Asp Ile Gln Pro Thr Ala Ala 20 25 30 Pro Glu Ala Gln Ala Val Pro Glu Gly Glu Met Pro Ser Leu Lys Asp 35 40 45 Val Tyr Ala Gly Lys Phe Asp Phe Gly Thr Ala Leu Pro Arg Asn Ala 50 55 60 Phe Asn Asp Ile Gln Leu Leu Arg Leu Val Lys Asp Gln Phe Asn Ile 65 70 75 80 Leu Thr Pro Glu Asn Glu Met Lys Pro Asp Ala Ile Leu Asp Val Tyr 85 90 95 Gly Ser Lys Lys Leu Ala Glu Lys Asp Glu Thr Ala Val Ala Val Arg 100 105 110 Phe Glu Ala Cys Lys Thr Leu Leu Arg Phe Ala Gln Ser Asn Gly Leu 115 120 125 Lys Val His Gly His Thr Leu Leu Trp His Asn Gln Thr Pro Glu Ala 130 135 140 Leu Phe His Glu Gly Tyr Asp Thr Thr Lys Pro Met Ala Gly Arg Glu 145 150 155 160 Val Met Leu Gly Arg Met Glu Asn Tyr Ile Arg Glu Val Leu Thr Trp 165 170 175 Thr Glu Glu Asn Tyr Pro Gly Val Ile Val Ser Trp Asp Val Val Asn 180 185 190 Glu Ala Ile Asp Asp Gly Thr Asn Gln Leu Arg Thr Gly Ala Asn Trp 195 200 205 Tyr Lys Thr Val Gly Pro Asp Tyr Leu Ala Arg Ala Phe Glu Tyr Ala 210 215 220 Arg Lys Tyr Ala Ala Glu Gly Val Leu Leu Tyr Tyr Asn Asp Tyr Asn 225 230 235 240 Thr Ala Tyr Gly Gly Lys Leu Tyr Gly Ile Val Asp Leu Leu Glu Ser 245 250 255 Leu Ile Ala Glu Gly Asn Ile Asp Gly Tyr Gly Phe Gln Met His His 260 265 270 Ser Leu Gly Glu Pro Ser Met Asp Met Ile Thr Arg Ala Val Glu Lys 275 280 285 Ile Ala Ser Leu Gly Leu Arg Leu Arg Val Ser Glu Leu Asp Ile Asn 290 295 300 Ala Gly Lys Ala Thr Glu Lys Asn Phe Glu Ala Gln Lys Asn Lys Tyr 305 310 315 320 Lys Gln Val Met Lys Leu Met Leu Arg Phe Lys Asp Gln Thr Glu Ala 325 330 335 Val Gln Val Trp Gly Val Thr Asp Ile Met Ser Trp Arg Arg Asp Gly 340 345 350 Tyr Pro Leu Leu Phe Asp Lys Asn Met Asn Pro Lys Pro Ala Phe Phe 355 360 365 Gly Val Ile Glu Ala Gly Met Glu Asp 370 375 <210> 33 <211> 1815 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 33 atggttcgca aaaaactatt ttatatcgtc gcgttaatgc tgatgttcgg cgcaagtttt 60 acttccgctc aggacgcgga attttccctg cgcggtttag ccgagcgcaa taacttttat 120 gttggagcag ccgtttatac cactcatctg aatgatcctg tccatgttga aacactggca 180 cgagaattca atatgctcac gcctgaacag caggccaaac attgtgagtt ggaggcacag 240 caaggtcaat ttgactttcg gagtttcgat cgtttagtcg ccttcgccga agaacacaac 300 atggcgatac acggtcatgc gctggtctgg catagctgca caccgcaatg ggtggctaac 360 ggcgagtaca cccgtgacga agccattggt ctgctgcgcg actcgattat gaccattgtt 420 ggccgttaca aaggccgtat tccgatttgg gacgtcgtca atgaaggcat tgctgacagc 480 ggcggaacac tgcgcgatac gccatggcgg cagttaattg gcgatgatta catcgaactt 540 gccttccagt tcgctcatga agccgacccg gatgcgctgc tgttttacaa cgactataat 600 acggaaggca tgaaccctaa atcggacgcc atgtacgaga tggtgagcga ttttgtggcg 660 cgtggaattc cgattcacgg ggttgggctg caatcccatt tcatattagg cagttttgac 720 ccagaccaga ttgctcggaa cgtcgcgcgg cttggcgaac tcggtttaca agttcaattc 780 accgaggtcg atattcgata ttccggcgag gcgacagata atatcctcca gcggcaggcg 840 ggcgattacc atcgcctgat ggacgtttgc ctcggtaacg acgcctgtac tgcgtttatc 900 acctggggcg tgaccgataa atatacctgg ttgcggggcg cgaacctggg cttctacaac 960 aacctatcgg ttgaaccgct gctttttgac gatgactatg aacccaagcc cgcttatttt 1020 gcggtgctgg actcactagc gcgaagagcg ggcgaaaccc ccgttttgag cgatgacgag 1080 cttgcggcga tgatcggcgg cacagtccaa acggtcgaaa ttcccccgcc gacgaaaagc 1140 aatctcagtc aggaagcgcc ggacgccgtt cctggtgtga tctattacgc cgcctacccc 1200 ataagcatca cagttgacgg cgaagccaac gattgggaac gcattccgcg cggtatgatt 1260 gacagcggcc ccaccgtacc tcaggataac gacacgacaa tgacatttgc cgccgctgcc 1320 gacaaaacca atctatactt ccttgcagag gttacggaca gccaggtgtc ctacggaacg 1380 cacgacccgg ctactgcctg gtatcaggag gactcggttg agttttacct gaacacgaca 1440 ggcgatctaa ctaacaccgc ctaccaaccc ggcgtcgccc aaatcggtat catggcagcc 1500 aacatcgaca acgataatcc cggtgcaccg atcatcgggg gcggcaacag cgacatttcg 1560 caggtaaaag cgattgtcgt caaaaccgat accgggtatc tggtcgaggc gtctgttcca 1620 ctcatgaccg atgtctggac gattgaaccg aaacaagggg ctgtactcgg cttccaagtg 1680 catctcaatg gctcacgcac accggatgcc gaccgagaca ccaagttgat ctggtcgcta 1740 ctggatacgc tagatcagtc ctatagcaat cccagcctgt ttggccgact catcttctgg 1800 aacataaatc tctaa 1815 <210> 34 <211> 604 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(23) <400> 34 Met Val Arg Lys Lys Leu Phe Tyr Ile Val Ala Leu Met Leu Met Phe 1 5 10 15 Gly Ala Ser Phe Thr Ser Ala Gln Asp Ala Glu Phe Ser Leu Arg Gly 20 25 30 Leu Ala Glu Arg Asn Asn Phe Tyr Val Gly Ala Ala Val Tyr Thr Thr 35 40 45 His Leu Asn Asp Pro Val His Val Glu Thr Leu Ala Arg Glu Phe Asn 50 55 60 Met Leu Thr Pro Glu Gln Gln Ala Lys His Cys Glu Leu Glu Ala Gln 65 70 75 80 Gln Gly Gln Phe Asp Phe Arg Ser Phe Asp Arg Leu Val Ala Phe Ala 85 90 95 Glu Glu His Asn Met Ala Ile His Gly His Ala Leu Val Trp His Ser 100 105 110 Cys Thr Pro Gln Trp Val Ala Asn Gly Glu Tyr Thr Arg Asp Glu Ala 115 120 125 Ile Gly Leu Leu Arg Asp Ser Ile Met Thr Ile Val Gly Arg Tyr Lys 130 135 140 Gly Arg Ile Pro Ile Trp Asp Val Val Asn Glu Gly Ile Ala Asp Ser 145 150 155 160 Gly Gly Thr Leu Arg Asp Thr Pro Trp Arg Gln Leu Ile Gly Asp Asp 165 170 175 Tyr Ile Glu Leu Ala Phe Gln Phe Ala His Glu Ala Asp Pro Asp Ala 180 185 190 Leu Leu Phe Tyr Asn Asp Tyr Asn Thr Glu Gly Met Asn Pro Lys Ser 195 200 205 Asp Ala Met Tyr Glu Met Val Ser Asp Phe Val Ala Arg Gly Ile Pro 210 215 220 Ile His Gly Val Gly Leu Gln Ser His Phe Ile Leu Gly Ser Phe Asp 225 230 235 240 Pro Asp Gln Ile Ala Arg Asn Val Ala Arg Leu Gly Glu Leu Gly Leu 245 250 255 Gln Val Gln Phe Thr Glu Val Asp Ile Arg Tyr Ser Gly Glu Ala Thr 260 265 270 Asp Asn Ile Leu Gln Arg Gln Ala Gly Asp Tyr His Arg Leu Met Asp 275 280 285 Val Cys Leu Gly Asn Asp Ala Cys Thr Ala Phe Ile Thr Trp Gly Val 290 295 300 Thr Asp Lys Tyr Thr Trp Leu Arg Gly Ala Asn Leu Gly Phe Tyr Asn 305 310 315 320 Asn Leu Ser Val Glu Pro Leu Leu Phe Asp Asp Asp Tyr Glu Pro Lys 325 330 335 Pro Ala Tyr Phe Ala Val Leu Asp Ser Leu Ala Arg Arg Ala Gly Glu 340 345 350 Thr Pro Val Leu Ser Asp Asp Glu Leu Ala Ala Met Ile Gly Gly Thr 355 360 365 Val Gln Thr Val Glu Ile Pro Pro Pro Thr Lys Ser Asn Leu Ser Gln 370 375 380 Glu Ala Pro Asp Ala Val Pro Gly Val Ile Tyr Tyr Ala Ala Tyr Pro 385 390 395 400 Ile Ser Ile Thr Val Asp Gly Glu Ala Asn Asp Trp Glu Arg Ile Pro 405 410 415 Arg Gly Met Ile Asp Ser Gly Pro Thr Val Pro Gln Asp Asn Asp Thr 420 425 430 Thr Met Thr Phe Ala Ala Ala Ala Asp Lys Thr Asn Leu Tyr Phe Leu 435 440 445 Ala Glu Val Thr Asp Ser Gln Val Ser Tyr Gly Thr His Asp Pro Ala 450 455 460 Thr Ala Trp Tyr Gln Glu Asp Ser Val Glu Phe Tyr Leu Asn Thr Thr 465 470 475 480 Gly Asp Leu Thr Asn Thr Ala Tyr Gln Pro Gly Val Ala Gln Ile Gly 485 490 495 Ile Met Ala Ala Asn Ile Asp Asn Asp Asn Pro Gly Ala Pro Ile Ile 500 505 510 Gly Gly Gly Asn Ser Asp Ile Ser Gln Val Lys Ala Ile Val Val Lys 515 520 525 Thr Asp Thr Gly Tyr Leu Val Glu Ala Ser Val Pro Leu Met Thr Asp 530 535 540 Val Trp Thr Ile Glu Pro Lys Gln Gly Ala Val Leu Gly Phe Gln Val 545 550 555 560 His Leu Asn Gly Ser Arg Thr Pro Asp Ala Asp Arg Asp Thr Lys Leu 565 570 575 Ile Trp Ser Leu Leu Asp Thr Leu Asp Gln Ser Tyr Ser Asn Pro Ser 580 585 590 Leu Phe Gly Arg Leu Ile Phe Trp Asn Ile Asn Leu 595 600 <210> 35 <211> 2286 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 35 atgaccttga ttacgccaag ctcgaaatta accctcacta aagggaacaa aagctggagc 60 tcgcgcgcct gcaggtcgac actagtggat ctcacgcttt acttcgaatc tcaaaatcca 120 acccttgagt tctacgtgga tgacgtgaag atagtggata caacttccgc agagataaag 180 attgaaatgg aacctgaaaa agagatacct gctctgaaag aagtactgaa agattacttc 240 aaagtcggag ttgcactgcc gtccaaggtc ttcctcaacc cgaaggacat agaactcatc 300 acgaaacact tcaacagcat caccgcagaa aacgagatga aaccggatag tctgctcgcg 360 ggcatcgaaa acggtaagct gaagttcagg tttgaaacag cagacaaata cattcagttc 420 gtcgaggaaa acggcatggt tataagaggt cacacactgg tgtggcacaa ccagacaccc 480 gactggttct tcaaagacga aaacggaaac ctcctctcca aagaagcgat gacggaaaga 540 ctcaaagagt acatccacac cgttgtcgga cacttcaaag gaaaagtcta cgcatgggac 600 gtggtgaacg aagcggtcga tccgaaccag ccggatggac tgagaagatc aacctggtac 660 cagatcatgg ggcctgacta catagaactc gccttcaagt tcgcaagaga ggcagatcca 720 gatgcaaaac tcttctacaa cgactacaac acattcgatc ccagaaagag agacatcatc 780 tacaacctcg tgaaggatct caaagagaag ggactcatcg atggcatagg aatgcagtgt 840 cacatcagtc ttgcaacaga catcaaacag atcgaagagg ccatcaaaaa gttcagcacc 900 atacccggta tagaaattca catcacagaa ctcgatatga gtgtctacag agattccagt 960 tccaactacc cagaggcacc gaggacggca ctcatcgaac aggctcacaa aatgatgcag 1020 ctctttgaga tcttcaagaa gcacagcaac gtgatcacga acgtcacatt ctggggtctc 1080 aaggacgatt actcctggag agcaacaaga agaaacgact ggccgctcat cttcgacaaa 1140 gatcaccagg cgaaactcgc ttactgggcg atagtggcac ctgaggtcct tccaccactt 1200 ccaaaagaaa gcaggatctc cgaaggcgaa gcagtggtag tggggatgat ggacgactcg 1260 tacctgatgt cgaagccgat agagatcctt gacgaagaag ggaacgtgaa ggcaacgatc 1320 agggcagtgt ggaaagacag cacgatctac atctacggag aggtacagga caagacaaag 1380 aaaccagcag aagacggagt ggccatattc atcaacccga acaacgaaag aacaccctat 1440 ctgcagcctg atgacaccta cgttgtgctg tggacgaact ggaagacgga ggtcaacaga 1500 gaagacgtac aggtgaagaa attcgttggg cctggcttta gaagatacag cttcgagatg 1560 tcgatcacga taccgggtgt ggagttcaag aaagacagct acataggatt tgacgttgcg 1620 gtgatagacg acgggaagtg gtacagctgg agcgacacga cgaacagcca gaagacgaac 1680 acgatgaact acggaacgct gaagctcgaa ggaataatgg tagcgacagc aaaatacgga 1740 acaccggtca tcgatggaga gatcgatgag atctggaaca cgacagagga gatagagacg 1800 aaagcggtgg ctatgggatc gcttgacaag aatgcgacag cgaaagtgag ggtgctgtgg 1860 gacgagaact acctgtacgt acttgcgatc gtgaaagatc ccgttctgaa caaagacaac 1920 agcaacccgt gggagcagga ttccgtggag atcttcgtgg atgagaacaa ccacaagaca 1980 ggatactacg aagacgacga cgcgcagttc agggtgaact acatgaacga gcagaccttt 2040 ggaacgggag gaagtccagc gaggttcaag acagcggtga agctgatcga aggaggatac 2100 atagttgagg cagcgatcaa gtggaagacg atcaagccaa caccgaacac agtgatagga 2160 ttcaacatcc aggtgaacga tgcgaacgag aaagggcaga gggtcggtat catctcctgg 2220 agcgatccca caaacaacag ctggcaagat ccttcaaagt tcggtaacct cagactcatc 2280 aagtga 2286 <210> 36 <211> 761 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 36 Met Thr Leu Ile Thr Pro Ser Ser Lys Leu Thr Leu Thr Lys Gly Asn 1 5 10 15 Lys Ser Trp Ser Ser Arg Ala Cys Arg Ser Thr Leu Val Asp Leu Thr 20 25 30 Leu Tyr Phe Glu Ser Gln Asn Pro Thr Leu Glu Phe Tyr Val Asp Asp 35 40 45 Val Lys Ile Val Asp Thr Thr Ser Ala Glu Ile Lys Ile Glu Met Glu 50 55 60 Pro Glu Lys Glu Ile Pro Ala Leu Lys Glu Val Leu Lys Asp Tyr Phe 65 70 75 80 Lys Val Gly Val Ala Leu Pro Ser Lys Val Phe Leu Asn Pro Lys Asp 85 90 95 Ile Glu Leu Ile Thr Lys His Phe Asn Ser Ile Thr Ala Glu Asn Glu 100 105 110 Met Lys Pro Asp Ser Leu Leu Ala Gly Ile Glu Asn Gly Lys Leu Lys 115 120 125 Phe Arg Phe Glu Thr Ala Asp Lys Tyr Ile Gln Phe Val Glu Glu Asn 130 135 140 Gly Met Val Ile Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro 145 150 155 160 Asp Trp Phe Phe Lys Asp Glu Asn Gly Asn Leu Leu Ser Lys Glu Ala 165 170 175 Met Thr Glu Arg Leu Lys Glu Tyr Ile His Thr Val Val Gly His Phe 180 185 190 Lys Gly Lys Val Tyr Ala Trp Asp Val Val Asn Glu Ala Val Asp Pro 195 200 205 Asn Gln Pro Asp Gly Leu Arg Arg Ser Thr Trp Tyr Gln Ile Met Gly 210 215 220 Pro Asp Tyr Ile Glu Leu Ala Phe Lys Phe Ala Arg Glu Ala Asp Pro 225 230 235 240 Asp Ala Lys Leu Phe Tyr Asn Asp Tyr Asn Thr Phe Asp Pro Arg Lys 245 250 255 Arg Asp Ile Ile Tyr Asn Leu Val Lys Asp Leu Lys Glu Lys Gly Leu 260 265 270 Ile Asp Gly Ile Gly Met Gln Cys His Ile Ser Leu Ala Thr Asp Ile 275 280 285 Lys Gln Ile Glu Glu Ala Ile Lys Lys Phe Ser Thr Ile Pro Gly Ile 290 295 300 Glu Ile His Ile Thr Glu Leu Asp Met Ser Val Tyr Arg Asp Ser Ser 305 310 315 320 Ser Asn Tyr Pro Glu Ala Pro Arg Thr Ala Leu Ile Glu Gln Ala His 325 330 335 Lys Met Met Gln Leu Phe Glu Ile Phe Lys Lys His Ser Asn Val Ile 340 345 350 Thr Asn Val Thr Phe Trp Gly Leu Lys Asp Asp Tyr Ser Trp Arg Ala 355 360 365 Thr Arg Arg Asn Asp Trp Pro Leu Ile Phe Asp Lys Asp His Gln Ala 370 375 380 Lys Leu Ala Tyr Trp Ala Ile Val Ala Pro Glu Val Leu Pro Pro Leu 385 390 395 400 Pro Lys Glu Ser Arg Ile Ser Glu Gly Glu Ala Val Val Val Gly Met 405 410 415 Met Asp Asp Ser Tyr Leu Met Ser Lys Pro Ile Glu Ile Leu Asp Glu 420 425 430 Glu Gly Asn Val Lys Ala Thr Ile Arg Ala Val Trp Lys Asp Ser Thr 435 440 445 Ile Tyr Ile Tyr Gly Glu Val Gln Asp Lys Thr Lys Lys Pro Ala Glu 450 455 460 Asp Gly Val Ala Ile Phe Ile Asn Pro Asn Asn Glu Arg Thr Pro Tyr 465 470 475 480 Leu Gln Pro Asp Asp Thr Tyr Val Val Leu Trp Thr Asn Trp Lys Thr 485 490 495 Glu Val Asn Arg Glu Asp Val Gln Val Lys Lys Phe Val Gly Pro Gly 500 505 510 Phe Arg Arg Tyr Ser Phe Glu Met Ser Ile Thr Ile Pro Gly Val Glu 515 520 525 Phe Lys Lys Asp Ser Tyr Ile Gly Phe Asp Val Ala Val Ile Asp Asp 530 535 540 Gly Lys Trp Tyr Ser Trp Ser Asp Thr Thr Asn Ser Gln Lys Thr Asn 545 550 555 560 Thr Met Asn Tyr Gly Thr Leu Lys Leu Glu Gly Ile Met Val Ala Thr 565 570 575 Ala Lys Tyr Gly Thr Pro Val Ile Asp Gly Glu Ile Asp Glu Ile Trp 580 585 590 Asn Thr Thr Glu Glu Ile Glu Thr Lys Ala Val Ala Met Gly Ser Leu 595 600 605 Asp Lys Asn Ala Thr Ala Lys Val Arg Val Leu Trp Asp Glu Asn Tyr 610 615 620 Leu Tyr Val Leu Ala Ile Val Lys Asp Pro Val Leu Asn Lys Asp Asn 625 630 635 640 Ser Asn Pro Trp Glu Gln Asp Ser Val Glu Ile Phe Val Asp Glu Asn 645 650 655 Asn His Lys Thr Gly Tyr Tyr Glu Asp Asp Asp Ala Gln Phe Arg Val 660 665 670 Asn Tyr Met Asn Glu Gln Thr Phe Gly Thr Gly Gly Ser Pro Ala Arg 675 680 685 Phe Lys Thr Ala Val Lys Leu Ile Glu Gly Gly Tyr Ile Val Glu Ala 690 695 700 Ala Ile Lys Trp Lys Thr Ile Lys Pro Thr Pro Asn Thr Val Ile Gly 705 710 715 720 Phe Asn Ile Gln Val Asn Asp Ala Asn Glu Lys Gly Gln Arg Val Gly 725 730 735 Ile Ile Ser Trp Ser Asp Pro Thr Asn Asn Ser Trp Gln Asp Pro Ser 740 745 750 Lys Phe Gly Asn Leu Arg Leu Ile Lys 755 760 <210> 37 <211> 2769 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 37 atgcacaaga agaacggcac ctattacctg agctactcta caaatccggc caacggcatg 60 cggattgact acatgaccag cacgagcccg accagtggct ttgtccatcg aggcacggtc 120 atggcgcagc cctggcagaa cagcaacaac aacaaccacg caaccagcac cgagtacaac 180 gggcagggct acatcttcta tcacaaccgt gcgttgtcga acgagcgtgc gggtggcaac 240 gtgctgcagc gctcggtgaa cgtggatcgc ctctacttca atgccgatgg cagcatccgt 300 caggtcactt ccagtgcaac cggcgtgccg gccctgaaaa ccctggatgc cttcctggtc 360 aagcctgccg agctgtatca caaggaaagc gggatcaaga ccgagcctgc cagtgaagga 420 acccaggcac tggttatgac ggctggtagc tgggtgcgcc tggccaatgt cgatttcggc 480 aatggcggcg ccactggttt ttccgcgcgt attgcggcaa ccggcagcgg cagcatccag 540 gtgatcctgg gcaatctgaa caacgccccg gtcggcacgc tggcagtgag cagcaccggc 600 aacctccaga cctggcaaga ccgcagcacc gccatcagca aggtgaccgg cgtgcatgac 660 gtgtatttgc gtgccaccgg caatgtgcat gtgcagcgtc actggttcgt ggcgtcggcg 720 ccggccgctg ccgcctcatc cagcagtcag gcaagcgtct ctgccagcag tcaggcaagt 780 gtttcttcca gtagccaggc aagcgttgcc tccagcagca gttccagccg cgcttcttcc 840 gccagcagtt cggtggcggc tggccaggtg gaggtcggtt atcgccttag cagcgaatgg 900 gccgccggct tctgcggcgt ggtcaccatc cgtaatccgg gtagttctcc ggtcaccagc 960 tggagtggca gtttcaacct gcctggcggc aagatcaccc agctgtggaa tgccaactgg 1020 acccagaacg gcagcaccgt gacggtatct tcccaggcct ggagcggtgc cattgctgca 1080 ggcgccacca tcaccacgcc gggcttctgc gccgagcgca cgagcagcaa tgcgtcctcc 1140 agtgtcgcca gcagcagtgt ctcctcatcg agcagcagtg ctgcggctgc cagctccagc 1200 gcggcttcca gcgtcccgtc cactggcagt ggcggggtgg gcagcagcgc atcctcggct 1260 agcagtgccg ctgcacccaa gggcgtgctt gaagtcggcc tgagcggcct ttccagccag 1320 gccatgttcg ccccgttgcg ggtcaggacg gacgctgcgg ccgccaacaa ggcctatgtt 1380 gaatggccca acaacggcgc caatcagtcg ctggcaacgc ctgccaacga tgccgcaggg 1440 caggtggagg tagccttcgt gctggcccag gcatccgcag tgcagtttga tatcgaagcg 1500 aatttcgcca acgcggaaga cgactccttc tacttccagc tcaacggtgg tgcctggcag 1560 accttcaaca acgccaccac ggtcggctgg cagaccctgc cggtcgcctc tctgggcaat 1620 ctggctgccg ggcgccatgt gctgaccctg ctgcgccgcg aggatggcgc gaagctgggc 1680 aaggtcgtcc tgagtgcggc acagagcagc atcagtcgtg ccacgccggt ggcctacgcg 1740 tcgccgaatg atgttgccaa cctgttcaag ctggccagct tcccgatcgg ggtggcggtc 1800 agtgccggca acgaaggtga cagcctgctg cgtagcggta cccgcgcagc agccgagcgt 1860 gcgctgaccg agaagcactt caacagtctg gtggccggca acatcatgaa gatgagctac 1920 ctgcatccgg ccgagaacac ctacaccttc acccaggcgg atgcgctggc cgactacgcc 1980 aagtccaagg gcatggtgtt gcatggccat gcgctggtct ggcatgcgga ctatcaggta 2040 cccaactgga tgaagaatta caccggagac tggtcgaaga tgctcgaagc ccacgtcacc 2100 accgtcgcca agcactatgc cggcaaggtg gtgagctggg atgtggtgaa tgaagccctg 2160 gccgatggca atgccaccgc caccaagggt ttccgtgcca ccgattcgat cttctatcag 2220 aagatgggct ccagtttcat cgagaaggcc tttattgctg cacgtgctgc cgacccgaat 2280 gccgacctgt attacaacga ctacggcatg gagggcggaa acagcaagtt caattactgc 2340 atggccatgg tcgatgattt ccagaagcgt ggcattccca tcgacggcat cggtttccag 2400 atgcacatca acatcgactg gccttcgtcg gcccagatcc gcgctgtatt cagtgaagtg 2460 gtcaagcgtg gtctgaaggt gcgtatctcc gagctggata ttccggtgaa taccactgcc 2520 ggtcgttttg ccagcctgaa tgccacggcc aacgagctgc agaagaagaa gtatcgtgag 2580 gttgtggctg cctacctgga tgtggtgccg cccgagctgc gcggtggcat caccgtgtgg 2640 ggcctgagcg acaacggcag ctggctggtg acccccacca agccggactg gccgctgctg 2700 ttcgatgccg acctcaaggc caaggacgcc ctgagcggct ttgccgacgc cctgcgcggc 2760 gtacgctga 2769 <210> 38 <211> 922 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 38 Met His Lys Lys Asn Gly Thr Tyr Tyr Leu Ser Tyr Ser Thr Asn Pro 1 5 10 15 Ala Asn Gly Met Arg Ile Asp Tyr Met Thr Ser Thr Ser Pro Thr Ser 20 25 30 Gly Phe Val His Arg Gly Thr Val Met Ala Gln Pro Trp Gln Asn Ser 35 40 45 Asn Asn Asn Asn His Ala Thr Ser Thr Glu Tyr Asn Gly Gln Gly Tyr 50 55 60 Ile Phe Tyr His Asn Arg Ala Leu Ser Asn Glu Arg Ala Gly Gly Asn 65 70 75 80 Val Leu Gln Arg Ser Val Asn Val Asp Arg Leu Tyr Phe Asn Ala Asp 85 90 95 Gly Ser Ile Arg Gln Val Thr Ser Ser Ala Thr Gly Val Pro Ala Leu 100 105 110 Lys Thr Leu Asp Ala Phe Leu Val Lys Pro Ala Glu Leu Tyr His Lys 115 120 125 Glu Ser Gly Ile Lys Thr Glu Pro Ala Ser Glu Gly Thr Gln Ala Leu 130 135 140 Val Met Thr Ala Gly Ser Trp Val Arg Leu Ala Asn Val Asp Phe Gly 145 150 155 160 Asn Gly Gly Ala Thr Gly Phe Ser Ala Arg Ile Ala Ala Thr Gly Ser 165 170 175 Gly Ser Ile Gln Val Ile Leu Gly Asn Leu Asn Asn Ala Pro Val Gly 180 185 190 Thr Leu Ala Val Ser Ser Thr Gly Asn Leu Gln Thr Trp Gln Asp Arg 195 200 205 Ser Thr Ala Ile Ser Lys Val Thr Gly Val His Asp Val Tyr Leu Arg 210 215 220 Ala Thr Gly Asn Val His Val Gln Arg His Trp Phe Val Ala Ser Ala 225 230 235 240 Pro Ala Ala Ala Ala Ser Ser Ser Ser Gln Ala Ser Val Ser Ala Ser 245 250 255 Ser Gln Ala Ser Val Ser Ser Ser Ser Gln Ala Ser Val Ala Ser Ser 260 265 270 Ser Ser Ser Ser Arg Ala Ser Ser Ala Ser Ser Ser Val Ala Ala Gly 275 280 285 Gln Val Glu Val Gly Tyr Arg Leu Ser Ser Glu Trp Ala Ala Gly Phe 290 295 300 Cys Gly Val Val Thr Ile Arg Asn Pro Gly Ser Ser Pro Val Thr Ser 305 310 315 320 Trp Ser Gly Ser Phe Asn Leu Pro Gly Gly Lys Ile Thr Gln Leu Trp 325 330 335 Asn Ala Asn Trp Thr Gln Asn Gly Ser Thr Val Thr Val Ser Ser Gln 340 345 350 Ala Trp Ser Gly Ala Ile Ala Ala Gly Ala Thr Ile Thr Thr Pro Gly 355 360 365 Phe Cys Ala Glu Arg Thr Ser Ser Asn Ala Ser Ser Ser Val Ala Ser 370 375 380 Ser Ser Val Ser Ser Ser Ser Ser Ser Ala Ala Ala Ala Ser Ser Ser 385 390 395 400 Ala Ala Ser Ser Val Pro Ser Thr Gly Ser Gly Gly Val Gly Ser Ser 405 410 415 Ala Ser Ser Ala Ser Ser Ala Ala Ala Pro Lys Gly Val Leu Glu Val 420 425 430 Gly Leu Ser Gly Leu Ser Ser Gln Ala Met Phe Ala Pro Leu Arg Val 435 440 445 Arg Thr Asp Ala Ala Ala Ala Asn Lys Ala Tyr Val Glu Trp Pro Asn 450 455 460 Asn Gly Ala Asn Gln Ser Leu Ala Thr Pro Ala Asn Asp Ala Ala Gly 465 470 475 480 Gln Val Glu Val Ala Phe Val Leu Ala Gln Ala Ser Ala Val Gln Phe 485 490 495 Asp Ile Glu Ala Asn Phe Ala Asn Ala Glu Asp Asp Ser Phe Tyr Phe 500 505 510 Gln Leu Asn Gly Gly Ala Trp Gln Thr Phe Asn Asn Ala Thr Thr Val 515 520 525 Gly Trp Gln Thr Leu Pro Val Ala Ser Leu Gly Asn Leu Ala Ala Gly 530 535 540 Arg His Val Leu Thr Leu Leu Arg Arg Glu Asp Gly Ala Lys Leu Gly 545 550 555 560 Lys Val Val Leu Ser Ala Ala Gln Ser Ser Ile Ser Arg Ala Thr Pro 565 570 575 Val Ala Tyr Ala Ser Pro Asn Asp Val Ala Asn Leu Phe Lys Leu Ala 580 585 590 Ser Phe Pro Ile Gly Val Ala Val Ser Ala Gly Asn Glu Gly Asp Ser 595 600 605 Leu Leu Arg Ser Gly Thr Arg Ala Ala Ala Glu Arg Ala Leu Thr Glu 610 615 620 Lys His Phe Asn Ser Leu Val Ala Gly Asn Ile Met Lys Met Ser Tyr 625 630 635 640 Leu His Pro Ala Glu Asn Thr Tyr Thr Phe Thr Gln Ala Asp Ala Leu 645 650 655 Ala Asp Tyr Ala Lys Ser Lys Gly Met Val Leu His Gly His Ala Leu 660 665 670 Val Trp His Ala Asp Tyr Gln Val Pro Asn Trp Met Lys Asn Tyr Thr 675 680 685 Gly Asp Trp Ser Lys Met Leu Glu Ala His Val Thr Thr Val Ala Lys 690 695 700 His Tyr Ala Gly Lys Val Val Ser Trp Asp Val Val Asn Glu Ala Leu 705 710 715 720 Ala Asp Gly Asn Ala Thr Ala Thr Lys Gly Phe Arg Ala Thr Asp Ser 725 730 735 Ile Phe Tyr Gln Lys Met Gly Ser Ser Phe Ile Glu Lys Ala Phe Ile 740 745 750 Ala Ala Arg Ala Ala Asp Pro Asn Ala Asp Leu Tyr Tyr Asn Asp Tyr 755 760 765 Gly Met Glu Gly Gly Asn Ser Lys Phe Asn Tyr Cys Met Ala Met Val 770 775 780 Asp Asp Phe Gln Lys Arg Gly Ile Pro Ile Asp Gly Ile Gly Phe Gln 785 790 795 800 Met His Ile Asn Ile Asp Trp Pro Ser Ser Ala Gln Ile Arg Ala Val 805 810 815 Phe Ser Glu Val Val Lys Arg Gly Leu Lys Val Arg Ile Ser Glu Leu 820 825 830 Asp Ile Pro Val Asn Thr Thr Ala Gly Arg Phe Ala Ser Leu Asn Ala 835 840 845 Thr Ala Asn Glu Leu Gln Lys Lys Lys Tyr Arg Glu Val Val Ala Ala 850 855 860 Tyr Leu Asp Val Val Pro Pro Glu Leu Arg Gly Gly Ile Thr Val Trp 865 870 875 880 Gly Leu Ser Asp Asn Gly Ser Trp Leu Val Thr Pro Thr Lys Pro Asp 885 890 895 Trp Pro Leu Leu Phe Asp Ala Asp Leu Lys Ala Lys Asp Ala Leu Ser 900 905 910 Gly Phe Ala Asp Ala Leu Arg Gly Val Arg 915 920 <210> 39 <211> 1143 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 39 atgaaaaaaa cgattgcaca tttcacctta tggatagtgt tttttctctt cacttcctgt 60 gctgttacgg cgcagaagaa tgcaaagaat acaagagtaa aacccactac cctaaaagag 120 gcttaccaag gtaaattcta tatcggtact gcgatgaact tgagacagat tcacggagat 180 gatccccaat ctgaaaatat tatcaaaaaa cagttcaatt ccatagttgc cgaaaactgc 240 atgaagagta tgtatcttca gccggaggaa ggaaaatttt tcttcgatga tgcggacaag 300 tttgtggatt ttggtcttca gaacaatatg ttcatcattg ggcattgtct gatttggcat 360 tcgcaggcgc caaaatggtt tttcaccgat gagaatggaa acacggtttc tccagaagtt 420 cttaaacaaa ggatgaaagc ccatattacc gccgtcgttt cccgttacaa agggaaaatc 480 aaaggttggg atgtggtgaa cgaagccatt atggaagatg gttcttaccg taaaagcaaa 540 ttttacgaga ttttgggaga agaatttatt ccgttggcat ttcagtatgc gcatgaagca 600 gatcctgatg cagaacttta ttacaacgat tataacgaat ggtatcccgg aaaaagagct 660 acggtgacca agataatccg cgatttcaaa actagaggaa tccgcatcga tgccatcgga 720 atgcaggctc atttcgggat ggattcgccc actgtagaag agtatgaaca aactattcag 780 ggctatataa aagaaggcgt gaaagtcaat attacggaac tcgatttgag tccacttcct 840 tctccttggg gaacttccgc caatgttgcc gatacgcagc aatatcagga aaaaatgaat 900 ccatacacca aaggacttcc tgcagatgtt gaaaaagcat gggaaaaccg ttatgtggat 960 tttttcaaac tgttcctaaa atatcatcag catattgagc gtgttacgtt ttggggcgtt 1020 agcgatatcg attcctggaa gaacgatttt ccggtaagag gacgtaccga ttatccacta 1080 ccgtttaacc gtcaatatca agcaaaacct ttggttcaga aattaataga tttaacaaaa 1140 tag 1143 <210> 40 <211> 380 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(24) <400> 40 Met Lys Lys Thr Ile Ala His Phe Thr Leu Trp Ile Val Phe Phe Leu 1 5 10 15 Phe Thr Ser Cys Ala Val Thr Ala Gln Lys Asn Ala Lys Asn Thr Arg 20 25 30 Val Lys Pro Thr Thr Leu Lys Glu Ala Tyr Gln Gly Lys Phe Tyr Ile 35 40 45 Gly Thr Ala Met Asn Leu Arg Gln Ile His Gly Asp Asp Pro Gln Ser 50 55 60 Glu Asn Ile Ile Lys Lys Gln Phe Asn Ser Ile Val Ala Glu Asn Cys 65 70 75 80 Met Lys Ser Met Tyr Leu Gln Pro Glu Glu Gly Lys Phe Phe Phe Asp 85 90 95 Asp Ala Asp Lys Phe Val Asp Phe Gly Leu Gln Asn Asn Met Phe Ile 100 105 110 Ile Gly His Cys Leu Ile Trp His Ser Gln Ala Pro Lys Trp Phe Phe 115 120 125 Thr Asp Glu Asn Gly Asn Thr Val Ser Pro Glu Val Leu Lys Gln Arg 130 135 140 Met Lys Ala His Ile Thr Ala Val Val Ser Arg Tyr Lys Gly Lys Ile 145 150 155 160 Lys Gly Trp Asp Val Val Asn Glu Ala Ile Met Glu Asp Gly Ser Tyr 165 170 175 Arg Lys Ser Lys Phe Tyr Glu Ile Leu Gly Glu Glu Phe Ile Pro Leu 180 185 190 Ala Phe Gln Tyr Ala His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr 195 200 205 Asn Asp Tyr Asn Glu Trp Tyr Pro Gly Lys Arg Ala Thr Val Thr Lys 210 215 220 Ile Ile Arg Asp Phe Lys Thr Arg Gly Ile Arg Ile Asp Ala Ile Gly 225 230 235 240 Met Gln Ala His Phe Gly Met Asp Ser Pro Thr Val Glu Glu Tyr Glu 245 250 255 Gln Thr Ile Gln Gly Tyr Ile Lys Glu Gly Val Lys Val Asn Ile Thr 260 265 270 Glu Leu Asp Leu Ser Pro Leu Pro Ser Pro Trp Gly Thr Ser Ala Asn 275 280 285 Val Ala Asp Thr Gln Gln Tyr Gln Glu Lys Met Asn Pro Tyr Thr Lys 290 295 300 Gly Leu Pro Ala Asp Val Glu Lys Ala Trp Glu Asn Arg Tyr Val Asp 305 310 315 320 Phe Phe Lys Leu Phe Leu Lys Tyr His Gln His Ile Glu Arg Val Thr 325 330 335 Phe Trp Gly Val Ser Asp Ile Asp Ser Trp Lys Asn Asp Phe Pro Val 340 345 350 Arg Gly Arg Thr Asp Tyr Pro Leu Pro Phe Asn Arg Gln Tyr Gln Ala 355 360 365 Lys Pro Leu Val Gln Lys Leu Ile Asp Leu Thr Lys 370 375 380 <210> 41 <211> 1893 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 41 atgatccatc aacaaaagcc caaccaagac atcggtaggc tattcaagcg cagctgcagc 60 tttgtcggta ttagcgcggc actggctgtt ttctcacaca ccgcaagtgc agcctgtact 120 tacaacattg ataaccaatg gggcagcggt tttgtcgcta gtattactgt aaagaatgac 180 actggtgcaa ccgtcaataa ctggagtgtg aattggcaat atgccaacaa tcgcatcacc 240 aatggttgga gtgcaaattt ctctggcagc aatccttaca ccgccaccaa tatgagctgg 300 aacggtagca ttgccgctgg ccagtcggtg acttttggtt tccagggcaa cactaacagc 360 aataccgttg agcgcccggt ggttaacggt tcactgtgcg gtactgcaac aacctcttca 420 gttcgctcca gcgtggctgc gacgtcttcc agtcgctcca gtgttgcgcc cagctcgatt 480 cctgcttcca gcactccgcg ttcaagcaca cctgccacct cttcttctgc ttccagcttc 540 tcagtaccgg ccaataattt tgcgcagaat ggcggcgtgg aatctggttt gaccaactgg 600 ggtacgactg cgggcaccgt gactcgctct actgccgata aacacagcgg tacagccagt 660 gccttaatta ccggccgcac tgctgcctgg aatggtttga cgtttaatgt gggcgcattg 720 accaacggca accagtacca agtcaacgtg tgggtgaaat tggctccagg tacgcccgac 780 agcgtactga ccttaaccgg taagcgtgta gacgatagcg atactactac ctacaacgaa 840 tacacacgcg tagcgactgt gactgcctct gccaatgagt ggcgtttgct ggaaggttac 900 tacacccaat ctggcagcac tgcattccag catttcatta tcgaagcaac ggatactact 960 gccagttatt acgcggatga tttcgccatc ggcggtcaag tcgtacaagt tccaagcagc 1020 agctcacgca gctcaagcag tgctccggcg gctagaaaat tcatcggcaa catcaccacc 1080 tcgggtgcag tgagatccga ctttactcgt tactggaacc aaattacacc agagaacgaa 1140 ggtaagtggg gttccgttga aggtactcgc aaccagtaca actgggcacc gctggatcgt 1200 atttatgctt acgctcgcca aaataatatt ccggtaaaag ctcacacgtt tgtgtggggt 1260 gcgcaatcac ccgcgtggct caataactta agcggaccgg aagtcgctgt tgaaattgaa 1320 caatggattc gcgattactg tactcgttac cctgacacgg cgatgattga cgtagtgaac 1380 gaagcggttc ctggccatca accggcaggt tatgcacaac gagcatttgg caataactgg 1440 atccaacgcg tgttccaatt ggctcgccaa tattgcccta actcgatcct gatcctgaat 1500 gattacaaca atatccgttg gcagcacaat gagtttattg cccttgcaaa agctcaaggc 1560 aattatattg atgcagtcgg cctgcaggcg catgaactga agggtatgac agcggcgcaa 1620 gtcaaaaccg caatcgacaa tatttggaac caagtgggca agcccatcta catttctgaa 1680 tacgacattg gcgataacaa tgaccaggtt caattgcaga atttccaggc gcatttccct 1740 gtattctggg accatccgca tgttaaaggc atcaccattt ggggttatgt caatggcaga 1800 acttggattg aaggctcggg cctgatttct gacaacggaa caccgcgccc cgcaatgact 1860 tggttgctga ataactatat caataagcag taa 1893 <210> 42 <211> 630 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(37) <400> 42 Met Ile His Gln Gln Lys Pro Asn Gln Asp Ile Gly Arg Leu Phe Lys 1 5 10 15 Arg Ser Cys Ser Phe Val Gly Ile Ser Ala Ala Leu Ala Val Phe Ser 20 25 30 His Thr Ala Ser Ala Ala Cys Thr Tyr Asn Ile Asp Asn Gln Trp Gly 35 40 45 Ser Gly Phe Val Ala Ser Ile Thr Val Lys Asn Asp Thr Gly Ala Thr 50 55 60 Val Asn Asn Trp Ser Val Asn Trp Gln Tyr Ala Asn Asn Arg Ile Thr 65 70 75 80 Asn Gly Trp Ser Ala Asn Phe Ser Gly Ser Asn Pro Tyr Thr Ala Thr 85 90 95 Asn Met Ser Trp Asn Gly Ser Ile Ala Ala Gly Gln Ser Val Thr Phe 100 105 110 Gly Phe Gln Gly Asn Thr Asn Ser Asn Thr Val Glu Arg Pro Val Val 115 120 125 Asn Gly Ser Leu Cys Gly Thr Ala Thr Thr Ser Ser Val Arg Ser Ser 130 135 140 Val Ala Ala Thr Ser Ser Ser Arg Ser Ser Val Ala Pro Ser Ser Ile 145 150 155 160 Pro Ala Ser Ser Thr Pro Arg Ser Ser Thr Pro Ala Thr Ser Ser Ser 165 170 175 Ala Ser Ser Phe Ser Val Pro Ala Asn Asn Phe Ala Gln Asn Gly Gly 180 185 190 Val Glu Ser Gly Leu Thr Asn Trp Gly Thr Thr Ala Gly Thr Val Thr 195 200 205 Arg Ser Thr Ala Asp Lys His Ser Gly Thr Ala Ser Ala Leu Ile Thr 210 215 220 Gly Arg Thr Ala Ala Trp Asn Gly Leu Thr Phe Asn Val Gly Ala Leu 225 230 235 240 Thr Asn Gly Asn Gln Tyr Gln Val Asn Val Trp Val Lys Leu Ala Pro 245 250 255 Gly Thr Pro Asp Ser Val Leu Thr Leu Thr Gly Lys Arg Val Asp Asp 260 265 270 Ser Asp Thr Thr Thr Tyr Asn Glu Tyr Thr Arg Val Ala Thr Val Thr 275 280 285 Ala Ser Ala Asn Glu Trp Arg Leu Leu Glu Gly Tyr Tyr Thr Gln Ser 290 295 300 Gly Ser Thr Ala Phe Gln His Phe Ile Ile Glu Ala Thr Asp Thr Thr 305 310 315 320 Ala Ser Tyr Tyr Ala Asp Asp Phe Ala Ile Gly Gly Gln Val Val Gln 325 330 335 Val Pro Ser Ser Ser Ser Arg Ser Ser Ser Ser Ala Pro Ala Ala Arg 340 345 350 Lys Phe Ile Gly Asn Ile Thr Thr Ser Gly Ala Val Arg Ser Asp Phe 355 360 365 Thr Arg Tyr Trp Asn Gln Ile Thr Pro Glu Asn Glu Gly Lys Trp Gly 370 375 380 Ser Val Glu Gly Thr Arg Asn Gln Tyr Asn Trp Ala Pro Leu Asp Arg 385 390 395 400 Ile Tyr Ala Tyr Ala Arg Gln Asn Asn Ile Pro Val Lys Ala His Thr 405 410 415 Phe Val Trp Gly Ala Gln Ser Pro Ala Trp Leu Asn Asn Leu Ser Gly 420 425 430 Pro Glu Val Ala Val Glu Ile Glu Gln Trp Ile Arg Asp Tyr Cys Thr 435 440 445 Arg Tyr Pro Asp Thr Ala Met Ile Asp Val Val Asn Glu Ala Val Pro 450 455 460 Gly His Gln Pro Ala Gly Tyr Ala Gln Arg Ala Phe Gly Asn Asn Trp 465 470 475 480 Ile Gln Arg Val Phe Gln Leu Ala Arg Gln Tyr Cys Pro Asn Ser Ile 485 490 495 Leu Ile Leu Asn Asp Tyr Asn Asn Ile Arg Trp Gln His Asn Glu Phe 500 505 510 Ile Ala Leu Ala Lys Ala Gln Gly Asn Tyr Ile Asp Ala Val Gly Leu 515 520 525 Gln Ala His Glu Leu Lys Gly Met Thr Ala Ala Gln Val Lys Thr Ala 530 535 540 Ile Asp Asn Ile Trp Asn Gln Val Gly Lys Pro Ile Tyr Ile Ser Glu 545 550 555 560 Tyr Asp Ile Gly Asp Asn Asn Asp Gln Val Gln Leu Gln Asn Phe Gln 565 570 575 Ala His Phe Pro Val Phe Trp Asp His Pro His Val Lys Gly Ile Thr 580 585 590 Ile Trp Gly Tyr Val Asn Gly Arg Thr Trp Ile Glu Gly Ser Gly Leu 595 600 605 Ile Ser Asp Asn Gly Thr Pro Arg Pro Ala Met Thr Trp Leu Leu Asn 610 615 620 Asn Tyr Ile Asn Lys Gln 625 630 <210> 43 <211> 1011 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 43 atgcaaacaa atattaaagg aaataacatt ccatcattac acgaagttta tcaagatcac 60 tttttgatag gtgcagcagt taatccaaaa acattagact cacagcagga tttattgaga 120 aaacacttta acagtattac agctgaaaat gaaatgaaat ttgaagaatt gcaaccagaa 180 cctggccatt tcacgtttgg tgtagcagat gaaatcgttt catttgcaaa agaaaatgga 240 atgaaagtta gaggacatac attagtttgg cataatcaaa cgcctgattg gatgtttttg 300 aatgaagatg gatctgtcac agatcgagaa acgcttctag aaagaatgaa attacacatt 360 acaacagtta tgcagcatta caaaggtcaa gcttattgct gggatgttgt aaatgaggtg 420 attgctgacg agggtacaga gttattccgt aaatctaaat ggactgaaat tattggtgat 480 gattttgtag aaaaggcatt tgaatatgca catgaggctg atccagaagc tttactattc 540 tacaatgact ataatgaatc ccatcccaat aagcgtgaga aaattttcac acttgtaaaa 600 ggattagttg ataaggggat acctattcat ggaatcggtt tacaagcaca ttggaattta 660 acaggacctt cttatgaaga tattagagca gcactcgaga aatatgctac attgggattg 720 gaaatacacc ttaccgaatt ggatgtttct gtttttaatt atgaagatcg aagaacagat 780 ttaacagaac caactaaaga tatgcaagcg cttcaagcgg agcgttatac agaattattc 840 aagatattga gagaatatag tcatgtaatc agttcgatta ctttttgggg agctgcagat 900 gattatactt ggttagatga ttttcctgtc aaaggaagaa aaaactggcc atttgttttt 960 gatgaaaacc aagagccaaa agagtcattt tggaatatta ttgactttta a 1011 <210> 44 <211> 336 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 44 Met Gln Thr Asn Ile Lys Gly Asn Asn Ile Pro Ser Leu His Glu Val 1 5 10 15 Tyr Gln Asp His Phe Leu Ile Gly Ala Ala Val Asn Pro Lys Thr Leu 20 25 30 Asp Ser Gln Gln Asp Leu Leu Arg Lys His Phe Asn Ser Ile Thr Ala 35 40 45 Glu Asn Glu Met Lys Phe Glu Glu Leu Gln Pro Glu Pro Gly His Phe 50 55 60 Thr Phe Gly Val Ala Asp Glu Ile Val Ser Phe Ala Lys Glu Asn Gly 65 70 75 80 Met Lys Val Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro Asp 85 90 95 Trp Met Phe Leu Asn Glu Asp Gly Ser Val Thr Asp Arg Glu Thr Leu 100 105 110 Leu Glu Arg Met Lys Leu His Ile Thr Thr Val Met Gln His Tyr Lys 115 120 125 Gly Gln Ala Tyr Cys Trp Asp Val Val Asn Glu Val Ile Ala Asp Glu 130 135 140 Gly Thr Glu Leu Phe Arg Lys Ser Lys Trp Thr Glu Ile Ile Gly Asp 145 150 155 160 Asp Phe Val Glu Lys Ala Phe Glu Tyr Ala His Glu Ala Asp Pro Glu 165 170 175 Ala Leu Leu Phe Tyr Asn Asp Tyr Asn Glu Ser His Pro Asn Lys Arg 180 185 190 Glu Lys Ile Phe Thr Leu Val Lys Gly Leu Val Asp Lys Gly Ile Pro 195 200 205 Ile His Gly Ile Gly Leu Gln Ala His Trp Asn Leu Thr Gly Pro Ser 210 215 220 Tyr Glu Asp Ile Arg Ala Ala Leu Glu Lys Tyr Ala Thr Leu Gly Leu 225 230 235 240 Glu Ile His Leu Thr Glu Leu Asp Val Ser Val Phe Asn Tyr Glu Asp 245 250 255 Arg Arg Thr Asp Leu Thr Glu Pro Thr Lys Asp Met Gln Ala Leu Gln 260 265 270 Ala Glu Arg Tyr Thr Glu Leu Phe Lys Ile Leu Arg Glu Tyr Ser His 275 280 285 Val Ile Ser Ser Ile Thr Phe Trp Gly Ala Ala Asp Asp Tyr Thr Trp 290 295 300 Leu Asp Asp Phe Pro Val Lys Gly Arg Lys Asn Trp Pro Phe Val Phe 305 310 315 320 Asp Glu Asn Gln Glu Pro Lys Glu Ser Phe Trp Asn Ile Ile Asp Phe 325 330 335 <210> 45 <211> 1137 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 45 atgaagatat cacgccgaca attacttgct atgggtggtg ccgctgcaac cctggcctct 60 gccaaattat tcgctgccga aaaagctgct gccgccaccg gattgaaaga tgcctataaa 120 aacgatttcc tgatcggtgc tgcattaaat acccaaattg ttgatggcaa agaccccaaa 180 cttactgcac tgatcaccaa agaatttaat tcaattaccg cagagaattg ccagaagtgg 240 gaaaggttgc gcaatgaaaa agatggtagc tgggaatgga aagatagcga tgcctttgtg 300 aatttcgggg ttgcccataa catgcatatt gtcgggcata cgttgggctg gcatagccaa 360 attcccgaca gcgtctttaa aaacaaagat ggcagttata tttccaaaga ggcactggca 420 aaaaaacaac aagagcacat caccacctta gtggatcgtt acaaaggcaa aattgccgca 480 tgggatgtgg ttaacgaagc catgggcgat gacaacaaga tgcgcgcaag ccattggtac 540 aacattatgg gtgatgactt tctcgtcaac gcctttaagc tcgcgcatga gactgacccc 600 aaagcacatt tgatgtacaa cgattacaac aacgagcgcc cggaaaagcg cgcagcaacg 660 gttgatatgc tcaagcgcct gttaaaactc ggggcgccga tccacggttt gggaatgcag 720 gcacatattg gcctggatgc ggatatgaaa aactttgaag acagtattgt cgcctattca 780 gaattaggct tgcgtattca ccttaccgaa ctggatatag atgtgttgcc ctcggtgtgg 840 aatttgccag tcgctgaagt atctacccgt tttgaataca aaccggagcg agatccttac 900 atcaaaggcc tgccaaaaga gatcgacgaa aaactcgcga aggcttatga atcgctattt 960 aaaattttgc ttaagcataa agacaaagta gatcgtgtga ccttctgggg tgtgagtgat 1020 gatgccagct ggctaaatgg cttcccgatc ccgggccgca ccaattatcc actgttattt 1080 gaccgtaagc agcaacctaa agcagcgtac ttccgcttac tggatttaaa gcgttaa 1137 <210> 46 <211> 378 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(25) <400> 46 Met Lys Ile Ser Arg Arg Gln Leu Leu Ala Met Gly Gly Ala Ala Ala 1 5 10 15 Thr Leu Ala Ser Ala Lys Leu Phe Ala Ala Glu Lys Ala Ala Ala Ala 20 25 30 Thr Gly Leu Lys Asp Ala Tyr Lys Asn Asp Phe Leu Ile Gly Ala Ala 35 40 45 Leu Asn Thr Gln Ile Val Asp Gly Lys Asp Pro Lys Leu Thr Ala Leu 50 55 60 Ile Thr Lys Glu Phe Asn Ser Ile Thr Ala Glu Asn Cys Gln Lys Trp 65 70 75 80 Glu Arg Leu Arg Asn Glu Lys Asp Gly Ser Trp Glu Trp Lys Asp Ser 85 90 95 Asp Ala Phe Val Asn Phe Gly Val Ala His Asn Met His Ile Val Gly 100 105 110 His Thr Leu Gly Trp His Ser Gln Ile Pro Asp Ser Val Phe Lys Asn 115 120 125 Lys Asp Gly Ser Tyr Ile Ser Lys Glu Ala Leu Ala Lys Lys Gln Gln 130 135 140 Glu His Ile Thr Thr Leu Val Asp Arg Tyr Lys Gly Lys Ile Ala Ala 145 150 155 160 Trp Asp Val Val Asn Glu Ala Met Gly Asp Asp Asn Lys Met Arg Ala 165 170 175 Ser His Trp Tyr Asn Ile Met Gly Asp Asp Phe Leu Val Asn Ala Phe 180 185 190 Lys Leu Ala His Glu Thr Asp Pro Lys Ala His Leu Met Tyr Asn Asp 195 200 205 Tyr Asn Asn Glu Arg Pro Glu Lys Arg Ala Ala Thr Val Asp Met Leu 210 215 220 Lys Arg Leu Leu Lys Leu Gly Ala Pro Ile His Gly Leu Gly Met Gln 225 230 235 240 Ala His Ile Gly Leu Asp Ala Asp Met Lys Asn Phe Glu Asp Ser Ile 245 250 255 Val Ala Tyr Ser Glu Leu Gly Leu Arg Ile His Leu Thr Glu Leu Asp 260 265 270 Ile Asp Val Leu Pro Ser Val Trp Asn Leu Pro Val Ala Glu Val Ser 275 280 285 Thr Arg Phe Glu Tyr Lys Pro Glu Arg Asp Pro Tyr Ile Lys Gly Leu 290 295 300 Pro Lys Glu Ile Asp Glu Lys Leu Ala Lys Ala Tyr Glu Ser Leu Phe 305 310 315 320 Lys Ile Leu Leu Lys His Lys Asp Lys Val Asp Arg Val Thr Phe Trp 325 330 335 Gly Val Ser Asp Asp Ala Ser Trp Leu Asn Gly Phe Pro Ile Pro Gly 340 345 350 Arg Thr Asn Tyr Pro Leu Leu Phe Asp Arg Lys Gln Gln Pro Lys Ala 355 360 365 Ala Tyr Phe Arg Leu Leu Asp Leu Lys Arg 370 375 <210> 47 <211> 1137 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 47 atgaaaagaa taaagattct gaattcgatt gtattagctt taatcctggc gatcatcctg 60 ccgggatgtt ccaatgcaca gaagagcgag ccggtgctga aagatgccct ttcgggaaaa 120 ttttacatcg gggctgctct caataccccc caaattacgg gccgggatac cttgtccatg 180 aaaatggtca ccagacattt taactccatc gtagctgaga actgcatgaa aagcggggag 240 atccagcgga ccgaagggga gtttgatttc agtcttgccg accagtttgt cgcgttcggc 300 gaaaaacaca acatgcacat tgtggggcat accctgatat ggcattcaca ggcgccgcgc 360 tggtttttca ccggtgcaga cggaaacgaa gtcagccggg aggtactgat tgagcgcatg 420 aagaaccata tttatacggt cgtggggcgt tacaaaggcc gtgtccacgg ctgggatgtg 480 gtcaacgaag ccattgaaga caacggctca tggcgcaaca gcaagtttta ccagatctta 540 ggtgacgagt ttgtggaact ggcctttaaa tttgccgcag aagccgaccc ggatgccgaa 600 ctttactata acgactactc catggcatta gaaggcagga gaaatggcgt tatcagaatg 660 gtgaagaacc ttcagtccaa gggactcaaa attgacggta tcggcatgca ggggcatctg 720 ctcatggact cgcccacgct ggaagcttat gaagaaagta tcctggccta ttccggactg 780 ggcgttaagg tgatgatcac ggaactcgat ttgtctgcgc tgccatggcc agcccgtcag 840 cagggagccg atattgccct gagggctgag tatgaggcac ggatgaatcc ttacaccgaa 900 ggtttaaccg attcagcttc cgtggcatgg aatcagcgga tgggcgattt cttctctctt 960 ttcctgaagc accaggacaa aatcagcagg gttacccttt ggggggtcac cgataaccaa 1020 tcctggaaaa ataactttcc gatgagagga aggacagact acccgttgct ttttgaccgg 1080 aattaccaac ccaaaccggt ggtggaaaga atcatcaaag aagcgaaagc aaaataa 1137 <210> 48 <211> 378 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(26) <400> 48 Met Lys Arg Ile Lys Ile Leu Asn Ser Ile Val Leu Ala Leu Ile Leu 1 5 10 15 Ala Ile Ile Leu Pro Gly Cys Ser Asn Ala Gln Lys Ser Glu Pro Val 20 25 30 Leu Lys Asp Ala Leu Ser Gly Lys Phe Tyr Ile Gly Ala Ala Leu Asn 35 40 45 Thr Pro Gln Ile Thr Gly Arg Asp Thr Leu Ser Met Lys Met Val Thr 50 55 60 Arg His Phe Asn Ser Ile Val Ala Glu Asn Cys Met Lys Ser Gly Glu 65 70 75 80 Ile Gln Arg Thr Glu Gly Glu Phe Asp Phe Ser Leu Ala Asp Gln Phe 85 90 95 Val Ala Phe Gly Glu Lys His Asn Met His Ile Val Gly His Thr Leu 100 105 110 Ile Trp His Ser Gln Ala Pro Arg Trp Phe Phe Thr Gly Ala Asp Gly 115 120 125 Asn Glu Val Ser Arg Glu Val Leu Ile Glu Arg Met Lys Asn His Ile 130 135 140 Tyr Thr Val Val Gly Arg Tyr Lys Gly Arg Val His Gly Trp Asp Val 145 150 155 160 Val Asn Glu Ala Ile Glu Asp Asn Gly Ser Trp Arg Asn Ser Lys Phe 165 170 175 Tyr Gln Ile Leu Gly Asp Glu Phe Val Glu Leu Ala Phe Lys Phe Ala 180 185 190 Ala Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Met 195 200 205 Ala Leu Glu Gly Arg Arg Asn Gly Val Ile Arg Met Val Lys Asn Leu 210 215 220 Gln Ser Lys Gly Leu Lys Ile Asp Gly Ile Gly Met Gln Gly His Leu 225 230 235 240 Leu Met Asp Ser Pro Thr Leu Glu Ala Tyr Glu Glu Ser Ile Leu Ala 245 250 255 Tyr Ser Gly Leu Gly Val Lys Val Met Ile Thr Glu Leu Asp Leu Ser 260 265 270 Ala Leu Pro Trp Pro Ala Arg Gln Gln Gly Ala Asp Ile Ala Leu Arg 275 280 285 Ala Glu Tyr Glu Ala Arg Met Asn Pro Tyr Thr Glu Gly Leu Thr Asp 290 295 300 Ser Ala Ser Val Ala Trp Asn Gln Arg Met Gly Asp Phe Phe Ser Leu 305 310 315 320 Phe Leu Lys His Gln Asp Lys Ile Ser Arg Val Thr Leu Trp Gly Val 325 330 335 Thr Asp Asn Gln Ser Trp Lys Asn Asn Phe Pro Met Arg Gly Arg Thr 340 345 350 Asp Tyr Pro Leu Leu Phe Asp Arg Asn Tyr Gln Pro Lys Pro Val Val 355 360 365 Glu Arg Ile Ile Lys Glu Ala Lys Ala Lys 370 375 <210> 49 <211> 996 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 49 atgaacagct ccctcccctc cctccgcgat gtattcgcga atgatttccg catcggggcg 60 gcggtcaatc ctgtgacgat cgagatgcaa aaacagttgt tgatcgatca tgtcaacagt 120 attacggcag agaaccatat gaagtttgag catcttcagc cggaagaagg gaaatttacc 180 tttcaggaag cggatcggat tgtggatttt gcttgttcgc accgaatggc ggttcgaggg 240 cacacacttg tatggcacaa ccagactccg gattgggtgt ttcaagatgg tcaaggccat 300 ttcgtcagtc gggatgtgtt gcttgagcgg atgaaatgtc acatttcaac tgttgtacgg 360 cgatacaagg gaaaaatata ttgttgggat gtcatcaacg aagcggtagc cgacgaagga 420 gacgaattgt tgaggccgtc gaagtggcga caaatcatcg gggacgattt tatggaacaa 480 gcatttctct acgcttatga agctgaccca gatgcactgc ttttttacaa tgactataat 540 gaatgttttc cggaaaagag agaaaaaatt tttgcacttg tcaaatcgct gcgtgataaa 600 ggcattccga ttcatggcat cggcatgcag gcgcactgga gcctgacccg cccgtcgctt 660 gatgaaattc gtgcggcgat tgaacggtat gcgtcccttg gtgttgttct tcatattacg 720 gaactcgatg tatccatgtt tgaatttcac gatcgtcgaa ccgatttggc tgtcccgacg 780 aacgaaatga tcgaacagca agcagaacgg tatgggcaaa tttttgcttt gtttaaggag 840 tatcgcgatg ttattcaaag tgtcacattt tggggaattg ctgatgacca tacatggctc 900 gataactttc cagtgcacgg gagaaaaaac tggccgcttt tgttcgatga acagcataaa 960 ccgaaaccag ctttttggcg ggcagtgagt gtctga 996 <210> 50 <211> 331 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 50 Met Asn Ser Ser Leu Pro Ser Leu Arg Asp Val Phe Ala Asn Asp Phe 1 5 10 15 Arg Ile Gly Ala Ala Val Asn Pro Val Thr Ile Glu Met Gln Lys Gln 20 25 30 Leu Leu Ile Asp His Val Asn Ser Ile Thr Ala Glu Asn His Met Lys 35 40 45 Phe Glu His Leu Gln Pro Glu Glu Gly Lys Phe Thr Phe Gln Glu Ala 50 55 60 Asp Arg Ile Val Asp Phe Ala Cys Ser His Arg Met Ala Val Arg Gly 65 70 75 80 His Thr Leu Val Trp His Asn Gln Thr Pro Asp Trp Val Phe Gln Asp 85 90 95 Gly Gln Gly His Phe Val Ser Arg Asp Val Leu Leu Glu Arg Met Lys 100 105 110 Cys His Ile Ser Thr Val Val Arg Arg Tyr Lys Gly Lys Ile Tyr Cys 115 120 125 Trp Asp Val Ile Asn Glu Ala Val Ala Asp Glu Gly Asp Glu Leu Leu 130 135 140 Arg Pro Ser Lys Trp Arg Gln Ile Ile Gly Asp Asp Phe Met Glu Gln 145 150 155 160 Ala Phe Leu Tyr Ala Tyr Glu Ala Asp Pro Asp Ala Leu Leu Phe Tyr 165 170 175 Asn Asp Tyr Asn Glu Cys Phe Pro Glu Lys Arg Glu Lys Ile Phe Ala 180 185 190 Leu Val Lys Ser Leu Arg Asp Lys Gly Ile Pro Ile His Gly Ile Gly 195 200 205 Met Gln Ala His Trp Ser Leu Thr Arg Pro Ser Leu Asp Glu Ile Arg 210 215 220 Ala Ala Ile Glu Arg Tyr Ala Ser Leu Gly Val Val Leu His Ile Thr 225 230 235 240 Glu Leu Asp Val Ser Met Phe Glu Phe His Asp Arg Arg Thr Asp Leu 245 250 255 Ala Val Pro Thr Asn Glu Met Ile Glu Gln Gln Ala Glu Arg Tyr Gly 260 265 270 Gln Ile Phe Ala Leu Phe Lys Glu Tyr Arg Asp Val Ile Gln Ser Val 275 280 285 Thr Phe Trp Gly Ile Ala Asp Asp His Thr Trp Leu Asp Asn Phe Pro 290 295 300 Val His Gly Arg Lys Asn Trp Pro Leu Leu Phe Asp Glu Gln His Lys 305 310 315 320 Pro Lys Pro Ala Phe Trp Arg Ala Val Ser Val 325 330 <210> 51 <211> 3162 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 51 atgagaggga aaagcaaaaa gggatttctg aacatctcag aagctgtact tgttggaatt 60 ttagcaggct ttcttggagt tcttctcgca gctacggggg ttttgagttt tggtggaaca 120 gcgtcttcgt ctcttgaaac ggtgttcacc ttgagtttcg agggaacaac gcaaggtgtc 180 aatccctttg gaaaagaagt agttctcaca gcttctcaag atgtagcagc cgatggcgaa 240 tattcattga aagtagagaa tagaacttcc ggctgggatg gagttgagat cgatttaacg 300 gaaaaagtag aagcgaacaa agattatctg ttgtctttct acgtctatca aacatctgac 360 tcaccccaac tttttgaagt ccttgcaaga acagaagacg ggaaaggtga aaaatacgaa 420 acccttaccg acaaggtggt agtatcgaac tactggaaag aaattcttgt gcccttttcc 480 ccgagtttcg agagtacccc aacaaaatgt tctttgatcg ttgtttcacc aaagaaccca 540 tcattcactt tctatattga caaggttcaa attctcaaac cgaagaagca aggtccacaa 600 gtcatttacg aaacatcctt tgagagtggg acgggaagct ggcaagccag agggtctgat 660 gtgaaaatca aagtgacatc gaaagttgct cattctggaa aaaggtctct ctatgtctcc 720 aacagacaaa aaggctggca tggtgtacaa cttgacgtga agagactctt gagacccggg 780 aaaacgtatg cttttgaagg atgggtttat caagactctg gacaggatca aacaattatt 840 ctgacgatgc agagaagata ttcttctgat tctagcacac aatatgagtg gatcaaggcg 900 gtaactgttc catcaggaca atggacgcag atctctggaa cttacacaat ccaaccaaga 960 gtaagcgtgg aggaactcat tgtttacttt gaagccaagg atcccactct tgccttctat 1020 gtggacgatt tcaaaataac ggataccaca actactgaca tcaagctcga gctgaagcct 1080 gaagaagaaa ttccagctct taaagaagtg cttggagatt acttcaaagt aggtgttgcc 1140 ttacctttca aagtttttgc caaaccagag gatattgctc tcattactaa acatttcaac 1200 agcatcactg ccgaaaacga aatgaaacct gagagtctct tggctggcgt agaaaatgga 1260 aagttgaagt tcaggtttga gacagcagac aaatacgtag aatttgcaca gcaaaacggt 1320 atggttgtga gaggtcacac tctggtgtgg cacaatcaaa caccggactg gttcttcaag 1380 gacgagaacg gaaatctgct ctccaaagaa gcaatgactg aaaggcttag ggaatacatc 1440 cacacagtcg tcggacactt caaaggcaaa gtttacgcgt gggacgtcgt taatgaggca 1500 gtagatccat cccaaccaga tggacttaga agatctatat ggtacgaaat catgggacct 1560 gactatatag aacttgcatt caagtttgca agagaagcgg accccaatgc aaagctcttc 1620 tacaacgact acaacaccta ccaggagaag aagagagaca tcatttacaa cctcgtcaaa 1680 tccctcaaag agaagggact cattgacggt atcggtatgc agtgtcatat cggtgttggg 1740 accagtgtca aagagattga agaggcaatc aaaaaattca gcaccattcc aggtatcgaa 1800 attcatatca cggaactaga tataagtgtg tacgaggatg cgacttccaa ttatccaaca 1860 cctccaaggg aggctctcat taaacaagca cacgtaatga gagaactctt tgccatcttc 1920 aaaaagtaca gcaacgtcat aacaaacgtt actttctggg gattgaaaga tgattattcc 1980 tggaagaatg cccgcagaaa cgactggccg ctactttttg ataaagacta ccaagccaaa 2040 cttgcctact gggccatagt cagtcctgag gctctaccgg tgcttccaaa gaaatggtct 2100 atcgctacag gtagtgcttt ggtagttgga atgatggatg actcctattt ggcttcttca 2160 cctatcaaaa ttctcgtcga tggccaagaa aaactcacag ccagagtcat ctgggaagaa 2220 aacaaactct tcgtctacgc agaggtctat gacaggacaa gagacaaagg aaaggacggt 2280 atcaccatct ttgtggatcc taaaaacttc aaggcacctt acttgcatga agatgctttc 2340 tacgttacca taaaaaccga ctggagtgtt gagaagagtc gtgatgacat agaagtccag 2400 agattcgtag gtccaagtgg agtaaggtac aacgttgaat gtgaaataac acttcctgaa 2460 aaactccagg aaggacagca aatcggattt gatatcgccg tccaggatgg cgataaggtc 2520 tacagctggt ctgatacatc caatcagcag aagctcgcaa ccatgaacta cggaactctc 2580 actctgcagg gtgcggtaat ggccacagct aagtatggca cacctgtgat cgatggtgaa 2640 atagatgaca tctggtacac cactgaagaa atctcaaccg atgttgttgt catgggttca 2700 ctcaagaacg caagggcaaa agtgagagtg ctctgggatg aagagcacct ctatgtgctt 2760 gccatcgtaa ccgatcctgt gctcaataag gacaacacca atccatggga acaagactct 2820 gtagaaatct tcatagacga aaacaacgcc aaaacaccgt actatcagga cgatgatgct 2880 caatatcgtg tcaactacct caacgaacaa tccttcggta caggtgcaag cagcaagaac 2940 ttcaagacag ccgtgaaact catcgatggt ggttatcttg ttgaggcagc ggttaaatgg 3000 aagaccatca aaccttcacc aaacacagtg ataggctttg atttccaggt gaacgatgca 3060 aatgctcaag gtaagagagt tggaatactt aagtggtgcg atccaacgga caacagctgg 3120 cagaatacct ccaagtttgg taatctcagg ttgataaaat ag 3162 <210> 52 <211> 1053 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(30) <400> 52 Met Arg Gly Lys Ser Lys Lys Gly Phe Leu Asn Ile Ser Glu Ala Val 1 5 10 15 Leu Val Gly Ile Leu Ala Gly Phe Leu Gly Val Leu Leu Ala Ala Thr 20 25 30 Gly Val Leu Ser Phe Gly Gly Thr Ala Ser Ser Ser Leu Glu Thr Val 35 40 45 Phe Thr Leu Ser Phe Glu Gly Thr Thr Gln Gly Val Asn Pro Phe Gly 50 55 60 Lys Glu Val Val Leu Thr Ala Ser Gln Asp Val Ala Ala Asp Gly Glu 65 70 75 80 Tyr Ser Leu Lys Val Glu Asn Arg Thr Ser Gly Trp Asp Gly Val Glu 85 90 95 Ile Asp Leu Thr Glu Lys Val Glu Ala Asn Lys Asp Tyr Leu Leu Ser 100 105 110 Phe Tyr Val Tyr Gln Thr Ser Asp Ser Pro Gln Leu Phe Glu Val Leu 115 120 125 Ala Arg Thr Glu Asp Gly Lys Gly Glu Lys Tyr Glu Thr Leu Thr Asp 130 135 140 Lys Val Val Val Ser Asn Tyr Trp Lys Glu Ile Leu Val Pro Phe Ser 145 150 155 160 Pro Ser Phe Glu Ser Thr Pro Thr Lys Cys Ser Leu Ile Val Val Ser 165 170 175 Pro Lys Asn Pro Ser Phe Thr Phe Tyr Ile Asp Lys Val Gln Ile Leu 180 185 190 Lys Pro Lys Lys Gln Gly Pro Gln Val Ile Tyr Glu Thr Ser Phe Glu 195 200 205 Ser Gly Thr Gly Ser Trp Gln Ala Arg Gly Ser Asp Val Lys Ile Lys 210 215 220 Val Thr Ser Lys Val Ala His Ser Gly Lys Arg Ser Leu Tyr Val Ser 225 230 235 240 Asn Arg Gln Lys Gly Trp His Gly Val Gln Leu Asp Val Lys Arg Leu 245 250 255 Leu Arg Pro Gly Lys Thr Tyr Ala Phe Glu Gly Trp Val Tyr Gln Asp 260 265 270 Ser Gly Gln Asp Gln Thr Ile Ile Leu Thr Met Gln Arg Arg Tyr Ser 275 280 285 Ser Asp Ser Ser Thr Gln Tyr Glu Trp Ile Lys Ala Val Thr Val Pro 290 295 300 Ser Gly Gln Trp Thr Gln Ile Ser Gly Thr Tyr Thr Ile Gln Pro Arg 305 310 315 320 Val Ser Val Glu Glu Leu Ile Val Tyr Phe Glu Ala Lys Asp Pro Thr 325 330 335 Leu Ala Phe Tyr Val Asp Asp Phe Lys Ile Thr Asp Thr Thr Thr Thr 340 345 350 Asp Ile Lys Leu Glu Leu Lys Pro Glu Glu Glu Ile Pro Ala Leu Lys 355 360 365 Glu Val Leu Gly Asp Tyr Phe Lys Val Gly Val Ala Leu Pro Phe Lys 370 375 380 Val Phe Ala Lys Pro Glu Asp Ile Ala Leu Ile Thr Lys His Phe Asn 385 390 395 400 Ser Ile Thr Ala Glu Asn Glu Met Lys Pro Glu Ser Leu Leu Ala Gly 405 410 415 Val Glu Asn Gly Lys Leu Lys Phe Arg Phe Glu Thr Ala Asp Lys Tyr 420 425 430 Val Glu Phe Ala Gln Gln Asn Gly Met Val Val Arg Gly His Thr Leu 435 440 445 Val Trp His Asn Gln Thr Pro Asp Trp Phe Phe Lys Asp Glu Asn Gly 450 455 460 Asn Leu Leu Ser Lys Glu Ala Met Thr Glu Arg Leu Arg Glu Tyr Ile 465 470 475 480 His Thr Val Val Gly His Phe Lys Gly Lys Val Tyr Ala Trp Asp Val 485 490 495 Val Asn Glu Ala Val Asp Pro Ser Gln Pro Asp Gly Leu Arg Arg Ser 500 505 510 Ile Trp Tyr Glu Ile Met Gly Pro Asp Tyr Ile Glu Leu Ala Phe Lys 515 520 525 Phe Ala Arg Glu Ala Asp Pro Asn Ala Lys Leu Phe Tyr Asn Asp Tyr 530 535 540 Asn Thr Tyr Gln Glu Lys Lys Arg Asp Ile Ile Tyr Asn Leu Val Lys 545 550 555 560 Ser Leu Lys Glu Lys Gly Leu Ile Asp Gly Ile Gly Met Gln Cys His 565 570 575 Ile Gly Val Gly Thr Ser Val Lys Glu Ile Glu Glu Ala Ile Lys Lys 580 585 590 Phe Ser Thr Ile Pro Gly Ile Glu Ile His Ile Thr Glu Leu Asp Ile 595 600 605 Ser Val Tyr Glu Asp Ala Thr Ser Asn Tyr Pro Thr Pro Pro Arg Glu 610 615 620 Ala Leu Ile Lys Gln Ala His Val Met Arg Glu Leu Phe Ala Ile Phe 625 630 635 640 Lys Lys Tyr Ser Asn Val Ile Thr Asn Val Thr Phe Trp Gly Leu Lys 645 650 655 Asp Asp Tyr Ser Trp Lys Asn Ala Arg Arg Asn Asp Trp Pro Leu Leu 660 665 670 Phe Asp Lys Asp Tyr Gln Ala Lys Leu Ala Tyr Trp Ala Ile Val Ser 675 680 685 Pro Glu Ala Leu Pro Val Leu Pro Lys Lys Trp Ser Ile Ala Thr Gly 690 695 700 Ser Ala Leu Val Val Gly Met Met Asp Asp Ser Tyr Leu Ala Ser Ser 705 710 715 720 Pro Ile Lys Ile Leu Val Asp Gly Gln Glu Lys Leu Thr Ala Arg Val 725 730 735 Ile Trp Glu Glu Asn Lys Leu Phe Val Tyr Ala Glu Val Tyr Asp Arg 740 745 750 Thr Arg Asp Lys Gly Lys Asp Gly Ile Thr Ile Phe Val Asp Pro Lys 755 760 765 Asn Phe Lys Ala Pro Tyr Leu His Glu Asp Ala Phe Tyr Val Thr Ile 770 775 780 Lys Thr Asp Trp Ser Val Glu Lys Ser Arg Asp Asp Ile Glu Val Gln 785 790 795 800 Arg Phe Val Gly Pro Ser Gly Val Arg Tyr Asn Val Glu Cys Glu Ile 805 810 815 Thr Leu Pro Glu Lys Leu Gln Glu Gly Gln Gln Ile Gly Phe Asp Ile 820 825 830 Ala Val Gln Asp Gly Asp Lys Val Tyr Ser Trp Ser Asp Thr Ser Asn 835 840 845 Gln Gln Lys Leu Ala Thr Met Asn Tyr Gly Thr Leu Thr Leu Gln Gly 850 855 860 Ala Val Met Ala Thr Ala Lys Tyr Gly Thr Pro Val Ile Asp Gly Glu 865 870 875 880 Ile Asp Asp Ile Trp Tyr Thr Thr Glu Glu Ile Ser Thr Asp Val Val 885 890 895 Val Met Gly Ser Leu Lys Asn Ala Arg Ala Lys Val Arg Val Leu Trp 900 905 910 Asp Glu Glu His Leu Tyr Val Leu Ala Ile Val Thr Asp Pro Val Leu 915 920 925 Asn Lys Asp Asn Thr Asn Pro Trp Glu Gln Asp Ser Val Glu Ile Phe 930 935 940 Ile Asp Glu Asn Asn Ala Lys Thr Pro Tyr Tyr Gln Asp Asp Asp Ala 945 950 955 960 Gln Tyr Arg Val Asn Tyr Leu Asn Glu Gln Ser Phe Gly Thr Gly Ala 965 970 975 Ser Ser Lys Asn Phe Lys Thr Ala Val Lys Leu Ile Asp Gly Gly Tyr 980 985 990 Leu Val Glu Ala Ala Val Lys Trp Lys Thr Ile Lys Pro Ser Pro Asn 995 1000 1005 Thr Val Ile Gly Phe Asp Phe Gln Val Asn Asp Ala Asn Ala Gln Gly 1010 1015 1020 Lys Arg Val Gly Ile Leu Lys Trp Cys Asp Pro Thr Asp Asn Ser Trp 1025 1030 1035 1040 Gln Asn Thr Ser Lys Phe Gly Asn Leu Arg Leu Ile Lys 1045 1050 <210> 53 <211> 2370 <212> DNA <213> Bacteria <400> 53 atgaagggcc tgcaccggct ccgccgccgt cgccggacct gggtggcagg actgtcggcc 60 gcggcggtgg tcgccggcgc cctgacgctc ctccccggct ccgccggcgc cgcgggcctg 120 ggtacgcacg cggccccctc gggccggtac ttcggcacgg ccgtggccgc gggccgcctc 180 ggcgactcgg cgtacaccgc gatcgccgac cgggagttca acatgatcac cccggagaac 240 gagatgaagt gggacgccgt cgagccgtcc cgcggccgtt tcgacttcgg tcccgcggac 300 cggatcgtcg agcgtgccct ggcacgcggc cagcgcgtcc gcggccacac cacggtctgg 360 cactcgcagc tcccctcctg ggtgggctcc atccgcgaca cgaagacgct gcgcggcgtg 420 atgaaccacc acatcaccac ccagatgacc cactacaagg gcaagatcta cgcctgggac 480 gtggtcaacg aggccttcgc cgatggcggc agcggccggc tccgcgactc ggtcttccag 540 aaggtgctgg gcgacggctt catcgaggag gcgttccgca ccgcccgcgc ggccgacccc 600 tcggccaagc tctgctacaa cgactacaac atcgagaact ggtcggacgc caagacccag 660 ggcgtctacc gcctggtgaa ggacttcacg tcccgaggcg ttcccatcga ctgcgtcggc 720 ttccagagcc acttcggcgc gggcggcccg ccggcgagct tcaagacgac cctggccaac 780 ttcgccgccc tgggcgtcga cgtccagatc accgagctgg acatcgccca ggcatcacct 840 gcccactacg cgagtgcggt cagcacctgt ctgtccgtgg cccggtgcac cggcatcacg 900 gtgtggggcg tccgtgacag cgactcctgg cggagcgccg aaagcccgct gctgttcgac 960 cggaacggca agcccaagcc cgcgtacgcc gccgtcatga acgccctcgg ctccggctcg 1020 ggtcccaccc cgagcaagcc ggccgacggt acggggagcg gtacggggga gatcaagggc 1080 gtggcctccg gccgctgtct ggacgtcccc gcctccacca ccgccaacgg cacccgggcg 1140 cagctgtggg actgtagcgg ccaggccaac cagcgctgga cccacaccgc cggcaagcag 1200 ctgaagatcc acggcgacaa gtgcctggac gccaagggca agggcaccgc caacggcacc 1260 gcggtggtcg tctgggactg caacggcggc accaaccagc agtggaacgt ccacaccgac 1320 ggcacgatca ccggcgtcca gtccggtctg tgcctcgatg ccgtcggcgc ggccaccgcc 1380 aacggcaccc cgatccagct gcacgcctgt gggggtgtcg gcaaccagaa gtggtccgcc 1440 ccgtccggat cgggcggcgg cacgtgcgtg cttccgtcga cgtacaagtg gagctcgacg 1500 ggtgccctgg cgcagcccaa ggccgggtgg gcctcgctga aggacttcac ccatgtggtg 1560 ctgggcggca agcacctggt ctacgggtcg aacttcaacg gatcgacgta cggctcgatg 1620 acgttcagcc ccttcaccac ctggtcggac atggcgtccg caggacagaa ggcgatgaag 1680 cagcccgcgg tcgcacccac cctgttctac ttcgcaccca agaagatctg ggtgctggcg 1740 taccagtggg gcaggaccgc gttctcctac cggacgtcga ccgaccccac caacccgaac 1800 ggctggtcgg cggagcagga gctcttctcc ggaagcatca ccggctcggg cacgggcccc 1860 atcgaccaga cgctcatcgg cgacgggacg aacatgtacc tgttcttcgc cggtgacaac 1920 ggcaagatct accgggccag catgccgatc gggaacttcc cgggcagctt cggctcctcg 1980 tacacgacgg tcatgagcga caccgcgaag aacctgttcg aggcgccgca ggtgtacaag 2040 gtcaaggacc agaaccagta cctcatgatc gtcgaggccc ggggcgcggg cgagcgccgc 2100 tacttccgct cgttcacggc ctccagcctg agcggtgcgt ggaccccgca ggccgcgacc 2160 gagagcaacc ccttcgcggg caaggccaac agcggcgcca cctggaccga cgacatcagc 2220 cacggtgatc tgatccgcac caaccccgat cagaccatga ccatcgaccc ctgcaacctt 2280 cagctgctct accagggcaa gtccccgcag gcgggcggac cctacgacca gctgccgtac 2340 cggccgggcg tcctcaccct gcagcgctga 2370 <210> 54 <211> 787 <212> PRT <213> Bacteria <220> <221> SIGNAL <222> (1)...(37) <400> 54 Met Lys Gly Leu His Arg Leu Arg Arg Arg Arg Arg Thr Trp Val Ala 1 5 10 15 Gly Leu Ser Ala Ala Ala Val Val Ala Gly Ala Leu Thr Leu Leu Pro 20 25 30 Gly Ser Ala Gly Ala Ala Gly Leu Gly Thr His Ala Ala Pro Ser Gly 35 40 45 Arg Tyr Phe Gly Thr Ala Val Ala Ala Gly Arg Leu Gly Asp Ser Ala 50 55 60 Tyr Thr Ala Ile Ala Asp Arg Glu Phe Asn Met Ile Thr Pro Glu Asn 65 70 75 80 Glu Met Lys Trp Asp Ala Val Glu Pro Ser Arg Gly Arg Phe Asp Phe 85 90 95 Gly Pro Ala Asp Arg Ile Val Glu Arg Ala Leu Ala Arg Gly Gln Arg 100 105 110 Val Arg Gly His Thr Thr Val Trp His Ser Gln Leu Pro Ser Trp Val 115 120 125 Gly Ser Ile Arg Asp Thr Lys Thr Leu Arg Gly Val Met Asn His His 130 135 140 Ile Thr Thr Gln Met Thr His Tyr Lys Gly Lys Ile Tyr Ala Trp Asp 145 150 155 160 Val Val Asn Glu Ala Phe Ala Asp Gly Gly Ser Gly Arg Leu Arg Asp 165 170 175 Ser Val Phe Gln Lys Val Leu Gly Asp Gly Phe Ile Glu Glu Ala Phe 180 185 190 Arg Thr Ala Arg Ala Ala Asp Pro Ser Ala Lys Leu Cys Tyr Asn Asp 195 200 205 Tyr Asn Ile Glu Asn Trp Ser Asp Ala Lys Thr Gln Gly Val Tyr Arg 210 215 220 Leu Val Lys Asp Phe Thr Ser Arg Gly Val Pro Ile Asp Cys Val Gly 225 230 235 240 Phe Gln Ser His Phe Gly Ala Gly Gly Pro Pro Ala Ser Phe Lys Thr 245 250 255 Thr Leu Ala Asn Phe Ala Ala Leu Gly Val Asp Val Gln Ile Thr Glu 260 265 270 Leu Asp Ile Ala Gln Ala Ser Pro Ala His Tyr Ala Ser Ala Val Ser 275 280 285 Thr Cys Leu Ser Val Ala Arg Cys Thr Gly Ile Thr Val Trp Gly Val 290 295 300 Arg Asp Ser Asp Ser Trp Arg Ser Ala Glu Ser Pro Leu Leu Phe Asp 305 310 315 320 Arg Asn Gly Lys Pro Lys Pro Ala Tyr Ala Ala Val Met Asn Ala Leu 325 330 335 Gly Ser Gly Ser Gly Pro Thr Pro Ser Lys Pro Ala Asp Gly Thr Gly 340 345 350 Ser Gly Thr Gly Glu Ile Lys Gly Val Ala Ser Gly Arg Cys Leu Asp 355 360 365 Val Pro Ala Ser Thr Thr Ala Asn Gly Thr Arg Ala Gln Leu Trp Asp 370 375 380 Cys Ser Gly Gln Ala Asn Gln Arg Trp Thr His Thr Ala Gly Lys Gln 385 390 395 400 Leu Lys Ile His Gly Asp Lys Cys Leu Asp Ala Lys Gly Lys Gly Thr 405 410 415 Ala Asn Gly Thr Ala Val Val Val Trp Asp Cys Asn Gly Gly Thr Asn 420 425 430 Gln Gln Trp Asn Val His Thr Asp Gly Thr Ile Thr Gly Val Gln Ser 435 440 445 Gly Leu Cys Leu Asp Ala Val Gly Ala Ala Thr Ala Asn Gly Thr Pro 450 455 460 Ile Gln Leu His Ala Cys Gly Gly Val Gly Asn Gln Lys Trp Ser Ala 465 470 475 480 Pro Ser Gly Ser Gly Gly Gly Thr Cys Val Leu Pro Ser Thr Tyr Lys 485 490 495 Trp Ser Ser Thr Gly Ala Leu Ala Gln Pro Lys Ala Gly Trp Ala Ser 500 505 510 Leu Lys Asp Phe Thr His Val Val Leu Gly Gly Lys His Leu Val Tyr 515 520 525 Gly Ser Asn Phe Asn Gly Ser Thr Tyr Gly Ser Met Thr Phe Ser Pro 530 535 540 Phe Thr Thr Trp Ser Asp Met Ala Ser Ala Gly Gln Lys Ala Met Lys 545 550 555 560 Gln Pro Ala Val Ala Pro Thr Leu Phe Tyr Phe Ala Pro Lys Lys Ile 565 570 575 Trp Val Leu Ala Tyr Gln Trp Gly Arg Thr Ala Phe Ser Tyr Arg Thr 580 585 590 Ser Thr Asp Pro Thr Asn Pro Asn Gly Trp Ser Ala Glu Gln Glu Leu 595 600 605 Phe Ser Gly Ser Ile Thr Gly Ser Gly Thr Gly Pro Ile Asp Gln Thr 610 615 620 Leu Ile Gly Asp Gly Thr Asn Met Tyr Leu Phe Phe Ala Gly Asp Asn 625 630 635 640 Gly Lys Ile Tyr Arg Ala Ser Met Pro Ile Gly Asn Phe Pro Gly Ser 645 650 655 Phe Gly Ser Ser Tyr Thr Thr Val Met Ser Asp Thr Ala Lys Asn Leu 660 665 670 Phe Glu Ala Pro Gln Val Tyr Lys Val Lys Asp Gln Asn Gln Tyr Leu 675 680 685 Met Ile Val Glu Ala Arg Gly Ala Gly Glu Arg Arg Tyr Phe Arg Ser 690 695 700 Phe Thr Ala Ser Ser Leu Ser Gly Ala Trp Thr Pro Gln Ala Ala Thr 705 710 715 720 Glu Ser Asn Pro Phe Ala Gly Lys Ala Asn Ser Gly Ala Thr Trp Thr 725 730 735 Asp Asp Ile Ser His Gly Asp Leu Ile Arg Thr Asn Pro Asp Gln Thr 740 745 750 Met Thr Ile Asp Pro Cys Asn Leu Gln Leu Leu Tyr Gln Gly Lys Ser 755 760 765 Pro Gln Ala Gly Gly Pro Tyr Asp Gln Leu Pro Tyr Arg Pro Gly Val 770 775 780 Leu Thr Leu 785 <210> 55 <211> 1143 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 55 atgaaaaaaa cgattgcaca tttcacctta tggatagcgt tttttctctt cacttcctgt 60 gctgttacgg cgcagaagaa tactaagaat gcaagagtaa agcccactac tctaaaagag 120 gcttaccaag gtaaattcta tatcggtaca gcgatgaatc tgagacagat tcacggagat 180 gatccccagt ctgaaaatat tatcaaaaaa cagttcaatt ccattgttgc tgaaaactgc 240 atgaagagta tgtatcttca gccggaggaa ggaaaatttt tcttcgatga tgcggataag 300 tttgtggatt ttggtcttca gaacaatatg tttattatcg ggcattgtct gatttggcat 360 tcgcaggcgc caaaatggtt tttcaccgac gagaatggga aaacggtctc cccagaagtt 420 cttaaacaaa ggatgaaagc tcatatcacc gccgtcgttt ctcgctacaa agggaaaatc 480 aaaggatggg atgtggtgaa cgaagccatt atggaagatg gttcttaccg caaaagcaaa 540 ttttacgaga ttttgggaga agaatttatt ccgttggcat ttcagtatgc gcatgaagca 600 gatcctgatg cagaactcta ttacaacgat tataacgaat ggtatcccgg aaaaagagct 660 acggtgacca aaataatccg agatttcaaa tctagaggaa tccgcattga tgccattgga 720 atgcaggctc atttcgggat ggattcaccc actatagaag agtatgaaca aactattcag 780 ggctatataa aagaaggcgt gaaagtcaat attacggaac tcgatttgag tccacttcct 840 tccccttggg gaacttccgc caacgttgcc gatacgcagc agtatcagga aaaaatgaat 900 ccttacacca aaggacttcc cacagaggtg gaaaaagctt gggaaaaccg ttatctcgat 960 tttttcaaac tattcctaaa atatcatcag catatcgagc gtgttacgtt ttggggcgtt 1020 agcgatatcg attcctggaa gaacgatttt ccagtgagag gacgtaccga ttatccgtta 1080 ccctttgacc gacagtatca ggcaaaacct ttggttcaga aattaataga cttaacgaaa 1140 tag 1143 <210> 56 <211> 380 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(24) <400> 56 Met Lys Lys Thr Ile Ala His Phe Thr Leu Trp Ile Ala Phe Phe Leu 1 5 10 15 Phe Thr Ser Cys Ala Val Thr Ala Gln Lys Asn Thr Lys Asn Ala Arg 20 25 30 Val Lys Pro Thr Thr Leu Lys Glu Ala Tyr Gln Gly Lys Phe Tyr Ile 35 40 45 Gly Thr Ala Met Asn Leu Arg Gln Ile His Gly Asp Asp Pro Gln Ser 50 55 60 Glu Asn Ile Ile Lys Lys Gln Phe Asn Ser Ile Val Ala Glu Asn Cys 65 70 75 80 Met Lys Ser Met Tyr Leu Gln Pro Glu Glu Gly Lys Phe Phe Phe Asp 85 90 95 Asp Ala Asp Lys Phe Val Asp Phe Gly Leu Gln Asn Asn Met Phe Ile 100 105 110 Ile Gly His Cys Leu Ile Trp His Ser Gln Ala Pro Lys Trp Phe Phe 115 120 125 Thr Asp Glu Asn Gly Lys Thr Val Ser Pro Glu Val Leu Lys Gln Arg 130 135 140 Met Lys Ala His Ile Thr Ala Val Val Ser Arg Tyr Lys Gly Lys Ile 145 150 155 160 Lys Gly Trp Asp Val Val Asn Glu Ala Ile Met Glu Asp Gly Ser Tyr 165 170 175 Arg Lys Ser Lys Phe Tyr Glu Ile Leu Gly Glu Glu Phe Ile Pro Leu 180 185 190 Ala Phe Gln Tyr Ala His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr 195 200 205 Asn Asp Tyr Asn Glu Trp Tyr Pro Gly Lys Arg Ala Thr Val Thr Lys 210 215 220 Ile Ile Arg Asp Phe Lys Ser Arg Gly Ile Arg Ile Asp Ala Ile Gly 225 230 235 240 Met Gln Ala His Phe Gly Met Asp Ser Pro Thr Ile Glu Glu Tyr Glu 245 250 255 Gln Thr Ile Gln Gly Tyr Ile Lys Glu Gly Val Lys Val Asn Ile Thr 260 265 270 Glu Leu Asp Leu Ser Pro Leu Pro Ser Pro Trp Gly Thr Ser Ala Asn 275 280 285 Val Ala Asp Thr Gln Gln Tyr Gln Glu Lys Met Asn Pro Tyr Thr Lys 290 295 300 Gly Leu Pro Thr Glu Val Glu Lys Ala Trp Glu Asn Arg Tyr Leu Asp 305 310 315 320 Phe Phe Lys Leu Phe Leu Lys Tyr His Gln His Ile Glu Arg Val Thr 325 330 335 Phe Trp Gly Val Ser Asp Ile Asp Ser Trp Lys Asn Asp Phe Pro Val 340 345 350 Arg Gly Arg Thr Asp Tyr Pro Leu Pro Phe Asp Arg Gln Tyr Gln Ala 355 360 365 Lys Pro Leu Val Gln Lys Leu Ile Asp Leu Thr Lys 370 375 380 <210> 57 <211> 1578 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 57 atgaaaagaa tgatcggttt gctgctggcc atttgcctgg tgatgacgct ggctggggcc 60 tgggctgcct cggatacgct ggtctatgca tccagtttcg cagcgggcga tgacgactgg 120 tttgcaaggg gcgcttcccg ggtttaccat accacggagg cgacgctgcg gacggaaggc 180 cggagcgaca actggaattc tccgggacgc tattttgaac tggtgccgga taatgaatat 240 acgctgagcg tggaggtcta ccaggacgga gcggacagcg cgaacttcat gatttccctg 300 gaaaaggttg cggatgggat caccggatgg gaaaacctgg tgcggggaac cgtgaaaaag 360 ggtgaatgga cgacgctgtc cggaacctat acttttgcag actatgaaag ctatgtgctg 420 tatgtggaga cctccgacgc gccgacgctg gactttgaga tccggaattt ccgggtggaa 480 agccccaatg ggatcccgga gccgaaggct accgaggcgc cggcagtggt ttcggaagcc 540 acggatattc cgagcctgaa ggacgcttac gcggattact tcgactttgg cgcggccgtg 600 ccgcagtctg ctttcaccag cagagataat attcagctga tggagctgat gaaaaaccag 660 ttcagcatcc tgacgcctga aaatgagctg aagccggaca gtgtattgga tgtaagcgcc 720 agcaagcagc tggccaaaga ggatgaaacc gcggtagtgg tgcggtttaa cggggcaaag 780 tcattgctgc ggtttgccca gcaaaacggc atcaaggtgc acgggcatgt gctggtctgg 840 cacagccaga cgccggaagc ctttttccat gaaggatatg atcccaagaa cccgctggtg 900 agccgggaag tgatgctggg acggctggaa aactatatcc gggaagtgct gacccagacg 960 gaagaactgt atccgggcgt gatcgtcagc tgggacgtgg tgaacgaagc gattgacgac 1020 ggaaccaact ggatccggaa gggatcgggc tggtaccgga ccatcgggga agactatgtg 1080 gagaaggctt ttgagtttgc ccggaagtat gccccggaag gcgtgctgct gtactacaac 1140 gattacaaca cggcatacgc cggaaaactg aatgggatta tcaaactgat caaacccatg 1200 atcgagcagg gaacgatcga cggatacggc ttccagatgc accatacgac cgggcagccc 1260 agcaaccaga tgatcaccac ggcggtggag aagatcgcgg ccctgggaat caagctgcgg 1320 gtcagcgaga tggacatcgg gattacaaag tatacagaga cgagcctgca ggcacaaaag 1380 gacaagtaca aggcgatgat ggaactgatg ctgcggttcg cggaccagac ggaagcagtg 1440 caggtctggg ggattacgga tacgatgagc tggcggagct ccagctatcc gctgctgttt 1500 gaccggagca ggaatccgaa gccggcgttc tatggcgtga ttgaagcggt tgaagactgg 1560 acagggaaaa gtgaatag 1578 <210> 58 <211> 525 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(22) <400> 58 Met Lys Arg Met Ile Gly Leu Leu Leu Ala Ile Cys Leu Val Met Thr 1 5 10 15 Leu Ala Gly Ala Trp Ala Ala Ser Asp Thr Leu Val Tyr Ala Ser Ser 20 25 30 Phe Ala Ala Gly Asp Asp Asp Trp Phe Ala Arg Gly Ala Ser Arg Val 35 40 45 Tyr His Thr Thr Glu Ala Thr Leu Arg Thr Glu Gly Arg Ser Asp Asn 50 55 60 Trp Asn Ser Pro Gly Arg Tyr Phe Glu Leu Val Pro Asp Asn Glu Tyr 65 70 75 80 Thr Leu Ser Val Glu Val Tyr Gln Asp Gly Ala Asp Ser Ala Asn Phe 85 90 95 Met Ile Ser Leu Glu Lys Val Ala Asp Gly Ile Thr Gly Trp Glu Asn 100 105 110 Leu Val Arg Gly Thr Val Lys Lys Gly Glu Trp Thr Thr Leu Ser Gly 115 120 125 Thr Tyr Thr Phe Ala Asp Tyr Glu Ser Tyr Val Leu Tyr Val Glu Thr 130 135 140 Ser Asp Ala Pro Thr Leu Asp Phe Glu Ile Arg Asn Phe Arg Val Glu 145 150 155 160 Ser Pro Asn Gly Ile Pro Glu Pro Lys Ala Thr Glu Ala Pro Ala Val 165 170 175 Val Ser Glu Ala Thr Asp Ile Pro Ser Leu Lys Asp Ala Tyr Ala Asp 180 185 190 Tyr Phe Asp Phe Gly Ala Ala Val Pro Gln Ser Ala Phe Thr Ser Arg 195 200 205 Asp Asn Ile Gln Leu Met Glu Leu Met Lys Asn Gln Phe Ser Ile Leu 210 215 220 Thr Pro Glu Asn Glu Leu Lys Pro Asp Ser Val Leu Asp Val Ser Ala 225 230 235 240 Ser Lys Gln Leu Ala Lys Glu Asp Glu Thr Ala Val Val Val Arg Phe 245 250 255 Asn Gly Ala Lys Ser Leu Leu Arg Phe Ala Gln Gln Asn Gly Ile Lys 260 265 270 Val His Gly His Val Leu Val Trp His Ser Gln Thr Pro Glu Ala Phe 275 280 285 Phe His Glu Gly Tyr Asp Pro Lys Asn Pro Leu Val Ser Arg Glu Val 290 295 300 Met Leu Gly Arg Leu Glu Asn Tyr Ile Arg Glu Val Leu Thr Gln Thr 305 310 315 320 Glu Glu Leu Tyr Pro Gly Val Ile Val Ser Trp Asp Val Val Asn Glu 325 330 335 Ala Ile Asp Asp Gly Thr Asn Trp Ile Arg Lys Gly Ser Gly Trp Tyr 340 345 350 Arg Thr Ile Gly Glu Asp Tyr Val Glu Lys Ala Phe Glu Phe Ala Arg 355 360 365 Lys Tyr Ala Pro Glu Gly Val Leu Leu Tyr Tyr Asn Asp Tyr Asn Thr 370 375 380 Ala Tyr Ala Gly Lys Leu Asn Gly Ile Ile Lys Leu Ile Lys Pro Met 385 390 395 400 Ile Glu Gln Gly Thr Ile Asp Gly Tyr Gly Phe Gln Met His His Thr 405 410 415 Thr Gly Gln Pro Ser Asn Gln Met Ile Thr Thr Ala Val Glu Lys Ile 420 425 430 Ala Ala Leu Gly Ile Lys Leu Arg Val Ser Glu Met Asp Ile Gly Ile 435 440 445 Thr Lys Tyr Thr Glu Thr Ser Leu Gln Ala Gln Lys Asp Lys Tyr Lys 450 455 460 Ala Met Met Glu Leu Met Leu Arg Phe Ala Asp Gln Thr Glu Ala Val 465 470 475 480 Gln Val Trp Gly Ile Thr Asp Thr Met Ser Trp Arg Ser Ser Ser Tyr 485 490 495 Pro Leu Leu Phe Asp Arg Ser Arg Asn Pro Lys Pro Ala Phe Tyr Gly 500 505 510 Val Ile Glu Ala Val Glu Asp Trp Thr Gly Lys Ser Glu 515 520 525 <210> 59 <211> 1104 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 59 atgcttgcca gtagtgccgg tttggtagca tcccaactca agctgtccgc gttagctgca 60 gctaaaaatg ctggattaaa agatgtatat aaggatcgct ttctgattgg tgcagcaatt 120 aatacctcga ttgcgagcgg ccagcaacct gatattacag aaattatcaa gcgtgatttt 180 tcgtcgttaa cacctgaaaa tgcaatgaag tgggaatctg tcaggactgc tgatggcgga 240 tggaaatggg cagatgccga tcaattcgtt acgtttgcaa cagaacacaa aatacacgct 300 gttggccaca cccttgcctg gcatagccag attcccgatt ccgtattcaa aaatgaaaaa 360 ggcgaataca taaaatccac cgagctatca aaaaaaatgg aagaacatat cactacgatt 420 gtaggtagat ataaaggcaa actcgatgcc tgggatgtag ttaatgaggc tgttggtgat 480 gataatcaaa tgcgcaaaag ccattattac aatattctcg gcgaagattt tattgataag 540 gcatttcacc ttgcgcatga ggtcgatccc aaagcgcatt taatgtataa cgactacaac 600 attgaaaaag atggcaagcg tgaagctacc cttgaaatgt taaagcgttt acaaaaacgc 660 ggtgtaccga ttcatgggct cggcatccag ggacatattg ccgttgatgg ccccagcatt 720 gcggatattg aaaaaagtat tttggcttat gcggatttgg gtttgcgtgt acatttcacc 780 gagttggata ttgatgtatt gccgcaaatc tggaacttac cggttgcaga aatttctaca 840 cgcttcgaat acaaacctga gcgagatcct ttcaaaaatg gtttatcaaa agaaatgaac 900 gataaactca gtgcacgcta tgaagaatta ttcacattat ttattaaaca caaagataaa 960 attgatcgta ttactttgtg gggtgtcagc gatgatgcaa cctggctaaa tgatttcccc 1020 atcaaaggca gaaccagtta tccattattg tttgatcgca agcatcaacc aaaagatgct 1080 tattataaca ttctggcgtt gtga 1104 <210> 60 <211> 367 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(21) <400> 60 Met Leu Ala Ser Ser Ala Gly Leu Val Ala Ser Gln Leu Lys Leu Ser 1 5 10 15 Ala Leu Ala Ala Ala Lys Asn Ala Gly Leu Lys Asp Val Tyr Lys Asp 20 25 30 Arg Phe Leu Ile Gly Ala Ala Ile Asn Thr Ser Ile Ala Ser Gly Gln 35 40 45 Gln Pro Asp Ile Thr Glu Ile Ile Lys Arg Asp Phe Ser Ser Leu Thr 50 55 60 Pro Glu Asn Ala Met Lys Trp Glu Ser Val Arg Thr Ala Asp Gly Gly 65 70 75 80 Trp Lys Trp Ala Asp Ala Asp Gln Phe Val Thr Phe Ala Thr Glu His 85 90 95 Lys Ile His Ala Val Gly His Thr Leu Ala Trp His Ser Gln Ile Pro 100 105 110 Asp Ser Val Phe Lys Asn Glu Lys Gly Glu Tyr Ile Lys Ser Thr Glu 115 120 125 Leu Ser Lys Lys Met Glu Glu His Ile Thr Thr Ile Val Gly Arg Tyr 130 135 140 Lys Gly Lys Leu Asp Ala Trp Asp Val Val Asn Glu Ala Val Gly Asp 145 150 155 160 Asp Asn Gln Met Arg Lys Ser His Tyr Tyr Asn Ile Leu Gly Glu Asp 165 170 175 Phe Ile Asp Lys Ala Phe His Leu Ala His Glu Val Asp Pro Lys Ala 180 185 190 His Leu Met Tyr Asn Asp Tyr Asn Ile Glu Lys Asp Gly Lys Arg Glu 195 200 205 Ala Thr Leu Glu Met Leu Lys Arg Leu Gln Lys Arg Gly Val Pro Ile 210 215 220 His Gly Leu Gly Ile Gln Gly His Ile Ala Val Asp Gly Pro Ser Ile 225 230 235 240 Ala Asp Ile Glu Lys Ser Ile Leu Ala Tyr Ala Asp Leu Gly Leu Arg 245 250 255 Val His Phe Thr Glu Leu Asp Ile Asp Val Leu Pro Gln Ile Trp Asn 260 265 270 Leu Pro Val Ala Glu Ile Ser Thr Arg Phe Glu Tyr Lys Pro Glu Arg 275 280 285 Asp Pro Phe Lys Asn Gly Leu Ser Lys Glu Met Asn Asp Lys Leu Ser 290 295 300 Ala Arg Tyr Glu Glu Leu Phe Thr Leu Phe Ile Lys His Lys Asp Lys 305 310 315 320 Ile Asp Arg Ile Thr Leu Trp Gly Val Ser Asp Asp Ala Thr Trp Leu 325 330 335 Asn Asp Phe Pro Ile Lys Gly Arg Thr Ser Tyr Pro Leu Leu Phe Asp 340 345 350 Arg Lys His Gln Pro Lys Asp Ala Tyr Tyr Asn Ile Leu Ala Leu 355 360 365 <210> 61 <211> 1041 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 61 atgagaagaa gcatggaaag gctgcccaag ctccatgaag cttacggcaa tagtttcaag 60 atcggcgctg ccgtgaatcc aattacgatg gtgacccaaa aggaattgtt gtcacaccac 120 ttcaacagcg ttacggcaga aaatgaaatg aaattcgagc gattgcaccc atcggaagag 180 gtgtatacat tcgagcaagc cgaccagatc gtatcgtttg ccaaatcgaa cggaatgtcg 240 gtgagaggac ataccctcgt atggcataat cagacgccgg aatgggtgtt tcaagacagt 300 tccggtggga cagccggccg cgagctgctg ctcgctcgga tgaaatcgca catcgatgag 360 gtcgttggcc gttatcgcgg agatatctat gcttgggatg tcgtaaacga agccattgcc 420 gacagtggaa gcgatctgct tcgttcctcc ccgtggcttg cgtcgatcgg ggaggatttt 480 atcgccaagg ctttcgaata tgcgcacgaa gcagacccgc aagcgctgct gttttataac 540 gattacaacg aatccgtgcc cgagaagcgg gagaagattt acacgctcct taaatcgtta 600 aaggagcagg atgtgccgat tcacggcgtc gggcttcagg cccattggaa tttggagttt 660 ccatcgcttg acgatatccg cagggcaatc gaaaggtatg caagccttgg catgatcttg 720 catatcacgg agcttgacgt atccgtattc gcgcatgagg ataagcggac cgatctggcg 780 gcgccgaccg aagaaatgct tgagcgccag gcggagcgtt acggtcaatt gttccgtctg 840 cttaaagagt acagcggcag cgtcacttcc gtgaccttct ggggagcggc ggacgattat 900 acctggctgg atcattttcc ggtaaggggc cgcaaaaatt ggccgttcgt cttcgacgag 960 aaccatcttc cgaaggaatc ctattggaac ctgttgaagg aagccaatcc cgaaagaaca 1020 ttccaagaga tacgttcgta a 1041 <210> 62 <211> 346 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 62 Met Arg Arg Ser Met Glu Arg Leu Pro Lys Leu His Glu Ala Tyr Gly 1 5 10 15 Asn Ser Phe Lys Ile Gly Ala Ala Val Asn Pro Ile Thr Met Val Thr 20 25 30 Gln Lys Glu Leu Leu Ser His His Phe Asn Ser Val Thr Ala Glu Asn 35 40 45 Glu Met Lys Phe Glu Arg Leu His Pro Ser Glu Glu Val Tyr Thr Phe 50 55 60 Glu Gln Ala Asp Gln Ile Val Ser Phe Ala Lys Ser Asn Gly Met Ser 65 70 75 80 Val Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro Glu Trp Val 85 90 95 Phe Gln Asp Ser Ser Gly Gly Thr Ala Gly Arg Glu Leu Leu Leu Ala 100 105 110 Arg Met Lys Ser His Ile Asp Glu Val Val Gly Arg Tyr Arg Gly Asp 115 120 125 Ile Tyr Ala Trp Asp Val Val Asn Glu Ala Ile Ala Asp Ser Gly Ser 130 135 140 Asp Leu Leu Arg Ser Ser Pro Trp Leu Ala Ser Ile Gly Glu Asp Phe 145 150 155 160 Ile Ala Lys Ala Phe Glu Tyr Ala His Glu Ala Asp Pro Gln Ala Leu 165 170 175 Leu Phe Tyr Asn Asp Tyr Asn Glu Ser Val Pro Glu Lys Arg Glu Lys 180 185 190 Ile Tyr Thr Leu Leu Lys Ser Leu Lys Glu Gln Asp Val Pro Ile His 195 200 205 Gly Val Gly Leu Gln Ala His Trp Asn Leu Glu Phe Pro Ser Leu Asp 210 215 220 Asp Ile Arg Arg Ala Ile Glu Arg Tyr Ala Ser Leu Gly Met Ile Leu 225 230 235 240 His Ile Thr Glu Leu Asp Val Ser Val Phe Ala His Glu Asp Lys Arg 245 250 255 Thr Asp Leu Ala Ala Pro Thr Glu Glu Met Leu Glu Arg Gln Ala Glu 260 265 270 Arg Tyr Gly Gln Leu Phe Arg Leu Leu Lys Glu Tyr Ser Gly Ser Val 275 280 285 Thr Ser Val Thr Phe Trp Gly Ala Ala Asp Asp Tyr Thr Trp Leu Asp 290 295 300 His Phe Pro Val Arg Gly Arg Lys Asn Trp Pro Phe Val Phe Asp Glu 305 310 315 320 Asn His Leu Pro Lys Glu Ser Tyr Trp Asn Leu Leu Lys Glu Ala Asn 325 330 335 Pro Glu Arg Thr Phe Gln Glu Ile Arg Ser 340 345 <210> 63 <211> 1110 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 63 atgaaacgaa ttttaattgg tttggcggct cttaccgctt ccgggctgtc ggcgcagaaa 60 tccgacggta ctttaaaaaa agcatttcag gataaattct atatcgggac tgcgatgagt 120 cttcctcaga ttgatgggac agataaaaga gcggtagcca ttatcagaaa tcagttcagt 180 tctattgttg ctgaaaactg tatgaaatcg atgtttctgc aacctcagga aggaaagttc 240 ttctttgatg acgctgataa atttgttgat ttcgggatga aaaacaatat gttcgtcatc 300 ggacatacgc taatctggca ttcccagctt ccaaaatggt tttttacaga taaaaatgga 360 aaagatgttt ctccggaagt attgaaacag cgcatgaaaa accacattac aaccgtagtt 420 tcccgttaca aaggaaaagt aaaaggatgg gatgtggtga atgaagccat tcttgaagac 480 ggaacctata gaaaaagtaa attttacgaa attctgggtg aagattttat tcctttggcg 540 tttcagtatg cacaggaagc cgatcccaat gcagaattat attacaacga ttataatgaa 600 tggtatccgg aaaaggtaaa agcagtcatt acaatggttg aaaagcttaa atcaagagga 660 atccgtattg atggagtagg aatgcaggcc catgtcggaa tggatatccc ttccatcaat 720 gaatatgaaa aagcaattct ggcgtattcc aatgccggag ttaaagttaa tattacggag 780 ctggaaatta gtgcgctgcc ttctccgtgg ggaagctctg ccaatgtttc agataccgtt 840 gcctatcaga aagaaatgaa tccttacacc aaagggcttc ccaatgaagt agaagcgaaa 900 tgggaaaaac gttaccttga tttctttagc ttgtttttaa aacataaaga taaaataaga 960 agggtgacct tatggggagt tactgataag cagtcctgga aaaacgattt tccggtaaaa 1020 ggaagaacag attacccgtt gctgtttgac aggaaagatc aggagaaacc tgtagtacaa 1080 aaaataataa aattggcaga gaaaaattaa 1110 <210> 64 <211> 369 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(20) <400> 64 Met Lys Arg Ile Leu Ile Gly Leu Ala Ala Leu Thr Ala Ser Gly Leu 1 5 10 15 Ser Ala Gln Lys Ser Asp Gly Thr Leu Lys Lys Ala Phe Gln Asp Lys 20 25 30 Phe Tyr Ile Gly Thr Ala Met Ser Leu Pro Gln Ile Asp Gly Thr Asp 35 40 45 Lys Arg Ala Val Ala Ile Ile Arg Asn Gln Phe Ser Ser Ile Val Ala 50 55 60 Glu Asn Cys Met Lys Ser Met Phe Leu Gln Pro Gln Glu Gly Lys Phe 65 70 75 80 Phe Phe Asp Asp Ala Asp Lys Phe Val Asp Phe Gly Met Lys Asn Asn 85 90 95 Met Phe Val Ile Gly His Thr Leu Ile Trp His Ser Gln Leu Pro Lys 100 105 110 Trp Phe Phe Thr Asp Lys Asn Gly Lys Asp Val Ser Pro Glu Val Leu 115 120 125 Lys Gln Arg Met Lys Asn His Ile Thr Thr Val Val Ser Arg Tyr Lys 130 135 140 Gly Lys Val Lys Gly Trp Asp Val Val Asn Glu Ala Ile Leu Glu Asp 145 150 155 160 Gly Thr Tyr Arg Lys Ser Lys Phe Tyr Glu Ile Leu Gly Glu Asp Phe 165 170 175 Ile Pro Leu Ala Phe Gln Tyr Ala Gln Glu Ala Asp Pro Asn Ala Glu 180 185 190 Leu Tyr Tyr Asn Asp Tyr Asn Glu Trp Tyr Pro Glu Lys Val Lys Ala 195 200 205 Val Ile Thr Met Val Glu Lys Leu Lys Ser Arg Gly Ile Arg Ile Asp 210 215 220 Gly Val Gly Met Gln Ala His Val Gly Met Asp Ile Pro Ser Ile Asn 225 230 235 240 Glu Tyr Glu Lys Ala Ile Leu Ala Tyr Ser Asn Ala Gly Val Lys Val 245 250 255 Asn Ile Thr Glu Leu Glu Ile Ser Ala Leu Pro Ser Pro Trp Gly Ser 260 265 270 Ser Ala Asn Val Ser Asp Thr Val Ala Tyr Gln Lys Glu Met Asn Pro 275 280 285 Tyr Thr Lys Gly Leu Pro Asn Glu Val Glu Ala Lys Trp Glu Lys Arg 290 295 300 Tyr Leu Asp Phe Phe Ser Leu Phe Leu Lys His Lys Asp Lys Ile Arg 305 310 315 320 Arg Val Thr Leu Trp Gly Val Thr Asp Lys Gln Ser Trp Lys Asn Asp 325 330 335 Phe Pro Val Lys Gly Arg Thr Asp Tyr Pro Leu Leu Phe Asp Arg Lys 340 345 350 Asp Gln Glu Lys Pro Val Val Gln Lys Ile Ile Lys Leu Ala Glu Lys 355 360 365 Asn <210> 65 <211> 1557 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 65 atgaaaagaa tcggactgtt gctgctggct gtgatcatgc ttgtgggctg tgtatattcc 60 gcggcggcgg aggatacgct ggtttatgct tccacttttg tggccggaac ggacggatgg 120 tacgcccgcg gagcgcagaa agtataccgc acaaccgagg agacactgcg gacggaaggc 180 cggaccagcg actggcattc cccgggccgt gattttgacc tggtggaagg cggcgtctat 240 gtcctgagcg tggaagtgtt ccaggacgaa gcggacaacg ccagcttcat gatttccatc 300 gcccacagca aggacggtac ggaaacctat gaaaacctgg ctcgcggaac cgccaaacgc 360 ggcgagtggg tcaccctgac cggaacatat accgccggca attttgaccg gaacgtcctg 420 tatgtggaaa cgaccggatc gccggaactg agctatgaaa tccggaattt ccgggttgaa 480 gcgccgaacg gagttccgga gccgaaggct acggagcccc cgatggtgat tgaggcggtg 540 gagaacctcc cgggcctgaa gaacgcgtat gcgggaaaat ttgatttcgg cgcggcggtt 600 ccgggatacg ctttcggcga tccgggcctg aaacagctga tgactgagca gttcagcatc 660 ctgacgcccg aaaacgaact gaaaccggac gctgtgctgg acgtggcggc gagcaagcgg 720 ctggcccagg aggatgaaac ggcggtggcg gttcattttg acggcgccat tccgctgctg 780 aactttgccc gggacaacgg catcagggtg cacggacatg tgctgatctg gcacagccag 840 acgccggaag cgttcttcca tgagggctat gacacctcca agcccctggt cagccgggaa 900 gtgatgctgg gccggatgga aaactatatc cgcgaggtgc tgacctggac gaacgagaat 960 tatccgggcg tgatcgtatc ctgggacgtg gtgaacgaag ccattgatga cggaacgaac 1020 tggctgcgga attccaactg gtacaagacg gtgggcggcg actttgtgaa ccgggctttt 1080 gaatttgccc gcatgtacgc ggcggacggc gtcctcctgt attacaatga ttacaatacc 1140 gcctatccgg ccaaacggaa gggaatcatc aagctgctgg gccagctgat tgaggaaggc 1200 aatattgacg gatacggctt ccagatgcat cacagcaccg gcgagccttc catggagatg 1260 atcaccgctt cggtggagga aatcgccgcg ctgggaataa aactgcgggt cagcgagctg 1320 gatgtgggca tgggcagcag catgacggaa gaagccctga tgaaacagaa ggacaaatac 1380 aaggcggtca tggaactgat gctgcggttt gccgaccaga cggaagcggt gcaggtatgg 1440 ggactgacgg acaatatgag ctggcggacc ggccagaatc cgctgctgtt tgaccggaac 1500 cggaacccga agccggcctt cttcggcgtc ctggaagcgg cggaagaaag caaataa 1557 <210> 66 <211> 518 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(22) <400> 66 Met Lys Arg Ile Gly Leu Leu Leu Leu Ala Val Ile Met Leu Val Gly 1 5 10 15 Cys Val Tyr Ser Ala Ala Ala Glu Asp Thr Leu Val Tyr Ala Ser Thr 20 25 30 Phe Val Ala Gly Thr Asp Gly Trp Tyr Ala Arg Gly Ala Gln Lys Val 35 40 45 Tyr Arg Thr Thr Glu Glu Thr Leu Arg Thr Glu Gly Arg Thr Ser Asp 50 55 60 Trp His Ser Pro Gly Arg Asp Phe Asp Leu Val Glu Gly Gly Val Tyr 65 70 75 80 Val Leu Ser Val Glu Val Phe Gln Asp Glu Ala Asp Asn Ala Ser Phe 85 90 95 Met Ile Ser Ile Ala His Ser Lys Asp Gly Thr Glu Thr Tyr Glu Asn 100 105 110 Leu Ala Arg Gly Thr Ala Lys Arg Gly Glu Trp Val Thr Leu Thr Gly 115 120 125 Thr Tyr Thr Ala Gly Asn Phe Asp Arg Asn Val Leu Tyr Val Glu Thr 130 135 140 Thr Gly Ser Pro Glu Leu Ser Tyr Glu Ile Arg Asn Phe Arg Val Glu 145 150 155 160 Ala Pro Asn Gly Val Pro Glu Pro Lys Ala Thr Glu Pro Pro Met Val 165 170 175 Ile Glu Ala Val Glu Asn Leu Pro Gly Leu Lys Asn Ala Tyr Ala Gly 180 185 190 Lys Phe Asp Phe Gly Ala Ala Val Pro Gly Tyr Ala Phe Gly Asp Pro 195 200 205 Gly Leu Lys Gln Leu Met Thr Glu Gln Phe Ser Ile Leu Thr Pro Glu 210 215 220 Asn Glu Leu Lys Pro Asp Ala Val Leu Asp Val Ala Ala Ser Lys Arg 225 230 235 240 Leu Ala Gln Glu Asp Glu Thr Ala Val Ala Val His Phe Asp Gly Ala 245 250 255 Ile Pro Leu Leu Asn Phe Ala Arg Asp Asn Gly Ile Arg Val His Gly 260 265 270 His Val Leu Ile Trp His Ser Gln Thr Pro Glu Ala Phe Phe His Glu 275 280 285 Gly Tyr Asp Thr Ser Lys Pro Leu Val Ser Arg Glu Val Met Leu Gly 290 295 300 Arg Met Glu Asn Tyr Ile Arg Glu Val Leu Thr Trp Thr Asn Glu Asn 305 310 315 320 Tyr Pro Gly Val Ile Val Ser Trp Asp Val Val Asn Glu Ala Ile Asp 325 330 335 Asp Gly Thr Asn Trp Leu Arg Asn Ser Asn Trp Tyr Lys Thr Val Gly 340 345 350 Gly Asp Phe Val Asn Arg Ala Phe Glu Phe Ala Arg Met Tyr Ala Ala 355 360 365 Asp Gly Val Leu Leu Tyr Tyr Asn Asp Tyr Asn Thr Ala Tyr Pro Ala 370 375 380 Lys Arg Lys Gly Ile Ile Lys Leu Leu Gly Gln Leu Ile Glu Glu Gly 385 390 395 400 Asn Ile Asp Gly Tyr Gly Phe Gln Met His His Ser Thr Gly Glu Pro 405 410 415 Ser Met Glu Met Ile Thr Ala Ser Val Glu Glu Ile Ala Ala Leu Gly 420 425 430 Ile Lys Leu Arg Val Ser Glu Leu Asp Val Gly Met Gly Ser Ser Met 435 440 445 Thr Glu Glu Ala Leu Met Lys Gln Lys Asp Lys Tyr Lys Ala Val Met 450 455 460 Glu Leu Met Leu Arg Phe Ala Asp Gln Thr Glu Ala Val Gln Val Trp 465 470 475 480 Gly Leu Thr Asp Asn Met Ser Trp Arg Thr Gly Gln Asn Pro Leu Leu 485 490 495 Phe Asp Arg Asn Arg Asn Pro Lys Pro Ala Phe Phe Gly Val Leu Glu 500 505 510 Ala Ala Glu Glu Ser Lys 515 <210> 67 <211> 1224 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 67 atgcggaacg tcgtgcgtaa accattgaca atcggactcg ctttaacact attattgccc 60 atgggaatga cggcaacatc agcgaagaat gcagattcct atgcgaaaaa acctcacatc 120 agcgcattga atgccccaca attggatcaa cgctacaaaa acgagttcac gattggtgcg 180 gcagtagaac cttatcaact acaaaatgaa aaagacgtac aaatgctaaa gcgccacttc 240 aacagcattg ttgccgagaa cgtaatgaaa ccgatcagca ttcaacctga ggaaggaaaa 300 ttcaattttg aacaagcgga tcgaattgtg aagttcgcta aggcaaatgg catggatatt 360 cgcttccata cactcgtttg gcacagccaa gtacctcaat ggttctttct tgacaaggaa 420 ggcaagccaa tggttaatga aacagatcca gtgaaacgtg aacaaaataa acaactgctg 480 ttaaaacgac ttgaaactca tattaaaacg atcgtcgagc ggtacaaaga tgacattaag 540 tactgggacg ttgtaaatga ggttgtgggg gacgacggaa aactgcgcaa ctctccatgg 600 tatcaaatcg ccggcatcga ttatattaaa gtggcattcc aaacagcgag aaaatatggc 660 ggcaacaaga ttaaacttta tatcaatgat tacaataccg aagtggaacc aaagcgaagc 720 gctctttata acttggtgaa gcaattaaaa gaagagggcg ttcctattga cggcatcggc 780 catcaatccc acattcaaat cggctggcct tctgaagcag aaatcgagaa aacgattaac 840 atgttcgccg ctctcggctt agacaaccaa atcactgagc ttgatgtgag catgtacggt 900 tggccgccgc gcgcttaccc gacgtatgac gccattccaa aacaaaagtt tttggatcag 960 gcagcgcgct atgatcgttt gttcaaactg tatgaaaagt tgagcgataa aattagcaac 1020 gtcaccttct ggggcatcgc cgacaatcat acgtggctcg acagccgtgc ggatgtgtac 1080 tatgacgcca acgggaatgt tgtggttgac ccgaacgctc cgtacgcaaa agtggaaaaa 1140 gggaaaggaa aagatgcgcc gttcgttttt ggaccggatt acaaagtcaa acccgcatat 1200 tgggctatta tcgaccacaa atag 1224 <210> 68 <211> 407 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(28) <400> 68 Met Arg Asn Val Val Arg Lys Pro Leu Thr Ile Gly Leu Ala Leu Thr 1 5 10 15 Leu Leu Leu Pro Met Gly Met Thr Ala Thr Ser Ala Lys Asn Ala Asp 20 25 30 Ser Tyr Ala Lys Lys Pro His Ile Ser Ala Leu Asn Ala Pro Gln Leu 35 40 45 Asp Gln Arg Tyr Lys Asn Glu Phe Thr Ile Gly Ala Ala Val Glu Pro 50 55 60 Tyr Gln Leu Gln Asn Glu Lys Asp Val Gln Met Leu Lys Arg His Phe 65 70 75 80 Asn Ser Ile Val Ala Glu Asn Val Met Lys Pro Ile Ser Ile Gln Pro 85 90 95 Glu Glu Gly Lys Phe Asn Phe Glu Gln Ala Asp Arg Ile Val Lys Phe 100 105 110 Ala Lys Ala Asn Gly Met Asp Ile Arg Phe His Thr Leu Val Trp His 115 120 125 Ser Gln Val Pro Gln Trp Phe Phe Leu Asp Lys Glu Gly Lys Pro Met 130 135 140 Val Asn Glu Thr Asp Pro Val Lys Arg Glu Gln Asn Lys Gln Leu Leu 145 150 155 160 Leu Lys Arg Leu Glu Thr His Ile Lys Thr Ile Val Glu Arg Tyr Lys 165 170 175 Asp Asp Ile Lys Tyr Trp Asp Val Val Asn Glu Val Val Gly Asp Asp 180 185 190 Gly Lys Leu Arg Asn Ser Pro Trp Tyr Gln Ile Ala Gly Ile Asp Tyr 195 200 205 Ile Lys Val Ala Phe Gln Thr Ala Arg Lys Tyr Gly Gly Asn Lys Ile 210 215 220 Lys Leu Tyr Ile Asn Asp Tyr Asn Thr Glu Val Glu Pro Lys Arg Ser 225 230 235 240 Ala Leu Tyr Asn Leu Val Lys Gln Leu Lys Glu Glu Gly Val Pro Ile 245 250 255 Asp Gly Ile Gly His Gln Ser His Ile Gln Ile Gly Trp Pro Ser Glu 260 265 270 Ala Glu Ile Glu Lys Thr Ile Asn Met Phe Ala Ala Leu Gly Leu Asp 275 280 285 Asn Gln Ile Thr Glu Leu Asp Val Ser Met Tyr Gly Trp Pro Pro Arg 290 295 300 Ala Tyr Pro Thr Tyr Asp Ala Ile Pro Lys Gln Lys Phe Leu Asp Gln 305 310 315 320 Ala Ala Arg Tyr Asp Arg Leu Phe Lys Leu Tyr Glu Lys Leu Ser Asp 325 330 335 Lys Ile Ser Asn Val Thr Phe Trp Gly Ile Ala Asp Asn His Thr Trp 340 345 350 Leu Asp Ser Arg Ala Asp Val Tyr Tyr Asp Ala Asn Gly Asn Val Val 355 360 365 Val Asp Pro Asn Ala Pro Tyr Ala Lys Val Glu Lys Gly Lys Gly Lys 370 375 380 Asp Ala Pro Phe Val Phe Gly Pro Asp Tyr Lys Val Lys Pro Ala Tyr 385 390 395 400 Trp Ala Ile Ile Asp His Lys 405 <210> 69 <211> 1596 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 69 atggcgatgc atagatttaa gcaattaggg gccatcctac ttgtcctatg gttttgtgca 60 ttgccagtgc aggcgcaggc ttggcgtgcg gccgcagagc agcgtattga acagtaccgt 120 aaggggccac tgcgggttca ggtgaaggat cctgaaggac ggcccgtacc gaatgcccaa 180 gtgcacgttc gcatgacgcg tcacgctttt ggatttggta cggctgtcag ctttggcctg 240 gtcgtggggt cgggatacaa ccccacctat cgggccaagc tagaagacct gacgggcgac 300 ggccgcacat tcaacatggc tacgccagag aatgaattga agtggcctgc gtgggagtcg 360 gaatggccca tttcgaatcg tcgaaagatc gacgtcatca actggctgcg cgcaaaaggc 420 tacagcattc gaggacacaa cctgctatgg cctgactggc aatggatgcc ccgtgatatt 480 gagcaaaacc gcaacaatcc acagtacatc tacgatcgcg ttcgcaatca cattgcggcg 540 ttggctgggc atcgggacat tcggggcaaa ctgcgggact gggatgttct taacgaacca 600 gcccacctga ccgcattgcg cgatgtgttt aacggttggg gctcatatga gcgtggggaa 660 gacttctatg tggatgtctt taggtgggcc aaggcagcag actcgaccgc ccgtctatac 720 atcaacgagt acaacattat caacaactac gccaacgagc agcctacgcg caactattac 780 aagtggatca ttgcacgcct aatctcaaaa ggagcgccta tcgaagggat cggcattcag 840 gggcatattt cggcaccact gccaagcatg agtgaggtca aggcagccct agacgaaatg 900 gcagtttttg gattgccttt ggccatcaca gaatacgacg ttaccggcgt ttcggaagaa 960 gtcgaagcca actttatgcg ggactttttg accatggtct ttagtcatcc cgctgtggag 1020 agcttcgtca tgtggggttt ctggagcgga gcacactggc gtgacaatgc gccgctgttt 1080 cgggccgact ggagtctcaa gccttcggga caggtgttcc ttgatctggt ctttcggcgc 1140 tggtggaccg atactacggg ggtaaccggt ccagatggca gctggtctgt acgcggattt 1200 ttaggggatt acgttgtgga agtgcaggtg ggggaggttt cagtgaccaa gtccctgcgc 1260 ctcgaaagcc cgcaggatac aaccacgcta gaggtggtgg tcagtagcgt taaggtgggt 1320 gaaaagccta cagaagacgt gttgcgcgtg caagggtttg gaccagaccc ctttgtcgaa 1380 ggaacggcgc tgcgctactg gttagggcgg ccggccgatg ttgaactggc agtgtatgat 1440 gtgctgggcc gacaggtcta cgccgtgcaa aagcatcgcg tagctggttg gcatactgaa 1500 tgggtcgagg cttcccactg gcctgcagga ctttatctgt accgactcca agcaggtgat 1560 ctgttgcaca cgggtagaat ggtcaagatc caataa 1596 <210> 70 <211> 531 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(25) <400> 70 Met Ala Met His Arg Phe Lys Gln Leu Gly Ala Ile Leu Leu Val Leu 1 5 10 15 Trp Phe Cys Ala Leu Pro Val Gln Ala Gln Ala Trp Arg Ala Ala Ala 20 25 30 Glu Gln Arg Ile Glu Gln Tyr Arg Lys Gly Pro Leu Arg Val Gln Val 35 40 45 Lys Asp Pro Glu Gly Arg Pro Val Pro Asn Ala Gln Val His Val Arg 50 55 60 Met Thr Arg His Ala Phe Gly Phe Gly Thr Ala Val Ser Phe Gly Leu 65 70 75 80 Val Val Gly Ser Gly Tyr Asn Pro Thr Tyr Arg Ala Lys Leu Glu Asp 85 90 95 Leu Thr Gly Asp Gly Arg Thr Phe Asn Met Ala Thr Pro Glu Asn Glu 100 105 110 Leu Lys Trp Pro Ala Trp Glu Ser Glu Trp Pro Ile Ser Asn Arg Arg 115 120 125 Lys Ile Asp Val Ile Asn Trp Leu Arg Ala Lys Gly Tyr Ser Ile Arg 130 135 140 Gly His Asn Leu Leu Trp Pro Asp Trp Gln Trp Met Pro Arg Asp Ile 145 150 155 160 Glu Gln Asn Arg Asn Asn Pro Gln Tyr Ile Tyr Asp Arg Val Arg Asn 165 170 175 His Ile Ala Ala Leu Ala Gly His Arg Asp Ile Arg Gly Lys Leu Arg 180 185 190 Asp Trp Asp Val Leu Asn Glu Pro Ala His Leu Thr Ala Leu Arg Asp 195 200 205 Val Phe Asn Gly Trp Gly Ser Tyr Glu Arg Gly Glu Asp Phe Tyr Val 210 215 220 Asp Val Phe Arg Trp Ala Lys Ala Ala Asp Ser Thr Ala Arg Leu Tyr 225 230 235 240 Ile Asn Glu Tyr Asn Ile Ile Asn Asn Tyr Ala Asn Glu Gln Pro Thr 245 250 255 Arg Asn Tyr Tyr Lys Trp Ile Ile Ala Arg Leu Ile Ser Lys Gly Ala 260 265 270 Pro Ile Glu Gly Ile Gly Ile Gln Gly His Ile Ser Ala Pro Leu Pro 275 280 285 Ser Met Ser Glu Val Lys Ala Ala Leu Asp Glu Met Ala Val Phe Gly 290 295 300 Leu Pro Leu Ala Ile Thr Glu Tyr Asp Val Thr Gly Val Ser Glu Glu 305 310 315 320 Val Glu Ala Asn Phe Met Arg Asp Phe Leu Thr Met Val Phe Ser His 325 330 335 Pro Ala Val Glu Ser Phe Val Met Trp Gly Phe Trp Ser Gly Ala His 340 345 350 Trp Arg Asp Asn Ala Pro Leu Phe Arg Ala Asp Trp Ser Leu Lys Pro 355 360 365 Ser Gly Gln Val Phe Leu Asp Leu Val Phe Arg Arg Trp Trp Thr Asp 370 375 380 Thr Thr Gly Val Thr Gly Pro Asp Gly Ser Trp Ser Val Arg Gly Phe 385 390 395 400 Leu Gly Asp Tyr Val Val Glu Val Gln Val Gly Glu Val Ser Val Thr 405 410 415 Lys Ser Leu Arg Leu Glu Ser Pro Gln Asp Thr Thr Thr Leu Glu Val 420 425 430 Val Val Ser Ser Val Lys Val Gly Glu Lys Pro Thr Glu Asp Val Leu 435 440 445 Arg Val Gln Gly Phe Gly Pro Asp Pro Phe Val Glu Gly Thr Ala Leu 450 455 460 Arg Tyr Trp Leu Gly Arg Pro Ala Asp Val Glu Leu Ala Val Tyr Asp 465 470 475 480 Val Leu Gly Arg Gln Val Tyr Ala Val Gln Lys His Arg Val Ala Gly 485 490 495 Trp His Thr Glu Trp Val Glu Ala Ser His Trp Pro Ala Gly Leu Tyr 500 505 510 Leu Tyr Arg Leu Gln Ala Gly Asp Leu Leu His Thr Gly Arg Met Val 515 520 525 Lys Ile Gln 530 <210> 71 <211> 1269 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 71 atgatttcca tcgcccattc agtgaacggg gcggagacct atgagaacct ggcgcacgga 60 actgccaaaa aaggcgaatg gactacgctg aaggggacat acaccgccgg cgcctatcag 120 cgcaacgtgc tctatgtgga aacggtttct gaaggcaccc ttgactttga gatccgtaat 180 tttgtcctga cggctccgaa cggactaccg gagcccaagc cgaccgagcc tccgatggtc 240 atcgaggaag ccgagaacgt gcccagtctc aaagagattt atgcagacaa attcgatttc 300 ggctccgccg cgccccagat ggtattccgt gaccccaaat ggctcaacct gatgaaggaa 360 cagttcagca ttctgacgcc ggaaaacgaa atgaaaccgg attccgttct ggatgtgggc 420 gcgagcaaag cgctggtgaa ggaaaccggt gatgagaccg ccgtcgccgt tcatttcgac 480 gctgccaaag cgctgctgaa ttttgccaag agcaacggga tcaaggttca cggccatgtg 540 ctgatctggc acagccagac gccggaagct ttcttccatc agggatatga ttccaagaag 600 cctttcgtta cacgggaagt gatgctgggc cgaatggaaa attacattaa gggtgttttt 660 gaatacctgg atgaaaatta tcccggcgtc gttgtctcct gggacgtgct gaatgaggcg 720 attgacgacg gaagcaactg gctgcggaac agcaactgga gaaagattgt cggcgaagac 780 tatccgaacc gggcatatga atatgcgcgc aaatatgcgc cggaaggtac gctgctgtat 840 tacaacgatt acaatacgtc gattcccggg aaactgaacg gcattgtgaa actgctgaac 900 agtctgattc cggaaggaaa tatcgacggt tacggcttcc agatgcacca tggcgtcggc 960 ttcccgtcca ttgatatgat ccagactgca gtggaacgga ttgccgcgct gaatatccgc 1020 cttcgcgtca gcgaactgga tgtcacggtg gacaacaaca cggaagcgtc cttcaacaaa 1080 caggcaaagt attatgccga agtcatgaag attctgattg ctcacagcga ccagtttgag 1140 gctgtgcagg tctgggggct gacagacctg atgagctggc gcggcagtca gttcccgctg 1200 ctgtttgacg gggcaggcaa tccgaaaccg gcgttctggg ccgtcgcgga tccggattcc 1260 gtgaaataa 1269 <210> 72 <211> 422 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 72 Met Ile Ser Ile Ala His Ser Val Asn Gly Ala Glu Thr Tyr Glu Asn 1 5 10 15 Leu Ala His Gly Thr Ala Lys Lys Gly Glu Trp Thr Thr Leu Lys Gly 20 25 30 Thr Tyr Thr Ala Gly Ala Tyr Gln Arg Asn Val Leu Tyr Val Glu Thr 35 40 45 Val Ser Glu Gly Thr Leu Asp Phe Glu Ile Arg Asn Phe Val Leu Thr 50 55 60 Ala Pro Asn Gly Leu Pro Glu Pro Lys Pro Thr Glu Pro Pro Met Val 65 70 75 80 Ile Glu Glu Ala Glu Asn Val Pro Ser Leu Lys Glu Ile Tyr Ala Asp 85 90 95 Lys Phe Asp Phe Gly Ser Ala Ala Pro Gln Met Val Phe Arg Asp Pro 100 105 110 Lys Trp Leu Asn Leu Met Lys Glu Gln Phe Ser Ile Leu Thr Pro Glu 115 120 125 Asn Glu Met Lys Pro Asp Ser Val Leu Asp Val Gly Ala Ser Lys Ala 130 135 140 Leu Val Lys Glu Thr Gly Asp Glu Thr Ala Val Ala Val His Phe Asp 145 150 155 160 Ala Ala Lys Ala Leu Leu Asn Phe Ala Lys Ser Asn Gly Ile Lys Val 165 170 175 His Gly His Val Leu Ile Trp His Ser Gln Thr Pro Glu Ala Phe Phe 180 185 190 His Gln Gly Tyr Asp Ser Lys Lys Pro Phe Val Thr Arg Glu Val Met 195 200 205 Leu Gly Arg Met Glu Asn Tyr Ile Lys Gly Val Phe Glu Tyr Leu Asp 210 215 220 Glu Asn Tyr Pro Gly Val Val Val Ser Trp Asp Val Leu Asn Glu Ala 225 230 235 240 Ile Asp Asp Gly Ser Asn Trp Leu Arg Asn Ser Asn Trp Arg Lys Ile 245 250 255 Val Gly Glu Asp Tyr Pro Asn Arg Ala Tyr Glu Tyr Ala Arg Lys Tyr 260 265 270 Ala Pro Glu Gly Thr Leu Leu Tyr Tyr Asn Asp Tyr Asn Thr Ser Ile 275 280 285 Pro Gly Lys Leu Asn Gly Ile Val Lys Leu Leu Asn Ser Leu Ile Pro 290 295 300 Glu Gly Asn Ile Asp Gly Tyr Gly Phe Gln Met His His Gly Val Gly 305 310 315 320 Phe Pro Ser Ile Asp Met Ile Gln Thr Ala Val Glu Arg Ile Ala Ala 325 330 335 Leu Asn Ile Arg Leu Arg Val Ser Glu Leu Asp Val Thr Val Asp Asn 340 345 350 Asn Thr Glu Ala Ser Phe Asn Lys Gln Ala Lys Tyr Tyr Ala Glu Val 355 360 365 Met Lys Ile Leu Ile Ala His Ser Asp Gln Phe Glu Ala Val Gln Val 370 375 380 Trp Gly Leu Thr Asp Leu Met Ser Trp Arg Gly Ser Gln Phe Pro Leu 385 390 395 400 Leu Phe Asp Gly Ala Gly Asn Pro Lys Pro Ala Phe Trp Ala Val Ala 405 410 415 Asp Pro Asp Ser Val Lys 420 <210> 73 <211> 4455 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 73 atgcagaaaa tgagaagaaa attgaaaaga attatgttat tacttctggc agctatgttg 60 ataatcccgt caggctggat tacacaggct tcagcagcgg aaacaaacaa agatatacct 120 gttctactgt accatcgaat tgttgataat cctactaatc aatggacgga taccagcgtt 180 gaaacgttta aacagactat gcaatatcta aatgatagcg gttacaacac cttgtcagcc 240 gaacaatatg taaagatcat ggatggaacg gcaacggcgc ctgaaaaacc gattctatta 300 acgtttgacg atggtactcc agaatttatc accaatgctc ttccagtatt aaagcaatat 360 aacatgaaag ctgttctgtt tattgtcagt gactggatag gcggcggctt cagcatgtca 420 aaagaacagc tgcaaagttt ggctaatgaa ccatctttaa gcctcgaaaa tcatacgaaa 480 acccatgacg gtactatttg gggaacaaat ggcggtgtac gtagtacgat aacgaaagaa 540 caagctgagg accaaattat atcagcgaat acttatctta aaagtattac aggtaaagac 600 ccagtcctaa tggcataccc ttatggcagc tataatgata ttgcaaaact agtaaaccaa 660 gaaaatggta ttaagtacgc atttaaagtg ggatacccta atgaagataa ttatgctatg 720 ggccgtcact atgtaacaaa tcaaagtgtg gctcaaattg cccaaatgat tggcggccct 780 gtgccagaac caactccaga accaggaaac cagacagaaa ccgtctatca agaaaccttt 840 gccagtgata ttggtgtagc agttcaagcg ggtaacccac aagtaaccca cgtttctggt 900 atggtttttg caggcaatga cgatggaaaa gccatctctg ttagcggcag gacgaacaac 960 tgggacggcg tcgatatccc attcaacaat gtcggtatgg aaaacggcaa aacttatacg 1020 attacagtta ctggttatgt tgacgaaaat gcaactgttc cttctggcgc acaagcttta 1080 ctgcagaatg tagacagcta taacggtttg tatgttgccg cagattatgc agcgggacag 1140 gcttttactt taacgggtca gtataccgtg gatactagta aagatagagc cctacgtatc 1200 caatcaaatg atgctgggaa aactgttccg ttttacattg gaaacatctt gattacaacg 1260 aaaaaaacga ctgcgcctga aacagataga gtggtatttc acgaaacatt tggaaatggt 1320 gttggtgttg ctacacaagc gggaagtgcg aaattgactc ctgtttctga gcttgttttt 1380 gaaggcaata gcgatggaaa agcaatttct gttaatggca gatccaataa ctgggacgga 1440 gttgatatac cgttcagcag tgtcagcatg cagaacggca aagcctatac cattacagtc 1500 actggttttg tttatagcag tgtgagtgtt cctgaaggtg cacaagcttt gcttcagaat 1560 gtagacagct ataatggctt gtatgcagca gcagatgtta aggcaggtca aacatttact 1620 ctaacgggtc aatataccgt tgatacgagc aaagatagag cactacgaat tcaatcaaat 1680 gatgcaggga aaaccgttcc cttctatatc ggagatattc tcattaccga gaaggcagcc 1740 tctggtggtg gcggggacga tggaagacta cctgccgaac catttacagc aattaatttt 1800 gaagaccaaa atatgggtgg tttcgaggga agagctggta ccgaaacact aacagtaacc 1860 aatgaagcca atcatactga tggcggttcc tatgctttga aggttgaagg cagatcacaa 1920 gcttggcatg gaccagcatt acacgtagag aaatatgttg acaaggattc ggaatataaa 1980 atttctgcct gggtgaagct gatttcacca gcaacttcac agcttcagct ttctacacag 2040 gtcggcaatg gcggaactgc tagttacaat aatcttcaag gaaaaactat cagcactgaa 2100 gatggctggg ttaaacttga gggaacgtac cgttatagca gtgtaggcga tgagttttta 2160 accatttatg tagagagctc gaataatagc acagcctcct tttatatcga tgatattact 2220 tttgaatcga ctggttcggg tccgattgaa gttgaggatt tgacaccgat aaaagatgtt 2280 tatcaagacg atttcttaat tggaaacgct gtctcagctt ctgatcttga aggcaataga 2340 cttaagcttc tcaacatgca tcacaatgtt gtcacagcag agaatgcaat gaagccagat 2400 caagcgtata atgcggaaaa acaatttgac tttactgatg aaaatgcgct tgtcgacaag 2460 gttttggatc agggattgca gctgcatggt cacgtgcttg tatggcacca gcagacgcca 2520 gaatggttat ttacagctga aaacggtgcc cctttgagcc gtgaggcagc actagcaaat 2580 ttaaggaccc atgttaaaac agtcgtagaa aattacggta acaaggtaat ttcatgggac 2640 gtggtaaacg aagcaatcat cgataacccg ccgaacccaa cggattggaa ggcatcactt 2700 cgtaaatctg gctggtacaa atcgattgga ccagacttcg tagaacaatc cttccttgct 2760 gcaaaagagg tactgaatga aaaaggcttg aatatcaagc tatattacaa tgattacaat 2820 gatgataatc agagcaaagc cgaggccatt tatcagatgg tgaaagatat caatgaaaag 2880 tatgctaaag aacatgatgg ggatcttctc attgacggaa ttggaatgca agcgcactac 2940 aataaaaaca ctaatcctga aaatgttaaa ctctccctag agaagtttat tacattgggt 3000 gtagaagtca gtgtgactga acttgacatt accgctggaa ccaataatgt acttactgag 3060 aaggaagcaa ttgcacaggg ttatttatac gcacaattgt tcaagattta caaagaacac 3120 gcagagcata tctcacgggt aactttctgg ggactaaatg atgcaacgag ctggagagct 3180 gcacagagtc cattgttgtt tgataaagat ttgcaagcaa aaccagctta ctatgctgtt 3240 atcgatccag acacatttac tgtagaaaat caacctgagg taagagaggc taatcaagga 3300 agtgctgttt ccggcacacc agtgattgat ggaactgtag atggtgtttg gagcaatgca 3360 acggaactgc cgattaatcg cttccaaatg gcttggcagg gagcaaacgg ggtatccaag 3420 gtcctctggg ataatgaaaa cctgtatgtt ttaattcaag taagtgactc acagctcgac 3480 aaatcgagtc caaatccatg ggaacaggat tccattgaag tctttgtaga tgagaataat 3540 gcaaagacat cttccttcga agatggtgat ggacaatatc gagtaaactt tgacaatgaa 3600 acatccttta accctgtcag agttggagaa ggtttcgaat ctgcaaccaa agcatcaggt 3660 aatggctata ccgttgaagt aaagattccg ttcaaaacca ttacaccaga taacaatacg 3720 aaaatcggtt ttgatgttca gattaatgac ggtaaagatg gtgctcgtca aagtgctgca 3780 acatggaacg atttaactgg tctgggatat caggacactt ctgtgttcgg cgtcctgaca 3840 cttatgaaga ctgacaccac cgcgcctgtt acaaccgata acggaccaga agattgggtt 3900 aataaagatg taacgattgc tttcagtgca aatgataatg acactggtgt ggcggcaacc 3960 tattatagta ttgataatgg ggtcgtacaa aacggtaatt cagttactat ttcggaagag 4020 ggtgtccaca ttctaacata ttggagtgta gacaaagctg gtaatgtcga gcaggttcat 4080 acaaaaacaa ttaaactaga taagaccgga ccaatattag atattaaact cgacaaaaca 4140 acattatcac cagttaatca taagatggtc ccaatatcgg cggctattag tgcatctgat 4200 gccgattcag gaattcattc agtagtgtta acatcaatta ctagcaatga atctatccaa 4260 cctgatgata ttcagaatgc caactataat aaacctatta caggtactac ggattccttt 4320 aaacttcgtg cagaaagatt agcaaacggt aatggccgtg tttacaccat tacttatacg 4380 gccacagata aagctggtaa tgtgacaaca aaaagtgttg aagtttccgt tccacgcgac 4440 aattctaaaa aataa 4455 <210> 74 <211> 1484 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(21) <400> 74 Met Gln Lys Met Arg Arg Lys Leu Lys Arg Ile Met Leu Leu Leu Leu 1 5 10 15 Ala Ala Met Leu Ile Ile Pro Ser Gly Trp Ile Thr Gln Ala Ser Ala 20 25 30 Ala Glu Thr Asn Lys Asp Ile Pro Val Leu Leu Tyr His Arg Ile Val 35 40 45 Asp Asn Pro Thr Asn Gln Trp Thr Asp Thr Ser Val Glu Thr Phe Lys 50 55 60 Gln Thr Met Gln Tyr Leu Asn Asp Ser Gly Tyr Asn Thr Leu Ser Ala 65 70 75 80 Glu Gln Tyr Val Lys Ile Met Asp Gly Thr Ala Thr Ala Pro Glu Lys 85 90 95 Pro Ile Leu Leu Thr Phe Asp Asp Gly Thr Pro Glu Phe Ile Thr Asn 100 105 110 Ala Leu Pro Val Leu Lys Gln Tyr Asn Met Lys Ala Val Leu Phe Ile 115 120 125 Val Ser Asp Trp Ile Gly Gly Gly Phe Ser Met Ser Lys Glu Gln Leu 130 135 140 Gln Ser Leu Ala Asn Glu Pro Ser Leu Ser Leu Glu Asn His Thr Lys 145 150 155 160 Thr His Asp Gly Thr Ile Trp Gly Thr Asn Gly Gly Val Arg Ser Thr 165 170 175 Ile Thr Lys Glu Gln Ala Glu Asp Gln Ile Ile Ser Ala Asn Thr Tyr 180 185 190 Leu Lys Ser Ile Thr Gly Lys Asp Pro Val Leu Met Ala Tyr Pro Tyr 195 200 205 Gly Ser Tyr Asn Asp Ile Ala Lys Leu Val Asn Gln Glu Asn Gly Ile 210 215 220 Lys Tyr Ala Phe Lys Val Gly Tyr Pro Asn Glu Asp Asn Tyr Ala Met 225 230 235 240 Gly Arg His Tyr Val Thr Asn Gln Ser Val Ala Gln Ile Ala Gln Met 245 250 255 Ile Gly Gly Pro Val Pro Glu Pro Thr Pro Glu Pro Gly Asn Gln Thr 260 265 270 Glu Thr Val Tyr Gln Glu Thr Phe Ala Ser Asp Ile Gly Val Ala Val 275 280 285 Gln Ala Gly Asn Pro Gln Val Thr His Val Ser Gly Met Val Phe Ala 290 295 300 Gly Asn Asp Asp Gly Lys Ala Ile Ser Val Ser Gly Arg Thr Asn Asn 305 310 315 320 Trp Asp Gly Val Asp Ile Pro Phe Asn Asn Val Gly Met Glu Asn Gly 325 330 335 Lys Thr Tyr Thr Ile Thr Val Thr Gly Tyr Val Asp Glu Asn Ala Thr 340 345 350 Val Pro Ser Gly Ala Gln Ala Leu Leu Gln Asn Val Asp Ser Tyr Asn 355 360 365 Gly Leu Tyr Val Ala Ala Asp Tyr Ala Ala Gly Gln Ala Phe Thr Leu 370 375 380 Thr Gly Gln Tyr Thr Val Asp Thr Ser Lys Asp Arg Ala Leu Arg Ile 385 390 395 400 Gln Ser Asn Asp Ala Gly Lys Thr Val Pro Phe Tyr Ile Gly Asn Ile 405 410 415 Leu Ile Thr Thr Lys Lys Thr Thr Ala Pro Glu Thr Asp Arg Val Val 420 425 430 Phe His Glu Thr Phe Gly Asn Gly Val Gly Val Ala Thr Gln Ala Gly 435 440 445 Ser Ala Lys Leu Thr Pro Val Ser Glu Leu Val Phe Glu Gly Asn Ser 450 455 460 Asp Gly Lys Ala Ile Ser Val Asn Gly Arg Ser Asn Asn Trp Asp Gly 465 470 475 480 Val Asp Ile Pro Phe Ser Ser Val Ser Met Gln Asn Gly Lys Ala Tyr 485 490 495 Thr Ile Thr Val Thr Gly Phe Val Tyr Ser Ser Val Ser Val Pro Glu 500 505 510 Gly Ala Gln Ala Leu Leu Gln Asn Val Asp Ser Tyr Asn Gly Leu Tyr 515 520 525 Ala Ala Ala Asp Val Lys Ala Gly Gln Thr Phe Thr Leu Thr Gly Gln 530 535 540 Tyr Thr Val Asp Thr Ser Lys Asp Arg Ala Leu Arg Ile Gln Ser Asn 545 550 555 560 Asp Ala Gly Lys Thr Val Pro Phe Tyr Ile Gly Asp Ile Leu Ile Thr 565 570 575 Glu Lys Ala Ala Ser Gly Gly Gly Gly Asp Asp Gly Arg Leu Pro Ala 580 585 590 Glu Pro Phe Thr Ala Ile Asn Phe Glu Asp Gln Asn Met Gly Gly Phe 595 600 605 Glu Gly Arg Ala Gly Thr Glu Thr Leu Thr Val Thr Asn Glu Ala Asn 610 615 620 His Thr Asp Gly Gly Ser Tyr Ala Leu Lys Val Glu Gly Arg Ser Gln 625 630 635 640 Ala Trp His Gly Pro Ala Leu His Val Glu Lys Tyr Val Asp Lys Asp 645 650 655 Ser Glu Tyr Lys Ile Ser Ala Trp Val Lys Leu Ile Ser Pro Ala Thr 660 665 670 Ser Gln Leu Gln Leu Ser Thr Gln Val Gly Asn Gly Gly Thr Ala Ser 675 680 685 Tyr Asn Asn Leu Gln Gly Lys Thr Ile Ser Thr Glu Asp Gly Trp Val 690 695 700 Lys Leu Glu Gly Thr Tyr Arg Tyr Ser Ser Val Gly Asp Glu Phe Leu 705 710 715 720 Thr Ile Tyr Val Glu Ser Ser Asn Asn Ser Thr Ala Ser Phe Tyr Ile 725 730 735 Asp Asp Ile Thr Phe Glu Ser Thr Gly Ser Gly Pro Ile Glu Val Glu 740 745 750 Asp Leu Thr Pro Ile Lys Asp Val Tyr Gln Asp Asp Phe Leu Ile Gly 755 760 765 Asn Ala Val Ser Ala Ser Asp Leu Glu Gly Asn Arg Leu Lys Leu Leu 770 775 780 Asn Met His His Asn Val Val Thr Ala Glu Asn Ala Met Lys Pro Asp 785 790 795 800 Gln Ala Tyr Asn Ala Glu Lys Gln Phe Asp Phe Thr Asp Glu Asn Ala 805 810 815 Leu Val Asp Lys Val Leu Asp Gln Gly Leu Gln Leu His Gly His Val 820 825 830 Leu Val Trp His Gln Gln Thr Pro Glu Trp Leu Phe Thr Ala Glu Asn 835 840 845 Gly Ala Pro Leu Ser Arg Glu Ala Ala Leu Ala Asn Leu Arg Thr His 850 855 860 Val Lys Thr Val Val Glu Asn Tyr Gly Asn Lys Val Ile Ser Trp Asp 865 870 875 880 Val Val Asn Glu Ala Ile Ile Asp Asn Pro Pro Asn Pro Thr Asp Trp 885 890 895 Lys Ala Ser Leu Arg Lys Ser Gly Trp Tyr Lys Ser Ile Gly Pro Asp 900 905 910 Phe Val Glu Gln Ser Phe Leu Ala Ala Lys Glu Val Leu Asn Glu Lys 915 920 925 Gly Leu Asn Ile Lys Leu Tyr Tyr Asn Asp Tyr Asn Asp Asp Asn Gln 930 935 940 Ser Lys Ala Glu Ala Ile Tyr Gln Met Val Lys Asp Ile Asn Glu Lys 945 950 955 960 Tyr Ala Lys Glu His Asp Gly Asp Leu Leu Ile Asp Gly Ile Gly Met 965 970 975 Gln Ala His Tyr Asn Lys Asn Thr Asn Pro Glu Asn Val Lys Leu Ser 980 985 990 Leu Glu Lys Phe Ile Thr Leu Gly Val Glu Val Ser Val Thr Glu Leu 995 1000 1005 Asp Ile Thr Ala Gly Thr Asn Asn Val Leu Thr Glu Lys Glu Ala Ile 1010 1015 1020 Ala Gln Gly Tyr Leu Tyr Ala Gln Leu Phe Lys Ile Tyr Lys Glu His 1025 1030 1035 1040 Ala Glu His Ile Ser Arg Val Thr Phe Trp Gly Leu Asn Asp Ala Thr 1045 1050 1055 Ser Trp Arg Ala Ala Gln Ser Pro Leu Leu Phe Asp Lys Asp Leu Gln 1060 1065 1070 Ala Lys Pro Ala Tyr Tyr Ala Val Ile Asp Pro Asp Thr Phe Thr Val 1075 1080 1085 Glu Asn Gln Pro Glu Val Arg Glu Ala Asn Gln Gly Ser Ala Val Ser 1090 1095 1100 Gly Thr Pro Val Ile Asp Gly Thr Val Asp Gly Val Trp Ser Asn Ala 1105 1110 1115 1120 Thr Glu Leu Pro Ile Asn Arg Phe Gln Met Ala Trp Gln Gly Ala Asn 1125 1130 1135 Gly Val Ser Lys Val Leu Trp Asp Asn Glu Asn Leu Tyr Val Leu Ile 1140 1145 1150 Gln Val Ser Asp Ser Gln Leu Asp Lys Ser Ser Pro Asn Pro Trp Glu 1155 1160 1165 Gln Asp Ser Ile Glu Val Phe Val Asp Glu Asn Asn Ala Lys Thr Ser 1170 1175 1180 Ser Phe Glu Asp Gly Asp Gly Gln Tyr Arg Val Asn Phe Asp Asn Glu 1185 1190 1195 1200 Thr Ser Phe Asn Pro Val Arg Val Gly Glu Gly Phe Glu Ser Ala Thr 1205 1210 1215 Lys Ala Ser Gly Asn Gly Tyr Thr Val Glu Val Lys Ile Pro Phe Lys 1220 1225 1230 Thr Ile Thr Pro Asp Asn Asn Thr Lys Ile Gly Phe Asp Val Gln Ile 1235 1240 1245 Asn Asp Gly Lys Asp Gly Ala Arg Gln Ser Ala Ala Thr Trp Asn Asp 1250 1255 1260 Leu Thr Gly Leu Gly Tyr Gln Asp Thr Ser Val Phe Gly Val Leu Thr 1265 1270 1275 1280 Leu Met Lys Thr Asp Thr Thr Ala Pro Val Thr Thr Asp Asn Gly Pro 1285 1290 1295 Glu Asp Trp Val Asn Lys Asp Val Thr Ile Ala Phe Ser Ala Asn Asp 1300 1305 1310 Asn Asp Thr Gly Val Ala Ala Thr Tyr Tyr Ser Ile Asp Asn Gly Val 1315 1320 1325 Val Gln Asn Gly Asn Ser Val Thr Ile Ser Glu Glu Gly Val His Ile 1330 1335 1340 Leu Thr Tyr Trp Ser Val Asp Lys Ala Gly Asn Val Glu Gln Val His 1345 1350 1355 1360 Thr Lys Thr Ile Lys Leu Asp Lys Thr Gly Pro Ile Leu Asp Ile Lys 1365 1370 1375 Leu Asp Lys Thr Thr Leu Ser Pro Val Asn His Lys Met Val Pro Ile 1380 1385 1390 Ser Ala Ala Ile Ser Ala Ser Asp Ala Asp Ser Gly Ile His Ser Val 1395 1400 1405 Val Leu Thr Ser Ile Thr Ser Asn Glu Ser Ile Gln Pro Asp Asp Ile 1410 1415 1420 Gln Asn Ala Asn Tyr Asn Lys Pro Ile Thr Gly Thr Thr Asp Ser Phe 1425 1430 1435 1440 Lys Leu Arg Ala Glu Arg Leu Ala Asn Gly Asn Gly Arg Val Tyr Thr 1445 1450 1455 Ile Thr Tyr Thr Ala Thr Asp Lys Ala Gly Asn Val Thr Thr Lys Ser 1460 1465 1470 Val Glu Val Ser Val Pro Arg Asp Asn Ser Lys Lys 1475 1480 <210> 75 <211> 1122 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 75 atgaaaaagc atattgtact cttcgcattt ctttccgtga ttttgctggc ggcccgatcg 60 tcggcgtcgg agcgatttct caaggacgtc ttttcggatt ccttcaaggt cggcgtagcc 120 ctcaatgccg atcagattac gggggcggac tcggccagcc tcgacttgtc cttggctcac 180 ttcgattctc ttgtcgctga aaatgcgatg aagtgggggt cgctcaatcc tgagccgggg 240 gtttacgatt tccgggtggc tgacgccctg gtcgatttgg cggagcggga aggtttgttt 300 ttggttggcc acacactgct ctggcatcag cagacgccgg actgggtttt tctggacgag 360 aagggcgaga ccgccacgcg ggagctggtg ctcgctcgac tggagacgca catccgcacc 420 gtggtcggcc gctaccaggg ccgggtgcag ggctgggatg tggtcaacga agccttgaac 480 gaagacggtt cgttgcggga gtcgaaatgg ttgcagatca tcggcccgga ctacatcgaa 540 ctggcgttcc gcatggcgaa ggaggccgat cccgacgccg agctttatta caatgactac 600 aatgtgtcca agcccggcaa gcgaggtgga gtggtgcgcc tgcttggaga gctgcaggcg 660 aaaggagtta aggtcgatgc ggtcggcatc cagggccact acagtctcgg gcaccctgag 720 ctcgaccagc tcgaggccag catttctgcg ataacggagg ctggggctcc gatcatgata 780 accgagctcg atgtgtcggt cttgcccttt cccgacgcgg agcaaatggg ggcggacgtg 840 tcgctcagct ttgagatgca ggaccacctc aatccctatg ccgatggctt gcccgaggcg 900 gtttcgcagc agctagctga acgttacgcg gccatttttg aagtgttttt gcgccaccag 960 agccacatcg accgcgtgac gttttgggga gtgcacgacg gggtcagctg gtggaactat 1020 tggccgatcg cgggcaggac cgactatccc ttgctgtttg atcgggagct caagcggaaa 1080 gcggccttcg aggcggtggt cgatttagcg gagggccgct ga 1122 <210> 76 <211> 373 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(22) <400> 76 Met Lys Lys His Ile Val Leu Phe Ala Phe Leu Ser Val Ile Leu Leu 1 5 10 15 Ala Ala Arg Ser Ser Ala Ser Glu Arg Phe Leu Lys Asp Val Phe Ser 20 25 30 Asp Ser Phe Lys Val Gly Val Ala Leu Asn Ala Asp Gln Ile Thr Gly 35 40 45 Ala Asp Ser Ala Ser Leu Asp Leu Ser Leu Ala His Phe Asp Ser Leu 50 55 60 Val Ala Glu Asn Ala Met Lys Trp Gly Ser Leu Asn Pro Glu Pro Gly 65 70 75 80 Val Tyr Asp Phe Arg Val Ala Asp Ala Leu Val Asp Leu Ala Glu Arg 85 90 95 Glu Gly Leu Phe Leu Val Gly His Thr Leu Leu Trp His Gln Gln Thr 100 105 110 Pro Asp Trp Val Phe Leu Asp Glu Lys Gly Glu Thr Ala Thr Arg Glu 115 120 125 Leu Val Leu Ala Arg Leu Glu Thr His Ile Arg Thr Val Val Gly Arg 130 135 140 Tyr Gln Gly Arg Val Gln Gly Trp Asp Val Val Asn Glu Ala Leu Asn 145 150 155 160 Glu Asp Gly Ser Leu Arg Glu Ser Lys Trp Leu Gln Ile Ile Gly Pro 165 170 175 Asp Tyr Ile Glu Leu Ala Phe Arg Met Ala Lys Glu Ala Asp Pro Asp 180 185 190 Ala Glu Leu Tyr Tyr Asn Asp Tyr Asn Val Ser Lys Pro Gly Lys Arg 195 200 205 Gly Gly Val Val Arg Leu Leu Gly Glu Leu Gln Ala Lys Gly Val Lys 210 215 220 Val Asp Ala Val Gly Ile Gln Gly His Tyr Ser Leu Gly His Pro Glu 225 230 235 240 Leu Asp Gln Leu Glu Ala Ser Ile Ser Ala Ile Thr Glu Ala Gly Ala 245 250 255 Pro Ile Met Ile Thr Glu Leu Asp Val Ser Val Leu Pro Phe Pro Asp 260 265 270 Ala Glu Gln Met Gly Ala Asp Val Ser Leu Ser Phe Glu Met Gln Asp 275 280 285 His Leu Asn Pro Tyr Ala Asp Gly Leu Pro Glu Ala Val Ser Gln Gln 290 295 300 Leu Ala Glu Arg Tyr Ala Ala Ile Phe Glu Val Phe Leu Arg His Gln 305 310 315 320 Ser His Ile Asp Arg Val Thr Phe Trp Gly Val His Asp Gly Val Ser 325 330 335 Trp Trp Asn Tyr Trp Pro Ile Ala Gly Arg Thr Asp Tyr Pro Leu Leu 340 345 350 Phe Asp Arg Glu Leu Lys Arg Lys Ala Ala Phe Glu Ala Val Val Asp 355 360 365 Leu Ala Glu Gly Arg 370 <210> 77 <211> 1248 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 77 atgctaaaag ttttacgtaa acctatcgtt tctggattag ctctagcctt attattacct 60 ataggatcga cagttagtgc cgaaacaaat atttcaaata aaccaggtat tagcgggtta 120 acagcaccac aattggacca acgatataaa gattctttca ccataggtgc agcggttgag 180 ccaaatcaat tattagatgc aaaagactca caaatgttaa agcgccattt taatagcatt 240 gtagcagaaa atgtcatgaa gcctagcagt ttacagccag tagaagggca gtttaactgg 300 gaaccggcag ataaacttgt taagtttgcg aaagaaaatg gaatggacat gcgcggccat 360 acgcttgtct ggcatagcca agtaccagat tggttcttca aagatgcaaa tggaaattca 420 atggttgttt ggcagaatgg aaagcaagtg gttgcagatc cgtcaaatct tgaggctaac 480 aaaaagcttt tattaagccg tttagaaaca catgttaata cagtcgtttc tcgttataaa 540 aatgatatta aattttggga cgttgtcaat gaagtaatcg acgaatgggg cggacatcct 600 gaaggtttac gtcaatctcc atggttccta attaccggaa cggactatat taaagtcgct 660 tttgagacag caagacaata tgctgctcca gacgctaagc tttatatcaa tgattacaat 720 acagaagtaa caccaaaaag aacgtactta tacaacctag taaaaagttt aaaacagcaa 780 ggtgttccaa ttgatggtgt tgggcatcag tctcacattc aaatcggctg gccgtctgaa 840 aaagaaattg aagacacaat taacatgttt gctgaactgg ggttagacaa ccaaattact 900 gagcttgatg taagcatgta tggctggcca gtaagggcgt atcctaccta tgattctatt 960 ccagcacaga aatttataga tcaagcagac cgatatgatc gtttatttaa attatatgag 1020 aaattaggcg ataaaatcag caatgtgaca ttctggggaa ttgctgataa ccatacatgg 1080 ttaaatgacc gtgcagatgt ttactatgat gcagatggaa acgttgtaac attggcaaat 1140 gcaccatatg ctaaaatgga agctagatca ggtaaagatg caccatttgt atttgatcca 1200 gaatacaatg taaaaccagc ctattgggcg attatcgacc acaaataa 1248 <210> 78 <211> 415 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(27) <400> 78 Met Leu Lys Val Leu Arg Lys Pro Ile Val Ser Gly Leu Ala Leu Ala 1 5 10 15 Leu Leu Leu Pro Ile Gly Ser Thr Val Ser Ala Glu Thr Asn Ile Ser 20 25 30 Asn Lys Pro Gly Ile Ser Gly Leu Thr Ala Pro Gln Leu Asp Gln Arg 35 40 45 Tyr Lys Asp Ser Phe Thr Ile Gly Ala Ala Val Glu Pro Asn Gln Leu 50 55 60 Leu Asp Ala Lys Asp Ser Gln Met Leu Lys Arg His Phe Asn Ser Ile 65 70 75 80 Val Ala Glu Asn Val Met Lys Pro Ser Ser Leu Gln Pro Val Glu Gly 85 90 95 Gln Phe Asn Trp Glu Pro Ala Asp Lys Leu Val Lys Phe Ala Lys Glu 100 105 110 Asn Gly Met Asp Met Arg Gly His Thr Leu Val Trp His Ser Gln Val 115 120 125 Pro Asp Trp Phe Phe Lys Asp Ala Asn Gly Asn Ser Met Val Val Trp 130 135 140 Gln Asn Gly Lys Gln Val Val Ala Asp Pro Ser Asn Leu Glu Ala Asn 145 150 155 160 Lys Lys Leu Leu Leu Ser Arg Leu Glu Thr His Val Asn Thr Val Val 165 170 175 Ser Arg Tyr Lys Asn Asp Ile Lys Phe Trp Asp Val Val Asn Glu Val 180 185 190 Ile Asp Glu Trp Gly Gly His Pro Glu Gly Leu Arg Gln Ser Pro Trp 195 200 205 Phe Leu Ile Thr Gly Thr Asp Tyr Ile Lys Val Ala Phe Glu Thr Ala 210 215 220 Arg Gln Tyr Ala Ala Pro Asp Ala Lys Leu Tyr Ile Asn Asp Tyr Asn 225 230 235 240 Thr Glu Val Thr Pro Lys Arg Thr Tyr Leu Tyr Asn Leu Val Lys Ser 245 250 255 Leu Lys Gln Gln Gly Val Pro Ile Asp Gly Val Gly His Gln Ser His 260 265 270 Ile Gln Ile Gly Trp Pro Ser Glu Lys Glu Ile Glu Asp Thr Ile Asn 275 280 285 Met Phe Ala Glu Leu Gly Leu Asp Asn Gln Ile Thr Glu Leu Asp Val 290 295 300 Ser Met Tyr Gly Trp Pro Val Arg Ala Tyr Pro Thr Tyr Asp Ser Ile 305 310 315 320 Pro Ala Gln Lys Phe Ile Asp Gln Ala Asp Arg Tyr Asp Arg Leu Phe 325 330 335 Lys Leu Tyr Glu Lys Leu Gly Asp Lys Ile Ser Asn Val Thr Phe Trp 340 345 350 Gly Ile Ala Asp Asn His Thr Trp Leu Asn Asp Arg Ala Asp Val Tyr 355 360 365 Tyr Asp Ala Asp Gly Asn Val Val Thr Leu Ala Asn Ala Pro Tyr Ala 370 375 380 Lys Met Glu Ala Arg Ser Gly Lys Asp Ala Pro Phe Val Phe Asp Pro 385 390 395 400 Glu Tyr Asn Val Lys Pro Ala Tyr Trp Ala Ile Ile Asp His Lys 405 410 415 <210> 79 <211> 1293 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 79 atgattggtc tggatttgat ttctggtggt cgtcgcaagg cctgtctggc tgcctgtctg 60 gcgcttgccg cgctgtcatt gccggtatcg gctcaaatgg ctgcggggaa ggaaaagttc 120 gtgggtaacg tgatcgctgg ttatgtgccc ggtgattacg gcaatctctg gaatcaggtg 180 acgccggaga attccaccaa gtggggagcg gttgagtcta cgcgtaatgt catgaactgg 240 acgcaggctg atctggccta caactacgcc aagtccaagg gcttcaagtt caagatgcac 300 acgctggtat ggggctcgca agagccggcc tgggtcaaga atctggatgc gacttcccag 360 cgtgtcgagg tcgaacagtg gatgcgtctg agctgcgaac gctaccccga ttcctgggct 420 atcgatgtgg tgaatgaacc cctgcatgcc gtgccctcgt acaagaacgc actgggtggc 480 gatggtgcca ccggctggga ttgggtcatc acctcgttcc gtctggcgcg tcagtactgt 540 ccgcgcgcca agctgctgct caatgagtac gccaccgagc tggatgccag caagcgcgcc 600 aagatcaaga ccattgcctc gctgctcaag agtcgcggtc tgattgatgg tgttggcctg 660 caggcccatt tcttcacgct ggattacatg aatgccagcc agatgaaggc ggcactggat 720 gattacgcca cgctgggtgt ggatatctac atttccgagc tggatctgaa gggcagtgcc 780 aataccgacg ccagccagaa ggcgaagtac gaagagctgt tcccggtgat gtggaatcac 840 gccagcgtga agggcatcac cctgtggggc tacaaggtgg gtgaaacctg gtcgagcggc 900 accggcctgc tgaatgcgaa cggtagcgag cgtccggccc tgacctggct gaaaagctat 960 atgagcagcc gtcctgcagc atcgagcagc agttcttcga gtgtttcatc cagcaaatcc 1020 agttcgtctt cttctagcca gtccagtgcc tccagcagtg caggcagtgc gccggtcttg 1080 tccggcacca gtgattaccc gagcggtttc agcaagtgtg ccgatctggg cggcacttgc 1140 agcgtgtctt ccggcaccgg ctgggcggcc ttcgggcgca agggtaagtg ggttgccaaa 1200 tacgtcggtg tgggcaagag cattccctgc acggtggcgg cgtttggtcg tgacccgggg 1260 ggcaatccca acaagtgttc cttccagagg taa 1293 <210> 80 <211> 430 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(36) <400> 80 Met Ile Gly Leu Asp Leu Ile Ser Gly Gly Arg Arg Lys Ala Cys Leu 1 5 10 15 Ala Ala Cys Leu Ala Leu Ala Ala Leu Ser Leu Pro Val Ser Ala Gln 20 25 30 Met Ala Ala Gly Lys Glu Lys Phe Val Gly Asn Val Ile Ala Gly Tyr 35 40 45 Val Pro Gly Asp Tyr Gly Asn Leu Trp Asn Gln Val Thr Pro Glu Asn 50 55 60 Ser Thr Lys Trp Gly Ala Val Glu Ser Thr Arg Asn Val Met Asn Trp 65 70 75 80 Thr Gln Ala Asp Leu Ala Tyr Asn Tyr Ala Lys Ser Lys Gly Phe Lys 85 90 95 Phe Lys Met His Thr Leu Val Trp Gly Ser Gln Glu Pro Ala Trp Val 100 105 110 Lys Asn Leu Asp Ala Thr Ser Gln Arg Val Glu Val Glu Gln Trp Met 115 120 125 Arg Leu Ser Cys Glu Arg Tyr Pro Asp Ser Trp Ala Ile Asp Val Val 130 135 140 Asn Glu Pro Leu His Ala Val Pro Ser Tyr Lys Asn Ala Leu Gly Gly 145 150 155 160 Asp Gly Ala Thr Gly Trp Asp Trp Val Ile Thr Ser Phe Arg Leu Ala 165 170 175 Arg Gln Tyr Cys Pro Arg Ala Lys Leu Leu Leu Asn Glu Tyr Ala Thr 180 185 190 Glu Leu Asp Ala Ser Lys Arg Ala Lys Ile Lys Thr Ile Ala Ser Leu 195 200 205 Leu Lys Ser Arg Gly Leu Ile Asp Gly Val Gly Leu Gln Ala His Phe 210 215 220 Phe Thr Leu Asp Tyr Met Asn Ala Ser Gln Met Lys Ala Ala Leu Asp 225 230 235 240 Asp Tyr Ala Thr Leu Gly Val Asp Ile Tyr Ile Ser Glu Leu Asp Leu 245 250 255 Lys Gly Ser Ala Asn Thr Asp Ala Ser Gln Lys Ala Lys Tyr Glu Glu 260 265 270 Leu Phe Pro Val Met Trp Asn His Ala Ser Val Lys Gly Ile Thr Leu 275 280 285 Trp Gly Tyr Lys Val Gly Glu Thr Trp Ser Ser Gly Thr Gly Leu Leu 290 295 300 Asn Ala Asn Gly Ser Glu Arg Pro Ala Leu Thr Trp Leu Lys Ser Tyr 305 310 315 320 Met Ser Ser Arg Pro Ala Ala Ser Ser Ser Ser Ser Ser Ser Val Ser 325 330 335 Ser Ser Lys Ser Ser Ser Ser Ser Ser Ser Gln Ser Ser Ala Ser Ser 340 345 350 Ser Ala Gly Ser Ala Pro Val Leu Ser Gly Thr Ser Asp Tyr Pro Ser 355 360 365 Gly Phe Ser Lys Cys Ala Asp Leu Gly Gly Thr Cys Ser Val Ser Ser 370 375 380 Gly Thr Gly Trp Ala Ala Phe Gly Arg Lys Gly Lys Trp Val Ala Lys 385 390 395 400 Tyr Val Gly Val Gly Lys Ser Ile Pro Cys Thr Val Ala Ala Phe Gly 405 410 415 Arg Asp Pro Gly Gly Asn Pro Asn Lys Cys Ser Phe Gln Arg 420 425 430 <210> 81 <211> 1017 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 81 ttgaccacga gagctattcg cacggaggca gcgctgaagg agatgtttgc ggaggacttt 60 cagatcggag ccgctgttaa tccgatgact atacggacac aggaggagct gcttgcttat 120 cacttcaaca gtattacggc agagaatgaa atgaagtttg ccagtctgca gccggaggag 180 ggggcttatg cttttgacga ggcggatcga ttggcggcct tcgcccggaa gcatggcatg 240 gcgatgcggg gacacacttt agtgtggcat aaccagtcca caggctggct gttcgaagac 300 aagcagggaa atcctgtaga taaggcaact ctgctggaga ggctgaaatc gcacatccat 360 acggtagtag gacgttataa aaacgatatt tatgcttggg atgtggtaaa cgaggttata 420 gaggacgagg gagacggcct gctgcgccgg tcgaaatggc tggatattgc cggaccggaa 480 ttcattgccc gggcgttcga gtatgctcat gaggctgacc ctaatgcgct gctcttctat 540 aatgactaca acgagtccaa tccggcgaag cgagacaaga tccatgctct ggtgaagtcg 600 ctgctggagc aaggcgtgcc tattcatggc attggactgc aggcgcattg gaatttgtat 660 ggtccttctc tcggcgagat ccgagcggca ctggagaagt atgcttctct tggcctgcag 720 ctgcagctta cggagctgga tatgtcgctg tttcgttttg acgacaagcg tacggatata 780 accgagcctc cggcggaatt gcttgagctg caggctgagc ggtatgagga aattttcaag 840 ctgctgaggg aataccggga tgtaatcact tccgtgacct tctggggggc tgcggatgat 900 tatacgtggc tgaacgattt tcccgtccgg gggcggaaaa attggccttt cctgttcgat 960 gagcagcatc accccaaact ggcatttcat cgggtcgctg cactttcccg ccagtga 1017 <210> 82 <211> 338 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 82 Leu Thr Thr Arg Ala Ile Arg Thr Glu Ala Ala Leu Lys Glu Met Phe 1 5 10 15 Ala Glu Asp Phe Gln Ile Gly Ala Ala Val Asn Pro Met Thr Ile Arg 20 25 30 Thr Gln Glu Glu Leu Leu Ala Tyr His Phe Asn Ser Ile Thr Ala Glu 35 40 45 Asn Glu Met Lys Phe Ala Ser Leu Gln Pro Glu Glu Gly Ala Tyr Ala 50 55 60 Phe Asp Glu Ala Asp Arg Leu Ala Ala Phe Ala Arg Lys His Gly Met 65 70 75 80 Ala Met Arg Gly His Thr Leu Val Trp His Asn Gln Ser Thr Gly Trp 85 90 95 Leu Phe Glu Asp Lys Gln Gly Asn Pro Val Asp Lys Ala Thr Leu Leu 100 105 110 Glu Arg Leu Lys Ser His Ile His Thr Val Val Gly Arg Tyr Lys Asn 115 120 125 Asp Ile Tyr Ala Trp Asp Val Val Asn Glu Val Ile Glu Asp Glu Gly 130 135 140 Asp Gly Leu Leu Arg Arg Ser Lys Trp Leu Asp Ile Ala Gly Pro Glu 145 150 155 160 Phe Ile Ala Arg Ala Phe Glu Tyr Ala His Glu Ala Asp Pro Asn Ala 165 170 175 Leu Leu Phe Tyr Asn Asp Tyr Asn Glu Ser Asn Pro Ala Lys Arg Asp 180 185 190 Lys Ile His Ala Leu Val Lys Ser Leu Leu Glu Gln Gly Val Pro Ile 195 200 205 His Gly Ile Gly Leu Gln Ala His Trp Asn Leu Tyr Gly Pro Ser Leu 210 215 220 Gly Glu Ile Arg Ala Ala Leu Glu Lys Tyr Ala Ser Leu Gly Leu Gln 225 230 235 240 Leu Gln Leu Thr Glu Leu Asp Met Ser Leu Phe Arg Phe Asp Asp Lys 245 250 255 Arg Thr Asp Ile Thr Glu Pro Pro Ala Glu Leu Leu Glu Leu Gln Ala 260 265 270 Glu Arg Tyr Glu Glu Ile Phe Lys Leu Leu Arg Glu Tyr Arg Asp Val 275 280 285 Ile Thr Ser Val Thr Phe Trp Gly Ala Ala Asp Asp Tyr Thr Trp Leu 290 295 300 Asn Asp Phe Pro Val Arg Gly Arg Lys Asn Trp Pro Phe Leu Phe Asp 305 310 315 320 Glu Gln His His Pro Lys Leu Ala Phe His Arg Val Ala Ala Leu Ser 325 330 335 Arg Gln <210> 83 <211> 3024 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 83 atgaaaacca aaaggtctat attcaggttg tctatcctgg ttgtcctggc tgtgctgctg 60 ttcagcgcaa tcaccttgac agccagcgcc gccgacacgc tcggcgcggc ggcggcccag 120 tcgggccggt acttcggcac ggcgatagct gccggcaagc tcggcgactc gacctacacg 180 accattgcca accgtgagtt caacatgatc acggctgaga atgagatgaa gatcgacgcc 240 accgagccga accagaacca attcaacttc accaacgccg accggatctt caactgggcg 300 gtgcagaatg ggaagcaggt gcgcgggcac acgctggcat ggcactcgca gcagccgggg 360 tggatgagca gcatgagcgg caccgcgctg cgcaatgcga tgatcaacca catcaatggg 420 gtgatggccc actacaaggg caggatctac gcctgggatg tggtgaacga ggctttcaac 480 gaggacggca gccgccgcaa ctcgaacctg cagcagaccg gcaacgactg gatcgaggtg 540 gccttccgga cagcccgcac cgccgacccg gccgccaagc tgtgctacaa cgactacaac 600 atcgaagcct ggagctatgc caagacgcag ggcgtttacc ggatggtcca ggacttcaag 660 tcccgcggcg tgccgatcga ctgtgtcggg ttccagagcc acttcaacag cggcacttcc 720 tacgtcaaca gcaacttccg gacgacgctg caaagcttcg ccgcgctggg cgtggacgtg 780 cagatcaccg agctggatgt cgagaatgcc gactcgcggc tcgattggtg gagaggcatc 840 gtcaatgact gcctggcggt cccgcgctgc aacggcatca cggtgtgggg cgtgcgcgac 900 agcgattcgt ggcgctcttc gcagaacccg ctgctgttca actccagcgg tggtaagaag 960 gcttcgtaca ccgccgtcct cgacgccctc aacgctgccc cgaccgtcac acctccggta 1020 acgacacctc cggtgacgac accgccagtg accacgcctc ctcccggcac tgtgtcgatt 1080 aacgcgggcg gctcggcgag cggcagcttc acggccgacc agtacttcag cggtggcagc 1140 acctacacca acaccgccac catcgacatg agtcagatca ccagcaaccc accgccggcg 1200 gcggtcttca acagcgagcg ttacggggcg atgacctaca ccatccccaa ccgctcgggt 1260 gctcagacgg tgacgctgta ctttgccgag acctacctca ccgcggcagg gcagcggtcg 1320 ttcaacgtgt cgattaatgg cgcagcggcg ctgtccaact tcgacatcta tgcctcggca 1380 ggtggcgcta accgggccat cgcccggacg ttcagcacca cggctaactc aagtggccag 1440 gtggtgatcc agttcacggc ggttaccgag aaccccaaga tcaacgctat cacggtaaca 1500 gcgggtggca cgcctccacc gacaacgcct ccgcccacca cgccgccacc gaccacccct 1560 ccggtgacga cacccccagt gacgacaccc ccagtgacga caccgccccc cggcagcgtg 1620 tcgatcaacg cgggcggctc ggccaccggc agcttcacgg gcgaccagta ctttagcggt 1680 ggcagcacct acaccaacac cgccaccatc gacatgagcc agatcaccag caacccacca 1740 ccggcggcgg tgttcaacag cgagcgctac ggggcgatga cctacaccat ccccggccgc 1800 tcgggggctc agacggtcac gctttacttt gccgaaacgt atgtcactgc ggcagggcag 1860 cgcgtcttta acgtgtctgt aaacggcgcg gcagcgctgt ccaacttcga catctatgcc 1920 agcgccggcg gccagaaccg ggccatcgct cgctccttca acaccacggc caactcaagc 1980 ggccaggtgg tgatccagtt cacggcggtc accgagaacc ccaagatcaa cgccatcact 2040 gtggcgggcg ggatcgggga cttccaaacc ctgaccgtca cgaagtccgg cacggggacg 2100 gtcacctcca acccggctgg tatcaactgc ggctcgacct gcaacgccag cttcgctacc 2160 ggcaccagcg tgaccctgac cgcctccggc gggaccttca ccggctggag cggagcctgc 2220 tccggcacct ccaccacctg caccgtctcc atgacccagg cccggtcggt caccgctact 2280 tttagcggcg gtggtgacac caggccgagc gcggggtgtg gtaagaaccg gacactgcag 2340 aatggcacaa tcaccatttc aagtggcggc gtcaaccgca cctacatcct acgcacgcct 2400 gacaactaca acaacacgca tgcataccgg ctgatcatgg cttatcactg gcttaacggc 2460 agcgcgcaga atgtggcgag cgagaactac taccggctgt tcccactctc caacaacagc 2520 accatcttcg tggcgcctca ggggctggat gccggatggg ctaacaccaa caaccgcgac 2580 ctgaacctca ccgatgccat actcacccag gtcgagaacg atctgtgcgt cgacttgaac 2640 cgggtctggg ccaccgggtt cagctacggc gcaggtatgt catacgccat cgcctgtgcc 2700 agggccaatg tgttccgggg cgtcgctctc tatgccggcg cgcagctcag cggttgcacc 2760 ggtggaacca cggccattgc gtacttcgca acgcacggca tcaacgacag tgtcctcaac 2820 atctcgcaag ggcggactct acgcgaccgc tttgtctcga acaacagctg cacggcgcag 2880 aaccctcccg agccttcctc gggcagcggg acgcacatct gcacgtccta ccagaactgc 2940 tcggcaggac atcctgtccg gtggtgcgcg ttcgacggcg accacacccc gaatcagacc 3000 gaccgcggcc agagcacaag ctaa 3024 <210> 84 <211> 1007 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(30) <400> 84 Met Lys Thr Lys Arg Ser Ile Phe Arg Leu Ser Ile Leu Val Val Leu 1 5 10 15 Ala Val Leu Leu Phe Ser Ala Ile Thr Leu Thr Ala Ser Ala Ala Asp 20 25 30 Thr Leu Gly Ala Ala Ala Ala Gln Ser Gly Arg Tyr Phe Gly Thr Ala 35 40 45 Ile Ala Ala Gly Lys Leu Gly Asp Ser Thr Tyr Thr Thr Ile Ala Asn 50 55 60 Arg Glu Phe Asn Met Ile Thr Ala Glu Asn Glu Met Lys Ile Asp Ala 65 70 75 80 Thr Glu Pro Asn Gln Asn Gln Phe Asn Phe Thr Asn Ala Asp Arg Ile 85 90 95 Phe Asn Trp Ala Val Gln Asn Gly Lys Gln Val Arg Gly His Thr Leu 100 105 110 Ala Trp His Ser Gln Gln Pro Gly Trp Met Ser Ser Met Ser Gly Thr 115 120 125 Ala Leu Arg Asn Ala Met Ile Asn His Ile Asn Gly Val Met Ala His 130 135 140 Tyr Lys Gly Arg Ile Tyr Ala Trp Asp Val Val Asn Glu Ala Phe Asn 145 150 155 160 Glu Asp Gly Ser Arg Arg Asn Ser Asn Leu Gln Gln Thr Gly Asn Asp 165 170 175 Trp Ile Glu Val Ala Phe Arg Thr Ala Arg Thr Ala Asp Pro Ala Ala 180 185 190 Lys Leu Cys Tyr Asn Asp Tyr Asn Ile Glu Ala Trp Ser Tyr Ala Lys 195 200 205 Thr Gln Gly Val Tyr Arg Met Val Gln Asp Phe Lys Ser Arg Gly Val 210 215 220 Pro Ile Asp Cys Val Gly Phe Gln Ser His Phe Asn Ser Gly Thr Ser 225 230 235 240 Tyr Val Asn Ser Asn Phe Arg Thr Thr Leu Gln Ser Phe Ala Ala Leu 245 250 255 Gly Val Asp Val Gln Ile Thr Glu Leu Asp Val Glu Asn Ala Asp Ser 260 265 270 Arg Leu Asp Trp Trp Arg Gly Ile Val Asn Asp Cys Leu Ala Val Pro 275 280 285 Arg Cys Asn Gly Ile Thr Val Trp Gly Val Arg Asp Ser Asp Ser Trp 290 295 300 Arg Ser Ser Gln Asn Pro Leu Leu Phe Asn Ser Ser Gly Gly Lys Lys 305 310 315 320 Ala Ser Tyr Thr Ala Val Leu Asp Ala Leu Asn Ala Ala Pro Thr Val 325 330 335 Thr Pro Pro Val Thr Thr Pro Pro Val Thr Thr Pro Pro Val Thr Thr 340 345 350 Pro Pro Pro Gly Thr Val Ser Ile Asn Ala Gly Gly Ser Ala Ser Gly 355 360 365 Ser Phe Thr Ala Asp Gln Tyr Phe Ser Gly Gly Ser Thr Tyr Thr Asn 370 375 380 Thr Ala Thr Ile Asp Met Ser Gln Ile Thr Ser Asn Pro Pro Pro Ala 385 390 395 400 Ala Val Phe Asn Ser Glu Arg Tyr Gly Ala Met Thr Tyr Thr Ile Pro 405 410 415 Asn Arg Ser Gly Ala Gln Thr Val Thr Leu Tyr Phe Ala Glu Thr Tyr 420 425 430 Leu Thr Ala Ala Gly Gln Arg Ser Phe Asn Val Ser Ile Asn Gly Ala 435 440 445 Ala Ala Leu Ser Asn Phe Asp Ile Tyr Ala Ser Ala Gly Gly Ala Asn 450 455 460 Arg Ala Ile Ala Arg Thr Phe Ser Thr Thr Ala Asn Ser Ser Gly Gln 465 470 475 480 Val Val Ile Gln Phe Thr Ala Val Thr Glu Asn Pro Lys Ile Asn Ala 485 490 495 Ile Thr Val Thr Ala Gly Gly Thr Pro Pro Pro Thr Thr Pro Pro Pro 500 505 510 Thr Thr Pro Pro Pro Thr Thr Pro Pro Val Thr Thr Pro Pro Val Thr 515 520 525 Thr Pro Pro Val Thr Thr Pro Pro Pro Gly Ser Val Ser Ile Asn Ala 530 535 540 Gly Gly Ser Ala Thr Gly Ser Phe Thr Gly Asp Gln Tyr Phe Ser Gly 545 550 555 560 Gly Ser Thr Tyr Thr Asn Thr Ala Thr Ile Asp Met Ser Gln Ile Thr 565 570 575 Ser Asn Pro Pro Pro Ala Ala Val Phe Asn Ser Glu Arg Tyr Gly Ala 580 585 590 Met Thr Tyr Thr Ile Pro Gly Arg Ser Gly Ala Gln Thr Val Thr Leu 595 600 605 Tyr Phe Ala Glu Thr Tyr Val Thr Ala Ala Gly Gln Arg Val Phe Asn 610 615 620 Val Ser Val Asn Gly Ala Ala Ala Leu Ser Asn Phe Asp Ile Tyr Ala 625 630 635 640 Ser Ala Gly Gly Gln Asn Arg Ala Ile Ala Arg Ser Phe Asn Thr Thr 645 650 655 Ala Asn Ser Ser Gly Gln Val Val Ile Gln Phe Thr Ala Val Thr Glu 660 665 670 Asn Pro Lys Ile Asn Ala Ile Thr Val Ala Gly Gly Ile Gly Asp Phe 675 680 685 Gln Thr Leu Thr Val Thr Lys Ser Gly Thr Gly Thr Val Thr Ser Asn 690 695 700 Pro Ala Gly Ile Asn Cys Gly Ser Thr Cys Asn Ala Ser Phe Ala Thr 705 710 715 720 Gly Thr Ser Val Thr Leu Thr Ala Ser Gly Gly Thr Phe Thr Gly Trp 725 730 735 Ser Gly Ala Cys Ser Gly Thr Ser Thr Thr Cys Thr Val Ser Met Thr 740 745 750 Gln Ala Arg Ser Val Thr Ala Thr Phe Ser Gly Gly Gly Asp Thr Arg 755 760 765 Pro Ser Ala Gly Cys Gly Lys Asn Arg Thr Leu Gln Asn Gly Thr Ile 770 775 780 Thr Ile Ser Ser Gly Gly Val Asn Arg Thr Tyr Ile Leu Arg Thr Pro 785 790 795 800 Asp Asn Tyr Asn Asn Thr His Ala Tyr Arg Leu Ile Met Ala Tyr His 805 810 815 Trp Leu Asn Gly Ser Ala Gln Asn Val Ala Ser Glu Asn Tyr Tyr Arg 820 825 830 Leu Phe Pro Leu Ser Asn Asn Ser Thr Ile Phe Val Ala Pro Gln Gly 835 840 845 Leu Asp Ala Gly Trp Ala Asn Thr Asn Asn Arg Asp Leu Asn Leu Thr 850 855 860 Asp Ala Ile Leu Thr Gln Val Glu Asn Asp Leu Cys Val Asp Leu Asn 865 870 875 880 Arg Val Trp Ala Thr Gly Phe Ser Tyr Gly Ala Gly Met Ser Tyr Ala 885 890 895 Ile Ala Cys Ala Arg Ala Asn Val Phe Arg Gly Val Ala Leu Tyr Ala 900 905 910 Gly Ala Gln Leu Ser Gly Cys Thr Gly Gly Thr Thr Ala Ile Ala Tyr 915 920 925 Phe Ala Thr His Gly Ile Asn Asp Ser Val Leu Asn Ile Ser Gln Gly 930 935 940 Arg Thr Leu Arg Asp Arg Phe Val Ser Asn Asn Ser Cys Thr Ala Gln 945 950 955 960 Asn Pro Pro Glu Pro Ser Ser Gly Ser Gly Thr His Ile Cys Thr Ser 965 970 975 Tyr Gln Asn Cys Ser Ala Gly His Pro Val Arg Trp Cys Ala Phe Asp 980 985 990 Gly Asp His Thr Pro Asn Gln Thr Asp Arg Gly Gln Ser Thr Ser 995 1000 1005 <210> 85 <211> 1254 <212> DNA <213> Bacteria <400> 85 atgaccttga ttacgccaag ctcgaaatta accctcacta aagggaacaa aagctggagc 60 tcgcgcgcct gcaggtcgac actagtggat ctcacacttt acttcgagtc tcagaatccg 120 accctcgagt tctacgtgga cgatgtgaag gtagtggaca ccacctctgc tgagataaaa 180 ctcgagatga atccagaaga ggaaatacca gccctcaggg aagttctgaa agactacttc 240 agagtgggcg ttgctcttcc atccaaggta ttcatcaacc agaaggactt aacgctcatc 300 accaagcact tcaacagcat caccgcagaa aatgagatga aacctgatag tctgcttgca 360 ggcattgaga atggcaaact caagttcaga tttgaaacag cagacaaata catcgaattt 420 gcacagcaaa acggcatggt tgtgaggggc cacacactgg tatggcacaa tcagacgccc 480 gagtggttct tcaaagacga aaatggaaac ctcctctcca aagaagcgat gacagaaaga 540 ctcagagaat acatacacac cgtcgttgga cacttcaaag ggaaggtcta cgcatgggac 600 gttgtgaacg aagcggtcga tccgaaccag ccagatggac tgagaagatc cacctggtat 660 cagatcatgg ggcctgacta catagaactt gccttcaagt ttgcaaggga ggcagatccc 720 gatgcgaaac tcttctacaa cgactacaac accttcgaac ccaaaaagag agacatcatc 780 tacaaccttg tgaagagtct caaggaaaag ggtctcatcg atggaatcgg tatgcagtgt 840 cacatcagtc ttgcaacgga catcaggcag atcgaagagg ccatcaaaaa gttcagctcc 900 atccctggta tagaaatcca cataacagag ctcgatatga gcgtctacag agattctact 960 tccaactacc cagaggcacc gaggaacgca ctcattgaac aggctcacaa gatggctcaa 1020 ctctttgaaa tcttcaagaa atacagtaat gtgatcacaa acgtcacgtt ctggggtctc 1080 aaagacgact actcctggag agcaacaaga agaaatgact ggacattgat ctttgacaaa 1140 gattatcagg caaaactcgc ttactgggcg attgtcgctc ctgaagtgct accacctctt 1200 tcaaaagaaa gcaagatcca aagaattcaa aaagcttctc gagagtactt ctag 1254 <210> 86 <211> 417 <212> PRT <213> Bacteria <400> 86 Met Thr Leu Ile Thr Pro Ser Ser Lys Leu Thr Leu Thr Lys Gly Asn 1 5 10 15 Lys Ser Trp Ser Ser Arg Ala Cys Arg Ser Thr Leu Val Asp Leu Thr 20 25 30 Leu Tyr Phe Glu Ser Gln Asn Pro Thr Leu Glu Phe Tyr Val Asp Asp 35 40 45 Val Lys Val Val Asp Thr Thr Ser Ala Glu Ile Lys Leu Glu Met Asn 50 55 60 Pro Glu Glu Glu Ile Pro Ala Leu Arg Glu Val Leu Lys Asp Tyr Phe 65 70 75 80 Arg Val Gly Val Ala Leu Pro Ser Lys Val Phe Ile Asn Gln Lys Asp 85 90 95 Leu Thr Leu Ile Thr Lys His Phe Asn Ser Ile Thr Ala Glu Asn Glu 100 105 110 Met Lys Pro Asp Ser Leu Leu Ala Gly Ile Glu Asn Gly Lys Leu Lys 115 120 125 Phe Arg Phe Glu Thr Ala Asp Lys Tyr Ile Glu Phe Ala Gln Gln Asn 130 135 140 Gly Met Val Val Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro 145 150 155 160 Glu Trp Phe Phe Lys Asp Glu Asn Gly Asn Leu Leu Ser Lys Glu Ala 165 170 175 Met Thr Glu Arg Leu Arg Glu Tyr Ile His Thr Val Val Gly His Phe 180 185 190 Lys Gly Lys Val Tyr Ala Trp Asp Val Val Asn Glu Ala Val Asp Pro 195 200 205 Asn Gln Pro Asp Gly Leu Arg Arg Ser Thr Trp Tyr Gln Ile Met Gly 210 215 220 Pro Asp Tyr Ile Glu Leu Ala Phe Lys Phe Ala Arg Glu Ala Asp Pro 225 230 235 240 Asp Ala Lys Leu Phe Tyr Asn Asp Tyr Asn Thr Phe Glu Pro Lys Lys 245 250 255 Arg Asp Ile Ile Tyr Asn Leu Val Lys Ser Leu Lys Glu Lys Gly Leu 260 265 270 Ile Asp Gly Ile Gly Met Gln Cys His Ile Ser Leu Ala Thr Asp Ile 275 280 285 Arg Gln Ile Glu Glu Ala Ile Lys Lys Phe Ser Ser Ile Pro Gly Ile 290 295 300 Glu Ile His Ile Thr Glu Leu Asp Met Ser Val Tyr Arg Asp Ser Thr 305 310 315 320 Ser Asn Tyr Pro Glu Ala Pro Arg Asn Ala Leu Ile Glu Gln Ala His 325 330 335 Lys Met Ala Gln Leu Phe Glu Ile Phe Lys Lys Tyr Ser Asn Val Ile 340 345 350 Thr Asn Val Thr Phe Trp Gly Leu Lys Asp Asp Tyr Ser Trp Arg Ala 355 360 365 Thr Arg Arg Asn Asp Trp Thr Leu Ile Phe Asp Lys Asp Tyr Gln Ala 370 375 380 Lys Leu Ala Tyr Trp Ala Ile Val Ala Pro Glu Val Leu Pro Pro Leu 385 390 395 400 Ser Lys Glu Ser Lys Ile Gln Arg Ile Gln Lys Ala Ser Arg Glu Tyr 405 410 415 Phe <210> 87 <211> 1089 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 87 ttgaagaaca gaattaaaaa ggttgtgggc gggctcgccc tggcgagtgt tctgctcacc 60 tcggtaatgg caggcaatgc cagcgcagca attaccaatg gatcgaagtt cctggggaat 120 atcattgccg gcagtgctcc aagtaacttc accacctact ggaatcaggt caccccggag 180 aacggcacca aatggggttc catcgaaggc aaccgcaacc agatgaactg gggaaacgcg 240 gacatgatct ataactacgc catcagcaaa aacatcccgt tcaaattcca tactctcgtc 300 tggggaagcc aggagcccaa ctgggtggcc ggcttgtcgg cagcggagca gaaggcggaa 360 atcagctcat tcattactca agcaggacag cgttattccg cgaagacagc ttttgtggat 420 gtagtcaatg aaccgctgca tgccaagcct tcgtaccgca atgccatcgg cggcgatggc 480 agcaccggct gggattgggt gatctggtct ttccagcaag cccgggccgc cttcccgaac 540 gccaagctgc acctcaatga ctacggcatt atcggtgacc ccagcgcggc cgataaatat 600 gtgaacatta tcaatatcct gaaatccaga ggactgatcg atggtattgg tattcagtgc 660 cactacttca atatggataa cgtaagtgtg agcaccatga atactgtact gggtaagctt 720 gctgcaacag gcctgccaat ctatgtctcc gagctggata ttaccggtga tgacaacacc 780 cagcttgcca gataccaaca gaaattccct gtgctctgga accatccttc cgtgaagggc 840 gtcaccctgt ggggctacat ccaaaatcag acctgggcat caggcaccca tctggtgaat 900 tccaacggca cagagcgccc tgccctgaag tggctgaagc aatacctggg cggctcgtca 960 gctctgatgg aaaccacaga cgcccaagac ctcactatca ctgacagtct gatccagccg 1020 gacagtgtgg ttgagccgga ccctcaactg gatctccagc cggtgcttga gcccgttccg 1080 gctgagtaa 1089 <210> 88 <211> 362 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(29) <400> 88 Leu Lys Asn Arg Ile Lys Lys Val Val Gly Gly Leu Ala Leu Ala Ser 1 5 10 15 Val Leu Leu Thr Ser Val Met Ala Gly Asn Ala Ser Ala Ala Ile Thr 20 25 30 Asn Gly Ser Lys Phe Leu Gly Asn Ile Ile Ala Gly Ser Ala Pro Ser 35 40 45 Asn Phe Thr Thr Tyr Trp Asn Gln Val Thr Pro Glu Asn Gly Thr Lys 50 55 60 Trp Gly Ser Ile Glu Gly Asn Arg Asn Gln Met Asn Trp Gly Asn Ala 65 70 75 80 Asp Met Ile Tyr Asn Tyr Ala Ile Ser Lys Asn Ile Pro Phe Lys Phe 85 90 95 His Thr Leu Val Trp Gly Ser Gln Glu Pro Asn Trp Val Ala Gly Leu 100 105 110 Ser Ala Ala Glu Gln Lys Ala Glu Ile Ser Ser Phe Ile Thr Gln Ala 115 120 125 Gly Gln Arg Tyr Ser Ala Lys Thr Ala Phe Val Asp Val Val Asn Glu 130 135 140 Pro Leu His Ala Lys Pro Ser Tyr Arg Asn Ala Ile Gly Gly Asp Gly 145 150 155 160 Ser Thr Gly Trp Asp Trp Val Ile Trp Ser Phe Gln Gln Ala Arg Ala 165 170 175 Ala Phe Pro Asn Ala Lys Leu His Leu Asn Asp Tyr Gly Ile Ile Gly 180 185 190 Asp Pro Ser Ala Ala Asp Lys Tyr Val Asn Ile Ile Asn Ile Leu Lys 195 200 205 Ser Arg Gly Leu Ile Asp Gly Ile Gly Ile Gln Cys His Tyr Phe Asn 210 215 220 Met Asp Asn Val Ser Val Ser Thr Met Asn Thr Val Leu Gly Lys Leu 225 230 235 240 Ala Ala Thr Gly Leu Pro Ile Tyr Val Ser Glu Leu Asp Ile Thr Gly 245 250 255 Asp Asp Asn Thr Gln Leu Ala Arg Tyr Gln Gln Lys Phe Pro Val Leu 260 265 270 Trp Asn His Pro Ser Val Lys Gly Val Thr Leu Trp Gly Tyr Ile Gln 275 280 285 Asn Gln Thr Trp Ala Ser Gly Thr His Leu Val Asn Ser Asn Gly Thr 290 295 300 Glu Arg Pro Ala Leu Lys Trp Leu Lys Gln Tyr Leu Gly Gly Ser Ser 305 310 315 320 Ala Leu Met Glu Thr Thr Asp Ala Gln Asp Leu Thr Ile Thr Asp Ser 325 330 335 Leu Ile Gln Pro Asp Ser Val Val Glu Pro Asp Pro Gln Leu Asp Leu 340 345 350 Gln Pro Val Leu Glu Pro Val Pro Ala Glu 355 360 <210> 89 <211> 2541 <212> DNA <213> Bacteria <400> 89 atggatacat tgttcaatac aaccgatgag cgtggggcgt ccaagcgccg tggcatcgtc 60 gcggcgcttg cggccgcagc catgctggtg ccgctggcgt tcgccccgac ggccatggcg 120 gccgaccccg actatccggg cggcatcaag ggcgaataca atccgctggg aatcaacgct 180 ggtgtcgcca tcgagacata caccctcaac caggacaagg agaaggccct ggtcgagaac 240 ttcgaccaga tcaccccgga gaactcgctg aagccggaag gctggtacga cgaccagcat 300 aatttccgca tgtcggatga cgcgcggaac ctgctgacgt tcgccagcga gaacggcatc 360 aaggtctacg gccatgttct ggtctggcac tcgcagacgc ccgactggtt cttccaggcc 420 gacgaatggt gccatgacac caacgacaac cccggcgtca ccagctgccc gcttgccgac 480 aaggccacga tgcaggaacg ccagcgcagg cacatcgaga acgtggcgga ggccatctcc 540 gacgaattcg gaaaattcgg cagcccgacc aatcccgtcg tcgcgttcga cgtggtcaac 600 gagaccgtga acgacagcga cgaccccgcc accaacggca tgcgcaattc gctgtggtat 660 cagacctatg ggggcgagga ctacatctat gacgcgttcc ggaacgcgaa tacgtatctg 720 aacgacgtct acgccgccga cgacgcggag catccggtga cgttgttcat caacgattac 780 ggcaccgagc aggcgggcaa gcgttcccgc tacaaggcgc ttctggaacg catgatccag 840 cagggggttc cctttgacgg catcggtcac cagttccatg tgtcgttgac cacggcctcg 900 tcgaatctcg acgacgcgct gaccgatatg tcctcgctcg gcaagaagca ggccatcacc 960 gaactggacg tcgccaccgg aacgccggtt acggaggcga agctcatcga gcagggacgg 1020 tactactacg acgtcaacca gatcatccac aggcacgccg accagctgtt ctcggtttcg 1080 gtgtgggggc tgagcgacga ccagtcctgg cgcaacaagg agggcgcgcc gctgctgttc 1140 gacgacaacc tggagaagaa gccggcgtac atcggctaca tcggtgatag cgccaacctt 1200 cccgagccgt tgaagagcat gaacgcattc aaggatgacg ccgtgggcat cgactcggcg 1260 cttcccggta ccgtggccga gtccggcgcg tcctctccgt gggaacgtct ttcgctggtc 1320 gagatgaccc cgtctgcgta tgacgccgtt tccggctcgt tcaatgtcta ttggaaggac 1380 ggctctctgg tcgtctacgc ggatgtcgcc gatgccagcg cggcggatga cgacaccgtc 1440 accgtgcgtg tgggtgacgc cgagtatacg atcggccgca acggtgtgac cggcggcgag 1500 ggtgtgcagg ccaacgtcgt ttcgtctgat gccggatacg aagtcgtggc cgatatcccg 1560 tacaccggtg cagagaagga catcgtcgag atgaacgtca tcgcgacgga ttccgccacc 1620 acggagacca gcgcgtggag cacgaacgac actggcgccg tcacgctggc cgagccgctg 1680 agctacacgg aagccgtgaa ggttcccgcc gacgcccagg ctccggtcgt tgacgccgac 1740 ccgtcggatt ccgtctgggc ggaagccaac gaggttcccg tgggtaaggt gaccgccgcc 1800 acgccttccc ccgaggcgac cgctaccgcc aagaccctgt ggtcggacgg caagctgtat 1860 gtcctcatgg aagtgaccga cgcggacatc gatctgacca actcgaatcc gtgggagaag 1920 gactccgttg aggtgtacat cgaccgtggc aacaccaaga gcggccagta taccaacgac 1980 atccagcaga ttcgcgtgtc cgccgatggt gcggagctga gcttcggctc cggcgcgtcg 2040 gaggatgtcc agaagtccat ggtccagacc gccggcaagc tcgtcgatgg cggctatgtc 2100 gtcgagatgg ccatcgatct gggaacggct gaggccggca ccttcgaagg tgtcgacttc 2160 cagatcaacg acgcgaagaa cggtgctcga atcggcatcc gcaactgggc cgatccgacc 2220 ggtgccggct atcagacggc gtcccattgg ggcgtgctgc gtctgctggc cgatccctcc 2280 gaaaccgaga ccccgggtgg agaagatccc gagacccccg gtgacgagga gactcctggc 2340 gaggataccg agaagcctgg cgacgaggaa acccccggtg aggataccga gaagcctggc 2400 gacgagaagc cgcggccttc cgacgatgct gacaacgacg acaagatgcc gcagaccggt 2460 tccgcggtca tcggaatcgc cgtggtggcg ctgctgctgg ttgccgccgg atgcgggctg 2520 gtcatcgctc ggcgtcgatg a 2541 <210> 90 <211> 846 <212> PRT <213> Bacteria <220> <221> SIGNAL <222> (1)...(40) <400> 90 Met Asp Thr Leu Phe Asn Thr Thr Asp Glu Arg Gly Ala Ser Lys Arg 1 5 10 15 Arg Gly Ile Val Ala Ala Leu Ala Ala Ala Ala Met Leu Val Pro Leu 20 25 30 Ala Phe Ala Pro Thr Ala Met Ala Ala Asp Pro Asp Tyr Pro Gly Gly 35 40 45 Ile Lys Gly Glu Tyr Asn Pro Leu Gly Ile Asn Ala Gly Val Ala Ile 50 55 60 Glu Thr Tyr Thr Leu Asn Gln Asp Lys Glu Lys Ala Leu Val Glu Asn 65 70 75 80 Phe Asp Gln Ile Thr Pro Glu Asn Ser Leu Lys Pro Glu Gly Trp Tyr 85 90 95 Asp Asp Gln His Asn Phe Arg Met Ser Asp Asp Ala Arg Asn Leu Leu 100 105 110 Thr Phe Ala Ser Glu Asn Gly Ile Lys Val Tyr Gly His Val Leu Val 115 120 125 Trp His Ser Gln Thr Pro Asp Trp Phe Phe Gln Ala Asp Glu Trp Cys 130 135 140 His Asp Thr Asn Asp Asn Pro Gly Val Thr Ser Cys Pro Leu Ala Asp 145 150 155 160 Lys Ala Thr Met Gln Glu Arg Gln Arg Arg His Ile Glu Asn Val Ala 165 170 175 Glu Ala Ile Ser Asp Glu Phe Gly Lys Phe Gly Ser Pro Thr Asn Pro 180 185 190 Val Val Ala Phe Asp Val Val Asn Glu Thr Val Asn Asp Ser Asp Asp 195 200 205 Pro Ala Thr Asn Gly Met Arg Asn Ser Leu Trp Tyr Gln Thr Tyr Gly 210 215 220 Gly Glu Asp Tyr Ile Tyr Asp Ala Phe Arg Asn Ala Asn Thr Tyr Leu 225 230 235 240 Asn Asp Val Tyr Ala Ala Asp Asp Ala Glu His Pro Val Thr Leu Phe 245 250 255 Ile Asn Asp Tyr Gly Thr Glu Gln Ala Gly Lys Arg Ser Arg Tyr Lys 260 265 270 Ala Leu Leu Glu Arg Met Ile Gln Gln Gly Val Pro Phe Asp Gly Ile 275 280 285 Gly His Gln Phe His Val Ser Leu Thr Thr Ala Ser Ser Asn Leu Asp 290 295 300 Asp Ala Leu Thr Asp Met Ser Ser Leu Gly Lys Lys Gln Ala Ile Thr 305 310 315 320 Glu Leu Asp Val Ala Thr Gly Thr Pro Val Thr Glu Ala Lys Leu Ile 325 330 335 Glu Gln Gly Arg Tyr Tyr Tyr Asp Val Asn Gln Ile Ile His Arg His 340 345 350 Ala Asp Gln Leu Phe Ser Val Ser Val Trp Gly Leu Ser Asp Asp Gln 355 360 365 Ser Trp Arg Asn Lys Glu Gly Ala Pro Leu Leu Phe Asp Asp Asn Leu 370 375 380 Glu Lys Lys Pro Ala Tyr Ile Gly Tyr Ile Gly Asp Ser Ala Asn Leu 385 390 395 400 Pro Glu Pro Leu Lys Ser Met Asn Ala Phe Lys Asp Asp Ala Val Gly 405 410 415 Ile Asp Ser Ala Leu Pro Gly Thr Val Ala Glu Ser Gly Ala Ser Ser 420 425 430 Pro Trp Glu Arg Leu Ser Leu Val Glu Met Thr Pro Ser Ala Tyr Asp 435 440 445 Ala Val Ser Gly Ser Phe Asn Val Tyr Trp Lys Asp Gly Ser Leu Val 450 455 460 Val Tyr Ala Asp Val Ala Asp Ala Ser Ala Ala Asp Asp Asp Thr Val 465 470 475 480 Thr Val Arg Val Gly Asp Ala Glu Tyr Thr Ile Gly Arg Asn Gly Val 485 490 495 Thr Gly Gly Glu Gly Val Gln Ala Asn Val Val Ser Ser Asp Ala Gly 500 505 510 Tyr Glu Val Val Ala Asp Ile Pro Tyr Thr Gly Ala Glu Lys Asp Ile 515 520 525 Val Glu Met Asn Val Ile Ala Thr Asp Ser Ala Thr Thr Glu Thr Ser 530 535 540 Ala Trp Ser Thr Asn Asp Thr Gly Ala Val Thr Leu Ala Glu Pro Leu 545 550 555 560 Ser Tyr Thr Glu Ala Val Lys Val Pro Ala Asp Ala Gln Ala Pro Val 565 570 575 Val Asp Ala Asp Pro Ser Asp Ser Val Trp Ala Glu Ala Asn Glu Val 580 585 590 Pro Val Gly Lys Val Thr Ala Ala Thr Pro Ser Pro Glu Ala Thr Ala 595 600 605 Thr Ala Lys Thr Leu Trp Ser Asp Gly Lys Leu Tyr Val Leu Met Glu 610 615 620 Val Thr Asp Ala Asp Ile Asp Leu Thr Asn Ser Asn Pro Trp Glu Lys 625 630 635 640 Asp Ser Val Glu Val Tyr Ile Asp Arg Gly Asn Thr Lys Ser Gly Gln 645 650 655 Tyr Thr Asn Asp Ile Gln Gln Ile Arg Val Ser Ala Asp Gly Ala Glu 660 665 670 Leu Ser Phe Gly Ser Gly Ala Ser Glu Asp Val Gln Lys Ser Met Val 675 680 685 Gln Thr Ala Gly Lys Leu Val Asp Gly Gly Tyr Val Val Glu Met Ala 690 695 700 Ile Asp Leu Gly Thr Ala Glu Ala Gly Thr Phe Glu Gly Val Asp Phe 705 710 715 720 Gln Ile Asn Asp Ala Lys Asn Gly Ala Arg Ile Gly Ile Arg Asn Trp 725 730 735 Ala Asp Pro Thr Gly Ala Gly Tyr Gln Thr Ala Ser His Trp Gly Val 740 745 750 Leu Arg Leu Leu Ala Asp Pro Ser Glu Thr Glu Thr Pro Gly Gly Glu 755 760 765 Asp Pro Glu Thr Pro Gly Asp Glu Glu Thr Pro Gly Glu Asp Thr Glu 770 775 780 Lys Pro Gly Asp Glu Glu Thr Pro Gly Glu Asp Thr Glu Lys Pro Gly 785 790 795 800 Asp Glu Lys Pro Arg Pro Ser Asp Asp Ala Asp Asn Asp Asp Lys Met 805 810 815 Pro Gln Thr Gly Ser Ala Val Ile Gly Ile Ala Val Val Ala Leu Leu 820 825 830 Leu Val Ala Ala Gly Cys Gly Leu Val Ile Ala Arg Arg Arg 835 840 845 <210> 91 <211> 1023 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 91 atgaatgtat cggtaccggc cgagtccgca cttaaagaca tcttcgcgga agacttccat 60 ataggtgcgg cggtcagtag taatacgatc aagtcgcagg agagtctgct tacgcatcac 120 tttaacagca ttacggcgga aaacgaaatg aagttcgcca gcgtccatcc agaggaagag 180 ctttacacct tcgaggaagc ggatcagatc gtggacttcg cgcgcaaaca cgggatggct 240 gtccgcggac atacgctggt atggcataac cagaccaccg attggttgtt ccgcgacaag 300 cagaatcagc tcgtgagcaa agccgtgctt tatgaaagaa tccgttcgca tatccaaacg 360 gtagtaggca gatataaggg cgatatttac gcttgggacg ttgtgaacga ggtcattgcc 420 gatgacggcg atcagttgct gcgtacctcc agctggacgg aaatcgccgg ggacgaattc 480 atcgccaaag cgtttgaata cgcgcatgct gccgacccga atgcgctgtt gttctacaac 540 gactacaatg agtcccatcc aagcaaacgg gataaaattt ataccttggt caagtctctt 600 ctggaccggg gagtacctat tcacggcatt ggcctgcagg cacactggaa tctgttcaac 660 ccgtccttgg atgacatccg ggcagccatc gaaaaatatg cttcgctagg attgcagctc 720 cagctcacgg aactggatgt gtcggtattc cgtttcgaag ataagcgggc cgatctgacc 780 gagcctgaac cgggaatgct ggaacagcag gctgaattct acgaagccgt gttcaagctg 840 cttaaggaat acagcgatgt aattagcgcg gtgacgttct ggggagctgc ggacgaccac 900 acctggctca gcgattttcc ggtacgtggg cgcaaaaact ggccgctgct gttcgatgag 960 cggcacaggc cgaagccggc atattatcgc ttagctgctc ttgccaatca tcttcggcgt 1020 tga 1023 <210> 92 <211> 340 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 92 Met Asn Val Ser Val Pro Ala Glu Ser Ala Leu Lys Asp Ile Phe Ala 1 5 10 15 Glu Asp Phe His Ile Gly Ala Ala Val Ser Ser Asn Thr Ile Lys Ser 20 25 30 Gln Glu Ser Leu Leu Thr His His Phe Asn Ser Ile Thr Ala Glu Asn 35 40 45 Glu Met Lys Phe Ala Ser Val His Pro Glu Glu Glu Leu Tyr Thr Phe 50 55 60 Glu Glu Ala Asp Gln Ile Val Asp Phe Ala Arg Lys His Gly Met Ala 65 70 75 80 Val Arg Gly His Thr Leu Val Trp His Asn Gln Thr Thr Asp Trp Leu 85 90 95 Phe Arg Asp Lys Gln Asn Gln Leu Val Ser Lys Ala Val Leu Tyr Glu 100 105 110 Arg Ile Arg Ser His Ile Gln Thr Val Val Gly Arg Tyr Lys Gly Asp 115 120 125 Ile Tyr Ala Trp Asp Val Val Asn Glu Val Ile Ala Asp Asp Gly Asp 130 135 140 Gln Leu Leu Arg Thr Ser Ser Trp Thr Glu Ile Ala Gly Asp Glu Phe 145 150 155 160 Ile Ala Lys Ala Phe Glu Tyr Ala His Ala Ala Asp Pro Asn Ala Leu 165 170 175 Leu Phe Tyr Asn Asp Tyr Asn Glu Ser His Pro Ser Lys Arg Asp Lys 180 185 190 Ile Tyr Thr Leu Val Lys Ser Leu Leu Asp Arg Gly Val Pro Ile His 195 200 205 Gly Ile Gly Leu Gln Ala His Trp Asn Leu Phe Asn Pro Ser Leu Asp 210 215 220 Asp Ile Arg Ala Ala Ile Glu Lys Tyr Ala Ser Leu Gly Leu Gln Leu 225 230 235 240 Gln Leu Thr Glu Leu Asp Val Ser Val Phe Arg Phe Glu Asp Lys Arg 245 250 255 Ala Asp Leu Thr Glu Pro Glu Pro Gly Met Leu Glu Gln Gln Ala Glu 260 265 270 Phe Tyr Glu Ala Val Phe Lys Leu Leu Lys Glu Tyr Ser Asp Val Ile 275 280 285 Ser Ala Val Thr Phe Trp Gly Ala Ala Asp Asp His Thr Trp Leu Ser 290 295 300 Asp Phe Pro Val Arg Gly Arg Lys Asn Trp Pro Leu Leu Phe Asp Glu 305 310 315 320 Arg His Arg Pro Lys Pro Ala Tyr Tyr Arg Leu Ala Ala Leu Ala Asn 325 330 335 His Leu Arg Arg 340 <210> 93 <211> 1011 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 93 atgaatcaat cagtaaatga agcacaggtt cctgcattat cggatgtata tgaagattat 60 ttttcaatag gtgccgctgt taatccactt actttaggta cgcaaaaaaa gctgttaacc 120 aaacatttta atagtataac ggctgagaat gaaatgaaat ttgaagcatt acagcctaaa 180 ccagatcaat ttacatttga tacggcggat aaaatggttg cctttgccca agcacatgat 240 atgaagatgc gtggccatac attaatctgg cacaatcaaa caccagattg gatgtttttg 300 caaaaagacg gtacgacaat tgatcgtgaa acactcttgg agagaatgaa aaaacatatt 360 aagacggtgg tggaaagata taaaggcaaa atatattgtt gggacgttgt aaatgaagcg 420 gtagctgatg aaggcgaagc tattttaaga ccatcaaaat ggacggacat tattggcgac 480 tcgtttattg agtatgcttt taaatacgcc cacgaggccg atcccgatgc actgttgttt 540 tacaatgact acaatgcttg ccaccctcat aaaagagata agatttatca acttgtaaag 600 gggttaatag acaagggtgt gcccatacac ggtattggcc tacaagcaca ttggaacatt 660 gttgacccgt cttacgatga tattaaacga gccatcgaaa cttatgcatc attaggatta 720 agcatacact ttactgaaat ggatgtgtct gtttttgaat atcatgatcg aagaacagac 780 ttattggaac ctacaaaaga tatggtttca cgtcaagctg agcgttatca ggcatttttt 840 gaaatattta ggtcgtatgc tgatgtgatt gattccgtta cgttttgggg catggccgat 900 gattatacat ggcttgatga ttttccggtg acaggtcgaa aaaattggcc ctttgtattt 960 gatgcgagac atcagcctaa aacagcattc tggaacatcg ttgattttta a 1011 <210> 94 <211> 336 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 94 Met Asn Gln Ser Val Asn Glu Ala Gln Val Pro Ala Leu Ser Asp Val 1 5 10 15 Tyr Glu Asp Tyr Phe Ser Ile Gly Ala Ala Val Asn Pro Leu Thr Leu 20 25 30 Gly Thr Gln Lys Lys Leu Leu Thr Lys His Phe Asn Ser Ile Thr Ala 35 40 45 Glu Asn Glu Met Lys Phe Glu Ala Leu Gln Pro Lys Pro Asp Gln Phe 50 55 60 Thr Phe Asp Thr Ala Asp Lys Met Val Ala Phe Ala Gln Ala His Asp 65 70 75 80 Met Lys Met Arg Gly His Thr Leu Ile Trp His Asn Gln Thr Pro Asp 85 90 95 Trp Met Phe Leu Gln Lys Asp Gly Thr Thr Ile Asp Arg Glu Thr Leu 100 105 110 Leu Glu Arg Met Lys Lys His Ile Lys Thr Val Val Glu Arg Tyr Lys 115 120 125 Gly Lys Ile Tyr Cys Trp Asp Val Val Asn Glu Ala Val Ala Asp Glu 130 135 140 Gly Glu Ala Ile Leu Arg Pro Ser Lys Trp Thr Asp Ile Ile Gly Asp 145 150 155 160 Ser Phe Ile Glu Tyr Ala Phe Lys Tyr Ala His Glu Ala Asp Pro Asp 165 170 175 Ala Leu Leu Phe Tyr Asn Asp Tyr Asn Ala Cys His Pro His Lys Arg 180 185 190 Asp Lys Ile Tyr Gln Leu Val Lys Gly Leu Ile Asp Lys Gly Val Pro 195 200 205 Ile His Gly Ile Gly Leu Gln Ala His Trp Asn Ile Val Asp Pro Ser 210 215 220 Tyr Asp Asp Ile Lys Arg Ala Ile Glu Thr Tyr Ala Ser Leu Gly Leu 225 230 235 240 Ser Ile His Phe Thr Glu Met Asp Val Ser Val Phe Glu Tyr His Asp 245 250 255 Arg Arg Thr Asp Leu Leu Glu Pro Thr Lys Asp Met Val Ser Arg Gln 260 265 270 Ala Glu Arg Tyr Gln Ala Phe Phe Glu Ile Phe Arg Ser Tyr Ala Asp 275 280 285 Val Ile Asp Ser Val Thr Phe Trp Gly Met Ala Asp Asp Tyr Thr Trp 290 295 300 Leu Asp Asp Phe Pro Val Thr Gly Arg Lys Asn Trp Pro Phe Val Phe 305 310 315 320 Asp Ala Arg His Gln Pro Lys Thr Ala Phe Trp Asn Ile Val Asp Phe 325 330 335 <210> 95 <211> 1143 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 95 atgaaaaaaa cgattgcaca tttcacctta tggatagtgt tttttctctt cacttcctgt 60 gctgttacgg cgcagaagaa tgctaagaat acaagagtaa aactcactac cctaaaagag 120 gcttaccaag gtaaattcta tatcggtact gcgatgaatc tgagacagat tcacggagat 180 gatccccagt ctgaaaatat tatcaaaaaa cagttcaatt ccatagttgc cgaaaactgc 240 atgaagagta tgtatcttca gccggaggaa ggaaaatttt tcttcgatga tgcggacaag 300 tttgtggatt ttggtcttca gaacaatatg ttcatcatcg ggcattgtct gatttggcat 360 tcgcaggcgc caaaatggtt tttcaccgat gagaatggaa aaacggtttc cccagaagtt 420 cttaaacaaa ggatgaaagc ccatatcacc gctgtcgttt cccgctacaa agggaaaatc 480 aaaggttggg atgtggtgaa cgaagccatt atggaagatg gttcttaccg caaaagcaaa 540 ttttatgaga ttttgggaga agaatttatt ccgttggcat ttcagtatgc gcatgaagca 600 gatcctgatg cagaacttta ttacaacgat tataacgaat ggtatcccgg aaaaagagct 660 acggtgacca agataatccg cgatttcaaa tctagaggaa tccgcattga tgccatcgga 720 atgcaggctc atttcgggat ggattcgccc actttagaag agtatgaaca aaccattcag 780 ggctatataa aagaaggcgt gaaagtcaat attacggaac tcgatttgag tccgcttcct 840 tctccttggg gaacttccgc caatgttgcc gatacgcagc agtatcagga aaaaatgaat 900 ccttacacca aaggacttcc cgccgatgtg gaaaaagcat gggaaaaccg ctatctcgat 960 tttttcaaac tgttcctgaa atatcatcag catatcgagc gtgttacgtt ttggggcgtt 1020 agcgatatcg attcctggaa gaacgatttt ccagtaagag gacgtaccga ttatccacta 1080 ccgtttaacc gacagtatca ggcaaaacct ttggtgcaga aattaataga cttaacgaaa 1140 tag 1143 <210> 96 <211> 380 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(24) <400> 96 Met Lys Lys Thr Ile Ala His Phe Thr Leu Trp Ile Val Phe Phe Leu 1 5 10 15 Phe Thr Ser Cys Ala Val Thr Ala Gln Lys Asn Ala Lys Asn Thr Arg 20 25 30 Val Lys Leu Thr Thr Leu Lys Glu Ala Tyr Gln Gly Lys Phe Tyr Ile 35 40 45 Gly Thr Ala Met Asn Leu Arg Gln Ile His Gly Asp Asp Pro Gln Ser 50 55 60 Glu Asn Ile Ile Lys Lys Gln Phe Asn Ser Ile Val Ala Glu Asn Cys 65 70 75 80 Met Lys Ser Met Tyr Leu Gln Pro Glu Glu Gly Lys Phe Phe Phe Asp 85 90 95 Asp Ala Asp Lys Phe Val Asp Phe Gly Leu Gln Asn Asn Met Phe Ile 100 105 110 Ile Gly His Cys Leu Ile Trp His Ser Gln Ala Pro Lys Trp Phe Phe 115 120 125 Thr Asp Glu Asn Gly Lys Thr Val Ser Pro Glu Val Leu Lys Gln Arg 130 135 140 Met Lys Ala His Ile Thr Ala Val Val Ser Arg Tyr Lys Gly Lys Ile 145 150 155 160 Lys Gly Trp Asp Val Val Asn Glu Ala Ile Met Glu Asp Gly Ser Tyr 165 170 175 Arg Lys Ser Lys Phe Tyr Glu Ile Leu Gly Glu Glu Phe Ile Pro Leu 180 185 190 Ala Phe Gln Tyr Ala His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr 195 200 205 Asn Asp Tyr Asn Glu Trp Tyr Pro Gly Lys Arg Ala Thr Val Thr Lys 210 215 220 Ile Ile Arg Asp Phe Lys Ser Arg Gly Ile Arg Ile Asp Ala Ile Gly 225 230 235 240 Met Gln Ala His Phe Gly Met Asp Ser Pro Thr Leu Glu Glu Tyr Glu 245 250 255 Gln Thr Ile Gln Gly Tyr Ile Lys Glu Gly Val Lys Val Asn Ile Thr 260 265 270 Glu Leu Asp Leu Ser Pro Leu Pro Ser Pro Trp Gly Thr Ser Ala Asn 275 280 285 Val Ala Asp Thr Gln Gln Tyr Gln Glu Lys Met Asn Pro Tyr Thr Lys 290 295 300 Gly Leu Pro Ala Asp Val Glu Lys Ala Trp Glu Asn Arg Tyr Leu Asp 305 310 315 320 Phe Phe Lys Leu Phe Leu Lys Tyr His Gln His Ile Glu Arg Val Thr 325 330 335 Phe Trp Gly Val Ser Asp Ile Asp Ser Trp Lys Asn Asp Phe Pro Val 340 345 350 Arg Gly Arg Thr Asp Tyr Pro Leu Pro Phe Asn Arg Gln Tyr Gln Ala 355 360 365 Lys Pro Leu Val Gln Lys Leu Ile Asp Leu Thr Lys 370 375 380 <210> 97 <211> 1407 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 97 atgaatgaaa cctcgcggaa ttggttggag agaggattgc ctttcgaacg ccaacggcgt 60 tccaacattc agcccagggt tggcgcttgc gcctaccctg ggttggaagc aatcgctcca 120 tcaaccctga aagggttgca gcggaggttt gcacaagacc gatacaaccc tttcaggatt 180 ggctttctcc cttttccacc cagggtagcg cctgcggcgc aaccctgggc tgatggatca 240 gaacgccgtt ggcgttcccg gaaacctgcg aagaaacaac tcgccttcct ggccatcacc 300 agtctcctct cgggtctgct gtggggcgcc gaagtgcaac cggcactgaa agacgtattc 360 cgccaggact tcctgctggg ggcggcgttg aacgcggagc aggtgctgga caccaaccgg 420 gtcgagtcgg tattgatcga aaagcatttc aacacgatca cgcccgagaa tgtgctgaag 480 tgggaacgag tccatcctca gcccaaccag tattcttttg aggacgcgga tcgctacgtc 540 gagttcggcc gcaaacacgg aatggtcatc atcggccaca cgctggtctg gcacagccag 600 acgcccggct gggtcttccg ggatgccgac ggaaagacgc tgacgcgcga agccctgctg 660 gagcggatgc gcgaccacat ccacaccgtg gtcgggcgct acaagggcaa gatccgcggc 720 tgggatgtgg tgaacgaggc gctgcgcgac gacggcgcgt ggcggaattc ccaatggcgg 780 cggatcatcg gcgacgatta cattttgaaa gccttccagt atgcccatga ggccgatccg 840 gatgcggagc tctattacaa cgattattcg ctggagaagc cggccaagcg caatggcgcc 900 gtggacctgg tgaagcagct ccaggccggc ggggcgaagc tggccggcgt cggcttgcag 960 gggcactaca acctcgactg gccggagacc gccgagatcg aaaacaccat cgcggcgttc 1020 gcggagctgg ggctcaaggt gatgatcacg gagctggacg tcaacgcgct gccgacgccc 1080 ggccagtcgg gcgaagccga tgtagggatg acgttcggcg gcaatttcgg cggcgataaa 1140 tggaatcctt tcacgaacgg actgccggcc gcagtggagc aacgcctcgc ggaccgctac 1200 gctgaaatct tcaggatctt cacgaagcac agccgtcgga tttcgcgcgt caccttctgg 1260 ggcgtcaccg accggacctc ctggctcaac aattttccca tccgcggccg gaccaattac 1320 ccgttgctct ttgatcgggc tggggagccc aaacccgcgt tccgatccgt cgtggcggtc 1380 cgtcagccgc gccagcccgt cgaatga 1407 <210> 98 <211> 468 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 98 Met Asn Glu Thr Ser Arg Asn Trp Leu Glu Arg Gly Leu Pro Phe Glu 1 5 10 15 Arg Gln Arg Arg Ser Asn Ile Gln Pro Arg Val Gly Ala Cys Ala Tyr 20 25 30 Pro Gly Leu Glu Ala Ile Ala Pro Ser Thr Leu Lys Gly Leu Gln Arg 35 40 45 Arg Phe Ala Gln Asp Arg Tyr Asn Pro Phe Arg Ile Gly Phe Leu Pro 50 55 60 Phe Pro Pro Arg Val Ala Pro Ala Ala Gln Pro Trp Ala Asp Gly Ser 65 70 75 80 Glu Arg Arg Trp Arg Ser Arg Lys Pro Ala Lys Lys Gln Leu Ala Phe 85 90 95 Leu Ala Ile Thr Ser Leu Leu Ser Gly Leu Leu Trp Gly Ala Glu Val 100 105 110 Gln Pro Ala Leu Lys Asp Val Phe Arg Gln Asp Phe Leu Leu Gly Ala 115 120 125 Ala Leu Asn Ala Glu Gln Val Leu Asp Thr Asn Arg Val Glu Ser Val 130 135 140 Leu Ile Glu Lys His Phe Asn Thr Ile Thr Pro Glu Asn Val Leu Lys 145 150 155 160 Trp Glu Arg Val His Pro Gln Pro Asn Gln Tyr Ser Phe Glu Asp Ala 165 170 175 Asp Arg Tyr Val Glu Phe Gly Arg Lys His Gly Met Val Ile Ile Gly 180 185 190 His Thr Leu Val Trp His Ser Gln Thr Pro Gly Trp Val Phe Arg Asp 195 200 205 Ala Asp Gly Lys Thr Leu Thr Arg Glu Ala Leu Leu Glu Arg Met Arg 210 215 220 Asp His Ile His Thr Val Val Gly Arg Tyr Lys Gly Lys Ile Arg Gly 225 230 235 240 Trp Asp Val Val Asn Glu Ala Leu Arg Asp Asp Gly Ala Trp Arg Asn 245 250 255 Ser Gln Trp Arg Arg Ile Ile Gly Asp Asp Tyr Ile Leu Lys Ala Phe 260 265 270 Gln Tyr Ala His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr Asn Asp 275 280 285 Tyr Ser Leu Glu Lys Pro Ala Lys Arg Asn Gly Ala Val Asp Leu Val 290 295 300 Lys Gln Leu Gln Ala Gly Gly Ala Lys Leu Ala Gly Val Gly Leu Gln 305 310 315 320 Gly His Tyr Asn Leu Asp Trp Pro Glu Thr Ala Glu Ile Glu Asn Thr 325 330 335 Ile Ala Ala Phe Ala Glu Leu Gly Leu Lys Val Met Ile Thr Glu Leu 340 345 350 Asp Val Asn Ala Leu Pro Thr Pro Gly Gln Ser Gly Glu Ala Asp Val 355 360 365 Gly Met Thr Phe Gly Gly Asn Phe Gly Gly Asp Lys Trp Asn Pro Phe 370 375 380 Thr Asn Gly Leu Pro Ala Ala Val Glu Gln Arg Leu Ala Asp Arg Tyr 385 390 395 400 Ala Glu Ile Phe Arg Ile Phe Thr Lys His Ser Arg Arg Ile Ser Arg 405 410 415 Val Thr Phe Trp Gly Val Thr Asp Arg Thr Ser Trp Leu Asn Asn Phe 420 425 430 Pro Ile Arg Gly Arg Thr Asn Tyr Pro Leu Leu Phe Asp Arg Ala Gly 435 440 445 Glu Pro Lys Pro Ala Phe Arg Ser Val Val Ala Val Arg Gln Pro Arg 450 455 460 Gln Pro Val Glu 465 <210> 99 <211> 1074 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 99 gtgcgctcaa gagctagcgc gtactggttc ggcgtggggt tggtggtggc gctgagcctg 60 gctcagaccc cttcccccca gtccctgcgc gcgctggccg agcgccaggg gctgctggtg 120 ggagccgcgg tggacctagc ggccctgtac gaccccctcg agcccgagta cgcccaactc 180 ctcgcccgcg agttcaacct ggtggtggcc gagaacgcca tgaagtgggc ctccctgagc 240 aacgcgcggg ggcagtacag cttcaccggc gctgacgccc tggtgcgctt cgcccgccag 300 cacggccagc gcttgcgcgg ccacaccctc atctggcacg agcaactgcc cgcgtgggtg 360 cgcagcggca ccttctcccg cgaggccatg ctggcggtga tgcaggagca cattcaggcg 420 gtggccgggc acttccgcgg ccaggtggcc tactgggacg tggtcaacga ggcggtgagt 480 gaccggggcg gcctgcgcga gacccccttt ctgcgggcgg tgggccccga ctacctcgag 540 cacgccttcc gcttcgcccg cgccgccgac ccccaggcca agctcttcta caacgactac 600 ggcgccgacg gcatgggcgc taaatcggac gagatctacg ccctgctcaa agcgctcaag 660 gccaaggggg tacccgtcga cggggtgggc ttccaggccc acctcgacag caccttctcg 720 gtccagcagg cgcggatgcg ggagaaccta gagacgcttc gccgacctgg gcctcgaggt 780 gcacatcacc gagctggacg tgcagctaaa aggggcgggc tcgcgggagg aacggctgga 840 ggcgcaggcc cggatctacg ccgaggtgct ggcgacctgc cgcgcggtcc gcggctgcag 900 cgccgtgacg ctgtggggct tcaccgacgc ccactcctgg cgagccgccg ccgaacccct 960 gatcttcgac gcgctctacc ggcccaaacc ggcgtaccag gctctgctgc gggctctggg 1020 aggcaaccct tgagcctttt cagcccagtt ttgccaacga ggacagcact atga 1074 <210> 100 <211> 357 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(33) <400> 100 Val Arg Ser Arg Ala Ser Ala Tyr Trp Phe Gly Val Gly Leu Val Val 1 5 10 15 Ala Leu Ser Leu Ala Gln Thr Pro Ser Pro Gln Ser Leu Arg Ala Leu 20 25 30 Ala Glu Arg Gln Gly Leu Leu Val Gly Ala Ala Val Asp Leu Ala Ala 35 40 45 Leu Tyr Asp Pro Leu Glu Pro Glu Tyr Ala Gln Leu Leu Ala Arg Glu 50 55 60 Phe Asn Leu Val Val Ala Glu Asn Ala Met Lys Trp Ala Ser Leu Ser 65 70 75 80 Asn Ala Arg Gly Gln Tyr Ser Phe Thr Gly Ala Asp Ala Leu Val Arg 85 90 95 Phe Ala Arg Gln His Gly Gln Arg Leu Arg Gly His Thr Leu Ile Trp 100 105 110 His Glu Gln Leu Pro Ala Trp Val Arg Ser Gly Thr Phe Ser Arg Glu 115 120 125 Ala Met Leu Ala Val Met Gln Glu His Ile Gln Ala Val Ala Gly His 130 135 140 Phe Arg Gly Gln Val Ala Tyr Trp Asp Val Val Asn Glu Ala Val Ser 145 150 155 160 Asp Arg Gly Gly Leu Arg Glu Thr Pro Phe Leu Arg Ala Val Gly Pro 165 170 175 Asp Tyr Leu Glu His Ala Phe Arg Phe Ala Arg Ala Ala Asp Pro Gln 180 185 190 Ala Lys Leu Phe Tyr Asn Asp Tyr Gly Ala Asp Gly Met Gly Ala Lys 195 200 205 Ser Asp Glu Ile Tyr Ala Leu Leu Lys Ala Leu Lys Ala Lys Gly Val 210 215 220 Pro Val Asp Gly Val Gly Phe Gln Ala His Leu Asp Ser Thr Phe Ser 225 230 235 240 Val Gln Gln Ala Arg Met Arg Glu Asn Leu Glu Thr Leu Arg Arg Pro 245 250 255 Gly Pro Arg Gly Ala His His Arg Ala Gly Arg Ala Ala Lys Arg Gly 260 265 270 Gly Leu Ala Gly Gly Thr Ala Gly Gly Ala Gly Pro Asp Leu Arg Arg 275 280 285 Gly Ala Gly Asp Leu Pro Arg Gly Pro Arg Leu Gln Arg Arg Asp Ala 290 295 300 Val Gly Leu His Arg Arg Pro Leu Leu Ala Ser Arg Arg Arg Thr Pro 305 310 315 320 Asp Leu Arg Arg Ala Leu Pro Ala Gln Thr Gly Val Pro Gly Ser Ala 325 330 335 Ala Gly Ser Gly Arg Gln Pro Leu Ser Leu Phe Ser Pro Val Leu Pro 340 345 350 Thr Arg Thr Ala Leu 355 <210> 101 <211> 1131 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 101 atgaagtatt ggcttacaac cctggtttta atgatagcgg gaataccctt ggcttttggt 60 tcttcagcaa agcaagataa atcaaagagt ttgaaagatg ctttcaaaaa caaattctat 120 atcggtgtgg ctttgaaccg gagtcaatat ctggaacaaa acgaacaggc ggataaagag 180 ataaaggcac agttcagctc tattgtagct gagaactgca tgaaaagcga aaatctggaa 240 cctaaagagg gaaaattctt ctttgacgat gccgatcgtt ttgtcgcttt tggagaaaaa 300 aatggaatgt acatcattgg acatacctta atttggcatt ctcaagtgcc aaaatggttt 360 ttcatagata atgaaggcaa agttgtttcc cgggaagttt tgattgaacg aatgaaaaac 420 tacatccata cagttgtcgg tcattataaa ggtcgagtta aaggttggga tgttgtcaat 480 gaggccattc tagatgatgg ctcatttaga caaagtaatt tctttaaaat actaggagcc 540 gattttatta aacttgcttt tcaatttgcc catgaagcag atcccaatgc tgagctttat 600 tacaacgatt attcgatgtc caatccgacc aaaagagacg gagtggttcg catggtgaag 660 tcattgcagc aacaaggtgt gagaatagac gctatcggaa tgcagggaca cgtagggatg 720 gattatccca agttggatga gtttgaaaat agtatcaaag ctttttcgtc tttaggaacc 780 aaagtgatga ttacggaact cgatttaagt gtcctaccaa ctcctaaagg aaaacaaggt 840 gctaatattt cggatgttgc cgcttatgag gaaaagataa atccttacaa aaatggtctg 900 ccggctgaag ttgaaaaggc ttgggaagac cggtatttgg attttttcaa attatttttg 960 aaatatcaac accaaatttc aagggttaca ttatgggggc ttagtgatca ggattcgtgg 1020 aaaaatgatt tcccagtcag agggagaacg gattatcctt tgcttttcga cagacaatac 1080 aaaccaaaac ctgtagttca gaaaattatt aaattagcat tgaaaaaata a 1131 <210> 102 <211> 376 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(23) <400> 102 Met Lys Tyr Trp Leu Thr Thr Leu Val Leu Met Ile Ala Gly Ile Pro 1 5 10 15 Leu Ala Phe Gly Ser Ser Ala Lys Gln Asp Lys Ser Lys Ser Leu Lys 20 25 30 Asp Ala Phe Lys Asn Lys Phe Tyr Ile Gly Val Ala Leu Asn Arg Ser 35 40 45 Gln Tyr Leu Glu Gln Asn Glu Gln Ala Asp Lys Glu Ile Lys Ala Gln 50 55 60 Phe Ser Ser Ile Val Ala Glu Asn Cys Met Lys Ser Glu Asn Leu Glu 65 70 75 80 Pro Lys Glu Gly Lys Phe Phe Phe Asp Asp Ala Asp Arg Phe Val Ala 85 90 95 Phe Gly Glu Lys Asn Gly Met Tyr Ile Ile Gly His Thr Leu Ile Trp 100 105 110 His Ser Gln Val Pro Lys Trp Phe Phe Ile Asp Asn Glu Gly Lys Val 115 120 125 Val Ser Arg Glu Val Leu Ile Glu Arg Met Lys Asn Tyr Ile His Thr 130 135 140 Val Val Gly His Tyr Lys Gly Arg Val Lys Gly Trp Asp Val Val Asn 145 150 155 160 Glu Ala Ile Leu Asp Asp Gly Ser Phe Arg Gln Ser Asn Phe Phe Lys 165 170 175 Ile Leu Gly Ala Asp Phe Ile Lys Leu Ala Phe Gln Phe Ala His Glu 180 185 190 Ala Asp Pro Asn Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Met Ser Asn 195 200 205 Pro Thr Lys Arg Asp Gly Val Val Arg Met Val Lys Ser Leu Gln Gln 210 215 220 Gln Gly Val Arg Ile Asp Ala Ile Gly Met Gln Gly His Val Gly Met 225 230 235 240 Asp Tyr Pro Lys Leu Asp Glu Phe Glu Asn Ser Ile Lys Ala Phe Ser 245 250 255 Ser Leu Gly Thr Lys Val Met Ile Thr Glu Leu Asp Leu Ser Val Leu 260 265 270 Pro Thr Pro Lys Gly Lys Gln Gly Ala Asn Ile Ser Asp Val Ala Ala 275 280 285 Tyr Glu Glu Lys Ile Asn Pro Tyr Lys Asn Gly Leu Pro Ala Glu Val 290 295 300 Glu Lys Ala Trp Glu Asp Arg Tyr Leu Asp Phe Phe Lys Leu Phe Leu 305 310 315 320 Lys Tyr Gln His Gln Ile Ser Arg Val Thr Leu Trp Gly Leu Ser Asp 325 330 335 Gln Asp Ser Trp Lys Asn Asp Phe Pro Val Arg Gly Arg Thr Asp Tyr 340 345 350 Pro Leu Leu Phe Asp Arg Gln Tyr Lys Pro Lys Pro Val Val Gln Lys 355 360 365 Ile Ile Lys Leu Ala Leu Lys Lys 370 375 <210> 103 <211> 1449 <212> DNA <213> Bacteria <220> <223> Obtained from an environmental sample <400> 103 atgcgttcac attcccttcc cccgtccacc gtccgccgga aattgggcgg cctcggcgcg 60 gcgctgctcg tcggcgccgt cggcgccgcc accgtgctcg tggcgcccct cacctcgcac 120 gccgccgaga gcacgctcgg cgccgcggcg aagcagagcg gccggtactt cggcaccgcc 180 atcgcctcgg gcaggctcaa cgactcgacg tacacgacga tcgcgaaccg cgagttcaac 240 tcggtgaccg ccgagaacga gatgaagatc gacgccaccg aaccccagca gggccgcttc 300 gacttcaccg ccggcgaccg cgtctacaac tgggcggtgc agaacggcaa gcaggtacgg 360 ggccacaccc tggcctggca ctcccagcag cccgcctgga tgcagaacct cagcggcagc 420 gcgctgcgca cggcgatgac caaccacatc aacggcgtca tggcccacta caagggcaag 480 atcggccagt gggacgtcgt caacgaggcg ttcgcggacg gcagttcggg agcgcgccgg 540 gactccaacc tccagcggag cggcaacgac tggatcgagg tcgccttccg caccgcccgc 600 gccgccgacc cggccgccaa gctctgctac aacgactaca acgtcgagaa ctggacgtgg 660 gccaagaccc aggccatgta cgccatggtc aaggacttca agcagcgcgg cgtgcccatc 720 gactgcgtcg gcttccagtc gcacttcaac aacgacagcc cctacaacag caacttccgc 780 accaccctcc agagtttcgc cgccctcggc gtcgacgtgg ccatcaccga actcgacatc 840 cagggcgcct cgggcacgac ctacgccaac gtgaccaacg actgcctggc cgtcccgcgc 900 tgcctcggca tcaccgtctg gggtgtccgc gacaccgact cctggcgagc cgagcacact 960 ccgctgctct tcaacggcga cggcagcaag aagcccgcct actcctccgt cctcaacgcc 1020 ctcaactccg tctcccccaa ccccaacccc actccgaccc cctcccccgg cgccgggccg 1080 atcaagggag tcgcctcggg ccgctgcgtg gacgtacccg gagccggcac cgccgacggc 1140 acccaggtcc agctgtggga ctgcaacaac cgcaccaacc agcagtggac cctcaccgcc 1200 gccggtgagc tcagggtcta cggcgacaag tgcctggacg ccgccggcac cggcaacggc 1260 gccaaggtcc agatctacag ctgctggggc ggcgacaacc agaagtggcg cctcaactcc 1320 gacggttcca tcgtcggtgt ccagtccggc ctctgcctcg acgccgctgc cggcggcacc 1380 gccaacggca cgctgatcca gctctactcc tgctggaaca gcggcaacca gcgctggacc 1440 cgcacctga 1449 <210> 104 <211> 482 <212> PRT <213> Bacteria <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(41) <400> 104 Met Arg Ser His Ser Leu Pro Pro Ser Thr Val Arg Arg Lys Leu Gly 1 5 10 15 Gly Leu Gly Ala Ala Leu Leu Val Gly Ala Val Gly Ala Ala Thr Val 20 25 30 Leu Val Ala Pro Leu Thr Ser His Ala Ala Glu Ser Thr Leu Gly Ala 35 40 45 Ala Ala Lys Gln Ser Gly Arg Tyr Phe Gly Thr Ala Ile Ala Ser Gly 50 55 60 Arg Leu Asn Asp Ser Thr Tyr Thr Thr Ile Ala Asn Arg Glu Phe Asn 65 70 75 80 Ser Val Thr Ala Glu Asn Glu Met Lys Ile Asp Ala Thr Glu Pro Gln 85 90 95 Gln Gly Arg Phe Asp Phe Thr Ala Gly Asp Arg Val Tyr Asn Trp Ala 100 105 110 Val Gln Asn Gly Lys Gln Val Arg Gly His Thr Leu Ala Trp His Ser 115 120 125 Gln Gln Pro Ala Trp Met Gln Asn Leu Ser Gly Ser Ala Leu Arg Thr 130 135 140 Ala Met Thr Asn His Ile Asn Gly Val Met Ala His Tyr Lys Gly Lys 145 150 155 160 Ile Gly Gln Trp Asp Val Val Asn Glu Ala Phe Ala Asp Gly Ser Ser 165 170 175 Gly Ala Arg Arg Asp Ser Asn Leu Gln Arg Ser Gly Asn Asp Trp Ile 180 185 190 Glu Val Ala Phe Arg Thr Ala Arg Ala Ala Asp Pro Ala Ala Lys Leu 195 200 205 Cys Tyr Asn Asp Tyr Asn Val Glu Asn Trp Thr Trp Ala Lys Thr Gln 210 215 220 Ala Met Tyr Ala Met Val Lys Asp Phe Lys Gln Arg Gly Val Pro Ile 225 230 235 240 Asp Cys Val Gly Phe Gln Ser His Phe Asn Asn Asp Ser Pro Tyr Asn 245 250 255 Ser Asn Phe Arg Thr Thr Leu Gln Ser Phe Ala Ala Leu Gly Val Asp 260 265 270 Val Ala Ile Thr Glu Leu Asp Ile Gln Gly Ala Ser Gly Thr Thr Tyr 275 280 285 Ala Asn Val Thr Asn Asp Cys Leu Ala Val Pro Arg Cys Leu Gly Ile 290 295 300 Thr Val Trp Gly Val Arg Asp Thr Asp Ser Trp Arg Ala Glu His Thr 305 310 315 320 Pro Leu Leu Phe Asn Gly Asp Gly Ser Lys Lys Pro Ala Tyr Ser Ser 325 330 335 Val Leu Asn Ala Leu Asn Ser Val Ser Pro Asn Pro Asn Pro Thr Pro 340 345 350 Thr Pro Ser Pro Gly Ala Gly Pro Ile Lys Gly Val Ala Ser Gly Arg 355 360 365 Cys Val Asp Val Pro Gly Ala Gly Thr Ala Asp Gly Thr Gln Val Gln 370 375 380 Leu Trp Asp Cys Asn Asn Arg Thr Asn Gln Gln Trp Thr Leu Thr Ala 385 390 395 400 Ala Gly Glu Leu Arg Val Tyr Gly Asp Lys Cys Leu Asp Ala Ala Gly 405 410 415 Thr Gly Asn Gly Ala Lys Val Gln Ile Tyr Ser Cys Trp Gly Gly Asp 420 425 430 Asn Gln Lys Trp Arg Leu Asn Ser Asp Gly Ser Ile Val Gly Val Gln 435 440 445 Ser Gly Leu Cys Leu Asp Ala Ala Ala Gly Gly Thr Ala Asn Gly Thr 450 455 460 Leu Ile Gln Leu Tyr Ser Cys Trp Asn Ser Gly Asn Gln Arg Trp Thr 465 470 475 480 Arg Thr <210> 105 <211> 2793 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 105 atgaagttca ctttgatgcc gctgctgtgc gggttcgcct tgctgttggg ttgcgcggtg 60 caggcaaccc cagccgcttc gttacagcag gcttatcagc cgtatttcca tatcggtact 120 gccgtcagct tggcgcaact gcaagcatcg aaaaaccatg aacgagattt aatcgcccag 180 cactttaaca gtctgaccgc tgaaaacctg atgaaatggg aaaaaatcca accgactgaa 240 ggcaactttg attttacagc ggccgacaag ctcgtcgctt ttgctgaaca acatcggatg 300 tggctggtcg gccatacgat cctgtggcat gaacaaaccc cggactgggt atttcagggg 360 ccagatggca aaccggccag caagcaagtg ttactcggca gattaaaaaa gcatatccaa 420 actgtggtcg gtcgttacca aggtcgggta catggctggg atgtagtgaa tgaagcgctg 480 aatgaagatg gcagtctgcg cgatacgccg tggcgaaaaa ttctgggtga tgattacatt 540 gccaccactt ttgcgctggt gcatcaggtc gaccccaaag ccaaactcta ttacaacgac 600 tacaacctgt ataaaccaaa aaaacgcact ggcgtgctac ggatcatcca gcaactgcag 660 caacaacaag tgcccattca tgccattggc gaacaagcgc attatggtct cgattcgccg 720 aaattgcagg aagttgaaga ctcgatcaac gcctttgcag ccaccggcct cgacgtgatg 780 ctgaccgagt tggaaatttc ggtgctaccg tttccgcctg gcatgacacc aggcgccgat 840 atcagtcagc atcaggaact gcaacaacag ctgaatcctt accgcgaagg cttaccaaaa 900 accgtcgaac aggcctggca acaacgttat ctggatctgt tttcgctgtt attgcgccag 960 catcaaaaat tacaccgggt gacgttttgg ggtttagatg atggccaaag ctggcgcaat 1020 aactttccaa tgcgcggtcg taccgattac ccgctactgt ttgaccgcaa gctgcaagcc 1080 aaaccgctat tgagcgcact gatcaaactg gcagaaactc aagcctcagc caagccgaaa 1140 gtaaatcagc tcggttttgc gccaaatgcg caaaaattgc tggtggtgcc ggggcggcag 1200 gcggtgtcgt ttcagatcat caatcaaagc aacggcaaaa cggtgttgca aggccaaagt 1260 tcggtggctc agttttggcc cgaatcgggc gagtgggtca gtatcgctga cttttcgacc 1320 ttaaccaccc aagggcgtta tcaggttgaa gcggctggat taactccgat caccgtcgag 1380 attactgctg aaccttatgc cgcgctgcat gatgcgtcca tcaaagccta ttattttaat 1440 cgcgcctcgc tggcgctgga gccaagtttt gccgggcctt gggcgcgcgc tgccggtcat 1500 ccggataaca aagtgttggt gcacacttcc gccgcttccg acaagcgacc agccggtttt 1560 gtgatcagcg ccgctaaagg ctggtatgac gccggtgact ataacaaata cgtggtcaat 1620 tccggtattt ccagttacac cctattgcaa gcctggcagg attttcctga gttttatcgc 1680 gacagaacat ggaatcttcc ggagtccagc aacaacctac cagacattct cgacgagacg 1740 ttatggaatt tacagtggct gagcaccatg caggacccaa gcgacggcgg cgtgtatcac 1800 aagctgactg aactgaattt ctctgctacc caaatgccgt cagaagtgac agcgccacgt 1860 tatgtggtgc aaaaaaccac ggcagcggca cttaatttcg cggcggtgct ggccaaagcc 1920 agtcgcattt ttacagaatt tgaaacgcaa ctgcccggcc tgtcacagca atatcgccag 1980 caagcattag cagcctggca atgggcgcaa aaaaatccac aacaaattta tcagcaacca 2040 gccgatgttc acaccggtgc ttatggcgac aaacagctgg ctgatgaatg ggcttgggct 2100 ggggcggagc tatatttatt aaccggtgag cagagttacc tgcagccgtt gttggcactt 2160 gagacgccaa tcaccgcagc ttcctgggcc aatgtggcgg cgttgggtta ttttgcgttg 2220 gcatccgctg aacagtttga gcctgcactt cgaaaaaaag tgcagcaaaa aatccaacaa 2280 gccgcggcgc aaattgtagc cgagcatcaa gcgtccgcct accaggtggc gatgactcaa 2340 aaagattttg tctggggcag taatgcggtg gcgatgaaca aaggcatgtt gttatatcaa 2400 gcgtggaaaa ttgacccaca accagagctg cgacaggcga tgcaagggct gctggattac 2460 gtcctcggtc gcaacccgct gcagctgtct tatgtcacag gttttggtgc gcaaagcccg 2520 caacatatcc atcaccgccc ctcggcggca gatcagatca aagcaccagt gccgggctgg 2580 ttagtgggtg gtgcacagcc gggtaagcaa gataaatgct cttattccgg tatttttgct 2640 accggcactt tacccgctgc cagcacttta cctgcaacga cttatctcga ccactggtgc 2700 agctacgcca ccaatgaagt ggcgattaac tggaatgcac ctttagtgta cgtgctggcc 2760 tggagccttt caccagactc catgaccaaa tga 2793 <210> 106 <211> 930 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(22) <400> 106 Met Lys Phe Thr Leu Met Pro Leu Leu Cys Gly Phe Ala Leu Leu Leu 1 5 10 15 Gly Cys Ala Val Gln Ala Thr Pro Ala Ala Ser Leu Gln Gln Ala Tyr 20 25 30 Gln Pro Tyr Phe His Ile Gly Thr Ala Val Ser Leu Ala Gln Leu Gln 35 40 45 Ala Ser Lys Asn His Glu Arg Asp Leu Ile Ala Gln His Phe Asn Ser 50 55 60 Leu Thr Ala Glu Asn Leu Met Lys Trp Glu Lys Ile Gln Pro Thr Glu 65 70 75 80 Gly Asn Phe Asp Phe Thr Ala Ala Asp Lys Leu Val Ala Phe Ala Glu 85 90 95 Gln His Arg Met Trp Leu Val Gly His Thr Ile Leu Trp His Glu Gln 100 105 110 Thr Pro Asp Trp Val Phe Gln Gly Pro Asp Gly Lys Pro Ala Ser Lys 115 120 125 Gln Val Leu Leu Gly Arg Leu Lys Lys His Ile Gln Thr Val Val Gly 130 135 140 Arg Tyr Gln Gly Arg Val His Gly Trp Asp Val Val Asn Glu Ala Leu 145 150 155 160 Asn Glu Asp Gly Ser Leu Arg Asp Thr Pro Trp Arg Lys Ile Leu Gly 165 170 175 Asp Asp Tyr Ile Ala Thr Thr Phe Ala Leu Val His Gln Val Asp Pro 180 185 190 Lys Ala Lys Leu Tyr Tyr Asn Asp Tyr Asn Leu Tyr Lys Pro Lys Lys 195 200 205 Arg Thr Gly Val Leu Arg Ile Ile Gln Gln Leu Gln Gln Gln Gln Val 210 215 220 Pro Ile His Ala Ile Gly Glu Gln Ala His Tyr Gly Leu Asp Ser Pro 225 230 235 240 Lys Leu Gln Glu Val Glu Asp Ser Ile Asn Ala Phe Ala Ala Thr Gly 245 250 255 Leu Asp Val Met Leu Thr Glu Leu Glu Ile Ser Val Leu Pro Phe Pro 260 265 270 Pro Gly Met Thr Pro Gly Ala Asp Ile Ser Gln His Gln Glu Leu Gln 275 280 285 Gln Gln Leu Asn Pro Tyr Arg Glu Gly Leu Pro Lys Thr Val Glu Gln 290 295 300 Ala Trp Gln Gln Arg Tyr Leu Asp Leu Phe Ser Leu Leu Leu Arg Gln 305 310 315 320 His Gln Lys Leu His Arg Val Thr Phe Trp Gly Leu Asp Asp Gly Gln 325 330 335 Ser Trp Arg Asn Asn Phe Pro Met Arg Gly Arg Thr Asp Tyr Pro Leu 340 345 350 Leu Phe Asp Arg Lys Leu Gln Ala Lys Pro Leu Leu Ser Ala Leu Ile 355 360 365 Lys Leu Ala Glu Thr Gln Ala Ser Ala Lys Pro Lys Val Asn Gln Leu 370 375 380 Gly Phe Ala Pro Asn Ala Gln Lys Leu Leu Val Val Pro Gly Arg Gln 385 390 395 400 Ala Val Ser Phe Gln Ile Ile Asn Gln Ser Asn Gly Lys Thr Val Leu 405 410 415 Gln Gly Gln Ser Ser Val Ala Gln Phe Trp Pro Glu Ser Gly Glu Trp 420 425 430 Val Ser Ile Ala Asp Phe Ser Thr Leu Thr Thr Gln Gly Arg Tyr Gln 435 440 445 Val Glu Ala Ala Gly Leu Thr Pro Ile Thr Val Glu Ile Thr Ala Glu 450 455 460 Pro Tyr Ala Ala Leu His Asp Ala Ser Ile Lys Ala Tyr Tyr Phe Asn 465 470 475 480 Arg Ala Ser Leu Ala Leu Glu Pro Ser Phe Ala Gly Pro Trp Ala Arg 485 490 495 Ala Ala Gly His Pro Asp Asn Lys Val Leu Val His Thr Ser Ala Ala 500 505 510 Ser Asp Lys Arg Pro Ala Gly Phe Val Ile Ser Ala Ala Lys Gly Trp 515 520 525 Tyr Asp Ala Gly Asp Tyr Asn Lys Tyr Val Val Asn Ser Gly Ile Ser 530 535 540 Ser Tyr Thr Leu Leu Gln Ala Trp Gln Asp Phe Pro Glu Phe Tyr Arg 545 550 555 560 Asp Arg Thr Trp Asn Leu Pro Glu Ser Ser Asn Asn Leu Pro Asp Ile 565 570 575 Leu Asp Glu Thr Leu Trp Asn Leu Gln Trp Leu Ser Thr Met Gln Asp 580 585 590 Pro Ser Asp Gly Gly Val Tyr His Lys Leu Thr Glu Leu Asn Phe Ser 595 600 605 Ala Thr Gln Met Pro Ser Glu Val Thr Ala Pro Arg Tyr Val Val Gln 610 615 620 Lys Thr Thr Ala Ala Ala Leu Asn Phe Ala Ala Val Leu Ala Lys Ala 625 630 635 640 Ser Arg Ile Phe Thr Glu Phe Glu Thr Gln Leu Pro Gly Leu Ser Gln 645 650 655 Gln Tyr Arg Gln Gln Ala Leu Ala Ala Trp Gln Trp Ala Gln Lys Asn 660 665 670 Pro Gln Gln Ile Tyr Gln Gln Pro Ala Asp Val His Thr Gly Ala Tyr 675 680 685 Gly Asp Lys Gln Leu Ala Asp Glu Trp Ala Trp Ala Gly Ala Glu Leu 690 695 700 Tyr Leu Leu Thr Gly Glu Gln Ser Tyr Leu Gln Pro Leu Leu Ala Leu 705 710 715 720 Glu Thr Pro Ile Thr Ala Ala Ser Trp Ala Asn Val Ala Ala Leu Gly 725 730 735 Tyr Phe Ala Leu Ala Ser Ala Glu Gln Phe Glu Pro Ala Leu Arg Lys 740 745 750 Lys Val Gln Gln Lys Ile Gln Gln Ala Ala Ala Gln Ile Val Ala Glu 755 760 765 His Gln Ala Ser Ala Tyr Gln Val Ala Met Thr Gln Lys Asp Phe Val 770 775 780 Trp Gly Ser Asn Ala Val Ala Met Asn Lys Gly Met Leu Leu Tyr Gln 785 790 795 800 Ala Trp Lys Ile Asp Pro Gln Pro Glu Leu Arg Gln Ala Met Gln Gly 805 810 815 Leu Leu Asp Tyr Val Leu Gly Arg Asn Pro Leu Gln Leu Ser Tyr Val 820 825 830 Thr Gly Phe Gly Ala Gln Ser Pro Gln His Ile His His Arg Pro Ser 835 840 845 Ala Ala Asp Gln Ile Lys Ala Pro Val Pro Gly Trp Leu Val Gly Gly 850 855 860 Ala Gln Pro Gly Lys Gln Asp Lys Cys Ser Tyr Ser Gly Ile Phe Ala 865 870 875 880 Thr Gly Thr Leu Pro Ala Ala Ser Thr Leu Pro Ala Thr Thr Tyr Leu 885 890 895 Asp His Trp Cys Ser Tyr Ala Thr Asn Glu Val Ala Ile Asn Trp Asn 900 905 910 Ala Pro Leu Val Tyr Val Leu Ala Trp Ser Leu Ser Pro Asp Ser Met 915 920 925 Thr Lys 930 <210> 107 <211> 1725 <212> DNA <213> Bacteria <400> 107 gtgtggaagc ccggattgtg gaatttcctt caaatggcag atgaagccgg attgacgagg 60 gatggaaaca ctccggttcc gacacccagt ccaaagccgg ctaacacacg tattgaagcg 120 gaagattatg acggtattaa ttcttcaagt attgagataa taggtgttcc acctgaagga 180 ggcagaggaa taggttatat taccagtggt gattatctgg tatacaagag tatagacttt 240 ggaaacggag caacgtcgtt taaggccaag gttgcaaatg caaatacttc caatattgaa 300 cttagattaa acggtccgaa tggtactctc ataggcacac tctcggtaaa atccacagga 360 gattggaata catatgagga gcaaacttgc agcattagca aagtcaccgg aataaatgat 420 ttgtacttgg tattcaaagg ccctgtaaac atagactggt tcacttttgg cgttgaaagc 480 agttccacag gtctggggga tttaaatggt gacggaaata ttaactcgtc ggaccttcag 540 gcgttaaaga ggcatttgct cggtatatca ccgcttacgg gagaggctct tttaagagcg 600 gatgtaaata ggagcggcaa agtggattct actgactatt cagtgctgaa aagatatata 660 ctccgcatta ttacagagtt ccccggacaa ggtgatgtac agacacccaa tccgtctgtt 720 actccgacac aaactcctat ccccacgatt tcgggaaatg ctcttaggga ttatgcggag 780 gcaaggggaa taaaaatcgg aacatgtgtc aactatccgt tttacaacaa ttcagatcca 840 acctacaaca gcattttgca aagagaattt tcaatggttg tatgtgaaaa tgaaatgaag 900 tttgatgctt tgcagccgag acaaaacgtt tttgattttt cgaaaggaga ccagttgctt 960 gcttttgcag aaagaaacgg tatgcagatg aggggacata cgttgatttg gcacaatcaa 1020 aacccgtcat ggcttacaaa cggtaactgg aaccgggatt cgctgcttgc ggtaatgaaa 1080 aatcacatta ccactgttat gacccattac aaaggtaaaa ttgttgagtg ggatgtggca 1140 aacgaatgta tggatgattc cggcaacggc ttaagaagca gcatatggag aaatgtaatc 1200 ggtcaggact accttgacta tgctttcagg tatgcaagag aagcagatcc cgatgcactt 1260 cttttctaca atgattataa tattgaagac ttgggtccaa agtccaatgc ggtatttaac 1320 atgattaaaa gtatgaagga aagaggtgtg ccgattgacg gagtaggatt ccaatgccac 1380 tttatcaatg gaatgagccc cgagtacctt gccagcattg atcaaaatat taagagatat 1440 gcggaaatag gcgttatagt atcctttacc gaaatagata tacgcatacc tcagtcggaa 1500 aacccggcaa ctgcattcca ggtacaggca aacaactata aggaacttat gaaaatttgt 1560 ctggcaaacc ccaattgcaa tacctttgta atgtggggat tcacagataa atacacatgg 1620 attccgggaa ctttcccagg atatggcaat ccattgattt atgacagcaa ttacaatccg 1680 aaaccggcat acaatgcaat aaaggaagct cttatgggct attga 1725 <210> 108 <211> 574 <212> PRT <213> Bacteria <400> 108 Val Trp Lys Pro Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala 1 5 10 15 Gly Leu Thr Arg Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys 20 25 30 Pro Ala Asn Thr Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser 35 40 45 Ser Ser Ile Glu Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile 50 55 60 Gly Tyr Ile Thr Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe 65 70 75 80 Gly Asn Gly Ala Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr 85 90 95 Ser Asn Ile Glu Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly 100 105 110 Thr Leu Ser Val Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln 115 120 125 Thr Cys Ser Ile Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val 130 135 140 Phe Lys Gly Pro Val Asn Ile Asp Trp Phe Thr Phe Gly Val Glu Ser 145 150 155 160 Ser Ser Thr Gly Leu Gly Asp Leu Asn Gly Asp Gly Asn Ile Asn Ser 165 170 175 Ser Asp Leu Gln Ala Leu Lys Arg His Leu Leu Gly Ile Ser Pro Leu 180 185 190 Thr Gly Glu Ala Leu Leu Arg Ala Asp Val Asn Arg Ser Gly Lys Val 195 200 205 Asp Ser Thr Asp Tyr Ser Val Leu Lys Arg Tyr Ile Leu Arg Ile Ile 210 215 220 Thr Glu Phe Pro Gly Gln Gly Asp Val Gln Thr Pro Asn Pro Ser Val 225 230 235 240 Thr Pro Thr Gln Thr Pro Ile Pro Thr Ile Ser Gly Asn Ala Leu Arg 245 250 255 Asp Tyr Ala Glu Ala Arg Gly Ile Lys Ile Gly Thr Cys Val Asn Tyr 260 265 270 Pro Phe Tyr Asn Asn Ser Asp Pro Thr Tyr Asn Ser Ile Leu Gln Arg 275 280 285 Glu Phe Ser Met Val Val Cys Glu Asn Glu Met Lys Phe Asp Ala Leu 290 295 300 Gln Pro Arg Gln Asn Val Phe Asp Phe Ser Lys Gly Asp Gln Leu Leu 305 310 315 320 Ala Phe Ala Glu Arg Asn Gly Met Gln Met Arg Gly His Thr Leu Ile 325 330 335 Trp His Asn Gln Asn Pro Ser Trp Leu Thr Asn Gly Asn Trp Asn Arg 340 345 350 Asp Ser Leu Leu Ala Val Met Lys Asn His Ile Thr Thr Val Met Thr 355 360 365 His Tyr Lys Gly Lys Ile Val Glu Trp Asp Val Ala Asn Glu Cys Met 370 375 380 Asp Asp Ser Gly Asn Gly Leu Arg Ser Ser Ile Trp Arg Asn Val Ile 385 390 395 400 Gly Gln Asp Tyr Leu Asp Tyr Ala Phe Arg Tyr Ala Arg Glu Ala Asp 405 410 415 Pro Asp Ala Leu Leu Phe Tyr Asn Asp Tyr Asn Ile Glu Asp Leu Gly 420 425 430 Pro Lys Ser Asn Ala Val Phe Asn Met Ile Lys Ser Met Lys Glu Arg 435 440 445 Gly Val Pro Ile Asp Gly Val Gly Phe Gln Cys His Phe Ile Asn Gly 450 455 460 Met Ser Pro Glu Tyr Leu Ala Ser Ile Asp Gln Asn Ile Lys Arg Tyr 465 470 475 480 Ala Glu Ile Gly Val Ile Val Ser Phe Thr Glu Ile Asp Ile Arg Ile 485 490 495 Pro Gln Ser Glu Asn Pro Ala Thr Ala Phe Gln Val Gln Ala Asn Asn 500 505 510 Tyr Lys Glu Leu Met Lys Ile Cys Leu Ala Asn Pro Asn Cys Asn Thr 515 520 525 Phe Val Met Trp Gly Phe Thr Asp Lys Tyr Thr Trp Ile Pro Gly Thr 530 535 540 Phe Pro Gly Tyr Gly Asn Pro Leu Ile Tyr Asp Ser Asn Tyr Asn Pro 545 550 555 560 Lys Pro Ala Tyr Asn Ala Ile Lys Glu Ala Leu Met Gly Tyr 565 570 <210> 109 <211> 1242 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 109 atgctaaaag ttttacgtaa acctattatt tctggattag ctttagctct attattgccg 60 gcaggggcag ctggtgccga aactaatatt tcaaagaagc caaatataag tggattaacc 120 gcgccgcaat tagaccaaag atataaagat tctttcacca ttggtgctgc ggttgagccg 180 tatcaattat tagatgcaaa agattcacaa atgctaaagc ggcattttaa tagtatcgta 240 gcagagaatg tcatgaagcc tagtagttta cagccagtag aaggacaatt caattgggag 300 ccggccgata aacttgttca gtttgcgaag gaaaatggaa tggacatgcg cggacatacg 360 cttgtctggc atagccaggt accggattgg ttctttgaag atgcggcagg aaatccaatg 420 gttgtttggg aaaatggcag gcaagtggtt gccgatccag caaatcttca ggaaaacaaa 480 gagctcttac ttagccgatt acaaaatcat attcaggcag tcgtaacgcg ttataaagat 540 gatataaaat cttgggatgt tgttaatgaa gtaatcgatg aatggggcgg acattctgaa 600 gggctgcgtc aatctccatg gttcctcatc accggaacgg actatattaa agttgctttt 660 gaaactgcaa gagaatatgc agctccagac gctaagctgt atatcaatga ttacaataca 720 gaagtagaac caaaaaggac gcacctttat aacttagtaa aaagtttaaa agaagaacaa 780 aacgttccaa ttgatggtgt tgggcatcag tctcacattc aaattggctg gccttcagaa 840 aaagaaattg aagataccat taatatgttt gcagatcttg gtttagataa ccaaatcacc 900 gagcttgatg ttagtatgta tggctggcca gtaaggtcgt atccaactta tgatgcgatc 960 ccagaactta aattcatgga tcaagcagct cgttatgatc gtttatttaa gttatatgag 1020 aaattaggag ataaaatcag taatgtgaca ttctggggta ttgcggataa ccatacatgg 1080 ctgaatgacc gtgcagatgt ttactatgat gaaaatggaa atgttgtatt agatagagaa 1140 acaccaagag tagaaagagg agcaggaaaa gatgcgccat ttgtatttga tcctgaatac 1200 aatgtaaaac cagcttattg ggcaattatc gaccacaaat aa 1242 <210> 110 <211> 413 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(26) <400> 110 Met Leu Lys Val Leu Arg Lys Pro Ile Ile Ser Gly Leu Ala Leu Ala 1 5 10 15 Leu Leu Leu Pro Ala Gly Ala Ala Gly Ala Glu Thr Asn Ile Ser Lys 20 25 30 Lys Pro Asn Ile Ser Gly Leu Thr Ala Pro Gln Leu Asp Gln Arg Tyr 35 40 45 Lys Asp Ser Phe Thr Ile Gly Ala Ala Val Glu Pro Tyr Gln Leu Leu 50 55 60 Asp Ala Lys Asp Ser Gln Met Leu Lys Arg His Phe Asn Ser Ile Val 65 70 75 80 Ala Glu Asn Val Met Lys Pro Ser Ser Leu Gln Pro Val Glu Gly Gln 85 90 95 Phe Asn Trp Glu Pro Ala Asp Lys Leu Val Gln Phe Ala Lys Glu Asn 100 105 110 Gly Met Asp Met Arg Gly His Thr Leu Val Trp His Ser Gln Val Pro 115 120 125 Asp Trp Phe Phe Glu Asp Ala Ala Gly Asn Pro Met Val Val Trp Glu 130 135 140 Asn Gly Arg Gln Val Val Ala Asp Pro Ala Asn Leu Gln Glu Asn Lys 145 150 155 160 Glu Leu Leu Leu Ser Arg Leu Gln Asn His Ile Gln Ala Val Val Thr 165 170 175 Arg Tyr Lys Asp Asp Ile Lys Ser Trp Asp Val Val Asn Glu Val Ile 180 185 190 Asp Glu Trp Gly Gly His Ser Glu Gly Leu Arg Gln Ser Pro Trp Phe 195 200 205 Leu Ile Thr Gly Thr Asp Tyr Ile Lys Val Ala Phe Glu Thr Ala Arg 210 215 220 Glu Tyr Ala Ala Pro Asp Ala Lys Leu Tyr Ile Asn Asp Tyr Asn Thr 225 230 235 240 Glu Val Glu Pro Lys Arg Thr His Leu Tyr Asn Leu Val Lys Ser Leu 245 250 255 Lys Glu Glu Gln Asn Val Pro Ile Asp Gly Val Gly His Gln Ser His 260 265 270 Ile Gln Ile Gly Trp Pro Ser Glu Lys Glu Ile Glu Asp Thr Ile Asn 275 280 285 Met Phe Ala Asp Leu Gly Leu Asp Asn Gln Ile Thr Glu Leu Asp Val 290 295 300 Ser Met Tyr Gly Trp Pro Val Arg Ser Tyr Pro Thr Tyr Asp Ala Ile 305 310 315 320 Pro Glu Leu Lys Phe Met Asp Gln Ala Ala Arg Tyr Asp Arg Leu Phe 325 330 335 Lys Leu Tyr Glu Lys Leu Gly Asp Lys Ile Ser Asn Val Thr Phe Trp 340 345 350 Gly Ile Ala Asp Asn His Thr Trp Leu Asn Asp Arg Ala Asp Val Tyr 355 360 365 Tyr Asp Glu Asn Gly Asn Val Val Leu Asp Arg Glu Thr Pro Arg Val 370 375 380 Glu Arg Gly Ala Gly Lys Asp Ala Pro Phe Val Phe Asp Pro Glu Tyr 385 390 395 400 Asn Val Lys Pro Ala Tyr Trp Ala Ile Ile Asp His Lys 405 410 <210> 111 <211> 1089 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 111 atgttgacga ccccgacaac tcaagatcat gtccccgtgc ttaaggacgc tttcaaaggc 60 aagttcctca ttggagccgt gctgggttat gacgcactcc agggaaagga tccggcgagt 120 gtggaaattg cgaccacgca cttcgatgct ctcactgcgg aaaacagcat gaagcccgct 180 ctggtgcaac ctaaagaggg cgaatttgac ttcgctgatg gagaccggct tcttgacatc 240 acacagcagt gcggtgcgac tgcgattggc cacactttgc tctggcacca acagacaccg 300 aaatggtttt tcgaggggcc agatgaccag cctactaacc gcgagttggc cctggcacgc 360 atgagaaagc acatcgccac tcttgttggc cgttacaaag gtcgcattaa gcaatgggat 420 gtggtgaatg aggcgattag cgatgcagag ggcgagtact tgagaccaaa tagtccatgg 480 ttcaaggctg ttggagaaga tcacattgcg caggctttcc gggcagcgca cgaagccgat 540 cctgacgcca tcctcatcta taacgattac aacatcgagc aggagtacaa gcgtcccaaa 600 gcgatacgac tgctgaggtc attacttgag caggacgttc cccttcatgc cgtgggcatc 660 cagggccact ggcgtatgga cactctgaat gttgccgaaa tcgaagaagc tatcaaagaa 720 tttgctgcgc tgggtctcaa ggtcatgatc accgagcttg acatcagcgt gctaccgaca 780 aagtatcagg gagccgatct ctctacccgc gaagaattga cgcctgaaat caatccctat 840 acggagggac tacccgagaa cgttgcccgg caacatgccg aatgttaccg ccaagtcttc 900 aaaatgttcc tgtgccacaa ggatgccatt ggccgtgtca cgctctgggg cgttcatgat 960 ggcagatcat ggttcaatga ctttcccgtc agagggcgca ccgattatcc tctgcttttc 1020 gaccggcagg gcaaacccaa gccagcattt tttgccgtct tgaaggctgc gcaagatcag 1080 ccacaatga 1089 <210> 112 <211> 362 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 112 Met Leu Thr Thr Pro Thr Thr Gln Asp His Val Pro Val Leu Lys Asp 1 5 10 15 Ala Phe Lys Gly Lys Phe Leu Ile Gly Ala Val Leu Gly Tyr Asp Ala 20 25 30 Leu Gln Gly Lys Asp Pro Ala Ser Val Glu Ile Ala Thr Thr His Phe 35 40 45 Asp Ala Leu Thr Ala Glu Asn Ser Met Lys Pro Ala Leu Val Gln Pro 50 55 60 Lys Glu Gly Glu Phe Asp Phe Ala Asp Gly Asp Arg Leu Leu Asp Ile 65 70 75 80 Thr Gln Gln Cys Gly Ala Thr Ala Ile Gly His Thr Leu Leu Trp His 85 90 95 Gln Gln Thr Pro Lys Trp Phe Phe Glu Gly Pro Asp Asp Gln Pro Thr 100 105 110 Asn Arg Glu Leu Ala Leu Ala Arg Met Arg Lys His Ile Ala Thr Leu 115 120 125 Val Gly Arg Tyr Lys Gly Arg Ile Lys Gln Trp Asp Val Val Asn Glu 130 135 140 Ala Ile Ser Asp Ala Glu Gly Glu Tyr Leu Arg Pro Asn Ser Pro Trp 145 150 155 160 Phe Lys Ala Val Gly Glu Asp His Ile Ala Gln Ala Phe Arg Ala Ala 165 170 175 His Glu Ala Asp Pro Asp Ala Ile Leu Ile Tyr Asn Asp Tyr Asn Ile 180 185 190 Glu Gln Glu Tyr Lys Arg Pro Lys Ala Ile Arg Leu Leu Arg Ser Leu 195 200 205 Leu Glu Gln Asp Val Pro Leu His Ala Val Gly Ile Gln Gly His Trp 210 215 220 Arg Met Asp Thr Leu Asn Val Ala Glu Ile Glu Glu Ala Ile Lys Glu 225 230 235 240 Phe Ala Ala Leu Gly Leu Lys Val Met Ile Thr Glu Leu Asp Ile Ser 245 250 255 Val Leu Pro Thr Lys Tyr Gln Gly Ala Asp Leu Ser Thr Arg Glu Glu 260 265 270 Leu Thr Pro Glu Ile Asn Pro Tyr Thr Glu Gly Leu Pro Glu Asn Val 275 280 285 Ala Arg Gln His Ala Glu Cys Tyr Arg Gln Val Phe Lys Met Phe Leu 290 295 300 Cys His Lys Asp Ala Ile Gly Arg Val Thr Leu Trp Gly Val His Asp 305 310 315 320 Gly Arg Ser Trp Phe Asn Asp Phe Pro Val Arg Gly Arg Thr Asp Tyr 325 330 335 Pro Leu Leu Phe Asp Arg Gln Gly Lys Pro Lys Pro Ala Phe Phe Ala 340 345 350 Val Leu Lys Ala Ala Gln Asp Gln Pro Gln 355 360 <210> 113 <211> 1155 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 113 atgttaaaag tattgcgtaa accacttttt tctggattag ctttagcgat agtattacct 60 accggattat ccagtgctta tgcagctgaa aatcaaccag ttagtgcatt agatgcagcg 120 gttgaacttg atgaaagata tgcagaatca ttcgatattg gtgcagccgt tgagccttct 180 atgcttcaag gaaaagatgc tgaagtatta aagcgtcatt ataacagcat tgtggccgaa 240 aatgtaatga aaccgattaa tatacagcct gaagaaggaa agttcacttt taaagaaatg 300 gataaaatcg ttaagtttgc gaaagaaaat aatatgaagc ttcgtggcca tacccttatt 360 tggcacagtc aagtaccgga gtggttcttc cttgataaag aaggaaataa gatggtggat 420 gaaacggatc caaagcagcg cgaaaaaaat aaaaggcttt tacttaagcg tttagaaacg 480 catattaaaa cgatcgtcaa gcgctataaa aatgatatta gctcctggga cgtggtcaac 540 gaggtagtgg atgataacgg gaaattacgt aattcaccct ggtatcaaat cacaggtact 600 gattatatca aggttgcttt tgaaacagcg gaccgttatg cagggaagaa cgctaagctt 660 tatatcaatg actacaacac ggaaatagac cctaaaagag aaaccctcta taatcttgtc 720 aaggaattag tgaaggaggg agtcccagtt gatggagtgg gacatcaagc tcatatccaa 780 atcggctggc caactatagc ggaaatcgag aaaaccatta atatgtttgc agaccttggc 840 ctagacaatc aaattacaga actagatgtt agcctttatg ggtggccgcc aaagcctgct 900 tacccaactt atgacgaaat cccggcaagt gaattcgaac gtcaagctgt tcgttacgat 960 caactatttg atttatacga gagattggga gataaaatta gcagtgtgac attctggggc 1020 gttgctgaca accatacatg gttaaatgac cgtgcagaac aatataatga cggggtaggc 1080 gtggacgcac catttgtttt cgataaggat tataatgtaa aaccagctta ttgggctatt 1140 atcgatcgcg attaa 1155 <210> 114 <211> 384 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(28) <400> 114 Met Leu Lys Val Leu Arg Lys Pro Leu Phe Ser Gly Leu Ala Leu Ala 1 5 10 15 Ile Val Leu Pro Thr Gly Leu Ser Ser Ala Tyr Ala Ala Glu Asn Gln 20 25 30 Pro Val Ser Ala Leu Asp Ala Ala Val Glu Leu Asp Glu Arg Tyr Ala 35 40 45 Glu Ser Phe Asp Ile Gly Ala Ala Val Glu Pro Ser Met Leu Gln Gly 50 55 60 Lys Asp Ala Glu Val Leu Lys Arg His Tyr Asn Ser Ile Val Ala Glu 65 70 75 80 Asn Val Met Lys Pro Ile Asn Ile Gln Pro Glu Glu Gly Lys Phe Thr 85 90 95 Phe Lys Glu Met Asp Lys Ile Val Lys Phe Ala Lys Glu Asn Asn Met 100 105 110 Lys Leu Arg Gly His Thr Leu Ile Trp His Ser Gln Val Pro Glu Trp 115 120 125 Phe Phe Leu Asp Lys Glu Gly Asn Lys Met Val Asp Glu Thr Asp Pro 130 135 140 Lys Gln Arg Glu Lys Asn Lys Arg Leu Leu Leu Lys Arg Leu Glu Thr 145 150 155 160 His Ile Lys Thr Ile Val Lys Arg Tyr Lys Asn Asp Ile Ser Ser Trp 165 170 175 Asp Val Val Asn Glu Val Val Asp Asp Asn Gly Lys Leu Arg Asn Ser 180 185 190 Pro Trp Tyr Gln Ile Thr Gly Thr Asp Tyr Ile Lys Val Ala Phe Glu 195 200 205 Thr Ala Asp Arg Tyr Ala Gly Lys Asn Ala Lys Leu Tyr Ile Asn Asp 210 215 220 Tyr Asn Thr Glu Ile Asp Pro Lys Arg Glu Thr Leu Tyr Asn Leu Val 225 230 235 240 Lys Glu Leu Val Lys Glu Gly Val Pro Val Asp Gly Val Gly His Gln 245 250 255 Ala His Ile Gln Ile Gly Trp Pro Thr Ile Ala Glu Ile Glu Lys Thr 260 265 270 Ile Asn Met Phe Ala Asp Leu Gly Leu Asp Asn Gln Ile Thr Glu Leu 275 280 285 Asp Val Ser Leu Tyr Gly Trp Pro Pro Lys Pro Ala Tyr Pro Thr Tyr 290 295 300 Asp Glu Ile Pro Ala Ser Glu Phe Glu Arg Gln Ala Val Arg Tyr Asp 305 310 315 320 Gln Leu Phe Asp Leu Tyr Glu Arg Leu Gly Asp Lys Ile Ser Ser Val 325 330 335 Thr Phe Trp Gly Val Ala Asp Asn His Thr Trp Leu Asn Asp Arg Ala 340 345 350 Glu Gln Tyr Asn Asp Gly Val Gly Val Asp Ala Pro Phe Val Phe Asp 355 360 365 Lys Asp Tyr Asn Val Lys Pro Ala Tyr Trp Ala Ile Ile Asp Arg Asp 370 375 380 <210> 115 <211> 1362 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 115 atgacgaacc gtaaatcgaa cgtgcaccgt tcattgaccg atgatttgct cgatggtgtc 60 ttcgccgagg caaaagcggg caaagttgag aagtaccgtg ccaccgggat ccttggaacg 120 ctattcggat tcactgtggc gtcctccatc atgttggcgg cttgcagcaa cgcacaagag 180 aatgttccac cagttgcttc atccaccgca cagagcaata tcacccagga gaacgttccg 240 ccgctcaaag atgcgtttaa gggcaagttc ttgattggca ccgcggtgag caatcgcttg 300 ctggagggac aagatccggc cacggaagcc ttggtgcgca ggcacttcga tgctctcacg 360 gcggaaaacg ccatgaagcc ggatgcactg caaccgcgcg aaggccagtt caacttcgtc 420 gccgccgacc gtctggtgga aatcgcccag caaagcggcg cgacagtggt cggccacacg 480 ctggtctggc actcccaaac gccaggctgg ttcttccagg gtccgaatgg ccagccagcg 540 agtcgagaac tggccctggc gcggatgcga acacacatca agacggtggt gggacgctac 600 aaagggcgca tcaagcagtg ggatgtggtc aacgaagcga tcaacgacgg ccctggcgtg 660 ctgcggcaaa gtccgtggct gcgtgccatc ggcgaagact acatcgccga agcgttccgc 720 gccgcgcacg aagccgatcc tgacgccatt ctggtctaca acgactacaa catcgaactc 780 aactacaagc gtcccaaggc gctggaactg ctaaagaagc tcatcgacca gaaggttccg 840 attcatggtg tgggcattca ggctcactgg cgcatgaccc cgccgctggc cgagaccgaa 900 gaagccatca aacagttcgc cgcgctgggc ctgaaggtga tgttcaccga actggacatc 960 ggtgtgctgc ccactcagta tcagggggct gacatctcgg cgcgtgaaac catgacaccc 1020 gaacagcaag cggtgatgaa cccttacact cagggcttgc cggctgaagt ggcacagcaa 1080 catgccgagc gctaccgaca ggccttcgag ctgttcctgc gccacaagga tgtgattggt 1140 cgcgtcacgc tctggggcac gcatgatggc gaatcctggc tgaacggttt tccggtgcgg 1200 ggccgcaccg actatccctt gctcttcgac cgccggtatc agccaaaacc agccttcttc 1260 gccgtcaggc aggttgcaca ggcgcatact gtacaaacga ccggtgcgca aacccaagct 1320 acagcgaaga caattcaaaa agcttctcga gagtacttct ag 1362 <210> 116 <211> 453 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 116 Met Thr Asn Arg Lys Ser Asn Val His Arg Ser Leu Thr Asp Asp Leu 1 5 10 15 Leu Asp Gly Val Phe Ala Glu Ala Lys Ala Gly Lys Val Glu Lys Tyr 20 25 30 Arg Ala Thr Gly Ile Leu Gly Thr Leu Phe Gly Phe Thr Val Ala Ser 35 40 45 Ser Ile Met Leu Ala Ala Cys Ser Asn Ala Gln Glu Asn Val Pro Pro 50 55 60 Val Ala Ser Ser Thr Ala Gln Ser Asn Ile Thr Gln Glu Asn Val Pro 65 70 75 80 Pro Leu Lys Asp Ala Phe Lys Gly Lys Phe Leu Ile Gly Thr Ala Val 85 90 95 Ser Asn Arg Leu Leu Glu Gly Gln Asp Pro Ala Thr Glu Ala Leu Val 100 105 110 Arg Arg His Phe Asp Ala Leu Thr Ala Glu Asn Ala Met Lys Pro Asp 115 120 125 Ala Leu Gln Pro Arg Glu Gly Gln Phe Asn Phe Val Ala Ala Asp Arg 130 135 140 Leu Val Glu Ile Ala Gln Gln Ser Gly Ala Thr Val Val Gly His Thr 145 150 155 160 Leu Val Trp His Ser Gln Thr Pro Gly Trp Phe Phe Gln Gly Pro Asn 165 170 175 Gly Gln Pro Ala Ser Arg Glu Leu Ala Leu Ala Arg Met Arg Thr His 180 185 190 Ile Lys Thr Val Val Gly Arg Tyr Lys Gly Arg Ile Lys Gln Trp Asp 195 200 205 Val Val Asn Glu Ala Ile Asn Asp Gly Pro Gly Val Leu Arg Gln Ser 210 215 220 Pro Trp Leu Arg Ala Ile Gly Glu Asp Tyr Ile Ala Glu Ala Phe Arg 225 230 235 240 Ala Ala His Glu Ala Asp Pro Asp Ala Ile Leu Val Tyr Asn Asp Tyr 245 250 255 Asn Ile Glu Leu Asn Tyr Lys Arg Pro Lys Ala Leu Glu Leu Leu Lys 260 265 270 Lys Leu Ile Asp Gln Lys Val Pro Ile His Gly Val Gly Ile Gln Ala 275 280 285 His Trp Arg Met Thr Pro Pro Leu Ala Glu Thr Glu Glu Ala Ile Lys 290 295 300 Gln Phe Ala Ala Leu Gly Leu Lys Val Met Phe Thr Glu Leu Asp Ile 305 310 315 320 Gly Val Leu Pro Thr Gln Tyr Gln Gly Ala Asp Ile Ser Ala Arg Glu 325 330 335 Thr Met Thr Pro Glu Gln Gln Ala Val Met Asn Pro Tyr Thr Gln Gly 340 345 350 Leu Pro Ala Glu Val Ala Gln Gln His Ala Glu Arg Tyr Arg Gln Ala 355 360 365 Phe Glu Leu Phe Leu Arg His Lys Asp Val Ile Gly Arg Val Thr Leu 370 375 380 Trp Gly Thr His Asp Gly Glu Ser Trp Leu Asn Gly Phe Pro Val Arg 385 390 395 400 Gly Arg Thr Asp Tyr Pro Leu Leu Phe Asp Arg Arg Tyr Gln Pro Lys 405 410 415 Pro Ala Phe Phe Ala Val Arg Gln Val Ala Gln Ala His Thr Val Gln 420 425 430 Thr Thr Gly Ala Gln Thr Gln Ala Thr Ala Lys Thr Ile Gln Lys Ala 435 440 445 Ser Arg Glu Tyr Phe 450 <210> 117 <211> 1437 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 117 atgacgaacc gtaaattgaa cgtgcaccgt tcattgagcg atgatttgct cgatggcgcc 60 ttcgccgagt caaaagcggg caaagttgag aaataccgtg ccacggggat ccttggaacg 120 ctattcggat tcactgtggc gtcctccatc atgttggcgg cttgcagcaa cgcacaagag 180 aatgctccac cagttgcttc atccaccgca caaagcaata tcacccagga gaacgttccg 240 ccgctcaagg atgcgtttaa gggcaagttc ttgattggca ccatcgcgag caatcgcttg 300 ctgcagggac aagatccagc cacagaagcc ctggtgcgca ggcacttcga cgccctcacg 360 gcggaaaatg ccatgaagcc tgatgccatg caacccagag agggtgagtt caactttgcc 420 gccgctgacc gcctggtgga aatcgcccag caaagcggcg ccacggtggt cggccacacc 480 ttggtctggc atagccaaac gccaagctgg ttcttccagg gtccagatgg ccaaccggcg 540 agtcgggaac tggccttggc acggatgcga acgcacatca agactgtggt gggacgctac 600 aaaggacgca tcaagcaatg ggatgtggtc aacgaagcga tcaacgacgg ccctggagtg 660 ctgcggccat cgccgtggtt gcgcgccatc ggcgaagact tcatcgccga agcgttccgc 720 gccgcgcacg aagctgatcc cgacgcgatt ctcgtctaca acgactacaa catcgagctc 780 aactacaagc gtcccaaggc gctggaacta ctgaagagac tcatcgagca gaaggttccg 840 attcatggtg tgggcattca ggctcactgg cgcatgaccc cgccgctggc cgagatggaa 900 gagaccatca agcagttttc ggctttgggc ttgaaggtaa tgatcaccga gttggacatt 960 ggtgtattgc caacacaata ccagggtgcc gacatctcgg ctcgcgagac catgacaccc 1020 gaacagcaag cggtgatgaa cccttacacg cagggcttgc cggctgaagt ggcgcagcaa 1080 catgccgagc gttatcgtca ggcgtttgag ctgttcatgc gttacaagga tgtgattggt 1140 cgcgttaccc tgtggggcac gcatgatggc gaatcttggc tgaacggttt tcccgttcgt 1200 ggccgcacgg attatcctct actgttcgac cgccggtatc agcctaagcc cgccttcttc 1260 gcggtgcaaa aggtcgcgca ggcgcagaac gcacaggcag caaccgatca agcaccactt 1320 gcacaaaacc cagttgcgca gaagaaatct gcaccaaggc aggcggctca aaatcagacc 1380 actcaaaagc cagtggtaca aaagcaaagt gcggcaagtc gggccgcaga aaagtaa 1437 <210> 118 <211> 478 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 118 Met Thr Asn Arg Lys Leu Asn Val His Arg Ser Leu Ser Asp Asp Leu 1 5 10 15 Leu Asp Gly Ala Phe Ala Glu Ser Lys Ala Gly Lys Val Glu Lys Tyr 20 25 30 Arg Ala Thr Gly Ile Leu Gly Thr Leu Phe Gly Phe Thr Val Ala Ser 35 40 45 Ser Ile Met Leu Ala Ala Cys Ser Asn Ala Gln Glu Asn Ala Pro Pro 50 55 60 Val Ala Ser Ser Thr Ala Gln Ser Asn Ile Thr Gln Glu Asn Val Pro 65 70 75 80 Pro Leu Lys Asp Ala Phe Lys Gly Lys Phe Leu Ile Gly Thr Ile Ala 85 90 95 Ser Asn Arg Leu Leu Gln Gly Gln Asp Pro Ala Thr Glu Ala Leu Val 100 105 110 Arg Arg His Phe Asp Ala Leu Thr Ala Glu Asn Ala Met Lys Pro Asp 115 120 125 Ala Met Gln Pro Arg Glu Gly Glu Phe Asn Phe Ala Ala Ala Asp Arg 130 135 140 Leu Val Glu Ile Ala Gln Gln Ser Gly Ala Thr Val Val Gly His Thr 145 150 155 160 Leu Val Trp His Ser Gln Thr Pro Ser Trp Phe Phe Gln Gly Pro Asp 165 170 175 Gly Gln Pro Ala Ser Arg Glu Leu Ala Leu Ala Arg Met Arg Thr His 180 185 190 Ile Lys Thr Val Val Gly Arg Tyr Lys Gly Arg Ile Lys Gln Trp Asp 195 200 205 Val Val Asn Glu Ala Ile Asn Asp Gly Pro Gly Val Leu Arg Pro Ser 210 215 220 Pro Trp Leu Arg Ala Ile Gly Glu Asp Phe Ile Ala Glu Ala Phe Arg 225 230 235 240 Ala Ala His Glu Ala Asp Pro Asp Ala Ile Leu Val Tyr Asn Asp Tyr 245 250 255 Asn Ile Glu Leu Asn Tyr Lys Arg Pro Lys Ala Leu Glu Leu Leu Lys 260 265 270 Arg Leu Ile Glu Gln Lys Val Pro Ile His Gly Val Gly Ile Gln Ala 275 280 285 His Trp Arg Met Thr Pro Pro Leu Ala Glu Met Glu Glu Thr Ile Lys 290 295 300 Gln Phe Ser Ala Leu Gly Leu Lys Val Met Ile Thr Glu Leu Asp Ile 305 310 315 320 Gly Val Leu Pro Thr Gln Tyr Gln Gly Ala Asp Ile Ser Ala Arg Glu 325 330 335 Thr Met Thr Pro Glu Gln Gln Ala Val Met Asn Pro Tyr Thr Gln Gly 340 345 350 Leu Pro Ala Glu Val Ala Gln Gln His Ala Glu Arg Tyr Arg Gln Ala 355 360 365 Phe Glu Leu Phe Met Arg Tyr Lys Asp Val Ile Gly Arg Val Thr Leu 370 375 380 Trp Gly Thr His Asp Gly Glu Ser Trp Leu Asn Gly Phe Pro Val Arg 385 390 395 400 Gly Arg Thr Asp Tyr Pro Leu Leu Phe Asp Arg Arg Tyr Gln Pro Lys 405 410 415 Pro Ala Phe Phe Ala Val Gln Lys Val Ala Gln Ala Gln Asn Ala Gln 420 425 430 Ala Ala Thr Asp Gln Ala Pro Leu Ala Gln Asn Pro Val Ala Gln Lys 435 440 445 Lys Ser Ala Pro Arg Gln Ala Ala Gln Asn Gln Thr Thr Gln Lys Pro 450 455 460 Val Val Gln Lys Gln Ser Ala Ala Ser Arg Ala Ala Glu Lys 465 470 475 <210> 119 <211> 2559 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 119 atgaaaaaaa gattgttagc gttgatagtg acattagttt ttattatctc attgtttaat 60 cccatattca ccacaccttt aacaaatgta gcaaaggctc aaagtaacca aacaaattta 120 aaatttgact ttgaaaacgg tactcaaggt tggggagcaa gaggtgtttc aacaactatt 180 gcaaccgttt acgagcaagc ttatgaagga agttattctt taaaggtttc aggtagaagt 240 tcaacgtggg atggagcagt tgtggatatc acatcaagta tttcagcaaa tgtcacctat 300 acagtttctt tatttgttcg tcacagcgat gtaaaaccac aaagattttc tgtctatgta 360 tatgtcaaag ataacacagg cgaaaaatac atccaggttg cagacaaagt ggttatgcca 420 aacttttgga agcagctctt tgggaagttc acaatcacaa catcaaatcc aattcaaaaa 480 gtagaacttc ttgtatgtgt tccatctaac aaatctttag gattttatct tgacaatgta 540 gttattactt cagcacaacc agcttcctcg ggtgttgtta aatcttgcac atttgaaagc 600 ggtagcactg agggttttgt tcagagaggt tcagcttcat tgacagttgt cgacggtgta 660 tactatcatt ctccaacaaa agcattatat gtgacaggaa ggacagctac atggcagggt 720 gcacagatag atatgacaag tttgcttgag aagggcaagg attatcagtt tagcatatgg 780 gtatatcaaa atagtggaag tgatcagaag ataaccctta cgatgcaaag gaagaatgaa 840 gatggaacta cgagttatga ttctataaag tatcagcaaa cagttccatc tggtacatgg 900 acagaagtaa caggttcata cacagtgcct cagacagcaa cacagcttat attctatgtt 960 gaatcaccga atattaattt tgacttctac cttgatgact ttacagcggt tgacaaaaac 1020 ccacctgttg taaacccagg gcttgttaaa tcttgcacat ttgaaagcgg tagcactgag 1080 ggttttgttc agagaggttc agcttcattg acagttgtcg acggtgtata ctatcattct 1140 ccaacaaaag cattgtatgt gacaggaagg acagctacat ggcagggtgc acagatagat 1200 atgacaagtt tgcttgagaa gggcaaggat tatcagttta gcatatgggt atatcaaaat 1260 agtggaagtg atcagaagat aacccttacg atgcaaagga agaatgaaga tggaactacg 1320 agttatgatt ctataaagta tcagcaaaca gttccatctg gtacatggac agaagtaaca 1380 ggttcataca cagtgcctca gacagcaaca cagcttatat tctatgttga atcaccgaat 1440 attaattttg acttctacct tgatgacttt acagtaatag ataaaaatcc agtgacggta 1500 ccgattgcag caaaagaacc cgaatgggaa attccgtcac tttgtcagca atatagtcaa 1560 tatttctcaa taggtgttgc aataccgtat aaagtacttc aaaatcctgt tgaaagagca 1620 atggtgttaa aacacttcaa cagtataaca gctgaaaatg agatgaaacc tgacgctctg 1680 caaagaacag aagggaactt tacattcgat atagcagacc agtatgtaaa cttcgcacag 1740 caaaacggta ttggaattag agggcatact ctggtatggc acagccaagt acctaattgg 1800 ttcttccagc acagtgatgg aacttcactt gatccaagca atccagatga taagcaactt 1860 ttgagagata gattgaaaaa tcatattcaa actgttatgt caagatacaa agggaaagtc 1920 tatgcatggg atgttgtaaa cgaggcaata gatgaaagcc agcctgatgg atttagaaga 1980 agcgaatggt acagaatact tggtccaaca cctgagacaa atggtattcc agaatacatt 2040 gtgcttgctt tcaggtatgc aagagaggcg gatccggatg caaaactttt ctacaatgac 2100 tacaacacag agatatctaa aaaaagacag tttatatatg acatggtaaa aaagctacat 2160 gatatgggtt taattgatgg tgttggtttg caagggcata taaatgttga ttctccaaca 2220 gtaaaagata tagaagatac aatcaatctt ttctcaacaa ttcctggact tgagatacag 2280 gtaacagagc ttgacataag cgtttacaca agcagcagtc agcgttatga tacgcttcct 2340 caggatataa tgataaaaca agcaatgaag tttaaagaac tatttgaaat gttaaagaga 2400 catagtgata gagtcacaaa tgtgacactt tggggactta aggatgatta ttcatggctt 2460 tcaaaggata gaaataactg gccattgctt tttgacagca actaccaggc aaaatacagc 2520 tactgggcaa ttcaaaaagc ttctcgagag tacttctag 2559 <210> 120 <211> 852 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(33) <400> 120 Met Lys Lys Arg Leu Leu Ala Leu Ile Val Thr Leu Val Phe Ile Ile 1 5 10 15 Ser Leu Phe Asn Pro Ile Phe Thr Thr Pro Leu Thr Asn Val Ala Lys 20 25 30 Ala Gln Ser Asn Gln Thr Asn Leu Lys Phe Asp Phe Glu Asn Gly Thr 35 40 45 Gln Gly Trp Gly Ala Arg Gly Val Ser Thr Thr Ile Ala Thr Val Tyr 50 55 60 Glu Gln Ala Tyr Glu Gly Ser Tyr Ser Leu Lys Val Ser Gly Arg Ser 65 70 75 80 Ser Thr Trp Asp Gly Ala Val Val Asp Ile Thr Ser Ser Ile Ser Ala 85 90 95 Asn Val Thr Tyr Thr Val Ser Leu Phe Val Arg His Ser Asp Val Lys 100 105 110 Pro Gln Arg Phe Ser Val Tyr Val Tyr Val Lys Asp Asn Thr Gly Glu 115 120 125 Lys Tyr Ile Gln Val Ala Asp Lys Val Val Met Pro Asn Phe Trp Lys 130 135 140 Gln Leu Phe Gly Lys Phe Thr Ile Thr Thr Ser Asn Pro Ile Gln Lys 145 150 155 160 Val Glu Leu Leu Val Cys Val Pro Ser Asn Lys Ser Leu Gly Phe Tyr 165 170 175 Leu Asp Asn Val Val Ile Thr Ser Ala Gln Pro Ala Ser Ser Gly Val 180 185 190 Val Lys Ser Cys Thr Phe Glu Ser Gly Ser Thr Glu Gly Phe Val Gln 195 200 205 Arg Gly Ser Ala Ser Leu Thr Val Val Asp Gly Val Tyr Tyr His Ser 210 215 220 Pro Thr Lys Ala Leu Tyr Val Thr Gly Arg Thr Ala Thr Trp Gln Gly 225 230 235 240 Ala Gln Ile Asp Met Thr Ser Leu Leu Glu Lys Gly Lys Asp Tyr Gln 245 250 255 Phe Ser Ile Trp Val Tyr Gln Asn Ser Gly Ser Asp Gln Lys Ile Thr 260 265 270 Leu Thr Met Gln Arg Lys Asn Glu Asp Gly Thr Thr Ser Tyr Asp Ser 275 280 285 Ile Lys Tyr Gln Gln Thr Val Pro Ser Gly Thr Trp Thr Glu Val Thr 290 295 300 Gly Ser Tyr Thr Val Pro Gln Thr Ala Thr Gln Leu Ile Phe Tyr Val 305 310 315 320 Glu Ser Pro Asn Ile Asn Phe Asp Phe Tyr Leu Asp Asp Phe Thr Ala 325 330 335 Val Asp Lys Asn Pro Pro Val Val Asn Pro Gly Leu Val Lys Ser Cys 340 345 350 Thr Phe Glu Ser Gly Ser Thr Glu Gly Phe Val Gln Arg Gly Ser Ala 355 360 365 Ser Leu Thr Val Val Asp Gly Val Tyr Tyr His Ser Pro Thr Lys Ala 370 375 380 Leu Tyr Val Thr Gly Arg Thr Ala Thr Trp Gln Gly Ala Gln Ile Asp 385 390 395 400 Met Thr Ser Leu Leu Glu Lys Gly Lys Asp Tyr Gln Phe Ser Ile Trp 405 410 415 Val Tyr Gln Asn Ser Gly Ser Asp Gln Lys Ile Thr Leu Thr Met Gln 420 425 430 Arg Lys Asn Glu Asp Gly Thr Thr Ser Tyr Asp Ser Ile Lys Tyr Gln 435 440 445 Gln Thr Val Pro Ser Gly Thr Trp Thr Glu Val Thr Gly Ser Tyr Thr 450 455 460 Val Pro Gln Thr Ala Thr Gln Leu Ile Phe Tyr Val Glu Ser Pro Asn 465 470 475 480 Ile Asn Phe Asp Phe Tyr Leu Asp Asp Phe Thr Val Ile Asp Lys Asn 485 490 495 Pro Val Thr Val Pro Ile Ala Ala Lys Glu Pro Glu Trp Glu Ile Pro 500 505 510 Ser Leu Cys Gln Gln Tyr Ser Gln Tyr Phe Ser Ile Gly Val Ala Ile 515 520 525 Pro Tyr Lys Val Leu Gln Asn Pro Val Glu Arg Ala Met Val Leu Lys 530 535 540 His Phe Asn Ser Ile Thr Ala Glu Asn Glu Met Lys Pro Asp Ala Leu 545 550 555 560 Gln Arg Thr Glu Gly Asn Phe Thr Phe Asp Ile Ala Asp Gln Tyr Val 565 570 575 Asn Phe Ala Gln Gln Asn Gly Ile Gly Ile Arg Gly His Thr Leu Val 580 585 590 Trp His Ser Gln Val Pro Asn Trp Phe Phe Gln His Ser Asp Gly Thr 595 600 605 Ser Leu Asp Pro Ser Asn Pro Asp Asp Lys Gln Leu Leu Arg Asp Arg 610 615 620 Leu Lys Asn His Ile Gln Thr Val Met Ser Arg Tyr Lys Gly Lys Val 625 630 635 640 Tyr Ala Trp Asp Val Val Asn Glu Ala Ile Asp Glu Ser Gln Pro Asp 645 650 655 Gly Phe Arg Arg Ser Glu Trp Tyr Arg Ile Leu Gly Pro Thr Pro Glu 660 665 670 Thr Asn Gly Ile Pro Glu Tyr Ile Val Leu Ala Phe Arg Tyr Ala Arg 675 680 685 Glu Ala Asp Pro Asp Ala Lys Leu Phe Tyr Asn Asp Tyr Asn Thr Glu 690 695 700 Ile Ser Lys Lys Arg Gln Phe Ile Tyr Asp Met Val Lys Lys Leu His 705 710 715 720 Asp Met Gly Leu Ile Asp Gly Val Gly Leu Gln Gly His Ile Asn Val 725 730 735 Asp Ser Pro Thr Val Lys Asp Ile Glu Asp Thr Ile Asn Leu Phe Ser 740 745 750 Thr Ile Pro Gly Leu Glu Ile Gln Val Thr Glu Leu Asp Ile Ser Val 755 760 765 Tyr Thr Ser Ser Ser Gln Arg Tyr Asp Thr Leu Pro Gln Asp Ile Met 770 775 780 Ile Lys Gln Ala Met Lys Phe Lys Glu Leu Phe Glu Met Leu Lys Arg 785 790 795 800 His Ser Asp Arg Val Thr Asn Val Thr Leu Trp Gly Leu Lys Asp Asp 805 810 815 Tyr Ser Trp Leu Ser Lys Asp Arg Asn Asn Trp Pro Leu Leu Phe Asp 820 825 830 Ser Asn Tyr Gln Ala Lys Tyr Ser Tyr Trp Ala Ile Gln Lys Ala Ser 835 840 845 Arg Glu Tyr Phe 850 <210> 121 <211> 1905 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 121 atgaagcata tttttattgt attaattgtt tccctgctgt ttagcttcgg gggatatgct 60 caacaaacca ttagcagagc tccgcagggg tttgaccagc aacgtgccgg cattgcatcc 120 ggtaaagttg aaatcgtaac ctataaatcg aaaaccgtag gagtgaatcg ctctgcacgt 180 gtttatacac cagccggatt ctcaaaaaag aagaaatatc ctgtgcttta tttattacat 240 ggcattggag gcgacgaaga tgagtggtac aaaaacggcg ttcctcatat tattttcgac 300 aacctgattg ccgacggcaa aatggaaccg atgattgtgg tactgcccaa tggtcgcgcc 360 atgaaaaacg accgtgccga aggaaatatt ttcgacaaag agaaagttga agcctttgca 420 acattcgaaa aagacctttt aaacgattta ataccgttta tcgaaaaaaa ataccctgta 480 ttaaaaaccc gtgagtttcg cgccattgca ggattatcaa tgggcggcgg acaatcgctc 540 aattttggac tgggaaatct cgacaaattt gcatgggtag gcggcttttc atcggccccc 600 aataccaaaa tgcccgctga gttggttcca aacactcaaa aggcaacaga aatgcttaag 660 ttgctttatg tgtcttgtgg cgataaagac aatttaatgc aggttagtca gcgcacccac 720 gattatctga aagccaataa agtacctcat attttcaggg ttattcctga tggttaccac 780 gattttaatg tttggaaaga cgatttgtat cattacgtac aaatgctgtt taagcctgtg 840 gtaatgcccg tagcagcagc tactttaaaa gatgcttata aagggaaatt cttcattgga 900 actgccctta atacccctca aattttgggt accgctgttg atgaagtgaa tattgttaaa 960 acccatttca actccattgt tgccgaaaac tgtatgaaga gtggcccgat gcaaccacaa 1020 gaagggaaat ttgagtttga cctggccgat aagtttgtag agtttggagt taaaaacaat 1080 atgcagatta ttggtcatac gcttatctgg cattcgcagg caccccgctg gttttttacc 1140 gacagcgaag gcaaggacgt atcgcccgag gtgcttaccg agcgcatgaa aaaccatatc 1200 tatactgttg ttggccgtta caaaggcaag gtgcacggat gggatgtggt gaatgaagcc 1260 atagttgacg atggcagcta ccgaaacagt aaattctacc aaatactggg cgaagatttt 1320 atcaaactgg cattccagtt tgctcatgaa gccgaccccg atgcagaatt gtactacaac 1380 gattattccg aatttgttcc tgccaaaaga gaaggcattg cccgcatggt gaagaaactc 1440 aaagaccagg gcattagaat cgacggcgtt ggatttcagt gccatattgg cctcgattat 1500 ccaggcctgg atgaatacga aaaaaccatt caattaattg ccaacgaggg ggtaaaagta 1560 atgataaccg aaatggaaat atcggtatta cccatgcccg actggcgcgt tggtgctgag 1620 atttcggcca gtttcgaata tcaacagaaa ttaaatccct acaccgaagg attgcccgat 1680 tcagtgaatg ctcaattaga acagcgttat gtcgactttt tcacgctctt ccttaaatat 1740 cacgaagtga ttccaagagt tacggtttgg ggggttaacg atggcaactc atggaaaaac 1800 ggattcccgg tgcgtggaag aaccgactac ccattgttat tcgaccggaa aaatcagcct 1860 aaatcagctg ttgccaaatt aattgaactg gctaatacaa agtag 1905 <210> 122 <211> 634 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(20) <400> 122 Met Lys His Ile Phe Ile Val Leu Ile Val Ser Leu Leu Phe Ser Phe 1 5 10 15 Gly Gly Tyr Ala Gln Gln Thr Ile Ser Arg Ala Pro Gln Gly Phe Asp 20 25 30 Gln Gln Arg Ala Gly Ile Ala Ser Gly Lys Val Glu Ile Val Thr Tyr 35 40 45 Lys Ser Lys Thr Val Gly Val Asn Arg Ser Ala Arg Val Tyr Thr Pro 50 55 60 Ala Gly Phe Ser Lys Lys Lys Lys Tyr Pro Val Leu Tyr Leu Leu His 65 70 75 80 Gly Ile Gly Gly Asp Glu Asp Glu Trp Tyr Lys Asn Gly Val Pro His 85 90 95 Ile Ile Phe Asp Asn Leu Ile Ala Asp Gly Lys Met Glu Pro Met Ile 100 105 110 Val Val Leu Pro Asn Gly Arg Ala Met Lys Asn Asp Arg Ala Glu Gly 115 120 125 Asn Ile Phe Asp Lys Glu Lys Val Glu Ala Phe Ala Thr Phe Glu Lys 130 135 140 Asp Leu Leu Asn Asp Leu Ile Pro Phe Ile Glu Lys Lys Tyr Pro Val 145 150 155 160 Leu Lys Thr Arg Glu Phe Arg Ala Ile Ala Gly Leu Ser Met Gly Gly 165 170 175 Gly Gln Ser Leu Asn Phe Gly Leu Gly Asn Leu Asp Lys Phe Ala Trp 180 185 190 Val Gly Gly Phe Ser Ser Ala Pro Asn Thr Lys Met Pro Ala Glu Leu 195 200 205 Val Pro Asn Thr Gln Lys Ala Thr Glu Met Leu Lys Leu Leu Tyr Val 210 215 220 Ser Cys Gly Asp Lys Asp Asn Leu Met Gln Val Ser Gln Arg Thr His 225 230 235 240 Asp Tyr Leu Lys Ala Asn Lys Val Pro His Ile Phe Arg Val Ile Pro 245 250 255 Asp Gly Tyr His Asp Phe Asn Val Trp Lys Asp Asp Leu Tyr His Tyr 260 265 270 Val Gln Met Leu Phe Lys Pro Val Val Met Pro Val Ala Ala Ala Thr 275 280 285 Leu Lys Asp Ala Tyr Lys Gly Lys Phe Phe Ile Gly Thr Ala Leu Asn 290 295 300 Thr Pro Gln Ile Leu Gly Thr Ala Val Asp Glu Val Asn Ile Val Lys 305 310 315 320 Thr His Phe Asn Ser Ile Val Ala Glu Asn Cys Met Lys Ser Gly Pro 325 330 335 Met Gln Pro Gln Glu Gly Lys Phe Glu Phe Asp Leu Ala Asp Lys Phe 340 345 350 Val Glu Phe Gly Val Lys Asn Asn Met Gln Ile Ile Gly His Thr Leu 355 360 365 Ile Trp His Ser Gln Ala Pro Arg Trp Phe Phe Thr Asp Ser Glu Gly 370 375 380 Lys Asp Val Ser Pro Glu Val Leu Thr Glu Arg Met Lys Asn His Ile 385 390 395 400 Tyr Thr Val Val Gly Arg Tyr Lys Gly Lys Val His Gly Trp Asp Val 405 410 415 Val Asn Glu Ala Ile Val Asp Asp Gly Ser Tyr Arg Asn Ser Lys Phe 420 425 430 Tyr Gln Ile Leu Gly Glu Asp Phe Ile Lys Leu Ala Phe Gln Phe Ala 435 440 445 His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Glu 450 455 460 Phe Val Pro Ala Lys Arg Glu Gly Ile Ala Arg Met Val Lys Lys Leu 465 470 475 480 Lys Asp Gln Gly Ile Arg Ile Asp Gly Val Gly Phe Gln Cys His Ile 485 490 495 Gly Leu Asp Tyr Pro Gly Leu Asp Glu Tyr Glu Lys Thr Ile Gln Leu 500 505 510 Ile Ala Asn Glu Gly Val Lys Val Met Ile Thr Glu Met Glu Ile Ser 515 520 525 Val Leu Pro Met Pro Asp Trp Arg Val Gly Ala Glu Ile Ser Ala Ser 530 535 540 Phe Glu Tyr Gln Gln Lys Leu Asn Pro Tyr Thr Glu Gly Leu Pro Asp 545 550 555 560 Ser Val Asn Ala Gln Leu Glu Gln Arg Tyr Val Asp Phe Phe Thr Leu 565 570 575 Phe Leu Lys Tyr His Glu Val Ile Pro Arg Val Thr Val Trp Gly Val 580 585 590 Asn Asp Gly Asn Ser Trp Lys Asn Gly Phe Pro Val Arg Gly Arg Thr 595 600 605 Asp Tyr Pro Leu Leu Phe Asp Arg Lys Asn Gln Pro Lys Ser Ala Val 610 615 620 Ala Lys Leu Ile Glu Leu Ala Asn Thr Lys 625 630 <210> 123 <211> 1200 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 123 atgatcgttg gattctcgtt tatgctgctg cttcctttag ggatgacgaa tgcattggca 60 aaaacggaac cagcgtacgc taaaaagccg cgaatcagcg cattgcacgc ccctcaattg 120 gatcagcgct acaaagattc cttcactatt ggggcggccg ttgaacctta tcagttgcaa 180 aacgaaaaag acgtccaaat gctgaaacgc cattttaaca gcattgtcgc tgagaacgtt 240 atgaaaccga tcaacatcca acccgaagaa ggaaagttca attttgctga ggcggatcaa 300 atcgtccgat ttgctaaaaa acatcatatg gatattcgtt tccatacact cgtttggcac 360 agccaagtac ctcaatggtt ctttcttgac aaggaaggca agccgatggt caatgaaacg 420 gatccggcaa agcgcgaaca aaataaacag ctgttactga aacggctcga aatccatatt 480 aaaacgattg tcgaacggta taaagacgac atcaaatatt gggacgtcgt gaacgaggta 540 gtcggggatg atggaaaatt gcgcaattcc ccgtggtatc aaatcgccgg catcgattat 600 atcaaggtag cattccaaac ggcgagaaca tatggcggca acaagattaa actgtacatc 660 aacgattaca ataccgaagt ggaaccgaag cgaagcgctc tttataactt agtgaaacaa 720 ttaaaagaag aaggcgttcc cattgacggg attggccacc agtcccacat ccaaattggc 780 tggccttctg aagaagaaat cgaaaaaacg atcaacatgt ttgccgatct agggttagac 840 aatcaaatta cggagctgga tgtgagcatg tacggctggc cgccgcgcgc ctacccgtcg 900 tatgacgcca ttccggaaca aaagtttttg gaccaagcgg ctcgctatga ccgattgttt 960 aagctgtacg aaaaacttgg cgataaaatc agcaacgtca ccttctgggg catcgccgac 1020 aaccatacgt ggctcgacag ccgtgcggat gtgtactatg acgccaacgg gaatgttgtg 1080 gttgacccga acgctccgta cgcaaaagtg gaaaaaggga aaggaaaaga tgcgccgttt 1140 ctgttcgacc ccgaatacca cgtaaaacct gcgtattggg ccattatcga tcataagtga 1200 <210> 124 <211> 399 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(20) <400> 124 Met Ile Val Gly Phe Ser Phe Met Leu Leu Leu Pro Leu Gly Met Thr 1 5 10 15 Asn Ala Leu Ala Lys Thr Glu Pro Ala Tyr Ala Lys Lys Pro Arg Ile 20 25 30 Ser Ala Leu His Ala Pro Gln Leu Asp Gln Arg Tyr Lys Asp Ser Phe 35 40 45 Thr Ile Gly Ala Ala Val Glu Pro Tyr Gln Leu Gln Asn Glu Lys Asp 50 55 60 Val Gln Met Leu Lys Arg His Phe Asn Ser Ile Val Ala Glu Asn Val 65 70 75 80 Met Lys Pro Ile Asn Ile Gln Pro Glu Glu Gly Lys Phe Asn Phe Ala 85 90 95 Glu Ala Asp Gln Ile Val Arg Phe Ala Lys Lys His His Met Asp Ile 100 105 110 Arg Phe His Thr Leu Val Trp His Ser Gln Val Pro Gln Trp Phe Phe 115 120 125 Leu Asp Lys Glu Gly Lys Pro Met Val Asn Glu Thr Asp Pro Ala Lys 130 135 140 Arg Glu Gln Asn Lys Gln Leu Leu Leu Lys Arg Leu Glu Ile His Ile 145 150 155 160 Lys Thr Ile Val Glu Arg Tyr Lys Asp Asp Ile Lys Tyr Trp Asp Val 165 170 175 Val Asn Glu Val Val Gly Asp Asp Gly Lys Leu Arg Asn Ser Pro Trp 180 185 190 Tyr Gln Ile Ala Gly Ile Asp Tyr Ile Lys Val Ala Phe Gln Thr Ala 195 200 205 Arg Thr Tyr Gly Gly Asn Lys Ile Lys Leu Tyr Ile Asn Asp Tyr Asn 210 215 220 Thr Glu Val Glu Pro Lys Arg Ser Ala Leu Tyr Asn Leu Val Lys Gln 225 230 235 240 Leu Lys Glu Glu Gly Val Pro Ile Asp Gly Ile Gly His Gln Ser His 245 250 255 Ile Gln Ile Gly Trp Pro Ser Glu Glu Glu Ile Glu Lys Thr Ile Asn 260 265 270 Met Phe Ala Asp Leu Gly Leu Asp Asn Gln Ile Thr Glu Leu Asp Val 275 280 285 Ser Met Tyr Gly Trp Pro Pro Arg Ala Tyr Pro Ser Tyr Asp Ala Ile 290 295 300 Pro Glu Gln Lys Phe Leu Asp Gln Ala Ala Arg Tyr Asp Arg Leu Phe 305 310 315 320 Lys Leu Tyr Glu Lys Leu Gly Asp Lys Ile Ser Asn Val Thr Phe Trp 325 330 335 Gly Ile Ala Asp Asn His Thr Trp Leu Asp Ser Arg Ala Asp Val Tyr 340 345 350 Tyr Asp Ala Asn Gly Asn Val Val Val Asp Pro Asn Ala Pro Tyr Ala 355 360 365 Lys Val Glu Lys Gly Lys Gly Lys Asp Ala Pro Phe Leu Phe Asp Pro 370 375 380 Glu Tyr His Val Lys Pro Ala Tyr Trp Ala Ile Ile Asp His Lys 385 390 395 <210> 125 <211> 1089 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 125 atgttgacga ccccgacaac tcaagatcat gtccccgtgc tcaaggacgc tttcaaaggc 60 aagctcctca ttggagccgt gctcggttac gatgctctcc aggggaagga cccgctgagt 120 gagaaaattg cgaccactca cttcgatgct ctcactgctg aaaacagcat gaagccggct 180 ctcgtgcaac ccaaagaggg cgagtttgat ttcgctgatg gagatcgtct ccttgaaatc 240 gcgcagcaat gcggcgctac tgcaatcggc catactctgc tctggcacca acaaacgcca 300 cgctggtttt ttgaagggcc agatggtcag cctgctgacc gtgagttggc cctggcacgc 360 atgaggaagc acatttccac tctcgttggt cgctataaag gtcgcattaa acaatgggat 420 gtggtgaatg aggcgattag cgatgcagag ggcgagtact taagaccaaa gagcccctgg 480 ttcaaagccg ttggagagga tcacatcgcg catgctttcc aggcagcaca tgaagctgat 540 cccgatgcca tccttatcta taacgactac aacatcgagc aggagtacaa gcgcccgaag 600 gcgatacgcc tactgaggtc attacttgag caggacgttc ccattcatgc cgtgggcatt 660 cagggccatt ggcgtatgga cactctgaat gttgccgaaa tcgaagaagc tatcgaagaa 720 tttgctgcgc tgggtctcaa ggtcatgatc accgagcttg atatcagcgt gctaccgaca 780 aagtatcagg gagccgatct cgctactcgg gaagaattga cgcctgaaat caatccctat 840 acggaggaac tacctgagga cgttgcccgg caacatgccg agtgttatcg gcaggtcttc 900 gaaatgttcc tgcgccacaa ggatgccatt agccgtgtca cgctctgggg cattcacgat 960 ggcagatcat ggttcaacaa ctttccggtc agggggcgca cagactatcc tctgctattc 1020 gaccgggaat gtaaccccaa gccagcgttt ttcgccgtct tgaaagctgc gcaagaccag 1080 ccacaatga 1089 <210> 126 <211> 362 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 126 Met Leu Thr Thr Pro Thr Thr Gln Asp His Val Pro Val Leu Lys Asp 1 5 10 15 Ala Phe Lys Gly Lys Leu Leu Ile Gly Ala Val Leu Gly Tyr Asp Ala 20 25 30 Leu Gln Gly Lys Asp Pro Leu Ser Glu Lys Ile Ala Thr Thr His Phe 35 40 45 Asp Ala Leu Thr Ala Glu Asn Ser Met Lys Pro Ala Leu Val Gln Pro 50 55 60 Lys Glu Gly Glu Phe Asp Phe Ala Asp Gly Asp Arg Leu Leu Glu Ile 65 70 75 80 Ala Gln Gln Cys Gly Ala Thr Ala Ile Gly His Thr Leu Leu Trp His 85 90 95 Gln Gln Thr Pro Arg Trp Phe Phe Glu Gly Pro Asp Gly Gln Pro Ala 100 105 110 Asp Arg Glu Leu Ala Leu Ala Arg Met Arg Lys His Ile Ser Thr Leu 115 120 125 Val Gly Arg Tyr Lys Gly Arg Ile Lys Gln Trp Asp Val Val Asn Glu 130 135 140 Ala Ile Ser Asp Ala Glu Gly Glu Tyr Leu Arg Pro Lys Ser Pro Trp 145 150 155 160 Phe Lys Ala Val Gly Glu Asp His Ile Ala His Ala Phe Gln Ala Ala 165 170 175 His Glu Ala Asp Pro Asp Ala Ile Leu Ile Tyr Asn Asp Tyr Asn Ile 180 185 190 Glu Gln Glu Tyr Lys Arg Pro Lys Ala Ile Arg Leu Leu Arg Ser Leu 195 200 205 Leu Glu Gln Asp Val Pro Ile His Ala Val Gly Ile Gln Gly His Trp 210 215 220 Arg Met Asp Thr Leu Asn Val Ala Glu Ile Glu Glu Ala Ile Glu Glu 225 230 235 240 Phe Ala Ala Leu Gly Leu Lys Val Met Ile Thr Glu Leu Asp Ile Ser 245 250 255 Val Leu Pro Thr Lys Tyr Gln Gly Ala Asp Leu Ala Thr Arg Glu Glu 260 265 270 Leu Thr Pro Glu Ile Asn Pro Tyr Thr Glu Glu Leu Pro Glu Asp Val 275 280 285 Ala Arg Gln His Ala Glu Cys Tyr Arg Gln Val Phe Glu Met Phe Leu 290 295 300 Arg His Lys Asp Ala Ile Ser Arg Val Thr Leu Trp Gly Ile His Asp 305 310 315 320 Gly Arg Ser Trp Phe Asn Asn Phe Pro Val Arg Gly Arg Thr Asp Tyr 325 330 335 Pro Leu Leu Phe Asp Arg Glu Cys Asn Pro Lys Pro Ala Phe Phe Ala 340 345 350 Val Leu Lys Ala Ala Gln Asp Gln Pro Gln 355 360 <210> 127 <211> 960 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 127 gtggatctcg ctgagaaatg cggcatatat attggtgcag cggttgaacc cggatattta 60 attatcaggg aatacgctga gattttatcc cgcgaattta acgtggtaac cgcggaaaat 120 gcattaaaat ttgaagctat tcatccgcag cgtggagtat attcatttga aggtgcagat 180 gcaatagttc gatttgcaga aactcatgga atgaaggttc gtggacatac acttgtttgg 240 caccagcagc ttcctgcatg gataacttct ggaagttacg cttgggagga gtggaagaat 300 attctccgtg agcatgtaat gagcgttgtt ggacgatata agggccaaat atatgcatgg 360 gatgtggtta acgaagcaat attagataac ggttcattaa gagataatgt ttggtttaga 420 aatgtaggtc cagaatatat tgagtcagcc tttagatggg ctcatgaagc tgacccaaac 480 gctcttctct tctataatga ttatgaagct gaggacttga atgataagtc gcatgctgtt 540 tataacctgg ttaagagttt acttgagaaa ggtgtaccga tacatggcgt aggattacag 600 atgcatatta acgtagaaaa tccgccgaaa ccggaagatg ttgcagcaaa cattaaacgt 660 ctaaatgatc tgggcttgat tgtccacata acggaaatgg atgtgcgcat tagaacccca 720 ccatcaaatg aagatctcat taaacaagca gaaatttacc gtgatatatt aagagtttgt 780 ctttcatcag aaaaatgcac agcattcatt atgtggggat ttactgaccg ctattcatgg 840 ataccaaatt acttcagcgg ctacggttca gctttaatat tcgatgagca atataagccc 900 aaactagcat attactatat acttcggaca ttcatcgaaa aactaggcat taaaggttaa 960 <210> 128 <211> 319 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 128 Val Asp Leu Ala Glu Lys Cys Gly Ile Tyr Ile Gly Ala Ala Val Glu 1 5 10 15 Pro Gly Tyr Leu Ile Ile Arg Glu Tyr Ala Glu Ile Leu Ser Arg Glu 20 25 30 Phe Asn Val Val Thr Ala Glu Asn Ala Leu Lys Phe Glu Ala Ile His 35 40 45 Pro Gln Arg Gly Val Tyr Ser Phe Glu Gly Ala Asp Ala Ile Val Arg 50 55 60 Phe Ala Glu Thr His Gly Met Lys Val Arg Gly His Thr Leu Val Trp 65 70 75 80 His Gln Gln Leu Pro Ala Trp Ile Thr Ser Gly Ser Tyr Ala Trp Glu 85 90 95 Glu Trp Lys Asn Ile Leu Arg Glu His Val Met Ser Val Val Gly Arg 100 105 110 Tyr Lys Gly Gln Ile Tyr Ala Trp Asp Val Val Asn Glu Ala Ile Leu 115 120 125 Asp Asn Gly Ser Leu Arg Asp Asn Val Trp Phe Arg Asn Val Gly Pro 130 135 140 Glu Tyr Ile Glu Ser Ala Phe Arg Trp Ala His Glu Ala Asp Pro Asn 145 150 155 160 Ala Leu Leu Phe Tyr Asn Asp Tyr Glu Ala Glu Asp Leu Asn Asp Lys 165 170 175 Ser His Ala Val Tyr Asn Leu Val Lys Ser Leu Leu Glu Lys Gly Val 180 185 190 Pro Ile His Gly Val Gly Leu Gln Met His Ile Asn Val Glu Asn Pro 195 200 205 Pro Lys Pro Glu Asp Val Ala Ala Asn Ile Lys Arg Leu Asn Asp Leu 210 215 220 Gly Leu Ile Val His Ile Thr Glu Met Asp Val Arg Ile Arg Thr Pro 225 230 235 240 Pro Ser Asn Glu Asp Leu Ile Lys Gln Ala Glu Ile Tyr Arg Asp Ile 245 250 255 Leu Arg Val Cys Leu Ser Ser Glu Lys Cys Thr Ala Phe Ile Met Trp 260 265 270 Gly Phe Thr Asp Arg Tyr Ser Trp Ile Pro Asn Tyr Phe Ser Gly Tyr 275 280 285 Gly Ser Ala Leu Ile Phe Asp Glu Gln Tyr Lys Pro Lys Leu Ala Tyr 290 295 300 Tyr Tyr Ile Leu Arg Thr Phe Ile Glu Lys Leu Gly Ile Lys Gly 305 310 315 <210> 129 <211> 3021 <212> DNA <213> Bacteria <400> 129 atggtaataa atcgctccag tgcgagtgac ggtgcgtatt cggaaaaagg tttctatctc 60 gacggtggtg tagaatacaa gtacagtgtt tttgtaaaac acaacgggac cggcaccgaa 120 actttcaaac tttctgtgtc ctatttggat tcggaaacag aagaagaaaa taaggaagta 180 attgcaacaa aggatgttgt ggccggagaa tggactgaga tttcggcaaa atacaaagca 240 cccaaaactg cagtgaatat tactttgtca attacaaccg acagcactgt agatttcatt 300 tttgacgatg taaccataac ccgtaaagga atggctgagg caaacacagt atatgcagca 360 aacgctgtgc tgaaagatat gtatgcaaac tatttcagag ttggttcggt acttaactcc 420 ggaacggtaa acaattcatc aataaaggcc ttgattttaa gagagtttaa cagtattacc 480 tgtgaaaatg aaatgaagcc tgatgccaca ctggttcaat caggatcaac caatacaaat 540 atcagggttt ctcttaatcg tgcagcaagt attttaaact tctgtgcaca aaataatata 600 gccgtcagag gtcatacact ggtttggcac agccagacac ctcaatggtt tttcaaagac 660 aatttccagg acaacggaaa ctgggtttcc caatcagtta tggaccagcg tttggaaagc 720 tacataaaaa atatgtttgc tgaaatccaa agacagtatc cgtctttgaa tctttatgcc 780 tatgacgttg taaatgaggc agtaagtgat gatgcaaaca ggaccagata ttatggcggg 840 gcgagggaac ctggatacgg aaatggtaga tctccatggg ttcagatcta cggagacaac 900 aaatttattg agaaagcatt tacatatgca agaaaatatg ctccggcaaa ttgtaagctt 960 tactacaacg attacaacga atattgggat cataagagag actgtattgc ctcaatttgt 1020 gcaaacttgt acaacaaggg cttgcttgac ggtgtgggaa tgcagtccca tattaatgcg 1080 gatatgaatg gattctcagg tatacaaaat tataaagcag ctttgcagaa atatataaat 1140 atcggttgtg atgtccaaat taccgagctt gatattagta cagaaaacgg caaatttagc 1200 ttacagcagc aggctgataa atataaagct gttttccagg cagctgttga tataaacaga 1260 acctccagca aaggaaaggt tacggctgtc tgtgtatggg gacctaatga cgccaatact 1320 tggctcggtt cacaaaatgc acctcttttg tttaacgcaa acaatcaacc gaaaccggca 1380 tacaatgcgg ttgcatccat tattcctcag tccgaatggg gcgacggtaa caatccggcc 1440 ggcggcggag gaggaggcaa accggaagag ccggatgcaa acggatatta ttatcatgac 1500 acttttgaag gaagcgtagg acagtggaca gccagaggac ctgcggaagt tctgcttagc 1560 ggaagaacgg cttacaaagg ttcagaatca ctcttggtaa ggaaccgtac ggcagcatgg 1620 aacggagcac aacgggcgct gaatcccaga acgtttgttc ccggaaacac atattgtttc 1680 agcgtagtgg catcgtttat tgaaggtgcg tcttccacaa cattctgcat gaagctgcaa 1740 tacgtagacg gaagcggcac tcaacggtat gataccatag atatgaaaac tgtgggtcca 1800 aatcagtggg ttcacctgta caatccgcaa tacagaattc cttccgatgc aacagatatg 1860 tatgtttatg tggaaacagc ggatgacacc attaacttct acatagatga ggcaatcgga 1920 gcggttgccg gaactgtaat cgaaggacct gctccacagc ctacacagcc tccggtactg 1980 cttggcgatg taaacggtga tggaaccatt aactcaactg acttgacaat gttaaagaga 2040 agcgtgttga gggcaatcac ccttaccgac gatgcaaagg ctagagcaga cgttgacaag 2100 aatggatcga taaacagcac tgatgtttta cttctttcac gctacctttt aagagtaatc 2160 gacaaatttc ctgtagcaga aaatccttct tcttctttta aatatgagtc ggccgtgcaa 2220 tatcggccgg ctcctgattc ttatttaaac ccttgtccgc aggcgggaag aattgtcaag 2280 gaaacatata caggaataaa cggaactaag agtcttaatg tatatcttcc atacggttat 2340 gatccgaaca aaaaatataa cattttctac cttatgcatg gcggcggtga aaatgagaat 2400 acgattttca gcaacgatgt taaattgcaa aatatccttg accacgcgat tatgaacggt 2460 gaacttgagc ctttgattgt agtaacaccc actttcaacg gcggaaactg cacggcccaa 2520 aacttttatc aggaattcag gcaaaatgtc attccttttg tggaaagcaa gtactctact 2580 tatgcagaat caacaacccc acagggaata gccgcttcaa gaatgcacag aggtttcggc 2640 ggattctcaa tgggaggatt gacaacatgg tatgtaatgg ttaactgcct tgattacgtt 2700 gcatatttta tgcctttaag cggtgactac tggtatggaa acagtccgca ggataaggct 2760 aattcaattg ctgaagcaat taacagatcc ggactttcaa agagggagta tttcgtattt 2820 gcggccaccg gttccgagga tattgcatat gctaatatga atcctcaaat tgaagctatg 2880 aaggctttgc cgcattttga ttatacttcg gatttttcca aaggtaattt ttactttctt 2940 gtagctccgg gcgccactca ctggtgggga tacgtaagac attatattta tgatgcactt 3000 ccatatttct tccatgaatg a 3021 <210> 130 <211> 1006 <212> PRT <213> Bacteria <400> 130 Met Val Ile Asn Arg Ser Ser Ala Ser Asp Gly Ala Tyr Ser Glu Lys 1 5 10 15 Gly Phe Tyr Leu Asp Gly Gly Val Glu Tyr Lys Tyr Ser Val Phe Val 20 25 30 Lys His Asn Gly Thr Gly Thr Glu Thr Phe Lys Leu Ser Val Ser Tyr 35 40 45 Leu Asp Ser Glu Thr Glu Glu Glu Asn Lys Glu Val Ile Ala Thr Lys 50 55 60 Asp Val Val Ala Gly Glu Trp Thr Glu Ile Ser Ala Lys Tyr Lys Ala 65 70 75 80 Pro Lys Thr Ala Val Asn Ile Thr Leu Ser Ile Thr Thr Asp Ser Thr 85 90 95 Val Asp Phe Ile Phe Asp Asp Val Thr Ile Thr Arg Lys Gly Met Ala 100 105 110 Glu Ala Asn Thr Val Tyr Ala Ala Asn Ala Val Leu Lys Asp Met Tyr 115 120 125 Ala Asn Tyr Phe Arg Val Gly Ser Val Leu Asn Ser Gly Thr Val Asn 130 135 140 Asn Ser Ser Ile Lys Ala Leu Ile Leu Arg Glu Phe Asn Ser Ile Thr 145 150 155 160 Cys Glu Asn Glu Met Lys Pro Asp Ala Thr Leu Val Gln Ser Gly Ser 165 170 175 Thr Asn Thr Asn Ile Arg Val Ser Leu Asn Arg Ala Ala Ser Ile Leu 180 185 190 Asn Phe Cys Ala Gln Asn Asn Ile Ala Val Arg Gly His Thr Leu Val 195 200 205 Trp His Ser Gln Thr Pro Gln Trp Phe Phe Lys Asp Asn Phe Gln Asp 210 215 220 Asn Gly Asn Trp Val Ser Gln Ser Val Met Asp Gln Arg Leu Glu Ser 225 230 235 240 Tyr Ile Lys Asn Met Phe Ala Glu Ile Gln Arg Gln Tyr Pro Ser Leu 245 250 255 Asn Leu Tyr Ala Tyr Asp Val Val Asn Glu Ala Val Ser Asp Asp Ala 260 265 270 Asn Arg Thr Arg Tyr Tyr Gly Gly Ala Arg Glu Pro Gly Tyr Gly Asn 275 280 285 Gly Arg Ser Pro Trp Val Gln Ile Tyr Gly Asp Asn Lys Phe Ile Glu 290 295 300 Lys Ala Phe Thr Tyr Ala Arg Lys Tyr Ala Pro Ala Asn Cys Lys Leu 305 310 315 320 Tyr Tyr Asn Asp Tyr Asn Glu Tyr Trp Asp His Lys Arg Asp Cys Ile 325 330 335 Ala Ser Ile Cys Ala Asn Leu Tyr Asn Lys Gly Leu Leu Asp Gly Val 340 345 350 Gly Met Gln Ser His Ile Asn Ala Asp Met Asn Gly Phe Ser Gly Ile 355 360 365 Gln Asn Tyr Lys Ala Ala Leu Gln Lys Tyr Ile Asn Ile Gly Cys Asp 370 375 380 Val Gln Ile Thr Glu Leu Asp Ile Ser Thr Glu Asn Gly Lys Phe Ser 385 390 395 400 Leu Gln Gln Gln Ala Asp Lys Tyr Lys Ala Val Phe Gln Ala Ala Val 405 410 415 Asp Ile Asn Arg Thr Ser Ser Lys Gly Lys Val Thr Ala Val Cys Val 420 425 430 Trp Gly Pro Asn Asp Ala Asn Thr Trp Leu Gly Ser Gln Asn Ala Pro 435 440 445 Leu Leu Phe Asn Ala Asn Asn Gln Pro Lys Pro Ala Tyr Asn Ala Val 450 455 460 Ala Ser Ile Ile Pro Gln Ser Glu Trp Gly Asp Gly Asn Asn Pro Ala 465 470 475 480 Gly Gly Gly Gly Gly Gly Lys Pro Glu Glu Pro Asp Ala Asn Gly Tyr 485 490 495 Tyr Tyr His Asp Thr Phe Glu Gly Ser Val Gly Gln Trp Thr Ala Arg 500 505 510 Gly Pro Ala Glu Val Leu Leu Ser Gly Arg Thr Ala Tyr Lys Gly Ser 515 520 525 Glu Ser Leu Leu Val Arg Asn Arg Thr Ala Ala Trp Asn Gly Ala Gln 530 535 540 Arg Ala Leu Asn Pro Arg Thr Phe Val Pro Gly Asn Thr Tyr Cys Phe 545 550 555 560 Ser Val Val Ala Ser Phe Ile Glu Gly Ala Ser Ser Thr Thr Phe Cys 565 570 575 Met Lys Leu Gln Tyr Val Asp Gly Ser Gly Thr Gln Arg Tyr Asp Thr 580 585 590 Ile Asp Met Lys Thr Val Gly Pro Asn Gln Trp Val His Leu Tyr Asn 595 600 605 Pro Gln Tyr Arg Ile Pro Ser Asp Ala Thr Asp Met Tyr Val Tyr Val 610 615 620 Glu Thr Ala Asp Asp Thr Ile Asn Phe Tyr Ile Asp Glu Ala Ile Gly 625 630 635 640 Ala Val Ala Gly Thr Val Ile Glu Gly Pro Ala Pro Gln Pro Thr Gln 645 650 655 Pro Pro Val Leu Leu Gly Asp Val Asn Gly Asp Gly Thr Ile Asn Ser 660 665 670 Thr Asp Leu Thr Met Leu Lys Arg Ser Val Leu Arg Ala Ile Thr Leu 675 680 685 Thr Asp Asp Ala Lys Ala Arg Ala Asp Val Asp Lys Asn Gly Ser Ile 690 695 700 Asn Ser Thr Asp Val Leu Leu Leu Ser Arg Tyr Leu Leu Arg Val Ile 705 710 715 720 Asp Lys Phe Pro Val Ala Glu Asn Pro Ser Ser Ser Phe Lys Tyr Glu 725 730 735 Ser Ala Val Gln Tyr Arg Pro Ala Pro Asp Ser Tyr Leu Asn Pro Cys 740 745 750 Pro Gln Ala Gly Arg Ile Val Lys Glu Thr Tyr Thr Gly Ile Asn Gly 755 760 765 Thr Lys Ser Leu Asn Val Tyr Leu Pro Tyr Gly Tyr Asp Pro Asn Lys 770 775 780 Lys Tyr Asn Ile Phe Tyr Leu Met His Gly Gly Gly Glu Asn Glu Asn 785 790 795 800 Thr Ile Phe Ser Asn Asp Val Lys Leu Gln Asn Ile Leu Asp His Ala 805 810 815 Ile Met Asn Gly Glu Leu Glu Pro Leu Ile Val Val Thr Pro Thr Phe 820 825 830 Asn Gly Gly Asn Cys Thr Ala Gln Asn Phe Tyr Gln Glu Phe Arg Gln 835 840 845 Asn Val Ile Pro Phe Val Glu Ser Lys Tyr Ser Thr Tyr Ala Glu Ser 850 855 860 Thr Thr Pro Gln Gly Ile Ala Ala Ser Arg Met His Arg Gly Phe Gly 865 870 875 880 Gly Phe Ser Met Gly Gly Leu Thr Thr Trp Tyr Val Met Val Asn Cys 885 890 895 Leu Asp Tyr Val Ala Tyr Phe Met Pro Leu Ser Gly Asp Tyr Trp Tyr 900 905 910 Gly Asn Ser Pro Gln Asp Lys Ala Asn Ser Ile Ala Glu Ala Ile Asn 915 920 925 Arg Ser Gly Leu Ser Lys Arg Glu Tyr Phe Val Phe Ala Ala Thr Gly 930 935 940 Ser Glu Asp Ile Ala Tyr Ala Asn Met Asn Pro Gln Ile Glu Ala Met 945 950 955 960 Lys Ala Leu Pro His Phe Asp Tyr Thr Ser Asp Phe Ser Lys Gly Asn 965 970 975 Phe Tyr Phe Leu Val Ala Pro Gly Ala Thr His Trp Trp Gly Tyr Val 980 985 990 Arg His Tyr Ile Tyr Asp Ala Leu Pro Tyr Phe Phe His Glu 995 1000 1005 <210> 131 <211> 1218 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 131 atgccgatca tccgaaccct atcgagttac atgcgaaatc atcaagcgat ctaccgtcag 60 ctcctcacgc tggccgccgc cgtcacgctg gcgggcgcgg ccaccgcgga ggaagaagcc 120 accctgcgcg gggtttacga aaaggacttc accatcggcg tggccatgaa cgggggccag 180 gcctccggcc gcaatgccgc cgccggcgag atcatcggca agcagttctc ctcgctcacc 240 gcggagaacg acatgaagtg gcagatgatc cacccccagg agggtcaata ccgcttcgaa 300 acgtccgacg cctacgtcgc gttcgcggaa aagcacaaga tggaagtcat cggccacacc 360 ctcgtgtggc acagccagac cccgcagtgg gtcttccagg gtgaaaacgg ccagcccgcc 420 accaaggaag agctgctcaa gcgcatgcgc gaccacatcc acgccgtggc cggccgttac 480 aagggcaaga tcaagggctg ggacgtcgtc aacgaagcgc tctccgacgg cggggacgac 540 attctccgcc agtccccctg gcgccgcatc atcggcgacg acttcatcga ctacgccttc 600 cgctacgcca aggaagccgc cccggatgcc gagctctact acaacgacta caacctcgag 660 atcccccgca agcgcgccaa ttgcatcacg ctggtcaagg gcatgctcga gcgcggcgtg 720 ccgatcgacg gcatcggcac ccagtcgcac ttccagctcg gctttccctc cttggacgac 780 gtggaagcca ccatcaagga attcgccgcc ctgggcatga aggtgatgat caccgagctc 840 gacgtggatg tcctgccccg caacaacccc ggggtcgccg acatcgccaa ccgcgaacag 900 ggagccaacc cctacaccga aggccttccg gacgacgtgc aggaaaagct cgcgaagcgc 960 tacgaggaca tcttccgcat ctacctgaag taccgcgacc acgtcacccg cgtcaccttc 1020 tggggcctgg atgacggcat gacctggctg aacggcttcc cggtccgcgg ccgcaccaac 1080 caccccctgc tctacgaccg gcagctcaat gccaagcccg ccttccacgc cctcgtcaag 1140 ctgggtcagg aagagcgtcc ggaagccgcc aaggtcgagg tccagaagat cgaagcgaag 1200 aaagaagagg cgaagtaa 1218 <210> 132 <211> 405 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(26) <400> 132 Met Pro Ile Ile Arg Thr Leu Ser Ser Tyr Met Arg Asn His Gln Ala 1 5 10 15 Ile Tyr Arg Gln Leu Leu Thr Leu Ala Ala Ala Val Thr Leu Ala Gly 20 25 30 Ala Ala Thr Ala Glu Glu Glu Ala Thr Leu Arg Gly Val Tyr Glu Lys 35 40 45 Asp Phe Thr Ile Gly Val Ala Met Asn Gly Gly Gln Ala Ser Gly Arg 50 55 60 Asn Ala Ala Ala Gly Glu Ile Ile Gly Lys Gln Phe Ser Ser Leu Thr 65 70 75 80 Ala Glu Asn Asp Met Lys Trp Gln Met Ile His Pro Gln Glu Gly Gln 85 90 95 Tyr Arg Phe Glu Thr Ser Asp Ala Tyr Val Ala Phe Ala Glu Lys His 100 105 110 Lys Met Glu Val Ile Gly His Thr Leu Val Trp His Ser Gln Thr Pro 115 120 125 Gln Trp Val Phe Gln Gly Glu Asn Gly Gln Pro Ala Thr Lys Glu Glu 130 135 140 Leu Leu Lys Arg Met Arg Asp His Ile His Ala Val Ala Gly Arg Tyr 145 150 155 160 Lys Gly Lys Ile Lys Gly Trp Asp Val Val Asn Glu Ala Leu Ser Asp 165 170 175 Gly Gly Asp Asp Ile Leu Arg Gln Ser Pro Trp Arg Arg Ile Ile Gly 180 185 190 Asp Asp Phe Ile Asp Tyr Ala Phe Arg Tyr Ala Lys Glu Ala Ala Pro 195 200 205 Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Asn Leu Glu Ile Pro Arg Lys 210 215 220 Arg Ala Asn Cys Ile Thr Leu Val Lys Gly Met Leu Glu Arg Gly Val 225 230 235 240 Pro Ile Asp Gly Ile Gly Thr Gln Ser His Phe Gln Leu Gly Phe Pro 245 250 255 Ser Leu Asp Asp Val Glu Ala Thr Ile Lys Glu Phe Ala Ala Leu Gly 260 265 270 Met Lys Val Met Ile Thr Glu Leu Asp Val Asp Val Leu Pro Arg Asn 275 280 285 Asn Pro Gly Val Ala Asp Ile Ala Asn Arg Glu Gln Gly Ala Asn Pro 290 295 300 Tyr Thr Glu Gly Leu Pro Asp Asp Val Gln Glu Lys Leu Ala Lys Arg 305 310 315 320 Tyr Glu Asp Ile Phe Arg Ile Tyr Leu Lys Tyr Arg Asp His Val Thr 325 330 335 Arg Val Thr Phe Trp Gly Leu Asp Asp Gly Met Thr Trp Leu Asn Gly 340 345 350 Phe Pro Val Arg Gly Arg Thr Asn His Pro Leu Leu Tyr Asp Arg Gln 355 360 365 Leu Asn Ala Lys Pro Ala Phe His Ala Leu Val Lys Leu Gly Gln Glu 370 375 380 Glu Arg Pro Glu Ala Ala Lys Val Glu Val Gln Lys Ile Glu Ala Lys 385 390 395 400 Lys Glu Glu Ala Lys 405 <210> 133 <211> 1011 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 133 atgaaaaata atcaatttag gaaaatccct tccctacata aggtatataa gagtcatttt 60 ttaattgggg cagctgtaaa tccacttaca cttcaaacac aacaggaact aatcaaaaag 120 cactttaata gtattacggc agaaaatgaa atgaaatttg aagagttgca acctgagcct 180 ggacatttta catttgatgt aggagataaa atggtcgctt tcgcaaaaga aaatggtatg 240 aaagttagag gtcatacatt aatctggcac aatcaaacac ctgattggat gtttaagaat 300 gaagatggtt ctgtcacaga tcgagataca cttcttgaaa gaatgaaatt acatattaca 360 actgttatgg agcattataa ggggcaaatt tattgttggg atgttgtcaa tgaagcgatt 420 gctgatgaag gatcagagtt attacgtcac tctaaatgga ctgaaattat tggcgacgat 480 tttattgaaa aggcatttga gtatgcacat gaagcagacc cagaagcttt actattctat 540 aatgactata atgagtccca ccctcataag cgagataaaa tttacacact aataaaaaga 600 ttggtagaca aaggcatacc tattcacggg gttggcttgc aagcacattg gaatttaaca 660 gacccttctt atgaggagat tagggctgca attgaaaaat atgcctcatt aggcttggaa 720 atacatctta cagaaatgga tgtttcagtg ttcaattttg aagatcgaag aacagactta 780 acagagccga ctaatgaaat gaagactctt caagtagaac gttatacgga atttttcaaa 840 atacttagag aatatagcca tgtgattagc tctgtcactt tttggggagc tgcagatgat 900 tatacttggt tggatgggtt tccagttaga ggaaggaaaa actggccatt tgtttttgac 960 gaaaaccacc aaccgaaaga atctttctgg ggaattgtcg attttgaata a 1011 <210> 134 <211> 336 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 134 Met Lys Asn Asn Gln Phe Arg Lys Ile Pro Ser Leu His Lys Val Tyr 1 5 10 15 Lys Ser His Phe Leu Ile Gly Ala Ala Val Asn Pro Leu Thr Leu Gln 20 25 30 Thr Gln Gln Glu Leu Ile Lys Lys His Phe Asn Ser Ile Thr Ala Glu 35 40 45 Asn Glu Met Lys Phe Glu Glu Leu Gln Pro Glu Pro Gly His Phe Thr 50 55 60 Phe Asp Val Gly Asp Lys Met Val Ala Phe Ala Lys Glu Asn Gly Met 65 70 75 80 Lys Val Arg Gly His Thr Leu Ile Trp His Asn Gln Thr Pro Asp Trp 85 90 95 Met Phe Lys Asn Glu Asp Gly Ser Val Thr Asp Arg Asp Thr Leu Leu 100 105 110 Glu Arg Met Lys Leu His Ile Thr Thr Val Met Glu His Tyr Lys Gly 115 120 125 Gln Ile Tyr Cys Trp Asp Val Val Asn Glu Ala Ile Ala Asp Glu Gly 130 135 140 Ser Glu Leu Leu Arg His Ser Lys Trp Thr Glu Ile Ile Gly Asp Asp 145 150 155 160 Phe Ile Glu Lys Ala Phe Glu Tyr Ala His Glu Ala Asp Pro Glu Ala 165 170 175 Leu Leu Phe Tyr Asn Asp Tyr Asn Glu Ser His Pro His Lys Arg Asp 180 185 190 Lys Ile Tyr Thr Leu Ile Lys Arg Leu Val Asp Lys Gly Ile Pro Ile 195 200 205 His Gly Val Gly Leu Gln Ala His Trp Asn Leu Thr Asp Pro Ser Tyr 210 215 220 Glu Glu Ile Arg Ala Ala Ile Glu Lys Tyr Ala Ser Leu Gly Leu Glu 225 230 235 240 Ile His Leu Thr Glu Met Asp Val Ser Val Phe Asn Phe Glu Asp Arg 245 250 255 Arg Thr Asp Leu Thr Glu Pro Thr Asn Glu Met Lys Thr Leu Gln Val 260 265 270 Glu Arg Tyr Thr Glu Phe Phe Lys Ile Leu Arg Glu Tyr Ser His Val 275 280 285 Ile Ser Ser Val Thr Phe Trp Gly Ala Ala Asp Asp Tyr Thr Trp Leu 290 295 300 Asp Gly Phe Pro Val Arg Gly Arg Lys Asn Trp Pro Phe Val Phe Asp 305 310 315 320 Glu Asn His Gln Pro Lys Glu Ser Phe Trp Gly Ile Val Asp Phe Glu 325 330 335 <210> 135 <211> 1170 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 135 atgcgacgcc tcatcgccct tgtcctatat ataggaaccg ccgcgagcgg gacctccgtg 60 gagaccgttg cggccgaatc gaaacagccg aaagctagcc taaagaatgc gttcgcagac 120 gattttcgtg tcggcgctgc aattggcacc aatcaggtca tgggcgagga gccaaaatcg 180 ctcgaggttg tcgcccagca gttcaacaca atcacgcctg agaatctcct caaatgggct 240 gaggtccacc cagaagcaga ccgctacaac ttcgaaccgt ccgatcgctt cgtcgaattt 300 ggcgaaaaga acaacatgtt catcgtcggc cacacgctcg tgtggcataa ccaaacgccg 360 gactgggcct ttgagggcaa ggacggcaag ccgctcgatc gcgaaacagc gctcgcccga 420 atcaaggaac acattgaaac cgtggtcggc cgatatcgcg gccgcatcca tgcttgggac 480 gtcgtgaacg aggcaatcga cgacaacggc aaacttcgta gtgggccggt cggagtgccc 540 ggtcagcgcg gcgaaccgtg gcacgccgcc atcggagacg actacatcca gaaggcgttc 600 gaattcgcgc acaccgccga ccccgacgct gaactctatt acaacgacta caacgaatgg 660 cacccgaaaa agatcgaagc catctcgcag ctggtgcggt cgctcaaaga gaagggcgtt 720 cgtatcgatg gcctcggtct ccagggccat tgggggatgg attacccgaa agtcgaagag 780 atcgatcaca tgctaaccga gtatggcaag ctcggcgtga agctcatgat taccgaactc 840 gacatcaaca tgcttccgca gcccgacccg agtcaacgcg gcgccgatat cactcgcaac 900 tacgagctca gaaaggagct cgatccgtat tccgacggac tcccgcccga tatgcaaaag 960 gcactcgcgg cgcgttatgc tgaaatcttc gaagtcttcg ctaagcatcg cgataagctc 1020 gaccgcgtca cattttgggg cgttcacgac ggccattcat ggctcaacaa ctggcctgtt 1080 cccggtcgca ctgcctaccc gcttctcttc gacacgaagc ttcagcccaa gccggcattt 1140 gatgccgtca tcggagtcgc agagcaatga 1170 <210> 136 <211> 389 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(25) <400> 136 Met Arg Arg Leu Ile Ala Leu Val Leu Tyr Ile Gly Thr Ala Ala Ser 1 5 10 15 Gly Thr Ser Val Glu Thr Val Ala Ala Glu Ser Lys Gln Pro Lys Ala 20 25 30 Ser Leu Lys Asn Ala Phe Ala Asp Asp Phe Arg Val Gly Ala Ala Ile 35 40 45 Gly Thr Asn Gln Val Met Gly Glu Glu Pro Lys Ser Leu Glu Val Val 50 55 60 Ala Gln Gln Phe Asn Thr Ile Thr Pro Glu Asn Leu Leu Lys Trp Ala 65 70 75 80 Glu Val His Pro Glu Ala Asp Arg Tyr Asn Phe Glu Pro Ser Asp Arg 85 90 95 Phe Val Glu Phe Gly Glu Lys Asn Asn Met Phe Ile Val Gly His Thr 100 105 110 Leu Val Trp His Asn Gln Thr Pro Asp Trp Ala Phe Glu Gly Lys Asp 115 120 125 Gly Lys Pro Leu Asp Arg Glu Thr Ala Leu Ala Arg Ile Lys Glu His 130 135 140 Ile Glu Thr Val Val Gly Arg Tyr Arg Gly Arg Ile His Ala Trp Asp 145 150 155 160 Val Val Asn Glu Ala Ile Asp Asp Asn Gly Lys Leu Arg Ser Gly Pro 165 170 175 Val Gly Val Pro Gly Gln Arg Gly Glu Pro Trp His Ala Ala Ile Gly 180 185 190 Asp Asp Tyr Ile Gln Lys Ala Phe Glu Phe Ala His Thr Ala Asp Pro 195 200 205 Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Asn Glu Trp His Pro Lys Lys 210 215 220 Ile Glu Ala Ile Ser Gln Leu Val Arg Ser Leu Lys Glu Lys Gly Val 225 230 235 240 Arg Ile Asp Gly Leu Gly Leu Gln Gly His Trp Gly Met Asp Tyr Pro 245 250 255 Lys Val Glu Glu Ile Asp His Met Leu Thr Glu Tyr Gly Lys Leu Gly 260 265 270 Val Lys Leu Met Ile Thr Glu Leu Asp Ile Asn Met Leu Pro Gln Pro 275 280 285 Asp Pro Ser Gln Arg Gly Ala Asp Ile Thr Arg Asn Tyr Glu Leu Arg 290 295 300 Lys Glu Leu Asp Pro Tyr Ser Asp Gly Leu Pro Pro Asp Met Gln Lys 305 310 315 320 Ala Leu Ala Ala Arg Tyr Ala Glu Ile Phe Glu Val Phe Ala Lys His 325 330 335 Arg Asp Lys Leu Asp Arg Val Thr Phe Trp Gly Val His Asp Gly His 340 345 350 Ser Trp Leu Asn Asn Trp Pro Val Pro Gly Arg Thr Ala Tyr Pro Leu 355 360 365 Leu Phe Asp Thr Lys Leu Gln Pro Lys Pro Ala Phe Asp Ala Val Ile 370 375 380 Gly Val Ala Glu Gln 385 <210> 137 <211> 1044 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 137 gtggatcctt cgctgaagga agcagcttcg ggcaagtttc tgatgggggt agcgttgaat 60 gtacgtcagg cagcaggtca ggatacttgc gcctcgaaag tggtaaaacg tcattttaat 120 tccattgtgg ccgagaattg catgaaatgc gaagtgattc atccggagga agaccatttt 180 gattttacgg aagcggaccg gttggttcgt tttggcgagg agaacgatat ggctgttatc 240 gggcattgcc ttatctggca ttcacagctg gcaccttggt tctgtgtgga caaacaagga 300 aaaacagtaa gtgccgacat cttgaaggag cgtataaaaa aacatatcca gactattgtg 360 acgcactata aagggcgtat aaagggctgg gatgtgttga atgaagccat tgaatcggac 420 ggctcctggc gtaaatctcc tttttacgag atattaggcg aagagtacat cccgcttatt 480 tttcagtatg ctcatgaggc agatccggaa gccgaacttt actataatga ttatggcatg 540 gacgggaagg ctaagcgtga caaagtagtc gaattggtaa agatgctgaa agatcgtgga 600 ctgcgcatcg acgcggtagg tatgcaggga cacatgggaa tggattatcc gtcagtgtcc 660 gaatttgaag ccagtatact ggcatttgca gctgccggag taaaggtgat ggtaaccgaa 720 tgggatatga gtgcattgcc cacgacacgg atgggagcca atatttcgga cacggtgtct 780 tataaacaat ccctgaatcc ctatcccgac ggtttgcccg actctgtgtc tgtggcatgg 840 aataaccgga tgaaggaatt tttcggtctt ttcctgaaac attcgaatat cattacccgt 900 gtgacggcgt ggggggtgac ggacggtgac tcatggaaga ataatttccc tgtgcccgga 960 cgtgtggatt atcctttatt gttcgaccgt gattgccggc cgaaaccttt tgtggaagaa 1020 ctgattggaa aacagaacat ttaa 1044 <210> 138 <211> 347 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 138 Val Asp Pro Ser Leu Lys Glu Ala Ala Ser Gly Lys Phe Leu Met Gly 1 5 10 15 Val Ala Leu Asn Val Arg Gln Ala Ala Gly Gln Asp Thr Cys Ala Ser 20 25 30 Lys Val Val Lys Arg His Phe Asn Ser Ile Val Ala Glu Asn Cys Met 35 40 45 Lys Cys Glu Val Ile His Pro Glu Glu Asp His Phe Asp Phe Thr Glu 50 55 60 Ala Asp Arg Leu Val Arg Phe Gly Glu Glu Asn Asp Met Ala Val Ile 65 70 75 80 Gly His Cys Leu Ile Trp His Ser Gln Leu Ala Pro Trp Phe Cys Val 85 90 95 Asp Lys Gln Gly Lys Thr Val Ser Ala Asp Ile Leu Lys Glu Arg Ile 100 105 110 Lys Lys His Ile Gln Thr Ile Val Thr His Tyr Lys Gly Arg Ile Lys 115 120 125 Gly Trp Asp Val Leu Asn Glu Ala Ile Glu Ser Asp Gly Ser Trp Arg 130 135 140 Lys Ser Pro Phe Tyr Glu Ile Leu Gly Glu Glu Tyr Ile Pro Leu Ile 145 150 155 160 Phe Gln Tyr Ala His Glu Ala Asp Pro Glu Ala Glu Leu Tyr Tyr Asn 165 170 175 Asp Tyr Gly Met Asp Gly Lys Ala Lys Arg Asp Lys Val Val Glu Leu 180 185 190 Val Lys Met Leu Lys Asp Arg Gly Leu Arg Ile Asp Ala Val Gly Met 195 200 205 Gln Gly His Met Gly Met Asp Tyr Pro Ser Val Ser Glu Phe Glu Ala 210 215 220 Ser Ile Leu Ala Phe Ala Ala Ala Gly Val Lys Val Met Val Thr Glu 225 230 235 240 Trp Asp Met Ser Ala Leu Pro Thr Thr Arg Met Gly Ala Asn Ile Ser 245 250 255 Asp Thr Val Ser Tyr Lys Gln Ser Leu Asn Pro Tyr Pro Asp Gly Leu 260 265 270 Pro Asp Ser Val Ser Val Ala Trp Asn Asn Arg Met Lys Glu Phe Phe 275 280 285 Gly Leu Phe Leu Lys His Ser Asn Ile Ile Thr Arg Val Thr Ala Trp 290 295 300 Gly Val Thr Asp Gly Asp Ser Trp Lys Asn Asn Phe Pro Val Pro Gly 305 310 315 320 Arg Val Asp Tyr Pro Leu Leu Phe Asp Arg Asp Cys Arg Pro Lys Pro 325 330 335 Phe Val Glu Glu Leu Ile Gly Lys Gln Asn Ile 340 345 <210> 139 <211> 1143 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 139 atgaaaaaaa cgattgcaca tttcacctta tggatagtgt tttttctctt cacttcctgt 60 actgttacgg cgcagaagaa tgctaagaat gcaagagtaa aacccactac cctaaaagag 120 gcttaccaag gtaaattcta tatcggtact gcgatgaact tgagacagat tcacggagat 180 gatccccaat ctgaaaatat tatcaaaaaa cagttcaatt ccatagttgc cgaaaactgc 240 atgaagagta tgtatcttca gccggaggaa ggaaaatttt tcttcgatga tgcggacaag 300 tttgtggatt ttggtcttca gaacaatatg ttcattatcg ggcattgtct gatttggcat 360 tcgcaggcgc caaaatggtt tttcaccgac gaaaatggaa acacggtttc tccagaagtt 420 cttaaacaaa ggatgaaagc ccatatcacc gctgtcgttt cccgctacaa agggaaaatc 480 aaaggttggg atgtggtgaa cgaagccatt atggaagatg gttcttaccg caaaagcaaa 540 ttttacgaga ttttgggaga agaatttatt ccgttggcat ttcagtatgc gcatgaagca 600 gatcctgatg cagaacttta ttacaacgat tataacgaat ggtatcccgg gaaaagagct 660 atggtgacca aaataatccg cgatttcaaa actagaggaa tccgcatcga tgccatcgga 720 atgcaggctc atttcgggat ggattcgccc actgtagaag agtatgaaca aactattcag 780 ggctatataa aagaaggcgt gaaagtcaat attacggaac tcgatttaag tccgcttcct 840 tctccttggg gaacttccgc caacgttgct gatacgcagc agtatcagga aaaaatgaat 900 ccttacacca aaggacttcc tgtcgatgta gaaaaagcat gggaaaaccg ttatctcgat 960 tttttcaaac ttttcctaaa atatcatcag catattgagc gtgtaacttt ttggggagtg 1020 agcgacatcg attcctggaa aaacgatttt ccgataagag gacgtaccga ttatccacta 1080 ccgtttaacc gtcaatatca ggcaaaacct ttggttcaga aattaataga cttaacgaaa 1140 tag 1143 <210> 140 <211> 380 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(24) <400> 140 Met Lys Lys Thr Ile Ala His Phe Thr Leu Trp Ile Val Phe Phe Leu 1 5 10 15 Phe Thr Ser Cys Thr Val Thr Ala Gln Lys Asn Ala Lys Asn Ala Arg 20 25 30 Val Lys Pro Thr Thr Leu Lys Glu Ala Tyr Gln Gly Lys Phe Tyr Ile 35 40 45 Gly Thr Ala Met Asn Leu Arg Gln Ile His Gly Asp Asp Pro Gln Ser 50 55 60 Glu Asn Ile Ile Lys Lys Gln Phe Asn Ser Ile Val Ala Glu Asn Cys 65 70 75 80 Met Lys Ser Met Tyr Leu Gln Pro Glu Glu Gly Lys Phe Phe Phe Asp 85 90 95 Asp Ala Asp Lys Phe Val Asp Phe Gly Leu Gln Asn Asn Met Phe Ile 100 105 110 Ile Gly His Cys Leu Ile Trp His Ser Gln Ala Pro Lys Trp Phe Phe 115 120 125 Thr Asp Glu Asn Gly Asn Thr Val Ser Pro Glu Val Leu Lys Gln Arg 130 135 140 Met Lys Ala His Ile Thr Ala Val Val Ser Arg Tyr Lys Gly Lys Ile 145 150 155 160 Lys Gly Trp Asp Val Val Asn Glu Ala Ile Met Glu Asp Gly Ser Tyr 165 170 175 Arg Lys Ser Lys Phe Tyr Glu Ile Leu Gly Glu Glu Phe Ile Pro Leu 180 185 190 Ala Phe Gln Tyr Ala His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr 195 200 205 Asn Asp Tyr Asn Glu Trp Tyr Pro Gly Lys Arg Ala Met Val Thr Lys 210 215 220 Ile Ile Arg Asp Phe Lys Thr Arg Gly Ile Arg Ile Asp Ala Ile Gly 225 230 235 240 Met Gln Ala His Phe Gly Met Asp Ser Pro Thr Val Glu Glu Tyr Glu 245 250 255 Gln Thr Ile Gln Gly Tyr Ile Lys Glu Gly Val Lys Val Asn Ile Thr 260 265 270 Glu Leu Asp Leu Ser Pro Leu Pro Ser Pro Trp Gly Thr Ser Ala Asn 275 280 285 Val Ala Asp Thr Gln Gln Tyr Gln Glu Lys Met Asn Pro Tyr Thr Lys 290 295 300 Gly Leu Pro Val Asp Val Glu Lys Ala Trp Glu Asn Arg Tyr Leu Asp 305 310 315 320 Phe Phe Lys Leu Phe Leu Lys Tyr His Gln His Ile Glu Arg Val Thr 325 330 335 Phe Trp Gly Val Ser Asp Ile Asp Ser Trp Lys Asn Asp Phe Pro Ile 340 345 350 Arg Gly Arg Thr Asp Tyr Pro Leu Pro Phe Asn Arg Gln Tyr Gln Ala 355 360 365 Lys Pro Leu Val Gln Lys Leu Ile Asp Leu Thr Lys 370 375 380 <210> 141 <211> 1134 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 141 atgaatatct cacgcagaca actactggcg ctcacgggtg ctacggcggc gatcacagca 60 gccaaattac aggcggcaga aaaagccagc gccgcgaccg gcttgcgcga tgcctacaaa 120 aatgattttt tgattggcgc tgcgctgagt gcatcgatca ttcaacagca agatccacag 180 ctagttgcac tgattaataa agactttaat tccatcaccc cagaaaactg tatgaaatgg 240 ggcgagatgc gcaatgatga cggcagctgg aagtggcagg atgcagacgc atttgtcgag 300 tatggaagca aatacaaact acatatggtc ggccacacat tggggtggca cagccagatt 360 cccgatagcg tgtttaaaaa taaagacggt agctatattt ccaaaaccga actcgcgaaa 420 aaacaaaaag aacacatcac cactattgtt ggccgctaca aaggcaaact tgccgcgtgg 480 gatgtggtga atgaagctgt cggcgatgac aacaaaatgc gcgatagtca ctggtataaa 540 atcatgggcg atgattttct cgttaatgca tttaaccttg ctcatgaagt agatccgaag 600 gcgcatctga tgtacaacga ctacaacaac gagcgcccgg aaaaacgcca ggcgactatc 660 gatatgatca agcgtctgca acaacgcggt acaccaatcc atggtttggg catgcaagcg 720 catatcggat tggaaaccaa tatgcaggat tttgaagata gtattctcgc ctattcagca 780 ttgggtttaa aaatccatct caccgaacta gatatagatg tgctgccctc tgtatggaat 840 ttaccggtgg ccgaaatttc tacccgcttt gaatacaagc cggaacgcga tccttataca 900 aaaggtttgc cgaaagagat tgatgaaaaa cttgcaaaag cctatgaatc gctatttaaa 960 atattgctta aacatcgcga caaaatagat agagttacgt tttggggcgt aagcgatgat 1020 gccagctggc tcaatgattt cccaatcaat ggcagaacca actatccgtt attgtttaac 1080 cgtcaacgcc aacctaaagc tgcttatttc cgtttgctgg atttaaaacg ctag 1134 <210> 142 <211> 377 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(25) <400> 142 Met Asn Ile Ser Arg Arg Gln Leu Leu Ala Leu Thr Gly Ala Thr Ala 1 5 10 15 Ala Ile Thr Ala Ala Lys Leu Gln Ala Ala Glu Lys Ala Ser Ala Ala 20 25 30 Thr Gly Leu Arg Asp Ala Tyr Lys Asn Asp Phe Leu Ile Gly Ala Ala 35 40 45 Leu Ser Ala Ser Ile Ile Gln Gln Gln Asp Pro Gln Leu Val Ala Leu 50 55 60 Ile Asn Lys Asp Phe Asn Ser Ile Thr Pro Glu Asn Cys Met Lys Trp 65 70 75 80 Gly Glu Met Arg Asn Asp Asp Gly Ser Trp Lys Trp Gln Asp Ala Asp 85 90 95 Ala Phe Val Glu Tyr Gly Ser Lys Tyr Lys Leu His Met Val Gly His 100 105 110 Thr Leu Gly Trp His Ser Gln Ile Pro Asp Ser Val Phe Lys Asn Lys 115 120 125 Asp Gly Ser Tyr Ile Ser Lys Thr Glu Leu Ala Lys Lys Gln Lys Glu 130 135 140 His Ile Thr Thr Ile Val Gly Arg Tyr Lys Gly Lys Leu Ala Ala Trp 145 150 155 160 Asp Val Val Asn Glu Ala Val Gly Asp Asp Asn Lys Met Arg Asp Ser 165 170 175 His Trp Tyr Lys Ile Met Gly Asp Asp Phe Leu Val Asn Ala Phe Asn 180 185 190 Leu Ala His Glu Val Asp Pro Lys Ala His Leu Met Tyr Asn Asp Tyr 195 200 205 Asn Asn Glu Arg Pro Glu Lys Arg Gln Ala Thr Ile Asp Met Ile Lys 210 215 220 Arg Leu Gln Gln Arg Gly Thr Pro Ile His Gly Leu Gly Met Gln Ala 225 230 235 240 His Ile Gly Leu Glu Thr Asn Met Gln Asp Phe Glu Asp Ser Ile Leu 245 250 255 Ala Tyr Ser Ala Leu Gly Leu Lys Ile His Leu Thr Glu Leu Asp Ile 260 265 270 Asp Val Leu Pro Ser Val Trp Asn Leu Pro Val Ala Glu Ile Ser Thr 275 280 285 Arg Phe Glu Tyr Lys Pro Glu Arg Asp Pro Tyr Thr Lys Gly Leu Pro 290 295 300 Lys Glu Ile Asp Glu Lys Leu Ala Lys Ala Tyr Glu Ser Leu Phe Lys 305 310 315 320 Ile Leu Leu Lys His Arg Asp Lys Ile Asp Arg Val Thr Phe Trp Gly 325 330 335 Val Ser Asp Asp Ala Ser Trp Leu Asn Asp Phe Pro Ile Asn Gly Arg 340 345 350 Thr Asn Tyr Pro Leu Leu Phe Asn Arg Gln Arg Gln Pro Lys Ala Ala 355 360 365 Tyr Phe Arg Leu Leu Asp Leu Lys Arg 370 375 <210> 143 <211> 3285 <212> DNA <213> Bacteria <400> 143 atgagtttaa aaataaataa aatcatatca tttatcatag ttttttcgat ggtttttggg 60 acgttaatgt atgtgccaca tctaaaagca tttgcggata ataccggtat taatttggtt 120 tctaatggtg attttgaatc aggcacaatt gatggctggt ttaaacaagg taatccgaca 180 ttaacagtaa caactgagca ggcaattggg caatacagta tgaaagttac aggtagaaca 240 cagacatatg aaggacccgc atatagcttt ttggggaaaa tgcagaaagg tgaatcatat 300 aacgtatcac ttaaagttag acttgtttct ggacaaaatt catctaatcc tttgatcact 360 gtaactatgt ttagagaaga tgacaatggc aatcattatg acacaatagt ttggcaaaaa 420 caagtttctg aagattcatg gactactgta agtgggactt atacattgga ttatactgga 480 acattaaaaa cattatatat gtatgtagaa tcacccgatc caacgcttga atattatatt 540 gatgatgttg tagtcacacc gcaaaatcca acgcaaatag gaaatgtagt tgccaatgga 600 acttttgaaa atgaaaatac ttctggatgg gttggaacag gttcatctgt tgttaaagca 660 gtatatggtg atgctcacag cggagattat agcttattga cgacaggaag gacagctaac 720 tggaatggtc ctagttatga tttgactggc aaaatagttc ccggacaaca atacaatgtg 780 gatttttggg taaaatttat tgatggcaat gatacagagc aaatcaaggc tactgttaaa 840 gcgacttctg acaaagacaa ttatatacaa gttaatgatt ttgcagatgt aagtaaaggt 900 gaatggacag aaataaaagg cagttttact ttacctgttg cagattacag cggcattagc 960 atctatgtgg aatctcaaaa tcctacttta gagttttaca ttgatgattt ttctgtaata 1020 ggtgaaattg caaataatca gattactatt caaaatgaca ttccagattt gtactctgta 1080 tttaaagatt attttcctat aggcgttgcg gttgatccaa gtagattaaa tgatactgat 1140 ccgcatgctc aattgacggc taaacatttt aatatgcttg ttgcagaaaa cgccatgaaa 1200 cctgaaagtt tacaacccac agaaggaaat tttacttttg ataatgctga taagattgtt 1260 gattatgcaa tatcacataa tatgaagatg agggggcata ctttactttg gcataatcaa 1320 gttccagatt ggtttttcca agatccgtct gacccatcca agcctgcttc gagagattta 1380 ctattacaaa gattaaaaac tcatattaca actgtgttag accattttaa aacaaagtat 1440 ggttctcaga atccaataat tggatgggat gtcgtaaatg aagttcttga tgataatggc 1500 agtttgagaa attcgaagtg gttgcaaatt attggacccg actatataga aaaagccttt 1560 gaatatgcac atgaagcgga tccatcgatg aagttgttta ttaatgatta caatatcgaa 1620 aataatggcg ttaaaactca agctatgtat gacttggtaa aaagattaaa gagtgaaggc 1680 gttcctatag atggaatagg gatgcaaatg cacataaata taaattccaa tatagataat 1740 ataaaagcat caatagaaaa actggcatcg ttaggcgttg aaatacaagt aactgaatta 1800 gatatgaaca tgaacggtaa tatatctaac gaagcattgc tcaagcaagc tagattgtat 1860 aaacaattat ttgacttatt taaagcagag aaacaatata taactgctgt agttttttgg 1920 ggagtttcag acgatgtaac ttggcttagc aagccaaatg ctccgctact ttttgataca 1980 aagttgcaag caaagccagc atactgggca atagtagatc cgaataaagc tacaccagac 2040 attcaatctg caaaggcttt ggaaggatca ccgacaatgg gtacaaatgt tgataactct 2100 tggaaacttg taaagccgtt atatgcaaat acttttgtag aagggtcggt cggagcaact 2160 gctgctgtta agtctatgtg ggatactaaa aacttgtatt tgttagtaca agtttcagac 2220 aataccccat ctagtaatga tggtattgag atttttgtag ataagaatga tgacaaatcc 2280 acttcttatg aaactgatga tgaacattat acaattaaga gggatggtac agggagttca 2340 gatattacca aatatgtgac ttctaatgct gacggatatg tagcacagct agctattcca 2400 attgaagata ttaatcctgc acttaatgat aaaattggat ttgacattag aataaatgat 2460 gataaaggta ttggtaatat agatgcaata acagtttgga acgattatac aaacagtcaa 2520 gatactaata catcgtattt tggcgattta gtattatcaa aacctgcaca aattgcaaca 2580 gctatatatg gcactcctgt tattgatggt aaagtagatg atatttggaa taatgttgaa 2640 gctatttcaa caaatacatg ggttttgggt tcaaatggtg ctactgcgac agcaaaaatg 2700 atgtgggacg ataagtacct ttatgttttg gcggatgtta cagattcaaa tctgaacaaa 2760 tctagtgtta atccatatga acaagattct gtagaagttt ttgtagatca aaataatgac 2820 aagacgacat attataaaaa tgatgatgga cagtttagag ttaactatga caatgaacaa 2880 agctttgggg gaagcactaa ttcaaatgga tttaaatcgg caactagtct tacacaaagt 2940 ggatatattg tagaagaagc tattccttgg acgagtatca ctccatcaaa tggcactatc 3000 ataggatttg acttgcaagt taatgatgca gatgaaaatg gtaagaggac aggtattgta 3060 acatggtgtg atccgagcgg aaattcatgg caagatactt ctgggtttgg gaatttattg 3120 cttacaggta aaccatccgg tgttggtaca aaaagaatgg cgtttaacga cataaaagac 3180 agttgggcaa aagatgcaat agaagtatta gcatcaaggc acatagtaga aggtatgaca 3240 gacactcagt atgaaccaaa caagacagta acgagagcgg aataa 3285 <210> 144 <211> 1094 <212> PRT <213> Bacteria <220> <221> SIGNAL <222> (1)...(32) <400> 144 Met Ser Leu Lys Ile Asn Lys Ile Ile Ser Phe Ile Ile Val Phe Ser 1 5 10 15 Met Val Phe Gly Thr Leu Met Tyr Val Pro His Leu Lys Ala Phe Ala 20 25 30 Asp Asn Thr Gly Ile Asn Leu Val Ser Asn Gly Asp Phe Glu Ser Gly 35 40 45 Thr Ile Asp Gly Trp Phe Lys Gln Gly Asn Pro Thr Leu Thr Val Thr 50 55 60 Thr Glu Gln Ala Ile Gly Gln Tyr Ser Met Lys Val Thr Gly Arg Thr 65 70 75 80 Gln Thr Tyr Glu Gly Pro Ala Tyr Ser Phe Leu Gly Lys Met Gln Lys 85 90 95 Gly Glu Ser Tyr Asn Val Ser Leu Lys Val Arg Leu Val Ser Gly Gln 100 105 110 Asn Ser Ser Asn Pro Leu Ile Thr Val Thr Met Phe Arg Glu Asp Asp 115 120 125 Asn Gly Asn His Tyr Asp Thr Ile Val Trp Gln Lys Gln Val Ser Glu 130 135 140 Asp Ser Trp Thr Thr Val Ser Gly Thr Tyr Thr Leu Asp Tyr Thr Gly 145 150 155 160 Thr Leu Lys Thr Leu Tyr Met Tyr Val Glu Ser Pro Asp Pro Thr Leu 165 170 175 Glu Tyr Tyr Ile Asp Asp Val Val Val Thr Pro Gln Asn Pro Thr Gln 180 185 190 Ile Gly Asn Val Val Ala Asn Gly Thr Phe Glu Asn Glu Asn Thr Ser 195 200 205 Gly Trp Val Gly Thr Gly Ser Ser Val Val Lys Ala Val Tyr Gly Asp 210 215 220 Ala His Ser Gly Asp Tyr Ser Leu Leu Thr Thr Gly Arg Thr Ala Asn 225 230 235 240 Trp Asn Gly Pro Ser Tyr Asp Leu Thr Gly Lys Ile Val Pro Gly Gln 245 250 255 Gln Tyr Asn Val Asp Phe Trp Val Lys Phe Ile Asp Gly Asn Asp Thr 260 265 270 Glu Gln Ile Lys Ala Thr Val Lys Ala Thr Ser Asp Lys Asp Asn Tyr 275 280 285 Ile Gln Val Asn Asp Phe Ala Asp Val Ser Lys Gly Glu Trp Thr Glu 290 295 300 Ile Lys Gly Ser Phe Thr Leu Pro Val Ala Asp Tyr Ser Gly Ile Ser 305 310 315 320 Ile Tyr Val Glu Ser Gln Asn Pro Thr Leu Glu Phe Tyr Ile Asp Asp 325 330 335 Phe Ser Val Ile Gly Glu Ile Ala Asn Asn Gln Ile Thr Ile Gln Asn 340 345 350 Asp Ile Pro Asp Leu Tyr Ser Val Phe Lys Asp Tyr Phe Pro Ile Gly 355 360 365 Val Ala Val Asp Pro Ser Arg Leu Asn Asp Thr Asp Pro His Ala Gln 370 375 380 Leu Thr Ala Lys His Phe Asn Met Leu Val Ala Glu Asn Ala Met Lys 385 390 395 400 Pro Glu Ser Leu Gln Pro Thr Glu Gly Asn Phe Thr Phe Asp Asn Ala 405 410 415 Asp Lys Ile Val Asp Tyr Ala Ile Ser His Asn Met Lys Met Arg Gly 420 425 430 His Thr Leu Leu Trp His Asn Gln Val Pro Asp Trp Phe Phe Gln Asp 435 440 445 Pro Ser Asp Pro Ser Lys Pro Ala Ser Arg Asp Leu Leu Leu Gln Arg 450 455 460 Leu Lys Thr His Ile Thr Thr Val Leu Asp His Phe Lys Thr Lys Tyr 465 470 475 480 Gly Ser Gln Asn Pro Ile Ile Gly Trp Asp Val Val Asn Glu Val Leu 485 490 495 Asp Asp Asn Gly Ser Leu Arg Asn Ser Lys Trp Leu Gln Ile Ile Gly 500 505 510 Pro Asp Tyr Ile Glu Lys Ala Phe Glu Tyr Ala His Glu Ala Asp Pro 515 520 525 Ser Met Lys Leu Phe Ile Asn Asp Tyr Asn Ile Glu Asn Asn Gly Val 530 535 540 Lys Thr Gln Ala Met Tyr Asp Leu Val Lys Arg Leu Lys Ser Glu Gly 545 550 555 560 Val Pro Ile Asp Gly Ile Gly Met Gln Met His Ile Asn Ile Asn Ser 565 570 575 Asn Ile Asp Asn Ile Lys Ala Ser Ile Glu Lys Leu Ala Ser Leu Gly 580 585 590 Val Glu Ile Gln Val Thr Glu Leu Asp Met Asn Met Asn Gly Asn Ile 595 600 605 Ser Asn Glu Ala Leu Leu Lys Gln Ala Arg Leu Tyr Lys Gln Leu Phe 610 615 620 Asp Leu Phe Lys Ala Glu Lys Gln Tyr Ile Thr Ala Val Val Phe Trp 625 630 635 640 Gly Val Ser Asp Asp Val Thr Trp Leu Ser Lys Pro Asn Ala Pro Leu 645 650 655 Leu Phe Asp Thr Lys Leu Gln Ala Lys Pro Ala Tyr Trp Ala Ile Val 660 665 670 Asp Pro Asn Lys Ala Thr Pro Asp Ile Gln Ser Ala Lys Ala Leu Glu 675 680 685 Gly Ser Pro Thr Met Gly Thr Asn Val Asp Asn Ser Trp Lys Leu Val 690 695 700 Lys Pro Leu Tyr Ala Asn Thr Phe Val Glu Gly Ser Val Gly Ala Thr 705 710 715 720 Ala Ala Val Lys Ser Met Trp Asp Thr Lys Asn Leu Tyr Leu Leu Val 725 730 735 Gln Val Ser Asp Asn Thr Pro Ser Ser Asn Asp Gly Ile Glu Ile Phe 740 745 750 Val Asp Lys Asn Asp Asp Lys Ser Thr Ser Tyr Glu Thr Asp Asp Glu 755 760 765 His Tyr Thr Ile Lys Arg Asp Gly Thr Gly Ser Ser Asp Ile Thr Lys 770 775 780 Tyr Val Thr Ser Asn Ala Asp Gly Tyr Val Ala Gln Leu Ala Ile Pro 785 790 795 800 Ile Glu Asp Ile Asn Pro Ala Leu Asn Asp Lys Ile Gly Phe Asp Ile 805 810 815 Arg Ile Asn Asp Asp Lys Gly Ile Gly Asn Ile Asp Ala Ile Thr Val 820 825 830 Trp Asn Asp Tyr Thr Asn Ser Gln Asp Thr Asn Thr Ser Tyr Phe Gly 835 840 845 Asp Leu Val Leu Ser Lys Pro Ala Gln Ile Ala Thr Ala Ile Tyr Gly 850 855 860 Thr Pro Val Ile Asp Gly Lys Val Asp Asp Ile Trp Asn Asn Val Glu 865 870 875 880 Ala Ile Ser Thr Asn Thr Trp Val Leu Gly Ser Asn Gly Ala Thr Ala 885 890 895 Thr Ala Lys Met Met Trp Asp Asp Lys Tyr Leu Tyr Val Leu Ala Asp 900 905 910 Val Thr Asp Ser Asn Leu Asn Lys Ser Ser Val Asn Pro Tyr Glu Gln 915 920 925 Asp Ser Val Glu Val Phe Val Asp Gln Asn Asn Asp Lys Thr Thr Tyr 930 935 940 Tyr Lys Asn Asp Asp Gly Gln Phe Arg Val Asn Tyr Asp Asn Glu Gln 945 950 955 960 Ser Phe Gly Gly Ser Thr Asn Ser Asn Gly Phe Lys Ser Ala Thr Ser 965 970 975 Leu Thr Gln Ser Gly Tyr Ile Val Glu Glu Ala Ile Pro Trp Thr Ser 980 985 990 Ile Thr Pro Ser Asn Gly Thr Ile Ile Gly Phe Asp Leu Gln Val Asn 995 1000 1005 Asp Ala Asp Glu Asn Gly Lys Arg Thr Gly Ile Val Thr Trp Cys Asp 1010 1015 1020 Pro Ser Gly Asn Ser Trp Gln Asp Thr Ser Gly Phe Gly Asn Leu Leu 1025 1030 1035 1040 Leu Thr Gly Lys Pro Ser Gly Val Gly Thr Lys Arg Met Ala Phe Asn 1045 1050 1055 Asp Ile Lys Asp Ser Trp Ala Lys Asp Ala Ile Glu Val Leu Ala Ser 1060 1065 1070 Arg His Ile Val Glu Gly Met Thr Asp Thr Gln Tyr Glu Pro Asn Lys 1075 1080 1085 Thr Val Thr Arg Ala Glu 1090 <210> 145 <211> 1629 <212> DNA <213> Eukaryote <400> 145 atgaagattg tggatacaac ttccgcagag ataaagattg aaatggaacc tgaaaaagag 60 atacctgctc tgaaagaagt actaaaagac tacttcaaag tcggagttgc actgccgtcc 120 aaggtcttcc tcaacccgaa ggacatagaa ctcatcacga aacacttcaa cagcatcacc 180 gcagaaaacg agatgaaacc ggatagtctg ctcgcgggca tcgaaaacgg taagctgaag 240 ttcaggtttg aaacagcaga caaatacatt cagttcgtcg aggaaaacgg catggttata 300 agaggtcaca cactggtgtg gcacaaccag acacccgact ggttcttcaa agacgaaaac 360 ggaaacctcc tctccaaaga agcgatgacg gaaagactca aagagtacat ccacaccgtt 420 gtcggacact tcaaaggaaa agtctacgca tgggacgtgg tgaacgaagc ggtcgatccg 480 aaccagccgg atggactgag aagatccacc tggtaccaga tcatggggcc tgactacata 540 gaactcgcct tcaagttcgc aagagaagca gatccagatg caaaactctt ctacaacgac 600 tacaacacat tcgagcccag aaagagagat atcatctaca acctcgtgaa ggatctcaag 660 gagaagggac tcatcgatgg gataggcatg cagtgtcaca tcagtcttgc aacagacatc 720 aaacagatcg aagaggccat caaaaagttc agcaccatac ccggtataga aattcacatc 780 acagaactcg atatgagtgt ctacagagat tccagttcca actacccaga ggcaccgagg 840 acggcactca tcgaacaggc tcacaaaatg atgcagctct ttgagatttt caagaagtac 900 agcaacgtga tcacgaacgt cacattctgg ggtctcaagg acgattactc ctggagagca 960 acaagaagaa acgactggcc gctcatcttc gacaaagatc accaggcgaa actcgcttac 1020 tgggcgatag tggcacctga ggtccttcca ccacttccaa aagaaagcag gatctccgaa 1080 ggcgaggctg tggtagtggg gatgatggat gactcgtacc tgatgtcgaa gccgatagag 1140 atccttgacg aagaagggaa cgtgaaggca acgatcaggg cggtgtggaa agacagcacg 1200 atctacatct acggagaggt acaggacaag acgaaaaaac cagcagaaga cggagtggcc 1260 atattcatca acccgaacaa cgaaagaaca ccctatctgc agcctgatga cacctacgct 1320 gtgctgtgga caaactggaa gacggaggtc aacagagaag acgtacaggt gaagaaattc 1380 gttgggcctg gctttagaag atacagcttc gagatgtcga tcacgatacc gggtgtggag 1440 ttcaagaaag acagctacat aggattcgac gctgcggtga tagacgacgg gaagtggtac 1500 agctggagcg acacgacgaa cagccagaag acgaacacga tgaactacgg aacgctgaaa 1560 ctcgaaggaa taatggtagc gacagcaaaa tacggaacac cggtcatcga tggagagata 1620 gacgagtaa 1629 <210> 146 <211> 542 <212> PRT <213> Eukaryote <400> 146 Met Lys Ile Val Asp Thr Thr Ser Ala Glu Ile Lys Ile Glu Met Glu 1 5 10 15 Pro Glu Lys Glu Ile Pro Ala Leu Lys Glu Val Leu Lys Asp Tyr Phe 20 25 30 Lys Val Gly Val Ala Leu Pro Ser Lys Val Phe Leu Asn Pro Lys Asp 35 40 45 Ile Glu Leu Ile Thr Lys His Phe Asn Ser Ile Thr Ala Glu Asn Glu 50 55 60 Met Lys Pro Asp Ser Leu Leu Ala Gly Ile Glu Asn Gly Lys Leu Lys 65 70 75 80 Phe Arg Phe Glu Thr Ala Asp Lys Tyr Ile Gln Phe Val Glu Glu Asn 85 90 95 Gly Met Val Ile Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro 100 105 110 Asp Trp Phe Phe Lys Asp Glu Asn Gly Asn Leu Leu Ser Lys Glu Ala 115 120 125 Met Thr Glu Arg Leu Lys Glu Tyr Ile His Thr Val Val Gly His Phe 130 135 140 Lys Gly Lys Val Tyr Ala Trp Asp Val Val Asn Glu Ala Val Asp Pro 145 150 155 160 Asn Gln Pro Asp Gly Leu Arg Arg Ser Thr Trp Tyr Gln Ile Met Gly 165 170 175 Pro Asp Tyr Ile Glu Leu Ala Phe Lys Phe Ala Arg Glu Ala Asp Pro 180 185 190 Asp Ala Lys Leu Phe Tyr Asn Asp Tyr Asn Thr Phe Glu Pro Arg Lys 195 200 205 Arg Asp Ile Ile Tyr Asn Leu Val Lys Asp Leu Lys Glu Lys Gly Leu 210 215 220 Ile Asp Gly Ile Gly Met Gln Cys His Ile Ser Leu Ala Thr Asp Ile 225 230 235 240 Lys Gln Ile Glu Glu Ala Ile Lys Lys Phe Ser Thr Ile Pro Gly Ile 245 250 255 Glu Ile His Ile Thr Glu Leu Asp Met Ser Val Tyr Arg Asp Ser Ser 260 265 270 Ser Asn Tyr Pro Glu Ala Pro Arg Thr Ala Leu Ile Glu Gln Ala His 275 280 285 Lys Met Met Gln Leu Phe Glu Ile Phe Lys Lys Tyr Ser Asn Val Ile 290 295 300 Thr Asn Val Thr Phe Trp Gly Leu Lys Asp Asp Tyr Ser Trp Arg Ala 305 310 315 320 Thr Arg Arg Asn Asp Trp Pro Leu Ile Phe Asp Lys Asp His Gln Ala 325 330 335 Lys Leu Ala Tyr Trp Ala Ile Val Ala Pro Glu Val Leu Pro Pro Leu 340 345 350 Pro Lys Glu Ser Arg Ile Ser Glu Gly Glu Ala Val Val Val Gly Met 355 360 365 Met Asp Asp Ser Tyr Leu Met Ser Lys Pro Ile Glu Ile Leu Asp Glu 370 375 380 Glu Gly Asn Val Lys Ala Thr Ile Arg Ala Val Trp Lys Asp Ser Thr 385 390 395 400 Ile Tyr Ile Tyr Gly Glu Val Gln Asp Lys Thr Lys Lys Pro Ala Glu 405 410 415 Asp Gly Val Ala Ile Phe Ile Asn Pro Asn Asn Glu Arg Thr Pro Tyr 420 425 430 Leu Gln Pro Asp Asp Thr Tyr Ala Val Leu Trp Thr Asn Trp Lys Thr 435 440 445 Glu Val Asn Arg Glu Asp Val Gln Val Lys Lys Phe Val Gly Pro Gly 450 455 460 Phe Arg Arg Tyr Ser Phe Glu Met Ser Ile Thr Ile Pro Gly Val Glu 465 470 475 480 Phe Lys Lys Asp Ser Tyr Ile Gly Phe Asp Ala Ala Val Ile Asp Asp 485 490 495 Gly Lys Trp Tyr Ser Trp Ser Asp Thr Thr Asn Ser Gln Lys Thr Asn 500 505 510 Thr Met Asn Tyr Gly Thr Leu Lys Leu Glu Gly Ile Met Val Ala Thr 515 520 525 Ala Lys Tyr Gly Thr Pro Val Ile Asp Gly Glu Ile Asp Glu 530 535 540 <210> 147 <211> 1146 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 147 atgactttct ctcgacggca atttttgctg caaacctccg ccggcctggc acttttgagc 60 actgccaaaa tgcgcgcttt cgcccgcgca gtcgatgaag tgggccttaa agaccatttt 120 aaagaccatt ttcatattgg gactgccatc agcggtcgac tgatgacgga aatgccggcc 180 ttttaccgcg acctggttac ccgtgaattc agtgccatta ccatggaaaa cgacatgaaa 240 tgggagcgtc tgcatcccaa agaaggccaa tgggattggg agattgccga caaattcgtc 300 aattttggcg aagaaaacga catgtacatt gtcgggcatg ttctggtctg gcactcacag 360 accccggatt gggtgttcca ggattccaga ggcaagccca tttctcgcga cgctttgctg 420 aaacgcatgc gccaccagat tgaacagatg gcgggccgct ataagggccg ggtacacgcg 480 tgggatgtgg tcaatgaggc ggtggacgag gaccaaggct ggcgcaaaag cccgtggttt 540 aacattattg ggcccgagtt tatggagcac gccttcaatt acgcccacga agtggacccc 600 gacgctcacc tgttgtacaa cgactacaat atgcacggtc gggaaaaacg cgaattcgtc 660 ctggatttca tcaaaagata caagaaaaaa ggcattccga tccagggcat aggcatgcaa 720 ggccatgtgg gcctgagctt tcccgatatc agcgagtttg agaaaagcct gcaagcctac 780 gccaaacagg gcatgcggat gcacattacc gagctggata tggacgtgtt accagtggcc 840 tgggatcaca ttggcgccga gatttccacc gagtttgact acgctgatga actggacccc 900 tggcccaaag ggctgccgga agaagtcgaa caggaattta ccgatcgcta caccgctttc 960 tttaaactgt ttttgaaata ccgcgatgat attgaaaggg tcaccttctg gggaaccgga 1020 gatgcggaat cgtggaaaaa taatttccca gtaagggggc gcaccaacta cccgctgctg 1080 tttgatcgcc gataccgcag aaaaccggcc tatgattcga ttgtcgaact gaccaaaaac 1140 ctttaa 1146 <210> 148 <211> 381 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(28) <400> 148 Met Thr Phe Ser Arg Arg Gln Phe Leu Leu Gln Thr Ser Ala Gly Leu 1 5 10 15 Ala Leu Leu Ser Thr Ala Lys Met Arg Ala Phe Ala Arg Ala Val Asp 20 25 30 Glu Val Gly Leu Lys Asp His Phe Lys Asp His Phe His Ile Gly Thr 35 40 45 Ala Ile Ser Gly Arg Leu Met Thr Glu Met Pro Ala Phe Tyr Arg Asp 50 55 60 Leu Val Thr Arg Glu Phe Ser Ala Ile Thr Met Glu Asn Asp Met Lys 65 70 75 80 Trp Glu Arg Leu His Pro Lys Glu Gly Gln Trp Asp Trp Glu Ile Ala 85 90 95 Asp Lys Phe Val Asn Phe Gly Glu Glu Asn Asp Met Tyr Ile Val Gly 100 105 110 His Val Leu Val Trp His Ser Gln Thr Pro Asp Trp Val Phe Gln Asp 115 120 125 Ser Arg Gly Lys Pro Ile Ser Arg Asp Ala Leu Leu Lys Arg Met Arg 130 135 140 His Gln Ile Glu Gln Met Ala Gly Arg Tyr Lys Gly Arg Val His Ala 145 150 155 160 Trp Asp Val Val Asn Glu Ala Val Asp Glu Asp Gln Gly Trp Arg Lys 165 170 175 Ser Pro Trp Phe Asn Ile Ile Gly Pro Glu Phe Met Glu His Ala Phe 180 185 190 Asn Tyr Ala His Glu Val Asp Pro Asp Ala His Leu Leu Tyr Asn Asp 195 200 205 Tyr Asn Met His Gly Arg Glu Lys Arg Glu Phe Val Leu Asp Phe Ile 210 215 220 Lys Arg Tyr Lys Lys Lys Gly Ile Pro Ile Gln Gly Ile Gly Met Gln 225 230 235 240 Gly His Val Gly Leu Ser Phe Pro Asp Ile Ser Glu Phe Glu Lys Ser 245 250 255 Leu Gln Ala Tyr Ala Lys Gln Gly Met Arg Met His Ile Thr Glu Leu 260 265 270 Asp Met Asp Val Leu Pro Val Ala Trp Asp His Ile Gly Ala Glu Ile 275 280 285 Ser Thr Glu Phe Asp Tyr Ala Asp Glu Leu Asp Pro Trp Pro Lys Gly 290 295 300 Leu Pro Glu Glu Val Glu Gln Glu Phe Thr Asp Arg Tyr Thr Ala Phe 305 310 315 320 Phe Lys Leu Phe Leu Lys Tyr Arg Asp Asp Ile Glu Arg Val Thr Phe 325 330 335 Trp Gly Thr Gly Asp Ala Glu Ser Trp Lys Asn Asn Phe Pro Val Arg 340 345 350 Gly Arg Thr Asn Tyr Pro Leu Leu Phe Asp Arg Arg Tyr Arg Arg Lys 355 360 365 Pro Ala Tyr Asp Ser Ile Val Glu Leu Thr Lys Asn Leu 370 375 380 <210> 149 <211> 1044 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 149 atgaagaagc tttttgtcgc ggtcgttttg ttgcccttag caactttttt cgcgtcggac 60 ggattggagg gagaaccttt gagatcgtta gccgagaaac ttggcatcta catcggttac 120 gcttcgatca accatttctg gactcttccg gattcaaaca agtacacaga agtggcaaag 180 agggagttca acatactcac gccagagaac caaatgaagt gggacagcct tcacccagag 240 cctgacaggt acaacttcac ttacgcagag cgtcatgtcg agttcgcttt ggaaaacaac 300 atgctcgttc acggccacac actcgtttgg cacaaccaac ttccgttctg gttgaacaga 360 cagtggacca aagaagaact cctgaaagtc cttgaggacc acatcaaaac agtcgtcggt 420 cacttcaaag gaagggtgaa gatttgggac gtggtgaacg aagcggtcag cgacatgggc 480 agttacagag agaccatttg gtacaagacc atcggacccg agtacatcga aaaggcattc 540 gtgtgggcaa gacaagccga tccggaagcg atcctcatat acaacgacta caatatagaa 600 acgatcaatc ccaaatcgaa tttcacctac cagctcatca aggagctgaa agaaaaaggt 660 gtgccgatag acggcatcgg ttttcaaatg cacatagaca tcaacggaat aaactatgac 720 agtttcagaa acaacctgaa gaggttcgct gatctcggtc tgaagctcta catcacggaa 780 atggatgtga gaatacccaa gaacgcaact gaaaaagact tggacagaca ggcagaaatc 840 tacgcgaaga tcttcgaaat ctgcttagag aatcctgcgg tccaagccat acagttctgg 900 ggtttcacgg acaagtattc ctgggtgcct ggctttttca gcgggtacga tcatgcgctg 960 atctttgaca gggactacag ccccaagccc gcgtattttg cgataaagag ggtgctcgaa 1020 gccaaggtga gcaagggacg ctga 1044 <210> 150 <211> 347 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(18) <400> 150 Met Lys Lys Leu Phe Val Ala Val Val Leu Leu Pro Leu Ala Thr Phe 1 5 10 15 Phe Ala Ser Asp Gly Leu Glu Gly Glu Pro Leu Arg Ser Leu Ala Glu 20 25 30 Lys Leu Gly Ile Tyr Ile Gly Tyr Ala Ser Ile Asn His Phe Trp Thr 35 40 45 Leu Pro Asp Ser Asn Lys Tyr Thr Glu Val Ala Lys Arg Glu Phe Asn 50 55 60 Ile Leu Thr Pro Glu Asn Gln Met Lys Trp Asp Ser Leu His Pro Glu 65 70 75 80 Pro Asp Arg Tyr Asn Phe Thr Tyr Ala Glu Arg His Val Glu Phe Ala 85 90 95 Leu Glu Asn Asn Met Leu Val His Gly His Thr Leu Val Trp His Asn 100 105 110 Gln Leu Pro Phe Trp Leu Asn Arg Gln Trp Thr Lys Glu Glu Leu Leu 115 120 125 Lys Val Leu Glu Asp His Ile Lys Thr Val Val Gly His Phe Lys Gly 130 135 140 Arg Val Lys Ile Trp Asp Val Val Asn Glu Ala Val Ser Asp Met Gly 145 150 155 160 Ser Tyr Arg Glu Thr Ile Trp Tyr Lys Thr Ile Gly Pro Glu Tyr Ile 165 170 175 Glu Lys Ala Phe Val Trp Ala Arg Gln Ala Asp Pro Glu Ala Ile Leu 180 185 190 Ile Tyr Asn Asp Tyr Asn Ile Glu Thr Ile Asn Pro Lys Ser Asn Phe 195 200 205 Thr Tyr Gln Leu Ile Lys Glu Leu Lys Glu Lys Gly Val Pro Ile Asp 210 215 220 Gly Ile Gly Phe Gln Met His Ile Asp Ile Asn Gly Ile Asn Tyr Asp 225 230 235 240 Ser Phe Arg Asn Asn Leu Lys Arg Phe Ala Asp Leu Gly Leu Lys Leu 245 250 255 Tyr Ile Thr Glu Met Asp Val Arg Ile Pro Lys Asn Ala Thr Glu Lys 260 265 270 Asp Leu Asp Arg Gln Ala Glu Ile Tyr Ala Lys Ile Phe Glu Ile Cys 275 280 285 Leu Glu Asn Pro Ala Val Gln Ala Ile Gln Phe Trp Gly Phe Thr Asp 290 295 300 Lys Tyr Ser Trp Val Pro Gly Phe Phe Ser Gly Tyr Asp His Ala Leu 305 310 315 320 Ile Phe Asp Arg Asp Tyr Ser Pro Lys Pro Ala Tyr Phe Ala Ile Lys 325 330 335 Arg Val Leu Glu Ala Lys Val Ser Lys Gly Arg 340 345 <210> 151 <211> 1131 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 151 atgcgatcta tgccacttta tgtgttgtta tgcagcgccc ttctgaccgg cagcctatat 60 gcacaagacc aaaatgcttc tttaaaacag gcctttagca aaaactttag tattggcaca 120 gccttaagtg ctacacaaat tcagggcaaa gagccgggca cactggaatt ggtaacacag 180 caatttaacg cggtgacggc agaaaacgtg atgaagtggg aaatcattga acctgtggaa 240 ggccagttca actttgctgc cgccgacgcc atgattgaat tcgccgaagc caatcatatc 300 aaggtgatag gccatgtgct gttatggcac gaacaaacac cagcctgggt atttctggac 360 gccaaaggcc aggccgcctc aaaggaactg gtgttatcac ggctaaaaaa ccatatcaat 420 gccgtaatgg gccgctacaa aggccgtatt catggctggg atgcagtcaa cgaagcctta 480 aatgaagacg gcactctgcg ccaatccaac tggtataaag ctttaggcga cgactatata 540 gccacagtct ttgaactggc gcatcaggcc gacccgaaag ccgaactcta ttacaacgac 600 ttcaatttat ttaaaccgga aaaacgcgct ggtgtactca aactggtggc agctttaaaa 660 gcgaaaaatg tgcctatcca cggcataggc gagcaaggcc attacagcct ggattaccct 720 gagctgcagc aagtagaaga ctctattgtg gcttttaaaa acactggcct gaaagtggtg 780 attaccgaac tggatatctc agttttaccc ttccctgagc cagaaaagat tggtgctgat 840 atctcactca atatgcagtt aaaacaagaa cttaatccct acgccgatgg cttacccaaa 900 gaagtcagcg atcaactgac agaaaaatac ctgcaattat ttcagctatt tttacgccac 960 agcgacgcca tcgaacgcgt gaccttatgg ggcgtaaacg acaaccaaac ctggcgcaac 1020 aactggccaa tgaaaggcag aacagactac cccttactct tcgaccggaa aaaccagcca 1080 aaagaagtgg ttcctgcatt gattaaactg gcggaaaaag ctggtaaata a 1131 <210> 152 <211> 376 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(21) <400> 152 Met Arg Ser Met Pro Leu Tyr Val Leu Leu Cys Ser Ala Leu Leu Thr 1 5 10 15 Gly Ser Leu Tyr Ala Gln Asp Gln Asn Ala Ser Leu Lys Gln Ala Phe 20 25 30 Ser Lys Asn Phe Ser Ile Gly Thr Ala Leu Ser Ala Thr Gln Ile Gln 35 40 45 Gly Lys Glu Pro Gly Thr Leu Glu Leu Val Thr Gln Gln Phe Asn Ala 50 55 60 Val Thr Ala Glu Asn Val Met Lys Trp Glu Ile Ile Glu Pro Val Glu 65 70 75 80 Gly Gln Phe Asn Phe Ala Ala Ala Asp Ala Met Ile Glu Phe Ala Glu 85 90 95 Ala Asn His Ile Lys Val Ile Gly His Val Leu Leu Trp His Glu Gln 100 105 110 Thr Pro Ala Trp Val Phe Leu Asp Ala Lys Gly Gln Ala Ala Ser Lys 115 120 125 Glu Leu Val Leu Ser Arg Leu Lys Asn His Ile Asn Ala Val Met Gly 130 135 140 Arg Tyr Lys Gly Arg Ile His Gly Trp Asp Ala Val Asn Glu Ala Leu 145 150 155 160 Asn Glu Asp Gly Thr Leu Arg Gln Ser Asn Trp Tyr Lys Ala Leu Gly 165 170 175 Asp Asp Tyr Ile Ala Thr Val Phe Glu Leu Ala His Gln Ala Asp Pro 180 185 190 Lys Ala Glu Leu Tyr Tyr Asn Asp Phe Asn Leu Phe Lys Pro Glu Lys 195 200 205 Arg Ala Gly Val Leu Lys Leu Val Ala Ala Leu Lys Ala Lys Asn Val 210 215 220 Pro Ile His Gly Ile Gly Glu Gln Gly His Tyr Ser Leu Asp Tyr Pro 225 230 235 240 Glu Leu Gln Gln Val Glu Asp Ser Ile Val Ala Phe Lys Asn Thr Gly 245 250 255 Leu Lys Val Val Ile Thr Glu Leu Asp Ile Ser Val Leu Pro Phe Pro 260 265 270 Glu Pro Glu Lys Ile Gly Ala Asp Ile Ser Leu Asn Met Gln Leu Lys 275 280 285 Gln Glu Leu Asn Pro Tyr Ala Asp Gly Leu Pro Lys Glu Val Ser Asp 290 295 300 Gln Leu Thr Glu Lys Tyr Leu Gln Leu Phe Gln Leu Phe Leu Arg His 305 310 315 320 Ser Asp Ala Ile Glu Arg Val Thr Leu Trp Gly Val Asn Asp Asn Gln 325 330 335 Thr Trp Arg Asn Asn Trp Pro Met Lys Gly Arg Thr Asp Tyr Pro Leu 340 345 350 Leu Phe Asp Arg Lys Asn Gln Pro Lys Glu Val Val Pro Ala Leu Ile 355 360 365 Lys Leu Ala Glu Lys Ala Gly Lys 370 375 <210> 153 <211> 1020 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 153 atgggtgcta tgggcctggc ggcgctgtat tcgctgccag ccaatgcaca gacctgcatt 60 acgcagagtc agacgggcac caacaacggc cactattttt cgttctggaa ggacaatccg 120 ggaacggtca atttctgtat gtatgccaac ggccgttaca cgtctaactg gaacggcatc 180 aacaattggg tcggcggcaa aggctggcaa accggctcgc gcagaaacgt cacctactct 240 ggctcgttca actctcccgg caatggctat ctggctgctc tactggctgg accaccaatc 300 ctgttggtcg agtactacat catcgagagc tggggaaatt ggcgcccgcc gggttcggat 360 ggaacattgt taggcaccgt cactagcgac ggcggtactt acgatatcta tcgctcgcgc 420 cgcaccaacg cgccttgtat cactggcaac tcctgtaact tcgatcagta ctggagcgta 480 cggcaatcca agcgcgtggg cggcacgatt accacgggca atcacttcga cgcttgggcg 540 gcacgcggct tgaacctcgg cacgcacaac taccaagtga tggcgaccga gggatatcag 600 agcaacggca gctccgacat caccattagc gacaacccgg gaccgacgcc aggacccact 660 ccgaacccga atcccacgcc gggcaccaag aatttcacgg tgcgcgcgcg cggaaccgcg 720 gggggtgagt ccatcacgct gcgtgtgaac aatcagaacg tgcagacctg gacgctgtcg 780 accagctacc agaacttcac ggcgtccacg acgttgagtg gtggcatcac ggtcgcgttc 840 accaatgatg gtggtagtcg agacgttcag gtggattaca tccaggtgaa cggcgcaact 900 cgacaatccg agagccagac gtacaacacc ggcctctatg ccaacggcag ttgcggcggc 960 ggctcgaaca gcgagtggat gcattgcaat ggagcgatcg gctacggcaa cacgccgtag 1020 <210> 154 <211> 339 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(16) <400> 154 Met Gly Ala Met Gly Leu Ala Ala Leu Tyr Ser Leu Pro Ala Asn Ala 1 5 10 15 Gln Thr Cys Ile Thr Gln Ser Gln Thr Gly Thr Asn Asn Gly His Tyr 20 25 30 Phe Ser Phe Trp Lys Asp Asn Pro Gly Thr Val Asn Phe Cys Met Tyr 35 40 45 Ala Asn Gly Arg Tyr Thr Ser Asn Trp Asn Gly Ile Asn Asn Trp Val 50 55 60 Gly Gly Lys Gly Trp Gln Thr Gly Ser Arg Arg Asn Val Thr Tyr Ser 65 70 75 80 Gly Ser Phe Asn Ser Pro Gly Asn Gly Tyr Leu Ala Ala Leu Leu Ala 85 90 95 Gly Pro Pro Ile Leu Leu Val Glu Tyr Tyr Ile Ile Glu Ser Trp Gly 100 105 110 Asn Trp Arg Pro Pro Gly Ser Asp Gly Thr Leu Leu Gly Thr Val Thr 115 120 125 Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Arg Ser Arg Arg Thr Asn Ala 130 135 140 Pro Cys Ile Thr Gly Asn Ser Cys Asn Phe Asp Gln Tyr Trp Ser Val 145 150 155 160 Arg Gln Ser Lys Arg Val Gly Gly Thr Ile Thr Thr Gly Asn His Phe 165 170 175 Asp Ala Trp Ala Ala Arg Gly Leu Asn Leu Gly Thr His Asn Tyr Gln 180 185 190 Val Met Ala Thr Glu Gly Tyr Gln Ser Asn Gly Ser Ser Asp Ile Thr 195 200 205 Ile Ser Asp Asn Pro Gly Pro Thr Pro Gly Pro Thr Pro Asn Pro Asn 210 215 220 Pro Thr Pro Gly Thr Lys Asn Phe Thr Val Arg Ala Arg Gly Thr Ala 225 230 235 240 Gly Gly Glu Ser Ile Thr Leu Arg Val Asn Asn Gln Asn Val Gln Thr 245 250 255 Trp Thr Leu Ser Thr Ser Tyr Gln Asn Phe Thr Ala Ser Thr Thr Leu 260 265 270 Ser Gly Gly Ile Thr Val Ala Phe Thr Asn Asp Gly Gly Ser Arg Asp 275 280 285 Val Gln Val Asp Tyr Ile Gln Val Asn Gly Ala Thr Arg Gln Ser Glu 290 295 300 Ser Gln Thr Tyr Asn Thr Gly Leu Tyr Ala Asn Gly Ser Cys Gly Gly 305 310 315 320 Gly Ser Asn Ser Glu Trp Met His Cys Asn Gly Ala Ile Gly Tyr Gly 325 330 335 Asn Thr Pro <210> 155 <211> 1836 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 155 atgaaaggat taattgcggc agcgcttgct ggcttggcat tcggggcctc cctatcctgg 60 ggacagtgca caacgtttac caccagtacc attcagaatt gtaatggcat tgattacgag 120 ctctggagtc agaataacaa gggcaccgta agcatgaaga ttacgggagg gagcacgaat 180 ccgaatggag gaactttcga tgctacctgg aatggcaccg agaatatcct ggctagagct 240 ggtaagaaat ggggctcgtc cagcactacc acccccacgt ccgcaggcaa tattactctt 300 gaattcgcgg cgacatggtc ctcaagcgat aacgtaaaaa tgcttggagt ctatggctgg 360 gcgtactatc caactggaag tatcccgact aaacaggaaa atggagcaag tacctcattc 420 acaaatcaaa ttgagtacta catcatccag gatcgtggta gctataatgc tgcatcgggt 480 ggaacgaact ccaaaaaata cggcgaaggg acgatcgatg gaattctgta tgaattctat 540 atcgcagaca gaatcaacca gcctgatctg tcaggaaaga gtggaaactt caagcaatac 600 ttcagcgtcc cgaaaagtac gagcagccat aggcaaagtg ggacgattac cgtttccaaa 660 catttccagg cctgggaaaa tgccggaatg aaaatgatgt cctgtcgctt gtatgaagtc 720 gcaatgaaag tcgagtccta taccggttct gcgaccggtg ttggctctgc gaaggttaca 780 aagaatatac tcaccattgg tggaatcttg agcagtagca gtactgcaag cagtagcagc 840 acagtaagta gcagtagcag caatgcatat acgcttgtca cgaatgtttc tcccgctgga 900 gccggaacag tgaccaggag ccccaatact gcgacctatg ccccgaatgc ttcagtacag 960 cttactgcaa cgccgagtac cggttggaaa tttgtcggtt gggctgggga tcttacgtca 1020 actacgagta ctgctaccgt caccatgacc aaagatatta ccgcaactgc aaaatttgaa 1080 ctggtatcgg gagatggcac gaccaacttg atcaaggatg gaaacttccc cagtagcagc 1140 gtcatctcca caggtgatgg cacctcctgg aagctcgggc aaggtacaaa ctggggtaat 1200 tccgcagcaa cgacgagtgt cagcaatgga atcgcgactg tcaatgtgac caccattgga 1260 tctcaaacct atcaacccca gctaattcag tataacgtgg ctctttacaa ggatatgagc 1320 tacaagctca ccttcaaggc aaaagctgct gctgcaagga aaattgaagt cgcattccaa 1380 cagtcggtgg acccatgggc tggatatgct tccaaggaat tcgatcttac aacgacagag 1440 cagacatatg agttcgtatt taaaatgact agcgctactg acacggcttc acagttcgcg 1500 ttcaatctcg gccaggcaac aggcgccgtc aatattagtg atgtaaagct agtatatacg 1560 acagctggta caacacccgt attccgtgga tataatgagg cggcaacaca ggagaggcct 1620 gtattcatat ccttggatgg taggacgttg aacattgttc cagtgtatgg agccaaactg 1680 caggtcaagt tagtggacat caatggtaag atgagagcct ccttcaatgt ggtcggaatt 1740 gcttccatcc cgctgtccaa tatccccgct gggcggtatt atattgacgt aagtggtgac 1800 ggcgttaagc aggcatcccc gatagttctg gaataa 1836 <210> 156 <211> 611 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(21) <400> 156 Met Lys Gly Leu Ile Ala Ala Ala Leu Ala Gly Leu Ala Phe Gly Ala 1 5 10 15 Ser Leu Ser Trp Gly Gln Cys Thr Thr Phe Thr Thr Ser Thr Ile Gln 20 25 30 Asn Cys Asn Gly Ile Asp Tyr Glu Leu Trp Ser Gln Asn Asn Lys Gly 35 40 45 Thr Val Ser Met Lys Ile Thr Gly Gly Ser Thr Asn Pro Asn Gly Gly 50 55 60 Thr Phe Asp Ala Thr Trp Asn Gly Thr Glu Asn Ile Leu Ala Arg Ala 65 70 75 80 Gly Lys Lys Trp Gly Ser Ser Ser Thr Thr Thr Pro Thr Ser Ala Gly 85 90 95 Asn Ile Thr Leu Glu Phe Ala Ala Thr Trp Ser Ser Ser Asp Asn Val 100 105 110 Lys Met Leu Gly Val Tyr Gly Trp Ala Tyr Tyr Pro Thr Gly Ser Ile 115 120 125 Pro Thr Lys Gln Glu Asn Gly Ala Ser Thr Ser Phe Thr Asn Gln Ile 130 135 140 Glu Tyr Tyr Ile Ile Gln Asp Arg Gly Ser Tyr Asn Ala Ala Ser Gly 145 150 155 160 Gly Thr Asn Ser Lys Lys Tyr Gly Glu Gly Thr Ile Asp Gly Ile Leu 165 170 175 Tyr Glu Phe Tyr Ile Ala Asp Arg Ile Asn Gln Pro Asp Leu Ser Gly 180 185 190 Lys Ser Gly Asn Phe Lys Gln Tyr Phe Ser Val Pro Lys Ser Thr Ser 195 200 205 Ser His Arg Gln Ser Gly Thr Ile Thr Val Ser Lys His Phe Gln Ala 210 215 220 Trp Glu Asn Ala Gly Met Lys Met Met Ser Cys Arg Leu Tyr Glu Val 225 230 235 240 Ala Met Lys Val Glu Ser Tyr Thr Gly Ser Ala Thr Gly Val Gly Ser 245 250 255 Ala Lys Val Thr Lys Asn Ile Leu Thr Ile Gly Gly Ile Leu Ser Ser 260 265 270 Ser Ser Thr Ala Ser Ser Ser Ser Thr Val Ser Ser Ser Ser Ser Asn 275 280 285 Ala Tyr Thr Leu Val Thr Asn Val Ser Pro Ala Gly Ala Gly Thr Val 290 295 300 Thr Arg Ser Pro Asn Thr Ala Thr Tyr Ala Pro Asn Ala Ser Val Gln 305 310 315 320 Leu Thr Ala Thr Pro Ser Thr Gly Trp Lys Phe Val Gly Trp Ala Gly 325 330 335 Asp Leu Thr Ser Thr Thr Ser Thr Ala Thr Val Thr Met Thr Lys Asp 340 345 350 Ile Thr Ala Thr Ala Lys Phe Glu Leu Val Ser Gly Asp Gly Thr Thr 355 360 365 Asn Leu Ile Lys Asp Gly Asn Phe Pro Ser Ser Ser Val Ile Ser Thr 370 375 380 Gly Asp Gly Thr Ser Trp Lys Leu Gly Gln Gly Thr Asn Trp Gly Asn 385 390 395 400 Ser Ala Ala Thr Thr Ser Val Ser Asn Gly Ile Ala Thr Val Asn Val 405 410 415 Thr Thr Ile Gly Ser Gln Thr Tyr Gln Pro Gln Leu Ile Gln Tyr Asn 420 425 430 Val Ala Leu Tyr Lys Asp Met Ser Tyr Lys Leu Thr Phe Lys Ala Lys 435 440 445 Ala Ala Ala Ala Arg Lys Ile Glu Val Ala Phe Gln Gln Ser Val Asp 450 455 460 Pro Trp Ala Gly Tyr Ala Ser Lys Glu Phe Asp Leu Thr Thr Thr Glu 465 470 475 480 Gln Thr Tyr Glu Phe Val Phe Lys Met Thr Ser Ala Thr Asp Thr Ala 485 490 495 Ser Gln Phe Ala Phe Asn Leu Gly Gln Ala Thr Gly Ala Val Asn Ile 500 505 510 Ser Asp Val Lys Leu Val Tyr Thr Thr Ala Gly Thr Thr Pro Val Phe 515 520 525 Arg Gly Tyr Asn Glu Ala Ala Thr Gln Glu Arg Pro Val Phe Ile Ser 530 535 540 Leu Asp Gly Arg Thr Leu Asn Ile Val Pro Val Tyr Gly Ala Lys Leu 545 550 555 560 Gln Val Lys Leu Val Asp Ile Asn Gly Lys Met Arg Ala Ser Phe Asn 565 570 575 Val Val Gly Ile Ala Ser Ile Pro Leu Ser Asn Ile Pro Ala Gly Arg 580 585 590 Tyr Tyr Ile Asp Val Ser Gly Asp Gly Val Lys Gln Ala Ser Pro Ile 595 600 605 Val Leu Glu 610 <210> 157 <211> 645 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 157 atgtttaagt taagtaagaa aattttgatg gtgttattaa caatttcaat gagttttatt 60 agcttatttg cagtaaccgc gtatgcagct tcgacagact actggcaaaa ttggactgat 120 ggtggtggga cagtaaatgc taccaatgga tctgatggca attacagtgt ttcatggtca 180 aattgcggga attttgttgt tggtaaaggc tggactaccg gatcagcaac tagggtaata 240 aactataatg ccggagcctt ttcgccgtcc ggcaatggat atttagctct ttatgggtgg 300 acgagaaatt cactcataga atattacgtc gttgatagct gggggactta tagacctact 360 ggaacttata aaggcactgt gactagtgat ggagggacat atgacatata cacgactaca 420 cgaaccaacg caccttccat tgacggcaat aatacaaatt tcacccagtt ctggagtgtt 480 aggcagtcaa agagaccgat tggtaccaac aataccatca cttttagcaa ccacgttaac 540 gcctggaaga gtaaaggaat gaatctgggg agtagttggg cttatcaggt attagcgaca 600 gagggatatc aaagtagtgg gtactctaac gtaacggtct ggtaa 645 <210> 158 <211> 214 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(29) <400> 158 Met Phe Lys Leu Ser Lys Lys Ile Leu Met Val Leu Leu Thr Ile Ser 1 5 10 15 Met Ser Phe Ile Ser Leu Phe Ala Val Thr Ala Tyr Ala Ala Ser Thr 20 25 30 Asp Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr Val Asn Ala Thr 35 40 45 Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser Asn Cys Gly Asn 50 55 60 Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala Thr Arg Val Ile 65 70 75 80 Asn Tyr Asn Ala Gly Ala Phe Ser Pro Ser Gly Asn Gly Tyr Leu Ala 85 90 95 Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr Tyr Val Val Asp 100 105 110 Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Thr Val Thr 115 120 125 Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr Arg Thr Asn Ala 130 135 140 Pro Ser Ile Asp Gly Asn Asn Thr Asn Phe Thr Gln Phe Trp Ser Val 145 150 155 160 Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr Ile Thr Phe Ser 165 170 175 Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn Leu Gly Ser Ser 180 185 190 Trp Ala Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln Ser Ser Gly Tyr 195 200 205 Ser Asn Val Thr Val Trp 210 <210> 159 <211> 1041 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 159 atgatcagtc tcaaacgagt ggcggcgctc ctgtgcgtcg caggtctggg catgtctgcg 60 gcaaacgcgc agacctgcct cacgtcgagt caaaccggca ctaacaatgg cttctattat 120 tccttctgga aggacagtcc gggcacggtg aatttttgcc tgcagtccgg cggccgttac 180 acatcgaact ggagcggcat caacaactgg gtgggcggca agggatggca gaccggttca 240 cgccggaaca tcacgtactc gggcagcttc aattcaccgg gcaacggcta cctggcgctt 300 tacggatgga ccaccaatcc actcgtcgag tactacgtcg tcgatagctg ggggagctgg 360 cgtccgccgg gttcggacgg aacgttcctg gggacggtca acagcgatgg cggaacgtat 420 gacatctatc gcgcgcagcg ggtcaacgcg ccgtccatca tcggcaacgc cacgttctat 480 caatactgga gcgttcggca gtcgaagcgg gtaggtggga cgatcaccac cggaaaccac 540 ttcgacgcgt gggccagcgt gggcctgaac ctgggcactc acaactacca gatcatggcg 600 accgagggct accaaagcag cggcagctcc gacatcacgg tgagtgaagg cggtagcagc 660 agtggtggcg gaagcagcac gagcagcagc agcggcggtg gtggcaccaa gagcttcacg 720 gttcgtgcgc gcggtaccgc gggcggtgag tccatcacgc tgcgcgtgaa caaccagaac 780 gtgcagacct ggacgctggg caccagcatg acgaactaca cggcgtcgac ttcactgagc 840 ggcggcatca ccgtggtgta cacgaacgac agcggtaacc gcgacgtgca ggtggactac 900 atcgtcgtga acggccagac gcgccagtcc gaagcccaga gctacaacac cggcctttat 960 gcgaacgggc gttgcggcgg tggctccaac agcgaatgga tgcattgcaa cggcgccatc 1020 ggctacggca atacaccgta a 1041 <210> 160 <211> 346 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(23) <400> 160 Met Ile Ser Leu Lys Arg Val Ala Ala Leu Leu Cys Val Ala Gly Leu 1 5 10 15 Gly Met Ser Ala Ala Asn Ala Gln Thr Cys Leu Thr Ser Ser Gln Thr 20 25 30 Gly Thr Asn Asn Gly Phe Tyr Tyr Ser Phe Trp Lys Asp Ser Pro Gly 35 40 45 Thr Val Asn Phe Cys Leu Gln Ser Gly Gly Arg Tyr Thr Ser Asn Trp 50 55 60 Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly Ser 65 70 75 80 Arg Arg Asn Ile Thr Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn Gly 85 90 95 Tyr Leu Ala Leu Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr Tyr 100 105 110 Val Val Asp Ser Trp Gly Ser Trp Arg Pro Pro Gly Ser Asp Gly Thr 115 120 125 Phe Leu Gly Thr Val Asn Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Arg 130 135 140 Ala Gln Arg Val Asn Ala Pro Ser Ile Ile Gly Asn Ala Thr Phe Tyr 145 150 155 160 Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Val Gly Gly Thr Ile Thr 165 170 175 Thr Gly Asn His Phe Asp Ala Trp Ala Ser Val Gly Leu Asn Leu Gly 180 185 190 Thr His Asn Tyr Gln Ile Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly 195 200 205 Ser Ser Asp Ile Thr Val Ser Glu Gly Gly Ser Ser Ser Gly Gly Gly 210 215 220 Ser Ser Thr Ser Ser Ser Ser Gly Gly Gly Gly Thr Lys Ser Phe Thr 225 230 235 240 Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Ser Ile Thr Leu Arg Val 245 250 255 Asn Asn Gln Asn Val Gln Thr Trp Thr Leu Gly Thr Ser Met Thr Asn 260 265 270 Tyr Thr Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val Val Tyr Thr 275 280 285 Asn Asp Ser Gly Asn Arg Asp Val Gln Val Asp Tyr Ile Val Val Asn 290 295 300 Gly Gln Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly Leu Tyr 305 310 315 320 Ala Asn Gly Arg Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys 325 330 335 Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro 340 345 <210> 161 <211> 1047 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 161 atgttcaaag gtcttttgaa atcggtcctc accggcaagc gagccggtgc ggtgttcatc 60 tgtctggccg gactgtggat gacacaggcg caggcgcaga cgtgcatcgg ttcaccacaa 120 acgggcaaca acggcggctt cttcttttcg ttctggaaag acaatccggg gtcggtgaat 180 ttctgcatgt actccggcgg tcgctatacc tccagctgga gcggcatcaa caactgggta 240 ggtgggaagg gctggcaaac cggttcatcc cgcacggtga cgtattcggg cacgttcaac 300 tcgccgggaa acggctacct gactctgtac ggatggacca ccaatccgct ggtcgagtac 360 tacatcgtgg acagctgggg cagctaccgt ccgcctggag gccagggctt catgggcacg 420 gtcaccagcg acggcggaac gtatgacatc taccgggttc gccgcaccaa tgcgccgtgc 480 atcacaggca acaactgcaa cttcgaccag tactggagcg tgcgtcagtc gaggcgggtg 540 ggcggcacca tcaccaccgc caaccatttc aacgcgtggc gtacgctcgg catgaatctc 600 gggcagcaca actaccaggt gatggcgacc gaaggattcc agagcagtgg cagctcggac 660 atcaccgtga gcgaaggatc tggcggtggc ggcggaggtg gcggcggtgg caccaagagc 720 ttcacggtgc gcgcgcgcgg caccgcgggc ggcgagtcca tcacgctgcg cgtcaacaac 780 caggtcgtgc agagctggac cttgagcacc agcatgcaga actacacggc ctcgaccacg 840 atgagcggcg gcatcacggt gaacttcacc aacgacggca ccaaccgcga cgtgcaggtg 900 gactacatca tcgtgaatgg ccagacgcgt cagtccgaag cgcagacgta caacaccggg 960 ctgtacgcca acggccgttg cggtggcggg tcgaacagcg agtggatgca ttgcaatggc 1020 gcgatcgggt acggcgacac gccctga 1047 <210> 162 <211> 348 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(32) <400> 162 Met Phe Lys Gly Leu Leu Lys Ser Val Leu Thr Gly Lys Arg Ala Gly 1 5 10 15 Ala Val Phe Ile Cys Leu Ala Gly Leu Trp Met Thr Gln Ala Gln Ala 20 25 30 Gln Thr Cys Ile Gly Ser Pro Gln Thr Gly Asn Asn Gly Gly Phe Phe 35 40 45 Phe Ser Phe Trp Lys Asp Asn Pro Gly Ser Val Asn Phe Cys Met Tyr 50 55 60 Ser Gly Gly Arg Tyr Thr Ser Ser Trp Ser Gly Ile Asn Asn Trp Val 65 70 75 80 Gly Gly Lys Gly Trp Gln Thr Gly Ser Ser Arg Thr Val Thr Tyr Ser 85 90 95 Gly Thr Phe Asn Ser Pro Gly Asn Gly Tyr Leu Thr Leu Tyr Gly Trp 100 105 110 Thr Thr Asn Pro Leu Val Glu Tyr Tyr Ile Val Asp Ser Trp Gly Ser 115 120 125 Tyr Arg Pro Pro Gly Gly Gln Gly Phe Met Gly Thr Val Thr Ser Asp 130 135 140 Gly Gly Thr Tyr Asp Ile Tyr Arg Val Arg Arg Thr Asn Ala Pro Cys 145 150 155 160 Ile Thr Gly Asn Asn Cys Asn Phe Asp Gln Tyr Trp Ser Val Arg Gln 165 170 175 Ser Arg Arg Val Gly Gly Thr Ile Thr Thr Ala Asn His Phe Asn Ala 180 185 190 Trp Arg Thr Leu Gly Met Asn Leu Gly Gln His Asn Tyr Gln Val Met 195 200 205 Ala Thr Glu Gly Phe Gln Ser Ser Gly Ser Ser Asp Ile Thr Val Ser 210 215 220 Glu Gly Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Thr Lys Ser 225 230 235 240 Phe Thr Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Ser Ile Thr Leu 245 250 255 Arg Val Asn Asn Gln Val Val Gln Ser Trp Thr Leu Ser Thr Ser Met 260 265 270 Gln Asn Tyr Thr Ala Ser Thr Thr Met Ser Gly Gly Ile Thr Val Asn 275 280 285 Phe Thr Asn Asp Gly Thr Asn Arg Asp Val Gln Val Asp Tyr Ile Ile 290 295 300 Val Asn Gly Gln Thr Arg Gln Ser Glu Ala Gln Thr Tyr Asn Thr Gly 305 310 315 320 Leu Tyr Ala Asn Gly Arg Cys Gly Gly Gly Ser Asn Ser Glu Trp Met 325 330 335 His Cys Asn Gly Ala Ile Gly Tyr Gly Asp Thr Pro 340 345 <210> 163 <211> 1068 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 163 atgaaagcaa agagaatgaa gttgtttgcc gcatttttac tctgttttac gcttgcactt 60 cctggggcag tgcatgcgca gacgatcacc agcaattcgg tcggtacgca tgacggttat 120 gactatgaat actggaagga cagcgggaat ggaactatgg ttctcggtag tggcggtacg 180 ttcagtgccg agtggagcaa tatcaataat attctgttcc gtaaaggcaa gaagttcaat 240 gagacgcaga cccatcagca aattggaaac atttccataa cctatggtgc cacctaccaa 300 ccgaatggca attcgtattt aacggtctat ggctggacgg ttgaccccct cgtcgaatat 360 tacattgtcg atagctgggg cagctggcgt ccgcctggag catcgccaaa ggggactgtt 420 aacgttgacg gaggaacgta tgacatttat gagacaactc gtgtcaacca gccttccatt 480 aaaggcacgg caaccttcaa gcagtattgg agtgtccgga cgtcaaaacg gacgagcgga 540 accatatctg taagcgagca ctttaaggcc tgggagaaat tggggatgac catgggcaag 600 atgtatgaag tcgcgcttac ggttgaaggc tatcaaagca gtggaagcgc taatgtgtat 660 agccatacac tgacgatcgg cgggggaaca acacctccac caaccacagg cacaaagatc 720 gaagccgaga gtatgaccaa aagcggacaa tacactggga atatcagctc gccgttcaac 780 ggagtcgctt tgtatgccaa caatgattcc gtgaaattca cgcataattt cacgaccggc 840 acccataact tctcactccg gggggcatca aacaactcca atatggcccg ggttgacctg 900 aaaatcggcg ggcagacgaa ggggaccttc tatttcggcg gaagcagccc tgcggtctat 960 actctgaata atgtcagcca tggaaccgga aatcaagagg ttgaactcgt tgtaaccgcc 1020 gataacggaa catgggatgc tttcattgat tatctcgaga tccattaa 1068 <210> 164 <211> 355 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(26) <400> 164 Met Lys Ala Lys Arg Met Lys Leu Phe Ala Ala Phe Leu Leu Cys Phe 1 5 10 15 Thr Leu Ala Leu Pro Gly Ala Val His Ala Gln Thr Ile Thr Ser Asn 20 25 30 Ser Val Gly Thr His Asp Gly Tyr Asp Tyr Glu Tyr Trp Lys Asp Ser 35 40 45 Gly Asn Gly Thr Met Val Leu Gly Ser Gly Gly Thr Phe Ser Ala Glu 50 55 60 Trp Ser Asn Ile Asn Asn Ile Leu Phe Arg Lys Gly Lys Lys Phe Asn 65 70 75 80 Glu Thr Gln Thr His Gln Gln Ile Gly Asn Ile Ser Ile Thr Tyr Gly 85 90 95 Ala Thr Tyr Gln Pro Asn Gly Asn Ser Tyr Leu Thr Val Tyr Gly Trp 100 105 110 Thr Val Asp Pro Leu Val Glu Tyr Tyr Ile Val Asp Ser Trp Gly Ser 115 120 125 Trp Arg Pro Pro Gly Ala Ser Pro Lys Gly Thr Val Asn Val Asp Gly 130 135 140 Gly Thr Tyr Asp Ile Tyr Glu Thr Thr Arg Val Asn Gln Pro Ser Ile 145 150 155 160 Lys Gly Thr Ala Thr Phe Lys Gln Tyr Trp Ser Val Arg Thr Ser Lys 165 170 175 Arg Thr Ser Gly Thr Ile Ser Val Ser Glu His Phe Lys Ala Trp Glu 180 185 190 Lys Leu Gly Met Thr Met Gly Lys Met Tyr Glu Val Ala Leu Thr Val 195 200 205 Glu Gly Tyr Gln Ser Ser Gly Ser Ala Asn Val Tyr Ser His Thr Leu 210 215 220 Thr Ile Gly Gly Gly Thr Thr Pro Pro Pro Thr Thr Gly Thr Lys Ile 225 230 235 240 Glu Ala Glu Ser Met Thr Lys Ser Gly Gln Tyr Thr Gly Asn Ile Ser 245 250 255 Ser Pro Phe Asn Gly Val Ala Leu Tyr Ala Asn Asn Asp Ser Val Lys 260 265 270 Phe Thr His Asn Phe Thr Thr Gly Thr His Asn Phe Ser Leu Arg Gly 275 280 285 Ala Ser Asn Asn Ser Asn Met Ala Arg Val Asp Leu Lys Ile Gly Gly 290 295 300 Gln Thr Lys Gly Thr Phe Tyr Phe Gly Gly Ser Ser Pro Ala Val Tyr 305 310 315 320 Thr Leu Asn Asn Val Ser His Gly Thr Gly Asn Gln Glu Val Glu Leu 325 330 335 Val Val Thr Ala Asp Asn Gly Thr Trp Asp Ala Phe Ile Asp Tyr Leu 340 345 350 Glu Ile His 355 <210> 165 <211> 1047 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 165 gtggggcgca ggagcgccgc cacggcattc atcggcctgg cagcgctgtg tgcctcggcc 60 gccaacgcgc agacctgtct gagctcgagt cagaccggca ccaacaacgg cttctactat 120 tcgttctgga ccgacggcgg tggctccgtg cagttctgcc tgcaatccgc cgggcgctac 180 acctccagct ggagcaatgt cggaaactgg gtcggtggca agggctggca gaccggcgcg 240 cgccgcaaca tcaactattc cggcagcttc aatccctcgg gtaacgcgta cctggccgtc 300 tatggctgga ccacgaatcc cctggtggag tactacatcg tcgacaactg gggtacctat 360 cgtccaccgg gtgggcaggg attcatgggc acggttgtca gcgatggcgg cacctacgac 420 gtctaccgca cgcaacgggt caacgcgccc tccattcagg gcaacgcgac cttctaccag 480 tactggagcg ttcgccagtc gaagcgcacc ggtggaacca tctccaccgg caaccatttc 540 gacggctggg cgacgttcgg catgaacctg ggaaccttca attaccagat cgtggcgacc 600 gagggctacc agagcagcgg caattccgac atcacggtga gcgatggcgg cagcagctcc 660 tcgtcctcca gcagcagcag ttcgtcgtcc tccagcagcg gcggtggcgg caccaagagc 720 ttcacggtgc gcgcgcgcgg cacggccgga ggcgagtcga tcagcctgcg ggtcaacaac 780 accaacgtgc agacctggtc gctgaccacc agctaccaga atctcacggc ctcgaccacg 840 ctgaccggcg gcatcaccgt caactacacc aacgacagca gcggtcacga cgtacaggtg 900 gactacatca tcgtgaacgg ccagacccgc cagtccgagg cgcagagcta caacaccgga 960 ctctatgcca acgggcgctg cggtggtggt ggctacagcg agtggatgca ttgcaacggc 1020 gccatcggct acggcaatac gccgtaa 1047 <210> 166 <211> 348 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(23) <400> 166 Val Gly Arg Arg Ser Ala Ala Thr Ala Phe Ile Gly Leu Ala Ala Leu 1 5 10 15 Cys Ala Ser Ala Ala Asn Ala Gln Thr Cys Leu Ser Ser Ser Gln Thr 20 25 30 Gly Thr Asn Asn Gly Phe Tyr Tyr Ser Phe Trp Thr Asp Gly Gly Gly 35 40 45 Ser Val Gln Phe Cys Leu Gln Ser Ala Gly Arg Tyr Thr Ser Ser Trp 50 55 60 Ser Asn Val Gly Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly Ala 65 70 75 80 Arg Arg Asn Ile Asn Tyr Ser Gly Ser Phe Asn Pro Ser Gly Asn Ala 85 90 95 Tyr Leu Ala Val Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr Tyr 100 105 110 Ile Val Asp Asn Trp Gly Thr Tyr Arg Pro Pro Gly Gly Gln Gly Phe 115 120 125 Met Gly Thr Val Val Ser Asp Gly Gly Thr Tyr Asp Val Tyr Arg Thr 130 135 140 Gln Arg Val Asn Ala Pro Ser Ile Gln Gly Asn Ala Thr Phe Tyr Gln 145 150 155 160 Tyr Trp Ser Val Arg Gln Ser Lys Arg Thr Gly Gly Thr Ile Ser Thr 165 170 175 Gly Asn His Phe Asp Gly Trp Ala Thr Phe Gly Met Asn Leu Gly Thr 180 185 190 Phe Asn Tyr Gln Ile Val Ala Thr Glu Gly Tyr Gln Ser Ser Gly Asn 195 200 205 Ser Asp Ile Thr Val Ser Asp Gly Gly Ser Ser Ser Ser Ser Ser Ser 210 215 220 Ser Ser Ser Ser Ser Ser Ser Ser Ser Gly Gly Gly Gly Thr Lys Ser 225 230 235 240 Phe Thr Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Ser Ile Ser Leu 245 250 255 Arg Val Asn Asn Thr Asn Val Gln Thr Trp Ser Leu Thr Thr Ser Tyr 260 265 270 Gln Asn Leu Thr Ala Ser Thr Thr Leu Thr Gly Gly Ile Thr Val Asn 275 280 285 Tyr Thr Asn Asp Ser Ser Gly His Asp Val Gln Val Asp Tyr Ile Ile 290 295 300 Val Asn Gly Gln Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly 305 310 315 320 Leu Tyr Ala Asn Gly Arg Cys Gly Gly Gly Gly Tyr Ser Glu Trp Met 325 330 335 His Cys Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro 340 345 <210> 167 <211> 669 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 167 gtgaagctga aaagactgtt caagatcgga ctgctgccgg ccgtattgtt gtttagtgca 60 acgcagcagt taaccgcgca aaccatctgc agcaaccaga ccggcaccaa caacggctac 120 ttctactcgt tctggaagga caccgggtcg gcgtgcatga cactgggttc cggcggcaac 180 tacagcgtca actggaacct gggttccggg aacatggtct gcggcaaagg ctggagtacc 240 ggatcttcaa gccgcagaat cggctacaac gccggcgtct gggcgccgaa cggcaatgcc 300 tacctgactc tgtatgggtg gaccaggaac ccgctcatcg agtactacgt ggtcgacagt 360 tggggaagct ggaggccgcc aggcggaacc tccgcgggca ccgtcaatag cgatggcggg 420 acctacaacc tctatcggac gcagcgggtc aacgcgcctt ccatcgacgg cacccggacg 480 ttctatcagt actggagtgt ccggacctcg aagaggccca ccgggagcaa ccagaccatc 540 accttcgcga accacgtgaa tgcgtggagg agcaaagggt ggaatctggg gagtcacgtc 600 taccagataa tggcaacaga gggatatcaa agcagcggga attccaacct gacggtgtgg 660 gcgcagtag 669 <210> 168 <211> 222 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(36) <400> 168 Val Lys Leu Lys Arg Leu Phe Lys Ile Gly Leu Leu Pro Ala Val Leu 1 5 10 15 Leu Phe Ser Ala Thr Gln Gln Leu Thr Ala Gln Thr Ile Cys Ser Asn 20 25 30 Gln Thr Gly Thr Asn Asn Gly Tyr Phe Tyr Ser Phe Trp Lys Asp Thr 35 40 45 Gly Ser Ala Cys Met Thr Leu Gly Ser Gly Gly Asn Tyr Ser Val Asn 50 55 60 Trp Asn Leu Gly Ser Gly Asn Met Val Cys Gly Lys Gly Trp Ser Thr 65 70 75 80 Gly Ser Ser Ser Arg Arg Ile Gly Tyr Asn Ala Gly Val Trp Ala Pro 85 90 95 Asn Gly Asn Ala Tyr Leu Thr Leu Tyr Gly Trp Thr Arg Asn Pro Leu 100 105 110 Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Ser Trp Arg Pro Pro Gly 115 120 125 Gly Thr Ser Ala Gly Thr Val Asn Ser Asp Gly Gly Thr Tyr Asn Leu 130 135 140 Tyr Arg Thr Gln Arg Val Asn Ala Pro Ser Ile Asp Gly Thr Arg Thr 145 150 155 160 Phe Tyr Gln Tyr Trp Ser Val Arg Thr Ser Lys Arg Pro Thr Gly Ser 165 170 175 Asn Gln Thr Ile Thr Phe Ala Asn His Val Asn Ala Trp Arg Ser Lys 180 185 190 Gly Trp Asn Leu Gly Ser His Val Tyr Gln Ile Met Ala Thr Glu Gly 195 200 205 Tyr Gln Ser Ser Gly Asn Ser Asn Leu Thr Val Trp Ala Gln 210 215 220 <210> 169 <211> 1041 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 169 atgattgtta gtttcaagag cgtgaaggca ctcgcgtgcc tcgccgtgct cggcattacc 60 gccgcgcagg cgcaaacctg catcacttcc agccagaccg gtaccaacaa cggcaactac 120 ttttccttct ggaaggacag cccgggtacc gtcaacttct gcatgtatgc caatgggcgc 180 tacacctcca actggagcgg catcaacaac tgggtgggcg gcaagggctg gcagacgggc 240 tccaaccgca cggtgaccta ctccggttcg ttcaattcgc ccggcaatgg ctatctcacc 300 ttgtacggat ggaccacgaa tccattgatc gagtactaca tcgtcgacag ctggggcacc 360 tatcgaccgc cgggcggcca gggcttcatg ggcaccgtca acagcgatgg cggcacctat 420 gacatctacc gcacgcagcg cgtgaaccag ccttccatca tcggcaccgc cacgttctac 480 cagtactgga gcgtgcggca gtcgaagcgc gtcggcggca cgatcaccac ggccaaccac 540 ttcaacgcct gggccacgct gggcatgaac ctgggccagc acaactacca ggtcatggcc 600 accgagggtt accagagcag tggcagctcc gacatcaccg tgaccgaggg cggcggctcc 660 tcgtcgtcca gtggcggcgg cagcaccagc agtggcggtg gcggcagcaa gagcttcacc 720 gtgcgtgcgc gcggcacggt cggcggcgaa aacatccagc tgcaggtcaa caaccagacg 780 gtggcgagct ggaacctgac caccagcatg cagaactaca acgcctcgac cagcctgagt 840 ggcggcatca ccgtcgtgta caccaatgac agcggcagcc gcgacgtgca ggtggactac 900 atcgtcgtca acggccagac ccgccagtcc gaagcccaga gctacaacac cgggctctat 960 gccaacggac gttgtggtgg cggctcgaac agcgagtgga tgcattgcaa cggcgcgatt 1020 ggctacggca acacgcccta g 1041 <210> 170 <211> 346 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(24) <400> 170 Met Ile Val Ser Phe Lys Ser Val Lys Ala Leu Ala Cys Leu Ala Val 1 5 10 15 Leu Gly Ile Thr Ala Ala Gln Ala Gln Thr Cys Ile Thr Ser Ser Gln 20 25 30 Thr Gly Thr Asn Asn Gly Asn Tyr Phe Ser Phe Trp Lys Asp Ser Pro 35 40 45 Gly Thr Val Asn Phe Cys Met Tyr Ala Asn Gly Arg Tyr Thr Ser Asn 50 55 60 Trp Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly 65 70 75 80 Ser Asn Arg Thr Val Thr Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn 85 90 95 Gly Tyr Leu Thr Leu Tyr Gly Trp Thr Thr Asn Pro Leu Ile Glu Tyr 100 105 110 Tyr Ile Val Asp Ser Trp Gly Thr Tyr Arg Pro Pro Gly Gly Gln Gly 115 120 125 Phe Met Gly Thr Val Asn Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Arg 130 135 140 Thr Gln Arg Val Asn Gln Pro Ser Ile Ile Gly Thr Ala Thr Phe Tyr 145 150 155 160 Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Val Gly Gly Thr Ile Thr 165 170 175 Thr Ala Asn His Phe Asn Ala Trp Ala Thr Leu Gly Met Asn Leu Gly 180 185 190 Gln His Asn Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly 195 200 205 Ser Ser Asp Ile Thr Val Thr Glu Gly Gly Gly Ser Ser Ser Ser Ser 210 215 220 Gly Gly Gly Ser Thr Ser Ser Gly Gly Gly Gly Ser Lys Ser Phe Thr 225 230 235 240 Val Arg Ala Arg Gly Thr Val Gly Gly Glu Asn Ile Gln Leu Gln Val 245 250 255 Asn Asn Gln Thr Val Ala Ser Trp Asn Leu Thr Thr Ser Met Gln Asn 260 265 270 Tyr Asn Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val Val Tyr Thr 275 280 285 Asn Asp Ser Gly Ser Arg Asp Val Gln Val Asp Tyr Ile Val Val Asn 290 295 300 Gly Gln Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly Leu Tyr 305 310 315 320 Ala Asn Gly Arg Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys 325 330 335 Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro 340 345 <210> 171 <211> 678 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 171 atggagttga aaaaaatatc cagaaaagga ctgccactag tattcttgtc cttgttgttg 60 ttcagtgtaa cgcagcagtc aaacgcccaa accatctgca gcaatcaaac tggcacaaac 120 aacggtttct tctattcgtt ttggaaggac accggatcag catgcatgac tttgggctct 180 ggcggcaatt acgacgtaag ttggaatctg ggttctggga atatggttgt cggcaaaggc 240 tggagtaccg gatcatcaac caggagagta ggctacaatg ccggcatctg gcagccgaac 300 ggcaatgcat atttggctct ctatgggtgg acgagaaacc cacttataga atattacgtc 360 gttgatagct ggggcacttt caggccgcct ggaggaacgt caataggctc cgtcaccact 420 gatggtggta cataccaaat atatcggacc cagcgagtca acgcgccttc cattgacggc 480 gccagaactt tttatcagta ctggagtgtc cggacctcga agagaccgac cgggagcaac 540 caaaccatca cctttgcgaa tcacgttaac gcgtggagga atctaggttt gaatctgggg 600 agtcatgttt accagataat ggccacagag ggatttcata gcagtgggag atctaaccta 660 acggtgtggt cacagtaa 678 <210> 172 <211> 225 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(29) <400> 172 Met Glu Leu Lys Lys Ile Ser Arg Lys Gly Leu Pro Leu Val Phe Leu 1 5 10 15 Ser Leu Leu Leu Phe Ser Val Thr Gln Gln Ser Asn Ala Gln Thr Ile 20 25 30 Cys Ser Asn Gln Thr Gly Thr Asn Asn Gly Phe Phe Tyr Ser Phe Trp 35 40 45 Lys Asp Thr Gly Ser Ala Cys Met Thr Leu Gly Ser Gly Gly Asn Tyr 50 55 60 Asp Val Ser Trp Asn Leu Gly Ser Gly Asn Met Val Val Gly Lys Gly 65 70 75 80 Trp Ser Thr Gly Ser Ser Thr Arg Arg Val Gly Tyr Asn Ala Gly Ile 85 90 95 Trp Gln Pro Asn Gly Asn Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Arg 100 105 110 Asn Pro Leu Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Thr Phe Arg 115 120 125 Pro Pro Gly Gly Thr Ser Ile Gly Ser Val Thr Thr Asp Gly Gly Thr 130 135 140 Tyr Gln Ile Tyr Arg Thr Gln Arg Val Asn Ala Pro Ser Ile Asp Gly 145 150 155 160 Ala Arg Thr Phe Tyr Gln Tyr Trp Ser Val Arg Thr Ser Lys Arg Pro 165 170 175 Thr Gly Ser Asn Gln Thr Ile Thr Phe Ala Asn His Val Asn Ala Trp 180 185 190 Arg Asn Leu Gly Leu Asn Leu Gly Ser His Val Tyr Gln Ile Met Ala 195 200 205 Thr Glu Gly Phe His Ser Ser Gly Arg Ser Asn Leu Thr Val Trp Ser 210 215 220 Gln 225 <210> 173 <211> 1503 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 173 ttgaaaaaac tcgcagctgc cttatcactt gcaattacct ttgccgtacc gacaatagta 60 caagcacaag gtcccacatg gactaccagc acaatacaga aatacaacaa ctacgactat 120 gaactctgga atgaaaacaa tcagggtacc gtttccatga agctcacagg agataacggt 180 accgctgcca atgcggtagg cggaacgttt gagtctactt ggagtggtac aaagaatgtg 240 cttttccgtt ccggcagaaa gtttaccggt acttcagggc aaagcgttga tggtggcggt 300 gctggcaaaa ccgctagtgc ttacggcaat ataagcatta acttcgccgc tacgtggtct 360 tccggtgacg atgtgaagat gcttggcgta tatggttggg cgttttacgc actgccaagt 420 gtaccagaca aacaggaaaa cggcacttct actaattttt ccaatcaaat agaatactac 480 atcattcaag accgcggcag ctataactcg gctacaggtg gcaccaactc aaagaaatac 540 ggtgaggcta ccattgacgg cattgcttat gagttccgtg tatgtgatag aatagggcaa 600 cctatgttaa ctggcaacgg gaattttaag cagtatttca gtgttcctaa aagcactata 660 aaccaccgca ccagcggtac aatctctgtt tccaaacact ttgaagaatg ggaaaaagtc 720 ggcatgaaaa tggacggtcc cttatacgaa gtagcgatga aagttgaatc ctattctggc 780 aatgggaata gtaacggcaa tgctaaaatt acaaagaata ttttgaccat tggcggaaca 840 accacaactc aaagcagttc aagcggaggt tcaacggttc cagatgaatg tggcgaatat 900 aaaaagagtt tctgtggtgg cttgggatat ggaagcgtat attccaattt aaccgcaata 960 ccctcaacgg gcgactgctt atacatcgga gattttgaag taatccagcc agctttgaat 1020 tcaaccgttg ccataaacgg tgtggaaaat acctgcggaa gcgagtggtc agattgccct 1080 tacaatgata aacccgattc aaaaaaagat ggcggctatt atgtttatgt gaaaacaggc 1140 tcaattaaca attatgagaa taacggttgg caaaacattg tagctaaagc aaaaccggct 1200 tgcacaccac cttctagcag ttccggtgct gcaccaggtt cttcttcttc agacgaagaa 1260 gacccagagc caattttgaa aaatcgcatt cctataactc atttttccct tcaaacgctt 1320 agcgataaag ccttgcgcat agaagtaaat gctccaacta ttgtggacat ttttgacctg 1380 agagggaata aggttaaaag tttgaatgtt tacggttcgc aaagggttaa attatccctg 1440 ccgagcgggg tgtattttgc caaagtgcgc gggatgaaaa gcgttagatt tgtgttgagg 1500 taa 1503 <210> 174 <211> 500 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(22) <400> 174 Leu Lys Lys Leu Ala Ala Ala Leu Ser Leu Ala Ile Thr Phe Ala Val 1 5 10 15 Pro Thr Ile Val Gln Ala Gln Gly Pro Thr Trp Thr Thr Ser Thr Ile 20 25 30 Gln Lys Tyr Asn Asn Tyr Asp Tyr Glu Leu Trp Asn Glu Asn Asn Gln 35 40 45 Gly Thr Val Ser Met Lys Leu Thr Gly Asp Asn Gly Thr Ala Ala Asn 50 55 60 Ala Val Gly Gly Thr Phe Glu Ser Thr Trp Ser Gly Thr Lys Asn Val 65 70 75 80 Leu Phe Arg Ser Gly Arg Lys Phe Thr Gly Thr Ser Gly Gln Ser Val 85 90 95 Asp Gly Gly Gly Ala Gly Lys Thr Ala Ser Ala Tyr Gly Asn Ile Ser 100 105 110 Ile Asn Phe Ala Ala Thr Trp Ser Ser Gly Asp Asp Val Lys Met Leu 115 120 125 Gly Val Tyr Gly Trp Ala Phe Tyr Ala Leu Pro Ser Val Pro Asp Lys 130 135 140 Gln Glu Asn Gly Thr Ser Thr Asn Phe Ser Asn Gln Ile Glu Tyr Tyr 145 150 155 160 Ile Ile Gln Asp Arg Gly Ser Tyr Asn Ser Ala Thr Gly Gly Thr Asn 165 170 175 Ser Lys Lys Tyr Gly Glu Ala Thr Ile Asp Gly Ile Ala Tyr Glu Phe 180 185 190 Arg Val Cys Asp Arg Ile Gly Gln Pro Met Leu Thr Gly Asn Gly Asn 195 200 205 Phe Lys Gln Tyr Phe Ser Val Pro Lys Ser Thr Ile Asn His Arg Thr 210 215 220 Ser Gly Thr Ile Ser Val Ser Lys His Phe Glu Glu Trp Glu Lys Val 225 230 235 240 Gly Met Lys Met Asp Gly Pro Leu Tyr Glu Val Ala Met Lys Val Glu 245 250 255 Ser Tyr Ser Gly Asn Gly Asn Ser Asn Gly Asn Ala Lys Ile Thr Lys 260 265 270 Asn Ile Leu Thr Ile Gly Gly Thr Thr Thr Thr Gln Ser Ser Ser Ser 275 280 285 Gly Gly Ser Thr Val Pro Asp Glu Cys Gly Glu Tyr Lys Lys Ser Phe 290 295 300 Cys Gly Gly Leu Gly Tyr Gly Ser Val Tyr Ser Asn Leu Thr Ala Ile 305 310 315 320 Pro Ser Thr Gly Asp Cys Leu Tyr Ile Gly Asp Phe Glu Val Ile Gln 325 330 335 Pro Ala Leu Asn Ser Thr Val Ala Ile Asn Gly Val Glu Asn Thr Cys 340 345 350 Gly Ser Glu Trp Ser Asp Cys Pro Tyr Asn Asp Lys Pro Asp Ser Lys 355 360 365 Lys Asp Gly Gly Tyr Tyr Val Tyr Val Lys Thr Gly Ser Ile Asn Asn 370 375 380 Tyr Glu Asn Asn Gly Trp Gln Asn Ile Val Ala Lys Ala Lys Pro Ala 385 390 395 400 Cys Thr Pro Pro Ser Ser Ser Ser Gly Ala Ala Pro Gly Ser Ser Ser 405 410 415 Ser Asp Glu Glu Asp Pro Glu Pro Ile Leu Lys Asn Arg Ile Pro Ile 420 425 430 Thr His Phe Ser Leu Gln Thr Leu Ser Asp Lys Ala Leu Arg Ile Glu 435 440 445 Val Asn Ala Pro Thr Ile Val Asp Ile Phe Asp Leu Arg Gly Asn Lys 450 455 460 Val Lys Ser Leu Asn Val Tyr Gly Ser Gln Arg Val Lys Leu Ser Leu 465 470 475 480 Pro Ser Gly Val Tyr Phe Ala Lys Val Arg Gly Met Lys Ser Val Arg 485 490 495 Phe Val Leu Arg 500 <210> 175 <211> 1053 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 175 atgaagtcca ttcgcagccg cagcctcgcc accgccgtcc tggctggcgc cctcggcgtc 60 gcagccgcag gcgcgcaggc gcagacgctc aacaacaatt ccaccggcac gcacgacggc 120 tactactaca cgttctggaa ggactcgggc agcgcctcga tgaccctcca tccgggcgga 180 cgctacagct cccagtggac cagcaacacc aacaactggg tcggcgggaa aggctggaat 240 cccggtggcc cgcgcgtggt caactactcg ggctactacg gggtcaacaa cagccagaac 300 tcctacctgg cgctgtacgg ctggacccgc aatccgctgg tcgagtacta cgtgatcgag 360 agctacggct cctacaaccc ggccagttgc gccggcgggg tggactacgg cagcttccag 420 agcgatggcg ccacctacaa cgtacgtcgc tgcctgcgcc agaacgcgcc gtcgatcgaa 480 ggcaacaaca gcaccttcta ccagtacttc agcgtgcgca atcccaagaa gggattcggc 540 aacatctccg gcacgatcac cgtcgccaac cacttcaact actgggccag ccgcggcctc 600 aacctcggca accacgacta catggtgttc gccaccgagg gctaccagag ccagggcagc 660 agcgacatca ccgtgagttc gggtaccggc ggcggcggtg gcggcggcaa cacgggcagc 720 aagaccatcg tggtgcgcgc gcgcggcacc gccggcggag agaacatctc gctcaaggtc 780 aacaacgcca ccatcgccag ctggacgctc accaccagca tggccaacta cacggccacc 840 acctcggcat cgggcggctc gctggtggag ttcaccaacg acggcggcaa ccgcgacgtg 900 caggtggact acctcagcgt caatggcgcc gtccgccagg ccgaggacca gacctacaac 960 accggcgtgt accagaacgg ccagtgcggc ggcggcaacg gccgcagcga atggctgcac 1020 tgcaacggtg ccatcggctt cggaaatctc tga 1053 <210> 176 <211> 350 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(27) <400> 176 Met Lys Ser Ile Arg Ser Arg Ser Leu Ala Thr Ala Val Leu Ala Gly 1 5 10 15 Ala Leu Gly Val Ala Ala Ala Gly Ala Gln Ala Gln Thr Leu Asn Asn 20 25 30 Asn Ser Thr Gly Thr His Asp Gly Tyr Tyr Tyr Thr Phe Trp Lys Asp 35 40 45 Ser Gly Ser Ala Ser Met Thr Leu His Pro Gly Gly Arg Tyr Ser Ser 50 55 60 Gln Trp Thr Ser Asn Thr Asn Asn Trp Val Gly Gly Lys Gly Trp Asn 65 70 75 80 Pro Gly Gly Pro Arg Val Val Asn Tyr Ser Gly Tyr Tyr Gly Val Asn 85 90 95 Asn Ser Gln Asn Ser Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Pro 100 105 110 Leu Val Glu Tyr Tyr Val Ile Glu Ser Tyr Gly Ser Tyr Asn Pro Ala 115 120 125 Ser Cys Ala Gly Gly Val Asp Tyr Gly Ser Phe Gln Ser Asp Gly Ala 130 135 140 Thr Tyr Asn Val Arg Arg Cys Leu Arg Gln Asn Ala Pro Ser Ile Glu 145 150 155 160 Gly Asn Asn Ser Thr Phe Tyr Gln Tyr Phe Ser Val Arg Asn Pro Lys 165 170 175 Lys Gly Phe Gly Asn Ile Ser Gly Thr Ile Thr Val Ala Asn His Phe 180 185 190 Asn Tyr Trp Ala Ser Arg Gly Leu Asn Leu Gly Asn His Asp Tyr Met 195 200 205 Val Phe Ala Thr Glu Gly Tyr Gln Ser Gln Gly Ser Ser Asp Ile Thr 210 215 220 Val Ser Ser Gly Thr Gly Gly Gly Gly Gly Gly Gly Asn Thr Gly Ser 225 230 235 240 Lys Thr Ile Val Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Asn Ile 245 250 255 Ser Leu Lys Val Asn Asn Ala Thr Ile Ala Ser Trp Thr Leu Thr Thr 260 265 270 Ser Met Ala Asn Tyr Thr Ala Thr Thr Ser Ala Ser Gly Gly Ser Leu 275 280 285 Val Glu Phe Thr Asn Asp Gly Gly Asn Arg Asp Val Gln Val Asp Tyr 290 295 300 Leu Ser Val Asn Gly Ala Val Arg Gln Ala Glu Asp Gln Thr Tyr Asn 305 310 315 320 Thr Gly Val Tyr Gln Asn Gly Gln Cys Gly Gly Gly Asn Gly Arg Ser 325 330 335 Glu Trp Leu His Cys Asn Gly Ala Ile Gly Phe Gly Asn Leu 340 345 350 <210> 177 <211> 1299 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 177 atgaaattgt tgaaaacgca caggcgtgcg attgctgccg cagcactagc ggtggcgact 60 gttccaatcg ctcatgcgca aacgcttagc tcaaatgcca ctggaaccca gaatggttac 120 tactattcgt tttggaagga ttccggtaac gccaccatga cactcggtgc cggtggaaac 180 tattcttcat cctggaacag cagcactaac aactgggttg gcggtaaagg ctggatgccg 240 ggtactcggc gcacagtcac ctattcgggc agttatagcg cgagtggaac cagctacctc 300 gcactttacg gctggactcg aaacccgctg atcgaatatt acattgtcga aaactgggtc 360 aattacaatc ctgcgtccgg cgcaacgaat tatgggactg tcaatattga cggcagcacc 420 taccagctgg gccgcagcca acgggttaat cagccatcta ttgaaggcac ggccacgttc 480 taccaatact ggagtgtgcg ccaaaacaag cgcaccagcg gaacgattaa tattggagcg 540 catttcgatg catgggctgc tgtgggcttg aacctgggga ctcacgatta tcagattatg 600 gcgaccgagg gctaccagag cagcggccag tccaatatca cggtgagcga aggcagtagc 660 ggcagcacga cttcgagcac atccagctcc agctcaagta cgagttccag tagttcttcc 720 agcagttctt ccggcggcgg cacaggaagt tgtgccggag tgaatgtgta ccccaattgg 780 accgcacgcg actggtctgg cggcgcatac aatcacgcca atgccggtga ccaaatggtc 840 tatcaaaaca atttgtaccg ggcaaactgg tacaccaact ccacgcctgg aagcgatgcc 900 tcctggacca gtctcgggtc ctgtagcggc ggcggtagca ccagttcaac aacgagctcc 960 tccagttcct cttccacctc ggcgtcgagc agctccaact catccagcag cagttcaagc 1020 agctccagca gcggtggctg tcgggaaatg tgtaactggt acggacaggg tatgtatcct 1080 ctgtgtcaga acaccagcgg ttggggatgg gaaaataacc agaactgtat cggtcgccaa 1140 acctgtcaaa gtcagaacgg cggctccggg ggtgtggtga acagctgtgg taccagcagc 1200 tcttcgtcca gtagcacctc ctcatcgagc agttcaagtt cgtcgagtgg caccacgtca 1260 tcgtcctccg gaattcctgc agcccggggg atccactag 1299 <210> 178 <211> 432 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(26) <400> 178 Met Lys Leu Leu Lys Thr His Arg Arg Ala Ile Ala Ala Ala Ala Leu 1 5 10 15 Ala Val Ala Thr Val Pro Ile Ala His Ala Gln Thr Leu Ser Ser Asn 20 25 30 Ala Thr Gly Thr Gln Asn Gly Tyr Tyr Tyr Ser Phe Trp Lys Asp Ser 35 40 45 Gly Asn Ala Thr Met Thr Leu Gly Ala Gly Gly Asn Tyr Ser Ser Ser 50 55 60 Trp Asn Ser Ser Thr Asn Asn Trp Val Gly Gly Lys Gly Trp Met Pro 65 70 75 80 Gly Thr Arg Arg Thr Val Thr Tyr Ser Gly Ser Tyr Ser Ala Ser Gly 85 90 95 Thr Ser Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Pro Leu Ile Glu 100 105 110 Tyr Tyr Ile Val Glu Asn Trp Val Asn Tyr Asn Pro Ala Ser Gly Ala 115 120 125 Thr Asn Tyr Gly Thr Val Asn Ile Asp Gly Ser Thr Tyr Gln Leu Gly 130 135 140 Arg Ser Gln Arg Val Asn Gln Pro Ser Ile Glu Gly Thr Ala Thr Phe 145 150 155 160 Tyr Gln Tyr Trp Ser Val Arg Gln Asn Lys Arg Thr Ser Gly Thr Ile 165 170 175 Asn Ile Gly Ala His Phe Asp Ala Trp Ala Ala Val Gly Leu Asn Leu 180 185 190 Gly Thr His Asp Tyr Gln Ile Met Ala Thr Glu Gly Tyr Gln Ser Ser 195 200 205 Gly Gln Ser Asn Ile Thr Val Ser Glu Gly Ser Ser Gly Ser Thr Thr 210 215 220 Ser Ser Thr Ser Ser Ser Ser Ser Ser Thr Ser Ser Ser Ser Ser Ser 225 230 235 240 Ser Ser Ser Ser Gly Gly Gly Thr Gly Ser Cys Ala Gly Val Asn Val 245 250 255 Tyr Pro Asn Trp Thr Ala Arg Asp Trp Ser Gly Gly Ala Tyr Asn His 260 265 270 Ala Asn Ala Gly Asp Gln Met Val Tyr Gln Asn Asn Leu Tyr Arg Ala 275 280 285 Asn Trp Tyr Thr Asn Ser Thr Pro Gly Ser Asp Ala Ser Trp Thr Ser 290 295 300 Leu Gly Ser Cys Ser Gly Gly Gly Ser Thr Ser Ser Thr Thr Ser Ser 305 310 315 320 Ser Ser Ser Ser Ser Thr Ser Ala Ser Ser Ser Ser Asn Ser Ser Ser 325 330 335 Ser Ser Ser Ser Ser Ser Ser Ser Gly Gly Cys Arg Glu Met Cys Asn 340 345 350 Trp Tyr Gly Gln Gly Met Tyr Pro Leu Cys Gln Asn Thr Ser Gly Trp 355 360 365 Gly Trp Glu Asn Asn Gln Asn Cys Ile Gly Arg Gln Thr Cys Gln Ser 370 375 380 Gln Asn Gly Gly Ser Gly Gly Val Val Asn Ser Cys Gly Thr Ser Ser 385 390 395 400 Ser Ser Ser Ser Ser Thr Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser 405 410 415 Gly Thr Thr Ser Ser Ser Ser Gly Ile Pro Ala Ala Arg Gly Ile His 420 425 430 <210> 179 <211> 852 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 179 atgaagaatt ggccgggaac gggtattata ttattattgg cgggcggcct tttggcggct 60 tgtttgacgg gcaaacggca agaggggcaa aaagtggatc cggatactca aaacgagaaa 120 ttgacaggcg ggaccgtgtt tacagctaac agcaggggga acaggcccct ggaaggttcg 180 ccttatggtt acgaaatgtg gacgcagggc gggaataata acaagcttgt ttggttcggg 240 ccggatcagg ggggaggggc ggctttcagg gcagaatgga acgagccgga tgattttttg 300 ggacgactgg gtttctggtg gggaaacggc gggcaattta aagaatataa aaatatgtac 360 gcggatttca attacacaag gtcggggcgc ggcaccggcg gcagttattc ttatataggc 420 atttacggct gggcgagaaa cccgaacgcc gcgaacgagg aagacaggtt aatagaatac 480 tatattgtgg acgactggtt cgggaatcaa tggcagtccg acgacacccc cattaccaca 540 agaacaacag gaggctccgt attgggtacc attatagcgg acggcgcgtt ttacaacgtc 600 gtcaggaatg tgagaaccca aaagccttcg atagacggca tcaaaacatt cgcccaatac 660 ttcagcatac gccaaacacc gcgccaaagc gggacaatct ccatcaccga acatttcaaa 720 caatgggaaa gcatgggcct gaagctcgga aatatgtacg aggcaaaatt cctggtagaa 780 gccggcggcg gcaccggctg gctggagttt acgtatctta aactgacgca ggaagaaaaa 840 aaaagaaatt ag 852 <210> 180 <211> 283 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(19) <400> 180 Met Lys Asn Trp Pro Gly Thr Gly Ile Ile Leu Leu Leu Ala Gly Gly 1 5 10 15 Leu Leu Ala Ala Cys Leu Thr Gly Lys Arg Gln Glu Gly Gln Lys Val 20 25 30 Asp Pro Asp Thr Gln Asn Glu Lys Leu Thr Gly Gly Thr Val Phe Thr 35 40 45 Ala Asn Ser Arg Gly Asn Arg Pro Leu Glu Gly Ser Pro Tyr Gly Tyr 50 55 60 Glu Met Trp Thr Gln Gly Gly Asn Asn Asn Lys Leu Val Trp Phe Gly 65 70 75 80 Pro Asp Gln Gly Gly Gly Ala Ala Phe Arg Ala Glu Trp Asn Glu Pro 85 90 95 Asp Asp Phe Leu Gly Arg Leu Gly Phe Trp Trp Gly Asn Gly Gly Gln 100 105 110 Phe Lys Glu Tyr Lys Asn Met Tyr Ala Asp Phe Asn Tyr Thr Arg Ser 115 120 125 Gly Arg Gly Thr Gly Gly Ser Tyr Ser Tyr Ile Gly Ile Tyr Gly Trp 130 135 140 Ala Arg Asn Pro Asn Ala Ala Asn Glu Glu Asp Arg Leu Ile Glu Tyr 145 150 155 160 Tyr Ile Val Asp Asp Trp Phe Gly Asn Gln Trp Gln Ser Asp Asp Thr 165 170 175 Pro Ile Thr Thr Arg Thr Thr Gly Gly Ser Val Leu Gly Thr Ile Ile 180 185 190 Ala Asp Gly Ala Phe Tyr Asn Val Val Arg Asn Val Arg Thr Gln Lys 195 200 205 Pro Ser Ile Asp Gly Ile Lys Thr Phe Ala Gln Tyr Phe Ser Ile Arg 210 215 220 Gln Thr Pro Arg Gln Ser Gly Thr Ile Ser Ile Thr Glu His Phe Lys 225 230 235 240 Gln Trp Glu Ser Met Gly Leu Lys Leu Gly Asn Met Tyr Glu Ala Lys 245 250 255 Phe Leu Val Glu Ala Gly Gly Gly Thr Gly Trp Leu Glu Phe Thr Tyr 260 265 270 Leu Lys Leu Thr Gln Glu Glu Lys Lys Arg Asn 275 280 <210> 181 <211> 1077 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 181 atgaacttca gtctcaggaa ggctgcagcg gcgctggctt gcgtcgcggg cctgtatgca 60 tcatcggcgg gcgctcagac ctgcctgacc aacaaccaga ccggcaacaa cggcgggtac 120 tactactcgt tctggaagga cagcggcaac gtcaccttct gcctgcagtc cggcgggcga 180 tacacgtccc agtggagcaa cgtcaacaac tgggtgggcg gcaagggctg gaacccgggt 240 gggcgacgca ccgtcaccta ttccggcacc tacaacccca atggcaattc gtacctgacc 300 ctgtacggct ggaccacgaa tccactggtc gagtactaca tcgtcgacag ctggggttcc 360 tggcgcccac cgggctcggg atacatgggc acggtcacca gcgatggcgg cacctacgac 420 atctatcgca cgcagcgtgt gaaccagcct tccatcatcg gcaccgcgac gttctaccaa 480 tactggagcg tgcggcaatc gaagcgcgtg ggtggcacca tcacctcggg caatcacttc 540 gatgcctggg cctcgctggg catgaacctc ggcacgcaca actacatggt gatggccacc 600 gagggctacc agagcagcgg cagctcggac atcacggtgg gcagcggcag ttcgtcgtcg 660 agcagcagct cgtccagcag tagcagctcg tcgtccagta gcagcagcag ttcttcgtcc 720 agcagcagcg gtggcggcgg caccaagagc ttcaccgtgc gcgcacgcgg cacggcgggt 780 ggcgagtcca tcaccttgcg ggtgaacaac cagaacgtgc agacctggac gctgggcacc 840 agcatgcaga actacacggc gtccacctcg ctgagcggcg gcatcacggt ggccttcacc 900 aacgacggcg gcaaccgcga cgtccaggtg gattacatca tcgtgaatgg ccagacgcgc 960 cagtccgagg cgcagaccta caacaccggc ctgtatgcca atggccgctg cggtggtggc 1020 tctaacagcg agtggatgca ctgcaacggc gccatcggct acggcaacac gccctag 1077 <210> 182 <211> 358 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(25) <400> 182 Met Asn Phe Ser Leu Arg Lys Ala Ala Ala Ala Leu Ala Cys Val Ala 1 5 10 15 Gly Leu Tyr Ala Ser Ser Ala Gly Ala Gln Thr Cys Leu Thr Asn Asn 20 25 30 Gln Thr Gly Asn Asn Gly Gly Tyr Tyr Tyr Ser Phe Trp Lys Asp Ser 35 40 45 Gly Asn Val Thr Phe Cys Leu Gln Ser Gly Gly Arg Tyr Thr Ser Gln 50 55 60 Trp Ser Asn Val Asn Asn Trp Val Gly Gly Lys Gly Trp Asn Pro Gly 65 70 75 80 Gly Arg Arg Thr Val Thr Tyr Ser Gly Thr Tyr Asn Pro Asn Gly Asn 85 90 95 Ser Tyr Leu Thr Leu Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr 100 105 110 Tyr Ile Val Asp Ser Trp Gly Ser Trp Arg Pro Pro Gly Ser Gly Tyr 115 120 125 Met Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Arg Thr 130 135 140 Gln Arg Val Asn Gln Pro Ser Ile Ile Gly Thr Ala Thr Phe Tyr Gln 145 150 155 160 Tyr Trp Ser Val Arg Gln Ser Lys Arg Val Gly Gly Thr Ile Thr Ser 165 170 175 Gly Asn His Phe Asp Ala Trp Ala Ser Leu Gly Met Asn Leu Gly Thr 180 185 190 His Asn Tyr Met Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser 195 200 205 Ser Asp Ile Thr Val Gly Ser Gly Ser Ser Ser Ser Ser Ser Ser Ser 210 215 220 Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser 225 230 235 240 Ser Ser Ser Gly Gly Gly Gly Thr Lys Ser Phe Thr Val Arg Ala Arg 245 250 255 Gly Thr Ala Gly Gly Glu Ser Ile Thr Leu Arg Val Asn Asn Gln Asn 260 265 270 Val Gln Thr Trp Thr Leu Gly Thr Ser Met Gln Asn Tyr Thr Ala Ser 275 280 285 Thr Ser Leu Ser Gly Gly Ile Thr Val Ala Phe Thr Asn Asp Gly Gly 290 295 300 Asn Arg Asp Val Gln Val Asp Tyr Ile Ile Val Asn Gly Gln Thr Arg 305 310 315 320 Gln Ser Glu Ala Gln Thr Tyr Asn Thr Gly Leu Tyr Ala Asn Gly Arg 325 330 335 Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys Asn Gly Ala Ile 340 345 350 Gly Tyr Gly Asn Thr Pro 355 <210> 183 <211> 1083 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 183 atgatcgaag gtctcaggag acctgccttc agtggcagga gcatcgtcaa ggcattgctc 60 tgcgtcgcgg ccctgtatgc atcggcggcg caggcgcaga cctgtctcag ttcgagccag 120 accggcacca acaacggctt ctactattcg ttctggaagg acagcccggg cagcgtgcag 180 ttctgcatgt attccggcgg ccgctacaca tccaactgga gcggcatcaa caactgggtc 240 ggcggcaagg ggtggcagac cggcgcctcg cgcgtggtca gctactcggg cacgttcaat 300 tcaccgggca acggctacct ggcgctgtac ggctggacca ccaatccact ggtcgagtac 360 tacatcgtcg acaactgggg cacctatcgc ccgccgggcg gcacgggatt ccagggcacg 420 gtgaccagtg acggcggtac ctacgacatc taccggaccg agcgcaccaa cgcgccctgc 480 atcaccggca acaactgcaa cttctcgcag ttctggagcg tgcggcagtc gaagcgcacc 540 ggcggcacca tcaccaccgg caatcacttc agcgcctggg cgtcgcacgg catgaacatg 600 ggccagcaca actaccagat catggccacc gagggttacc agagcaacgg cagctcggac 660 atcacggtct cggaaggcag cagttcgtcg agcagcagca gttcgtcctc ttcgtcgagc 720 agcagctcgt cgagcggcgg cggcggcagc aagagcttca cggtgcgcgc ccgcggcacc 780 gcgggtggcg agcagatccg gctgcgcgtg aacaatacga ccgtgcagac ctggacgctg 840 aacaccacga tgacgaacta caccgcttcg accacgctga gcggcggcat cacggtggag 900 tacttcaacg acagcaccaa tcacgacgtg caggtggact acatcatcgt gaacggcgcg 960 acgcgccagt ccgaagcgca gagctacaac accggcctgt atgccaacgg ccgttgcggt 1020 ggcggttcca acagcgaatg gatgcattgc aatggcgcca tcggctacgg caacactcca 1080 taa 1083 <210> 184 <211> 360 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(32) <400> 184 Met Ile Glu Gly Leu Arg Arg Pro Ala Phe Ser Gly Arg Ser Ile Val 1 5 10 15 Lys Ala Leu Leu Cys Val Ala Ala Leu Tyr Ala Ser Ala Ala Gln Ala 20 25 30 Gln Thr Cys Leu Ser Ser Ser Gln Thr Gly Thr Asn Asn Gly Phe Tyr 35 40 45 Tyr Ser Phe Trp Lys Asp Ser Pro Gly Ser Val Gln Phe Cys Met Tyr 50 55 60 Ser Gly Gly Arg Tyr Thr Ser Asn Trp Ser Gly Ile Asn Asn Trp Val 65 70 75 80 Gly Gly Lys Gly Trp Gln Thr Gly Ala Ser Arg Val Val Ser Tyr Ser 85 90 95 Gly Thr Phe Asn Ser Pro Gly Asn Gly Tyr Leu Ala Leu Tyr Gly Trp 100 105 110 Thr Thr Asn Pro Leu Val Glu Tyr Tyr Ile Val Asp Asn Trp Gly Thr 115 120 125 Tyr Arg Pro Pro Gly Gly Thr Gly Phe Gln Gly Thr Val Thr Ser Asp 130 135 140 Gly Gly Thr Tyr Asp Ile Tyr Arg Thr Glu Arg Thr Asn Ala Pro Cys 145 150 155 160 Ile Thr Gly Asn Asn Cys Asn Phe Ser Gln Phe Trp Ser Val Arg Gln 165 170 175 Ser Lys Arg Thr Gly Gly Thr Ile Thr Thr Gly Asn His Phe Ser Ala 180 185 190 Trp Ala Ser His Gly Met Asn Met Gly Gln His Asn Tyr Gln Ile Met 195 200 205 Ala Thr Glu Gly Tyr Gln Ser Asn Gly Ser Ser Asp Ile Thr Val Ser 210 215 220 Glu Gly Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser 225 230 235 240 Ser Ser Ser Ser Ser Gly Gly Gly Gly Ser Lys Ser Phe Thr Val Arg 245 250 255 Ala Arg Gly Thr Ala Gly Gly Glu Gln Ile Arg Leu Arg Val Asn Asn 260 265 270 Thr Thr Val Gln Thr Trp Thr Leu Asn Thr Thr Met Thr Asn Tyr Thr 275 280 285 Ala Ser Thr Thr Leu Ser Gly Gly Ile Thr Val Glu Tyr Phe Asn Asp 290 295 300 Ser Thr Asn His Asp Val Gln Val Asp Tyr Ile Ile Val Asn Gly Ala 305 310 315 320 Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly Leu Tyr Ala Asn 325 330 335 Gly Arg Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys Asn Gly 340 345 350 Ala Ile Gly Tyr Gly Asn Thr Pro 355 360 <210> 185 <211> 684 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 185 atgaatttga aaagattgag gctgttgttt gtgatgtgta ttggatttgt gctgacactg 60 acggctgtgc cagctcatgc ggaaacgatt tatgataata ggatagggac acacagcgga 120 tacgattttg aattatggaa ggattacgga aatacctcga tgacactcaa taacggcggg 180 gcatttagtg caagctggaa caatattgga aatgccttat ttcgaaaagg aaagaagttt 240 gattccacta aaactcatca tcaacttggc aacatctcca tcaactacaa cgcagccttt 300 aacccgggcg ggaattccta tttatgtgtc tatggctgga cacaatctcc attagctgaa 360 tactacattg ttgagtcatg gggcacatat cgtccaacag gaacgtataa aggatcattt 420 tatgccgatg gaggcacata tgacatatat gaaacgctcc gtgtcaatca gccttctatc 480 attggagacg ctaccttcaa acaatattgg agtgtacgtc aaacaaaacg cacaagcgga 540 actgtttccg tcagtgagca ttttaaaaaa tgggaaagct taggcatgcc aatgggaaaa 600 atgtatgaaa cagcattaac tgtagaaggc taccgaagca acggaagtgc gaatgtcatg 660 acgaatcagc tgatgattcg ataa 684 <210> 186 <211> 227 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(27) <400> 186 Met Asn Leu Lys Arg Leu Arg Leu Leu Phe Val Met Cys Ile Gly Phe 1 5 10 15 Val Leu Thr Leu Thr Ala Val Pro Ala His Ala Glu Thr Ile Tyr Asp 20 25 30 Asn Arg Ile Gly Thr His Ser Gly Tyr Asp Phe Glu Leu Trp Lys Asp 35 40 45 Tyr Gly Asn Thr Ser Met Thr Leu Asn Asn Gly Gly Ala Phe Ser Ala 50 55 60 Ser Trp Asn Asn Ile Gly Asn Ala Leu Phe Arg Lys Gly Lys Lys Phe 65 70 75 80 Asp Ser Thr Lys Thr His His Gln Leu Gly Asn Ile Ser Ile Asn Tyr 85 90 95 Asn Ala Ala Phe Asn Pro Gly Gly Asn Ser Tyr Leu Cys Val Tyr Gly 100 105 110 Trp Thr Gln Ser Pro Leu Ala Glu Tyr Tyr Ile Val Glu Ser Trp Gly 115 120 125 Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Ser Phe Tyr Ala Asp Gly 130 135 140 Gly Thr Tyr Asp Ile Tyr Glu Thr Leu Arg Val Asn Gln Pro Ser Ile 145 150 155 160 Ile Gly Asp Ala Thr Phe Lys Gln Tyr Trp Ser Val Arg Gln Thr Lys 165 170 175 Arg Thr Ser Gly Thr Val Ser Val Ser Glu His Phe Lys Lys Trp Glu 180 185 190 Ser Leu Gly Met Pro Met Gly Lys Met Tyr Glu Thr Ala Leu Thr Val 195 200 205 Glu Gly Tyr Arg Ser Asn Gly Ser Ala Asn Val Met Thr Asn Gln Leu 210 215 220 Met Ile Arg 225 <210> 187 <211> 642 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 187 atgtttaagt ttaaaaagaa tttcttagtt ggattatcgg cagctttaat gagtattagc 60 ttgttttcgg caaccgcctc tgcagctagc acagactact ggcaaaattg gactgatggg 120 ggcggtatag taaacgctgt caatgggtct ggcgggaatt acagtgttaa ttggtctaat 180 accggaaatt ttgttgttgg taaaggttgg actacaggtt cgccatttag gacgataaac 240 tataatgccg gagtttgggc gccgaatggc aatggatatt taactttata tggttggacg 300 agatcacctc tcatagaata ttatgtagtg gattcatggg gtacttatag acctactgga 360 acgtataaag gtactgtaaa aagtgatggg ggtacatatg acatatatac aactacacgt 420 tataacgcac cttccattga tggcgatcgc actactttta cgcagtactg gagtgttcgc 480 cagtcgaaga gaccaaccgg aagcaacgct acaatcactt tcagcaatca tgtgaacgca 540 tggaagagcc atggaatgaa tctgggcagt aattgggctt accaagtcat ggcgacagaa 600 ggatatcaaa gtagtggaag ttctaacgta acagtgtggt aa 642 <210> 188 <211> 213 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(28) <400> 188 Met Phe Lys Phe Lys Lys Asn Phe Leu Val Gly Leu Ser Ala Ala Leu 1 5 10 15 Met Ser Ile Ser Leu Phe Ser Ala Thr Ala Ser Ala Ala Ser Thr Asp 20 25 30 Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Ile Val Asn Ala Val Asn 35 40 45 Gly Ser Gly Gly Asn Tyr Ser Val Asn Trp Ser Asn Thr Gly Asn Phe 50 55 60 Val Val Gly Lys Gly Trp Thr Thr Gly Ser Pro Phe Arg Thr Ile Asn 65 70 75 80 Tyr Asn Ala Gly Val Trp Ala Pro Asn Gly Asn Gly Tyr Leu Thr Leu 85 90 95 Tyr Gly Trp Thr Arg Ser Pro Leu Ile Glu Tyr Tyr Val Val Asp Ser 100 105 110 Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Thr Val Lys Ser 115 120 125 Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr Arg Tyr Asn Ala Pro 130 135 140 Ser Ile Asp Gly Asp Arg Thr Thr Phe Thr Gln Tyr Trp Ser Val Arg 145 150 155 160 Gln Ser Lys Arg Pro Thr Gly Ser Asn Ala Thr Ile Thr Phe Ser Asn 165 170 175 His Val Asn Ala Trp Lys Ser His Gly Met Asn Leu Gly Ser Asn Trp 180 185 190 Ala Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser Ser 195 200 205 Asn Val Thr Val Trp 210 <210> 189 <211> 570 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 189 atggccctta tggcttcgac agactactgg caaaattgga ctgatggtgg tgggacagta 60 aatgctacca atggatctga tggcaattac agcgtttcat ggtcaaattg cgggaatttt 120 gttgttggta aaggctggac taccggatca gcaactaggg taataaacta taatgccgga 180 gccttttcgc cgtccggtaa tggatatttg gctctttatg ggtggacgag aaattcactc 240 atagaatatt acgtcgttga tagctggggg acttatagac ctactggaac ttataaaggc 300 actgtgacta gtgatggagg gacttatgac atatacacga ctacacgaac caacgcacct 360 tccattgacg gcaataatac aactttcacc cagttctgga gtgttaggca gtcgaagaga 420 ccgattggta ccaacaatac catcaccttt agcaaccatg ttaacgcctg gaagagtaaa 480 ggaatgaatt tggggagtag ttggtcttat caggtattag caacagaggg ctatcaaagt 540 agtgggtact ctaacgtaac ggtctggtaa 570 <210> 190 <211> 189 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 190 Met Ala Leu Met Ala Ser Thr Asp Tyr Trp Gln Asn Trp Thr Asp Gly 1 5 10 15 Gly Gly Thr Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val 20 25 30 Ser Trp Ser Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr 35 40 45 Gly Ser Ala Thr Arg Val Ile Asn Tyr Asn Ala Gly Ala Phe Ser Pro 50 55 60 Ser Gly Asn Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu 65 70 75 80 Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly 85 90 95 Thr Tyr Lys Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr 100 105 110 Thr Thr Thr Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr 115 120 125 Phe Thr Gln Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr 130 135 140 Asn Asn Thr Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys 145 150 155 160 Gly Met Asn Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu 165 170 175 Gly Tyr Gln Ser Ser Gly Tyr Ser Asn Val Thr Val Trp 180 185 <210> 191 <211> 1053 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 191 atgaagtcca ttcgcagccg cagcctcgcc accgccgtcc tggctggcgc cctcggcgtc 60 gcagccgccg gcgcgcaggc gcagacgctc aacaacaatt ccaccggcac gcacgacggc 120 ttctactaca cgttctggaa ggactcgggc agcgcctcga tgaccctcca tccgggcgga 180 cgctacagct cccagtggac cagcaacacc aacaactggg tcggcgggaa aggctggaat 240 cccggtggcc cgcgcgtggt caactactcg ggctactacg gggtcaacaa cagccagaac 300 tcctacctgg cgctgtacgg ctggacccgc aatccgctgg tcgagtacta cgtgatcgag 360 agctacggct cctacaaccc ggccagttgc gccggcgggg tggactacgg cagcttccag 420 agcgatggcg ccacctacaa cgtacgccgc tgcctgcgcc agaacgcgcc gtcgatcgaa 480 ggcaacaaca gcaccttcta ccagtacttc agcgtgcgca atcccaagaa gggattcggc 540 aacatctccg gcacgatcac cgtcgccaac cacttcaact actgggccag ccgcggcctc 600 aacctcggca accacgacta catggtgttc gccaccgagg gctaccagag ccagggcagc 660 agcgacatca ccgtgagttc gggtaccggc ggcggcggtg gcggcggcaa cacgggcagc 720 aagaccatcg tggtgcgcgc gcgcggcacc gccggcggag agaacatctc gctcaaggtc 780 aacaacgcca ccatcgccag ctggacgctc accaccagca tggccaacta cacggccacc 840 acctcggcat cgggcggctc gctggtggag ttcaccaacg acggcggcaa ccgcgacgtg 900 caggtggact acctcagcgt caatggcgcc gtccgccagg ccgaggacca gacctacaac 960 accggcgtgt accagaacgg ccagtgcggc ggcggcaacg gccgcagcga atggctgcac 1020 tgcaacggtg ccatcggctt cggaaatctc tga 1053 <210> 192 <211> 350 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(27) <400> 192 Met Lys Ser Ile Arg Ser Arg Ser Leu Ala Thr Ala Val Leu Ala Gly 1 5 10 15 Ala Leu Gly Val Ala Ala Ala Gly Ala Gln Ala Gln Thr Leu Asn Asn 20 25 30 Asn Ser Thr Gly Thr His Asp Gly Phe Tyr Tyr Thr Phe Trp Lys Asp 35 40 45 Ser Gly Ser Ala Ser Met Thr Leu His Pro Gly Gly Arg Tyr Ser Ser 50 55 60 Gln Trp Thr Ser Asn Thr Asn Asn Trp Val Gly Gly Lys Gly Trp Asn 65 70 75 80 Pro Gly Gly Pro Arg Val Val Asn Tyr Ser Gly Tyr Tyr Gly Val Asn 85 90 95 Asn Ser Gln Asn Ser Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Pro 100 105 110 Leu Val Glu Tyr Tyr Val Ile Glu Ser Tyr Gly Ser Tyr Asn Pro Ala 115 120 125 Ser Cys Ala Gly Gly Val Asp Tyr Gly Ser Phe Gln Ser Asp Gly Ala 130 135 140 Thr Tyr Asn Val Arg Arg Cys Leu Arg Gln Asn Ala Pro Ser Ile Glu 145 150 155 160 Gly Asn Asn Ser Thr Phe Tyr Gln Tyr Phe Ser Val Arg Asn Pro Lys 165 170 175 Lys Gly Phe Gly Asn Ile Ser Gly Thr Ile Thr Val Ala Asn His Phe 180 185 190 Asn Tyr Trp Ala Ser Arg Gly Leu Asn Leu Gly Asn His Asp Tyr Met 195 200 205 Val Phe Ala Thr Glu Gly Tyr Gln Ser Gln Gly Ser Ser Asp Ile Thr 210 215 220 Val Ser Ser Gly Thr Gly Gly Gly Gly Gly Gly Gly Asn Thr Gly Ser 225 230 235 240 Lys Thr Ile Val Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Asn Ile 245 250 255 Ser Leu Lys Val Asn Asn Ala Thr Ile Ala Ser Trp Thr Leu Thr Thr 260 265 270 Ser Met Ala Asn Tyr Thr Ala Thr Thr Ser Ala Ser Gly Gly Ser Leu 275 280 285 Val Glu Phe Thr Asn Asp Gly Gly Asn Arg Asp Val Gln Val Asp Tyr 290 295 300 Leu Ser Val Asn Gly Ala Val Arg Gln Ala Glu Asp Gln Thr Tyr Asn 305 310 315 320 Thr Gly Val Tyr Gln Asn Gly Gln Cys Gly Gly Gly Asn Gly Arg Ser 325 330 335 Glu Trp Leu His Cys Asn Gly Ala Ile Gly Phe Gly Asn Leu 340 345 350 <210> 193 <211> 840 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 193 atgacgaagt atcggttagg aataggtatt ttcattttgt tggtttgttg cttttcggcg 60 gcatgtattg tgcctaaaca acaagaggaa caaaaagtgg ctcctacaga attgaccggc 120 gcgataacat tcacagccaa cagcaacgga aacaagcccc tgaacggctc gccctacggt 180 tacgaaatat ggacacaggg cgggaccaat aacaaactga tctggttcgg gccggatcag 240 ggcggcggcg cggctttcag agccgaatgg aacaacccta acgatttttt aggccgcgtg 300 ggtttttact ggggtaatgg cggaaaatat accgagtaca aaaatatgta tgcggatttt 360 agctacacta gatctggacg caacaccgcc ggtaattatt catatatagg gatttatggc 420 tgggctagaa atccaaatgc cgcaaaagaa gaagacaaat tgatagagta ttatattgtg 480 gaagattggt ttggcaatca atggcaagag gatagctcac ccattaccac taatacaaca 540 agtggaaccg tattgggaag ttttactata gatggcgcgg tttataatgt cgttagaaat 600 gtcagagtcc aacaaccttc gatagacgga accaaaacat tcacccaata cttcagcata 660 cgacaaacgc cccgacagag cgggacaatt tccattaccg ggcatttcag gcaatgggag 720 agcatgggtt tacagcttgg caatatgtac gaggcaaagt ttcttgttga agccggcggc 780 ggcacaggat ggctggaatt ttcatacctt aaattaacga tggaagacag cttaaggtaa 840 <210> 194 <211> 279 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(21) <400> 194 Met Thr Lys Tyr Arg Leu Gly Ile Gly Ile Phe Ile Leu Leu Val Cys 1 5 10 15 Cys Phe Ser Ala Ala Cys Ile Val Pro Lys Gln Gln Glu Glu Gln Lys 20 25 30 Val Ala Pro Thr Glu Leu Thr Gly Ala Ile Thr Phe Thr Ala Asn Ser 35 40 45 Asn Gly Asn Lys Pro Leu Asn Gly Ser Pro Tyr Gly Tyr Glu Ile Trp 50 55 60 Thr Gln Gly Gly Thr Asn Asn Lys Leu Ile Trp Phe Gly Pro Asp Gln 65 70 75 80 Gly Gly Gly Ala Ala Phe Arg Ala Glu Trp Asn Asn Pro Asn Asp Phe 85 90 95 Leu Gly Arg Val Gly Phe Tyr Trp Gly Asn Gly Gly Lys Tyr Thr Glu 100 105 110 Tyr Lys Asn Met Tyr Ala Asp Phe Ser Tyr Thr Arg Ser Gly Arg Asn 115 120 125 Thr Ala Gly Asn Tyr Ser Tyr Ile Gly Ile Tyr Gly Trp Ala Arg Asn 130 135 140 Pro Asn Ala Ala Lys Glu Glu Asp Lys Leu Ile Glu Tyr Tyr Ile Val 145 150 155 160 Glu Asp Trp Phe Gly Asn Gln Trp Gln Glu Asp Ser Ser Pro Ile Thr 165 170 175 Thr Asn Thr Thr Ser Gly Thr Val Leu Gly Ser Phe Thr Ile Asp Gly 180 185 190 Ala Val Tyr Asn Val Val Arg Asn Val Arg Val Gln Gln Pro Ser Ile 195 200 205 Asp Gly Thr Lys Thr Phe Thr Gln Tyr Phe Ser Ile Arg Gln Thr Pro 210 215 220 Arg Gln Ser Gly Thr Ile Ser Ile Thr Gly His Phe Arg Gln Trp Glu 225 230 235 240 Ser Met Gly Leu Gln Leu Gly Asn Met Tyr Glu Ala Lys Phe Leu Val 245 250 255 Glu Ala Gly Gly Gly Thr Gly Trp Leu Glu Phe Ser Tyr Leu Lys Leu 260 265 270 Thr Met Glu Asp Ser Leu Arg 275 <210> 195 <211> 1044 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 195 atgttcaatc tgaagagagt ggcggcgctc ctgtgcgtcg cagggctggg ggtgtctgcg 60 gcaaatgcgc agacctgtct caattcgagt gggaccggca ccaacaacgg cttctattat 120 tccttctgga aagacagtcc gggttcagtg aatttctgca tgtactccgg cggtcgctac 180 acgtcgagct ggagcggcat caacaactgg gtcggcggca agggctggca aaccggatcg 240 cgccggacca tcaactactc cggcagcttc aactcgccgg gcaatggcta cctcgcgctc 300 tacggatgga ccaccaatcc actcgtcgag tactacatcg tcgacaactg gggcacgtat 360 cgtccgcccg gcggccaggg ctacatgggc acggtcacga gcgacggcgc cacgtacgac 420 gtctatcgaa cgcaacgagt cgatgcgccg tcgatcattg gtgatcacca gaccttctat 480 caatactgga gcgtgcgtca gtcgaagagg accggcggaa ccatcaccac cggcaaccac 540 ttcgatggct gggcgagcta cggcatgaac ctgggaactc acaactacca gatcctggcg 600 accgagggtt atcaaagcag cggcagctcg gacctcaccg tgagcgaagg cagcagcagt 660 agcagcagcg gtggcgggag cagttcgagc agcagcggcg gcggtggcac caagagcttc 720 acggtccgcg cgcgcggcac ggccggtgga gagtcgatca cgttgcgcgt gaataaccag 780 aacgtgcaga cctggacgct cggcacgagc atgacgaact acacggcgtc gacgtcgctg 840 agcggcggca tcaccgtggc gttcacgaac gacggtggca accgcgatgt tcaggtggac 900 tacatcatcg tgaacggcca gacacgccag tcggaagcgc agagctacaa caccgggctc 960 tacgcgaatg gacgttgcgg cggtggctcg aacagcgagt ggatgcactg caacggcgcg 1020 attggctacg gaaacacgcc gtaa 1044 <210> 196 <211> 347 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(23) <400> 196 Met Phe Asn Leu Lys Arg Val Ala Ala Leu Leu Cys Val Ala Gly Leu 1 5 10 15 Gly Val Ser Ala Ala Asn Ala Gln Thr Cys Leu Asn Ser Ser Gly Thr 20 25 30 Gly Thr Asn Asn Gly Phe Tyr Tyr Ser Phe Trp Lys Asp Ser Pro Gly 35 40 45 Ser Val Asn Phe Cys Met Tyr Ser Gly Gly Arg Tyr Thr Ser Ser Trp 50 55 60 Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly Ser 65 70 75 80 Arg Arg Thr Ile Asn Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn Gly 85 90 95 Tyr Leu Ala Leu Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr Tyr 100 105 110 Ile Val Asp Asn Trp Gly Thr Tyr Arg Pro Pro Gly Gly Gln Gly Tyr 115 120 125 Met Gly Thr Val Thr Ser Asp Gly Ala Thr Tyr Asp Val Tyr Arg Thr 130 135 140 Gln Arg Val Asp Ala Pro Ser Ile Ile Gly Asp His Gln Thr Phe Tyr 145 150 155 160 Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Thr Gly Gly Thr Ile Thr 165 170 175 Thr Gly Asn His Phe Asp Gly Trp Ala Ser Tyr Gly Met Asn Leu Gly 180 185 190 Thr His Asn Tyr Gln Ile Leu Ala Thr Glu Gly Tyr Gln Ser Ser Gly 195 200 205 Ser Ser Asp Leu Thr Val Ser Glu Gly Ser Ser Ser Ser Ser Ser Gly 210 215 220 Gly Gly Ser Ser Ser Ser Ser Ser Gly Gly Gly Gly Thr Lys Ser Phe 225 230 235 240 Thr Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Ser Ile Thr Leu Arg 245 250 255 Val Asn Asn Gln Asn Val Gln Thr Trp Thr Leu Gly Thr Ser Met Thr 260 265 270 Asn Tyr Thr Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val Ala Phe 275 280 285 Thr Asn Asp Gly Gly Asn Arg Asp Val Gln Val Asp Tyr Ile Ile Val 290 295 300 Asn Gly Gln Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly Leu 305 310 315 320 Tyr Ala Asn Gly Arg Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His 325 330 335 Cys Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro 340 345 <210> 197 <211> 636 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 197 atgtttaagt tcagtaagaa aatgatgacg gttattcttg cagctaccat gagttttggt 60 ttatttgcaa caacctcaag tgcagcaacc gactattggc aaaattggac cgatggcggc 120 ggaacggtta atgctgtaaa cggctccggc ggtaattaca gcgtgacatg gcaaaatacc 180 ggaaattttg tcgtcggcaa aggctggaat accggatcgc ctaaccgaac cattaactac 240 aatgccggcg tctgggcgcc ttccggcaat gggtatttga ctctctacgg atggacgaga 300 aacgcactca ttgaatatta cgtcgtggat agctggggta cttatcggcc tacaggaaca 360 tataaaggga cggtgacaag tgatgggggc acatatgata tctatacgac catgcggcac 420 aacgcgcctt ccattgacgg aactcaaacg tttgcccagt actggagtgt tcgacaatcg 480 aaaagagcga ccggggtcaa ctcctccatt acgttcagca accacgtgaa cgcatgggct 540 agcaagggaa tgaatctggg aagcagctgg tcatatcagg tgttagctac agagggttat 600 caaagtagcg gaagctctaa cgtaacagtg tggtaa 636 <210> 198 <211> 211 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(28) <400> 198 Met Phe Lys Phe Ser Lys Lys Met Met Thr Val Ile Leu Ala Ala Thr 1 5 10 15 Met Ser Phe Gly Leu Phe Ala Thr Thr Ser Ser Ala Ala Thr Asp Tyr 20 25 30 Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr Val Asn Ala Val Asn Gly 35 40 45 Ser Gly Gly Asn Tyr Ser Val Thr Trp Gln Asn Thr Gly Asn Phe Val 50 55 60 Val Gly Lys Gly Trp Asn Thr Gly Ser Pro Asn Arg Thr Ile Asn Tyr 65 70 75 80 Asn Ala Gly Val Trp Ala Pro Ser Gly Asn Gly Tyr Leu Thr Leu Tyr 85 90 95 Gly Trp Thr Arg Asn Ala Leu Ile Glu Tyr Tyr Val Val Asp Ser Trp 100 105 110 Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Thr Val Thr Ser Asp 115 120 125 Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Met Arg His Asn Ala Pro Ser 130 135 140 Ile Asp Gly Thr Gln Thr Phe Ala Gln Tyr Trp Ser Val Arg Gln Ser 145 150 155 160 Lys Arg Ala Thr Gly Val Asn Ser Ser Ile Thr Phe Ser Asn His Val 165 170 175 Asn Ala Trp Ala Ser Lys Gly Met Asn Leu Gly Ser Ser Trp Ser Tyr 180 185 190 Gln Val Leu Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser Ser Asn Val 195 200 205 Thr Val Trp 210 <210> 199 <211> 1074 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 199 atgattttcg gtctaaagtc gatcacgggc aggcgcgccg tcgcggcgct ggcctgcctt 60 gccggcctct acatggcgcc ggcgaatgcg caaacctgca tcacgtcgag ccagacgggc 120 accaacaacg gcaactactt ttcgttctgg aaagacagcc cgggcacggt gaacttctgc 180 atgtactccg gcggccgcta cacgtccaac tggagcggca tcaacaactg ggtgggcggc 240 aagggctggc agacgggctc gtcccgcacc gtctcctact ccggcagctt caattcgccg 300 ggtaacggct acctgacgct ctacggctgg accaccaatc cgctcatcga gtactacatc 360 gtcgacaact ggggcagcta tcgtccgccg ggtggccagg gcttcatggg cacggtgaac 420 accgacggcg gcacgtacga catctatcgc acgcaacggg tcaaccagcc gtcgatcatc 480 ggcaccgcga cgttctacca gtactggagc gtgcggcagt cgaagcgcac cggcggcacc 540 atcaccacgg ccaaccactt caatgcctgg gccagcctcg gcatgaacct gggacagcac 600 aactaccagg tgatggccac cgagggctac cagagcagcg gcagctccga catcacggtg 660 tgggaaggca cgagcagcgg cggaagcagc aatggcggca gcagcaacgg cggcagcagc 720 aatggtggca gcggcggcac gaagagcttc acggtgcgcg cgcgcggcac tgcgggcggc 780 gagtccatca cgctgcgggt caacaaccag aacgtgcaga cctggacgct gggtaccagc 840 atgcagaact acacggcctc gacctcgctg agcggcggca tcacggtggc gttcaccaac 900 gacggcggca gccgcgacgt gcaggtggac tacatcatcg tgaatggcca gacccgccag 960 tccgaacagc agagctacaa cactggcctc tacgccaatg gaagctgtgg tggcggttcg 1020 aacagcgagt ggatgcattg caacggcgcc atcggctacg gcaatacgcc ctga 1074 <210> 200 <211> 354 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(30) <400> 200 Met Ile Phe Gly Leu Lys Ser Ile Thr Gly Arg Arg Ala Val Ala Ala 1 5 10 15 Leu Ala Cys Leu Ala Gly Leu Tyr Met Ala Pro Ala Asn Ala Gln Thr 20 25 30 Cys Ile Thr Ser Ser Gln Thr Gly Thr Asn Asn Gly Asn Tyr Phe Ser 35 40 45 Phe Trp Lys Asp Ser Pro Gly Thr Val Asn Phe Cys Met Tyr Ser Gly 50 55 60 Gly Arg Tyr Thr Ser Asn Trp Ser Gly Ile Asn Asn Trp Val Gly Gly 65 70 75 80 Lys Gly Trp Gln Thr Gly Ser Ser Arg Thr Val Ser Tyr Ser Gly Ser 85 90 95 Phe Asn Ser Pro Gly Asn Gly Tyr Leu Thr Leu Tyr Gly Trp Thr Thr 100 105 110 Asn Pro Leu Ile Glu Tyr Tyr Ile Val Asp Asn Trp Gly Ser Tyr Arg 115 120 125 Pro Pro Gly Gly Gln Gly Phe Met Gly Thr Val Asn Thr Asp Gly Gly 130 135 140 Thr Tyr Asp Ile Tyr Arg Thr Gln Arg Val Asn Gln Pro Ser Ile Ile 145 150 155 160 Gly Thr Ala Thr Phe Tyr Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg 165 170 175 Thr Gly Gly Thr Ile Thr Thr Ala Asn His Phe Asn Ala Trp Ala Ser 180 185 190 Leu Gly Met Asn Leu Gly Gln His Asn Tyr Gln Val Met Ala Thr Glu 195 200 205 Gly Tyr Gln Ser Ser Gly Ser Ser Asp Ile Thr Val Trp Glu Gly Thr 210 215 220 Ser Ser Gly Gly Ser Ser Asn Gly Gly Ser Ser Asn Gly Gly Ser Ser 225 230 235 240 Asn Gly Gly Ser Gly Gly Thr Lys Ser Phe Thr Val Arg Ala Arg Gly 245 250 255 Thr Ala Gly Gly Glu Ser Ile Thr Leu Arg Val Asn Asn Gln Asn Val 260 265 270 Gln Thr Trp Thr Leu Gly Thr Ser Met Gln Asn Tyr Thr Ala Ser Thr 275 280 285 Ser Leu Ser Gly Gly Ile Thr Val Ala Phe Thr Asn Asp Gly Gly Ser 290 295 300 Arg Asp Val Gln Val Asp Tyr Ile Ile Val Asn Gly Gln Thr Arg Gln 305 310 315 320 Ser Glu Gln Gln Ser Tyr Asn Thr Gly Leu Tyr Ala Asn Gly Ser Cys 325 330 335 Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys Asn Gly Ala Ile Gly 340 345 350 Tyr Gly <210> 201 <211> 1002 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 201 atgaagatga acagctccct cccctccctc cgcgatgtat tcgcgaatga tttccgcatc 60 ggggcggcgg tcaatcctgt gacgatcgag atgcaaaaac agttgttgat cgatcatgtc 120 aacagtatta cggcagagaa ccatatgaag tttgagcatc ttcagccgga agaagggaaa 180 tttacctttc aggaagcgga tcggattgtg gattttgctt gttcgcaccg aatggcggtt 240 cgagggcaca cacttgtatg gcacaaccag actccggatt gggtgtttca agatggtcaa 300 ggccatttcg tcagtcggga tgtgttgctt gagcggatga aatgtcacat ttcaactgtt 360 gtacggcgat acaagggaaa aatatattgt tgggatgtca tcaacgaagc ggtagccgac 420 gaaggagacg aattgttgag gccgtcgaag tggcgacaaa tcatcgggga cgattttatg 480 gaacaagcat ttctctacgc ttatgaagct gacccagatg cactgctttt ttacaatgac 540 tataatgaat gttttccgga aaagagagaa aaaatttttg cacttgtcaa atcgctgcgt 600 gataaaggca ttccgattca tggcatcggc atgcaggcgc actggagcct gacccgcccg 660 tcgcttgatg aaattcgtgc ggcgattgaa cggtatgcgt cccttggtgt tgttcttcat 720 attacggaac tcgatgtatc catgtttgaa tttcacgatc gtcgaaccga tttggctgtc 780 ccgacgaacg aaatgatcga acagcaagca gaacggtatg ggcaaatttt tgctttgttt 840 aaggagtatc gcgatgttat tcaaagtgtc acattttggg gaattgctga tgaccataca 900 tggctcgata actttccagt gcacgggaga aaaaactggc cgcttttgtt cgatgaacag 960 cataaaccga aaccagcttt ttggcgggca gtgagtgtct ga 1002 <210> 202 <211> 333 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 202 Met Lys Met Asn Ser Ser Leu Pro Ser Leu Arg Asp Val Phe Ala Asn 1 5 10 15 Asp Phe Arg Ile Gly Ala Ala Val Asn Pro Val Thr Ile Glu Met Gln 20 25 30 Lys Gln Leu Leu Ile Asp His Val Asn Ser Ile Thr Ala Glu Asn His 35 40 45 Met Lys Phe Glu His Leu Gln Pro Glu Glu Gly Lys Phe Thr Phe Gln 50 55 60 Glu Ala Asp Arg Ile Val Asp Phe Ala Cys Ser His Arg Met Ala Val 65 70 75 80 Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro Asp Trp Val Phe 85 90 95 Gln Asp Gly Gln Gly His Phe Val Ser Arg Asp Val Leu Leu Glu Arg 100 105 110 Met Lys Cys His Ile Ser Thr Val Val Arg Arg Tyr Lys Gly Lys Ile 115 120 125 Tyr Cys Trp Asp Val Ile Asn Glu Ala Val Ala Asp Glu Gly Asp Glu 130 135 140 Leu Leu Arg Pro Ser Lys Trp Arg Gln Ile Ile Gly Asp Asp Phe Met 145 150 155 160 Glu Gln Ala Phe Leu Tyr Ala Tyr Glu Ala Asp Pro Asp Ala Leu Leu 165 170 175 Phe Tyr Asn Asp Tyr Asn Glu Cys Phe Pro Glu Lys Arg Glu Lys Ile 180 185 190 Phe Ala Leu Val Lys Ser Leu Arg Asp Lys Gly Ile Pro Ile His Gly 195 200 205 Ile Gly Met Gln Ala His Trp Ser Leu Thr Arg Pro Ser Leu Asp Glu 210 215 220 Ile Arg Ala Ala Ile Glu Arg Tyr Ala Ser Leu Gly Val Val Leu His 225 230 235 240 Ile Thr Glu Leu Asp Val Ser Met Phe Glu Phe His Asp Arg Arg Thr 245 250 255 Asp Leu Ala Val Pro Thr Asn Glu Met Ile Glu Gln Gln Ala Glu Arg 260 265 270 Tyr Gly Gln Ile Phe Ala Leu Phe Lys Glu Tyr Arg Asp Val Ile Gln 275 280 285 Ser Val Thr Phe Trp Gly Ile Ala Asp Asp His Thr Trp Leu Asp Asn 290 295 300 Phe Pro Val His Gly Arg Lys Asn Trp Pro Leu Leu Phe Asp Glu Gln 305 310 315 320 His Lys Pro Lys Pro Ala Phe Trp Arg Ala Val Ser Val 325 330 <210> 203 <211> 687 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 203 atgaaatctg cacgcgcact tttggtggcg ctatcacgca tacttccgat cgcacttgtg 60 ctgttgctcg cccccgtccc cgcgcaagcc caacaggtct gcaacaacgg aacgggcacg 120 cataacggct tcttctggac gttttggaag gacggcggca cggcctgcat gacgctcggc 180 tcgggcggca attatagcac gacgttcaat ctgtccggcg gccgcaacct tgttgcgggc 240 aagggctggc agactggctc caccaaccga gtcgtcggtt acaatgcggg cgtctggaac 300 ccaggcacca attcttatct gacgctctat ggctggtcga cgaatccgct cgtcgaatat 360 tatgtcgtgg accattgggg cagccaattc accccgccag gcaacggcgc gcagagcatg 420 gggaccgtga ccaccgacgg cggcacctac aacatctacc gcacccaacg cgtcaacgcg 480 ccttcgatca tcggcaacgc cacgttctac caatattgga gcgtgcgcac ttcgcgccgc 540 gggcaaggca cgaacaacac gatcaccttc gccaatcacg tcaacgcttg gcgcagccgc 600 ggcatgaacc ttgggaccat gaattatcaa gtcatggcca cggaaggttt cggctcgaac 660 ggaagctcca acctcacagt atggtag 687 <210> 204 <211> 228 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(30) <400> 204 Met Lys Ser Ala Arg Ala Leu Leu Val Ala Leu Ser Arg Ile Leu Pro 1 5 10 15 Ile Ala Leu Val Leu Leu Leu Ala Pro Val Pro Ala Gln Ala Gln Gln 20 25 30 Val Cys Asn Asn Gly Thr Gly Thr His Asn Gly Phe Phe Trp Thr Phe 35 40 45 Trp Lys Asp Gly Gly Thr Ala Cys Met Thr Leu Gly Ser Gly Gly Asn 50 55 60 Tyr Ser Thr Thr Phe Asn Leu Ser Gly Gly Arg Asn Leu Val Ala Gly 65 70 75 80 Lys Gly Trp Gln Thr Gly Ser Thr Asn Arg Val Val Gly Tyr Asn Ala 85 90 95 Gly Val Trp Asn Pro Gly Thr Asn Ser Tyr Leu Thr Leu Tyr Gly Trp 100 105 110 Ser Thr Asn Pro Leu Val Glu Tyr Tyr Val Val Asp His Trp Gly Ser 115 120 125 Gln Phe Thr Pro Pro Gly Asn Gly Ala Gln Ser Met Gly Thr Val Thr 130 135 140 Thr Asp Gly Gly Thr Tyr Asn Ile Tyr Arg Thr Gln Arg Val Asn Ala 145 150 155 160 Pro Ser Ile Ile Gly Asn Ala Thr Phe Tyr Gln Tyr Trp Ser Val Arg 165 170 175 Thr Ser Arg Arg Gly Gln Gly Thr Asn Asn Thr Ile Thr Phe Ala Asn 180 185 190 His Val Asn Ala Trp Arg Ser Arg Gly Met Asn Leu Gly Thr Met Asn 195 200 205 Tyr Gln Val Met Ala Thr Glu Gly Phe Gly Ser Asn Gly Ser Ser Asn 210 215 220 Leu Thr Val Trp 225 <210> 205 <211> 1068 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 205 atgcaaattt tcaaatcacc actgtcatgg gccggatcac tattactgat cctgtccacc 60 gccctgtttt caacagcggc cactgcccag gaatactgct ccaaccagac cggtacacac 120 agcggttttt actttaccca ttggtctgac ggcggcggta ctgcctgcat tactctggga 180 gacgacggaa attacagtta cacctggtcc aacacaggca attttgtcgg tggcaagggc 240 tggagtaccg gcacctccaa tcgggtgatc ggttacaacg ccggagacta ctcgccctcc 300 ggcaactcct acctggcgct gtatggctgg agcaccaatc cactgattga gtactacgtg 360 gtggatagct ggggtagctg gcgtccgccg ggtggcacct cggtaggtac agtcaccagc 420 gatggcggga cttacgacct gtaccgcacc gagcgcgtgc agcagccctc catcgaaggc 480 acggccacct tctatcaata ttggagcgtg cgcacctcac agcgtcccca ggggcagaac 540 aacaccatca cctttcagaa ccacgtggat gcctgggcca atcagggctg gaacctcggc 600 acccacaact atcaggtaat ggcgaccgaa ggctacgaaa gcagcggcag ctccaacgtc 660 acggtttggg attccggcac cagtagcggt aacggtggca acgctggcgg cggtggtggc 720 gaggcaggta acggctccaa ctcactggtc gtgcgtgcgg tgggcacttc gggcaacgaa 780 cagttgcgcg tcaacgtcag cggcaacacg gttgaaaccc tgaacctgtc taccaactgg 840 caggactaca ccatcaacac caacgcttcc ggcgatgtga atgtggagtt gatcaacgat 900 cagggcgagg gctacgaagc ccgggtggaa tacgtcatcg tcaacggcga tacccgctac 960 ggcgctgatc agagctacaa caccagcgcc tgggacggcg agtgcggcgg cggttccttt 1020 accatgtgga tgcactgcga aggcatcctc ggttttggcg atatgtaa 1068 <210> 206 <211> 355 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(29) <400> 206 Met Gln Ile Phe Lys Ser Pro Leu Ser Trp Ala Gly Ser Leu Leu Leu 1 5 10 15 Ile Leu Ser Thr Ala Leu Phe Ser Thr Ala Ala Thr Ala Gln Glu Tyr 20 25 30 Cys Ser Asn Gln Thr Gly Thr His Ser Gly Phe Tyr Phe Thr His Trp 35 40 45 Ser Asp Gly Gly Gly Thr Ala Cys Ile Thr Leu Gly Asp Asp Gly Asn 50 55 60 Tyr Ser Tyr Thr Trp Ser Asn Thr Gly Asn Phe Val Gly Gly Lys Gly 65 70 75 80 Trp Ser Thr Gly Thr Ser Asn Arg Val Ile Gly Tyr Asn Ala Gly Asp 85 90 95 Tyr Ser Pro Ser Gly Asn Ser Tyr Leu Ala Leu Tyr Gly Trp Ser Thr 100 105 110 Asn Pro Leu Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Ser Trp Arg 115 120 125 Pro Pro Gly Gly Thr Ser Val Gly Thr Val Thr Ser Asp Gly Gly Thr 130 135 140 Tyr Asp Leu Tyr Arg Thr Glu Arg Val Gln Gln Pro Ser Ile Glu Gly 145 150 155 160 Thr Ala Thr Phe Tyr Gln Tyr Trp Ser Val Arg Thr Ser Gln Arg Pro 165 170 175 Gln Gly Gln Asn Asn Thr Ile Thr Phe Gln Asn His Val Asp Ala Trp 180 185 190 Ala Asn Gln Gly Trp Asn Leu Gly Thr His Asn Tyr Gln Val Met Ala 195 200 205 Thr Glu Gly Tyr Glu Ser Ser Gly Ser Ser Asn Val Thr Val Trp Asp 210 215 220 Ser Gly Thr Ser Ser Gly Asn Gly Gly Asn Ala Gly Gly Gly Gly Gly 225 230 235 240 Glu Ala Gly Asn Gly Ser Asn Ser Leu Val Val Arg Ala Val Gly Thr 245 250 255 Ser Gly Asn Glu Gln Leu Arg Val Asn Val Ser Gly Asn Thr Val Glu 260 265 270 Thr Leu Asn Leu Ser Thr Asn Trp Gln Asp Tyr Thr Ile Asn Thr Asn 275 280 285 Ala Ser Gly Asp Val Asn Val Glu Leu Ile Asn Asp Gln Gly Glu Gly 290 295 300 Tyr Glu Ala Arg Val Glu Tyr Val Ile Val Asn Gly Asp Thr Arg Tyr 305 310 315 320 Gly Ala Asp Gln Ser Tyr Asn Thr Ser Ala Trp Asp Gly Glu Cys Gly 325 330 335 Gly Gly Ser Phe Thr Met Trp Met His Cys Glu Gly Ile Leu Gly Phe 340 345 350 Gly Asp Met 355 <210> 207 <211> 633 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 207 atgaaattaa aaaagaagat gctcacttta ctcctgacgg cttcgatgag tttcggttta 60 tttggggcaa cctcgagtgc agcaacggat tattggcaat attggacgga tggcggcgga 120 acggtgaatg cggttaacgg gtccgggggc aattacagcg taacttggca aaatagcggg 180 aacttcgtgg tcggcaaagg ctggagcgta gggtcgccaa atcggacgat caattacaat 240 gccggcatct gggaaccttc ggggaacggg tacttgaccc tttacggatg gactagaaac 300 tcgctgatcg agtattacgt tgtcgacagt tgggggacgt accggccaac aggtactcac 360 aaaggaacgg tgaacagcga cggaggcacc tacgatattt atacgaccat gcgctataat 420 gcgccttcca ttgatggcac gcagacgttc caacagttct ggagcgtgcg gcaatcgaaa 480 cgaccaaccg gcagcaacgt ctccatcacc ttcagcaatc acgtgaatgc ctggagaagc 540 aagggcatga acctgggcag cagctggtcg taccaggtct tggcgacgga aggctatcag 600 agcagcggaa gatccaacgt cacggtgtgg taa 633 <210> 208 <211> 210 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(27) <400> 208 Met Lys Leu Lys Lys Lys Met Leu Thr Leu Leu Leu Thr Ala Ser Met 1 5 10 15 Ser Phe Gly Leu Phe Gly Ala Thr Ser Ser Ala Ala Thr Asp Tyr Trp 20 25 30 Gln Tyr Trp Thr Asp Gly Gly Gly Thr Val Asn Ala Val Asn Gly Ser 35 40 45 Gly Gly Asn Tyr Ser Val Thr Trp Gln Asn Ser Gly Asn Phe Val Val 50 55 60 Gly Lys Gly Trp Ser Val Gly Ser Pro Asn Arg Thr Ile Asn Tyr Asn 65 70 75 80 Ala Gly Ile Trp Glu Pro Ser Gly Asn Gly Tyr Leu Thr Leu Tyr Gly 85 90 95 Trp Thr Arg Asn Ser Leu Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly 100 105 110 Thr Tyr Arg Pro Thr Gly Thr His Lys Gly Thr Val Asn Ser Asp Gly 115 120 125 Gly Thr Tyr Asp Ile Tyr Thr Thr Met Arg Tyr Asn Ala Pro Ser Ile 130 135 140 Asp Gly Thr Gln Thr Phe Gln Gln Phe Trp Ser Val Arg Gln Ser Lys 145 150 155 160 Arg Pro Thr Gly Ser Asn Val Ser Ile Thr Phe Ser Asn His Val Asn 165 170 175 Ala Trp Arg Ser Lys Gly Met Asn Leu Gly Ser Ser Trp Ser Tyr Gln 180 185 190 Val Leu Ala Thr Glu Gly Tyr Gln Ser Ser Gly Arg Ser Asn Val Thr 195 200 205 Val Trp 210 <210> 209 <211> 1194 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 209 atgaaaacat ttagtgtgac caagtctagc gttgttttcg caatggcttt gggtatggct 60 tcgacagctt ttgctcagga tttctgcagc aatgcgcaac attccggcca aaaggtaacg 120 attacttcga accaaactgg taaaatcggc gatatcggtt acgaactctg ggacgaaaac 180 ggtcatggtg gtagtgctac cttctatagc gatggttcca tggactgcaa tatcactggt 240 gctaaggact atctctgccg tgcgggcctt tccctcggca gtaacaagac ctacaaggaa 300 cttggtggtg atatgattgc cgagttcaag cttgtgaaga gcggtgccca gaatgtgggt 360 tactcttata tcggtatcta tggctggatg gaaggtgttt ctggaacgcc tagccagttg 420 gtcgaatact acgtgattga taacaccctc gccaatgaca tgccgggtag ctggattggt 480 aacgaaagaa agggtaccat tacggttgac ggcggtacct atactgttta tcgcaatacc 540 cgtacaggtc cggctattaa gaacagcggt aacgtcacgt tctatcagta tttcagcgtt 600 cgtacctctc cgcgcgattg cggtaccatc aatatttccg aacacatgag acagtgggaa 660 aagatgggca tgaccatggg taagctctac gaagccaagg tgcttggcga agcgggtaac 720 gtgaatggcg aagtccgcgg tggtcacatg gacttcccgc atgctaaggt ttatgtgaaa 780 aacggctctg atccggcttc ttcctcttct gtgaagtcca gctcttctac agtaacgcca 840 aaatccagct cctcgaaggg taacggcaac gtttctggta aaattgacgc ctgcaaggac 900 gctatgggcc atgaaggcaa agaaacgaga actcagggtc agaacaactc tagcgtgacg 960 ggtaacgtcg gcagctctcc gtaccactat gaaatttggt atcagggtgg taacaactcc 1020 atgacgttct acgacaacgg tacttataag gcaagctgga atggtaccaa cgacttcctt 1080 gctcgtgtcg gtttcaagta tgatgaaaag cacacttacg aagaacttgg ccctatcgat 1140 gcctactaca agtggagcaa gcagggtagt gctggtggct acaactacat cggt 1194 <210> 210 <211> 398 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(25) <400> 210 Met Lys Thr Phe Ser Val Thr Lys Ser Ser Val Val Phe Ala Met Ala 1 5 10 15 Leu Gly Met Ala Ser Thr Ala Phe Ala Gln Asp Phe Cys Ser Asn Ala 20 25 30 Gln His Ser Gly Gln Lys Val Thr Ile Thr Ser Asn Gln Thr Gly Lys 35 40 45 Ile Gly Asp Ile Gly Tyr Glu Leu Trp Asp Glu Asn Gly His Gly Gly 50 55 60 Ser Ala Thr Phe Tyr Ser Asp Gly Ser Met Asp Cys Asn Ile Thr Gly 65 70 75 80 Ala Lys Asp Tyr Leu Cys Arg Ala Gly Leu Ser Leu Gly Ser Asn Lys 85 90 95 Thr Tyr Lys Glu Leu Gly Gly Asp Met Ile Ala Glu Phe Lys Leu Val 100 105 110 Lys Ser Gly Ala Gln Asn Val Gly Tyr Ser Tyr Ile Gly Ile Tyr Gly 115 120 125 Trp Met Glu Gly Val Ser Gly Thr Pro Ser Gln Leu Val Glu Tyr Tyr 130 135 140 Val Ile Asp Asn Thr Leu Ala Asn Asp Met Pro Gly Ser Trp Ile Gly 145 150 155 160 Asn Glu Arg Lys Gly Thr Ile Thr Val Asp Gly Gly Thr Tyr Thr Val 165 170 175 Tyr Arg Asn Thr Arg Thr Gly Pro Ala Ile Lys Asn Ser Gly Asn Val 180 185 190 Thr Phe Tyr Gln Tyr Phe Ser Val Arg Thr Ser Pro Arg Asp Cys Gly 195 200 205 Thr Ile Asn Ile Ser Glu His Met Arg Gln Trp Glu Lys Met Gly Met 210 215 220 Thr Met Gly Lys Leu Tyr Glu Ala Lys Val Leu Gly Glu Ala Gly Asn 225 230 235 240 Val Asn Gly Glu Val Arg Gly Gly His Met Asp Phe Pro His Ala Lys 245 250 255 Val Tyr Val Lys Asn Gly Ser Asp Pro Ala Ser Ser Ser Ser Val Lys 260 265 270 Ser Ser Ser Ser Thr Val Thr Pro Lys Ser Ser Ser Ser Lys Gly Asn 275 280 285 Gly Asn Val Ser Gly Lys Ile Asp Ala Cys Lys Asp Ala Met Gly His 290 295 300 Glu Gly Lys Glu Thr Arg Thr Gln Gly Gln Asn Asn Ser Ser Val Thr 305 310 315 320 Gly Asn Val Gly Ser Ser Pro Tyr His Tyr Glu Ile Trp Tyr Gln Gly 325 330 335 Gly Asn Asn Ser Met Thr Phe Tyr Asp Asn Gly Thr Tyr Lys Ala Ser 340 345 350 Trp Asn Gly Thr Asn Asp Phe Leu Ala Arg Val Gly Phe Lys Tyr Asp 355 360 365 Glu Lys His Thr Tyr Glu Glu Leu Gly Pro Ile Asp Ala Tyr Tyr Lys 370 375 380 Trp Ser Lys Gln Gly Ser Ala Gly Gly Tyr Asn Tyr Ile Gly 385 390 395 <210> 211 <211> 1086 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 211 atgataagtt ctaaagcatc acagtcatgg ggctggtcac tattggtggc cctgtccgcc 60 gttctgcttt cggcgacagc ttccgcccag caacactgct ccaaccaaac cggtacgcac 120 aacggttttt actttaccca ttggtcagac ggtggcggta ccgcctgcat gactctgggg 180 gacgacggca actacagcta tacctggtcc aacactggca attttgtcgg tggtaagggc 240 tggagcacag gtacatccaa ccgggtgatt ggttacaacg ccggagacta ctcgccctcc 300 ggcaactcct acctggcact gtatggctgg agcaccaatc cgctgattga atattacgtg 360 gtcgacagtt ggggcagctg gcgtccgccg ggtggcacct ctgtgggcac ggtaaccagc 420 gacggtggca cttacgacct gtaccgaacc cagcgtgtgc agcagccctc cattgagggt 480 acggccacct tctatcaata ctggagcgtg cgcacctcac agcggcctca ggggcaaaac 540 aacaccatca cctttcagaa ccacgtgaat gcctgggcca atcagggctg gaatctgggc 600 acccacaact atcaggtgat ggcgaccgaa ggctacgaaa gcagcggcag ctccaacgtc 660 accgtttggg attccggcac cagtagcggt ggcggtggcg gtggcaacgc gggcggcggc 720 ggagcccccg gtggtggtga ggctggaggc ggctccaact cactggttgt gcgtgcggtg 780 ggcacttcgg gcaatgaaca gttgcgcgtc aacgtcagtg gcaacacggt ggaaaccctg 840 aacctgtcta ccaactggca ggactacacc atcaacacca acgcctccgg cgatgtcaat 900 gtggaattga tcaacgacca gggcgaaggc tacgaggccc gcgtcgagta cgtcatcatc 960 aacggcgata cccgctacgg cgccgaccag agctacaaca ccagcgcctg ggacggcgag 1020 tgcggtagcg gttcctttac catgtggatg cactgcgaag gcatcctcgg ttttggcgat 1080 atgtaa 1086 <210> 212 <211> 361 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(29) <400> 212 Met Ile Ser Ser Lys Ala Ser Gln Ser Trp Gly Trp Ser Leu Leu Val 1 5 10 15 Ala Leu Ser Ala Val Leu Leu Ser Ala Thr Ala Ser Ala Gln Gln His 20 25 30 Cys Ser Asn Gln Thr Gly Thr His Asn Gly Phe Tyr Phe Thr His Trp 35 40 45 Ser Asp Gly Gly Gly Thr Ala Cys Met Thr Leu Gly Asp Asp Gly Asn 50 55 60 Tyr Ser Tyr Thr Trp Ser Asn Thr Gly Asn Phe Val Gly Gly Lys Gly 65 70 75 80 Trp Ser Thr Gly Thr Ser Asn Arg Val Ile Gly Tyr Asn Ala Gly Asp 85 90 95 Tyr Ser Pro Ser Gly Asn Ser Tyr Leu Ala Leu Tyr Gly Trp Ser Thr 100 105 110 Asn Pro Leu Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Ser Trp Arg 115 120 125 Pro Pro Gly Gly Thr Ser Val Gly Thr Val Thr Ser Asp Gly Gly Thr 130 135 140 Tyr Asp Leu Tyr Arg Thr Gln Arg Val Gln Gln Pro Ser Ile Glu Gly 145 150 155 160 Thr Ala Thr Phe Tyr Gln Tyr Trp Ser Val Arg Thr Ser Gln Arg Pro 165 170 175 Gln Gly Gln Asn Asn Thr Ile Thr Phe Gln Asn His Val Asn Ala Trp 180 185 190 Ala Asn Gln Gly Trp Asn Leu Gly Thr His Asn Tyr Gln Val Met Ala 195 200 205 Thr Glu Gly Tyr Glu Ser Ser Gly Ser Ser Asn Val Thr Val Trp Asp 210 215 220 Ser Gly Thr Ser Ser Gly Gly Gly Gly Gly Gly Asn Ala Gly Gly Gly 225 230 235 240 Gly Ala Pro Gly Gly Gly Glu Ala Gly Gly Gly Ser Asn Ser Leu Val 245 250 255 Val Arg Ala Val Gly Thr Ser Gly Asn Glu Gln Leu Arg Val Asn Val 260 265 270 Ser Gly Asn Thr Val Glu Thr Leu Asn Leu Ser Thr Asn Trp Gln Asp 275 280 285 Tyr Thr Ile Asn Thr Asn Ala Ser Gly Asp Val Asn Val Glu Leu Ile 290 295 300 Asn Asp Gln Gly Glu Gly Tyr Glu Ala Arg Val Glu Tyr Val Ile Ile 305 310 315 320 Asn Gly Asp Thr Arg Tyr Gly Ala Asp Gln Ser Tyr Asn Thr Ser Ala 325 330 335 Trp Asp Gly Glu Cys Gly Ser Gly Ser Phe Thr Met Trp Met His Cys 340 345 350 Glu Gly Ile Leu Gly Phe Gly Asp Met 355 360 <210> 213 <211> 912 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 213 gtgaacgcac aacaaaccct tacgtctaac tccaccggta ctcatggtgg tcactactat 60 tctttctgga aggactccgg caatgcgtcc ttcactctct acgatggcgg acgttacggc 120 tcgcaatgga atagcggcac caacaattgg gtgggcggta aaggctggaa cccgggcggc 180 gcaaaagtcg ttaactacga aggttattac ggcgttaaca attcccagaa ttcttacctg 240 gcactctacg ggtggacccg caatccgctg atcgagtact acataatcga aagttacggt 300 tcgtacaacc catcgagctg tagtggcggt actaactacg gtagcttcca aagcgatggt 360 gcgacctata acgtccgccg ttgccagcgc gtacagcagc catcgattga tggaacgcaa 420 acgttctatc agtatttcag cgttcgctca cccaaaaagg gcttcggcca aatcagcggc 480 actatcaatg taggcaacca ctttaattat tgggccagca aagggctgaa tttgggtagc 540 cacgattaca tggttctggc gactgaaggc tatcagagca gcggcaattc agatatttcc 600 gtgtccgaag gcagcagcgg cggctcttcc tcaggcggtt cgacctccag cggaagctcc 660 tccggtagta cgaccagttc ttcaggaggc ggtggcggcg gcatcacagt acgtgctcgc 720 ggcactaatg gtgatgagcg tatcagcctg cgtgtcggcg gttctgcggt agccagttgg 780 acactcagta ccagcgcaca aagctatagc tacacaggcg gcgcctctgg cgatatccag 840 gtggaattcg atatcaagct tatcgatacc gtcgacctcg agggggggcc cggtacccaa 900 ttcgccctat ag 912 <210> 214 <211> 303 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 214 Val Asn Ala Gln Gln Thr Leu Thr Ser Asn Ser Thr Gly Thr His Gly 1 5 10 15 Gly His Tyr Tyr Ser Phe Trp Lys Asp Ser Gly Asn Ala Ser Phe Thr 20 25 30 Leu Tyr Asp Gly Gly Arg Tyr Gly Ser Gln Trp Asn Ser Gly Thr Asn 35 40 45 Asn Trp Val Gly Gly Lys Gly Trp Asn Pro Gly Gly Ala Lys Val Val 50 55 60 Asn Tyr Glu Gly Tyr Tyr Gly Val Asn Asn Ser Gln Asn Ser Tyr Leu 65 70 75 80 Ala Leu Tyr Gly Trp Thr Arg Asn Pro Leu Ile Glu Tyr Tyr Ile Ile 85 90 95 Glu Ser Tyr Gly Ser Tyr Asn Pro Ser Ser Cys Ser Gly Gly Thr Asn 100 105 110 Tyr Gly Ser Phe Gln Ser Asp Gly Ala Thr Tyr Asn Val Arg Arg Cys 115 120 125 Gln Arg Val Gln Gln Pro Ser Ile Asp Gly Thr Gln Thr Phe Tyr Gln 130 135 140 Tyr Phe Ser Val Arg Ser Pro Lys Lys Gly Phe Gly Gln Ile Ser Gly 145 150 155 160 Thr Ile Asn Val Gly Asn His Phe Asn Tyr Trp Ala Ser Lys Gly Leu 165 170 175 Asn Leu Gly Ser His Asp Tyr Met Val Leu Ala Thr Glu Gly Tyr Gln 180 185 190 Ser Ser Gly Asn Ser Asp Ile Ser Val Ser Glu Gly Ser Ser Gly Gly 195 200 205 Ser Ser Ser Gly Gly Ser Thr Ser Ser Gly Ser Ser Ser Gly Ser Thr 210 215 220 Thr Ser Ser Ser Gly Gly Gly Gly Gly Gly Ile Thr Val Arg Ala Arg 225 230 235 240 Gly Thr Asn Gly Asp Glu Arg Ile Ser Leu Arg Val Gly Gly Ser Ala 245 250 255 Val Ala Ser Trp Thr Leu Ser Thr Ser Ala Gln Ser Tyr Ser Tyr Thr 260 265 270 Gly Gly Ala Ser Gly Asp Ile Gln Val Glu Phe Asp Ile Lys Leu Ile 275 280 285 Asp Thr Val Asp Leu Glu Gly Gly Pro Gly Thr Gln Phe Ala Leu 290 295 300 <210> 215 <211> 1065 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 215 atgtttgcaa gattcgagaa actggccgcg gcgggtaaag ccgtcgtggc cctggcaggg 60 ctcgcccttt tgggcacggc gcctgccaat gcacagacct gtctcacgaa caattccacc 120 ggcaccaaca acggctacta ctactcgttc tggaaggaca gcggcaacgt gaccttctgc 180 atgtacgggg gcggccgcta tacctcgcag tggagcaaca tcaacaactg ggtgggcggc 240 aagggctgga atccgggcgg tcgtcggacc gtcacctatt cggggacgtt caacccgaac 300 ggcaattcct atctcacgct gtacggctgg accaccaatc cactggtcga gtactacatc 360 gtcgacagct ggggcagctg gcgtccgccg ggttccggct acatgggttc cgtcacgagc 420 gacggcggca cctacgacat ctatcgcacg cagcgcgtca accagccctc gatcatcggc 480 accgcgacgt tctaccagta ctggagcgtg cggcagcaga agcgcgtggg tggcaccatc 540 accaccggca accacttcga tgcctgggct tcgctgggca tgaacctcgg ccagcacaac 600 tacatggtca tggccaccga gggctaccag agcagcggca gctccgacat cacggtgggc 660 ggcaccagca gctcctcgtc gtcgagcggg ggcagcagca gcagtagcag cagcagcggg 720 ggtggcggct cgaagagctt caccgtgcgc gcgcggggtt cgacgggcgg tgagcagatc 780 agtttgcgcg tgaacaacca gaccgtgcag aactggacgc tgggcaccag catgcagaac 840 tacaccgcgt ccaccaacct gagcggcggc atcaccgtgc acttcaccaa tgacagcggc 900 aaccgcgacg tgcaggtgga ctacatccag gtgaacggcc agacgcgtca atccgagcag 960 cagagctaca acaccgggct gtatgccaac ggcagctgtg gcggcggcgg ctacagcgag 1020 tggatgcatt gcaatggcgc gatcggttac ggcaacacgc cgtag 1065 <210> 216 <211> 354 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(31) <400> 216 Met Phe Ala Arg Phe Glu Lys Leu Ala Ala Ala Gly Lys Ala Val Val 1 5 10 15 Ala Leu Ala Gly Leu Ala Leu Leu Gly Thr Ala Pro Ala Asn Ala Gln 20 25 30 Thr Cys Leu Thr Asn Asn Ser Thr Gly Thr Asn Asn Gly Tyr Tyr Tyr 35 40 45 Ser Phe Trp Lys Asp Ser Gly Asn Val Thr Phe Cys Met Tyr Gly Gly 50 55 60 Gly Arg Tyr Thr Ser Gln Trp Ser Asn Ile Asn Asn Trp Val Gly Gly 65 70 75 80 Lys Gly Trp Asn Pro Gly Gly Arg Arg Thr Val Thr Tyr Ser Gly Thr 85 90 95 Phe Asn Pro Asn Gly Asn Ser Tyr Leu Thr Leu Tyr Gly Trp Thr Thr 100 105 110 Asn Pro Leu Val Glu Tyr Tyr Ile Val Asp Ser Trp Gly Ser Trp Arg 115 120 125 Pro Pro Gly Ser Gly Tyr Met Gly Ser Val Thr Ser Asp Gly Gly Thr 130 135 140 Tyr Asp Ile Tyr Arg Thr Gln Arg Val Asn Gln Pro Ser Ile Ile Gly 145 150 155 160 Thr Ala Thr Phe Tyr Gln Tyr Trp Ser Val Arg Gln Gln Lys Arg Val 165 170 175 Gly Gly Thr Ile Thr Thr Gly Asn His Phe Asp Ala Trp Ala Ser Leu 180 185 190 Gly Met Asn Leu Gly Gln His Asn Tyr Met Val Met Ala Thr Glu Gly 195 200 205 Tyr Gln Ser Ser Gly Ser Ser Asp Ile Thr Val Gly Gly Thr Ser Ser 210 215 220 Ser Ser Ser Ser Ser Gly Gly Ser Ser Ser Ser Ser Ser Ser Ser Gly 225 230 235 240 Gly Gly Gly Ser Lys Ser Phe Thr Val Arg Ala Arg Gly Ser Thr Gly 245 250 255 Gly Glu Gln Ile Ser Leu Arg Val Asn Asn Gln Thr Val Gln Asn Trp 260 265 270 Thr Leu Gly Thr Ser Met Gln Asn Tyr Thr Ala Ser Thr Asn Leu Ser 275 280 285 Gly Gly Ile Thr Val His Phe Thr Asn Asp Ser Gly Asn Arg Asp Val 290 295 300 Gln Val Asp Tyr Ile Gln Val Asn Gly Gln Thr Arg Gln Ser Glu Gln 305 310 315 320 Gln Ser Tyr Asn Thr Gly Leu Tyr Ala Asn Gly Ser Cys Gly Gly Gly 325 330 335 Gly Tyr Ser Glu Trp Met His Cys Asn Gly Ala Ile Gly Tyr Gly Asn 340 345 350 Thr Pro <210> 217 <211> 1083 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 217 atgactttcg tcaagacgat caccggcaga cgcgccatcg cggcgttcct ctgcctcgcc 60 ggcctctaca tggcgccggc aaacgcgcaa acctgcatca cgtccagcca gaccggcacc 120 aacaacggga actacttttc gttctggaaa gacagcccgg gcacggtgaa cttctgcatg 180 tacccgaatg gccgctacac ctcgaactgg agcggcatca acaactgggt cggcggcaag 240 ggctggtcga ccggctccag ccgcaccgtc agctattcgg gcagcttcaa ttcgcccggc 300 aacggctacc tgactctcta cgggtggacc accaacccgc tcatcgagta ctacatcgtc 360 gagaactggg gtaactaccg cccgccgggc ggccaggggt acatggggac cgtcaattcc 420 gacggggcga cctatgacat ctaccggacc ttccgggaca accagccctg catcacgggc 480 aactcctgcg acttctacca gtactggagc gtgcgccagt ccaagcgcag cagcggcacc 540 atcaccacgg ccaatcactt cgcggcgtgg aacagcctcg gcatgaacct gggccagcac 600 aactaccagg tcatggccac cgagggttac cagagcagcg gcagctccga catcacggtc 660 acggaaggcg gcggcggcag cagcaatggt ggcagcagca acggcggcag cagcaatggc 720 ggcagcagca atggcggcgg cggcggcacc aagagcttca cggtccgcgc ccgtggcacc 780 gcgggtggcg agtccatcac gctgcgtgtc aacaaccaga acgtgcagac ctggacgctg 840 ggcaccggca tgcagaacta cacggcctcg acctcgctga gcggtggcat cacggtgcac 900 ttcaccaacg acggcggaag ccgcgacgtg caggtggact acatccaggt gaacggcagc 960 acgcgccagt ccgaggcaca gagctacaac accggcgcct acctgaacgg ccgttgcggc 1020 ggtggcggca acagcgaatg gatgcattgc aacggcgcca tcggctacgg caatacgccc 1080 tga 1083 <210> 218 <211> 360 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(29) <400> 218 Met Thr Phe Val Lys Thr Ile Thr Gly Arg Arg Ala Ile Ala Ala Phe 1 5 10 15 Leu Cys Leu Ala Gly Leu Tyr Met Ala Pro Ala Asn Ala Gln Thr Cys 20 25 30 Ile Thr Ser Ser Gln Thr Gly Thr Asn Asn Gly Asn Tyr Phe Ser Phe 35 40 45 Trp Lys Asp Ser Pro Gly Thr Val Asn Phe Cys Met Tyr Pro Asn Gly 50 55 60 Arg Tyr Thr Ser Asn Trp Ser Gly Ile Asn Asn Trp Val Gly Gly Lys 65 70 75 80 Gly Trp Ser Thr Gly Ser Ser Arg Thr Val Ser Tyr Ser Gly Ser Phe 85 90 95 Asn Ser Pro Gly Asn Gly Tyr Leu Thr Leu Tyr Gly Trp Thr Thr Asn 100 105 110 Pro Leu Ile Glu Tyr Tyr Ile Val Glu Asn Trp Gly Asn Tyr Arg Pro 115 120 125 Pro Gly Gly Gln Gly Tyr Met Gly Thr Val Asn Ser Asp Gly Ala Thr 130 135 140 Tyr Asp Ile Tyr Arg Thr Phe Arg Asp Asn Gln Pro Cys Ile Thr Gly 145 150 155 160 Asn Ser Cys Asp Phe Tyr Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg 165 170 175 Ser Ser Gly Thr Ile Thr Thr Ala Asn His Phe Ala Ala Trp Asn Ser 180 185 190 Leu Gly Met Asn Leu Gly Gln His Asn Tyr Gln Val Met Ala Thr Glu 195 200 205 Gly Tyr Gln Ser Ser Gly Ser Ser Asp Ile Thr Val Thr Glu Gly Gly 210 215 220 Gly Gly Ser Ser Asn Gly Gly Ser Ser Asn Gly Gly Ser Ser Asn Gly 225 230 235 240 Gly Ser Ser Asn Gly Gly Gly Gly Gly Thr Lys Ser Phe Thr Val Arg 245 250 255 Ala Arg Gly Thr Ala Gly Gly Glu Ser Ile Thr Leu Arg Val Asn Asn 260 265 270 Gln Asn Val Gln Thr Trp Thr Leu Gly Thr Gly Met Gln Asn Tyr Thr 275 280 285 Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val His Phe Thr Asn Asp 290 295 300 Gly Gly Ser Arg Asp Val Gln Val Asp Tyr Ile Gln Val Asn Gly Ser 305 310 315 320 Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly Ala Tyr Leu Asn 325 330 335 Gly Arg Cys Gly Gly Gly Gly Asn Ser Glu Trp Met His Cys Asn Gly 340 345 350 Ala Ile Gly Tyr Gly Asn Thr Pro 355 360 <210> 219 <211> 1029 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 219 atgacatcag gtctcaagaa agtgatggca ttcgtctgtc tcgccaccct tggcgtttcg 60 gcgcatgccc agacatgtat tcagtccagt cagaccggca ccaacaacgg attctatttc 120 tccttctgga aggacaaccc gggcacggtg cagttctgcc tgcagagcgg cggtcgttac 180 acctccaact ggaacggcat caacaactgg gtgggcggca aggggtggca gaccggcgca 240 cgccgcacgg tgaactactc gggctcgttc aactcgccgg gcaacggcta tctggcgctg 300 tacggctgga ccaccaatcc gctggtcgag tactacatcg tcgacagctg gggcagcttc 360 cgtccgccgg gcaacactgc aggcctgtgg gtactggtga acagcgatgg cggcacctac 420 gacatctatc gcgcgcatcg cagtaacgcg ccctgcatca ccggcagcag ctgcgacttc 480 gaccagtact ggagcgtgcg acagtcgaag cgcgtcggcg gcaccatcac caccggcaac 540 cacttcgatg cctgggcgaa ccaccagatg aatctgggcc agttcaacta ccagatcatg 600 gctaccgagg gtttccagag caacggcagc tccgacatca ccgtcagtga atgcaccagc 660 aattgcggcg gtggcggcgg cggcgggggt ggcagcaaca gcatcacggt gcgcgcgcgc 720 ggcacgggcg gcggcgagca gatccggctg cgggtgaaca acaccacggt gcaaacctgg 780 acgctgacca ccagctacca gaacttcacg gcttcgacct cgctgagcgg cggcaccatc 840 gtcgagtact tcaacgacag ttccggccat gacgtgcagg tcgactacat catcgtgaat 900 ggcgtgaccc gccagtccga atcgcagagc tacaacaccg ggctgtatgc caacgggcgt 960 tgcggcggcg gctccaacag cgagtggatg cattgcaacg gtgccattgg atacggaaat 1020 accccgtaa 1029 <210> 220 <211> 342 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(23) <400> 220 Met Thr Ser Gly Leu Lys Lys Val Met Ala Phe Val Cys Leu Ala Thr 1 5 10 15 Leu Gly Val Ser Ala His Ala Gln Thr Cys Ile Gln Ser Ser Gln Thr 20 25 30 Gly Thr Asn Asn Gly Phe Tyr Phe Ser Phe Trp Lys Asp Asn Pro Gly 35 40 45 Thr Val Gln Phe Cys Leu Gln Ser Gly Gly Arg Tyr Thr Ser Asn Trp 50 55 60 Asn Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly Ala 65 70 75 80 Arg Arg Thr Val Asn Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn Gly 85 90 95 Tyr Leu Ala Leu Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr Tyr 100 105 110 Ile Val Asp Ser Trp Gly Ser Phe Arg Pro Pro Gly Asn Thr Ala Gly 115 120 125 Leu Trp Val Leu Val Asn Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Arg 130 135 140 Ala His Arg Ser Asn Ala Pro Cys Ile Thr Gly Ser Ser Cys Asp Phe 145 150 155 160 Asp Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Val Gly Gly Thr Ile 165 170 175 Thr Thr Gly Asn His Phe Asp Ala Trp Ala Asn His Gln Met Asn Leu 180 185 190 Gly Gln Phe Asn Tyr Gln Ile Met Ala Thr Glu Gly Phe Gln Ser Asn 195 200 205 Gly Ser Ser Asp Ile Thr Val Ser Glu Cys Thr Ser Asn Cys Gly Gly 210 215 220 Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser Ile Thr Val Arg Ala Arg 225 230 235 240 Gly Thr Gly Gly Gly Glu Gln Ile Arg Leu Arg Val Asn Asn Thr Thr 245 250 255 Val Gln Thr Trp Thr Leu Thr Thr Ser Tyr Gln Asn Phe Thr Ala Ser 260 265 270 Thr Ser Leu Ser Gly Gly Thr Ile Val Glu Tyr Phe Asn Asp Ser Ser 275 280 285 Gly His Asp Val Gln Val Asp Tyr Ile Ile Val Asn Gly Val Thr Arg 290 295 300 Gln Ser Glu Ser Gln Ser Tyr Asn Thr Gly Leu Tyr Ala Asn Gly Arg 305 310 315 320 Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys Asn Gly Ala Ile 325 330 335 Gly Tyr Gly Asn Thr Pro 340 <210> 221 <211> 1044 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 221 atgattgtta gtttcaagag cgtgaaggca ctcgcgtgcc tggccgtgct cggcgtgacc 60 gccgcgcagg cgcaaacctg catcaattcc agccagaccg gcaccaacaa cggcaattat 120 ttttcattct ggaaagacaa cccgggcacg gtgaccttct gcatgtatgc caacggccgc 180 tacacctcca actggagcgg catcaacaac tgggtgggtg gcaagggctg gcagaccggc 240 tcgaatcgca cggtgaccta ctccggttcg ttcaactcgc ccggcaacgg ctacctcacc 300 ctgtacgggt ggaccacgaa tccgctgatc gagtactaca tcgtcgacag ttggggcagt 360 tatcgaccgc ccggcggcca gggcttcatg ggcaccgtga cgaccgacgg cggcacctac 420 gacatctatc gcacgcagcg cgtgaaccag ccttccatca tcggcaccgc gacgttctac 480 cagtactgga gcgtgcggca gtcgaagcgc gtggggggca ccatcaccac cgccaaccac 540 ttcaatgcct gggcgacgct gggcatgaac ctgggccagc acaactacca ggtcatggcc 600 accgagggtt accagagcag cggcagctcc gacatcaccg tgaccgaagg cggcggcagc 660 tcgtcgtcgt cgagcggcgg cggcagcacc agcagcggcg gtggcggcag caagagcttc 720 acggtgcgcg cccgcggcac ggtcggcggc gaaaacatcc agctgcaggt caacaaccag 780 acggtggcga gctggaacct gaccaccagc atgcagaact acaacgcctc gaccagcctg 840 agtggcggca tcaccgtggt ctacaccaac gacggcggta accgcgacgt ccaggtcgac 900 tacatcaccg tgaacggcca gacccgccag tccgaagcgc agagtttcaa caccgggctg 960 tatgccaacg gacgttgtgg cggcggctcg aacagcgagt ggatgcattg caatggcgcg 1020 atcggctacg gcaacacgcc gtaa 1044 <210> 222 <211> 347 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(24) <400> 222 Met Ile Val Ser Phe Lys Ser Val Lys Ala Leu Ala Cys Leu Ala Val 1 5 10 15 Leu Gly Val Thr Ala Ala Gln Ala Gln Thr Cys Ile Asn Ser Ser Gln 20 25 30 Thr Gly Thr Asn Asn Gly Asn Tyr Phe Ser Phe Trp Lys Asp Asn Pro 35 40 45 Gly Thr Val Thr Phe Cys Met Tyr Ala Asn Gly Arg Tyr Thr Ser Asn 50 55 60 Trp Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly 65 70 75 80 Ser Asn Arg Thr Val Thr Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn 85 90 95 Gly Tyr Leu Thr Leu Tyr Gly Trp Thr Thr Asn Pro Leu Ile Glu Tyr 100 105 110 Tyr Ile Val Asp Ser Trp Gly Ser Tyr Arg Pro Pro Gly Gly Gln Gly 115 120 125 Phe Met Gly Thr Val Thr Thr Asp Gly Gly Thr Tyr Asp Ile Tyr Arg 130 135 140 Thr Gln Arg Val Asn Gln Pro Ser Ile Ile Gly Thr Ala Thr Phe Tyr 145 150 155 160 Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Val Gly Gly Thr Ile Thr 165 170 175 Thr Ala Asn His Phe Asn Ala Trp Ala Thr Leu Gly Met Asn Leu Gly 180 185 190 Gln His Asn Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly 195 200 205 Ser Ser Asp Ile Thr Val Thr Glu Gly Gly Gly Ser Ser Ser Ser Ser 210 215 220 Ser Gly Gly Gly Ser Thr Ser Ser Gly Gly Gly Gly Ser Lys Ser Phe 225 230 235 240 Thr Val Arg Ala Arg Gly Thr Val Gly Gly Glu Asn Ile Gln Leu Gln 245 250 255 Val Asn Asn Gln Thr Val Ala Ser Trp Asn Leu Thr Thr Ser Met Gln 260 265 270 Asn Tyr Asn Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val Val Tyr 275 280 285 Thr Asn Asp Gly Gly Asn Arg Asp Val Gln Val Asp Tyr Ile Thr Val 290 295 300 Asn Gly Gln Thr Arg Gln Ser Glu Ala Gln Ser Phe Asn Thr Gly Leu 305 310 315 320 Tyr Ala Asn Gly Arg Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His 325 330 335 Cys Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro 340 345 <210> 223 <211> 642 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 223 atgtttaagt ttaaaaagaa tttcttagtt ggattatcgg cagctttaat gagtattagc 60 ttgttttcgg caaccgcctc tgcagctagc acagactact ggcaaaattg gactgatggg 120 ggcggtatag taaacgctgt caatgggtct ggcgggaatt acagtgttaa ttggtctaat 180 accggaaatt tcgttgttgg taaaggttgg actacaggtt cgccatttag gacgataaac 240 tataatgccg gagtttgggc accgaatgga aatggatatt taactttata tggttggacg 300 agatcacctc tcatagaata ttatgtagtg gattcatggg gtacttatag acctactgga 360 acgtataaag gtactgtaaa aagtgatggg ggtacatatg acatatatac aactacacgt 420 tataacgcac cttccattga tggcgatcgc actactttta cgcagtactg gagtgttcgc 480 caaacgaaga gaccaaccgg aagcaacgct acaatcactt tcagcaatca tgttaacgca 540 tggaagagcc atggaatgaa tctgggcagt aattgggctt accaagtcat ggcgacagaa 600 ggatatcaaa gtagtggaag ttctaacgta acagtgtggt aa 642 <210> 224 <211> 213 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(28) <400> 224 Met Phe Lys Phe Lys Lys Asn Phe Leu Val Gly Leu Ser Ala Ala Leu 1 5 10 15 Met Ser Ile Ser Leu Phe Ser Ala Thr Ala Ser Ala Ala Ser Thr Asp 20 25 30 Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Ile Val Asn Ala Val Asn 35 40 45 Gly Ser Gly Gly Asn Tyr Ser Val Asn Trp Ser Asn Thr Gly Asn Phe 50 55 60 Val Val Gly Lys Gly Trp Thr Thr Gly Ser Pro Phe Arg Thr Ile Asn 65 70 75 80 Tyr Asn Ala Gly Val Trp Ala Pro Asn Gly Asn Gly Tyr Leu Thr Leu 85 90 95 Tyr Gly Trp Thr Arg Ser Pro Leu Ile Glu Tyr Tyr Val Val Asp Ser 100 105 110 Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Thr Val Lys Ser 115 120 125 Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr Arg Tyr Asn Ala Pro 130 135 140 Ser Ile Asp Gly Asp Arg Thr Thr Phe Thr Gln Tyr Trp Ser Val Arg 145 150 155 160 Gln Thr Lys Arg Pro Thr Gly Ser Asn Ala Thr Ile Thr Phe Ser Asn 165 170 175 His Val Asn Ala Trp Lys Ser His Gly Met Asn Leu Gly Ser Asn Trp 180 185 190 Ala Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser Ser 195 200 205 Asn Val Thr Val Trp 210 <210> 225 <211> 1059 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 225 atgtttgtta gtctcaggaa gacggcttgg gcgtgcctgt tgctcgccgg cctcggaatc 60 tcgacttcac aagcccagac ctgcatcacg tccagcggga cgggcaccaa caacggccac 120 tactattcct tctggaagga cagtggcggc accgtcaact tctgcatgta cgcgaacggc 180 cgctacacct ccaactggag cggcatcaac aactgggtgg gcggcaaggg ctggcagacc 240 ggctcacgcc ggacgatcag ctactcgggc tcgttcaact cacccggcaa tggttatctc 300 accctgtacg gttggaccac caatccattg atcgagtact acatcgtcga caactggggc 360 acgtaccggc cgccgggagg ctcgggctac atgggcacgg tgacgagcga cggcggcacc 420 tacgacgtct atcgcaccca gcgcgtaaac cagccttcca tcatcggcac cgcgacgttc 480 tatcaatact ggagcgtgcg ccagcagaag cggaccggcg ggaccatcac caccggcaat 540 cacttcgacg cctgggccgc atacggaatg aacctcggca cccacaacta ccagatcatg 600 gcgaccgagg gttaccagag cagcggcagt tcggacatca cggtgagcga gggcggtggc 660 agttcatcga gcagcagctc gtcgagcagc agcagttcgt cctcttcgag cggcggcggc 720 ggcacgaaga gcttcacggt ccgcgcgcgc ggcacggcgg gcggtgaatc catcacgctg 780 cgcgtgaaca accagaacgt gcagacctgg acgctgggca cgtcgatgca gaactacacc 840 gcatcgacca cgctctccgg tggcatcacc gtcgcgtaca ccaacgacag cggcaatcgc 900 gacgtgcagg tggactacat cgtcgtgaac ggcgccaccc gccagtccga ggcgcagagc 960 tacaacaccg gtctctatgc caacggtcgt tgcggcggcg gctccaacag cgagtggatg 1020 cactgcaacg ggcagatcgg ctacgggaat actccctag 1059 <210> 226 <211> 352 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(25) <400> 226 Met Phe Val Ser Leu Arg Lys Thr Ala Trp Ala Cys Leu Leu Leu Ala 1 5 10 15 Gly Leu Gly Ile Ser Thr Ser Gln Ala Gln Thr Cys Ile Thr Ser Ser 20 25 30 Gly Thr Gly Thr Asn Asn Gly His Tyr Tyr Ser Phe Trp Lys Asp Ser 35 40 45 Gly Gly Thr Val Asn Phe Cys Met Tyr Ala Asn Gly Arg Tyr Thr Ser 50 55 60 Asn Trp Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr 65 70 75 80 Gly Ser Arg Arg Thr Ile Ser Tyr Ser Gly Ser Phe Asn Ser Pro Gly 85 90 95 Asn Gly Tyr Leu Thr Leu Tyr Gly Trp Thr Thr Asn Pro Leu Ile Glu 100 105 110 Tyr Tyr Ile Val Asp Asn Trp Gly Thr Tyr Arg Pro Pro Gly Gly Ser 115 120 125 Gly Tyr Met Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Val Tyr 130 135 140 Arg Thr Gln Arg Val Asn Gln Pro Ser Ile Ile Gly Thr Ala Thr Phe 145 150 155 160 Tyr Gln Tyr Trp Ser Val Arg Gln Gln Lys Arg Thr Gly Gly Thr Ile 165 170 175 Thr Thr Gly Asn His Phe Asp Ala Trp Ala Ala Tyr Gly Met Asn Leu 180 185 190 Gly Thr His Asn Tyr Gln Ile Met Ala Thr Glu Gly Tyr Gln Ser Ser 195 200 205 Gly Ser Ser Asp Ile Thr Val Ser Glu Gly Gly Gly Ser Ser Ser Ser 210 215 220 Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Gly Gly Gly 225 230 235 240 Gly Thr Lys Ser Phe Thr Val Arg Ala Arg Gly Thr Ala Gly Gly Glu 245 250 255 Ser Ile Thr Leu Arg Val Asn Asn Gln Asn Val Gln Thr Trp Thr Leu 260 265 270 Gly Thr Ser Met Gln Asn Tyr Thr Ala Ser Thr Thr Leu Ser Gly Gly 275 280 285 Ile Thr Val Ala Tyr Thr Asn Asp Ser Gly Asn Arg Asp Val Gln Val 290 295 300 Asp Tyr Ile Val Val Asn Gly Ala Thr Arg Gln Ser Glu Ala Gln Ser 305 310 315 320 Tyr Asn Thr Gly Leu Tyr Ala Asn Gly Arg Cys Gly Gly Gly Ser Asn 325 330 335 Ser Glu Trp Met His Cys Asn Gly Gln Ile Gly Tyr Gly Asn Thr Pro 340 345 350 <210> 227 <211> 747 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 227 atgggcggca cgactggtag tggcggctca gccgccgccg gcgcaggcac gagtggaagc 60 gcgggcggta ccgccggagc gctcggcccc ggcggtaccc agggcagcgg tggcgcagcc 120 ggtggtacga gcggaacggg cggggccatc agcagcagct gcacggaagc tgacaagacg 180 gtctgcaaca acgaaaccgg tcgccactgc aattacacgt acgagtattg gaaggaccag 240 ggaagcggtt gcctcgtgaa caaagccgac ggcttcagcg tcaactggaa caacatcaac 300 aatctgctgg gtcgcaaggg tctgaggccc ggatcgtcga atcagacggt gacctaccag 360 gcaaactacc agccgaacgg caattcatac ctgtgcgtat atggatggac gcaaaacccc 420 ctcgtcgaat actacatcgt cgatagctgg ggcagctggc gcccgccggg gggaacgtcc 480 atgggcaccg tcaacgcgga cggcggcacc tacgacatct accgcaccca gcgcgtcaac 540 cagccttcca tcgaaggcac caagaccttc tatcaatact ggagcgttcg cactcagaag 600 cgcacgagcg gaacgatcac ggttgccgct cacttcgacg cctgggcgac gaaggggatg 660 aacatgggga gtctgtacga ggtgtcgatg accgtcgagg gctatcaaag cagcgggacc 720 gccgacgtga gcttctcgat gaagtga 747 <210> 228 <211> 248 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(39) <400> 228 Met Gly Gly Thr Thr Gly Ser Gly Gly Ser Ala Ala Ala Gly Ala Gly 1 5 10 15 Thr Ser Gly Ser Ala Gly Gly Thr Ala Gly Ala Leu Gly Pro Gly Gly 20 25 30 Thr Gln Gly Ser Gly Gly Ala Ala Gly Gly Thr Ser Gly Thr Gly Gly 35 40 45 Ala Ile Ser Ser Ser Cys Thr Glu Ala Asp Lys Thr Val Cys Asn Asn 50 55 60 Glu Thr Gly Arg His Cys Asn Tyr Thr Tyr Glu Tyr Trp Lys Asp Gln 65 70 75 80 Gly Ser Gly Cys Leu Val Asn Lys Ala Asp Gly Phe Ser Val Asn Trp 85 90 95 Asn Asn Ile Asn Asn Leu Leu Gly Arg Lys Gly Leu Arg Pro Gly Ser 100 105 110 Ser Asn Gln Thr Val Thr Tyr Gln Ala Asn Tyr Gln Pro Asn Gly Asn 115 120 125 Ser Tyr Leu Cys Val Tyr Gly Trp Thr Gln Asn Pro Leu Val Glu Tyr 130 135 140 Tyr Ile Val Asp Ser Trp Gly Ser Trp Arg Pro Pro Gly Gly Thr Ser 145 150 155 160 Met Gly Thr Val Asn Ala Asp Gly Gly Thr Tyr Asp Ile Tyr Arg Thr 165 170 175 Gln Arg Val Asn Gln Pro Ser Ile Glu Gly Thr Lys Thr Phe Tyr Gln 180 185 190 Tyr Trp Ser Val Arg Thr Gln Lys Arg Thr Ser Gly Thr Ile Thr Val 195 200 205 Ala Ala His Phe Asp Ala Trp Ala Thr Lys Gly Met Asn Met Gly Ser 210 215 220 Leu Tyr Glu Val Ser Met Thr Val Glu Gly Tyr Gln Ser Ser Gly Thr 225 230 235 240 Ala Asp Val Ser Phe Ser Met Lys 245 <210> 229 <211> 642 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 229 atgtttaagt ttacaaagaa attcttagtt gggttaacgg cagctttgat gagtattagc 60 ttgttttcgg caaacgcctc tgcagctaac acagactact ggcaaaattg gactgatggg 120 ggcggaacag taaacgctgt caatgggtct ggcgggaatt acagtgtgaa ttggtctaat 180 accgggaatt tcgttgttgg taaaggttgg actacaggtt cgccatttag gacgataaac 240 tataatgccg gagtttgggc gccgaatggc aatgcatatt tgactttata tggttggacg 300 cgatcacccc tcatagaata ttatgtagtg gattcatggg gtacttatag acctactgga 360 acgtataaag gtacggttta cagtgatggg ggtacatatg acgtgtacac aactacacgt 420 tatgatgcac cttccattga tggcgataaa actactttta cgcagtactg gagtgttcgc 480 cagtcgaaga gaccaactgg aagcaacgct acaatcactt tcagcaatca cgttaacgca 540 tggaagagat atgggatgaa tctgggtagt aattggtctt accaagtctt agcgacagag 600 ggatatcaaa gtagtggaag ttctaacgta acagtgtggt aa 642 <210> 230 <211> 213 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(28) <400> 230 Met Phe Lys Phe Thr Lys Lys Phe Leu Val Gly Leu Thr Ala Ala Leu 1 5 10 15 Met Ser Ile Ser Leu Phe Ser Ala Asn Ala Ser Ala Ala Asn Thr Asp 20 25 30 Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr Val Asn Ala Val Asn 35 40 45 Gly Ser Gly Gly Asn Tyr Ser Val Asn Trp Ser Asn Thr Gly Asn Phe 50 55 60 Val Val Gly Lys Gly Trp Thr Thr Gly Ser Pro Phe Arg Thr Ile Asn 65 70 75 80 Tyr Asn Ala Gly Val Trp Ala Pro Asn Gly Asn Ala Tyr Leu Thr Leu 85 90 95 Tyr Gly Trp Thr Arg Ser Pro Leu Ile Glu Tyr Tyr Val Val Asp Ser 100 105 110 Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Thr Val Tyr Ser 115 120 125 Asp Gly Gly Thr Tyr Asp Val Tyr Thr Thr Thr Arg Tyr Asp Ala Pro 130 135 140 Ser Ile Asp Gly Asp Lys Thr Thr Phe Thr Gln Tyr Trp Ser Val Arg 145 150 155 160 Gln Ser Lys Arg Pro Thr Gly Ser Asn Ala Thr Ile Thr Phe Ser Asn 165 170 175 His Val Asn Ala Trp Lys Arg Tyr Gly Met Asn Leu Gly Ser Asn Trp 180 185 190 Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser Ser 195 200 205 Asn Val Thr Val Trp 210 <210> 231 <211> 1008 <212> DNA <213> Bacteria <400> 231 atgaacctgc tcgtccagcc gaggcgtcgc agacgcggtc cggtcacctt gctcgtcagg 60 agcgcgtggg ccgtcgcgct ggcggcgctc gccgcgctga tgctgccggg caccgcccag 120 gccgacacgg tcgtcacgac caaccaggag ggcaccaaca acggctacta ctactcgttc 180 tggaccgaca gccagggcac cgtctccatg aacatgggct ccggcggtca gtacagcacc 240 tcgtggcgca acaccggcaa cttcgtcgcg ggcaagggct gggccaacgg cggccgccgg 300 accgtgcagt actcgggcag cttcaacccc tccggcaacg cgtacctggc gctctacgga 360 tggacgtcga acccgctcgt cgagtactac atcgtcgaca actggggcac ctaccggccc 420 acgggcgagt acaagggcac cgtcaccagc gacggcggca cctacgacat ctacaagacg 480 acccgcgtca acaagccctc cgtcgagggc acccgcacct tcgaccagta ctggagcgtc 540 cggcaggcga agcggaccgg cggcaccatc acgaccggca accacttcga cgcgtgggcc 600 cgggccggga tgccgctcgg caacttcagc tactacatga tcatggccac cgagggctac 660 cagagcagcg gcagctccag catcaacgtc ggcgggaccg gccgcggcga caacggcggc 720 ggcgacaacg ggggcggtgg cggcgggtgc accgccacgg tgtccgccgg gcagaagtgg 780 ggcgaccggt acaacctcga cgtctccgtc agcggcgcca gcgactggac ggtgacgatg 840 aacgtgccgt ccccggcgaa ggtcctgtcg acctggaacg tcaacgccag ctatcccagt 900 gcgcagacgc tgaccgccag gtcgaacggc agcggcaaca actggggcgc caccatccag 960 gccaacggca actggacctg gcccagcgtg tcctgcagcg cgggctga 1008 <210> 232 <211> 335 <212> PRT <213> Bacteria <220> <221> SIGNAL <222> (1)...(41) <400> 232 Met Asn Leu Leu Val Gln Pro Arg Arg Arg Arg Arg Gly Pro Val Thr 1 5 10 15 Leu Leu Val Arg Ser Ala Trp Ala Val Ala Leu Ala Ala Leu Ala Ala 20 25 30 Leu Met Leu Pro Gly Thr Ala Gln Ala Asp Thr Val Val Thr Thr Asn 35 40 45 Gln Glu Gly Thr Asn Asn Gly Tyr Tyr Tyr Ser Phe Trp Thr Asp Ser 50 55 60 Gln Gly Thr Val Ser Met Asn Met Gly Ser Gly Gly Gln Tyr Ser Thr 65 70 75 80 Ser Trp Arg Asn Thr Gly Asn Phe Val Ala Gly Lys Gly Trp Ala Asn 85 90 95 Gly Gly Arg Arg Thr Val Gln Tyr Ser Gly Ser Phe Asn Pro Ser Gly 100 105 110 Asn Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Ser Asn Pro Leu Val Glu 115 120 125 Tyr Tyr Ile Val Asp Asn Trp Gly Thr Tyr Arg Pro Thr Gly Glu Tyr 130 135 140 Lys Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Lys Thr 145 150 155 160 Thr Arg Val Asn Lys Pro Ser Val Glu Gly Thr Arg Thr Phe Asp Gln 165 170 175 Tyr Trp Ser Val Arg Gln Ala Lys Arg Thr Gly Gly Thr Ile Thr Thr 180 185 190 Gly Asn His Phe Asp Ala Trp Ala Arg Ala Gly Met Pro Leu Gly Asn 195 200 205 Phe Ser Tyr Tyr Met Ile Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly 210 215 220 Ser Ser Ser Ile Asn Val Gly Gly Thr Gly Arg Gly Asp Asn Gly Gly 225 230 235 240 Gly Asp Asn Gly Gly Gly Gly Gly Gly Cys Thr Ala Thr Val Ser Ala 245 250 255 Gly Gln Lys Trp Gly Asp Arg Tyr Asn Leu Asp Val Ser Val Ser Gly 260 265 270 Ala Ser Asp Trp Thr Val Thr Met Asn Val Pro Ser Pro Ala Lys Val 275 280 285 Leu Ser Thr Trp Asn Val Asn Ala Ser Tyr Pro Ser Ala Gln Thr Leu 290 295 300 Thr Ala Arg Ser Asn Gly Ser Gly Asn Asn Trp Gly Ala Thr Ile Gln 305 310 315 320 Ala Asn Gly Asn Trp Thr Trp Pro Ser Val Ser Cys Ser Ala Gly 325 330 335 <210> 233 <211> 1071 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 233 atgtctatgt ttttgagtct caaaagagtg gcggcgctcg tctgcgtcgc agggtttggc 60 atttcggcgg cgaacgctca gtgcgtcact tcgagccaga caggaaccaa caacgggttc 120 tatttttcgt tctggaaaga tagtccggga accgtgaatt tctgcaacca gagcggtggc 180 cgctacacat ccaattggag cggtatcaac aactgggtcg gtggcaaggg ttggcagacc 240 ggctcgcgaa gggtcgtgag ctactccggt tcgttcaatt cgccgggcaa cgggtatctg 300 accctctatg ggtggaccac caatccgctc atcgagtact acatcgtcga caactggggc 360 tcgtatcgcc cgccgggcgg acaggggttc atgggcacgg tgaccagcga cggcggcacg 420 tacgatgtct accgcacaca gcgcgtcaat caaccctgca tcaccggcag cagttgcacc 480 ttctatcaat actggagcgt gcggcagtcg aagagaacgg gcggcacgat cacgacgggc 540 aatcactttg acgcgtgggc gagttacggc atgaacctgg gcgctcacaa ctaccagatc 600 atggcgaccg agggttatca aagcagcggg agctctgaca tcacggtcag tgaaggcagc 660 agcagtagca gcagtagcag cagttcgagc agtagctcga gcagcagctc cagcagcagc 720 agcggcggcg gtggcaccaa gagcttcacg gtccgcgcgc gcggcgtggc cggcggggaa 780 tccatcacgt tgcgcgtgaa caatcagaac gtgcagacct ggactctcgg caccggcatg 840 cagaactaca cggcgtcgac gtctttgagt ggcggcatca cggttgcgta taccaacgat 900 ggcggcagtc gcgacgtgca ggttgactac atcatcgtga acggccagac gcgtcagtcg 960 gaagcgcaga gctacaacac cgggctttat gccaacggcc gttgcggtgg cggcggcaac 1020 agcgaatgga tgcattgcaa tggcgccatt ggctacggga acacgccgta g 1071 <210> 234 <211> 356 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(26) <400> 234 Met Ser Met Phe Leu Ser Leu Lys Arg Val Ala Ala Leu Val Cys Val 1 5 10 15 Ala Gly Phe Gly Ile Ser Ala Ala Asn Ala Gln Cys Val Thr Ser Ser 20 25 30 Gln Thr Gly Thr Asn Asn Gly Phe Tyr Phe Ser Phe Trp Lys Asp Ser 35 40 45 Pro Gly Thr Val Asn Phe Cys Asn Gln Ser Gly Gly Arg Tyr Thr Ser 50 55 60 Asn Trp Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr 65 70 75 80 Gly Ser Arg Arg Val Val Ser Tyr Ser Gly Ser Phe Asn Ser Pro Gly 85 90 95 Asn Gly Tyr Leu Thr Leu Tyr Gly Trp Thr Thr Asn Pro Leu Ile Glu 100 105 110 Tyr Tyr Ile Val Asp Asn Trp Gly Ser Tyr Arg Pro Pro Gly Gly Gln 115 120 125 Gly Phe Met Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Val Tyr 130 135 140 Arg Thr Gln Arg Val Asn Gln Pro Cys Ile Thr Gly Ser Ser Cys Thr 145 150 155 160 Phe Tyr Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Thr Gly Gly Thr 165 170 175 Ile Thr Thr Gly Asn His Phe Asp Ala Trp Ala Ser Tyr Gly Met Asn 180 185 190 Leu Gly Ala His Asn Tyr Gln Ile Met Ala Thr Glu Gly Tyr Gln Ser 195 200 205 Ser Gly Ser Ser Asp Ile Thr Val Ser Glu Gly Ser Ser Ser Ser Ser 210 215 220 Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser 225 230 235 240 Ser Gly Gly Gly Gly Thr Lys Ser Phe Thr Val Arg Ala Arg Gly Val 245 250 255 Ala Gly Gly Glu Ser Ile Thr Leu Arg Val Asn Asn Gln Asn Val Gln 260 265 270 Thr Trp Thr Leu Gly Thr Gly Met Gln Asn Tyr Thr Ala Ser Thr Ser 275 280 285 Leu Ser Gly Gly Ile Thr Val Ala Tyr Thr Asn Asp Gly Gly Ser Arg 290 295 300 Asp Val Gln Val Asp Tyr Ile Ile Val Asn Gly Gln Thr Arg Gln Ser 305 310 315 320 Glu Ala Gln Ser Tyr Asn Thr Gly Leu Tyr Ala Asn Gly Arg Cys Gly 325 330 335 Gly Gly Gly Asn Ser Glu Trp Met His Cys Asn Gly Ala Ile Gly Tyr 340 345 350 Gly Asn Thr Pro 355 <210> 235 <211> 1539 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 235 atgtcgaata acagatttgt gctgaatcgt gttgctgcag gtttgctgct gggtttctcg 60 ctgctgtcat cagcagccat cgcccagaat gtggtggtaa atccttctac ggtccatcag 120 accgtgcgcg gctttggcgg catgaacgcg ccgggctgga ttgatgacct taccaccgcc 180 caggtcaata aggcctatgg cagtggcgat ggccaggtcg ggctctccat catgcgcatg 240 cgcattgatc cgaactcggc agcctggaat atccaggtgc cggctgccaa gcgggccaag 300 gagctgggtg cgatcctgtt tgccacgccc tggtcgccgc ccgcctacat gaaatccaac 360 aaaagcctga ataacggcgg caagctgctg cccgagtatt acagcgccta caccacccac 420 ctgctggatt ttgcgagttt catgtcgcgc aacggcgcac cgctgtatgc gatttcaatc 480 cagaacgaac cggactggct gccggattat gagtcgtgtg cctggactgg tactgatttc 540 gtcaattatc tgaataccca gggctcgcgt tttggtgatc tgaaagtgat tgcgccggaa 600 tccctgggtt tcacgacctc gtattccgac cccatcctca acagcgccac ggcagcgccg 660 catgtcgaca tcatcggcgg ccacctctac ggcgtgctgc ccaaggacta cccgctggcg 720 cgccagaagg gcaaggaaat ctggatgacc gagcattaca ccgagagcaa gaactcgggt 780 gatgcctggc cgctggcgct ggacgtaggc accgagctgc accagagcat ggtggccaac 840 tacaacgcct acgtgtggtg gtatgtgcgc cgcagctacg gcctgctgct ggagaacggc 900 aatgtgagca agcgcggcta catcatgtcg cagtacgcac gcttcgtccg ccccggctcc 960 aagcgcatcg gcgcgacgga aaagccgcac gccgacgtgg cggtgacggc ctacaagacg 1020 ccggataacc gcattgtgct ggtggcggtg aataccggtg cggcgcaccg tcagctgaac 1080 atcacggtgc cgagcggcag cgtgggttct ttcagcaagt tctccacttc cggcacgctg 1140 aatgtgggca gtggtggcag ctacaaggtc aacaacggcg cggtgagcct gtacatcgat 1200 ccgcagagcg tggccacgct ggtgggtgat ctgcccggca cggcctccag ctcttcggcg 1260 gcgtcctcgt cctcttccag tgcagccagc tctgcttcga gcagtgctag cggcgcaccg 1320 gccctgtctg gcagcagcga ttaccccacg ggcttcagca agtgcgctga tctgggtggt 1380 acttgtgccg tgccttcggg ctcgggctgg acggctttcg ggcgcaaggg caagtgggtt 1440 gccaagtacg tcggtgtggg caagagcatt gcctgcacgg tgacggcttt cggcagcgat 1500 cccggtggtg cacccaacaa gtgttcttac cagaagtaa 1539 <210> 236 <211> 512 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(28) <400> 236 Met Ser Asn Asn Arg Phe Val Leu Asn Arg Val Ala Ala Gly Leu Leu 1 5 10 15 Leu Gly Phe Ser Leu Leu Ser Ser Ala Ala Ile Ala Gln Asn Val Val 20 25 30 Val Asn Pro Ser Thr Val His Gln Thr Val Arg Gly Phe Gly Gly Met 35 40 45 Asn Ala Pro Gly Trp Ile Asp Asp Leu Thr Thr Ala Gln Val Asn Lys 50 55 60 Ala Tyr Gly Ser Gly Asp Gly Gln Val Gly Leu Ser Ile Met Arg Met 65 70 75 80 Arg Ile Asp Pro Asn Ser Ala Ala Trp Asn Ile Gln Val Pro Ala Ala 85 90 95 Lys Arg Ala Lys Glu Leu Gly Ala Ile Leu Phe Ala Thr Pro Trp Ser 100 105 110 Pro Pro Ala Tyr Met Lys Ser Asn Lys Ser Leu Asn Asn Gly Gly Lys 115 120 125 Leu Leu Pro Glu Tyr Tyr Ser Ala Tyr Thr Thr His Leu Leu Asp Phe 130 135 140 Ala Ser Phe Met Ser Arg Asn Gly Ala Pro Leu Tyr Ala Ile Ser Ile 145 150 155 160 Gln Asn Glu Pro Asp Trp Leu Pro Asp Tyr Glu Ser Cys Ala Trp Thr 165 170 175 Gly Thr Asp Phe Val Asn Tyr Leu Asn Thr Gln Gly Ser Arg Phe Gly 180 185 190 Asp Leu Lys Val Ile Ala Pro Glu Ser Leu Gly Phe Thr Thr Ser Tyr 195 200 205 Ser Asp Pro Ile Leu Asn Ser Ala Thr Ala Ala Pro His Val Asp Ile 210 215 220 Ile Gly Gly His Leu Tyr Gly Val Leu Pro Lys Asp Tyr Pro Leu Ala 225 230 235 240 Arg Gln Lys Gly Lys Glu Ile Trp Met Thr Glu His Tyr Thr Glu Ser 245 250 255 Lys Asn Ser Gly Asp Ala Trp Pro Leu Ala Leu Asp Val Gly Thr Glu 260 265 270 Leu His Gln Ser Met Val Ala Asn Tyr Asn Ala Tyr Val Trp Trp Tyr 275 280 285 Val Arg Arg Ser Tyr Gly Leu Leu Leu Glu Asn Gly Asn Val Ser Lys 290 295 300 Arg Gly Tyr Ile Met Ser Gln Tyr Ala Arg Phe Val Arg Pro Gly Ser 305 310 315 320 Lys Arg Ile Gly Ala Thr Glu Lys Pro His Ala Asp Val Ala Val Thr 325 330 335 Ala Tyr Lys Thr Pro Asp Asn Arg Ile Val Leu Val Ala Val Asn Thr 340 345 350 Gly Ala Ala His Arg Gln Leu Asn Ile Thr Val Pro Ser Gly Ser Val 355 360 365 Gly Ser Phe Ser Lys Phe Ser Thr Ser Gly Thr Leu Asn Val Gly Ser 370 375 380 Gly Gly Ser Tyr Lys Val Asn Asn Gly Ala Val Ser Leu Tyr Ile Asp 385 390 395 400 Pro Gln Ser Val Ala Thr Leu Val Gly Asp Leu Pro Gly Thr Ala Ser 405 410 415 Ser Ser Ser Ala Ala Ser Ser Ser Ser Ser Ser Ala Ala Ser Ser Ala 420 425 430 Ser Ser Ser Ala Ser Gly Ala Pro Ala Leu Ser Gly Ser Ser Asp Tyr 435 440 445 Pro Thr Gly Phe Ser Lys Cys Ala Asp Leu Gly Gly Thr Cys Ala Val 450 455 460 Pro Ser Gly Ser Gly Trp Thr Ala Phe Gly Arg Lys Gly Lys Trp Val 465 470 475 480 Ala Lys Tyr Val Gly Val Gly Lys Ser Ile Ala Cys Thr Val Thr Ala 485 490 495 Phe Gly Ser Asp Pro Gly Gly Ala Pro Asn Lys Cys Ser Tyr Gln Lys 500 505 510 <210> 237 <211> 1269 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 237 atgattccac gcataaaaaa aacaatttgt gtactattag tatgtttcac tatgctgtca 60 gtcatgttag ggccaggcgc tactgaagtt ttggcagcaa gtgatgtaac agttaatgta 120 tctgcagaga aacaagtgat tcgcggtttt ggagggatga atcatccggc ttgggctggg 180 gatcttacag cagctcaaag agaaactgct tttggcaatg gacagaacca gttaggattt 240 tcaatcttaa gaattcatgt agatgaaaat cgaaataatt ggtataaaga ggtggagact 300 gcaaagagtg cggtcaaaca cggagcaatc gtttttgctt ctccttggaa tcctccaagt 360 gatatggttg agacctttaa tcggaatggt gacacatcgg ctaaacggct gaaatacaac 420 aagtacgcag catacgcgca gcatcttaac gattttgtta ccttcatgaa gaataatggt 480 gtgaatcttt acgcgatttc ggtccaaaac gagcctgatt acgctcacga gtggacgtgg 540 tggacgccgc aagaaatact tcgctttatg agagaaaacg ccggctcgat caatgcccgc 600 gtcattgcgc ctgagtcatt tcaatacttg aagaatttgt cggacccgat cttgaacgat 660 ccgcaggctc ttgccaatat ggatattctc ggaactcacc tgtacggcac ccaggtcagc 720 caattccctt atcctctttt caaacaaaaa ggagcgggga aggacctttg gatgacggaa 780 gtatactatc caaacagtga taccaactcg gcggatcgat ggcctgaggc attggatgtt 840 tcacagcata ttcacaatgc gatggtagag ggggactttc aagcttatgt atggtggtac 900 atccgaagat catatggacc tatgaaagaa gatggtacga tcagcaaacg cggctacaat 960 atggctcatt tctcaaagtt tgtgcgtccc ggctatgtaa ggattgatgc aacgaaaaac 1020 cctaatgcga acgtttacgt gtcagcctat aaaggtgaca acaaggtcgt tattgttgcc 1080 atcaataaaa gcaacacagg agtcaaccaa aactttgttt tgcagaatgg atctgcttca 1140 aacgtatcta gatggatcac gagcagcagc agcaatctac aacctggaac gaatctcact 1200 gtatcaggca atcatttttg ggctcatctt ccagctcaaa gcgtgacaac atttgttgta 1260 aatcgttaa 1269 <210> 238 <211> 422 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(32) <400> 238 Met Ile Pro Arg Ile Lys Lys Thr Ile Cys Val Leu Leu Val Cys Phe 1 5 10 15 Thr Met Leu Ser Val Met Leu Gly Pro Gly Ala Thr Glu Val Leu Ala 20 25 30 Ala Ser Asp Val Thr Val Asn Val Ser Ala Glu Lys Gln Val Ile Arg 35 40 45 Gly Phe Gly Gly Met Asn His Pro Ala Trp Ala Gly Asp Leu Thr Ala 50 55 60 Ala Gln Arg Glu Thr Ala Phe Gly Asn Gly Gln Asn Gln Leu Gly Phe 65 70 75 80 Ser Ile Leu Arg Ile His Val Asp Glu Asn Arg Asn Asn Trp Tyr Lys 85 90 95 Glu Val Glu Thr Ala Lys Ser Ala Val Lys His Gly Ala Ile Val Phe 100 105 110 Ala Ser Pro Trp Asn Pro Pro Ser Asp Met Val Glu Thr Phe Asn Arg 115 120 125 Asn Gly Asp Thr Ser Ala Lys Arg Leu Lys Tyr Asn Lys Tyr Ala Ala 130 135 140 Tyr Ala Gln His Leu Asn Asp Phe Val Thr Phe Met Lys Asn Asn Gly 145 150 155 160 Val Asn Leu Tyr Ala Ile Ser Val Gln Asn Glu Pro Asp Tyr Ala His 165 170 175 Glu Trp Thr Trp Trp Thr Pro Gln Glu Ile Leu Arg Phe Met Arg Glu 180 185 190 Asn Ala Gly Ser Ile Asn Ala Arg Val Ile Ala Pro Glu Ser Phe Gln 195 200 205 Tyr Leu Lys Asn Leu Ser Asp Pro Ile Leu Asn Asp Pro Gln Ala Leu 210 215 220 Ala Asn Met Asp Ile Leu Gly Thr His Leu Tyr Gly Thr Gln Val Ser 225 230 235 240 Gln Phe Pro Tyr Pro Leu Phe Lys Gln Lys Gly Ala Gly Lys Asp Leu 245 250 255 Trp Met Thr Glu Val Tyr Tyr Pro Asn Ser Asp Thr Asn Ser Ala Asp 260 265 270 Arg Trp Pro Glu Ala Leu Asp Val Ser Gln His Ile His Asn Ala Met 275 280 285 Val Glu Gly Asp Phe Gln Ala Tyr Val Trp Trp Tyr Ile Arg Arg Ser 290 295 300 Tyr Gly Pro Met Lys Glu Asp Gly Thr Ile Ser Lys Arg Gly Tyr Asn 305 310 315 320 Met Ala His Phe Ser Lys Phe Val Arg Pro Gly Tyr Val Arg Ile Asp 325 330 335 Ala Thr Lys Asn Pro Asn Ala Asn Val Tyr Val Ser Ala Tyr Lys Gly 340 345 350 Asp Asn Lys Val Val Ile Val Ala Ile Asn Lys Ser Asn Thr Gly Val 355 360 365 Asn Gln Asn Phe Val Leu Gln Asn Gly Ser Ala Ser Asn Val Ser Arg 370 375 380 Trp Ile Thr Ser Ser Ser Ser Asn Leu Gln Pro Gly Thr Asn Leu Thr 385 390 395 400 Val Ser Gly Asn His Phe Trp Ala His Leu Pro Ala Gln Ser Val Thr 405 410 415 Thr Phe Val Val Asn Arg 420 <210> 239 <211> 1281 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 239 atgaatcgtt tcttgatttc acgttataag aaagccataa gtgcatgttt ggcccttgtc 60 cttgcgttgt ctctcatggc ggcacctggc gatgttgccg cagccagcga cgccgttata 120 aatgtatcgt cggagaaaca agtgatacgc ggtttcggag gcatcaacca cccggcatgg 180 atcggagatt tgacggcagc acagagagaa accgcatttg ggaacgggcc aaatcagtta 240 ggcttctcga tattaagaat ctacgtgcat gaagaccgaa atcagtggca ccgtgaactg 300 gatacggcca aacgagcgat tgcccttgga gctatcgtat tcgcttcgcc atggaatccg 360 cccgccgaca tggtcgagac cttcaaccgc aacggcgata cgtcggcaaa gcgacttcgt 420 tacgacaagt ataccgccta tgcccagcat cttaacgatt tcgtaaccta catgagaaac 480 aatggcgtga atctctacgc gatttccgtc cagaacgagc ccgattatgc gcatgactgg 540 acgtggtgga ctccgcagga aatgcttcgc tttatgaaag aaaatgccgg atcgatcaac 600 agcagagtga tcgcaccgga atcgttccaa tatctgaaaa atatgtcgga cccgattcta 660 aatgatcccc aggcgcttgc caatatggat attcttggcg ctcatctgta cggtacccaa 720 gttagcaatt tcgcgtatcc actattcaaa caaaaaggag cgggaaaaga cctctggatg 780 accgaggtgt attacccgaa cagcgacaac aactcggcgg atcgctggcc cgaagccctg 840 gatgtgtctt accatatcca caatgcgatg gtagagggag attttcaagc ttatgtatgg 900 tggtatatcc gcagatccta tggtccaatg aaagaggacg gcacgatcag caaacgcggc 960 tacaatatgg ctcatttctc caagtttgtc cgtcccggct atgtcagggt ggatgcttcg 1020 aaaaatccag aaacgaacgt ttacgtatcc gcatataaag gcgacaacaa aatcgttatc 1080 gttgccataa accggaacaa ctccggggtc aatcagaact ttgtccttca gaatggatcc 1140 gtttcgcagg tatcaaggtg gatcacgagc agcagcagca atctccagcc aggaacgtct 1200 ctcaatgtaa cagggagcaa tttctgggct catcttcccg cgcaaagcgt tacgactttt 1260 gtgggtgaac tcggaaggta a 1281 <210> 240 <211> 426 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(30) <400> 240 Met Asn Arg Phe Leu Ile Ser Arg Tyr Lys Lys Ala Ile Ser Ala Cys 1 5 10 15 Leu Ala Leu Val Leu Ala Leu Ser Leu Met Ala Ala Pro Gly Asp Val 20 25 30 Ala Ala Ala Ser Asp Ala Val Ile Asn Val Ser Ser Glu Lys Gln Val 35 40 45 Ile Arg Gly Phe Gly Gly Ile Asn His Pro Ala Trp Ile Gly Asp Leu 50 55 60 Thr Ala Ala Gln Arg Glu Thr Ala Phe Gly Asn Gly Pro Asn Gln Leu 65 70 75 80 Gly Phe Ser Ile Leu Arg Ile Tyr Val His Glu Asp Arg Asn Gln Trp 85 90 95 His Arg Glu Leu Asp Thr Ala Lys Arg Ala Ile Ala Leu Gly Ala Ile 100 105 110 Val Phe Ala Ser Pro Trp Asn Pro Pro Ala Asp Met Val Glu Thr Phe 115 120 125 Asn Arg Asn Gly Asp Thr Ser Ala Lys Arg Leu Arg Tyr Asp Lys Tyr 130 135 140 Thr Ala Tyr Ala Gln His Leu Asn Asp Phe Val Thr Tyr Met Arg Asn 145 150 155 160 Asn Gly Val Asn Leu Tyr Ala Ile Ser Val Gln Asn Glu Pro Asp Tyr 165 170 175 Ala His Asp Trp Thr Trp Trp Thr Pro Gln Glu Met Leu Arg Phe Met 180 185 190 Lys Glu Asn Ala Gly Ser Ile Asn Ser Arg Val Ile Ala Pro Glu Ser 195 200 205 Phe Gln Tyr Leu Lys Asn Met Ser Asp Pro Ile Leu Asn Asp Pro Gln 210 215 220 Ala Leu Ala Asn Met Asp Ile Leu Gly Ala His Leu Tyr Gly Thr Gln 225 230 235 240 Val Ser Asn Phe Ala Tyr Pro Leu Phe Lys Gln Lys Gly Ala Gly Lys 245 250 255 Asp Leu Trp Met Thr Glu Val Tyr Tyr Pro Asn Ser Asp Asn Asn Ser 260 265 270 Ala Asp Arg Trp Pro Glu Ala Leu Asp Val Ser Tyr His Ile His Asn 275 280 285 Ala Met Val Glu Gly Asp Phe Gln Ala Tyr Val Trp Trp Tyr Ile Arg 290 295 300 Arg Ser Tyr Gly Pro Met Lys Glu Asp Gly Thr Ile Ser Lys Arg Gly 305 310 315 320 Tyr Asn Met Ala His Phe Ser Lys Phe Val Arg Pro Gly Tyr Val Arg 325 330 335 Val Asp Ala Ser Lys Asn Pro Glu Thr Asn Val Tyr Val Ser Ala Tyr 340 345 350 Lys Gly Asp Asn Lys Ile Val Ile Val Ala Ile Asn Arg Asn Asn Ser 355 360 365 Gly Val Asn Gln Asn Phe Val Leu Gln Asn Gly Ser Val Ser Gln Val 370 375 380 Ser Arg Trp Ile Thr Ser Ser Ser Ser Asn Leu Gln Pro Gly Thr Ser 385 390 395 400 Leu Asn Val Thr Gly Ser Asn Phe Trp Ala His Leu Pro Ala Gln Ser 405 410 415 Val Thr Thr Phe Val Gly Glu Leu Gly Arg 420 425 <210> 241 <211> 1695 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 241 gtgaagatat tgaaatttaa gatgaattta aaaaaatcgg ttcatgttct gttggcctgt 60 ttaacagccc tgcctctcat gttaacgccg acacacgtat cagcagcaag tgatgccaac 120 attaatttgt cctccgaaaa acagcttatc aaggggtttg gaggtattaa ccacccagcc 180 tggattggcg acttgacggc agctcagcgt gaaacagcct ttggcaacgg agcgaaccag 240 cttggttttt ccatactaag aatctatgtc gatgaaaatc caaacaactg gtacagggag 300 gtggctactg ccaaaagagc catagagcaa ggtgccatcg tattcgcttc tccctggaat 360 ccaccaagtg acatggtcga aaccttcaat cggaacgggg atacgaacgc caaacgattg 420 agatacgaca aatatgctgc gtacgcgcag catctgaacg actttgtcag ttatatgaaa 480 aataacggtg tggatctgta tgccatttcg gtacaaaatg agccggatta tgcccatgaa 540 tggacctggt ggactccgca ggagatcctt cgtttcatga aggagaatgc gggatccatt 600 cagaatacca aagtcatggc acctgaatcg ttccagtatt tgaaaaacat gtctgacccg 660 attctgaatg atcctcaggc actcgccaat atggacattc tgggagctca tacgtacggg 720 acacagttca aagatttcgc atacccgctc tttaagcaaa agggagccgg caaagaactg 780 tggatgacag aagtgtatta cccgaacagc gataacaact cgtcggaccg ttggcctgag 840 gcattggacg tatcttacca tatgcataat gccatggttg aaggagattt tcaggcttac 900 gtatggtggt atattcggag acagtacggt ccgatgaatg agaacgggac tattagcaaa 960 cgtggttaca atatggccca tttctccaaa tttgtgcgac caggctatta ccgtgtcgat 1020 gcaaccaaaa atccggatac caataccttc gtctcagcct ataaaggtga taataaggca 1080 gtcattgtgg cgattaatcg cggcacctcg gctgtaagcc aaaaattcgt tcttcagaat 1140 ggtaacgctt ctactgtatc ctcttgggtt acggatagca gccgaaacct ggcaagcgga 1200 gcgccgatta cgatgtcagg tggagccttt acagcacaac tgccagccca aagcgtaaca 1260 acgtttgtag ccaacattac tggtggtagt gtcactccag gcagcggaac cacgtacgag 1320 gcggaaacgg gcactacact taccgatgcc gtgatcgaga ctctctaccc gggatacact 1380 gggaccggat acgtgaactt taatgcgtat actggttcgg ccattcaatg gaatgccatc 1440 aataacacga taacaggtac caaaaatgtg aaatttcgtt acgcccagga aagcggaacg 1500 cgtaatctcg acattttcgt taacggaact aaagtcatca gcaacgaacc tttcccggca 1560 acaggcagct ggtcgacctg gagtgaaaaa actattcagg tccccatgaa cgcgggaacc 1620 aatacgatta aagtggtcac aaccggtaca gaagggccaa atattgataa catcaatgtc 1680 actgcagtcc aataa 1695 <210> 242 <211> 564 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(28) <400> 242 Val Lys Ile Leu Lys Phe Lys Met Asn Leu Lys Lys Ser Val His Val 1 5 10 15 Leu Leu Ala Cys Leu Thr Ala Leu Pro Leu Met Leu Thr Pro Thr His 20 25 30 Val Ser Ala Ala Ser Asp Ala Asn Ile Asn Leu Ser Ser Glu Lys Gln 35 40 45 Leu Ile Lys Gly Phe Gly Gly Ile Asn His Pro Ala Trp Ile Gly Asp 50 55 60 Leu Thr Ala Ala Gln Arg Glu Thr Ala Phe Gly Asn Gly Ala Asn Gln 65 70 75 80 Leu Gly Phe Ser Ile Leu Arg Ile Tyr Val Asp Glu Asn Pro Asn Asn 85 90 95 Trp Tyr Arg Glu Val Ala Thr Ala Lys Arg Ala Ile Glu Gln Gly Ala 100 105 110 Ile Val Phe Ala Ser Pro Trp Asn Pro Pro Ser Asp Met Val Glu Thr 115 120 125 Phe Asn Arg Asn Gly Asp Thr Asn Ala Lys Arg Leu Arg Tyr Asp Lys 130 135 140 Tyr Ala Ala Tyr Ala Gln His Leu Asn Asp Phe Val Ser Tyr Met Lys 145 150 155 160 Asn Asn Gly Val Asp Leu Tyr Ala Ile Ser Val Gln Asn Glu Pro Asp 165 170 175 Tyr Ala His Glu Trp Thr Trp Trp Thr Pro Gln Glu Ile Leu Arg Phe 180 185 190 Met Lys Glu Asn Ala Gly Ser Ile Gln Asn Thr Lys Val Met Ala Pro 195 200 205 Glu Ser Phe Gln Tyr Leu Lys Asn Met Ser Asp Pro Ile Leu Asn Asp 210 215 220 Pro Gln Ala Leu Ala Asn Met Asp Ile Leu Gly Ala His Thr Tyr Gly 225 230 235 240 Thr Gln Phe Lys Asp Phe Ala Tyr Pro Leu Phe Lys Gln Lys Gly Ala 245 250 255 Gly Lys Glu Leu Trp Met Thr Glu Val Tyr Tyr Pro Asn Ser Asp Asn 260 265 270 Asn Ser Ser Asp Arg Trp Pro Glu Ala Leu Asp Val Ser Tyr His Met 275 280 285 His Asn Ala Met Val Glu Gly Asp Phe Gln Ala Tyr Val Trp Trp Tyr 290 295 300 Ile Arg Arg Gln Tyr Gly Pro Met Asn Glu Asn Gly Thr Ile Ser Lys 305 310 315 320 Arg Gly Tyr Asn Met Ala His Phe Ser Lys Phe Val Arg Pro Gly Tyr 325 330 335 Tyr Arg Val Asp Ala Thr Lys Asn Pro Asp Thr Asn Thr Phe Val Ser 340 345 350 Ala Tyr Lys Gly Asp Asn Lys Ala Val Ile Val Ala Ile Asn Arg Gly 355 360 365 Thr Ser Ala Val Ser Gln Lys Phe Val Leu Gln Asn Gly Asn Ala Ser 370 375 380 Thr Val Ser Ser Trp Val Thr Asp Ser Ser Arg Asn Leu Ala Ser Gly 385 390 395 400 Ala Pro Ile Thr Met Ser Gly Gly Ala Phe Thr Ala Gln Leu Pro Ala 405 410 415 Gln Ser Val Thr Thr Phe Val Ala Asn Ile Thr Gly Gly Ser Val Thr 420 425 430 Pro Gly Ser Gly Thr Thr Tyr Glu Ala Glu Thr Gly Thr Thr Leu Thr 435 440 445 Asp Ala Val Ile Glu Thr Leu Tyr Pro Gly Tyr Thr Gly Thr Gly Tyr 450 455 460 Val Asn Phe Asn Ala Tyr Thr Gly Ser Ala Ile Gln Trp Asn Ala Ile 465 470 475 480 Asn Asn Thr Ile Thr Gly Thr Lys Asn Val Lys Phe Arg Tyr Ala Gln 485 490 495 Glu Ser Gly Thr Arg Asn Leu Asp Ile Phe Val Asn Gly Thr Lys Val 500 505 510 Ile Ser Asn Glu Pro Phe Pro Ala Thr Gly Ser Trp Ser Thr Trp Ser 515 520 525 Glu Lys Thr Ile Gln Val Pro Met Asn Ala Gly Thr Asn Thr Ile Lys 530 535 540 Val Val Thr Thr Gly Thr Glu Gly Pro Asn Ile Asp Asn Ile Asn Val 545 550 555 560 Thr Ala Val Gln <210> 243 <211> 1272 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 243 atgatttcaa gcgtaaaaaa accaatttgt gtattattgg tatgtttcac tatgctgtca 60 gtcatgttag ccgggccagg tgctactgaa gttttagcag caagtgatgt aacaattaat 120 ttatctgcag aaaaacaagt gatccgcggt tttggaggca tgaaccaccc ggcttggatt 180 ggagatttga cagcagctca aagagaaacc gcttttggca atggacagaa tcagttaggt 240 ttttcaatct taagaattca tgtggatgaa aatagaaata attggtacag agaagtggag 300 actgcaaaga gtgcgatcaa acatggagca atcgtttttg cttctccctg gaatcctcca 360 agcgatatgg ttgagacttt caatcgtaat ggtgacacat cagctaaacg gctaagatac 420 gataagtacg ccgcatacgc gcagcatctt aacgattttg ttacctacat gaagaataat 480 ggcgtgaatc tttatgcgat ttctgttcaa aacgagcctg attatgcgca cgaatggacg 540 tggtggactc cgcaagaaat acttcgtttc atgagagaaa atgccggttc cattaatgca 600 cgtgtcattg caccagaatc ttttcagtac tttaaaaata tatcggaccc cattttgaac 660 gatccacagg cgcttaggaa tatggatatt ctcggaactc acctgtacgg tactcaggtc 720 agtcagtttc cttatcctct attcaaacaa aaaggagcag ggaaagagct atggatgacg 780 gaagtatact atccaaacag tgacaacaat tcagcggatc gctggcccga ggcattaggc 840 gtttcagagc atattcacca ttcaatggtg gagggagatt ttcaatctta tgtttggtgg 900 tacatccgca gatcttacgg tcctatgaaa gaggacggta cgatcagcaa acgcggttac 960 aatatggctc atttctcgaa gtttgtgcgt cccggctatg taagggtaga tgcaacgaaa 1020 aatcctaatg cgaacgttta cgtgtcagcc tataaaggtg acaacaaggt cgttattgtt 1080 gccattaaca aaagcaatac aggggtcaac caaaactttg tgttgcagaa tggatctgct 1140 tctcaggtat ctaggtggat aacaagcgga agcagcaatc ttcaacctgg aacgaatctc 1200 aatgtaacgg gcaatcattt ttgggcccat cttccagctc aaagcgtgac aacatttgtc 1260 gcaaatcgtt aa 1272 <210> 244 <211> 423 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(33) <400> 244 Met Ile Ser Ser Val Lys Lys Pro Ile Cys Val Leu Leu Val Cys Phe 1 5 10 15 Thr Met Leu Ser Val Met Leu Ala Gly Pro Gly Ala Thr Glu Val Leu 20 25 30 Ala Ala Ser Asp Val Thr Ile Asn Leu Ser Ala Glu Lys Gln Val Ile 35 40 45 Arg Gly Phe Gly Gly Met Asn His Pro Ala Trp Ile Gly Asp Leu Thr 50 55 60 Ala Ala Gln Arg Glu Thr Ala Phe Gly Asn Gly Gln Asn Gln Leu Gly 65 70 75 80 Phe Ser Ile Leu Arg Ile His Val Asp Glu Asn Arg Asn Asn Trp Tyr 85 90 95 Arg Glu Val Glu Thr Ala Lys Ser Ala Ile Lys His Gly Ala Ile Val 100 105 110 Phe Ala Ser Pro Trp Asn Pro Pro Ser Asp Met Val Glu Thr Phe Asn 115 120 125 Arg Asn Gly Asp Thr Ser Ala Lys Arg Leu Arg Tyr Asp Lys Tyr Ala 130 135 140 Ala Tyr Ala Gln His Leu Asn Asp Phe Val Thr Tyr Met Lys Asn Asn 145 150 155 160 Gly Val Asn Leu Tyr Ala Ile Ser Val Gln Asn Glu Pro Asp Tyr Ala 165 170 175 His Glu Trp Thr Trp Trp Thr Pro Gln Glu Ile Leu Arg Phe Met Arg 180 185 190 Glu Asn Ala Gly Ser Ile Asn Ala Arg Val Ile Ala Pro Glu Ser Phe 195 200 205 Gln Tyr Phe Lys Asn Ile Ser Asp Pro Ile Leu Asn Asp Pro Gln Ala 210 215 220 Leu Arg Asn Met Asp Ile Leu Gly Thr His Leu Tyr Gly Thr Gln Val 225 230 235 240 Ser Gln Phe Pro Tyr Pro Leu Phe Lys Gln Lys Gly Ala Gly Lys Glu 245 250 255 Leu Trp Met Thr Glu Val Tyr Tyr Pro Asn Ser Asp Asn Asn Ser Ala 260 265 270 Asp Arg Trp Pro Glu Ala Leu Gly Val Ser Glu His Ile His His Ser 275 280 285 Met Val Glu Gly Asp Phe Gln Ser Tyr Val Trp Trp Tyr Ile Arg Arg 290 295 300 Ser Tyr Gly Pro Met Lys Glu Asp Gly Thr Ile Ser Lys Arg Gly Tyr 305 310 315 320 Asn Met Ala His Phe Ser Lys Phe Val Arg Pro Gly Tyr Val Arg Val 325 330 335 Asp Ala Thr Lys Asn Pro Asn Ala Asn Val Tyr Val Ser Ala Tyr Lys 340 345 350 Gly Asp Asn Lys Val Val Ile Val Ala Ile Asn Lys Ser Asn Thr Gly 355 360 365 Val Asn Gln Asn Phe Val Leu Gln Asn Gly Ser Ala Ser Gln Val Ser 370 375 380 Arg Trp Ile Thr Ser Gly Ser Ser Asn Leu Gln Pro Gly Thr Asn Leu 385 390 395 400 Asn Val Thr Gly Asn His Phe Trp Ala His Leu Pro Ala Gln Ser Val 405 410 415 Thr Thr Phe Val Ala Asn Arg 420 <210> 245 <211> 1263 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 245 atgtcaatga tcaaaaaacc aatctgcact ttattgatct gcttcaccat gctgtctgtc 60 atgttcatcg gacctggcgt gactgaggtt tcagcagcag atgccaatat taatatcaat 120 gcggaaagac aagtgattcg cggctttggc ggaatgaacc atccggcttg gattggtgat 180 ttgaccgcac ctcaaaggga aaccgccttt ggcaatgggc agaatcaatt aggattttcc 240 attctaagaa tttttgtaga tgagaaccga aataattggc acagagaggt cgctactgcc 300 aaaagagcaa tagagcatgg agctttggtg atcgcttcac catggaatcc tccaagcaat 360 atggtagaga ccttcaaccg gaatggtaca tctgcaaagc ggctcagata caaccaatac 420 gccgcatatg ctcagcatct gaacgatttt gtgacgtata tgaaaaataa tggcgtcaat 480 ctctatgcta tatctgtaca aaatgagccc gattatgcac acgaatggac atggtggact 540 cctcaggaaa tcctgcgttt catgagagaa aatgctggct ccattaatgc ccgcgtgatc 600 gcaccagaat cctttcaata ccttaaaaat atatcagatc ctatcctaaa cgatccgcag 660 gcgcttggaa acatggacat tctcggagcc catttgtacg gaacccaaat cagccagctt 720 ccgtatcctc ttttcaaaca aaagggaggg ggaaaggagc tttggatgac agaggtctac 780 tacccgaata gcgataacaa ttcagcggac cgctggcctg aagcattagg ggtttcagag 840 catattcacc attcgatggt agaaggggac tttcaggcat atgtttggtg gtacattcgc 900 agatcctacg gccctatgaa agaagacggt ctaatcagca aacgtggtta caacatggcg 960 catttctcca agtttgtacg cccaggatac atcagaattg atgcaacgaa aagtcctgaa 1020 ccgaatgttt tcgtatcagc ctataaagga aacaatcaag tcgtcattgt cgcgattaac 1080 aaaaacaata caggagtcaa tcagcacttt gtgatgcaaa acggaactgc ttcacaagcg 1140 tcaagatgga tcacaagtag caacagcaac cttcagcctg gtacagactt aaatatatca 1200 ggtaatcaat tttgggctca tctcccggct caaagtgtga caacatttgt ggtcaaacgc 1260 tag 1263 <210> 246 <211> 401 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(32) <400> 246 Met Ser Met Ile Lys Lys Pro Ile Cys Thr Leu Leu Ile Cys Phe Thr 1 5 10 15 Met Leu Ser Val Met Phe Ile Gly Pro Gly Val Thr Glu Val Ser Ala 20 25 30 Ala Asp Ala Asn Ile Asn Ile Asn Ala Glu Arg Gln Val Ile Arg Gly 35 40 45 Phe Gly Gly Met Asn His Pro Ala Trp Ile Gly Asp Leu Thr Ala Pro 50 55 60 Gln Arg Glu Thr Ala Phe Gly Asn Gly Gln Asn Gln Leu Gly Phe Ser 65 70 75 80 Ile Leu Arg Ile Phe Val Asp Glu Asn Arg Asn Asn Trp His Arg Glu 85 90 95 Val Ala Thr Ala Lys Arg Ala Ile Glu His Gly Ala Leu Val Ile Ala 100 105 110 Ser Pro Trp Asn Pro Pro Ser Asn Met Val Glu Thr Phe Asn Arg Asn 115 120 125 Gly Thr Ser Ala Lys Arg Leu Arg Tyr Asn Gln Tyr Ala Ala Tyr Ala 130 135 140 Gln His Leu Asn Asp Phe Val Thr Tyr Met Lys Asn Asn Gly Val Asn 145 150 155 160 Leu Tyr Ala Ile Ser Val Gln Asn Glu Pro Asp Tyr Ala His Glu Trp 165 170 175 Thr Trp Trp Thr Pro Gln Glu Ile Leu Arg Phe Met Arg Glu Asn Ala 180 185 190 Gly Ser Ile Asn Ala Arg Val Ile Ala Pro Glu Ser Phe Gln Tyr Leu 195 200 205 Lys Asn Ile Ser Asp Pro Ile Leu Asn Asp Pro Gln Ala Leu Gly Asn 210 215 220 Met Asp Ile Leu Gly Ala His Leu Tyr Gly Thr Gln Ile Ser Gln Leu 225 230 235 240 Pro Tyr Pro Leu Phe Lys Gln Lys Gly Gly Gly Lys Glu Leu Trp Met 245 250 255 Thr Glu Val Tyr Tyr Pro Asn Ser Asp Asn Asn Ser Ala Asp Arg Trp 260 265 270 Pro Glu Ala Leu Gly Val Ser Glu His Ile His His Ser Met Val Glu 275 280 285 Gly Asp Phe Gln Ala Tyr Val Trp Trp Tyr Ile Arg Arg Ser Tyr Gly 290 295 300 Pro Met Lys Glu Asp Gly Leu Ile Ser Lys Arg Gly Tyr Asn Met Ala 305 310 315 320 His Phe Ser Lys Phe Val Arg Pro Gly Tyr Ile Arg Ile Asp Ala Thr 325 330 335 Lys Ser Pro Glu Pro Asn Val Phe Val Ser Ala Tyr Lys Gly Asn Asn 340 345 350 Gln Val Val Ile Val Ala Ile Asn Lys Asn Asn Thr Gly Val Asn Gln 355 360 365 His Phe Val Met Gln Asn Gly Thr Ala Ser Gln Ala Ser Arg Trp Ile 370 375 380 Thr Ser Ser Asn Ser Asn Leu Gln Pro Gly Thr Asp Leu Asn Ile Ser 385 390 395 400 Gly <210> 247 <211> 1044 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 247 gtgtttgcca acgatttcct gataggcgtg gcgctcaact cacggcaggt cgccggggaa 60 tccgaggccg gaaaactagc tggcgcgcaa ttttcgtcgg tgacggcgga gaatgagatg 120 aagtggcagt cgctccatcc ccagcccgac cgctatcagt tcggcgcggc ggactcctac 180 atcgattttg ccaaaaaaca caagatggcg gtgatcggcc acacgctcgt gtggcacagc 240 cagacacccg gctgggtgtt cgagggcaag gacggcaagc cggcgacccg cgaggatctg 300 ctcaagcgca tgcgcgatca catccacacc gtggccggac gctacaaggg caaggtgcgc 360 ggctgggacg tggtcaacga ggccttgtcc gacggcggtc ccgaaatcct gcgggattct 420 ccgtggcggc gcatcatcgg cgatgacttc atcgaccacg cgttccgttt cgcccgtgag 480 gccgatccga aagccgaact ctactacaac gactacggtc tcgagaacga aaggaagcgg 540 agcaactgca tcaagctcgt caagggcatg aaacaacgcg gcgtgccgat cgacggggtg 600 ggcacccagt cgcatttcca cttgaaacat ccctcgctcc aggaaatcga aaagaccatc 660 aaggactttt ccgaactcgg actcaaggtg atgatcaccg agctggatgt cgatgtgctg 720 ccgtcgcgtg gcaatttcgg caacgccgac atcagccgcc gcgagcaggg cggtgacgca 780 ctcaatcctt acaccggcgg cttgcccgat gaggtccaac aggaacttgc gaaacgctat 840 gcggacattt ttgatatcta tctgcgccac cggaaggcgg tcacccgcgt aaccttctgg 900 ggactcgatg acgggcatac ctggttgaac ggtttcccga tccgcggacg caccaactat 960 ccgctgttgt tcgaccgcgc cctcaagccg aagcccgcgt tcgaggcggt catcaaaaaa 1020 gggcttgaac ccaggaaacg ttga 1044 <210> 248 <211> 347 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 248 Val Phe Ala Asn Asp Phe Leu Ile Gly Val Ala Leu Asn Ser Arg Gln 1 5 10 15 Val Ala Gly Glu Ser Glu Ala Gly Lys Leu Ala Gly Ala Gln Phe Ser 20 25 30 Ser Val Thr Ala Glu Asn Glu Met Lys Trp Gln Ser Leu His Pro Gln 35 40 45 Pro Asp Arg Tyr Gln Phe Gly Ala Ala Asp Ser Tyr Ile Asp Phe Ala 50 55 60 Lys Lys His Lys Met Ala Val Ile Gly His Thr Leu Val Trp His Ser 65 70 75 80 Gln Thr Pro Gly Trp Val Phe Glu Gly Lys Asp Gly Lys Pro Ala Thr 85 90 95 Arg Glu Asp Leu Leu Lys Arg Met Arg Asp His Ile His Thr Val Ala 100 105 110 Gly Arg Tyr Lys Gly Lys Val Arg Gly Trp Asp Val Val Asn Glu Ala 115 120 125 Leu Ser Asp Gly Gly Pro Glu Ile Leu Arg Asp Ser Pro Trp Arg Arg 130 135 140 Ile Ile Gly Asp Asp Phe Ile Asp His Ala Phe Arg Phe Ala Arg Glu 145 150 155 160 Ala Asp Pro Lys Ala Glu Leu Tyr Tyr Asn Asp Tyr Gly Leu Glu Asn 165 170 175 Glu Arg Lys Arg Ser Asn Cys Ile Lys Leu Val Lys Gly Met Lys Gln 180 185 190 Arg Gly Val Pro Ile Asp Gly Val Gly Thr Gln Ser His Phe His Leu 195 200 205 Lys His Pro Ser Leu Gln Glu Ile Glu Lys Thr Ile Lys Asp Phe Ser 210 215 220 Glu Leu Gly Leu Lys Val Met Ile Thr Glu Leu Asp Val Asp Val Leu 225 230 235 240 Pro Ser Arg Gly Asn Phe Gly Asn Ala Asp Ile Ser Arg Arg Glu Gln 245 250 255 Gly Gly Asp Ala Leu Asn Pro Tyr Thr Gly Gly Leu Pro Asp Glu Val 260 265 270 Gln Gln Glu Leu Ala Lys Arg Tyr Ala Asp Ile Phe Asp Ile Tyr Leu 275 280 285 Arg His Arg Lys Ala Val Thr Arg Val Thr Phe Trp Gly Leu Asp Asp 290 295 300 Gly His Thr Trp Leu Asn Gly Phe Pro Ile Arg Gly Arg Thr Asn Tyr 305 310 315 320 Pro Leu Leu Phe Asp Arg Ala Leu Lys Pro Lys Pro Ala Phe Glu Ala 325 330 335 Val Ile Lys Lys Gly Leu Glu Pro Arg Lys Arg 340 345 <210> 249 <211> 1439 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 249 tgatcaatcc agtgaaggat cttcgtgaag atttcatctt tggaatggac gtttcaatgc 60 tctacgagat agagcggctc ggtggtaagt tcttcgatgg tggtgtggag aaagatcttt 120 tccagatact gaaggatcat gagataaact ggatcagatt gagagtgtgg aacgatccaa 180 gggatgaaaa cggaaatccg ctcggtgggg gaaactgtga ttatctgaaa atgacagaga 240 tcgcaaaaag ggccaaaaag tacggaatga aggttcttct tgactttcac tacagcgact 300 ggtgggcaga tcccggcaag cagtacaaac caaaagagtg ggatcacctt catggagaac 360 ttctggaaag ggcggtgtat tcctacacga aactcgtgct gaatcatatg agaagaaacg 420 gtgcactgcc ggacatggtc caggtgggaa acgaggtgaa caacggcttt ctctggccgg 480 atggaatgat tgccggaaag gatgcaggag gattcgacgg attcacaaaa cttttgaagg 540 cggccatcaa agccgtcagg gaagttgatc ccgatatcaa gatagtcatt catttggcag 600 aaggtggaaa caactcactt ttcaggtggt tcttcgacga gatcacaaga agagacgtgg 660 attttgatgt gatcggtgta tcgtactatc cgtactggca tggtaccctg gatgacctga 720 agaacaacct gtacgacata gcgaaaagat acaacaaaga cgtgctcatc gttgaaacgg 780 cgtatgcctg gacactcgag gacggggacg gttaccccaa catcttcagt ggtgaagaga 840 tggagctcac gggtggttac aaagcaacgg ttcagggaca ggcaacgttc ttgagggatc 900 tcatagaagt ggtgaacagt gttcctgacg gtcacggtct tgggatcttc tattgggaag 960 gagactggat tcctgtgaaa ggagccggct ggaaaaccgg cgaaggaaat ccatgggaga 1020 atcaggccat gtttgatttc aatggaaatg ctctcccatc cctggatgtt ttcaagctcg 1080 tgaggacagt cactcctatg gaaataaaaa tcgaagagat tctgcctgtg gagatctcga 1140 cgaatttggg agagattccg aagtttccgg atgctgtgaa agtgctgttc agcgatgatt 1200 ccatcagatc cctgaaagtt acatggaatt ttgatccttc tcttgttgaa acacccggtg 1260 tctacagagt ggaaggatac gtggaaagta tagaccagaa gatcttcgca accttgactg 1320 tgaagggaag tagaaactac ctgaagaacc ctgggtttga aacgggtgag ttttctccct 1380 ggaaggtgtt cggtaacgga aaacgcagtg aaggtggtaa aggccgatcc tccgagtaa 1439 <210> 250 <211> 479 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(33) <400> 250 Met Ile Asn Pro Val Lys Asp Leu Arg Glu Asp Phe Ile Phe Gly Met 1 5 10 15 Asp Val Ser Met Leu Tyr Glu Ile Glu Arg Leu Gly Gly Lys Phe Phe 20 25 30 Asp Gly Gly Val Glu Lys Asp Leu Phe Gln Ile Leu Lys Asp His Glu 35 40 45 Ile Asn Trp Ile Arg Leu Arg Val Trp Asn Asp Pro Arg Asp Glu Asn 50 55 60 Gly Asn Pro Leu Gly Gly Gly Asn Cys Asp Tyr Leu Lys Met Thr Glu 65 70 75 80 Ile Ala Lys Arg Ala Lys Lys Tyr Gly Met Lys Val Leu Leu Asp Phe 85 90 95 His Tyr Ser Asp Trp Trp Ala Asp Pro Gly Lys Gln Tyr Lys Pro Lys 100 105 110 Glu Trp Asp His Leu His Gly Glu Leu Leu Glu Arg Ala Val Tyr Ser 115 120 125 Tyr Thr Lys Leu Val Leu Asn His Met Arg Arg Asn Gly Ala Leu Pro 130 135 140 Asp Met Val Gln Val Gly Asn Glu Val Asn Asn Gly Phe Leu Trp Pro 145 150 155 160 Asp Gly Met Ile Ala Gly Lys Asp Ala Gly Gly Phe Asp Gly Phe Thr 165 170 175 Lys Leu Leu Lys Ala Ala Ile Lys Ala Val Arg Glu Val Asp Pro Asp 180 185 190 Ile Lys Ile Val Ile His Leu Ala Glu Gly Gly Asn Asn Ser Leu Phe 195 200 205 Arg Trp Phe Phe Asp Glu Ile Thr Arg Arg Asp Val Asp Phe Asp Val 210 215 220 Ile Gly Val Ser Tyr Tyr Pro Tyr Trp His Gly Thr Leu Asp Asp Leu 225 230 235 240 Lys Asn Asn Leu Tyr Asp Ile Ala Lys Arg Tyr Asn Lys Asp Val Leu 245 250 255 Ile Val Glu Thr Ala Tyr Ala Trp Thr Leu Glu Asp Gly Asp Gly Tyr 260 265 270 Pro Asn Ile Phe Ser Gly Glu Glu Met Glu Leu Thr Gly Gly Tyr Lys 275 280 285 Ala Thr Val Gln Gly Gln Ala Thr Phe Leu Arg Asp Leu Ile Glu Val 290 295 300 Val Asn Ser Val Pro Asp Gly His Gly Leu Gly Ile Phe Tyr Trp Glu 305 310 315 320 Gly Asp Trp Ile Pro Val Lys Gly Ala Gly Trp Lys Thr Gly Glu Gly 325 330 335 Asn Pro Trp Glu Asn Gln Ala Met Phe Asp Phe Asn Gly Asn Ala Leu 340 345 350 Pro Ser Leu Asp Val Phe Lys Leu Val Arg Thr Val Thr Pro Met Glu 355 360 365 Ile Lys Ile Glu Glu Ile Leu Pro Val Glu Ile Ser Thr Asn Leu Gly 370 375 380 Glu Ile Pro Lys Phe Pro Asp Ala Val Lys Val Leu Phe Ser Asp Asp 385 390 395 400 Ser Ile Arg Ser Leu Lys Val Thr Trp Asn Phe Asp Pro Ser Leu Val 405 410 415 Glu Thr Pro Gly Val Tyr Arg Val Glu Gly Tyr Val Glu Ser Ile Asp 420 425 430 Gln Lys Ile Phe Ala Thr Leu Thr Val Lys Gly Ser Arg Asn Tyr Leu 435 440 445 Lys Asn Pro Gly Phe Glu Thr Gly Glu Phe Ser Pro Trp Lys Val Phe 450 455 460 Gly Asn Gly Lys Arg Ser Glu Gly Gly Lys Gly Arg Ser Ser Glu 465 470 475 <210> 251 <211> 555 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 251 atggctacgg attattggca atattggacg gatggcggcg gaacggtgaa tgcggttaac 60 gggtccgggg gcaattacag cgtaacttgg caaaatagcg gggacttcgt ggtcggcaaa 120 ggctggagcg tagggtcgcc aaatcggacg atcaattaca atgccggcat ctgggaacct 180 tcggggaacg ggtacttgac cctttacgga tggactagaa actcgctgat cgagtattac 240 gttgtcgaca gttgggggac gtaccggcca acaggtactc acaaaggaac ggtgaacagc 300 gacggaggca cctacgatat ttatacgacc atgcgctata atgcgccttc cattgatggc 360 acgcagacgt tccaacagtt ctggagcgtg cggcaatcga aacgaccaac cggcagcaac 420 gtctccatca ccttcagcaa tcacgtgaat gcctggagaa gcaagggcat gaacctgggc 480 agcagctggt cgtaccaggt cttggcgacg gaaggctatc agagcagcgg aagatccaac 540 gtcacggtgt ggtaa 555 <210> 252 <211> 184 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 252 Met Ala Thr Asp Tyr Trp Gln Tyr Trp Thr Asp Gly Gly Gly Thr Val 1 5 10 15 Asn Ala Val Asn Gly Ser Gly Gly Asn Tyr Ser Val Thr Trp Gln Asn 20 25 30 Ser Gly Asp Phe Val Val Gly Lys Gly Trp Ser Val Gly Ser Pro Asn 35 40 45 Arg Thr Ile Asn Tyr Asn Ala Gly Ile Trp Glu Pro Ser Gly Asn Gly 50 55 60 Tyr Leu Thr Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr Tyr 65 70 75 80 Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr His Lys Gly 85 90 95 Thr Val Asn Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Met Arg 100 105 110 Tyr Asn Ala Pro Ser Ile Asp Gly Thr Gln Thr Phe Gln Gln Phe Trp 115 120 125 Ser Val Arg Gln Ser Lys Arg Pro Thr Gly Ser Asn Val Ser Ile Thr 130 135 140 Phe Ser Asn His Val Asn Ala Trp Arg Ser Lys Gly Met Asn Leu Gly 145 150 155 160 Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln Ser Ser 165 170 175 Gly Arg Ser Asn Val Thr Val Trp 180 <210> 253 <211> 1047 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 253 atgattgtta gcttcaagag cctgaaggca ctcgcgtgcc tcggcgtgct cggcatcacc 60 gccgcgcacg cgcaaacctg catcacgtcg agccagacgg gcaccaacaa cggcaattac 120 ttttcgttct ggaaagacag tccgggcacg gtgaacttct gcatgtatgc gaatggccgc 180 tatacctcca actggagcgg catcaacaac tgggtgggcg gcaagggctg ggctaccggc 240 tccagccaca cgatcagcta ctccggcacg ttcaattcgc cgggcaacgg ttacctggcc 300 ctgtatggct ggaccaccaa tccattggtc gagtactaca tcgtcgacag ctggggtacc 360 taccgtccgc cgggcggcca gggtttcatg ggcacggtag ttagcgacgg gggcacgtac 420 gacgtgtacc ggacgcaacg cgtgaaccag ccatccatca tcggcaacgc cacgttctac 480 cagtactgga gcgtgcggca gtcgaagcgc gtgggcggca ccatcaccat cgccaaccat 540 ttcaacgcct gggccacgct gggcatgaac ctgggccagc acaactacca ggtcatggcc 600 accgagggtt accagagcag cggcagctcc gacatcaccg tgaccgaagg tggcggcagy 660 tcctcgtcgt cctcgggcgg cggcagcacc agcagcagtg gtggcggcgg caacaagagc 720 ttcacggtgc gtgcgcgcgg cacggccgga ggcgagaaca tccagctgca ggtgaacaac 780 cagacggtcg cgagctggaa cctcaccacc agcatgcaga actacaccgc ctcgaccagc 840 ctgagcggcg gcatcaccgt gctctacacc aacgacggcg gcagccgcga cgtgcaggtg 900 gactacatca tcgtgaacgg ccagacccgc cagtccgaag cgcagagcta caacaccggg 960 ttgtatgcga atggacgctg cggcggtggc tcgaacagcg agtggatgca ttgcaacggc 1020 gcgatcggct acggcaatac gccctga 1047 <210> 254 <211> 347 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(24) <400> 254 Met Ile Val Ser Phe Lys Ser Leu Lys Ala Leu Ala Cys Leu Gly Val 1 5 10 15 Leu Gly Ile Thr Ala Ala His Ala Gln Thr Cys Ile Thr Ser Ser Gln 20 25 30 Thr Gly Thr Asn Asn Gly Asn Tyr Phe Ser Phe Trp Lys Asp Ser Pro 35 40 45 Gly Thr Val Asn Phe Cys Met Tyr Ala Asn Gly Arg Tyr Thr Ser Asn 50 55 60 Trp Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Ala Thr Gly 65 70 75 80 Ser Ser His Thr Ile Ser Tyr Ser Gly Thr Phe Asn Ser Pro Gly Asn 85 90 95 Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr 100 105 110 Tyr Ile Val Asp Ser Trp Gly Thr Tyr Arg Pro Pro Gly Gly Gln Gly 115 120 125 Phe Met Gly Thr Val Val Ser Asp Gly Gly Thr Tyr Asp Val Tyr Arg 130 135 140 Thr Gln Arg Val Asn Gln Pro Ser Ile Ile Gly Asn Ala Thr Phe Tyr 145 150 155 160 Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Val Gly Gly Thr Ile Thr 165 170 175 Ile Ala Asn His Phe Asn Ala Trp Ala Thr Leu Gly Met Asn Leu Gly 180 185 190 Gln His Asn Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly 195 200 205 Ser Ser Asp Ile Thr Val Thr Glu Gly Gly Gly Ser Ser Ser Ser Ser 210 215 220 Gly Gly Gly Ser Thr Ser Ser Ser Gly Gly Gly Gly Asn Lys Ser Phe 225 230 235 240 Thr Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Asn Ile Gln Leu Gln 245 250 255 Val Asn Asn Gln Thr Val Ala Ser Trp Asn Leu Thr Thr Ser Met Gln 260 265 270 Asn Tyr Thr Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val Leu Tyr 275 280 285 Thr Asn Asp Gly Gly Ser Arg Asp Val Gln Val Asp Tyr Ile Ile Val 290 295 300 Asn Gly Gln Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly Leu 305 310 315 320 Tyr Ala Asn Gly Arg Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His 325 330 335 Cys Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro 340 345 <210> 255 <211> 1137 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 255 ttgatctttt ccgtcagtgg ttccgcgtct cggcggcgcc ctggcatcca caagggggat 60 tccatgattt tcggtctaaa gtcgatcacg ggcaggcgcg ccgtcgcggc gctggcctgc 120 cttgccggcc tctacatggc gccggcgaat gcgcaaacct gcatcacgtc gagccagacg 180 ggcaccaaca acggcaacta cttttcgttc tggaaagaca gcccgggcac ggtgaacttc 240 tgcatgtact ccggcggccg ctacacgtcc aactggagcg gcatcaacaa ctgggtgggc 300 ggcaagggct ggcagacggg ctcgtcccgc accgtctcct actccggcag cttcaattcg 360 ccgggtaacg gctacctgac gctctacggc tggaccacca atccgctcat cgagtactac 420 atcgtcgaca actggggcag ctatcgtccg ccgggtggcc agggcttcat gggcacggtg 480 aacaccgacg gcggcacgta cgacatctat cgcacgcaac gggtcaacca gccgtcgatc 540 atcggcaccg cgacgttcta ccagtactgg agcgtgcggc agtcgaagcg caccggcggc 600 accatcacca cggccaacca cttcaatgcc tgggccagcc tcggcatgaa cctgggacag 660 cacaactacc aggtgatggc caccgagggc taccagagca gcggcagctc cgacatcacg 720 gtgtgggaag gcacgagcag cggcggaagc agcaatggcg gcagcagcaa cggcggcagc 780 agcaatggtg gcagcggcgg cacgaagagc ttcacggtgc gcgcgcgcgg cactgcgggc 840 ggcgagtcca tcacgctgcg ggtcaacaac cagaacgtgc agacctggac gctgggtacc 900 agcatgcaga actacacggc ctcgacctcg ctgagcggcg gcatcacggt ggcgttcacc 960 aacgacggcg gcagccgcga cgtgcaggtg gactacatca tcgtgaatgg ccagacccgc 1020 cagtccgaac agcagagcta caacactggc ctctacgcca atggaagctg tggtggcggt 1080 tcgaacagcg agtggatgca ttgcaacggc gccatcggct acggcaatac gccctga 1137 <210> 256 <211> 378 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <221> SIGNAL <222> (1)...(51) <400> 256 Leu Ile Phe Ser Val Ser Gly Ser Ala Ser Arg Arg Arg Pro Gly Ile 1 5 10 15 His Lys Gly Asp Ser Met Ile Phe Gly Leu Lys Ser Ile Thr Gly Arg 20 25 30 Arg Ala Val Ala Ala Leu Ala Cys Leu Ala Gly Leu Tyr Met Ala Pro 35 40 45 Ala Asn Ala Gln Thr Cys Ile Thr Ser Ser Gln Thr Gly Thr Asn Asn 50 55 60 Gly Asn Tyr Phe Ser Phe Trp Lys Asp Ser Pro Gly Thr Val Asn Phe 65 70 75 80 Cys Met Tyr Ser Gly Gly Arg Tyr Thr Ser Asn Trp Ser Gly Ile Asn 85 90 95 Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly Ser Ser Arg Thr Val 100 105 110 Ser Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn Gly Tyr Leu Thr Leu 115 120 125 Tyr Gly Trp Thr Thr Asn Pro Leu Ile Glu Tyr Tyr Ile Val Asp Asn 130 135 140 Trp Gly Ser Tyr Arg Pro Pro Gly Gly Gln Gly Phe Met Gly Thr Val 145 150 155 160 Asn Thr Asp Gly Gly Thr Tyr Asp Ile Tyr Arg Thr Gln Arg Val Asn 165 170 175 Gln Pro Ser Ile Ile Gly Thr Ala Thr Phe Tyr Gln Tyr Trp Ser Val 180 185 190 Arg Gln Ser Lys Arg Thr Gly Gly Thr Ile Thr Thr Ala Asn His Phe 195 200 205 Asn Ala Trp Ala Ser Leu Gly Met Asn Leu Gly Gln His Asn Tyr Gln 210 215 220 Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser Ser Asp Ile Thr 225 230 235 240 Val Trp Glu Gly Thr Ser Ser Gly Gly Ser Ser Asn Gly Gly Ser Ser 245 250 255 Asn Gly Gly Ser Ser Asn Gly Gly Ser Gly Gly Thr Lys Ser Phe Thr 260 265 270 Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Ser Ile Thr Leu Arg Val 275 280 285 Asn Asn Gln Asn Val Gln Thr Trp Thr Leu Gly Thr Ser Met Gln Asn 290 295 300 Tyr Thr Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val Ala Phe Thr 305 310 315 320 Asn Asp Gly Gly Ser Arg Asp Val Gln Val Asp Tyr Ile Ile Val Asn 325 330 335 Gly Gln Thr Arg Gln Ser Glu Gln Gln Ser Tyr Asn Thr Gly Leu Tyr 340 345 350 Ala Asn Gly Ser Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys 355 360 365 Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro 370 375 <210> 257 <211> 2694 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample <400> 257 atggctgata tatctaccac accagtcaca gcctcgacag atgctgccaa gaacctgtat 60 gcctatttcc tggaccagta tggcaagaag acgatttcca gcgtcatggc caatgtcaac 120 tggaacaaca cttgtgccga gaaagtctat aaactcacgg gcaagtatcc tgccatgaac 180 tgctacgact tcatccacat ctgtttctcg ccagccaact ggattgacta caccgacatc 240 actcctgcca aggaatggca cgatgcgggc ggtatcgtac agttgatgtg gcatttcaat 300 gtgcctaaga gccagggggc aacagatgtt acctgcacgc ccagcgagac cacctttaag 360 gcttccaatg ctctggttag cggcacgtgg gagaacaaat ggttctacga gcagatggac 420 aaggtcattg ccaccatcct caagttacag gacgctggca ttgccgctac ctggcgacct 480 ttccatgagg cagcaggcaa tgcttgcgcc aagcagcagg ccgactggac caaagcatgg 540 ttctggtggg gctacgacgg tgccgacacc tacaagaaac tgtggattgc catgtacgac 600 tatttcaagc tgaaaggcgt gaacaacctc atctggatgt ggaccaccca gaattataat 660 ggtgacagca gcaaatacaa ccaggacacc gactggtacc ctggcgacga gtatgttgac 720 atcgtggccc gcgacctcta tggctacaat gccgaccaga acctgcagga gttcagcgag 780 attcaggctg cctatcccaa caagatggtg gttctgggtg aatgcggaaa aggtgatagc 840 ggcgaccccg gcaagatgtc cgatgtatgg gcgaaaggtg ccaagtgggg ccacttcatg 900 gtatggtatc aaggcgaaca aggctctacc gacacgatgt gcagcgacga ctggtggaag 960 gatgccatga gcagcgccaa cgtcatcacc cgcgacaagg tggttatccc cgatgtcact 1020 tcaaccatcg agaatgccac ggatgccgtg aagaacatgg gactggggtg gaacctgggg 1080 aacgccctcg acgccaatgc ccagcaatac catgatgcca cccaggacaa ctactgggga 1140 cagcaggaca ttacctctga gagctgctgg ggtcagctac ccaccaaggc agagctgatg 1200 gccatgatga aagaagccgg tttcggagcc atccgcgttc ccgtgacatg gtataaccac 1260 atggacaagg acggcaatgt ggatgcagca tggatgaatc gtgtgcatga ggtggttgac 1320 tatgtcatca gccagggaat gtactgcatc ctcaacgtac accacgacac gggtgccgac 1380 agctacgaca gccagaagaa cctcaccggc taccattgga tcaaggccga cgaaaccaac 1440 tacgccacca acaaggcccg ctatgagaag ctgtggcagc agatagccca ggagttccgc 1500 aactacggcc agctgctgct gttcgagggc tataacgaga tgctcgatgc caacaactcc 1560 tggaattttg cacagagcag ttcagcctac gatgccatca acaaatacgc ccagagcttt 1620 gtcgatgtcg tacgcgccac cggtggcaac aatgcccagc gcaacctcat tgtcagcaca 1680 tacggcgcct gctcaggcaa cggcacgtgg gatgcaagag tgcaagaccc cttgaagaaa 1740 ctgcagattc ccacgggtga aagcaaccat atcatcttcg aggttcacaa ctatccctcc 1800 atcgtcaaca aggacaacgc gggcaactac gtcagcgatc gcaccatcag cgaaatcaag 1860 gcagagattg atgcatggct taagaactta aagacccacc tcgtcagcaa gggcgctccc 1920 gtcatcatcg gcgaatgggg caccaacaac gtcgatgccg gcggtggcaa gacagactac 1980 gacctccata aggacctgat gttcgaattt gtcagctaca tgataaagac catgaagcag 2040 aacgacattg ccaccttcta ctggatggga cttaccgacg gcgctccacg cacctacccc 2100 gccttcacac agcccgacct ggcgctgaag atgctgcagg cctatcacgg cgactcttgg 2160 aatccctacc tgcctgacgc caaggacttt cccgaaggca aaatcacctc ggccacggtg 2220 aatttcaaca gccaatgggg cgaactgacc atccacgatg gagctattga caagaccgtc 2280 tatagaggta tcaaggtgga gctggaagaa aagcctgcca ctggagccct gtctttcaag 2340 gtatatgcca acagtgagaa ggcaacagcc atcaattcca aaaccccaca gttggctttc 2400 ttcagttaca caggcatcca gaaaatcaac ctacagtgga acatagccac caaggggagt 2460 atcaaaatca agagcgtcaa ccttatcaag cacgacgact ccacagaacc ctgtagtctg 2520 aaagtggctt ggggttgtac tctcagcgac cagaactacg ccacgggcat cgaagacatt 2580 actatcactc ctgttcgtca tgacgatgga atcatctaca atctgagcgg acagcctgta 2640 acctctcctc agcgcggcat ctacatcctc aacggaaaga aaatcatcaa atag 2694 <210> 258 <211> 897 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample <400> 258 Met Ala Asp Ile Ser Thr Thr Pro Val Thr Ala Ser Thr Asp Ala Ala 1 5 10 15 Lys Asn Leu Tyr Ala Tyr Phe Leu Asp Gln Tyr Gly Lys Lys Thr Ile 20 25 30 Ser Ser Val Met Ala Asn Val Asn Trp Asn Asn Thr Cys Ala Glu Lys 35 40 45 Val Tyr Lys Leu Thr Gly Lys Tyr Pro Ala Met Asn Cys Tyr Asp Phe 50 55 60 Ile His Ile Cys Phe Ser Pro Ala Asn Trp Ile Asp Tyr Thr Asp Ile 65 70 75 80 Thr Pro Ala Lys Glu Trp His Asp Ala Gly Gly Ile Val Gln Leu Met 85 90 95 Trp His Phe Asn Val Pro Lys Ser Gln Gly Ala Thr Asp Val Thr Cys 100 105 110 Thr Pro Ser Glu Thr Thr Phe Lys Ala Ser Asn Ala Leu Val Ser Gly 115 120 125 Thr Trp Glu Asn Lys Trp Phe Tyr Glu Gln Met Asp Lys Val Ile Ala 130 135 140 Thr Ile Leu Lys Leu Gln Asp Ala Gly Ile Ala Ala Thr Trp Arg Pro 145 150 155 160 Phe His Glu Ala Ala Gly Asn Ala Cys Ala Lys Gln Gln Ala Asp Trp 165 170 175 Thr Lys Ala Trp Phe Trp Trp Gly Tyr Asp Gly Ala Asp Thr Tyr Lys 180 185 190 Lys Leu Trp Ile Ala Met Tyr Asp Tyr Phe Lys Leu Lys Gly Val Asn 195 200 205 Asn Leu Ile Trp Met Trp Thr Thr Gln Asn Tyr Asn Gly Asp Ser Ser 210 215 220 Lys Tyr Asn Gln Asp Thr Asp Trp Tyr Pro Gly Asp Glu Tyr Val Asp 225 230 235 240 Ile Val Ala Arg Asp Leu Tyr Gly Tyr Asn Ala Asp Gln Asn Leu Gln 245 250 255 Glu Phe Ser Glu Ile Gln Ala Ala Tyr Pro Asn Lys Met Val Val Leu 260 265 270 Gly Glu Cys Gly Lys Gly Asp Ser Gly Asp Pro Gly Lys Met Ser Asp 275 280 285 Val Trp Ala Lys Gly Ala Lys Trp Gly His Phe Met Val Trp Tyr Gln 290 295 300 Gly Glu Gln Gly Ser Thr Asp Thr Met Cys Ser Asp Asp Trp Trp Lys 305 310 315 320 Asp Ala Met Ser Ser Ala Asn Val Ile Thr Arg Asp Lys Val Val Ile 325 330 335 Pro Asp Val Thr Ser Thr Ile Glu Asn Ala Thr Asp Ala Val Lys Asn 340 345 350 Met Gly Leu Gly Trp Asn Leu Gly Asn Ala Leu Asp Ala Asn Ala Gln 355 360 365 Gln Tyr His Asp Ala Thr Gln Asp Asn Tyr Trp Gly Gln Gln Asp Ile 370 375 380 Thr Ser Glu Ser Cys Trp Gly Gln Leu Pro Thr Lys Ala Glu Leu Met 385 390 395 400 Ala Met Met Lys Glu Ala Gly Phe Gly Ala Ile Arg Val Pro Val Thr 405 410 415 Trp Tyr Asn His Met Asp Lys Asp Gly Asn Val Asp Ala Ala Trp Met 420 425 430 Asn Arg Val His Glu Val Val Asp Tyr Val Ile Ser Gln Gly Met Tyr 435 440 445 Cys Ile Leu Asn Val His His Asp Thr Gly Ala Asp Ser Tyr Asp Ser 450 455 460 Gln Lys Asn Leu Thr Gly Tyr His Trp Ile Lys Ala Asp Glu Thr Asn 465 470 475 480 Tyr Ala Thr Asn Lys Ala Arg Tyr Glu Lys Leu Trp Gln Gln Ile Ala 485 490 495 Gln Glu Phe Arg Asn Tyr Gly Gln Leu Leu Leu Phe Glu Gly Tyr Asn 500 505 510 Glu Met Leu Asp Ala Asn Asn Ser Trp Asn Phe Ala Gln Ser Ser Ser 515 520 525 Ala Tyr Asp Ala Ile Asn Lys Tyr Ala Gln Ser Phe Val Asp Val Val 530 535 540 Arg Ala Thr Gly Gly Asn Asn Ala Gln Arg Asn Leu Ile Val Ser Thr 545 550 555 560 Tyr Gly Ala Cys Ser Gly Asn Gly Thr Trp Asp Ala Arg Val Gln Asp 565 570 575 Pro Leu Lys Lys Leu Gln Ile Pro Thr Gly Glu Ser Asn His Ile Ile 580 585 590 Phe Glu Val His Asn Tyr Pro Ser Ile Val Asn Lys Asp Asn Ala Gly 595 600 605 Asn Tyr Val Ser Asp Arg Thr Ile Ser Glu Ile Lys Ala Glu Ile Asp 610 615 620 Ala Trp Leu Lys Asn Leu Lys Thr His Leu Val Ser Lys Gly Ala Pro 625 630 635 640 Val Ile Ile Gly Glu Trp Gly Thr Asn Asn Val Asp Ala Gly Gly Gly 645 650 655 Lys Thr Asp Tyr Asp Leu His Lys Asp Leu Met Phe Glu Phe Val Ser 660 665 670 Tyr Met Ile Lys Thr Met Lys Gln Asn Asp Ile Ala Thr Phe Tyr Trp 675 680 685 Met Gly Leu Thr Asp Gly Ala Pro Arg Thr Tyr Pro Ala Phe Thr Gln 690 695 700 Pro Asp Leu Ala Leu Lys Met Leu Gln Ala Tyr His Gly Asp Ser Trp 705 710 715 720 Asn Pro Tyr Leu Pro Asp Ala Lys Asp Phe Pro Glu Gly Lys Ile Thr 725 730 735 Ser Ala Thr Val Asn Phe Asn Ser Gln Trp Gly Glu Leu Thr Ile His 740 745 750 Asp Gly Ala Ile Asp Lys Thr Val Tyr Arg Gly Ile Lys Val Glu Leu 755 760 765 Glu Glu Lys Pro Ala Thr Gly Ala Leu Ser Phe Lys Val Tyr Ala Asn 770 775 780 Ser Glu Lys Ala Thr Ala Ile Asn Ser Lys Thr Pro Gln Leu Ala Phe 785 790 795 800 Phe Ser Tyr Thr Gly Ile Gln Lys Ile Asn Leu Gln Trp Asn Ile Ala 805 810 815 Thr Lys Gly Ser Ile Lys Ile Lys Ser Val Asn Leu Ile Lys His Asp 820 825 830 Asp Ser Thr Glu Pro Cys Ser Leu Lys Val Ala Trp Gly Cys Thr Leu 835 840 845 Ser Asp Gln Asn Tyr Ala Thr Gly Ile Glu Asp Ile Thr Ile Thr Pro 850 855 860 Val Arg His Asp Asp Gly Ile Ile Tyr Asn Leu Ser Gly Gln Pro Val 865 870 875 880 Thr Ser Pro Gln Arg Gly Ile Tyr Ile Leu Asn Gly Lys Lys Ile Ile 885 890 895 Lys <210> 259 <211> 1143 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 259 atgaagaaaa ttcgcttact ccagggtgtt tcgttggcca tgtcaataat gtttcttttg 60 tcatgtcagg cacaaaaacc agttgactct cttaaggaag catttgatgg tttgtttctt 120 ataggtactg ccatgaacac ccctcagatc accggccagg atacacaaac acttgagttg 180 ataaaaaaac acatgaactc catagtggcc gaaaatgtaa tgaaaagtga ggtgcttcaa 240 cccagggaag gagagtttga ttttactctt gccgatcagt ttgttcaatt tggtatcgat 300 aacaatatgc atatagttgg ccataccctt atatggcatt cccaggcgcc acgatggttt 360 tttgtggatg agaacggaaa cgatgtgagc cccgaaattc tgaaacaaag aatgaaagac 420 catatttata ccgtagtagg ccgttataaa ggcaaaattc atggatggga tgtggtgaat 480 gagtgtataa atgacgatgg ttcgtggcgc aatagtaagt tttaccaaat tcttggtgaa 540 gattttgtta aatatgcatt ccagtttgca gctgaagccg atcccgatgc agagctttat 600 tacaatgatt attcgatgtt ccttccagga cgtagggaag gcgtaattaa gatggtgaga 660 aatctgcagg aacagggaat taaaattgat ggtattggga tgcagggcca cctgatgatt 720 gattatccac ccctcgaaga ttttgaaacg agtatactgg cttttgccga tctgggggtg 780 aatgtcatga taaccgaact cgatatatcc gttttgccat ttcctacccg caacgtgggc 840 gccgatgttt ctctgaacat tgcatacaat actgaattaa atccctaccc gaatggctta 900 cccgaagatg tagcgcagaa attacataat cggtgggtgg atctttttcg cctgttcatt 960 aaacaccacg ataaaattac ccgtgtaacc acttggggta cagccgatgc catgtcatgg 1020 aagaataact ggcccattcg tggacgtaca gattatccct tacttttcga tcgcgatttt 1080 cagcccaaac cctttgtcgc tgatataatt aaggaggcat tggcagccaa aagaaaatta 1140 taa 1143 <210> 260 <211> 380 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(24) <400> 260 Met Lys Lys Ile Arg Leu Leu Gln Gly Val Ser Leu Ala Met Ser Ile 1 5 10 15 Met Phe Leu Leu Ser Cys Gln Ala Gln Lys Pro Val Asp Ser Leu Lys 20 25 30 Glu Ala Phe Asp Gly Leu Phe Leu Ile Gly Thr Ala Met Asn Thr Pro 35 40 45 Gln Ile Thr Gly Gln Asp Thr Gln Thr Leu Glu Leu Ile Lys Lys His 50 55 60 Met Asn Ser Ile Val Ala Glu Asn Val Met Lys Ser Glu Val Leu Gln 65 70 75 80 Pro Arg Glu Gly Glu Phe Asp Phe Thr Leu Ala Asp Gln Phe Val Gln 85 90 95 Phe Gly Ile Asp Asn Asn Met His Ile Val Gly His Thr Leu Ile Trp 100 105 110 His Ser Gln Ala Pro Arg Trp Phe Phe Val Asp Glu Asn Gly Asn Asp 115 120 125 Val Ser Pro Glu Ile Leu Lys Gln Arg Met Lys Asp His Ile Tyr Thr 130 135 140 Val Val Gly Arg Tyr Lys Gly Lys Ile His Gly Trp Asp Val Val Asn 145 150 155 160 Glu Cys Ile Asn Asp Asp Gly Ser Trp Arg Asn Ser Lys Phe Tyr Gln 165 170 175 Ile Leu Gly Glu Asp Phe Val Lys Tyr Ala Phe Gln Phe Ala Ala Glu 180 185 190 Ala Asp Pro Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Met Phe Leu 195 200 205 Pro Gly Arg Arg Glu Gly Val Ile Lys Met Val Arg Asn Leu Gln Glu 210 215 220 Gln Gly Ile Lys Ile Asp Gly Ile Gly Met Gln Gly His Leu Met Ile 225 230 235 240 Asp Tyr Pro Pro Leu Glu Asp Phe Glu Thr Ser Ile Leu Ala Phe Ala 245 250 255 Asp Leu Gly Val Asn Val Met Ile Thr Glu Leu Asp Ile Ser Val Leu 260 265 270 Pro Phe Pro Thr Arg Asn Val Gly Ala Asp Val Ser Leu Asn Ile Ala 275 280 285 Tyr Asn Thr Glu Leu Asn Pro Tyr Pro Asn Gly Leu Pro Glu Asp Val 290 295 300 Ala Gln Lys Leu His Asn Arg Trp Val Asp Leu Phe Arg Leu Phe Ile 305 310 315 320 Lys His His Asp Lys Ile Thr Arg Val Thr Thr Trp Gly Thr Ala Asp 325 330 335 Ala Met Ser Trp Lys Asn Asn Trp Pro Ile Arg Gly Arg Thr Asp Tyr 340 345 350 Pro Leu Leu Phe Asp Arg Asp Phe Gln Pro Lys Pro Phe Val Ala Asp 355 360 365 Ile Ile Lys Glu Ala Leu Ala Ala Lys Arg Lys Leu 370 375 380 <210> 261 <211> 1629 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 261 atgataaaca aaattggcaa aggttttttt tctgcgttca tttgtgctgc tgcgttgagt 60 gtctccacag ttaatgctca gcaaactgtc accaccaaca cgcaaggcac gcacgatggt 120 tttttctatt cgttttggaa agacagtggt gatgcatcat ttggtttgcg tgagggaggg 180 cgttacacct cgcaatggaa tacttctacc aataactggg tgggtggaaa agggtggaat 240 cccggtggta gaagggttgt tcactatcaa ggccaatata atgttgataa ttcacaaaac 300 tcttatttgg cattgtatgg ctggacacgc tcaccactga ttgaatatta cgtgattgaa 360 agttacggct cgtataaccc gtcgaattgc acccaaggtc ggcagaccta tggcaccttt 420 cagagtgatg gtgcaaccta tgaaattgtt cgctgtcagc gagttcagca gccctctatc 480 gatggcacac aaactttcta tcaatacttc agtgtgcgtc agccgaagaa aggctttggt 540 agtatcagtg gtacgatcac tgtgggcaac cattttgatg catgggccgc cgccggtttg 600 aacctggggg aacatgatta tatggtgatg gctaccgagg gttatcagag caccggtagt 660 tcggatatta cggtcagtga aattaccggt ggttcaggtg gtggctcttc ctcgggtgct 720 aataccctgg tgattcgtgc tgtgggcacc tctggtaatg aattgctgcg tgtcaatgtg 780 ggtggtagcc ctgtgcagac attgagcctt tcgaccagtt ggcaggattt tactgtcaat 840 acggatgcaa cgggtgacat taacgtagag ttgtttaatg atcagggtca gggttatgag 900 gcgcgtatcg attatgtgct ggttaatggt gagacccgct acgcggccga tcagagttat 960 aacaccagtg cctgggacgg cgaatgtggg ggtggctctt ttacccagtg gatgcattgt 1020 gatggcatga ttggctttgg tgatatgacc ggcggcaatg ccggtggtgg cggttcttcg 1080 ggtggttctg gcgccaatac tctggtggtg cgtgctgtcg gcacttcagg taacgagcag 1140 ttgcgcgtga atgtgggcgg caacacgatt caaacactga acctgtcaag cagttggcaa 1200 gattttactg tcaataccga tgcctcgggc gatattaacg tagagctgtt taatgaccag 1260 ggtcagggct atgaggcgcg tattgattat gtgctggtta atggcgagac ccgctacgcg 1320 gctgaccaga gttataacac cagcgcctgg gatggcgaat gcgggggtgg ctcttttacc 1380 caatggatgc attgtgatgg catgattggt tttggtgata tgtcgggtgg tggttctgct 1440 gtgggtacaa gcagtagcgg taatgccggc agcaatacca gcagtgcctg ttactgtaat 1500 tggtatggca gtgtgatggc ttcttgtgaa aatcaggtga acggctgggg ttgggaaaat 1560 aatcaaagct gtattggtaa taatacctgt aataatcagg gcggtagcgg aggcgtggtg 1620 tgcaattaa 1629 <210> 262 <211> 542 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(26) <400> 262 Met Ile Asn Lys Ile Gly Lys Gly Phe Phe Ser Ala Phe Ile Cys Ala 1 5 10 15 Ala Ala Leu Ser Val Ser Thr Val Asn Ala Gln Gln Thr Val Thr Thr 20 25 30 Asn Thr Gln Gly Thr His Asp Gly Phe Phe Tyr Ser Phe Trp Lys Asp 35 40 45 Ser Gly Asp Ala Ser Phe Gly Leu Arg Glu Gly Gly Arg Tyr Thr Ser 50 55 60 Gln Trp Asn Thr Ser Thr Asn Asn Trp Val Gly Gly Lys Gly Trp Asn 65 70 75 80 Pro Gly Gly Arg Arg Val Val His Tyr Gln Gly Gln Tyr Asn Val Asp 85 90 95 Asn Ser Gln Asn Ser Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Ser Pro 100 105 110 Leu Ile Glu Tyr Tyr Val Ile Glu Ser Tyr Gly Ser Tyr Asn Pro Ser 115 120 125 Asn Cys Thr Gln Gly Arg Gln Thr Tyr Gly Thr Phe Gln Ser Asp Gly 130 135 140 Ala Thr Tyr Glu Ile Val Arg Cys Gln Arg Val Gln Gln Pro Ser Ile 145 150 155 160 Asp Gly Thr Gln Thr Phe Tyr Gln Tyr Phe Ser Val Arg Gln Pro Lys 165 170 175 Lys Gly Phe Gly Ser Ile Ser Gly Thr Ile Thr Val Gly Asn His Phe 180 185 190 Asp Ala Trp Ala Ala Ala Gly Leu Asn Leu Gly Glu His Asp Tyr Met 195 200 205 Val Met Ala Thr Glu Gly Tyr Gln Ser Thr Gly Ser Ser Asp Ile Thr 210 215 220 Val Ser Glu Ile Thr Gly Gly Ser Gly Gly Gly Ser Ser Ser Gly Ala 225 230 235 240 Asn Thr Leu Val Ile Arg Ala Val Gly Thr Ser Gly Asn Glu Leu Leu 245 250 255 Arg Val Asn Val Gly Gly Ser Pro Val Gln Thr Leu Ser Leu Ser Thr 260 265 270 Ser Trp Gln Asp Phe Thr Val Asn Thr Asp Ala Thr Gly Asp Ile Asn 275 280 285 Val Glu Leu Phe Asn Asp Gln Gly Gln Gly Tyr Glu Ala Arg Ile Asp 290 295 300 Tyr Val Leu Val Asn Gly Glu Thr Arg Tyr Ala Ala Asp Gln Ser Tyr 305 310 315 320 Asn Thr Ser Ala Trp Asp Gly Glu Cys Gly Gly Gly Ser Phe Thr Gln 325 330 335 Trp Met His Cys Asp Gly Met Ile Gly Phe Gly Asp Met Thr Gly Gly 340 345 350 Asn Ala Gly Gly Gly Gly Ser Ser Gly Gly Ser Gly Ala Asn Thr Leu 355 360 365 Val Val Arg Ala Val Gly Thr Ser Gly Asn Glu Gln Leu Arg Val Asn 370 375 380 Val Gly Gly Asn Thr Ile Gln Thr Leu Asn Leu Ser Ser Ser Trp Gln 385 390 395 400 Asp Phe Thr Val Asn Thr Asp Ala Ser Gly Asp Ile Asn Val Glu Leu 405 410 415 Phe Asn Asp Gln Gly Gln Gly Tyr Glu Ala Arg Ile Asp Tyr Val Leu 420 425 430 Val Asn Gly Glu Thr Arg Tyr Ala Ala Asp Gln Ser Tyr Asn Thr Ser 435 440 445 Ala Trp Asp Gly Glu Cys Gly Gly Gly Ser Phe Thr Gln Trp Met His 450 455 460 Cys Asp Gly Met Ile Gly Phe Gly Asp Met Ser Gly Gly Gly Ser Ala 465 470 475 480 Val Gly Thr Ser Ser Ser Gly Asn Ala Gly Ser Asn Thr Ser Ser Ala 485 490 495 Cys Tyr Cys Asn Trp Tyr Gly Ser Val Met Ala Ser Cys Glu Asn Gln 500 505 510 Val Asn Gly Trp Gly Trp Glu Asn Asn Gln Ser Cys Ile Gly Asn Asn 515 520 525 Thr Cys Asn Asn Gln Gly Gly Ser Gly Gly Val Val Cys Asn 530 535 540 <210> 263 <211> 1092 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 263 atgaaaacta atcacccatt taaattcggg aaaaaaatat gtatggcatt ggctttgctg 60 gtgcttggca tacaggcttc aatcgcacag gaaatttgta ttaccagcgg cactgaccag 120 atcagagaaa ccacatccaa cggctatacc cacgaactat ggaatcagga cacccggggg 180 acggcctgta tgactattaa tgcaggcacc acttacagtg cgcggtggaa cggtgcattt 240 aactatttgg cccgccgtgg attggcctac gatggttcgt ccctcaccca tgctgaccgg 300 gggaaattca ccataaatta tgcctctaac tacaactgca acaatatgaa tgggctctct 360 tatttaagcg tgtacggatg gacgcgggat tttgccaagg aaaatgccaa tccggcagga 420 tcacaggctc atcaggaagc gctggtggaa tattacattg ttgaaaactg gtgcgactgg 480 aatgtttcac aagaccctaa cgcccagagt ctgggcaccc tgaatgttga tgggtcgatc 540 tatgatatgt atcgcacaga acggatcaac caaccttcta tcaggtgcgg tggtacctgc 600 gataattttt accaatactt cagcattcgc cgcaacacac gtaacagtgg caccattgat 660 gtcagcgctc atttcaacca gtgggaagca ttaaccggcg tccctatggg tggcctgcac 720 gaagtgatga tgaaggtcga aggctacaac tcaaacaatc aatccagtgg caatgtaagc 780 tttactcaat tgctcatgcg tgcccgcttc gaggatggcg ccattgtcga gaaccagaat 840 gcggtcggcc atgcgcacgg tggagaagcg gtgggagatg atcaccgccg tcttgccctg 900 ggccaggccc ttgaagcggg cgaacacctc ggcctcggcc ttggcgtcga gggcggcggt 960 gggttcgtcg agaatgatca actcggcgtc gcgcatatag gcgcgggcga tggctacctt 1020 ctgccactcg ccgcccgaga ggtcgcggcc ctgcttgaaa aggcgcccca attgctccag 1080 agaaacgggt ga 1092 <210> 264 <211> 363 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(29) <400> 264 Met Lys Thr Asn His Pro Phe Lys Phe Gly Lys Lys Ile Cys Met Ala 1 5 10 15 Leu Ala Leu Leu Val Leu Gly Ile Gln Ala Ser Ile Ala Gln Glu Ile 20 25 30 Cys Ile Thr Ser Gly Thr Asp Gln Ile Arg Glu Thr Thr Ser Asn Gly 35 40 45 Tyr Thr His Glu Leu Trp Asn Gln Asp Thr Arg Gly Thr Ala Cys Met 50 55 60 Thr Ile Asn Ala Gly Thr Thr Tyr Ser Ala Arg Trp Asn Gly Ala Phe 65 70 75 80 Asn Tyr Leu Ala Arg Arg Gly Leu Ala Tyr Asp Gly Ser Ser Leu Thr 85 90 95 His Ala Asp Arg Gly Lys Phe Thr Ile Asn Tyr Ala Ser Asn Tyr Asn 100 105 110 Cys Asn Asn Met Asn Gly Leu Ser Tyr Leu Ser Val Tyr Gly Trp Thr 115 120 125 Arg Asp Phe Ala Lys Glu Asn Ala Asn Pro Ala Gly Ser Gln Ala His 130 135 140 Gln Glu Ala Leu Val Glu Tyr Tyr Ile Val Glu Asn Trp Cys Asp Trp 145 150 155 160 Asn Val Ser Gln Asp Pro Asn Ala Gln Ser Leu Gly Thr Leu Asn Val 165 170 175 Asp Gly Ser Ile Tyr Asp Met Tyr Arg Thr Glu Arg Ile Asn Gln Pro 180 185 190 Ser Ile Arg Cys Gly Gly Thr Cys Asp Asn Phe Tyr Gln Tyr Phe Ser 195 200 205 Ile Arg Arg Asn Thr Arg Asn Ser Gly Thr Ile Asp Val Ser Ala His 210 215 220 Phe Asn Gln Trp Glu Ala Leu Thr Gly Val Pro Met Gly Gly Leu His 225 230 235 240 Glu Val Met Met Lys Val Glu Gly Tyr Asn Ser Asn Asn Gln Ser Ser 245 250 255 Gly Asn Val Ser Phe Thr Gln Leu Leu Met Arg Ala Arg Phe Glu Asp 260 265 270 Gly Ala Ile Val Glu Asn Gln Asn Ala Val Gly His Ala His Gly Gly 275 280 285 Glu Ala Val Gly Asp Asp His Arg Arg Leu Ala Leu Gly Gln Ala Leu 290 295 300 Glu Ala Gly Glu His Leu Gly Leu Gly Leu Gly Val Glu Gly Gly Gly 305 310 315 320 Gly Phe Val Glu Asn Asp Gln Leu Gly Val Ala His Ile Gly Ala Gly 325 330 335 Asp Gly Tyr Leu Leu Pro Leu Ala Ala Arg Glu Val Ala Ala Leu Leu 340 345 350 Glu Lys Ala Pro Gln Leu Leu Gln Arg Asn Gly 355 360 <210> 265 <211> 996 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 265 atgaacagct ccctcccctc cctccgcgat gtattcgcga atgatttccg catcggggcg 60 gcggtcaatc ctgtgacgat cgagatgcaa aaacagttgt tgatcgatca tgtcaacagt 120 attacggcag agaaccatat gaagtttgag catcttcagc cggaagaagg gaaatttacc 180 tttcaggaag cggatcggat tgtggatttt gcttgttcgc accgaatggc ggttcgaggg 240 cacacacttg tatggcacaa ccagactccg gattgggtgt ttcaagatgg tcaaggccat 300 ttcgtcagtc gggatgtgtt gcttgagcgg atgaaatgtc acatttcaac tgttgtacgg 360 cgatacaagg gaaaaatata ttgttgggat gtcatcaacg aagcggtagc cgacgaagga 420 gacgaattgt tgaggccgtc gaagtggcga caaatcatcg gggacgattt tatggaacaa 480 gcatttctct acgcttatga agctgaccca gatgcactgc ttttttacaa tgactataat 540 gaatgttttc cggaaaagag agaaaaaatt tttgcacttg tcaaatcgct gcgtgataaa 600 ggcattccga ttcatggcat cggcatgcag gcgcactgga gcctgacccg cccgtcgctt 660 gatgaaattc gtgcggcgat tgaacggtat gcgtcccttg gtgttgttct tcatattacg 720 gaactcgatg tatccatgtt tgaatttcac gatcgtcgaa ccgatttggc tgtcccgacg 780 aacgaaatga tcgaacagca agcagaacgg tatgggcaaa tttttgcttt gtttaaggag 840 tatcgcgatg ttattcaaag tgtcacattt tggggaattg ctgatgacca tacatggctc 900 gataactttc cagtgcacgg gagaaaaaac tggccgcttt tgttcgatga acagcataaa 960 ccgaaaccag ctttttggcg ggcagtgagt gtctga 996 <210> 266 <211> 331 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <400> 266 Met Asn Ser Ser Leu Pro Ser Leu Arg Asp Val Phe Ala Asn Asp Phe 1 5 10 15 Arg Ile Gly Ala Ala Val Asn Pro Val Thr Ile Glu Met Gln Lys Gln 20 25 30 Leu Leu Ile Asp His Val Asn Ser Ile Thr Ala Glu Asn His Met Lys 35 40 45 Phe Glu His Leu Gln Pro Glu Glu Gly Lys Phe Thr Phe Gln Glu Ala 50 55 60 Asp Arg Ile Val Asp Phe Ala Cys Ser His Arg Met Ala Val Arg Gly 65 70 75 80 His Thr Leu Val Trp His Asn Gln Thr Pro Asp Trp Val Phe Gln Asp 85 90 95 Gly Gln Gly His Phe Val Ser Arg Asp Val Leu Leu Glu Arg Met Lys 100 105 110 Cys His Ile Ser Thr Val Val Arg Arg Tyr Lys Gly Lys Ile Tyr Cys 115 120 125 Trp Asp Val Ile Asn Glu Ala Val Ala Asp Glu Gly Asp Glu Leu Leu 130 135 140 Arg Pro Ser Lys Trp Arg Gln Ile Ile Gly Asp Asp Phe Met Glu Gln 145 150 155 160 Ala Phe Leu Tyr Ala Tyr Glu Ala Asp Pro Asp Ala Leu Leu Phe Tyr 165 170 175 Asn Asp Tyr Asn Glu Cys Phe Pro Glu Lys Arg Glu Lys Ile Phe Ala 180 185 190 Leu Val Lys Ser Leu Arg Asp Lys Gly Ile Pro Ile His Gly Ile Gly 195 200 205 Met Gln Ala His Trp Ser Leu Thr Arg Pro Ser Leu Asp Glu Ile Arg 210 215 220 Ala Ala Ile Glu Arg Tyr Ala Ser Leu Gly Val Val Leu His Ile Thr 225 230 235 240 Glu Leu Asp Val Ser Met Phe Glu Phe His Asp Arg Arg Thr Asp Leu 245 250 255 Ala Val Pro Thr Asn Glu Met Ile Glu Gln Gln Ala Glu Arg Tyr Gly 260 265 270 Gln Ile Phe Ala Leu Phe Lys Glu Tyr Arg Asp Val Ile Gln Ser Val 275 280 285 Thr Phe Trp Gly Ile Ala Asp Asp His Thr Trp Leu Asp Asn Phe Pro 290 295 300 Val His Gly Arg Lys Asn Trp Pro Leu Leu Phe Asp Glu Gln His Lys 305 310 315 320 Pro Lys Pro Ala Phe Trp Arg Ala Val Ser Val 325 330 <210> 267 <211> 1956 <212> DNA <213> Bacteria <400> 267 atgaagcgta aggttaagaa gatggcagct atggcaacga gtataattat ggctatcatg 60 atcatcctac atagtatacc agtactcgcc gggcgaataa tttacgacaa tgagacaggc 120 acacatggag gctacgacta tgagctctgg aaagactacg gaaatacgat tatggaactt 180 aacgacggtg gtacttttag ttgtcaatgg agtaatatcg gtaatgcact atttagaaaa 240 gggagaaaat ttaattccga caaaacctat caagaattag gagatatagt agttgaatat 300 ggctgtgatt acaatccaaa cggaaattcc tatttgtgtg tttacggttg gacaagaaat 360 ccactggttg aatattacat tgtagaaagc tggggcagct ggcgtccacc tggagcaaca 420 cccaaaggaa ccatcacagt ggatggcggt acttatgaaa tatatgaaac tacccgggta 480 aatcagcctt ccatcgatgg aactgcgaca ttccaacaat attggagtgt tcgtacatcc 540 aagagaacaa gcggaacaat atctgtcact gaacatttta aacagtggga aagaatgggc 600 atgcgaatgg gtaagatgta tgaagttgct cttaccgttg aaggttatca gagcagtggg 660 tacgctaatg tatataagaa tgaaatcaga ataggtgcaa atccaactcc tgccccatct 720 caaagcccaa ttagaagaga tgcattttca ataatcgaag cggaagaata taacagcaca 780 aattcctcca ctttacaagt gattggaacg ccaaataatg gcagaggaat tggttatatt 840 gaaaatggta ataccgtaac ttacagcaat atagattttg gtagtggtgc aacagggttc 900 tctgcaactg ttgcaacgga ggttaatacc tcaattcaaa tccgttctga cagtcctatc 960 ggaactctac ttggtacctt atatgtaagt tctaccggca gctggaatac atatcaaacc 1020 gtatctacaa acatcagcaa aattaccggc gttcatgata ttgtattggt attctcaggt 1080 ccagtcaatg tggacaactt catatttagc agaagttcac cagtgcctgc acctggtgat 1140 aacacaagag acgcatattc tatcattcag gccgaggatt atgacagcag ttatggcccc 1200 aaccttcaaa tctttagctt accaggcggt ggcagcgcca ttggctatat tgaaaatggt 1260 tattccacta cctataataa cgttaatttc gccaacggct taagttctat aacagcaaga 1320 gttgccactc agatctcaac ttccattcag gtgagagcag gaggagcaac cggtacttta 1380 cttggtacaa tatatgttcc ttcgacaaat agttgggatt cttatcagaa tgtaactgcc 1440 aaccttagca atattacagg tgtgcatgat attacccttg tcttttcagg accagtgaat 1500 gtggactact tcgtatttac accagcaaat gtaaattcag ggcctacctc ccctgtcgga 1560 ggtacaagaa gtgcattttc caatattcaa gccgaagatt atgacagcag ttatggtccc 1620 aaccttcaaa tctttagctt accaggtggt ggcagcgcca ttggctatat tgaaaatggt 1680 tattccacta cctataaaaa tattgatttt ggtgacggcg caacgtccgt aacagcaaga 1740 gtagctaccc agaatgctac taccattcag gtaagattgg gaagtccatc gggtacatta 1800 cttggaacaa tttacgtggg gtccacagga agctttgata cttataggga tgtatccgct 1860 accattagta atactgcggg tgtaaaagat attgttcttg tattttcagg tcctgttaat 1920 gttgactggt ttgtattctc aaaatcagga acttaa 1956 <210> 268 <211> 651 <212> PRT <213> Bacteria <220> <221> SIGNAL <222> (1)...(30) <400> 268 Met Lys Arg Lys Val Lys Lys Met Ala Ala Met Ala Thr Ser Ile Ile 1 5 10 15 Met Ala Ile Met Ile Ile Leu His Ser Ile Pro Val Leu Ala Gly Arg 20 25 30 Ile Ile Tyr Asp Asn Glu Thr Gly Thr His Gly Gly Tyr Asp Tyr Glu 35 40 45 Leu Trp Lys Asp Tyr Gly Asn Thr Ile Met Glu Leu Asn Asp Gly Gly 50 55 60 Thr Phe Ser Cys Gln Trp Ser Asn Ile Gly Asn Ala Leu Phe Arg Lys 65 70 75 80 Gly Arg Lys Phe Asn Ser Asp Lys Thr Tyr Gln Glu Leu Gly Asp Ile 85 90 95 Val Val Glu Tyr Gly Cys Asp Tyr Asn Pro Asn Gly Asn Ser Tyr Leu 100 105 110 Cys Val Tyr Gly Trp Thr Arg Asn Pro Leu Val Glu Tyr Tyr Ile Val 115 120 125 Glu Ser Trp Gly Ser Trp Arg Pro Pro Gly Ala Thr Pro Lys Gly Thr 130 135 140 Ile Thr Val Asp Gly Gly Thr Tyr Glu Ile Tyr Glu Thr Thr Arg Val 145 150 155 160 Asn Gln Pro Ser Ile Asp Gly Thr Ala Thr Phe Gln Gln Tyr Trp Ser 165 170 175 Val Arg Thr Ser Lys Arg Thr Ser Gly Thr Ile Ser Val Thr Glu His 180 185 190 Phe Lys Gln Trp Glu Arg Met Gly Met Arg Met Gly Lys Met Tyr Glu 195 200 205 Val Ala Leu Thr Val Glu Gly Tyr Gln Ser Ser Gly Tyr Ala Asn Val 210 215 220 Tyr Lys Asn Glu Ile Arg Ile Gly Ala Asn Pro Thr Pro Ala Pro Ser 225 230 235 240 Gln Ser Pro Ile Arg Arg Asp Ala Phe Ser Ile Ile Glu Ala Glu Glu 245 250 255 Tyr Asn Ser Thr Asn Ser Ser Thr Leu Gln Val Ile Gly Thr Pro Asn 260 265 270 Asn Gly Arg Gly Ile Gly Tyr Ile Glu Asn Gly Asn Thr Val Thr Tyr 275 280 285 Ser Asn Ile Asp Phe Gly Ser Gly Ala Thr Gly Phe Ser Ala Thr Val 290 295 300 Ala Thr Glu Val Asn Thr Ser Ile Gln Ile Arg Ser Asp Ser Pro Ile 305 310 315 320 Gly Thr Leu Leu Gly Thr Leu Tyr Val Ser Ser Thr Gly Ser Trp Asn 325 330 335 Thr Tyr Gln Thr Val Ser Thr Asn Ile Ser Lys Ile Thr Gly Val His 340 345 350 Asp Ile Val Leu Val Phe Ser Gly Pro Val Asn Val Asp Asn Phe Ile 355 360 365 Phe Ser Arg Ser Ser Pro Val Pro Ala Pro Gly Asp Asn Thr Arg Asp 370 375 380 Ala Tyr Ser Ile Ile Gln Ala Glu Asp Tyr Asp Ser Ser Tyr Gly Pro 385 390 395 400 Asn Leu Gln Ile Phe Ser Leu Pro Gly Gly Gly Ser Ala Ile Gly Tyr 405 410 415 Ile Glu Asn Gly Tyr Ser Thr Thr Tyr Asn Asn Val Asn Phe Ala Asn 420 425 430 Gly Leu Ser Ser Ile Thr Ala Arg Val Ala Thr Gln Ile Ser Thr Ser 435 440 445 Ile Gln Val Arg Ala Gly Gly Ala Thr Gly Thr Leu Leu Gly Thr Ile 450 455 460 Tyr Val Pro Ser Thr Asn Ser Trp Asp Ser Tyr Gln Asn Val Thr Ala 465 470 475 480 Asn Leu Ser Asn Ile Thr Gly Val His Asp Ile Thr Leu Val Phe Ser 485 490 495 Gly Pro Val Asn Val Asp Tyr Phe Val Phe Thr Pro Ala Asn Val Asn 500 505 510 Ser Gly Pro Thr Ser Pro Val Gly Gly Thr Arg Ser Ala Phe Ser Asn 515 520 525 Ile Gln Ala Glu Asp Tyr Asp Ser Ser Tyr Gly Pro Asn Leu Gln Ile 530 535 540 Phe Ser Leu Pro Gly Gly Gly Ser Ala Ile Gly Tyr Ile Glu Asn Gly 545 550 555 560 Tyr Ser Thr Thr Tyr Lys Asn Ile Asp Phe Gly Asp Gly Ala Thr Ser 565 570 575 Val Thr Ala Arg Val Ala Thr Gln Asn Ala Thr Thr Ile Gln Val Arg 580 585 590 Leu Gly Ser Pro Ser Gly Thr Leu Leu Gly Thr Ile Tyr Val Gly Ser 595 600 605 Thr Gly Ser Phe Asp Thr Tyr Arg Asp Val Ser Ala Thr Ile Ser Asn 610 615 620 Thr Ala Gly Val Lys Asp Ile Val Leu Val Phe Ser Gly Pro Val Asn 625 630 635 640 Val Asp Trp Phe Val Phe Ser Lys Ser Gly Thr 645 650 <210> 269 <211> 1110 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 269 atggggtaca ataggatcat acaagcgatc cgcgtaagca agggagatgt tttgggcgtt 60 cataaagttt tttacgctgc acttgcgtgt gtggcgatgg ggtattcgga aacgtgggca 120 cagtgcgcga cctggacccg aagcaccatt cgcaattgcg agggcatcga ctacgagttg 180 tggaaccaga acaaccgcgg cacggtcaac atggaaatca cgggaaacgg aacgttcgcg 240 gcgacgtgga gcggaacgga aaacatcctg tttcgcgccg gcaagaaatg ggggttcaac 300 agcaccacga cggcgcggtc ggtcggcgcc atcacgctcg atttcgctgc gacctggacc 360 tccagcgaca acgtgaaaat gctcggcatc tacggctggg cgtattaccc gtcgggaagc 420 gagccgacga aaacggaaag cggtcaaaac acgagctttt ccgatcagat cgagtattac 480 atcatccagg accgcggagg cttcaacccg ggttccggcg gcgtcaacgc caaaaagtac 540 ggcgaggccg tgatcgacgg aatcgcctat gacttttggg tggccgaccg gatcaaccag 600 cccatgctga caggaagagg caacttcaag caatacttca gcgttccacg gaacacgagc 660 agccaccggc aaagcggcat cgtcagcatt tcgaagcact ttgaggagtg ggacaaggcc 720 ggcatgaaga tgctggactg tccgctatac gaagtcgcga tgaaggtgga atcgtatacg 780 ggctcggcga atggcggcgg gtcggcgaac gtgacccgga atattctcac gctcggcggt 840 tcttccgcac cgacccctat cgcgcgcggc cccggccggt ccgccgaaag catgcgggtc 900 gccttcgttc aggaaagagt gctcaaggtc gcgcccgtcg acggaacccg cctgcaagtc 960 aaggtgcggg acgtgaaggg cgtgaaccgg gccgagttca atgccgcggg cgcggcaacg 1020 ttctcgttgt cccatgtccc cgcgggcccg tatttcctgg atgtgacggg gccggatgta 1080 agacagatca cgccgttcgt tttgcgataa 1110 <210> 270 <211> 369 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <400> 270 Met Gly Tyr Asn Arg Ile Ile Gln Ala Ile Arg Val Ser Lys Gly Asp 1 5 10 15 Val Leu Gly Val His Lys Val Phe Tyr Ala Ala Leu Ala Cys Val Ala 20 25 30 Met Gly Tyr Ser Glu Thr Trp Ala Gln Cys Ala Thr Trp Thr Arg Ser 35 40 45 Thr Ile Arg Asn Cys Glu Gly Ile Asp Tyr Glu Leu Trp Asn Gln Asn 50 55 60 Asn Arg Gly Thr Val Asn Met Glu Ile Thr Gly Asn Gly Thr Phe Ala 65 70 75 80 Ala Thr Trp Ser Gly Thr Glu Asn Ile Leu Phe Arg Ala Gly Lys Lys 85 90 95 Trp Gly Phe Asn Ser Thr Thr Thr Ala Arg Ser Val Gly Ala Ile Thr 100 105 110 Leu Asp Phe Ala Ala Thr Trp Thr Ser Ser Asp Asn Val Lys Met Leu 115 120 125 Gly Ile Tyr Gly Trp Ala Tyr Tyr Pro Ser Gly Ser Glu Pro Thr Lys 130 135 140 Thr Glu Ser Gly Gln Asn Thr Ser Phe Ser Asp Gln Ile Glu Tyr Tyr 145 150 155 160 Ile Ile Gln Asp Arg Gly Gly Phe Asn Pro Gly Ser Gly Gly Val Asn 165 170 175 Ala Lys Lys Tyr Gly Glu Ala Val Ile Asp Gly Ile Ala Tyr Asp Phe 180 185 190 Trp Val Ala Asp Arg Ile Asn Gln Pro Met Leu Thr Gly Arg Gly Asn 195 200 205 Phe Lys Gln Tyr Phe Ser Val Pro Arg Asn Thr Ser Ser His Arg Gln 210 215 220 Ser Gly Ile Val Ser Ile Ser Lys His Phe Glu Glu Trp Asp Lys Ala 225 230 235 240 Gly Met Lys Met Leu Asp Cys Pro Leu Tyr Glu Val Ala Met Lys Val 245 250 255 Glu Ser Tyr Thr Gly Ser Ala Asn Gly Gly Gly Ser Ala Asn Val Thr 260 265 270 Arg Asn Ile Leu Thr Leu Gly Gly Ser Ser Ala Pro Thr Pro Ile Ala 275 280 285 Arg Gly Pro Gly Arg Ser Ala Glu Ser Met Arg Val Ala Phe Val Gln 290 295 300 Glu Arg Val Leu Lys Val Ala Pro Val Asp Gly Thr Arg Leu Gln Val 305 310 315 320 Lys Val Arg Asp Val Lys Gly Val Asn Arg Ala Glu Phe Asn Ala Ala 325 330 335 Gly Ala Ala Thr Phe Ser Leu Ser His Val Pro Ala Gly Pro Tyr Phe 340 345 350 Leu Asp Val Thr Gly Pro Asp Val Arg Gln Ile Thr Pro Phe Val Leu 355 360 365 Arg <210> 271 <211> 1128 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 271 atgttcattc acaacagcat atgcagcgca ctctgcacaa tctttttggc aactgcaaca 60 atgggagaaa acatgacact acaagaagcc tttgccgatc acttttatgt gggagccgcc 120 atcagccaac gcctttttca accagatcgc gccgaaacgc tgcaactggc cgcgcaccaa 180 ttcaacagca tcacagccga aaatgagatg aagtggcagt cgttaaatcc cactcctggc 240 gaataccgtt tcgaaaacgc cgataaattc gtccgctttg gtgtcgaaaa cgatatgtac 300 atcgttgggc acgttctctt ctggcacagc cagacacccg actggctctt caaggatgac 360 gacggtaact tcgtctcccg cgaagtctta ctcgaccgca tgcgcgccca cgtgcgcaat 420 cttgtccagc gctacggcaa ccatgtgcac gcctgggatg ttatcaatga aaccttcaat 480 gataatggtt ccttgcgcga cagcccatgg acgcaaatcc tcggcgagga attcatcgag 540 cacgccttcc ggattgccgg cgaggaactc cccccccatg tcgagctgct ctacaatgat 600 tattcgatga ccattcctgc caagcgcgat gctgttgctg aaatggttcg cgacctcata 660 gccaaaggca tccgcattga cggcgttggc atgcagggac attgggcacg gacccacccg 720 accatagcgg acatagaaaa aagcattctt gccttcgcag gaaccggcgt acaggtacac 780 atcactgagc tcgacatcga catgctgcca cgccatcccc agatgtttac tggtggtgca 840 gacaccatgt tgcgcctaca acaagatccc aaactcgacc cctacactga gggacttcca 900 gcggaagatc agcaggcatt ggcagaacgc tacgcaagca tcttccgttt attcttgaag 960 cacagcgatg ttattcgccg tgtcaccttc tggggggtca ccgatgccca cacctggctc 1020 aacaattggc ccatccgtgg ccgcaccagc catcccctgc tcttcgaccg ccagaacaac 1080 cccaaacccg ccttccacgc cgtcgtcaga ctgaagaccg aagactga 1128 <210> 272 <211> 375 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(22) <400> 272 Met Phe Ile His Asn Ser Ile Cys Ser Ala Leu Cys Thr Ile Phe Leu 1 5 10 15 Ala Thr Ala Thr Met Gly Glu Asn Met Thr Leu Gln Glu Ala Phe Ala 20 25 30 Asp His Phe Tyr Val Gly Ala Ala Ile Ser Gln Arg Leu Phe Gln Pro 35 40 45 Asp Arg Ala Glu Thr Leu Gln Leu Ala Ala His Gln Phe Asn Ser Ile 50 55 60 Thr Ala Glu Asn Glu Met Lys Trp Gln Ser Leu Asn Pro Thr Pro Gly 65 70 75 80 Glu Tyr Arg Phe Glu Asn Ala Asp Lys Phe Val Arg Phe Gly Val Glu 85 90 95 Asn Asp Met Tyr Ile Val Gly His Val Leu Phe Trp His Ser Gln Thr 100 105 110 Pro Asp Trp Leu Phe Lys Asp Asp Asp Gly Asn Phe Val Ser Arg Glu 115 120 125 Val Leu Leu Asp Arg Met Arg Ala His Val Arg Asn Leu Val Gln Arg 130 135 140 Tyr Gly Asn His Val His Ala Trp Asp Val Ile Asn Glu Thr Phe Asn 145 150 155 160 Asp Asn Gly Ser Leu Arg Asp Ser Pro Trp Thr Gln Ile Leu Gly Glu 165 170 175 Glu Phe Ile Glu His Ala Phe Arg Ile Ala Gly Glu Glu Leu Pro Pro 180 185 190 His Val Glu Leu Leu Tyr Asn Asp Tyr Ser Met Thr Ile Pro Ala Lys 195 200 205 Arg Asp Ala Val Ala Glu Met Val Arg Asp Leu Ile Ala Lys Gly Ile 210 215 220 Arg Ile Asp Gly Val Gly Met Gln Gly His Trp Ala Arg Thr His Pro 225 230 235 240 Thr Ile Ala Asp Ile Glu Lys Ser Ile Leu Ala Phe Ala Gly Thr Gly 245 250 255 Val Gln Val His Ile Thr Glu Leu Asp Ile Asp Met Leu Pro Arg His 260 265 270 Pro Gln Met Phe Thr Gly Gly Ala Asp Thr Met Leu Arg Leu Gln Gln 275 280 285 Asp Pro Lys Leu Asp Pro Tyr Thr Glu Gly Leu Pro Ala Glu Asp Gln 290 295 300 Gln Ala Leu Ala Glu Arg Tyr Ala Ser Ile Phe Arg Leu Phe Leu Lys 305 310 315 320 His Ser Asp Val Ile Arg Arg Val Thr Phe Trp Gly Val Thr Asp Ala 325 330 335 His Thr Trp Leu Asn Asn Trp Pro Ile Arg Gly Arg Thr Ser His Pro 340 345 350 Leu Leu Phe Asp Arg Gln Asn Asn Pro Lys Pro Ala Phe His Ala Val 355 360 365 Val Arg Leu Lys Thr Glu Asp 370 375 <210> 273 <211> 1134 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 273 atggtttcat cgctaatcaa ttcttcatac attcggctca agcactattc gtgctcaagt 60 ttattgctcc tgacattggc agcctgtggc ggccagcagc ctcccccgga tacgggatcc 120 agcacttcaa gttcaagcag ttcttcgagc tccagttcaa gcagctcttc aagttccagc 180 tcaagcagtt cttccagctc cagctcgagc agctcttcga gttcgagctc ttcatcatcc 240 agctcttcag gggcaaaccc gccaccgacc gggggcaagt tcgtcggcaa catcacgacc 300 cgaggcgccg tccaagcgga cttcattcag tactgggatc aaattacgcc ggagaacgag 360 ggcaaatggg gttctgtgga aggaactcgc gaccagtaca actgggcgcc tcttgatcgc 420 atctatgact atgcacgtca gcacaatatc ccagtcaaag cgcatacgct ggtttggggt 480 gcacaggctc caggctggat caacaatctg agtgcggccg agcagcgtga ggaaatcgag 540 gaatggattc gtgattactg cacgcgttac ccagacaccc aaatgatcga cgtagttaac 600 gaggcgcacc caaatcacgc ccccgctcgc tatgcgcaga atgccttcgg caatgactgg 660 attaccgaag cgttcaaact ggcgcgccgg cactgcccca acgccatttt gatctacaac 720 gactataatt tcatcacttg ggataccgat gaaatcatgg cgctgattcg cccggctatc 780 gcagcagggg tagtggatgc ggtagggctg caggcgcata gcttgtatcc tgacgaatac 840 gctaacaaga tgtggagtgc cgctgaaata cagcagaagc tcgatctgat ctctaccctt 900 ggcgtgccga tgtatatttc ggaatatgat gtcgccaagt ccaatgacca agagcagttg 960 gcgattttca gcgagcagtt cccggtcctt tacgaacacc ccaatgtcgt aggtgtaacc 1020 ctctggggct atattgatgg agcgacgtgg cgcgccggct cgggcttgat tcgaaacggt 1080 cagcaccggc ccgccatgca atggctgctc gagtacttgg agaacaatcg atag 1134 <210> 274 <211> 377 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(74) <400> 274 Met Val Ser Ser Leu Ile Asn Ser Ser Tyr Ile Arg Leu Lys His Tyr 1 5 10 15 Ser Cys Ser Ser Leu Leu Leu Leu Thr Leu Ala Ala Cys Gly Gly Gln 20 25 30 Gln Pro Pro Pro Asp Thr Gly Ser Ser Thr Ser Ser Ser Ser Ser Ser 35 40 45 Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser 50 55 60 Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser 65 70 75 80 Ser Ser Ser Gly Ala Asn Pro Pro Pro Thr Gly Gly Lys Phe Val Gly 85 90 95 Asn Ile Thr Thr Arg Gly Ala Val Gln Ala Asp Phe Ile Gln Tyr Trp 100 105 110 Asp Gln Ile Thr Pro Glu Asn Glu Gly Lys Trp Gly Ser Val Glu Gly 115 120 125 Thr Arg Asp Gln Tyr Asn Trp Ala Pro Leu Asp Arg Ile Tyr Asp Tyr 130 135 140 Ala Arg Gln His Asn Ile Pro Val Lys Ala His Thr Leu Val Trp Gly 145 150 155 160 Ala Gln Ala Pro Gly Trp Ile Asn Asn Leu Ser Ala Ala Glu Gln Arg 165 170 175 Glu Glu Ile Glu Glu Trp Ile Arg Asp Tyr Cys Thr Arg Tyr Pro Asp 180 185 190 Thr Gln Met Ile Asp Val Val Asn Glu Ala His Pro Asn His Ala Pro 195 200 205 Ala Arg Tyr Ala Gln Asn Ala Phe Gly Asn Asp Trp Ile Thr Glu Ala 210 215 220 Phe Lys Leu Ala Arg Arg His Cys Pro Asn Ala Ile Leu Ile Tyr Asn 225 230 235 240 Asp Tyr Asn Phe Ile Thr Trp Asp Thr Asp Glu Ile Met Ala Leu Ile 245 250 255 Arg Pro Ala Ile Ala Ala Gly Val Val Asp Ala Val Gly Leu Gln Ala 260 265 270 His Ser Leu Tyr Pro Asp Glu Tyr Ala Asn Lys Met Trp Ser Ala Ala 275 280 285 Glu Ile Gln Gln Lys Leu Asp Leu Ile Ser Thr Leu Gly Val Pro Met 290 295 300 Tyr Ile Ser Glu Tyr Asp Val Ala Lys Ser Asn Asp Gln Glu Gln Leu 305 310 315 320 Ala Ile Phe Ser Glu Gln Phe Pro Val Leu Tyr Glu His Pro Asn Val 325 330 335 Val Gly Val Thr Leu Trp Gly Tyr Ile Asp Gly Ala Thr Trp Arg Ala 340 345 350 Gly Ser Gly Leu Ile Arg Asn Gly Gln His Arg Pro Ala Met Gln Trp 355 360 365 Leu Leu Glu Tyr Leu Glu Asn Asn Arg 370 375 <210> 275 <211> 1401 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 275 ttgggcgctg atccatttgc gctcacctat aacggaagag tgtacattta tatgtcgagt 60 gatgactatg aatatcacag caatggaacg attaaggata attcttttgc caatttgaat 120 agggtctttg tcatctcttc agcagatatg gtgaactgga cagatcatgg cgcgattcca 180 gtagctgggg caaatggcgc aaatggcggc aaaggaattg ccaaatgggc aggtgcttcc 240 tgggctccat cagcagcggt gaaaaaaatc aatgggaagg ataaattttt cctttatttc 300 gcgaacagcg gcggagggat tggcgttctg acagcagact cccccatcgg tccatggaca 360 gatcctatcg gaaaagcact cgtcacgcca aatacaccag ggatggctgg agttgtatgg 420 ctttttgatc ctgccgtttt tgtagatgat gacggcactg gttatctata tgccggcgga 480 ggtgttccag gcggttctaa tccaacgcag ggacaatggg cgaatcctaa aacagcaaga 540 gttctaaaac taggacctga tatgacaagt gtggtaggca gcgcatcaac cattgatgct 600 ccttttatgt ttgaagattc ggggatgcat aagtataacg gaacctatta ctattcctat 660 tgcatcaact ttggcggctc ccacccagca gataaaccac ctggtgagat cggttatatg 720 acgagctcaa gtccgatggg tccctttacg tatagagggc acttcctgaa aaatccgggt 780 gcatttttcg ggggaggcgg taataaccat catgctgtgt tcaattttaa aaacgagtgg 840 tatgtcgtgt atcataccca aacggtcagc tctgctttat acggatcagg aaaaggctac 900 agatctccgc atattaataa acttgtgcat aatgctgacg gctcccttcg agaagtcgca 960 gccaattttg aaggggttaa acagctttcc aacctgaatc cttatcagcg tgtagaagct 1020 gaaacattcg catggaatgg acgcattttg acagaggcat cttcagctcc aggcggaccg 1080 gtcaataacc agcatgtcac aaacattcaa aacggagatt gggtggctgc cagtaacgtc 1140 gatttcggat caaacggcgc gaggacattt aaagcgaatg tagcatcaaa tacaggcggg 1200 aaaatagaag tacgcctcgg aagtccagac ggcagactcg tcggaacact gaatgtccct 1260 tccacagggg gaacaaataa ctggcgagaa gtagaaacgg cagtaaatgg agcagcaggc 1320 gtgcacaacg tattttttgt ttttactgga acaggtgcaa atctatttca atttgattcc 1380 tggcagttta ctcaaaggta a 1401 <210> 276 <211> 466 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <400> 276 Met Gly Ala Asp Pro Phe Ala Leu Thr Tyr Asn Gly Arg Val Tyr Ile 1 5 10 15 Tyr Met Ser Ser Asp Asp Tyr Glu Tyr His Ser Asn Gly Thr Ile Lys 20 25 30 Asp Asn Ser Phe Ala Asn Leu Asn Arg Val Phe Val Ile Ser Ser Ala 35 40 45 Asp Met Val Asn Trp Thr Asp His Gly Ala Ile Pro Val Ala Gly Ala 50 55 60 Asn Gly Ala Asn Gly Gly Lys Gly Ile Ala Lys Trp Ala Gly Ala Ser 65 70 75 80 Trp Ala Pro Ser Ala Ala Val Lys Lys Ile Asn Gly Lys Asp Lys Phe 85 90 95 Phe Leu Tyr Phe Ala Asn Ser Gly Gly Gly Ile Gly Val Leu Thr Ala 100 105 110 Asp Ser Pro Ile Gly Pro Trp Thr Asp Pro Ile Gly Lys Ala Leu Val 115 120 125 Thr Pro Asn Thr Pro Gly Met Ala Gly Val Val Trp Leu Phe Asp Pro 130 135 140 Ala Val Phe Val Asp Asp Asp Gly Thr Gly Tyr Leu Tyr Ala Gly Gly 145 150 155 160 Gly Val Pro Gly Gly Ser Asn Pro Thr Gln Gly Gln Trp Ala Asn Pro 165 170 175 Lys Thr Ala Arg Val Leu Lys Leu Gly Pro Asp Met Thr Ser Val Val 180 185 190 Gly Ser Ala Ser Thr Ile Asp Ala Pro Phe Met Phe Glu Asp Ser Gly 195 200 205 Met His Lys Tyr Asn Gly Thr Tyr Tyr Tyr Ser Tyr Cys Ile Asn Phe 210 215 220 Gly Gly Ser His Pro Ala Asp Lys Pro Pro Gly Glu Ile Gly Tyr Met 225 230 235 240 Thr Ser Ser Ser Pro Met Gly Pro Phe Thr Tyr Arg Gly His Phe Leu 245 250 255 Lys Asn Pro Gly Ala Phe Phe Gly Gly Gly Gly Asn Asn His His Ala 260 265 270 Val Phe Asn Phe Lys Asn Glu Trp Tyr Val Val Tyr His Thr Gln Thr 275 280 285 Val Ser Ser Ala Leu Tyr Gly Ser Gly Lys Gly Tyr Arg Ser Pro His 290 295 300 Ile Asn Lys Leu Val His Asn Ala Asp Gly Ser Leu Arg Glu Val Ala 305 310 315 320 Ala Asn Phe Glu Gly Val Lys Gln Leu Ser Asn Leu Asn Pro Tyr Gln 325 330 335 Arg Val Glu Ala Glu Thr Phe Ala Trp Asn Gly Arg Ile Leu Thr Glu 340 345 350 Ala Ser Ser Ala Pro Gly Gly Pro Val Asn Asn Gln His Val Thr Asn 355 360 365 Ile Gln Asn Gly Asp Trp Val Ala Ala Ser Asn Val Asp Phe Gly Ser 370 375 380 Asn Gly Ala Arg Thr Phe Lys Ala Asn Val Ala Ser Asn Thr Gly Gly 385 390 395 400 Lys Ile Glu Val Arg Leu Gly Ser Pro Asp Gly Arg Leu Val Gly Thr 405 410 415 Leu Asn Val Pro Ser Thr Gly Gly Thr Asn Asn Trp Arg Glu Val Glu 420 425 430 Thr Ala Val Asn Gly Ala Ala Gly Val His Asn Val Phe Phe Val Phe 435 440 445 Thr Gly Thr Gly Ala Asn Leu Phe Gln Phe Asp Ser Trp Gln Phe Thr 450 455 460 Gln Arg 465 <210> 277 <211> 1128 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 277 atgcgaaaca cattaatcct tttgattccg gccttgatga tgctttcttg cagtgcggga 60 aatcaggata gagtaccatc cctgcacgcc gagttctcgg atgcattttt gattggaacg 120 gcgctgaatt ctgagcagat attgggtcgg gatacacgcg gactcgaatt gattagaact 180 cattttaacg ccattacgcc cgaaaacatt accaaatggg aggctatcca tcccgaaccc 240 ggtgtctatg attttaaaga ggctgatgca ttcgtcgatt ttggccaaaa atataatatg 300 ttcatggtgg gtcatacact ggtttggcat agtcagacac cgcgctgggt cttcaaagac 360 gaaaatggcg cgttggtatc gcgcgaggta ctgttagagc ggatgcgcga ccacatccac 420 accgttgttg gccgctaccg tggacgtatt cacggctggg atgtcgtaaa cgaagccctc 480 aatgaagacg gttcgtacag agaaacactg tggtaccaaa taattggtac ggactatatt 540 cttaaagcat tcgaatttgc ccgggaggcc gatcccgacg ctgagctata ctataacgat 600 tactcgcttg agaacccctc aaagagagcc ggcgcgatgc gaattgttca atacctgcag 660 gaacatggtg ctccgattac tggggttgga acccaggggc atttcaccct cgactggccc 720 gaactttctg aaattgaaca gaccgtcatt gattttgcct cccttggtat ggatgtaatg 780 attaccgaat tggatatcga tgtactgcct cagccagacg attatactgg cgccgatgtg 840 aattttagcg cagagcttta cgacgaactg aacccatggc ccaacggcct tccaccggaa 900 attgaacagg aattggccaa tcgatatgcc gacatcttcg aaatctattt gcgtcatcgt 960 gataaagtta cgcgagtgtc tttttggggt gtcacagatg gcgactcgtg gaaaaataac 1020 tggcctgtgc caggtcgtac caactatccg ctcatttttg atcgaaactg gaagccaaaa 1080 cccgcttttt tctcgattgt tgatgcagcc agggaggcac tggattaa 1128 <210> 278 <211> 375 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(19) <400> 278 Met Arg Asn Thr Leu Ile Leu Leu Ile Pro Ala Leu Met Met Leu Ser 1 5 10 15 Cys Ser Ala Gly Asn Gln Asp Arg Val Pro Ser Leu His Ala Glu Phe 20 25 30 Ser Asp Ala Phe Leu Ile Gly Thr Ala Leu Asn Ser Glu Gln Ile Leu 35 40 45 Gly Arg Asp Thr Arg Gly Leu Glu Leu Ile Arg Thr His Phe Asn Ala 50 55 60 Ile Thr Pro Glu Asn Ile Thr Lys Trp Glu Ala Ile His Pro Glu Pro 65 70 75 80 Gly Val Tyr Asp Phe Lys Glu Ala Asp Ala Phe Val Asp Phe Gly Gln 85 90 95 Lys Tyr Asn Met Phe Met Val Gly His Thr Leu Val Trp His Ser Gln 100 105 110 Thr Pro Arg Trp Val Phe Lys Asp Glu Asn Gly Ala Leu Val Ser Arg 115 120 125 Glu Val Leu Leu Glu Arg Met Arg Asp His Ile His Thr Val Val Gly 130 135 140 Arg Tyr Arg Gly Arg Ile His Gly Trp Asp Val Val Asn Glu Ala Leu 145 150 155 160 Asn Glu Asp Gly Ser Tyr Arg Glu Thr Leu Trp Tyr Gln Ile Ile Gly 165 170 175 Thr Asp Tyr Ile Leu Lys Ala Phe Glu Phe Ala Arg Glu Ala Asp Pro 180 185 190 Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Leu Glu Asn Pro Ser Lys 195 200 205 Arg Ala Gly Ala Met Arg Ile Val Gln Tyr Leu Gln Glu His Gly Ala 210 215 220 Pro Ile Thr Gly Val Gly Thr Gln Gly His Phe Thr Leu Asp Trp Pro 225 230 235 240 Glu Leu Ser Glu Ile Glu Gln Thr Val Ile Asp Phe Ala Ser Leu Gly 245 250 255 Met Asp Val Met Ile Thr Glu Leu Asp Ile Asp Val Leu Pro Gln Pro 260 265 270 Asp Asp Tyr Thr Gly Ala Asp Val Asn Phe Ser Ala Glu Leu Tyr Asp 275 280 285 Glu Leu Asn Pro Trp Pro Asn Gly Leu Pro Pro Glu Ile Glu Gln Glu 290 295 300 Leu Ala Asn Arg Tyr Ala Asp Ile Phe Glu Ile Tyr Leu Arg His Arg 305 310 315 320 Asp Lys Val Thr Arg Val Ser Phe Trp Gly Val Thr Asp Gly Asp Ser 325 330 335 Trp Lys Asn Asn Trp Pro Val Pro Gly Arg Thr Asn Tyr Pro Leu Ile 340 345 350 Phe Asp Arg Asn Trp Lys Pro Lys Pro Ala Phe Phe Ser Ile Val Asp 355 360 365 Ala Ala Arg Glu Ala Leu Asp 370 375 <210> 279 <211> 786 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 279 atgctttctc cgacaaggaa actcccgccg gccattggac tcaccttcct cttcgccgct 60 tcggcgacgc cggaaaccac gctcaaggac gccttcgcgg accattttct cgtcggggcg 120 gcgctcaatg aatcgcactt tgcggagcac aatccggcgc acgccggtct cgtcgccgca 180 aacttcaatg cgatcaccgc ggagaatgtg atgaaatggg aggccgttca tccccggccg 240 ggagaatata cgttcggcgc cgcggaccgg ttcgttgagt tcggggaaaa gaacggcctg 300 ttcatcgtgg ggcacacgct gatctggcat tctcaaacgc cggcctgggt tttcgaggat 360 gagaatggcg cgccgctcgg ccgcgaggcg ctgctggagc ggatgcgcga tcacattcac 420 accgttgccg gacgttacag gggccgtgtg aaggggtggg acgtggtcaa cgaagccctc 480 gccgaggacg gttccctgcg ggattcgccg tggcgccgca tcataggcga cgactatttc 540 gtgaaggcct ttgagtttgc gcgggaagct gatccggatg cggagttgta ttacaacgat 600 tactcgattg aaaacgaacc gaagcgcaag ggggcggtgg cgttggtgag gacgctccag 660 gcggcgggtg ttcccgttgc cggcgtgggg attcagggac acggcaatct ccattggcct 720 tctccgcggc ttgtcgaaga ggcgatccgg gactttgcca gtttgggcgt caaggtgatg 780 atctga 786 <210> 280 <211> 261 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(22) <400> 280 Met Leu Ser Pro Thr Arg Lys Leu Pro Pro Ala Ile Gly Leu Thr Phe 1 5 10 15 Leu Phe Ala Ala Ser Ala Thr Pro Glu Thr Thr Leu Lys Asp Ala Phe 20 25 30 Ala Asp His Phe Leu Val Gly Ala Ala Leu Asn Glu Ser His Phe Ala 35 40 45 Glu His Asn Pro Ala His Ala Gly Leu Val Ala Ala Asn Phe Asn Ala 50 55 60 Ile Thr Ala Glu Asn Val Met Lys Trp Glu Ala Val His Pro Arg Pro 65 70 75 80 Gly Glu Tyr Thr Phe Gly Ala Ala Asp Arg Phe Val Glu Phe Gly Glu 85 90 95 Lys Asn Gly Leu Phe Ile Val Gly His Thr Leu Ile Trp His Ser Gln 100 105 110 Thr Pro Ala Trp Val Phe Glu Asp Glu Asn Gly Ala Pro Leu Gly Arg 115 120 125 Glu Ala Leu Leu Glu Arg Met Arg Asp His Ile His Thr Val Ala Gly 130 135 140 Arg Tyr Arg Gly Arg Val Lys Gly Trp Asp Val Val Asn Glu Ala Leu 145 150 155 160 Ala Glu Asp Gly Ser Leu Arg Asp Ser Pro Trp Arg Arg Ile Ile Gly 165 170 175 Asp Asp Tyr Phe Val Lys Ala Phe Glu Phe Ala Arg Glu Ala Asp Pro 180 185 190 Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Ile Glu Asn Glu Pro Lys 195 200 205 Arg Lys Gly Ala Val Ala Leu Val Arg Thr Leu Gln Ala Ala Gly Val 210 215 220 Pro Val Ala Gly Val Gly Ile Gln Gly His Gly Asn Leu His Trp Pro 225 230 235 240 Ser Pro Arg Leu Val Glu Glu Ala Ile Arg Asp Phe Ala Ser Leu Gly 245 250 255 Val Lys Val Met Ile 260 <210> 281 <211> 963 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 281 gtgggcacct gcatgagcgg ggccgattcg cgcaaccctg cccgtctgga gctgatcaga 60 acgcagtaca gcatcatcac cccggaaaac gagctcaagc ccgattccgt tctggatgtg 120 gctgccagcc gtgctctggc caaggaggac gataccgccg tggccgtgca tttcagcgcc 180 gccgctccca tcctgaactt tgcccgtgac aacggcatca aggtgcacgg tcatgtgctg 240 gtctggcaca gccagactcc cgaggagttc ttccacgagg gctataacgc ctccgcgccc 300 tatgtgagcc gcgaggtgat gctggcccgt ctggacaact acatccgtct catctttgaa 360 tatatggatg aaaactatcc cggcctgatc gtgtcctggg atgtggccaa cgaatgcgtg 420 gccgacggct ccaccgccct gcgcacctcc aactggaccc gcgtggtggg gcaggatttt 480 gtggcccgcg ccttcgagat cgccgataaa tacgcgcccg aagatgtgat gctctgctac 540 aacgattatt ccactcccta tgagcccaag ctcaccggca tcgtgaacct gctcaccgag 600 ctgacacagg agggtcatat cgacggctac ggcttccaga gccactacag tgtcggcgat 660 ccctccctgc aggcggtcga gaacgcgttc aaaaagatct ccgccctggg gctcaagctg 720 cgcgtgagcg agctggacat caaggtagat gccgacagcg agcccaaccg cgcccttcag 780 gccgaccggt atgaggccct gctgcgcatc tatatgaaat acggcgtcag cgccgtgcag 840 gtgtggggcg tatgcgacgg caccagctgg atcggcgcga gctatcccct cccctttgac 900 gccgggctgc gtcccaagcc ctccttcttc ggcatactcc gcgcccttga cgaacagaac 960 tga 963 <210> 282 <211> 320 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <400> 282 Met Gly Thr Cys Met Ser Gly Ala Asp Ser Arg Asn Pro Ala Arg Leu 1 5 10 15 Glu Leu Ile Arg Thr Gln Tyr Ser Ile Ile Thr Pro Glu Asn Glu Leu 20 25 30 Lys Pro Asp Ser Val Leu Asp Val Ala Ala Ser Arg Ala Leu Ala Lys 35 40 45 Glu Asp Asp Thr Ala Val Ala Val His Phe Ser Ala Ala Ala Pro Ile 50 55 60 Leu Asn Phe Ala Arg Asp Asn Gly Ile Lys Val His Gly His Val Leu 65 70 75 80 Val Trp His Ser Gln Thr Pro Glu Glu Phe Phe His Glu Gly Tyr Asn 85 90 95 Ala Ser Ala Pro Tyr Val Ser Arg Glu Val Met Leu Ala Arg Leu Asp 100 105 110 Asn Tyr Ile Arg Leu Ile Phe Glu Tyr Met Asp Glu Asn Tyr Pro Gly 115 120 125 Leu Ile Val Ser Trp Asp Val Ala Asn Glu Cys Val Ala Asp Gly Ser 130 135 140 Thr Ala Leu Arg Thr Ser Asn Trp Thr Arg Val Val Gly Gln Asp Phe 145 150 155 160 Val Ala Arg Ala Phe Glu Ile Ala Asp Lys Tyr Ala Pro Glu Asp Val 165 170 175 Met Leu Cys Tyr Asn Asp Tyr Ser Thr Pro Tyr Glu Pro Lys Leu Thr 180 185 190 Gly Ile Val Asn Leu Leu Thr Glu Leu Thr Gln Glu Gly His Ile Asp 195 200 205 Gly Tyr Gly Phe Gln Ser His Tyr Ser Val Gly Asp Pro Ser Leu Gln 210 215 220 Ala Val Glu Asn Ala Phe Lys Lys Ile Ser Ala Leu Gly Leu Lys Leu 225 230 235 240 Arg Val Ser Glu Leu Asp Ile Lys Val Asp Ala Asp Ser Glu Pro Asn 245 250 255 Arg Ala Leu Gln Ala Asp Arg Tyr Glu Ala Leu Leu Arg Ile Tyr Met 260 265 270 Lys Tyr Gly Val Ser Ala Val Gln Val Trp Gly Val Cys Asp Gly Thr 275 280 285 Ser Trp Ile Gly Ala Ser Tyr Pro Leu Pro Phe Asp Ala Gly Leu Arg 290 295 300 Pro Lys Pro Ser Phe Phe Gly Ile Leu Arg Ala Leu Asp Glu Gln Asn 305 310 315 320 <210> 283 <211> 4161 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 283 atgtataaaa gtttcgtcaa gaaagtctcc cttgtattat ctactctttt gctcttagtt 60 tcggcgtttc ctgtctcata tgcacaaatg aattccatcc ccgtttatga agaaacgttt 120 gaaaaccaag gaaactatgt ccaatctggt ggtgcgaccc tcactctagt aaaaaacaaa 180 gtgtttgcag ggaatgaaga tggaactgca ctatatatta gtaatcgatc gaataactgg 240 gacggggcag atttccgttt cacggatctt ggattacaag atggaaaaac atatacgatc 300 aatattatag gatatgtcga tgaaaatgaa gttgttcctt caggagccca agtgtatttg 360 caaactgtag ataaaacata tggatggtta gcaagcgcgg acttaaaaaa cggagagtcg 420 ttcactataa atacaacgtt cacccttgac atgagtaaag gggacacccg tcttcgtata 480 caatccaacg atagtggtaa aaaagtttca ttttacgtcg ggtatttttc aatttcaatt 540 agtgatgtag aaggagaaga tggtgggagc tctatttcaa ggccaccggc tttacctttt 600 gaaactattg actttgaaga tcaaagttta agtggatttg agggacgagc aggcacggaa 660 acattgaccg ttacgaatga agcaaataga actcctggag gatcttatgc actaaaagtg 720 gaaaatagat ctcaaaattg gcatggacct tccttacgca tcgagaaata tattgattta 780 ggttacgaat atacaatttc tctatgggtt aaacttattt cacccacaag tgcacaaatt 840 cagctttcta cccaagtcgg aagtggaagt ggtgcgagtt ataacaatat tttaagtaaa 900 gtaattagtg ttgatgatgg atgggtactg tatgaaggaa agtatcgcta caatagttcg 960 ggaggggaat atttaacaat ttacgtagaa agcccaaaca atagtactgc atctttttac 1020 atcgatgata ttcgtttaat aaagagtgga gacccaatct ctgtacaaaa agatcttctc 1080 cctatcaaga gtgtttatga aggtgacttc ttagttggta gtgccgtatc agcgactgat 1140 ttagagggag agagactcga gcttctcaag ttgcattaca atagcataac agcggaaaac 1200 gccatgaaac ctagctattt acaacctact aaaggaaact ttaccttcga agcagcagat 1260 agtattgtaa ataaagccct agaagaagga atgaaagtac atggacatgt tctcgtatgg 1320 catcagcaga cacctgaatg gatgaccact agagaagatg gaagccctct cggcagggaa 1380 gaagcgttag aaaatctaaa aaatcacatt gaaacagtta tgaaacattt tggtgataga 1440 gtaatttcat gggatgttgt caatgaagct atcattgata atccacctaa tcctgataat 1500 tgggaggaat cattaagaaa atcaccatgg tactattcaa tcggttctga ttatgttgag 1560 caagcattcc gaattgcacg acaagttttg gacgaaaatg ggtgggatat taagctatat 1620 tacaatgatt acaatgaaga taatcaaaga aaagcacaag ccatttacca tatggtaaaa 1680 gagcttaatg aaaaatatgc acaagagcat cctggtaaaa gattaatcga tggaattgga 1740 atgcaagggc attacagtat acgaacaaat ccagataatg tgaaaatgtc attagaaaga 1800 tttatttccc ttggtgtgga agttagtatt actgaactcg atattcaagc tggaacggat 1860 aatcatctta cggaagaaca gtcaaaagca caagcatatt tatacgctaa attattcaaa 1920 atattcaaag aaaatgcatc gcatatctcc cgagttacgt tatggggatt aaatgatgcg 1980 gcaagttggc gtgcgtcaac aagtccattg ttatttgatc gaaatttaca ggccaaacca 2040 agttactatg cggtaattga tcctgataca tttatagaag aaaatcctac tgtgacagaa 2100 gagtcgcgga aagcaattgc tttgtatggt atccctgtaa ttgatggaag catcgattcc 2160 atttgggaaa gtgttcctta catccctatt gatcgttacc aaatggcgtg gcaaggagca 2220 agcggaactg ctaaagttct ttgggacgaa gggaatctgt atgtattagt acaagttaac 2280 gatgaccagt tagataagtc gagtacaaat ccttgggagc aggattcgat agaggtgttt 2340 gtggacgaaa ataatgcaaa aacatcgttt taccaagagg atgatggaca atatagagta 2400 aactttgaca acgaaacatc gtttaatcca ccaagcattg aaaatggatt tatgtccgaa 2460 actaatgtat ctgggactaa ttatgtggtg gagatgaaaa tccctttaag aagtatacaa 2520 ctaaaaaatg ggtctgaaat agggtttgat gttcaaatta atgatgggaa aaatggtgct 2580 cgtcagagtg tggctgcttg gaatgatacg actggaactg catatatgga tacatctgta 2640 ttcgggacac ttactctttt aaccacttta gataatgaaa atacaccagg cagcggcaca 2700 acaccaggta gtggcacaac accaggcagt ggcacaacac caggcagcag cacaacacca 2760 ggcagcggta caacaccagg tagcggcaca acaccaggca gtggcacaac accaggcagc 2820 ggcacaacac caggcagtgg cacaacacca ggcagtggca caacaccggg cagcggtaca 2880 acaccaggca gtggcacaac accaggcagt ggtacaacac cgggcagtgg cacaacacca 2940 gtgaagggtg aaaatggtac ggttgtttta cagccgaaag tagagacgaa agaaaaagac 3000 ggcaaagtag tagaaaaagt ggcaactatt tcaacaaatg aagttgaagc gattgtcaag 3060 gagctgtcga atgaaaataa acaagtcgtc gtctccctcg gctcgcttcc aaaaggtgta 3120 gccacaaaag tagatgtgcc agctacatta tttacacaag cggcaaataa acaagcagaa 3180 gcaacgattg tgagcgccag tgaacaagcg acgtacaaat tgccagtcaa agaagtgcag 3240 gcgtctcttg cgacgattgc ccggtcactc ggtgcaacga tagaacaagt tagcatctcg 3300 attgaaatga aagtgaacga tgcgccgtca ctacgtgtga aaccgttgtc tgatgcggta 3360 gagtttcatg tcgtggcgaa agcaaatgga aaggaacgcg tcatcgatcg gtttactcaa 3420 tatgtcgaac gcgaaatcgc gttaaagcaa tcggtcaacg ctagtcgtgc cattgcagtg 3480 cgcgtgaacg atgacggttc acttacccca gtaccgacaa cgtttgttgg caacaaagca 3540 gtcattaaat cgttgacgaa ctcgacgtat gttgttgtgg aaggaacaca tacatttagt 3600 gacatccaac cacattgggc gaaaggttat attgaaacac tcgcggcaaa acagcttgtc 3660 aaagggatga cggacacaac atatcgacca aatgatcgga tgacgcgcgc gcaatttgcg 3720 gtgttgctcg tacgggcgct aggattgccg agcgaaacgt atgacggtcg ctttgctgat 3780 gtgaagggaa cggagtggtt taacaagaac ggtgaattag cagcggcagt caagttcgga 3840 atcattcaag gaaaaacagc ttatatgttt gcgccgaatg agccaatcac tcgcgcacaa 3900 gcagctgtca tgatcgaacg ggcattgaaa ctttcgatcg ttggctatga tgaggcaaca 3960 agcgacaaaa cgaaaaaagt gacagatttc cgcgatgcaa aacaattgcc aacatgggca 4020 aaacaggcga ttgaagcagt ataccaagca ggcatcatgc aaggacgaga tagcggaaac 4080 tttgatccga caagccatgt gacgcgtgcc gaaatggcga aggtgttaat ggatatttta 4140 gagttgacaa aacttattta a 4161 <210> 284 <211> 1386 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(28) <400> 284 Met Tyr Lys Ser Phe Val Lys Lys Val Ser Leu Val Leu Ser Thr Leu 1 5 10 15 Leu Leu Leu Val Ser Ala Phe Pro Val Ser Tyr Ala Gln Met Asn Ser 20 25 30 Ile Pro Val Tyr Glu Glu Thr Phe Glu Asn Gln Gly Asn Tyr Val Gln 35 40 45 Ser Gly Gly Ala Thr Leu Thr Leu Val Lys Asn Lys Val Phe Ala Gly 50 55 60 Asn Glu Asp Gly Thr Ala Leu Tyr Ile Ser Asn Arg Ser Asn Asn Trp 65 70 75 80 Asp Gly Ala Asp Phe Arg Phe Thr Asp Leu Gly Leu Gln Asp Gly Lys 85 90 95 Thr Tyr Thr Ile Asn Ile Ile Gly Tyr Val Asp Glu Asn Glu Val Val 100 105 110 Pro Ser Gly Ala Gln Val Tyr Leu Gln Thr Val Asp Lys Thr Tyr Gly 115 120 125 Trp Leu Ala Ser Ala Asp Leu Lys Asn Gly Glu Ser Phe Thr Ile Asn 130 135 140 Thr Thr Phe Thr Leu Asp Met Ser Lys Gly Asp Thr Arg Leu Arg Ile 145 150 155 160 Gln Ser Asn Asp Ser Gly Lys Lys Val Ser Phe Tyr Val Gly Tyr Phe 165 170 175 Ser Ile Ser Ile Ser Asp Val Glu Gly Glu Asp Gly Gly Ser Ser Ile 180 185 190 Ser Arg Pro Pro Ala Leu Pro Phe Glu Thr Ile Asp Phe Glu Asp Gln 195 200 205 Ser Leu Ser Gly Phe Glu Gly Arg Ala Gly Thr Glu Thr Leu Thr Val 210 215 220 Thr Asn Glu Ala Asn Arg Thr Pro Gly Gly Ser Tyr Ala Leu Lys Val 225 230 235 240 Glu Asn Arg Ser Gln Asn Trp His Gly Pro Ser Leu Arg Ile Glu Lys 245 250 255 Tyr Ile Asp Leu Gly Tyr Glu Tyr Thr Ile Ser Leu Trp Val Lys Leu 260 265 270 Ile Ser Pro Thr Ser Ala Gln Ile Gln Leu Ser Thr Gln Val Gly Ser 275 280 285 Gly Ser Gly Ala Ser Tyr Asn Asn Ile Leu Ser Lys Val Ile Ser Val 290 295 300 Asp Asp Gly Trp Val Leu Tyr Glu Gly Lys Tyr Arg Tyr Asn Ser Ser 305 310 315 320 Gly Gly Glu Tyr Leu Thr Ile Tyr Val Glu Ser Pro Asn Asn Ser Thr 325 330 335 Ala Ser Phe Tyr Ile Asp Asp Ile Arg Leu Ile Lys Ser Gly Asp Pro 340 345 350 Ile Ser Val Gln Lys Asp Leu Leu Pro Ile Lys Ser Val Tyr Glu Gly 355 360 365 Asp Phe Leu Val Gly Ser Ala Val Ser Ala Thr Asp Leu Glu Gly Glu 370 375 380 Arg Leu Glu Leu Leu Lys Leu His Tyr Asn Ser Ile Thr Ala Glu Asn 385 390 395 400 Ala Met Lys Pro Ser Tyr Leu Gln Pro Thr Lys Gly Asn Phe Thr Phe 405 410 415 Glu Ala Ala Asp Ser Ile Val Asn Lys Ala Leu Glu Glu Gly Met Lys 420 425 430 Val His Gly His Val Leu Val Trp His Gln Gln Thr Pro Glu Trp Met 435 440 445 Thr Thr Arg Glu Asp Gly Ser Pro Leu Gly Arg Glu Glu Ala Leu Glu 450 455 460 Asn Leu Lys Asn His Ile Glu Thr Val Met Lys His Phe Gly Asp Arg 465 470 475 480 Val Ile Ser Trp Asp Val Val Asn Glu Ala Ile Ile Asp Asn Pro Pro 485 490 495 Asn Pro Asp Asn Trp Glu Glu Ser Leu Arg Lys Ser Pro Trp Tyr Tyr 500 505 510 Ser Ile Gly Ser Asp Tyr Val Glu Gln Ala Phe Arg Ile Ala Arg Gln 515 520 525 Val Leu Asp Glu Asn Gly Trp Asp Ile Lys Leu Tyr Tyr Asn Asp Tyr 530 535 540 Asn Glu Asp Asn Gln Arg Lys Ala Gln Ala Ile Tyr His Met Val Lys 545 550 555 560 Glu Leu Asn Glu Lys Tyr Ala Gln Glu His Pro Gly Lys Arg Leu Ile 565 570 575 Asp Gly Ile Gly Met Gln Gly His Tyr Ser Ile Arg Thr Asn Pro Asp 580 585 590 Asn Val Lys Met Ser Leu Glu Arg Phe Ile Ser Leu Gly Val Glu Val 595 600 605 Ser Ile Thr Glu Leu Asp Ile Gln Ala Gly Thr Asp Asn His Leu Thr 610 615 620 Glu Glu Gln Ser Lys Ala Gln Ala Tyr Leu Tyr Ala Lys Leu Phe Lys 625 630 635 640 Ile Phe Lys Glu Asn Ala Ser His Ile Ser Arg Val Thr Leu Trp Gly 645 650 655 Leu Asn Asp Ala Ala Ser Trp Arg Ala Ser Thr Ser Pro Leu Leu Phe 660 665 670 Asp Arg Asn Leu Gln Ala Lys Pro Ser Tyr Tyr Ala Val Ile Asp Pro 675 680 685 Asp Thr Phe Ile Glu Glu Asn Pro Thr Val Thr Glu Glu Ser Arg Lys 690 695 700 Ala Ile Ala Leu Tyr Gly Ile Pro Val Ile Asp Gly Ser Ile Asp Ser 705 710 715 720 Ile Trp Glu Ser Val Pro Tyr Ile Pro Ile Asp Arg Tyr Gln Met Ala 725 730 735 Trp Gln Gly Ala Ser Gly Thr Ala Lys Val Leu Trp Asp Glu Gly Asn 740 745 750 Leu Tyr Val Leu Val Gln Val Asn Asp Asp Gln Leu Asp Lys Ser Ser 755 760 765 Thr Asn Pro Trp Glu Gln Asp Ser Ile Glu Val Phe Val Asp Glu Asn 770 775 780 Asn Ala Lys Thr Ser Phe Tyr Gln Glu Asp Asp Gly Gln Tyr Arg Val 785 790 795 800 Asn Phe Asp Asn Glu Thr Ser Phe Asn Pro Pro Ser Ile Glu Asn Gly 805 810 815 Phe Met Ser Glu Thr Asn Val Ser Gly Thr Asn Tyr Val Val Glu Met 820 825 830 Lys Ile Pro Leu Arg Ser Ile Gln Leu Lys Asn Gly Ser Glu Ile Gly 835 840 845 Phe Asp Val Gln Ile Asn Asp Gly Lys Asn Gly Ala Arg Gln Ser Val 850 855 860 Ala Ala Trp Asn Asp Thr Thr Gly Thr Ala Tyr Met Asp Thr Ser Val 865 870 875 880 Phe Gly Thr Leu Thr Leu Leu Thr Thr Leu Asp Asn Glu Asn Thr Pro 885 890 895 Gly Ser Gly Thr Thr Pro Gly Ser Gly Thr Thr Pro Gly Ser Gly Thr 900 905 910 Thr Pro Gly Ser Ser Thr Thr Pro Gly Ser Gly Thr Thr Pro Gly Ser 915 920 925 Gly Thr Thr Pro Gly Ser Gly Thr Thr Pro Gly Ser Gly Thr Thr Pro 930 935 940 Gly Ser Gly Thr Thr Pro Gly Ser Gly Thr Thr Pro Gly Ser Gly Thr 945 950 955 960 Thr Pro Gly Ser Gly Thr Thr Pro Gly Ser Gly Thr Thr Pro Gly Ser 965 970 975 Gly Thr Thr Pro Val Lys Gly Glu Asn Gly Thr Val Val Leu Gln Pro 980 985 990 Lys Val Glu Thr Lys Glu Lys Asp Gly Lys Val Val Glu Lys Val Ala 995 1000 1005 Thr Ile Ser Thr Asn Glu Val Glu Ala Ile Val Lys Glu Leu Ser Asn 1010 1015 1020 Glu Asn Lys Gln Val Val Val Ser Leu Gly Ser Leu Pro Lys Gly Val 1025 1030 1035 1040 Ala Thr Lys Val Asp Val Pro Ala Thr Leu Phe Thr Gln Ala Ala Asn 1045 1050 1055 Lys Gln Ala Glu Ala Thr Ile Val Ser Ala Ser Glu Gln Ala Thr Tyr 1060 1065 1070 Lys Leu Pro Val Lys Glu Val Gln Ala Ser Leu Ala Thr Ile Ala Arg 1075 1080 1085 Ser Leu Gly Ala Thr Ile Glu Gln Val Ser Ile Ser Ile Glu Met Lys 1090 1095 1100 Val Asn Asp Ala Pro Ser Leu Arg Val Lys Pro Leu Ser Asp Ala Val 1105 1110 1115 1120 Glu Phe His Val Val Ala Lys Ala Asn Gly Lys Glu Arg Val Ile Asp 1125 1130 1135 Arg Phe Thr Gln Tyr Val Glu Arg Glu Ile Ala Leu Lys Gln Ser Val 1140 1145 1150 Asn Ala Ser Arg Ala Ile Ala Val Arg Val Asn Asp Asp Gly Ser Leu 1155 1160 1165 Thr Pro Val Pro Thr Thr Phe Val Gly Asn Lys Ala Val Ile Lys Ser 1170 1175 1180 Leu Thr Asn Ser Thr Tyr Val Val Val Glu Gly Thr His Thr Phe Ser 1185 1190 1195 1200 Asp Ile Gln Pro His Trp Ala Lys Gly Tyr Ile Glu Thr Leu Ala Ala 1205 1210 1215 Lys Gln Leu Val Lys Gly Met Thr Asp Thr Thr Tyr Arg Pro Asn Asp 1220 1225 1230 Arg Met Thr Arg Ala Gln Phe Ala Val Leu Leu Val Arg Ala Leu Gly 1235 1240 1245 Leu Pro Ser Glu Thr Tyr Asp Gly Arg Phe Ala Asp Val Lys Gly Thr 1250 1255 1260 Glu Trp Phe Asn Lys Asn Gly Glu Leu Ala Ala Ala Val Lys Phe Gly 1265 1270 1275 1280 Ile Ile Gln Gly Lys Thr Ala Tyr Met Phe Ala Pro Asn Glu Pro Ile 1285 1290 1295 Thr Arg Ala Gln Ala Ala Val Met Ile Glu Arg Ala Leu Lys Leu Ser 1300 1305 1310 Ile Val Gly Tyr Asp Glu Ala Thr Ser Asp Lys Thr Lys Lys Val Thr 1315 1320 1325 Asp Phe Arg Asp Ala Lys Gln Leu Pro Thr Trp Ala Lys Gln Ala Ile 1330 1335 1340 Glu Ala Val Tyr Gln Ala Gly Ile Met Gln Gly Arg Asp Ser Gly Asn 1345 1350 1355 1360 Phe Asp Pro Thr Ser His Val Thr Arg Ala Glu Met Ala Lys Val Leu 1365 1370 1375 Met Asp Ile Leu Glu Leu Thr Lys Leu Ile 1380 1385 <210> 285 <211> 1569 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 285 gtgaaccgaa acacatctcc ggacttcaag cttggagcag gcgttacggt aagtgatttc 60 ctgaacaagg gcaggcaata tgaggtcgct gtggcgaatc ttgatgaaat gacggccgga 120 aatgccatga agcagtcttc tgtaatgagg cctgacggat ccatggattt cactcaggtc 180 agaagattca tcgaggaggc cgaacgtgtc ggaatgacag tgtacggcca tacattggca 240 tggcattcac agcagcagaa cgcctatctt aacggtctga tcaagggcaa gaagaccgag 300 gtcgagccag gccaggagtc agaggtcgtt cttctccaga cagatttcaa tgacggaaat 360 gtcacattca acggatgggg aaacaattct tcaaggactg tcgagaatgg tgcattaaag 420 cttacaaacc cttctgtagt aaacagttgg gaggcccagt tcgcatatga tttttcagag 480 gccttcgaga tggacaagac atataagctc aagttcagga tcaagggctc ggctgcagga 540 aagatcgcgg caggcttcca gatcactgac ggctaccttt cggcaggtga gttcggaacc 600 gtagagttca atacccagtg gaaggatgtc gagctctcat gcgtatgttc cgctgaaggc 660 ggtacacgct tgatcttcag tttcggagag tttgccggag atatctatat cgacgatttc 720 tgcttcagtg tggaaggagc tggatatatc tacgaagatc ttaccccggc agagaagaag 780 gagcgcctta ccgaggcaat ggaccgttgg atcaagggaa tgatggaggt taccgctacc 840 agggtttctg cgtgggatgc tgtcaatgag gcgatttccg gccgtgatac aaatggcgac 900 ggcttctatg aacttgagtc ggcacaatgg ggaagctcga acaacttcta ttggcaggat 960 tatctcggct caggagatta tgtgcgtatc gtgatcgcaa aggcccgcaa gtattatgag 1020 gaattcggcg gtacggctcc tttgagactc ttcatcaatg actacaacct cgaatctgac 1080 tgggatgaca acaagaagct caagagcctt atccattgga tcggtgtctg ggagtctgac 1140 ggagtgacaa agatcgacgg aatcggtacc cagatgcacg tttcgtatta cgagaatcct 1200 gatattcagg caagcaagga gaaacattat gtgcagatgc ttcagcttat ggcaaataca 1260 ggaaagctcg tgaagatctc cgagcttgat atgggctatg tagaccgcaa cggaaatact 1320 gtgggaacag cggacatgac cgaccagcag catagggcca tggcggatta ttatgacttc 1380 atcgtgcgca agtactttga gatcgtgcct cctgcacagc agtatggcat cacgcagtgg 1440 tgcatgacgg atgctcccgg agctatcggc acaggctgga gaggcggtga gcctgtgggc 1500 ctgtgggacc agaattacaa ccgcaagtat gcgtacgcag gatttgcaaa cggacttaga 1560 gcgaaataa 1569 <210> 286 <211> 522 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <400> 286 Met Asn Arg Asn Thr Ser Pro Asp Phe Lys Leu Gly Ala Gly Val Thr 1 5 10 15 Val Ser Asp Phe Leu Asn Lys Gly Arg Gln Tyr Glu Val Ala Val Ala 20 25 30 Asn Leu Asp Glu Met Thr Ala Gly Asn Ala Met Lys Gln Ser Ser Val 35 40 45 Met Arg Pro Asp Gly Ser Met Asp Phe Thr Gln Val Arg Arg Phe Ile 50 55 60 Glu Glu Ala Glu Arg Val Gly Met Thr Val Tyr Gly His Thr Leu Ala 65 70 75 80 Trp His Ser Gln Gln Gln Asn Ala Tyr Leu Asn Gly Leu Ile Lys Gly 85 90 95 Lys Lys Thr Glu Val Glu Pro Gly Gln Glu Ser Glu Val Val Leu Leu 100 105 110 Gln Thr Asp Phe Asn Asp Gly Asn Val Thr Phe Asn Gly Trp Gly Asn 115 120 125 Asn Ser Ser Arg Thr Val Glu Asn Gly Ala Leu Lys Leu Thr Asn Pro 130 135 140 Ser Val Val Asn Ser Trp Glu Ala Gln Phe Ala Tyr Asp Phe Ser Glu 145 150 155 160 Ala Phe Glu Met Asp Lys Thr Tyr Lys Leu Lys Phe Arg Ile Lys Gly 165 170 175 Ser Ala Ala Gly Lys Ile Ala Ala Gly Phe Gln Ile Thr Asp Gly Tyr 180 185 190 Leu Ser Ala Gly Glu Phe Gly Thr Val Glu Phe Asn Thr Gln Trp Lys 195 200 205 Asp Val Glu Leu Ser Cys Val Cys Ser Ala Glu Gly Gly Thr Arg Leu 210 215 220 Ile Phe Ser Phe Gly Glu Phe Ala Gly Asp Ile Tyr Ile Asp Asp Phe 225 230 235 240 Cys Phe Ser Val Glu Gly Ala Gly Tyr Ile Tyr Glu Asp Leu Thr Pro 245 250 255 Ala Glu Lys Lys Glu Arg Leu Thr Glu Ala Met Asp Arg Trp Ile Lys 260 265 270 Gly Met Met Glu Val Thr Ala Thr Arg Val Ser Ala Trp Asp Ala Val 275 280 285 Asn Glu Ala Ile Ser Gly Arg Asp Thr Asn Gly Asp Gly Phe Tyr Glu 290 295 300 Leu Glu Ser Ala Gln Trp Gly Ser Ser Asn Asn Phe Tyr Trp Gln Asp 305 310 315 320 Tyr Leu Gly Ser Gly Asp Tyr Val Arg Ile Val Ile Ala Lys Ala Arg 325 330 335 Lys Tyr Tyr Glu Glu Phe Gly Gly Thr Ala Pro Leu Arg Leu Phe Ile 340 345 350 Asn Asp Tyr Asn Leu Glu Ser Asp Trp Asp Asp Asn Lys Lys Leu Lys 355 360 365 Ser Leu Ile His Trp Ile Gly Val Trp Glu Ser Asp Gly Val Thr Lys 370 375 380 Ile Asp Gly Ile Gly Thr Gln Met His Val Ser Tyr Tyr Glu Asn Pro 385 390 395 400 Asp Ile Gln Ala Ser Lys Glu Lys His Tyr Val Gln Met Leu Gln Leu 405 410 415 Met Ala Asn Thr Gly Lys Leu Val Lys Ile Ser Glu Leu Asp Met Gly 420 425 430 Tyr Val Asp Arg Asn Gly Asn Thr Val Gly Thr Ala Asp Met Thr Asp 435 440 445 Gln Gln His Arg Ala Met Ala Asp Tyr Tyr Asp Phe Ile Val Arg Lys 450 455 460 Tyr Phe Glu Ile Val Pro Pro Ala Gln Gln Tyr Gly Ile Thr Gln Trp 465 470 475 480 Cys Met Thr Asp Ala Pro Gly Ala Ile Gly Thr Gly Trp Arg Gly Gly 485 490 495 Glu Pro Val Gly Leu Trp Asp Gln Asn Tyr Asn Arg Lys Tyr Ala Tyr 500 505 510 Ala Gly Phe Ala Asn Gly Leu Arg Ala Lys 515 520 <210> 287 <211> 1695 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 287 atgactattc atctacaaaa aaatctgctc tttgcagcag tcttactgac agggcaagca 60 gcgcatgcgc tcacctccgg atctggcgag gccacgctgg atgttaataa cagctggggt 120 tcaggttatt gcgctaacgt caccattgcc aacaacggca gccaagccat tacttcctgg 180 acggttggcc tgaaccttaa cggcacgacg atcaataatc tttggaacgg taatttgagt 240 ggggttacgg ttacccccgt ggcctacaat gcgaatgtgg cgccgggtgc taataccagc 300 tttggtttct gtgctaatgg cagcgcaacc cccacgttgg cgacgtttga agttcaaggc 360 ggcggtggcg cagccagtag ttccagcagt tctgctattt caagcagctc cagcagttcg 420 gttgccggcg gcagcaacag cgtcaccgta cgcatgagcg gcgtaaccgg agacgaaagc 480 gtgagcctgg aaatcggtgg tcagaccatc gagacctgga ccctgagcgt cggtatgctc 540 gactacaccg tacagaccaa cgctaccggt gagttgcgtg ttgcgtttac caatgatgaa 600 ggtgaccgcg atgtcgaagt ggattacatc atggtcaacg gcgtgaccta tcaggccgaa 660 gatcaggaag ataacaccgg cgcgtgggac ggagagtgtg gtgcgggttc cttctcgcag 720 atgctgcact gcaacggttc tatcggcttt ggcaatccat tcgatggcag caactcgtcg 780 tccagctcca gcaacacttc gagctcgagc agcagctcta accctaaccc tggcaatccg 840 aatttccccg atttcttcgt aggtaacatc accaccagcg gctcagttcg ctctgacttc 900 atgcagtatt gggatcaaat tacgccggaa aacgaaggta aatggggctc cgtagaggga 960 actcgcgacc agtacaactg gggtccgctg gatgcaattt acaatttcgc ccgtgcgaac 1020 ggtattcctg taaaagcgca cactctggtg tggggcagtc agcaaccggg ttggattggc 1080 ggcttgagtg ccgctgagca gcgcgcggaa attgaagagt ggattcgcga ttactgcgca 1140 cgctacccgg atacggcgat gatcgatgtg gtgaatgaag ctctgccttc gcacgctccg 1200 gcaaactatg cggccaatgc atttggaagc gattggatca ctgaatcctt ccgtttggca 1260 cgtcagtact gtccggatgc cgtgctgatc tacaacgact ataacttcat gacctgggac 1320 accgatgcca tcattcagat gattcgccca gccgtgaact ccggttatgt cgatgcactg 1380 ggtcttcaag cgcacagcct gtattcccca caagtctgga ccgctcagca aatccagagc 1440 aaattggatc agatttccga gttgggcttg ccgctgtaca tctccgagta cgacatcgaa 1500 gcaacgaatg atcagactca gttacagtac atgcagatgc acttcccgat cttctacaac 1560 catcccaacg tggccggtat taccctttgg ggttatgttg tgggtgctac ctggcgtgat 1620 ggcactggcc tgatccaaag caatggtcag cagcgcccgg ccatgcagtg gttgatggag 1680 tatctaaacc gctaa 1695 <210> 288 <211> 564 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(23) <400> 288 Met Thr Ile His Leu Gln Lys Asn Leu Leu Phe Ala Ala Val Leu Leu 1 5 10 15 Thr Gly Gln Ala Ala His Ala Leu Thr Ser Gly Ser Gly Glu Ala Thr 20 25 30 Leu Asp Val Asn Asn Ser Trp Gly Ser Gly Tyr Cys Ala Asn Val Thr 35 40 45 Ile Ala Asn Asn Gly Ser Gln Ala Ile Thr Ser Trp Thr Val Gly Leu 50 55 60 Asn Leu Asn Gly Thr Thr Ile Asn Asn Leu Trp Asn Gly Asn Leu Ser 65 70 75 80 Gly Val Thr Val Thr Pro Val Ala Tyr Asn Ala Asn Val Ala Pro Gly 85 90 95 Ala Asn Thr Ser Phe Gly Phe Cys Ala Asn Gly Ser Ala Thr Pro Thr 100 105 110 Leu Ala Thr Phe Glu Val Gln Gly Gly Gly Gly Ala Ala Ser Ser Ser 115 120 125 Ser Ser Ser Ala Ile Ser Ser Ser Ser Ser Ser Ser Val Ala Gly Gly 130 135 140 Ser Asn Ser Val Thr Val Arg Met Ser Gly Val Thr Gly Asp Glu Ser 145 150 155 160 Val Ser Leu Glu Ile Gly Gly Gln Thr Ile Glu Thr Trp Thr Leu Ser 165 170 175 Val Gly Met Leu Asp Tyr Thr Val Gln Thr Asn Ala Thr Gly Glu Leu 180 185 190 Arg Val Ala Phe Thr Asn Asp Glu Gly Asp Arg Asp Val Glu Val Asp 195 200 205 Tyr Ile Met Val Asn Gly Val Thr Tyr Gln Ala Glu Asp Gln Glu Asp 210 215 220 Asn Thr Gly Ala Trp Asp Gly Glu Cys Gly Ala Gly Ser Phe Ser Gln 225 230 235 240 Met Leu His Cys Asn Gly Ser Ile Gly Phe Gly Asn Pro Phe Asp Gly 245 250 255 Ser Asn Ser Ser Ser Ser Ser Ser Asn Thr Ser Ser Ser Ser Ser Ser 260 265 270 Ser Asn Pro Asn Pro Gly Asn Pro Asn Phe Pro Asp Phe Phe Val Gly 275 280 285 Asn Ile Thr Thr Ser Gly Ser Val Arg Ser Asp Phe Met Gln Tyr Trp 290 295 300 Asp Gln Ile Thr Pro Glu Asn Glu Gly Lys Trp Gly Ser Val Glu Gly 305 310 315 320 Thr Arg Asp Gln Tyr Asn Trp Gly Pro Leu Asp Ala Ile Tyr Asn Phe 325 330 335 Ala Arg Ala Asn Gly Ile Pro Val Lys Ala His Thr Leu Val Trp Gly 340 345 350 Ser Gln Gln Pro Gly Trp Ile Gly Gly Leu Ser Ala Ala Glu Gln Arg 355 360 365 Ala Glu Ile Glu Glu Trp Ile Arg Asp Tyr Cys Ala Arg Tyr Pro Asp 370 375 380 Thr Ala Met Ile Asp Val Val Asn Glu Ala Leu Pro Ser His Ala Pro 385 390 395 400 Ala Asn Tyr Ala Ala Asn Ala Phe Gly Ser Asp Trp Ile Thr Glu Ser 405 410 415 Phe Arg Leu Ala Arg Gln Tyr Cys Pro Asp Ala Val Leu Ile Tyr Asn 420 425 430 Asp Tyr Asn Phe Met Thr Trp Asp Thr Asp Ala Ile Ile Gln Met Ile 435 440 445 Arg Pro Ala Val Asn Ser Gly Tyr Val Asp Ala Leu Gly Leu Gln Ala 450 455 460 His Ser Leu Tyr Ser Pro Gln Val Trp Thr Ala Gln Gln Ile Gln Ser 465 470 475 480 Lys Leu Asp Gln Ile Ser Glu Leu Gly Leu Pro Leu Tyr Ile Ser Glu 485 490 495 Tyr Asp Ile Glu Ala Thr Asn Asp Gln Thr Gln Leu Gln Tyr Met Gln 500 505 510 Met His Phe Pro Ile Phe Tyr Asn His Pro Asn Val Ala Gly Ile Thr 515 520 525 Leu Trp Gly Tyr Val Val Gly Ala Thr Trp Arg Asp Gly Thr Gly Leu 530 535 540 Ile Gln Ser Asn Gly Gln Gln Arg Pro Ala Met Gln Trp Leu Met Glu 545 550 555 560 Tyr Leu Asn Arg <210> 289 <211> 2796 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 289 atgaagttca ctttgacacc gctgctgtgc gggttcgcct tattgttggg ttgcgcggtg 60 caggcaaccc cagccgcttc gttaaagcag gcctatcagc cgtttttcca tatcggcacc 120 gcagtcagtc tggcgcaatt acaaccatcc aaagaacatg aacgcgcttt aattgcgcag 180 cactttaaca gtctgaccgc cgaaaacctg atgaaatggg aggaaattca acccacggaa 240 ggcaactttg attttaaagc ggccgatcag ttggttgcgt ttgccgaaca acatcaaatg 300 tggatgatcg gccataccat tctgtggcat gaacaaaccc cagactgggt gtttcagggg 360 ctggatggca aacccgccag caagcagctg ctactggccc gcttgaccaa acatatccaa 420 acggtcgttg gccgttacca gggccgggtc aatggctggg atgtggtgaa tgaagcgctc 480 aatgaagatg gcagcctgcg cgataccccg tggcggcgca ttttgggtga tgattacatt 540 gccaccactt ttgcgttggt gcatcaggtc gaccctaaag ccaaactcta ttacaacgat 600 tacaacctgt ttaaaccgga aaaacgcgcc ggggtgctgc ggattatcca acaactgcag 660 caaaaaaatg tgcctattca tgccattggt gaacaagcgc attacggcct tgattcgcct 720 gcattcaaag acgttgaaga ttcgatcaac gcttttgctg ccaccggcct ggacgtgatg 780 ctaaccgaac tggagatttc agtattgccg tatccatccg gcatgacgca gggtgccgat 840 atcagtcagc atcaggaatt gcaggaacaa ctaaacccct atcgcgatgg tttgcccaaa 900 gccgtcgaac aagcctggca acaacggtat ctcgatttgt tttcgctgtt attacgccag 960 cagcaaaaac tgcatcgcgt gaccttctgg ggcttagatg atggccaaag ctggcgtaat 1020 aatttcccga tgcgcggtcg caccgattac ccactgctgt ttgatcgcaa gctgcaagcc 1080 aaaccgctgt taagcgcact gacggcatta gccgcagacc agactaaagc caagcccaaa 1140 atgaatcagc tgggctttgc gccgacttcg accaaactgt tgattgtgcc gggtcggcaa 1200 tcagtgcctt ttcatgtttt ggataccgag accggccaaa cggtgctgca aggccaaagt 1260 tcggcggcca ggttttggcc tgaatcgggg gaatgggtca gtgctgccga tttttctgcg 1320 gtgataactc ccggcaccta tcagatcaac atctcaggaa cgccgccaca aactgtcaag 1380 atccaggccg aaccctatgc cgcgctgcat gatgcggcaa tcaaagccta ttattttaac 1440 cgcgcctcgc tcacactgga gccaaagttt gccggacctt gggcacgcgc agcggggcat 1500 ccggatacca aagtacgggt gcatgcttct gctgcatcgg ccagcaggcc agaaggttat 1560 gagctcagcg ctgccaaagg ctggtatgac gccggtgact acaacaaata cgtggtgaat 1620 tccggcatta ccagttacac cctgttgcag gcctggcagg attttcctga gttttatcaa 1680 agccggacct ggaatattcc ggagtccggc aacgcggtac cggacattct cgacgaaacc 1740 ttatggaatc tgcagtggtt cagcgccatg caagacccaa acgacggggg cgtctatcac 1800 aagctgactg aactgaattt ttcggcaacc caaatgccgg accaagtgac agcagagcgt 1860 tatgtggtgc aaaaaaccac cgccgcggca ctgaatttcg ctgcggtgtt ggccaaagcc 1920 agtacggttt ttgccaaatt tgacgcccag ttgcccggcc tgtcgcaaca ataccgtcag 1980 caagcactgc tcgcctggca atgggcgcaa aaaaatccgc agcaaatcta tcaacaaccc 2040 aaagatgtcc acactggcgc ttatggtgac aaacaactgg ctgatgaatg ggcctgggct 2100 ggcgccgagc tgtatttatt gaccggcgag caaagttatc tgcagccact gttggcgctg 2160 gacacgccaa tcagtgcagc atcctgggcc agtgtcagcg ctttggggta tttttctttg 2220 gcttcggcga aacagcttga gcccgcacta cggcaacagg tacaacagaa aatccaacaa 2280 gccgccgcgc aaatcctgca ggaacatcaa acatccgcct atcaggtggc gatgaccaaa 2340 aacgattttg tctggggcag taatgcggtg gcaatgaata aagcgatgtt gttataccag 2400 gcgtggaaaa tagcgccaaa accggagctg ctacaggcga tgcaaggtct ggttgattac 2460 gttttggggc gcaacccgtt gcagcagtct tatgtcacag ggtttggcga gcaaagcccg 2520 cagcagatcc accaccgacc ttcggccgcc gatgccatca aagcgccggt accaggttgg 2580 ttagtcggtg gtgcacagcc gggtaagcag gataaatgca cttatgccgg cgctttaccc 2640 gctgtcggcg ctttacccgc tgccagcacc ttaccagcca ccacttatct tgatgactgg 2700 tgcagttacg ccaccaacga agtggcgatt aactggaatg cacctttggt gtatgtgctg 2760 gcatggcacc tttcgcaaaa caccaagaca ccataa 2796 <210> 290 <211> 931 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(22) <400> 290 Met Lys Phe Thr Leu Thr Pro Leu Leu Cys Gly Phe Ala Leu Leu Leu 1 5 10 15 Gly Cys Ala Val Gln Ala Thr Pro Ala Ala Ser Leu Lys Gln Ala Tyr 20 25 30 Gln Pro Phe Phe His Ile Gly Thr Ala Val Ser Leu Ala Gln Leu Gln 35 40 45 Pro Ser Lys Glu His Glu Arg Ala Leu Ile Ala Gln His Phe Asn Ser 50 55 60 Leu Thr Ala Glu Asn Leu Met Lys Trp Glu Glu Ile Gln Pro Thr Glu 65 70 75 80 Gly Asn Phe Asp Phe Lys Ala Ala Asp Gln Leu Val Ala Phe Ala Glu 85 90 95 Gln His Gln Met Trp Met Ile Gly His Thr Ile Leu Trp His Glu Gln 100 105 110 Thr Pro Asp Trp Val Phe Gln Gly Leu Asp Gly Lys Pro Ala Ser Lys 115 120 125 Gln Leu Leu Leu Ala Arg Leu Thr Lys His Ile Gln Thr Val Val Gly 130 135 140 Arg Tyr Gln Gly Arg Val Asn Gly Trp Asp Val Val Asn Glu Ala Leu 145 150 155 160 Asn Glu Asp Gly Ser Leu Arg Asp Thr Pro Trp Arg Arg Ile Leu Gly 165 170 175 Asp Asp Tyr Ile Ala Thr Thr Phe Ala Leu Val His Gln Val Asp Pro 180 185 190 Lys Ala Lys Leu Tyr Tyr Asn Asp Tyr Asn Leu Phe Lys Pro Glu Lys 195 200 205 Arg Ala Gly Val Leu Arg Ile Ile Gln Gln Leu Gln Gln Lys Asn Val 210 215 220 Pro Ile His Ala Ile Gly Glu Gln Ala His Tyr Gly Leu Asp Ser Pro 225 230 235 240 Ala Phe Lys Asp Val Glu Asp Ser Ile Asn Ala Phe Ala Ala Thr Gly 245 250 255 Leu Asp Val Met Leu Thr Glu Leu Glu Ile Ser Val Leu Pro Tyr Pro 260 265 270 Ser Gly Met Thr Gln Gly Ala Asp Ile Ser Gln His Gln Glu Leu Gln 275 280 285 Glu Gln Leu Asn Pro Tyr Arg Asp Gly Leu Pro Lys Ala Val Glu Gln 290 295 300 Ala Trp Gln Gln Arg Tyr Leu Asp Leu Phe Ser Leu Leu Leu Arg Gln 305 310 315 320 Gln Gln Lys Leu His Arg Val Thr Phe Trp Gly Leu Asp Asp Gly Gln 325 330 335 Ser Trp Arg Asn Asn Phe Pro Met Arg Gly Arg Thr Asp Tyr Pro Leu 340 345 350 Leu Phe Asp Arg Lys Leu Gln Ala Lys Pro Leu Leu Ser Ala Leu Thr 355 360 365 Ala Leu Ala Ala Asp Gln Thr Lys Ala Lys Pro Lys Met Asn Gln Leu 370 375 380 Gly Phe Ala Pro Thr Ser Thr Lys Leu Leu Ile Val Pro Gly Arg Gln 385 390 395 400 Ser Val Pro Phe His Val Leu Asp Thr Glu Thr Gly Gln Thr Val Leu 405 410 415 Gln Gly Gln Ser Ser Ala Ala Arg Phe Trp Pro Glu Ser Gly Glu Trp 420 425 430 Val Ser Ala Ala Asp Phe Ser Ala Val Ile Thr Pro Gly Thr Tyr Gln 435 440 445 Ile Asn Ile Ser Gly Thr Pro Pro Gln Thr Val Lys Ile Gln Ala Glu 450 455 460 Pro Tyr Ala Ala Leu His Asp Ala Ala Ile Lys Ala Tyr Tyr Phe Asn 465 470 475 480 Arg Ala Ser Leu Thr Leu Glu Pro Lys Phe Ala Gly Pro Trp Ala Arg 485 490 495 Ala Ala Gly His Pro Asp Thr Lys Val Arg Val His Ala Ser Ala Ala 500 505 510 Ser Ala Ser Arg Pro Glu Gly Tyr Glu Leu Ser Ala Ala Lys Gly Trp 515 520 525 Tyr Asp Ala Gly Asp Tyr Asn Lys Tyr Val Val Asn Ser Gly Ile Thr 530 535 540 Ser Tyr Thr Leu Leu Gln Ala Trp Gln Asp Phe Pro Glu Phe Tyr Gln 545 550 555 560 Ser Arg Thr Trp Asn Ile Pro Glu Ser Gly Asn Ala Val Pro Asp Ile 565 570 575 Leu Asp Glu Thr Leu Trp Asn Leu Gln Trp Phe Ser Ala Met Gln Asp 580 585 590 Pro Asn Asp Gly Gly Val Tyr His Lys Leu Thr Glu Leu Asn Phe Ser 595 600 605 Ala Thr Gln Met Pro Asp Gln Val Thr Ala Glu Arg Tyr Val Val Gln 610 615 620 Lys Thr Thr Ala Ala Ala Leu Asn Phe Ala Ala Val Leu Ala Lys Ala 625 630 635 640 Ser Thr Val Phe Ala Lys Phe Asp Ala Gln Leu Pro Gly Leu Ser Gln 645 650 655 Gln Tyr Arg Gln Gln Ala Leu Leu Ala Trp Gln Trp Ala Gln Lys Asn 660 665 670 Pro Gln Gln Ile Tyr Gln Gln Pro Lys Asp Val His Thr Gly Ala Tyr 675 680 685 Gly Asp Lys Gln Leu Ala Asp Glu Trp Ala Trp Ala Gly Ala Glu Leu 690 695 700 Tyr Leu Leu Thr Gly Glu Gln Ser Tyr Leu Gln Pro Leu Leu Ala Leu 705 710 715 720 Asp Thr Pro Ile Ser Ala Ala Ser Trp Ala Ser Val Ser Ala Leu Gly 725 730 735 Tyr Phe Ser Leu Ala Ser Ala Lys Gln Leu Glu Pro Ala Leu Arg Gln 740 745 750 Gln Val Gln Gln Lys Ile Gln Gln Ala Ala Ala Gln Ile Leu Gln Glu 755 760 765 His Gln Thr Ser Ala Tyr Gln Val Ala Met Thr Lys Asn Asp Phe Val 770 775 780 Trp Gly Ser Asn Ala Val Ala Met Asn Lys Ala Met Leu Leu Tyr Gln 785 790 795 800 Ala Trp Lys Ile Ala Pro Lys Pro Glu Leu Leu Gln Ala Met Gln Gly 805 810 815 Leu Val Asp Tyr Val Leu Gly Arg Asn Pro Leu Gln Gln Ser Tyr Val 820 825 830 Thr Gly Phe Gly Glu Gln Ser Pro Gln Gln Ile His His Arg Pro Ser 835 840 845 Ala Ala Asp Ala Ile Lys Ala Pro Val Pro Gly Trp Leu Val Gly Gly 850 855 860 Ala Gln Pro Gly Lys Gln Asp Lys Cys Thr Tyr Ala Gly Ala Leu Pro 865 870 875 880 Ala Val Gly Ala Leu Pro Ala Ala Ser Thr Leu Pro Ala Thr Thr Tyr 885 890 895 Leu Asp Asp Trp Cys Ser Tyr Ala Thr Asn Glu Val Ala Ile Asn Trp 900 905 910 Asn Ala Pro Leu Val Tyr Val Leu Ala Trp His Leu Ser Gln Asn Thr 915 920 925 Lys Thr Pro 930 <210> 291 <211> 1230 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 291 atggtcaaag aaagaagttt tcttcatcat tcattcaata ggggcgaaaa tggacaggac 60 agtctgatgt ggaaaaaaga ggcggatgat cgaatctcag agcatagaca aagagatctt 120 gtgatcaacg taacaaacgg tgaaaaaaag ccaatagcag gtatagaggt tgaaataaag 180 caaatcagac atgaattcgc ctttggttca gcgatgaatg atcaagtgtt atttaatcaa 240 caatatgctg attttttcgt gaagtatttt aattgggctg tttttgaaaa tgaggcaaaa 300 tggtatgcga atgagccaca aagagggaga atcacctacg aaaaagcaga tgcgatgctg 360 aattttgcag atcgacatca gcttccagtg agagggcacg ctttgttttg ggaggtagag 420 gatgcgaatc caagctggct aaggtcactg ccaaatcatg aagtatatga agccatgaaa 480 aaccggcttg agcatgcggg caatcacttt aagggaaggt tccgtcattg ggatgtaaac 540 aatgaaatga tgcatggttc attttttaaa gatcgctttg ggaaaaatat ttggaagtgg 600 atgtatgaag aaacgaaaaa aattgaccct caagcactat tgtttgtgaa tgattataat 660 gtgatctcat atggtgaaca ccatgcctat aaagcgcata tcaatgaact gcgtcagtta 720 ggcgcaccta ttgaggcgat tggggttcaa ggccattttg aagaacgggt cgatccagtc 780 attgtcaaag agagactcga tgtgcttgct gagctaggtc ttccaatatg ggtcacagag 840 tacgattcgg ttcaccctga ccctaatcga agagcggata acctggaagc tttatatcgc 900 gtcgcattta gtcatccagc cgtaaaagga gtgctgatgt ggggattttg ggcaggtgcc 960 cattggagag gggaaaatgc agccatcgtg aattatgatt ggtctttaaa tgaagcagga 1020 agacgttatg aaaagcttct aaatgagtgg acgacccaaa gaattgaaaa aacagatgct 1080 aatggccatg tgagatgtcc agcatttcac ggaacatatg aggttcgaat cggtaaagaa 1140 agtaaaatgt tgaaacagca gacgattgaa cttgattcaa atgaacaaac accgtttcaa 1200 ctagacgtga tcctgcctca agaaggatag 1230 <210> 292 <211> 409 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <400> 292 Met Val Lys Glu Arg Ser Phe Leu His His Ser Phe Asn Arg Gly Glu 1 5 10 15 Asn Gly Gln Asp Ser Leu Met Trp Lys Lys Glu Ala Asp Asp Arg Ile 20 25 30 Ser Glu His Arg Gln Arg Asp Leu Val Ile Asn Val Thr Asn Gly Glu 35 40 45 Lys Lys Pro Ile Ala Gly Ile Glu Val Glu Ile Lys Gln Ile Arg His 50 55 60 Glu Phe Ala Phe Gly Ser Ala Met Asn Asp Gln Val Leu Phe Asn Gln 65 70 75 80 Gln Tyr Ala Asp Phe Phe Val Lys Tyr Phe Asn Trp Ala Val Phe Glu 85 90 95 Asn Glu Ala Lys Trp Tyr Ala Asn Glu Pro Gln Arg Gly Arg Ile Thr 100 105 110 Tyr Glu Lys Ala Asp Ala Met Leu Asn Phe Ala Asp Arg His Gln Leu 115 120 125 Pro Val Arg Gly His Ala Leu Phe Trp Glu Val Glu Asp Ala Asn Pro 130 135 140 Ser Trp Leu Arg Ser Leu Pro Asn His Glu Val Tyr Glu Ala Met Lys 145 150 155 160 Asn Arg Leu Glu His Ala Gly Asn His Phe Lys Gly Arg Phe Arg His 165 170 175 Trp Asp Val Asn Asn Glu Met Met His Gly Ser Phe Phe Lys Asp Arg 180 185 190 Phe Gly Lys Asn Ile Trp Lys Trp Met Tyr Glu Glu Thr Lys Lys Ile 195 200 205 Asp Pro Gln Ala Leu Leu Phe Val Asn Asp Tyr Asn Val Ile Ser Tyr 210 215 220 Gly Glu His His Ala Tyr Lys Ala His Ile Asn Glu Leu Arg Gln Leu 225 230 235 240 Gly Ala Pro Ile Glu Ala Ile Gly Val Gln Gly His Phe Glu Glu Arg 245 250 255 Val Asp Pro Val Ile Val Lys Glu Arg Leu Asp Val Leu Ala Glu Leu 260 265 270 Gly Leu Pro Ile Trp Val Thr Glu Tyr Asp Ser Val His Pro Asp Pro 275 280 285 Asn Arg Arg Ala Asp Asn Leu Glu Ala Leu Tyr Arg Val Ala Phe Ser 290 295 300 His Pro Ala Val Lys Gly Val Leu Met Trp Gly Phe Trp Ala Gly Ala 305 310 315 320 His Trp Arg Gly Glu Asn Ala Ala Ile Val Asn Tyr Asp Trp Ser Leu 325 330 335 Asn Glu Ala Gly Arg Arg Tyr Glu Lys Leu Leu Asn Glu Trp Thr Thr 340 345 350 Gln Arg Ile Glu Lys Thr Asp Ala Asn Gly His Val Arg Cys Pro Ala 355 360 365 Phe His Gly Thr Tyr Glu Val Arg Ile Gly Lys Glu Ser Lys Met Leu 370 375 380 Lys Gln Gln Thr Ile Glu Leu Asp Ser Asn Glu Gln Thr Pro Phe Gln 385 390 395 400 Leu Asp Val Ile Leu Pro Gln Glu Gly 405 <210> 293 <211> 1002 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 293 atgaagatga acagctccct cccctccctc cgcgatgtat tcgcgaatga tttccgcatc 60 ggggcggcgg tcaatcctgt gacgatcgag atgcaaaaac agttgttgat cgatcatgtc 120 aacagtatta cggcagagaa ccatatgaag tttgagcatc ttcagccgga agaagggaaa 180 tttacctttc aggaagcgga tcggattgtg gattttgctt gttcgcaccg aatggcggtt 240 cgagggcaca cacttgtatg gcacaaccag actccggatt gggtgtttca agatggtcaa 300 ggccatttcg tcagtcggga tgtgttgctt gagcggatga aatgtcacat ttcaactgtt 360 gtacggcgat acaagggaaa aatatattgt tgggatgtca tcaacgaagc ggtagccgac 420 gaaggagacg aattgttgag gccgtcgaag tggcgacaaa tcatcgggga cgattttatg 480 gaacaagcat ttctctacgc ttatgaagct gacccagatg cactgctttt ttacaatgac 540 tataatgaat gttttccgga aaagagagaa aaaatttttg cacttgtcaa atcgctgcgt 600 gataaaggca ttccgattca tggcatcggg atgcaagcgc attggagttt gactcgcccg 660 tcgcttgatg aaattcgtgc ggccattgaa cgatatgcgt cccttggtgt tgttcttcat 720 attacggaac tcgatgtatc catgtttgaa tttcacgatc gtcgaaccga tttggcagct 780 ccaacgtcag aaatgatcga acggcaggca gagcggtatg ggcaaatttt tgctttgttt 840 aaggagtatc gcgatgttat tcaaagtgtc acattttggg gaattgctga tgaccataca 900 tggctcgata actttccagt gcacgggaga aaaaactggc cgcttttgtt cgatgaacag 960 cataaaccga aaccagcttt ttggcgggca gtgagtgtct ga 1002 <210> 294 <211> 333 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <400> 294 Met Lys Met Asn Ser Ser Leu Pro Ser Leu Arg Asp Val Phe Ala Asn 1 5 10 15 Asp Phe Arg Ile Gly Ala Ala Val Asn Pro Val Thr Ile Glu Met Gln 20 25 30 Lys Gln Leu Leu Ile Asp His Val Asn Ser Ile Thr Ala Glu Asn His 35 40 45 Met Lys Phe Glu His Leu Gln Pro Glu Glu Gly Lys Phe Thr Phe Gln 50 55 60 Glu Ala Asp Arg Ile Val Asp Phe Ala Cys Ser His Arg Met Ala Val 65 70 75 80 Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro Asp Trp Val Phe 85 90 95 Gln Asp Gly Gln Gly His Phe Val Ser Arg Asp Val Leu Leu Glu Arg 100 105 110 Met Lys Cys His Ile Ser Thr Val Val Arg Arg Tyr Lys Gly Lys Ile 115 120 125 Tyr Cys Trp Asp Val Ile Asn Glu Ala Val Ala Asp Glu Gly Asp Glu 130 135 140 Leu Leu Arg Pro Ser Lys Trp Arg Gln Ile Ile Gly Asp Asp Phe Met 145 150 155 160 Glu Gln Ala Phe Leu Tyr Ala Tyr Glu Ala Asp Pro Asp Ala Leu Leu 165 170 175 Phe Tyr Asn Asp Tyr Asn Glu Cys Phe Pro Glu Lys Arg Glu Lys Ile 180 185 190 Phe Ala Leu Val Lys Ser Leu Arg Asp Lys Gly Ile Pro Ile His Gly 195 200 205 Ile Gly Met Gln Ala His Trp Ser Leu Thr Arg Pro Ser Leu Asp Glu 210 215 220 Ile Arg Ala Ala Ile Glu Arg Tyr Ala Ser Leu Gly Val Val Leu His 225 230 235 240 Ile Thr Glu Leu Asp Val Ser Met Phe Glu Phe His Asp Arg Arg Thr 245 250 255 Asp Leu Ala Ala Pro Thr Ser Glu Met Ile Glu Arg Gln Ala Glu Arg 260 265 270 Tyr Gly Gln Ile Phe Ala Leu Phe Lys Glu Tyr Arg Asp Val Ile Gln 275 280 285 Ser Val Thr Phe Trp Gly Ile Ala Asp Asp His Thr Trp Leu Asp Asn 290 295 300 Phe Pro Val His Gly Arg Lys Asn Trp Pro Leu Leu Phe Asp Glu Gln 305 310 315 320 His Lys Pro Lys Pro Ala Phe Trp Arg Ala Val Ser Val 325 330 <210> 295 <211> 1134 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 295 atgagatccg tccgcatcgt cacctttgct ctcgccgccg cgctggccgt cccgctggtg 60 acgtcgacgg ccacggccaa gccgtccgcc gaccacgagg ccgcgcccca ctccaacgcc 120 aagttcgacc gcctgcgctg ggccgccccc gaagggttct tcataggctc cgcggcggcc 180 ggcggcggcc accacctcga acaggactac ccggacccct tcaccttcga caagaagtac 240 cggaagatcc tgggccagca gttcaactcg gtctccgccg agaaccagat gaagtgggag 300 ttcatccacc ccgagcgcga ccagtaccgc ttcgaggagg ccgacgccat cgtcgagttc 360 gcccagcgga accgccaggc cgtgcgcggg cacaccctcc tgtggcacag ccagaacccc 420 gaatggctgg aggagggcga cttcaccaag gaggaactgc gcgccatcct caaggaccac 480 atcgacacgg tcgtcggccg ctacgccggc aagatccagc agtgggacgt ggccaacgag 540 atcttcaacg accaggccga gctgcgcacc gacgagaaca tctggatacg tgagctcggc 600 ccggagatcg tcgcggacgc cttccgctgg gcccacgagg ccgaccccga ggccaagctg 660 ttcctcaacg actacaacgt cgagggcatc aacgccaaga gcgacgccta ctacgagctc 720 gcccaggaga tgctggagca gggcgtgccg ctccacggat tcggcgccca gggccacctg 780 agcacccgct acggcttccc gggcgacctg cagcagaacc tgcagcggtt cgccgacctc 840 ggtctggaga ccgccatcac cgagatcgac gtccgcatgg acctcccggc gagcggcaag 900 cccaccaagg agcagctgcg gcagcaggcc gactactacc agcaggcact gtcggcctgc 960 ctggccgtga acgactgcaa ctccttcacc atctggggct tcaccgacaa gtactcgtgg 1020 gtgccggtct tcttcgaggg tgagggcagc gccacggtca tgacggagaa gttcgtccgc 1080 aagccggcct tcttcgccct gcagtccacc ctgaaggagg cgcgcaagcg ctga 1134 <210> 296 <211> 377 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(26) <400> 296 Met Arg Ser Val Arg Ile Val Thr Phe Ala Leu Ala Ala Ala Leu Ala 1 5 10 15 Val Pro Leu Val Thr Ser Thr Ala Thr Ala Lys Pro Ser Ala Asp His 20 25 30 Glu Ala Ala Pro His Ser Asn Ala Lys Phe Asp Arg Leu Arg Trp Ala 35 40 45 Ala Pro Glu Gly Phe Phe Ile Gly Ser Ala Ala Ala Gly Gly Gly His 50 55 60 His Leu Glu Gln Asp Tyr Pro Asp Pro Phe Thr Phe Asp Lys Lys Tyr 65 70 75 80 Arg Lys Ile Leu Gly Gln Gln Phe Asn Ser Val Ser Ala Glu Asn Gln 85 90 95 Met Lys Trp Glu Phe Ile His Pro Glu Arg Asp Gln Tyr Arg Phe Glu 100 105 110 Glu Ala Asp Ala Ile Val Glu Phe Ala Gln Arg Asn Arg Gln Ala Val 115 120 125 Arg Gly His Thr Leu Leu Trp His Ser Gln Asn Pro Glu Trp Leu Glu 130 135 140 Glu Gly Asp Phe Thr Lys Glu Glu Leu Arg Ala Ile Leu Lys Asp His 145 150 155 160 Ile Asp Thr Val Val Gly Arg Tyr Ala Gly Lys Ile Gln Gln Trp Asp 165 170 175 Val Ala Asn Glu Ile Phe Asn Asp Gln Ala Glu Leu Arg Thr Asp Glu 180 185 190 Asn Ile Trp Ile Arg Glu Leu Gly Pro Glu Ile Val Ala Asp Ala Phe 195 200 205 Arg Trp Ala His Glu Ala Asp Pro Glu Ala Lys Leu Phe Leu Asn Asp 210 215 220 Tyr Asn Val Glu Gly Ile Asn Ala Lys Ser Asp Ala Tyr Tyr Glu Leu 225 230 235 240 Ala Gln Glu Met Leu Glu Gln Gly Val Pro Leu His Gly Phe Gly Ala 245 250 255 Gln Gly His Leu Ser Thr Arg Tyr Gly Phe Pro Gly Asp Leu Gln Gln 260 265 270 Asn Leu Gln Arg Phe Ala Asp Leu Gly Leu Glu Thr Ala Ile Thr Glu 275 280 285 Ile Asp Val Arg Met Asp Leu Pro Ala Ser Gly Lys Pro Thr Lys Glu 290 295 300 Gln Leu Arg Gln Gln Ala Asp Tyr Tyr Gln Gln Ala Leu Ser Ala Cys 305 310 315 320 Leu Ala Val Asn Asp Cys Asn Ser Phe Thr Ile Trp Gly Phe Thr Asp 325 330 335 Lys Tyr Ser Trp Val Pro Val Phe Phe Glu Gly Glu Gly Ser Ala Thr 340 345 350 Val Met Thr Glu Lys Phe Val Arg Lys Pro Ala Phe Phe Ala Leu Gln 355 360 365 Ser Thr Leu Lys Glu Ala Arg Lys Arg 370 375 <210> 297 <211> 1842 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 297 ttgaggtcag gcgcgttctg tttcatcata gtcgttttaa tcctgaacct tatatgcagg 60 gagttgtatg agtgtaaaaa agttgttacc gcagcactgg tatgcttggc tttcgggtca 120 tcgctgactt gggggcaatg caccacattt accaccagta ccattcggaa ttgcgatggt 180 atagattacg agctctggag ccagaataac tctggcacga ccaatatgca aatcacggga 240 gggaactcga atccaaacgg tggaaccttt gaggcgacat ggagtggcac gatcaatgtt 300 ctattccgcg cgggtaaaaa atggggcaca tccagcacca gtacccccaa aaccatcggc 360 aatatctctc ttgaattcgc agcgacatgg agttcggtcg ataatgtgaa aatgcttggc 420 atctatggct gggcgtatta tccctcggga agcgaaccaa caaaaacgga aagcggtcaa 480 agcacgaact tttccaatca gattgagtat tacatcattc aagaccgcgg tagctataac 540 ccggcatccg gcggcaccaa cgccaaaaag tacggtgaag ggacgatcga cggaatcgcg 600 tatgattttt atgtcgccga ccgtatcggc caggccatgc tgacaggaac gggaaatttc 660 aaacagtact tcagcgtgcc gaagagcaca agcagtcaca ggcaaagcgg cacggtttcc 720 gtctccaaac attttgaggc ctgggaaaaa gcgggcatga agatgatgga ttgtcggtta 780 tacgaagtcg cgatgaaagt ggaatcgtat accggttccg cgaatggcaa cggctcggcg 840 aaagtgacca aaaatctcct cacgatcggc ggaagcagca gcaacgagtt tagtctcgta 900 acgaatgttt ctcctgccag cgcgggaacg gtgtccaaga gcccggacaa cgcatcctat 960 gccccgaacg cctccgttca gctcacggcg accccgaata ccggttggaa gtttgtgggc 1020 tgggaagggg acgcctcggg ttccacgagc ccaaccagcg ttaccatgag caaagacctc 1080 acggttacag cgaagtttga gctggtatcg gaagaaggca gcacaaacct gatccaggat 1140 ggcaacttcc cgagcggcag cgtaatctct acagatgacg gggcttcatg gaaactcgga 1200 caaggggaaa actggggaaa ttccgcagcc acaacgagcg tcagcaatgg aatcgcgaca 1260 gtcaatgtga caactgtcgg agcggaagct tatcaaccgc agcttgtaca gtacggtttg 1320 ggactcgaca tggacatgag ttacaaactt accttcaagg caagagccga tgcggcaagg 1380 aagattgaag ttgcgttcca gcaggcggtg gatccttggg ctggttatgc ttcccaggaa 1440 ttcgacctga ccacgaccga tcaggatttc gagttcgtat tcacgatgac caacgccagc 1500 gacccggcat cacagttcgc gttcaatctt ggccaggcga caggcgatgt ctatatcagt 1560 gatgttaaac tggtatacac gacaggcacc acacccatat cccgcaccat agtccgcggc 1620 aatacggcat tcgtctcggt aagtggcaga accctgaata tttcggcagt cgacgcgtcc 1680 acacttcaga tcaaggtagt agatataaac ggaaaggtaa gagcgaattt caacacggct 1740 ggtgcagcaa gtgtttcctt gtccaatatt cctgcgggcc agtacttcgt tggtatcaca 1800 ggcacaggca taaaacaaat ctcaccgatc gttttggaat aa 1842 <210> 298 <211> 613 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <400> 298 Met Arg Ser Gly Ala Phe Cys Phe Ile Ile Val Val Leu Ile Leu Asn 1 5 10 15 Leu Ile Cys Arg Glu Leu Tyr Glu Cys Lys Lys Val Val Thr Ala Ala 20 25 30 Leu Val Cys Leu Ala Phe Gly Ser Ser Leu Thr Trp Gly Gln Cys Thr 35 40 45 Thr Phe Thr Thr Ser Thr Ile Arg Asn Cys Asp Gly Ile Asp Tyr Glu 50 55 60 Leu Trp Ser Gln Asn Asn Ser Gly Thr Thr Asn Met Gln Ile Thr Gly 65 70 75 80 Gly Asn Ser Asn Pro Asn Gly Gly Thr Phe Glu Ala Thr Trp Ser Gly 85 90 95 Thr Ile Asn Val Leu Phe Arg Ala Gly Lys Lys Trp Gly Thr Ser Ser 100 105 110 Thr Ser Thr Pro Lys Thr Ile Gly Asn Ile Ser Leu Glu Phe Ala Ala 115 120 125 Thr Trp Ser Ser Val Asp Asn Val Lys Met Leu Gly Ile Tyr Gly Trp 130 135 140 Ala Tyr Tyr Pro Ser Gly Ser Glu Pro Thr Lys Thr Glu Ser Gly Gln 145 150 155 160 Ser Thr Asn Phe Ser Asn Gln Ile Glu Tyr Tyr Ile Ile Gln Asp Arg 165 170 175 Gly Ser Tyr Asn Pro Ala Ser Gly Gly Thr Asn Ala Lys Lys Tyr Gly 180 185 190 Glu Gly Thr Ile Asp Gly Ile Ala Tyr Asp Phe Tyr Val Ala Asp Arg 195 200 205 Ile Gly Gln Ala Met Leu Thr Gly Thr Gly Asn Phe Lys Gln Tyr Phe 210 215 220 Ser Val Pro Lys Ser Thr Ser Ser His Arg Gln Ser Gly Thr Val Ser 225 230 235 240 Val Ser Lys His Phe Glu Ala Trp Glu Lys Ala Gly Met Lys Met Met 245 250 255 Asp Cys Arg Leu Tyr Glu Val Ala Met Lys Val Glu Ser Tyr Thr Gly 260 265 270 Ser Ala Asn Gly Asn Gly Ser Ala Lys Val Thr Lys Asn Leu Leu Thr 275 280 285 Ile Gly Gly Ser Ser Ser Asn Glu Phe Ser Leu Val Thr Asn Val Ser 290 295 300 Pro Ala Ser Ala Gly Thr Val Ser Lys Ser Pro Asp Asn Ala Ser Tyr 305 310 315 320 Ala Pro Asn Ala Ser Val Gln Leu Thr Ala Thr Pro Asn Thr Gly Trp 325 330 335 Lys Phe Val Gly Trp Glu Gly Asp Ala Ser Gly Ser Thr Ser Pro Thr 340 345 350 Ser Val Thr Met Ser Lys Asp Leu Thr Val Thr Ala Lys Phe Glu Leu 355 360 365 Val Ser Glu Glu Gly Ser Thr Asn Leu Ile Gln Asp Gly Asn Phe Pro 370 375 380 Ser Gly Ser Val Ile Ser Thr Asp Asp Gly Ala Ser Trp Lys Leu Gly 385 390 395 400 Gln Gly Glu Asn Trp Gly Asn Ser Ala Ala Thr Thr Ser Val Ser Asn 405 410 415 Gly Ile Ala Thr Val Asn Val Thr Thr Val Gly Ala Glu Ala Tyr Gln 420 425 430 Pro Gln Leu Val Gln Tyr Gly Leu Gly Leu Asp Met Asp Met Ser Tyr 435 440 445 Lys Leu Thr Phe Lys Ala Arg Ala Asp Ala Ala Arg Lys Ile Glu Val 450 455 460 Ala Phe Gln Gln Ala Val Asp Pro Trp Ala Gly Tyr Ala Ser Gln Glu 465 470 475 480 Phe Asp Leu Thr Thr Thr Asp Gln Asp Phe Glu Phe Val Phe Thr Met 485 490 495 Thr Asn Ala Ser Asp Pro Ala Ser Gln Phe Ala Phe Asn Leu Gly Gln 500 505 510 Ala Thr Gly Asp Val Tyr Ile Ser Asp Val Lys Leu Val Tyr Thr Thr 515 520 525 Gly Thr Thr Pro Ile Ser Arg Thr Ile Val Arg Gly Asn Thr Ala Phe 530 535 540 Val Ser Val Ser Gly Arg Thr Leu Asn Ile Ser Ala Val Asp Ala Ser 545 550 555 560 Thr Leu Gln Ile Lys Val Val Asp Ile Asn Gly Lys Val Arg Ala Asn 565 570 575 Phe Asn Thr Ala Gly Ala Ala Ser Val Ser Leu Ser Asn Ile Pro Ala 580 585 590 Gly Gln Tyr Phe Val Gly Ile Thr Gly Thr Gly Ile Lys Gln Ile Ser 595 600 605 Pro Ile Val Leu Glu 610 <210> 299 <211> 1047 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 299 atgtttttga gtctcaaaag agtggcggcg cttgtttgcg tcgccggtct cggcatctct 60 gcggcccaag cacagacctg cctgacctcg agtcaaaccg gcactaacaa cggcttctac 120 tattcgttct ggaaagacaa tcccggcacc gtgaatttct gtctgcagtc cggcggccgc 180 tacacctcca actggagcgg catcaacaac tgggtcggcg gaaagggatg gcagacgggt 240 tcccgcagag tggtgaacta ctcgggcagc ttcaattcgc ctggcaatgg gtacctgact 300 ctctatgggt ggaccaccaa tccgctcatc gagtactaca ttgtcgacaa ctggggcacg 360 tatcgtccgc cgggtgggca ggggttcatg ggcacggtga ccagcgatgg cgcgacgtat 420 gacgtctatc gcacgcagcg cgtcaatcag ccctgcatca ccggcagcag ttgcacgttc 480 tatcaatact ggagcgtgcg gcagtcgaag cggaccggtg gcacgatcac caccggcaac 540 cacttcgatg cctgggccag ctacggaatg aatctgggcg ctcacaacta ccagatcatg 600 gcgaccgagg gctatcaaag cagcggcagc tctgacatca cggtgagtga gggaagcagc 660 agcagtagca gcggtggtgg cagcagcacg agcagcagtg gcggcggcgg caccaagagc 720 ttcacggtcc gggcgcgcgg aaccgcgggt ggtgagtcca tcacgctgcg tgtgaacaat 780 cagaacgtgc agacctggac gctgggcacc agcatgacga actacacggc atcgacgtcg 840 ttgagcggtg gcatcaccgt ggcttacacg aacgacagtg gcaatcgcga cgtgcaggtg 900 gattacatca tcgtgaacgg ctcgacgcgt cagtcagaag cgcagagcta caacaccggg 960 ctctatgcca acggtagttg tggtggcggc tccaatagcg aatggatgca ttgcaacggc 1020 gccattggct acgggaatac gccgtag 1047 <210> 300 <211> 348 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(24) <400> 300 Met Phe Leu Ser Leu Lys Arg Val Ala Ala Leu Val Cys Val Ala Gly 1 5 10 15 Leu Gly Ile Ser Ala Ala Gln Ala Gln Thr Cys Leu Thr Ser Ser Gln 20 25 30 Thr Gly Thr Asn Asn Gly Phe Tyr Tyr Ser Phe Trp Lys Asp Asn Pro 35 40 45 Gly Thr Val Asn Phe Cys Leu Gln Ser Gly Gly Arg Tyr Thr Ser Asn 50 55 60 Trp Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly 65 70 75 80 Ser Arg Arg Val Val Asn Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn 85 90 95 Gly Tyr Leu Thr Leu Tyr Gly Trp Thr Thr Asn Pro Leu Ile Glu Tyr 100 105 110 Tyr Ile Val Asp Asn Trp Gly Thr Tyr Arg Pro Pro Gly Gly Gln Gly 115 120 125 Phe Met Gly Thr Val Thr Ser Asp Gly Ala Thr Tyr Asp Val Tyr Arg 130 135 140 Thr Gln Arg Val Asn Gln Pro Cys Ile Thr Gly Ser Ser Cys Thr Phe 145 150 155 160 Tyr Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Thr Gly Gly Thr Ile 165 170 175 Thr Thr Gly Asn His Phe Asp Ala Trp Ala Ser Tyr Gly Met Asn Leu 180 185 190 Gly Ala His Asn Tyr Gln Ile Met Ala Thr Glu Gly Tyr Gln Ser Ser 195 200 205 Gly Ser Ser Asp Ile Thr Val Ser Glu Gly Ser Ser Ser Ser Ser Ser 210 215 220 Gly Gly Gly Ser Ser Thr Ser Ser Ser Gly Gly Gly Gly Thr Lys Ser 225 230 235 240 Phe Thr Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Ser Ile Thr Leu 245 250 255 Arg Val Asn Asn Gln Asn Val Gln Thr Trp Thr Leu Gly Thr Ser Met 260 265 270 Thr Asn Tyr Thr Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val Ala 275 280 285 Tyr Thr Asn Asp Ser Gly Asn Arg Asp Val Gln Val Asp Tyr Ile Ile 290 295 300 Val Asn Gly Ser Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly 305 310 315 320 Leu Tyr Ala Asn Gly Ser Cys Gly Gly Gly Ser Asn Ser Glu Trp Met 325 330 335 His Cys Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro 340 345 <210> 301 <211> 642 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 301 atgtttaagt ttacaaagaa attcttagtt gggttaacgg cagctttgat gagtatgagc 60 ttgttttcgg caaacgcctc tgcagctaac acagactact ggcaaaattg gactgatggg 120 ggcggaacag taaacgctgt caatgggtct ggcgggaatt acagtgtgaa ttggtctaat 180 accggaaatt tcgttgttgg taaaggttgg actacaggtt cgccatttag gacgataaac 240 tataatgccg gagtttgggc gccgaacggc aatgcatatt tgactttata tggttggacg 300 cgatcccctc tcatagaata ttatgtagtg gattcatggg gtacttatag acctactgga 360 acgtataaag gtacggttta cagtgatggg ggtacatatg acgtgtacac aactacacgt 420 tatgatgcac cttccattga tggcgataaa actactttta cgcagtactg gagtgttcgc 480 cagtcgaaga gaccaactgg aagcaacgct acaatcactt tcagcaatca cgttaacgca 540 tggaagagat atgggatgaa tctgggtagt aattggtctt accaagtctt agcgacagag 600 ggatatcgaa gtagtggaag ttctaacgta acagtgtggt aa 642 <210> 302 <211> 213 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(28) <400> 302 Met Phe Lys Phe Thr Lys Lys Phe Leu Val Gly Leu Thr Ala Ala Leu 1 5 10 15 Met Ser Met Ser Leu Phe Ser Ala Asn Ala Ser Ala Ala Asn Thr Asp 20 25 30 Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr Val Asn Ala Val Asn 35 40 45 Gly Ser Gly Gly Asn Tyr Ser Val Asn Trp Ser Asn Thr Gly Asn Phe 50 55 60 Val Val Gly Lys Gly Trp Thr Thr Gly Ser Pro Phe Arg Thr Ile Asn 65 70 75 80 Tyr Asn Ala Gly Val Trp Ala Pro Asn Gly Asn Ala Tyr Leu Thr Leu 85 90 95 Tyr Gly Trp Thr Arg Ser Pro Leu Ile Glu Tyr Tyr Val Val Asp Ser 100 105 110 Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Thr Val Tyr Ser 115 120 125 Asp Gly Gly Thr Tyr Asp Val Tyr Thr Thr Thr Arg Tyr Asp Ala Pro 130 135 140 Ser Ile Asp Gly Asp Lys Thr Thr Phe Thr Gln Tyr Trp Ser Val Arg 145 150 155 160 Gln Ser Lys Arg Pro Thr Gly Ser Asn Ala Thr Ile Thr Phe Ser Asn 165 170 175 His Val Asn Ala Trp Lys Arg Tyr Gly Met Asn Leu Gly Ser Asn Trp 180 185 190 Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Arg Ser Ser Gly Ser Ser 195 200 205 Asn Val Thr Val Trp 210 <210> 303 <211> 1404 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 303 ttgactataa aggcctggcc cgggacggct gccagctata ataccaatag aggttttatc 60 atgtcctacg ctcagtttaa gggggccgct accctagcga cgtccttcct gctcgcagtc 120 accttgacag cctgtggagg cagcaaatcc aaacccgttc tgccagaccc atcgaacagc 180 agctcgtcat caagcagcag ctcgtcatca agcagcagct cctcaagttc ctccagtagc 240 agttcgagct cttctagtgc tccctccagc caaacgttct tcattgagcc ggatttccag 300 cttcacaccc tggcggactt cccgattgga gtggcagtct cggcagccaa tgagccatac 360 agcatcttca accaaaccga tggtactgat cggcaggatg tgatcctgga gcatttcaac 420 gaaatgaccg ctggcaacat catgaaaatg agctacgtgt acgcaggtca acgtgcaaat 480 cagcaacccg atcaattcga cttcagcaga gctgatgagc tggttgggtt tgcccacgca 540 aacagtgtga agattcacgg tcacgccctc gtttggcacg ccgactatca agttccgggt 600 ttcatgcaga attatgatgg cgactttgct gagatgttgg ccaatcacgc gcggagtgtt 660 gtggaacatt ttgacgaaga gtttccaggt accgtggtca gctgggatgt ggtcaacgag 720 gcgataaccg acaacttcgg aaccgataca aatggctggc gccggtcgct gttttacaac 780 gcgctgccgc ccgcgacaga agacgatatt cctgagtaca tccgcgttgc cttccaggcc 840 gctcgcgatg ccaacccgga catcgacctc tattacaatg attacgacaa taccgccaac 900 accaaccggc tgaacaaaac cctgcagatc gccgatgccc tggccgagga cgagctgatc 960 gacggtgtgg gattccagat gcacgtctat atgacgtacc cgagccttag tcacttccaa 1020 aacgcgtttc aagaagtggt tgatcgaggc ttgaaggtga agatcaccga gctggacgta 1080 tcggtggtca acccatacgg tcagagcact ccgccaccgc agcccgtcta cgatgaagcg 1140 ttggcaggcg cacagaaaaa gcggttctgc gatatcacca gagtctatct ggaaacggtt 1200 ccggctgagc ttcgcggcgg tctcactgtt tgggggcttg ccgacaacga aagctggttg 1260 atgcaacagt tcaggaacgc aacgggagcg aactacaccg acgtgtggcc gttgttgttc 1320 aacgccgacc tgtcagccaa acctacactc caaggcgtgg ccgatgctct gcagggtctc 1380 ccctgcacca ccgacctcga ctaa 1404 <210> 304 <211> 467 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(74) <400> 304 Met Thr Ile Lys Ala Trp Pro Gly Thr Ala Ala Ser Tyr Asn Thr Asn 1 5 10 15 Arg Gly Phe Ile Met Ser Tyr Ala Gln Phe Lys Gly Ala Ala Thr Leu 20 25 30 Ala Thr Ser Phe Leu Leu Ala Val Thr Leu Thr Ala Cys Gly Gly Ser 35 40 45 Lys Ser Lys Pro Val Leu Pro Asp Pro Ser Asn Ser Ser Ser Ser Ser 50 55 60 Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser 65 70 75 80 Ser Ser Ser Ser Ser Ser Ala Pro Ser Ser Gln Thr Phe Phe Ile Glu 85 90 95 Pro Asp Phe Gln Leu His Thr Leu Ala Asp Phe Pro Ile Gly Val Ala 100 105 110 Val Ser Ala Ala Asn Glu Pro Tyr Ser Ile Phe Asn Gln Thr Asp Gly 115 120 125 Thr Asp Arg Gln Asp Val Ile Leu Glu His Phe Asn Glu Met Thr Ala 130 135 140 Gly Asn Ile Met Lys Met Ser Tyr Val Tyr Ala Gly Gln Arg Ala Asn 145 150 155 160 Gln Gln Pro Asp Gln Phe Asp Phe Ser Arg Ala Asp Glu Leu Val Gly 165 170 175 Phe Ala His Ala Asn Ser Val Lys Ile His Gly His Ala Leu Val Trp 180 185 190 His Ala Asp Tyr Gln Val Pro Gly Phe Met Gln Asn Tyr Asp Gly Asp 195 200 205 Phe Ala Glu Met Leu Ala Asn His Ala Arg Ser Val Val Glu His Phe 210 215 220 Asp Glu Glu Phe Pro Gly Thr Val Val Ser Trp Asp Val Val Asn Glu 225 230 235 240 Ala Ile Thr Asp Asn Phe Gly Thr Asp Thr Asn Gly Trp Arg Arg Ser 245 250 255 Leu Phe Tyr Asn Ala Leu Pro Pro Ala Thr Glu Asp Asp Ile Pro Glu 260 265 270 Tyr Ile Arg Val Ala Phe Gln Ala Ala Arg Asp Ala Asn Pro Asp Ile 275 280 285 Asp Leu Tyr Tyr Asn Asp Tyr Asp Asn Thr Ala Asn Thr Asn Arg Leu 290 295 300 Asn Lys Thr Leu Gln Ile Ala Asp Ala Leu Ala Glu Asp Glu Leu Ile 305 310 315 320 Asp Gly Val Gly Phe Gln Met His Val Tyr Met Thr Tyr Pro Ser Leu 325 330 335 Ser His Phe Gln Asn Ala Phe Gln Glu Val Val Asp Arg Gly Leu Lys 340 345 350 Val Lys Ile Thr Glu Leu Asp Val Ser Val Val Asn Pro Tyr Gly Gln 355 360 365 Ser Thr Pro Pro Pro Gln Pro Val Tyr Asp Glu Ala Leu Ala Gly Ala 370 375 380 Gln Lys Lys Arg Phe Cys Asp Ile Thr Arg Val Tyr Leu Glu Thr Val 385 390 395 400 Pro Ala Glu Leu Arg Gly Gly Leu Thr Val Trp Gly Leu Ala Asp Asn 405 410 415 Glu Ser Trp Leu Met Gln Gln Phe Arg Asn Ala Thr Gly Ala Asn Tyr 420 425 430 Thr Asp Val Trp Pro Leu Leu Phe Asn Ala Asp Leu Ser Ala Lys Pro 435 440 445 Thr Leu Gln Gly Val Ala Asp Ala Leu Gln Gly Leu Pro Cys Thr Thr 450 455 460 Asp Leu Asp 465 <210> 305 <211> 3705 <212> DNA <213> Bacteria <400> 305 atgaagagta ttgtaaacag agttgtatct atcgttacag ctttaataat gatttttggg 60 acatcactgc tttcacaaca cataagggca tttgctgatg acactaatac aaatctggtt 120 tctaatgggg actttgagac aggcacaatt gatggctgga ttaagcaagg taatcctaca 180 ttagaagtaa cgactgaaca agcaattggg caatacagta tgaaagttac gggtagaaca 240 cagacatatg aaggacctgc atatagcttt ttaggaaaaa tgcagaaagg tgaatcatat 300 aatgtatcgc ttaaagttag acttgtttct ggacaaaatt cttctaatcc ttttattacc 360 gtgactatgt ttagagaaga tgacaatggc aagcattatg atacaatagt ttggcaaaaa 420 caagtttctg aagattcatg gactactgta agcgggactt atacattaga ttatactgga 480 acattaaaaa cattatacat gtatgtagaa tcacccgatc caacgctgga atactatatt 540 gatgatgttg tagtgacacc acaaaatcca atacaagtag gaaatgtgat taccaatgga 600 acttttgaaa atggaaatac ttcaggatgg gttggaacag gctcatctgt tgttaaggca 660 gtgtatggag tggctcatag cggaggttat agtttattga cgacagggag aacagctaat 720 tggaatggtc ctagctatga tttgactggc aaaatagtac caggtcaaca atacaatgtt 780 gatttttggg tgaaatttgt taatggcaat gatacagaac aaataaaggc tactgttaaa 840 gcgacttcta acaaagacaa ttatatacaa gttaatgatt ttgtaaatgt aaataaaggc 900 gaatggacag aaataaaagg cagttttact ttacctgtga cagattacag cggtgtcagc 960 atctatgtag aatctcaaaa tcctacttta gagttttaca ttgatgattt ttctgtaata 1020 ggtgaaattt caaataatca gattacaata caaaatgata ttccggattt atattcagta 1080 ttcaaagatt atttccccat cggtgttgca gttgattcga gtagattaaa tgatgctgat 1140 ccacatgctc aattgactgc taaacatttt aatatgcttg ttgcagaaaa tgccatgaaa 1200 ccggaaagct tgcagcctac agagggaaac tttacctttg ataatgctga taagattgtt 1260 gattatgaaa tagcacataa tatgaagatg agaggtcata cattgctttg gcataatcag 1320 gttccggatt ggtttttcca ggacccatct gatccgtcta aaccagcttc aagggatctg 1380 ctgcttcaaa gattaagaac gcacataaca actgtgttag atcattttaa aacaaaatac 1440 ggttctcaaa atccaataat cggatgggat gttgtaaatg aggttcttga tgataatggc 1500 aatttaagaa attctaagtg gttacaaatt ataggacctg attatataga aaaagctttt 1560 gaatatgcgc atgaggcaga tccatctatg aaattgttta ttaatgatta caacatcgaa 1620 aataatggcg ttaaaacaca ggcaatgtat gatttagtga aaaagttaaa aagtgaaggt 1680 gtgcctataa acggaatagg catgcaaatg cacataagca taaattcaaa tatagacaat 1740 ataaaagctt ctatagaaaa acttgcatca ttaggtgtgg aaatacaggt aactgaatta 1800 gatatgaaca tgaatggtaa tgtatctaac gacgcattgc ttaagcaagc gagattgtat 1860 aaacaattat ttgacttatt taaagcagaa aaacaatata taactgctgt agttttttgg 1920 ggagtttcag atgatgtaag ttggcttagt aagccaaatg ctccactact ttttgattca 1980 aagttacagg caaagccagc atactgggca attgtagatc aaggcaaagc catacctgac 2040 attcaatctg caaaagcttt agaaggatca ccgacgattg gtgcaaatgt tgatagttct 2100 tggaaacttg taaaaccatt gtatgctaat acttatgtga aaggaactat tggagcaact 2160 gctgctgtta aatctatgtg ggatactaaa aacttatatt tgttagtaca agtttcagac 2220 aatactccat ctaataatga tggtatcgag atttttgtgg ataagaatga caacaaatct 2280 actacctatg aaagtgacga tgaacattat atagttaaga gggatggtac agggagttca 2340 aatattacaa agtatgtaat gtctaatgct gatggatatg tagcacagat agctattcca 2400 attgaagaca ttagtcctgt gctgaatgat aaaattggat ttgatatcag aataaatgat 2460 gaccaaggca gtggcaatat aaatgcgata acagtttgga atgattatac aaacagtcaa 2520 gatactaata cagcatattt tggagattta gtattatcaa aacctgcaca gattgcaaca 2580 gctatatatg gcactcctgt tattgacggt aaagtagatg gtatttggaa taatgctgaa 2640 gctatttcga caaatacatg ggtcttgggt tcaaatggtg ctactgcaac agcaaaaatg 2700 atgtgggacg ataaatatct ttatatattg gcagatgtaa cagataacaa tttaaataaa 2760 tccagtgtga atccttatga acaggattct gtggaagttt ttgtagatca gaataatgat 2820 aagacaactt attatgaaaa tgatgatggg cagtttagag ttaactatga taatgaacaa 2880 agttttggag gaagcactaa ttcaaatgga tttaagtcgg caacaagtct tacacaaaat 2940 ggatatattg tagaagaagc tattccttgg acgagtatta ctccgtcaaa tggtactatc 3000 atagggtttg acttgcaagt taacgatgca gatgaaaatg gtaagaggac aggtattgtc 3060 acatggtgtg atccaagcgg aaattcttgg caagatactt ctggatttgg aaacttgatg 3120 cttacaggta agccatctgg tgtccttaaa aaggttgtgg catttaatga cataaaagac 3180 aattgggcga aagacgtaat agaagtatta gcgtcaaggc acatagtaga agggatgaca 3240 gacacccagt atgaaccaaa caagacagtg acgagagcag aatttacagc aatgatactg 3300 aggctattaa acataaaaga agaagcatac agcggagaat ttagcgatgt aaaaagtgga 3360 gactggtatg caaacgcgat agaagcagca tacaaaacag gaataatcga aggtgacgga 3420 aagaacgcaa ggccaaatga cagcataaca agagaagaga tgacagcaat agccatgagg 3480 gcatacgaga tgctgacaca gtacgaagaa gagaatatag gtgcgacaac atttagcgac 3540 gacaaatcca taagcgattg ggcaagaaat gtagtggcaa atgcagcgaa attaggaata 3600 gtaaatggtg agccaaataa cgtatttgca cctaaaggaa atgccacaag agcagaagca 3660 gcagctatca tatacggctt attagaaaaa acaaataagc tttaa 3705 <210> 306 <211> 1234 <212> PRT <213> Bacteria <220> <221> SIGNAL <222> (1)...(32) <400> 306 Met Lys Ser Ile Val Asn Arg Val Val Ser Ile Val Thr Ala Leu Ile 1 5 10 15 Met Ile Phe Gly Thr Ser Leu Leu Ser Gln His Ile Arg Ala Phe Ala 20 25 30 Asp Asp Thr Asn Thr Asn Leu Val Ser Asn Gly Asp Phe Glu Thr Gly 35 40 45 Thr Ile Asp Gly Trp Ile Lys Gln Gly Asn Pro Thr Leu Glu Val Thr 50 55 60 Thr Glu Gln Ala Ile Gly Gln Tyr Ser Met Lys Val Thr Gly Arg Thr 65 70 75 80 Gln Thr Tyr Glu Gly Pro Ala Tyr Ser Phe Leu Gly Lys Met Gln Lys 85 90 95 Gly Glu Ser Tyr Asn Val Ser Leu Lys Val Arg Leu Val Ser Gly Gln 100 105 110 Asn Ser Ser Asn Pro Phe Ile Thr Val Thr Met Phe Arg Glu Asp Asp 115 120 125 Asn Gly Lys His Tyr Asp Thr Ile Val Trp Gln Lys Gln Val Ser Glu 130 135 140 Asp Ser Trp Thr Thr Val Ser Gly Thr Tyr Thr Leu Asp Tyr Thr Gly 145 150 155 160 Thr Leu Lys Thr Leu Tyr Met Tyr Val Glu Ser Pro Asp Pro Thr Leu 165 170 175 Glu Tyr Tyr Ile Asp Asp Val Val Val Thr Pro Gln Asn Pro Ile Gln 180 185 190 Val Gly Asn Val Ile Thr Asn Gly Thr Phe Glu Asn Gly Asn Thr Ser 195 200 205 Gly Trp Val Gly Thr Gly Ser Ser Val Val Lys Ala Val Tyr Gly Val 210 215 220 Ala His Ser Gly Gly Tyr Ser Leu Leu Thr Thr Gly Arg Thr Ala Asn 225 230 235 240 Trp Asn Gly Pro Ser Tyr Asp Leu Thr Gly Lys Ile Val Pro Gly Gln 245 250 255 Gln Tyr Asn Val Asp Phe Trp Val Lys Phe Val Asn Gly Asn Asp Thr 260 265 270 Glu Gln Ile Lys Ala Thr Val Lys Ala Thr Ser Asn Lys Asp Asn Tyr 275 280 285 Ile Gln Val Asn Asp Phe Val Asn Val Asn Lys Gly Glu Trp Thr Glu 290 295 300 Ile Lys Gly Ser Phe Thr Leu Pro Val Thr Asp Tyr Ser Gly Val Ser 305 310 315 320 Ile Tyr Val Glu Ser Gln Asn Pro Thr Leu Glu Phe Tyr Ile Asp Asp 325 330 335 Phe Ser Val Ile Gly Glu Ile Ser Asn Asn Gln Ile Thr Ile Gln Asn 340 345 350 Asp Ile Pro Asp Leu Tyr Ser Val Phe Lys Asp Tyr Phe Pro Ile Gly 355 360 365 Val Ala Val Asp Ser Ser Arg Leu Asn Asp Ala Asp Pro His Ala Gln 370 375 380 Leu Thr Ala Lys His Phe Asn Met Leu Val Ala Glu Asn Ala Met Lys 385 390 395 400 Pro Glu Ser Leu Gln Pro Thr Glu Gly Asn Phe Thr Phe Asp Asn Ala 405 410 415 Asp Lys Ile Val Asp Tyr Glu Ile Ala His Asn Met Lys Met Arg Gly 420 425 430 His Thr Leu Leu Trp His Asn Gln Val Pro Asp Trp Phe Phe Gln Asp 435 440 445 Pro Ser Asp Pro Ser Lys Pro Ala Ser Arg Asp Leu Leu Leu Gln Arg 450 455 460 Leu Arg Thr His Ile Thr Thr Val Leu Asp His Phe Lys Thr Lys Tyr 465 470 475 480 Gly Ser Gln Asn Pro Ile Ile Gly Trp Asp Val Val Asn Glu Val Leu 485 490 495 Asp Asp Asn Gly Asn Leu Arg Asn Ser Lys Trp Leu Gln Ile Ile Gly 500 505 510 Pro Asp Tyr Ile Glu Lys Ala Phe Glu Tyr Ala His Glu Ala Asp Pro 515 520 525 Ser Met Lys Leu Phe Ile Asn Asp Tyr Asn Ile Glu Asn Asn Gly Val 530 535 540 Lys Thr Gln Ala Met Tyr Asp Leu Val Lys Lys Leu Lys Ser Glu Gly 545 550 555 560 Val Pro Ile Asn Gly Ile Gly Met Gln Met His Ile Ser Ile Asn Ser 565 570 575 Asn Ile Asp Asn Ile Lys Ala Ser Ile Glu Lys Leu Ala Ser Leu Gly 580 585 590 Val Glu Ile Gln Val Thr Glu Leu Asp Met Asn Met Asn Gly Asn Val 595 600 605 Ser Asn Asp Ala Leu Leu Lys Gln Ala Arg Leu Tyr Lys Gln Leu Phe 610 615 620 Asp Leu Phe Lys Ala Glu Lys Gln Tyr Ile Thr Ala Val Val Phe Trp 625 630 635 640 Gly Val Ser Asp Asp Val Ser Trp Leu Ser Lys Pro Asn Ala Pro Leu 645 650 655 Leu Phe Asp Ser Lys Leu Gln Ala Lys Pro Ala Tyr Trp Ala Ile Val 660 665 670 Asp Gln Gly Lys Ala Ile Pro Asp Ile Gln Ser Ala Lys Ala Leu Glu 675 680 685 Gly Ser Pro Thr Ile Gly Ala Asn Val Asp Ser Ser Trp Lys Leu Val 690 695 700 Lys Pro Leu Tyr Ala Asn Thr Tyr Val Lys Gly Thr Ile Gly Ala Thr 705 710 715 720 Ala Ala Val Lys Ser Met Trp Asp Thr Lys Asn Leu Tyr Leu Leu Val 725 730 735 Gln Val Ser Asp Asn Thr Pro Ser Asn Asn Asp Gly Ile Glu Ile Phe 740 745 750 Val Asp Lys Asn Asp Asn Lys Ser Thr Thr Tyr Glu Ser Asp Asp Glu 755 760 765 His Tyr Ile Val Lys Arg Asp Gly Thr Gly Ser Ser Asn Ile Thr Lys 770 775 780 Tyr Val Met Ser Asn Ala Asp Gly Tyr Val Ala Gln Ile Ala Ile Pro 785 790 795 800 Ile Glu Asp Ile Ser Pro Val Leu Asn Asp Lys Ile Gly Phe Asp Ile 805 810 815 Arg Ile Asn Asp Asp Gln Gly Ser Gly Asn Ile Asn Ala Ile Thr Val 820 825 830 Trp Asn Asp Tyr Thr Asn Ser Gln Asp Thr Asn Thr Ala Tyr Phe Gly 835 840 845 Asp Leu Val Leu Ser Lys Pro Ala Gln Ile Ala Thr Ala Ile Tyr Gly 850 855 860 Thr Pro Val Ile Asp Gly Lys Val Asp Gly Ile Trp Asn Asn Ala Glu 865 870 875 880 Ala Ile Ser Thr Asn Thr Trp Val Leu Gly Ser Asn Gly Ala Thr Ala 885 890 895 Thr Ala Lys Met Met Trp Asp Asp Lys Tyr Leu Tyr Ile Leu Ala Asp 900 905 910 Val Thr Asp Asn Asn Leu Asn Lys Ser Ser Val Asn Pro Tyr Glu Gln 915 920 925 Asp Ser Val Glu Val Phe Val Asp Gln Asn Asn Asp Lys Thr Thr Tyr 930 935 940 Tyr Glu Asn Asp Asp Gly Gln Phe Arg Val Asn Tyr Asp Asn Glu Gln 945 950 955 960 Ser Phe Gly Gly Ser Thr Asn Ser Asn Gly Phe Lys Ser Ala Thr Ser 965 970 975 Leu Thr Gln Asn Gly Tyr Ile Val Glu Glu Ala Ile Pro Trp Thr Ser 980 985 990 Ile Thr Pro Ser Asn Gly Thr Ile Ile Gly Phe Asp Leu Gln Val Asn 995 1000 1005 Asp Ala Asp Glu Asn Gly Lys Arg Thr Gly Ile Val Thr Trp Cys Asp 1010 1015 1020 Pro Ser Gly Asn Ser Trp Gln Asp Thr Ser Gly Phe Gly Asn Leu Met 1025 1030 1035 1040 Leu Thr Gly Lys Pro Ser Gly Val Leu Lys Lys Val Val Ala Phe Asn 1045 1050 1055 Asp Ile Lys Asp Asn Trp Ala Lys Asp Val Ile Glu Val Leu Ala Ser 1060 1065 1070 Arg His Ile Val Glu Gly Met Thr Asp Thr Gln Tyr Glu Pro Asn Lys 1075 1080 1085 Thr Val Thr Arg Ala Glu Phe Thr Ala Met Ile Leu Arg Leu Leu Asn 1090 1095 1100 Ile Lys Glu Glu Ala Tyr Ser Gly Glu Phe Ser Asp Val Lys Ser Gly 1105 1110 1115 1120 Asp Trp Tyr Ala Asn Ala Ile Glu Ala Ala Tyr Lys Thr Gly Ile Ile 1125 1130 1135 Glu Gly Asp Gly Lys Asn Ala Arg Pro Asn Asp Ser Ile Thr Arg Glu 1140 1145 1150 Glu Met Thr Ala Ile Ala Met Arg Ala Tyr Glu Met Leu Thr Gln Tyr 1155 1160 1165 Glu Glu Glu Asn Ile Gly Ala Thr Thr Phe Ser Asp Asp Lys Ser Ile 1170 1175 1180 Ser Asp Trp Ala Arg Asn Val Val Ala Asn Ala Ala Lys Leu Gly Ile 1185 1190 1195 1200 Val Asn Gly Glu Pro Asn Asn Val Phe Ala Pro Lys Gly Asn Ala Thr 1205 1210 1215 Arg Ala Glu Ala Ala Ala Ile Ile Tyr Gly Leu Leu Glu Lys Thr Asn 1220 1225 1230 Lys Leu <210> 307 <211> 3729 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 307 atgaaatccg ccatcggcga cgctgcgttt atggcggcga tggaacgcaa ctccgacatc 60 gtgacgatgc agtgctacgc acctatcttt gtcaatgtca atcccggcgg gcggcagtgg 120 cgccccaatt tgatgggcta cgatgcgtta agcgctttcg gctcgccctc gtattacgcc 180 atcaaaatgt tcagcaacaa tttgggcgat acgattttga agcccagtct cagcggtgcg 240 cgcctgccag tttccgttac acaagagcag aaaagcggca cgattttcat taaattggtg 300 aacccgcaaa cgacgccaca gagcgtaaaa attgatctca aaggcgtgcg ctccgtcgaa 360 ttcagcggca ccgccactgt tttagctgcc gactccggcg cgcttaactc cattgatgcg 420 cctaccaaag tcgttcctgt cacgcgcaga attactggaa tcagcccctc gtttgcgcaa 480 acgctggagc cgtattcgat tactgttttg caaatcaagg ccactgctct gccaacggcg 540 acagcaaacg ccgttgcgcc gccaaccttc accacggagc caaaagtgaa caccaccacg 600 cccgttacta ttcccgttgc gacttcgcag ccgcagccag tttcgcaacc gtcgccagat 660 gcaaacgcta tcgcgccgct gaaaaacgct ttcaaaggca agttcctcat tggcaccgtg 720 ttgagcgggc cagacctgcg cggccagcaa acgcgcagcg tgggtatcgc caccacgcat 780 ttcgacgcct ttacggcaga aaacgaaatg aagccggatg cgatgcagcc tcgcgaagga 840 caattcaact ttgctgccgg cgaccgctta gtggaactgg ccgaaaaaag cggcgccacg 900 cccatcggcc acacgctaat ctggcactcg caaacaccac gctggttctt tgaagggccg 960 gacggacaac cggcgaatcg tgaattggcc ttggcgcgga tgcgcaagca tattgcaacc 1020 gtcgtcggcc actacaaagg gcgcgtcaag cagtgggacg tggtgaacga agccataaac 1080 gatggccccg gcgtgctgcg ccaaagcccg tggctgcgcg ctatcggcga agactacatc 1140 gctgaagcgt ttcgagccgc gcacgccgcc gaccctgacg caattctcat ctataacgat 1200 tacaacatcg aaatgggcta caaacggccc aaagcaatcc aactcttaaa atctctggtt 1260 gatcagaaag tgccgattca tgcggttggt attcagggcc actggcgtat ggacaccaac 1320 ctcaccgaag tggaacaagc tattaaagaa ttctcggcgc tgggcctgaa ggtgatgatc 1380 actgaactcg acatcggtgt tttgccgacg cgttatcagg gcgctgatat ttcgcaggtg 1440 caaaacatga cgcctgaaca gcgcgccgcc gtgaacccat ataccaatgg tttgcccgac 1500 gacgtagcgc aaaaacacgc cgataaatat cgccaggcct tcgatatttt cctgcgctac 1560 aaagatgtca tcgaacgcgt cacgttctgg ggtgtggacg atgctcattc gtggctgaac 1620 ggtttcccga ttcgcgggcg caccgattac ccattgcttt tcgaccggca gggcaaacct 1680 aaacccgcct ttttcgccgt gcaaaacctg gctttaggcg tgaccgccgc gccgcaatcg 1740 aatgcttcgt ctgcacccag agctgtcgct caagctgcgc cggcaaccag caatattcgt 1800 ggccaggaat ttccacgggt cgaaagcgat ttgcgtgtga cgtttcgcat caaagccccc 1860 gaagcgcaaa aagtgcagtt cgatttaggc aagccttacg acgcgacccg cgatgctgaa 1920 ggcaactgga cggcaaccac cgagccgcag gtgcccggct ttcactatta caatttggtg 1980 attgacggcg tgcgcgtgaa cgacccggcc agcgaaacct tttacggcgc gggccgccag 2040 atgagcggca tcgaaatccc cgaccctgac agcgcctttt attcgccgca aaacgtgccg 2100 cacggcgaag tgcgcgagcg ctggtatttt tccaacacca cgcaggcgtg gcgtcgcatt 2160 ttcatttata cgccgccggg ttatgacacg aatcaagtgg agcgttttcc cgttttgtat 2220 ttacagcatg gcggcggcga agatgagcgc ggctggcctc aacagggtcg catgagcttt 2280 atcatggata atctcatcgc cacacgtaaa gccaaaccga tgcttgtggt gatggaacaa 2340 ggctatgcgc gcaagcccaa cgagccgcag gtgccgttgc gcccgcccgg cggtagcgcc 2400 ggagccatgc cccccgattt caatcgcatg ttcggcacac tgggtgaagt gttcaccaaa 2460 gacctgattc cctttattga tgctaattac cgcaccaaaa ccgaccgcga aaaccgcgcc 2520 atggccggac tttcgatggg cgggatgcaa agtttcctta ttggcttgtc gaacaccgat 2580 ttattcgcgc acatcggagg cttcagcggc gcgggcggcg gtttcggtgg cggcaccttc 2640 gacgcaaaaa cggcgcacgg cggtgtaatg gccgacgccg acgcgttcaa caaaaaagtt 2700 cgcacgctgt ttctcagcat cggcacagcg gaaaacgaac gctttcagag cagcgtgcgc 2760 ggttaccgcg atgcgctgac caaagcgggc atcaaaacca cattctacga atcgcccggc 2820 acctcacatg aatggctgac atggcggcgt agcctgaaag aattcgcacc gctcttgttt 2880 caagaagtcg aagtgcaaat tgagcgcggc ccgaatgcgc gcccaattgc gccgcaaccg 2940 attaatctcg gccccgacga taaacccgca tttcccccgg tgcccgccgg tttcgatgtc 3000 cgccgcaacg atattccgca tggcgaaatc aaactcgtgg aatatccatc cgctacagtg 3060 ggcacaaatc gtaagatgca ggtttacacg ccgcccggtt acaatccgca agaaaagtat 3120 gcggtgcttt atctgttgca cggaatcggc ggcgacgagt gggaatggaa aaatggcggc 3180 acgccggaag tgattctcga taatctttac gccgcgaaaa aactccagcc gatgattgtg 3240 gtcatgccca atggccgcgc gcaaaaagat gaccgtccaa tcggcaatgt gttcgcatca 3300 gcgcctgctt ttgaaacctt cgagaaagat ttactcaacg acgtaattcc gtttatcgaa 3360 aagaattatc cagtcaaaac cggcgccgaa aatcgcgcgc ttgcgggcct ttcgatgggc 3420 ggtgggcaat cgctgaactt tggtctgggc aatctcgaca cctttgcgtg ggtcggcggc 3480 ttttcttcgg cgcccaacac gcgcactggc gcaaggctat tagccaatcc cgacgatgcc 3540 aaaaagaagc tgaaattgtt atgggtttcg tgtggcgata aagacggctt gtttttcatc 3600 agccagcgca cgcatcgcta tctcgccgaa aacaatgtgc cacacgtctg gcatgtgcag 3660 cccggcggcc acgatttccg agtgtggaag caagaccttt ataacttttc gcaactgctg 3720 ttccgctaa 3729 <210> 308 <211> 1242 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <400> 308 Met Lys Ser Ala Ile Gly Asp Ala Ala Phe Met Ala Ala Met Glu Arg 1 5 10 15 Asn Ser Asp Ile Val Thr Met Gln Cys Tyr Ala Pro Ile Phe Val Asn 20 25 30 Val Asn Pro Gly Gly Arg Gln Trp Arg Pro Asn Leu Met Gly Tyr Asp 35 40 45 Ala Leu Ser Ala Phe Gly Ser Pro Ser Tyr Tyr Ala Ile Lys Met Phe 50 55 60 Ser Asn Asn Leu Gly Asp Thr Ile Leu Lys Pro Ser Leu Ser Gly Ala 65 70 75 80 Arg Leu Pro Val Ser Val Thr Gln Glu Gln Lys Ser Gly Thr Ile Phe 85 90 95 Ile Lys Leu Val Asn Pro Gln Thr Thr Pro Gln Ser Val Lys Ile Asp 100 105 110 Leu Lys Gly Val Arg Ser Val Glu Phe Ser Gly Thr Ala Thr Val Leu 115 120 125 Ala Ala Asp Ser Gly Ala Leu Asn Ser Ile Asp Ala Pro Thr Lys Val 130 135 140 Val Pro Val Thr Arg Arg Ile Thr Gly Ile Ser Pro Ser Phe Ala Gln 145 150 155 160 Thr Leu Glu Pro Tyr Ser Ile Thr Val Leu Gln Ile Lys Ala Thr Ala 165 170 175 Leu Pro Thr Ala Thr Ala Asn Ala Val Ala Pro Pro Thr Phe Thr Thr 180 185 190 Glu Pro Lys Val Asn Thr Thr Thr Pro Val Thr Ile Pro Val Ala Thr 195 200 205 Ser Gln Pro Gln Pro Val Ser Gln Pro Ser Pro Asp Ala Asn Ala Ile 210 215 220 Ala Pro Leu Lys Asn Ala Phe Lys Gly Lys Phe Leu Ile Gly Thr Val 225 230 235 240 Leu Ser Gly Pro Asp Leu Arg Gly Gln Gln Thr Arg Ser Val Gly Ile 245 250 255 Ala Thr Thr His Phe Asp Ala Phe Thr Ala Glu Asn Glu Met Lys Pro 260 265 270 Asp Ala Met Gln Pro Arg Glu Gly Gln Phe Asn Phe Ala Ala Gly Asp 275 280 285 Arg Leu Val Glu Leu Ala Glu Lys Ser Gly Ala Thr Pro Ile Gly His 290 295 300 Thr Leu Ile Trp His Ser Gln Thr Pro Arg Trp Phe Phe Glu Gly Pro 305 310 315 320 Asp Gly Gln Pro Ala Asn Arg Glu Leu Ala Leu Ala Arg Met Arg Lys 325 330 335 His Ile Ala Thr Val Val Gly His Tyr Lys Gly Arg Val Lys Gln Trp 340 345 350 Asp Val Val Asn Glu Ala Ile Asn Asp Gly Pro Gly Val Leu Arg Gln 355 360 365 Ser Pro Trp Leu Arg Ala Ile Gly Glu Asp Tyr Ile Ala Glu Ala Phe 370 375 380 Arg Ala Ala His Ala Ala Asp Pro Asp Ala Ile Leu Ile Tyr Asn Asp 385 390 395 400 Tyr Asn Ile Glu Met Gly Tyr Lys Arg Pro Lys Ala Ile Gln Leu Leu 405 410 415 Lys Ser Leu Val Asp Gln Lys Val Pro Ile His Ala Val Gly Ile Gln 420 425 430 Gly His Trp Arg Met Asp Thr Asn Leu Thr Glu Val Glu Gln Ala Ile 435 440 445 Lys Glu Phe Ser Ala Leu Gly Leu Lys Val Met Ile Thr Glu Leu Asp 450 455 460 Ile Gly Val Leu Pro Thr Arg Tyr Gln Gly Ala Asp Ile Ser Gln Val 465 470 475 480 Gln Asn Met Thr Pro Glu Gln Arg Ala Ala Val Asn Pro Tyr Thr Asn 485 490 495 Gly Leu Pro Asp Asp Val Ala Gln Lys His Ala Asp Lys Tyr Arg Gln 500 505 510 Ala Phe Asp Ile Phe Leu Arg Tyr Lys Asp Val Ile Glu Arg Val Thr 515 520 525 Phe Trp Gly Val Asp Asp Ala His Ser Trp Leu Asn Gly Phe Pro Ile 530 535 540 Arg Gly Arg Thr Asp Tyr Pro Leu Leu Phe Asp Arg Gln Gly Lys Pro 545 550 555 560 Lys Pro Ala Phe Phe Ala Val Gln Asn Leu Ala Leu Gly Val Thr Ala 565 570 575 Ala Pro Gln Ser Asn Ala Ser Ser Ala Pro Arg Ala Val Ala Gln Ala 580 585 590 Ala Pro Ala Thr Ser Asn Ile Arg Gly Gln Glu Phe Pro Arg Val Glu 595 600 605 Ser Asp Leu Arg Val Thr Phe Arg Ile Lys Ala Pro Glu Ala Gln Lys 610 615 620 Val Gln Phe Asp Leu Gly Lys Pro Tyr Asp Ala Thr Arg Asp Ala Glu 625 630 635 640 Gly Asn Trp Thr Ala Thr Thr Glu Pro Gln Val Pro Gly Phe His Tyr 645 650 655 Tyr Asn Leu Val Ile Asp Gly Val Arg Val Asn Asp Pro Ala Ser Glu 660 665 670 Thr Phe Tyr Gly Ala Gly Arg Gln Met Ser Gly Ile Glu Ile Pro Asp 675 680 685 Pro Asp Ser Ala Phe Tyr Ser Pro Gln Asn Val Pro His Gly Glu Val 690 695 700 Arg Glu Arg Trp Tyr Phe Ser Asn Thr Thr Gln Ala Trp Arg Arg Ile 705 710 715 720 Phe Ile Tyr Thr Pro Pro Gly Tyr Asp Thr Asn Gln Val Glu Arg Phe 725 730 735 Pro Val Leu Tyr Leu Gln His Gly Gly Gly Glu Asp Glu Arg Gly Trp 740 745 750 Pro Gln Gln Gly Arg Met Ser Phe Ile Met Asp Asn Leu Ile Ala Thr 755 760 765 Arg Lys Ala Lys Pro Met Leu Val Val Met Glu Gln Gly Tyr Ala Arg 770 775 780 Lys Pro Asn Glu Pro Gln Val Pro Leu Arg Pro Pro Gly Gly Ser Ala 785 790 795 800 Gly Ala Met Pro Pro Asp Phe Asn Arg Met Phe Gly Thr Leu Gly Glu 805 810 815 Val Phe Thr Lys Asp Leu Ile Pro Phe Ile Asp Ala Asn Tyr Arg Thr 820 825 830 Lys Thr Asp Arg Glu Asn Arg Ala Met Ala Gly Leu Ser Met Gly Gly 835 840 845 Met Gln Ser Phe Leu Ile Gly Leu Ser Asn Thr Asp Leu Phe Ala His 850 855 860 Ile Gly Gly Phe Ser Gly Ala Gly Gly Gly Phe Gly Gly Gly Thr Phe 865 870 875 880 Asp Ala Lys Thr Ala His Gly Gly Val Met Ala Asp Ala Asp Ala Phe 885 890 895 Asn Lys Lys Val Arg Thr Leu Phe Leu Ser Ile Gly Thr Ala Glu Asn 900 905 910 Glu Arg Phe Gln Ser Ser Val Arg Gly Tyr Arg Asp Ala Leu Thr Lys 915 920 925 Ala Gly Ile Lys Thr Thr Phe Tyr Glu Ser Pro Gly Thr Ser His Glu 930 935 940 Trp Leu Thr Trp Arg Arg Ser Leu Lys Glu Phe Ala Pro Leu Leu Phe 945 950 955 960 Gln Glu Val Glu Val Gln Ile Glu Arg Gly Pro Asn Ala Arg Pro Ile 965 970 975 Ala Pro Gln Pro Ile Asn Leu Gly Pro Asp Asp Lys Pro Ala Phe Pro 980 985 990 Pro Val Pro Ala Gly Phe Asp Val Arg Arg Asn Asp Ile Pro His Gly 995 1000 1005 Glu Ile Lys Leu Val Glu Tyr Pro Ser Ala Thr Val Gly Thr Asn Arg 1010 1015 1020 Lys Met Gln Val Tyr Thr Pro Pro Gly Tyr Asn Pro Gln Glu Lys Tyr 1025 1030 1035 1040 Ala Val Leu Tyr Leu Leu His Gly Ile Gly Gly Asp Glu Trp Glu Trp 1045 1050 1055 Lys Asn Gly Gly Thr Pro Glu Val Ile Leu Asp Asn Leu Tyr Ala Ala 1060 1065 1070 Lys Lys Leu Gln Pro Met Ile Val Val Met Pro Asn Gly Arg Ala Gln 1075 1080 1085 Lys Asp Asp Arg Pro Ile Gly Asn Val Phe Ala Ser Ala Pro Ala Phe 1090 1095 1100 Glu Thr Phe Glu Lys Asp Leu Leu Asn Asp Val Ile Pro Phe Ile Glu 1105 1110 1115 1120 Lys Asn Tyr Pro Val Lys Thr Gly Ala Glu Asn Arg Ala Leu Ala Gly 1125 1130 1135 Leu Ser Met Gly Gly Gly Gln Ser Leu Asn Phe Gly Leu Gly Asn Leu 1140 1145 1150 Asp Thr Phe Ala Trp Val Gly Gly Phe Ser Ser Ala Pro Asn Thr Arg 1155 1160 1165 Thr Gly Ala Arg Leu Leu Ala Asn Pro Asp Asp Ala Lys Lys Lys Leu 1170 1175 1180 Lys Leu Leu Trp Val Ser Cys Gly Asp Lys Asp Gly Leu Phe Phe Ile 1185 1190 1195 1200 Ser Gln Arg Thr His Arg Tyr Leu Ala Glu Asn Asn Val Pro His Val 1205 1210 1215 Trp His Val Gln Pro Gly Gly His Asp Phe Arg Val Trp Lys Gln Asp 1220 1225 1230 Leu Tyr Asn Phe Ser Gln Leu Leu Phe Arg 1235 1240 <210> 309 <211> 1830 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 309 ttgaaaaaac tcacaatcgc cctatccctt gcaatcactt ttgccgcgcc agtttttgcg 60 acagatgctt gtttgcaaaa tactcaatta aatgctaccg cccaaggagc acaaacctgg 120 actggcaaaa aaggagctac aactttaggc ggttcaggtg acgatgctta tggagttgaa 180 acttggacag aagctggtgg agacgctact aaatttacat ggtttggacc aaatcagggt 240 ggtggtttcg cttatagagc ggaatggaca aattccacag attacttagg tcgctttggt 300 tatttttggg gtattgacgg gaaaaaatgg gacaaattag gagacctttg cgttgattat 360 aactataaaa gatctgccaa tggcactgga ggttcatatt cttatatagg cgtttatgga 420 tggacaaacg ctggcggtgg tactgaagct gaatattata tagttgaaga ttggtttgga 480 gaaaatcaac agactgcaaa taatttaggc aatggttgcc aagagcacgg tgaaattaca 540 gtggacgaga aaagctataa agttgtcact tgcataagac cagcaggctc tggctgcgta 600 acttgcaacg gacaacaatt cgggcaagtc tttagcatac gccaaggcat gagaagcgaa 660 caacctaaaa catgcggaac aatctccatc aaaaagcact ttgaagaatg ggtaaaaatg 720 acaaccgaaa aaagcggaca atccccagct aaatatattt acgataaaac ttatgaatcc 780 aaatttttag cggaggcaca aggcggcact ggttggcttg aaaccacttt ccttaaattt 840 tctagaaacg gtgattgcgg cttcgatatt cctgatggtc atttcaccct tcaattagct 900 acctctccgt ctgagggcgg tactgtaagc agaaacccaa aggaatcttc ttatgcctcc 960 ggttcaactg taactctcac agccactccg gcagcaggtt ggaaatttgc cagttggagt 1020 ggtgatgcat gtcaaaccac aagcccattg acagtcacta tggacaaaaa caaggtaatc 1080 acagcgaaat ttacccccgt tgtagatctc aataaaaacc ttgttacaaa tggtactttc 1140 acgaataaag agagttggac ttttaatact ggttccagtt atggcaactc cgaaggaact 1200 tttgatgtgt caaacagcga aggcagaata aatgtgacga aaattggctc caacccgtgg 1260 gaaccacagc tcgttcaaaa tggcatcacc cttgttgaag gaatgaatta caaaataact 1320 tttgaagctt ctgcctctgc tgctcgaaaa ataggcttgg ttatacaaat ggcaggcggc 1380 gattatacca cttattttga aaaagatata gacttgactg cctcaaatca acaattttcg 1440 tatgaattca aaatgaatgc accaagcgat gaaagcggtc gtattgggtt taatcttggg 1500 caaacgactg gaaacgtcac tctaagcaaa atcacccttc attatttaga agaagattca 1560 cacgaaccgt ccgacaatcc ctgcgaagac ccaagtccaa ttttgaaaaa acgcatccct 1620 gcaactcatt tctcccttca aacgcttagc gacaaagcct tgcgcataga agtgaacgct 1680 ccaaccattg tggacatttt tgacctgaga gggaataaag ttaagagttt gaatgtctcc 1740 ggctcgcaaa cggttaaatt atccctgcca agcggagtgt attttgccaa agcacgtgga 1800 atgaaaagcg tcagatttgt gttgaggtaa 1830 <210> 310 <211> 609 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(20) <400> 310 Met Lys Lys Leu Thr Ile Ala Leu Ser Leu Ala Ile Thr Phe Ala Ala 1 5 10 15 Pro Val Phe Ala Thr Asp Ala Cys Leu Gln Asn Thr Gln Leu Asn Ala 20 25 30 Thr Ala Gln Gly Ala Gln Thr Trp Thr Gly Lys Lys Gly Ala Thr Thr 35 40 45 Leu Gly Gly Ser Gly Asp Asp Ala Tyr Gly Val Glu Thr Trp Thr Glu 50 55 60 Ala Gly Gly Asp Ala Thr Lys Phe Thr Trp Phe Gly Pro Asn Gln Gly 65 70 75 80 Gly Gly Phe Ala Tyr Arg Ala Glu Trp Thr Asn Ser Thr Asp Tyr Leu 85 90 95 Gly Arg Phe Gly Tyr Phe Trp Gly Ile Asp Gly Lys Lys Trp Asp Lys 100 105 110 Leu Gly Asp Leu Cys Val Asp Tyr Asn Tyr Lys Arg Ser Ala Asn Gly 115 120 125 Thr Gly Gly Ser Tyr Ser Tyr Ile Gly Val Tyr Gly Trp Thr Asn Ala 130 135 140 Gly Gly Gly Thr Glu Ala Glu Tyr Tyr Ile Val Glu Asp Trp Phe Gly 145 150 155 160 Glu Asn Gln Gln Thr Ala Asn Asn Leu Gly Asn Gly Cys Gln Glu His 165 170 175 Gly Glu Ile Thr Val Asp Glu Lys Ser Tyr Lys Val Val Thr Cys Ile 180 185 190 Arg Pro Ala Gly Ser Gly Cys Val Thr Cys Asn Gly Gln Gln Phe Gly 195 200 205 Gln Val Phe Ser Ile Arg Gln Gly Met Arg Ser Glu Gln Pro Lys Thr 210 215 220 Cys Gly Thr Ile Ser Ile Lys Lys His Phe Glu Glu Trp Val Lys Met 225 230 235 240 Thr Thr Glu Lys Ser Gly Gln Ser Pro Ala Lys Tyr Ile Tyr Asp Lys 245 250 255 Thr Tyr Glu Ser Lys Phe Leu Ala Glu Ala Gln Gly Gly Thr Gly Trp 260 265 270 Leu Glu Thr Thr Phe Leu Lys Phe Ser Arg Asn Gly Asp Cys Gly Phe 275 280 285 Asp Ile Pro Asp Gly His Phe Thr Leu Gln Leu Ala Thr Ser Pro Ser 290 295 300 Glu Gly Gly Thr Val Ser Arg Asn Pro Lys Glu Ser Ser Tyr Ala Ser 305 310 315 320 Gly Ser Thr Val Thr Leu Thr Ala Thr Pro Ala Ala Gly Trp Lys Phe 325 330 335 Ala Ser Trp Ser Gly Asp Ala Cys Gln Thr Thr Ser Pro Leu Thr Val 340 345 350 Thr Met Asp Lys Asn Lys Val Ile Thr Ala Lys Phe Thr Pro Val Val 355 360 365 Asp Leu Asn Lys Asn Leu Val Thr Asn Gly Thr Phe Thr Asn Lys Glu 370 375 380 Ser Trp Thr Phe Asn Thr Gly Ser Ser Tyr Gly Asn Ser Glu Gly Thr 385 390 395 400 Phe Asp Val Ser Asn Ser Glu Gly Arg Ile Asn Val Thr Lys Ile Gly 405 410 415 Ser Asn Pro Trp Glu Pro Gln Leu Val Gln Asn Gly Ile Thr Leu Val 420 425 430 Glu Gly Met Asn Tyr Lys Ile Thr Phe Glu Ala Ser Ala Ser Ala Ala 435 440 445 Arg Lys Ile Gly Leu Val Ile Gln Met Ala Gly Gly Asp Tyr Thr Thr 450 455 460 Tyr Phe Glu Lys Asp Ile Asp Leu Thr Ala Ser Asn Gln Gln Phe Ser 465 470 475 480 Tyr Glu Phe Lys Met Asn Ala Pro Ser Asp Glu Ser Gly Arg Ile Gly 485 490 495 Phe Asn Leu Gly Gln Thr Thr Gly Asn Val Thr Leu Ser Lys Ile Thr 500 505 510 Leu His Tyr Leu Glu Glu Asp Ser His Glu Pro Ser Asp Asn Pro Cys 515 520 525 Glu Asp Pro Ser Pro Ile Leu Lys Lys Arg Ile Pro Ala Thr His Phe 530 535 540 Ser Leu Gln Thr Leu Ser Asp Lys Ala Leu Arg Ile Glu Val Asn Ala 545 550 555 560 Pro Thr Ile Val Asp Ile Phe Asp Leu Arg Gly Asn Lys Val Lys Ser 565 570 575 Leu Asn Val Ser Gly Ser Gln Thr Val Lys Leu Ser Leu Pro Ser Gly 580 585 590 Val Tyr Phe Ala Lys Ala Arg Gly Met Lys Ser Val Arg Phe Val Leu 595 600 605 Arg <210> 311 <211> 3972 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 311 atgcggaaaa gagtaatagc tttatttgta actctcatct ttgtcatgtc tattttaagt 60 ccaggatatc ttccatttct gagtactaaa gcaaatgctc aaacacaaaa tacaccaaca 120 attttaaaat ttgattttga aagcggtaat caaggctgga cggggagagg tctttcaaca 180 actgttgcaa ccgtttacaa tgttgcttat gaaggtgatt attcattaaa agtttctggc 240 agaaatgctt catgggatgg agctgttatt gatttaacag acaagctttc ggcaaatgtg 300 agttatacag tttctctgtt tgttcgtcac agtgaccaaa aacctcaaag attttcagta 360 tatgcatatg taaaagattc agcaagtgaa aaatatattc cagttgtaga taaagttgca 420 gttcctaatt attggaagca actggttggt aaattcacaa tcaacacttc aaatccagtc 480 caaaagattc agctgcttgt ctgtgttcct acaaataaat cattggaatt ttttatcgat 540 agcgtattaa ttgcaagtag tgcaggagca acatctggag ttgtaaaatc cacaaatttt 600 gaaagcggta caacagaagg ctggcaagca aggggaacag gttctgttgc tcagattagt 660 gttgtttcta cagtagctca ttcaggtagt aaaagtttgt atgtgacagg gcgagttcaa 720 acgtggcaag gtgcacaaat agatttgaca agtttgttag agaagggtaa agaatatcag 780 ttttctgtgt gggtatatca ggatagtgga agcgaccaaa agctgacact gaccatggaa 840 aggaaaaatg cagatggaag tacaaattat gatacaataa aatggcagca aacagtttca 900 agcaatacat gggtagagct aacaggttca tatacagtac ctgcaacagc aacacaacta 960 atattctaca ttgaatcacc caatgctacc ctaagctttt atattgatga ttttactgct 1020 gttgataaaa atgcaccagt tgtagcgcct ggaattataa aatcagccac atttgaaagc 1080 ggtacaacag aagactggca agcaagaggg acaggagtga ccgtttctgt tgttaacaca 1140 gtggcacata ctgggagcaa gagtttgtat gtgacaggga gaagtcaaaa ttggcatggt 1200 gcagaaattg atctgacaaa tgtgctagag aagggcaagg aatatcaatt ttctgtgtgg 1260 gtatatcagg atagtggaag cgatcagaag ctgacattga ccatgcaaag gaaaaatgca 1320 gataacacaa cagattatga ttctataaaa tatcagcaga cagtagcaac aaatacatgg 1380 gtagagctaa caggttcata tacagtgccg acaacagcca cccagttaat tttatatgtt 1440 gaagctgcag atactaccct aagcttttat attgatgatt ttactgctgt tgataaaaac 1500 ccagaggtaa taccaacagt atcgagagta ccagaatggg aaattccttc actctttgag 1560 cagtatacga attatttcag cattggtgtg gcaataccat ataaagtact tacaaatcca 1620 accgaaaagg caatggtact caaacatttc aacagtataa cagctgagaa tgaaatgaaa 1680 cctgatgcta ttcaaaagac agaagggaat tttacattta atgttgcaga ccaatacgta 1740 gattttgcac agcaaaatag aattggaatc agaggtcaca ctcttgtttg gcatcagcaa 1800 acaccaaatt ggttcttcca gcatagtgat ggtactccgc ttgatccaag caatcctgct 1860 gacaaacaac ttctacgcga tagattaaga acgcatatcc aaacacttgt tggaagatac 1920 gcagggaaaa tttatgcatg ggatgttgta aacgaggcaa ttgacgagaa ccagccagat 1980 ggatacagaa gaagtgaatg gtacagaata ttggggccaa ctgatacaac agatggcatt 2040 ccagaatata ttctgcttgc attccagtat gcaagagagg cagacccaaa tactaagctc 2100 ttttataacg actataatac agaaaatcca aagaaaagac agtttatata caatcttgtt 2160 aagaagctca aagaaagagg cttgattgat ggtgtaggtc tgcagtgcca tattaatgtc 2220 gattcaccta cagttaaaga gatagaggat acaattaaac tgtttagtac aatccctggc 2280 ttagacattc acattacaga gcttgacatt agcgtttata caagcagcag ccagagatat 2340 gatactcttc cacaggatat aatgataaaa caggctttga agttcaaaga gctttttgag 2400 atgctaaaaa gatatagcta tgttgtcaca aacgttactt tctggggact caaagatgac 2460 tattcatggc tttcaacaag cagatctaac tggccactac tgtttgacaa caactaccag 2520 gcaaaatttg catactgggc aattgttgaa ccgtcagtat tgccacttgc tataaacaaa 2580 ggatatgcaa acaatgcatc agcaaggata gatggagttt tagacagaga atacaaaggt 2640 gcgattccaa ttaagattac aaatgaaagt ggacaagaag ttgcaactgt tcgagctcta 2700 tggaattcaa gtgaactcag cctctatata tcggtcaatg atacaacaat agatgctgct 2760 aatgataaag tagttgtatt tgtagaccag gataatggaa aaatgccaga aattaaacct 2820 gatgactatt gggtttcaat tacgagaact ggtacaaaag cacaatcagc tcaaggctat 2880 gtaaaggatt atgctgtcgt gcagcaagca aatggatatg tggttgagtt gaagctttta 2940 attaataaca cgttaactgt taactcttct ataggttttg atatagcaat ctttgacaat 3000 ggagttcaat acagctggaa tgacaagaca aactcacagt ttatagaaac tgataactat 3060 ggtattttaa caatggcaga tagcgtcaag tttgcttctg ctccaaaagg tacagcaata 3120 attgatgcag aattagatga tacatggaaa aacgctcagg aaataacaac tgacacaaag 3180 gtcacggtta caggcacagt atacgactca gcttatgcaa aggctaagat gatgtgggat 3240 gaaaatagta tctatgtcta tgcaattgtt tatgacttgc ttttgaacaa ggctaataca 3300 aatccatggg agcaggattc aattgagata tttgtggatg aaaataatca caaaacgcct 3360 tactatgaaa atgatgatgt tcagtacaga gtgaactatg agaatactca aacatttggc 3420 acgaacggtg ctcctcagaa cttcattaca gcaacaaaga taattccaaa cggatatata 3480 gtggaagctc aagtttacat gaggacgaca aagctttctg aaggaatggt tataggcttt 3540 gacattcaag tgaatgatgc agaccataca ggtaaaagag tcggtgttct aacctggaat 3600 gataaggttg ggaacaatta tagagacaca acaaggttta gatgcttaga gcttgtagca 3660 gcacctgtaa gccagccacc aatacaagct ccatcaccat cacaaccaac aacaataacg 3720 tatatactaa caccgacacc aacacagcca tcaacccaaa cacagcagca acctgctcag 3780 caaccatcac agcagcaaca gcaaccgcaa cagcagcagc ctgcacagac acaacaacct 3840 cagacacagc ctgcacaaaa gcctcagaat gttgtttcga taaagataga ccagacaaaa 3900 gctgagacat ttactgttgg cgctgatacc aaggttgttg tacctcaagg ttctgtaact 3960 ggtgcaaact ga 3972 <210> 312 <211> 1323 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(33) <400> 312 Met Arg Lys Arg Val Ile Ala Leu Phe Val Thr Leu Ile Phe Val Met 1 5 10 15 Ser Ile Leu Ser Pro Gly Tyr Leu Pro Phe Leu Ser Thr Lys Ala Asn 20 25 30 Ala Gln Thr Gln Asn Thr Pro Thr Ile Leu Lys Phe Asp Phe Glu Ser 35 40 45 Gly Asn Gln Gly Trp Thr Gly Arg Gly Leu Ser Thr Thr Val Ala Thr 50 55 60 Val Tyr Asn Val Ala Tyr Glu Gly Asp Tyr Ser Leu Lys Val Ser Gly 65 70 75 80 Arg Asn Ala Ser Trp Asp Gly Ala Val Ile Asp Leu Thr Asp Lys Leu 85 90 95 Ser Ala Asn Val Ser Tyr Thr Val Ser Leu Phe Val Arg His Ser Asp 100 105 110 Gln Lys Pro Gln Arg Phe Ser Val Tyr Ala Tyr Val Lys Asp Ser Ala 115 120 125 Ser Glu Lys Tyr Ile Pro Val Val Asp Lys Val Ala Val Pro Asn Tyr 130 135 140 Trp Lys Gln Leu Val Gly Lys Phe Thr Ile Asn Thr Ser Asn Pro Val 145 150 155 160 Gln Lys Ile Gln Leu Leu Val Cys Val Pro Thr Asn Lys Ser Leu Glu 165 170 175 Phe Phe Ile Asp Ser Val Leu Ile Ala Ser Ser Ala Gly Ala Thr Ser 180 185 190 Gly Val Val Lys Ser Thr Asn Phe Glu Ser Gly Thr Thr Glu Gly Trp 195 200 205 Gln Ala Arg Gly Thr Gly Ser Val Ala Gln Ile Ser Val Val Ser Thr 210 215 220 Val Ala His Ser Gly Ser Lys Ser Leu Tyr Val Thr Gly Arg Val Gln 225 230 235 240 Thr Trp Gln Gly Ala Gln Ile Asp Leu Thr Ser Leu Leu Glu Lys Gly 245 250 255 Lys Glu Tyr Gln Phe Ser Val Trp Val Tyr Gln Asp Ser Gly Ser Asp 260 265 270 Gln Lys Leu Thr Leu Thr Met Glu Arg Lys Asn Ala Asp Gly Ser Thr 275 280 285 Asn Tyr Asp Thr Ile Lys Trp Gln Gln Thr Val Ser Ser Asn Thr Trp 290 295 300 Val Glu Leu Thr Gly Ser Tyr Thr Val Pro Ala Thr Ala Thr Gln Leu 305 310 315 320 Ile Phe Tyr Ile Glu Ser Pro Asn Ala Thr Leu Ser Phe Tyr Ile Asp 325 330 335 Asp Phe Thr Ala Val Asp Lys Asn Ala Pro Val Val Ala Pro Gly Ile 340 345 350 Ile Lys Ser Ala Thr Phe Glu Ser Gly Thr Thr Glu Asp Trp Gln Ala 355 360 365 Arg Gly Thr Gly Val Thr Val Ser Val Val Asn Thr Val Ala His Thr 370 375 380 Gly Ser Lys Ser Leu Tyr Val Thr Gly Arg Ser Gln Asn Trp His Gly 385 390 395 400 Ala Glu Ile Asp Leu Thr Asn Val Leu Glu Lys Gly Lys Glu Tyr Gln 405 410 415 Phe Ser Val Trp Val Tyr Gln Asp Ser Gly Ser Asp Gln Lys Leu Thr 420 425 430 Leu Thr Met Gln Arg Lys Asn Ala Asp Asn Thr Thr Asp Tyr Asp Ser 435 440 445 Ile Lys Tyr Gln Gln Thr Val Ala Thr Asn Thr Trp Val Glu Leu Thr 450 455 460 Gly Ser Tyr Thr Val Pro Thr Thr Ala Thr Gln Leu Ile Leu Tyr Val 465 470 475 480 Glu Ala Ala Asp Thr Thr Leu Ser Phe Tyr Ile Asp Asp Phe Thr Ala 485 490 495 Val Asp Lys Asn Pro Glu Val Ile Pro Thr Val Ser Arg Val Pro Glu 500 505 510 Trp Glu Ile Pro Ser Leu Phe Glu Gln Tyr Thr Asn Tyr Phe Ser Ile 515 520 525 Gly Val Ala Ile Pro Tyr Lys Val Leu Thr Asn Pro Thr Glu Lys Ala 530 535 540 Met Val Leu Lys His Phe Asn Ser Ile Thr Ala Glu Asn Glu Met Lys 545 550 555 560 Pro Asp Ala Ile Gln Lys Thr Glu Gly Asn Phe Thr Phe Asn Val Ala 565 570 575 Asp Gln Tyr Val Asp Phe Ala Gln Gln Asn Arg Ile Gly Ile Arg Gly 580 585 590 His Thr Leu Val Trp His Gln Gln Thr Pro Asn Trp Phe Phe Gln His 595 600 605 Ser Asp Gly Thr Pro Leu Asp Pro Ser Asn Pro Ala Asp Lys Gln Leu 610 615 620 Leu Arg Asp Arg Leu Arg Thr His Ile Gln Thr Leu Val Gly Arg Tyr 625 630 635 640 Ala Gly Lys Ile Tyr Ala Trp Asp Val Val Asn Glu Ala Ile Asp Glu 645 650 655 Asn Gln Pro Asp Gly Tyr Arg Arg Ser Glu Trp Tyr Arg Ile Leu Gly 660 665 670 Pro Thr Asp Thr Thr Asp Gly Ile Pro Glu Tyr Ile Leu Leu Ala Phe 675 680 685 Gln Tyr Ala Arg Glu Ala Asp Pro Asn Thr Lys Leu Phe Tyr Asn Asp 690 695 700 Tyr Asn Thr Glu Asn Pro Lys Lys Arg Gln Phe Ile Tyr Asn Leu Val 705 710 715 720 Lys Lys Leu Lys Glu Arg Gly Leu Ile Asp Gly Val Gly Leu Gln Cys 725 730 735 His Ile Asn Val Asp Ser Pro Thr Val Lys Glu Ile Glu Asp Thr Ile 740 745 750 Lys Leu Phe Ser Thr Ile Pro Gly Leu Asp Ile His Ile Thr Glu Leu 755 760 765 Asp Ile Ser Val Tyr Thr Ser Ser Ser Gln Arg Tyr Asp Thr Leu Pro 770 775 780 Gln Asp Ile Met Ile Lys Gln Ala Leu Lys Phe Lys Glu Leu Phe Glu 785 790 795 800 Met Leu Lys Arg Tyr Ser Tyr Val Val Thr Asn Val Thr Phe Trp Gly 805 810 815 Leu Lys Asp Asp Tyr Ser Trp Leu Ser Thr Ser Arg Ser Asn Trp Pro 820 825 830 Leu Leu Phe Asp Asn Asn Tyr Gln Ala Lys Phe Ala Tyr Trp Ala Ile 835 840 845 Val Glu Pro Ser Val Leu Pro Leu Ala Ile Asn Lys Gly Tyr Ala Asn 850 855 860 Asn Ala Ser Ala Arg Ile Asp Gly Val Leu Asp Arg Glu Tyr Lys Gly 865 870 875 880 Ala Ile Pro Ile Lys Ile Thr Asn Glu Ser Gly Gln Glu Val Ala Thr 885 890 895 Val Arg Ala Leu Trp Asn Ser Ser Glu Leu Ser Leu Tyr Ile Ser Val 900 905 910 Asn Asp Thr Thr Ile Asp Ala Ala Asn Asp Lys Val Val Val Phe Val 915 920 925 Asp Gln Asp Asn Gly Lys Met Pro Glu Ile Lys Pro Asp Asp Tyr Trp 930 935 940 Val Ser Ile Thr Arg Thr Gly Thr Lys Ala Gln Ser Ala Gln Gly Tyr 945 950 955 960 Val Lys Asp Tyr Ala Val Val Gln Gln Ala Asn Gly Tyr Val Val Glu 965 970 975 Leu Lys Leu Leu Ile Asn Asn Thr Leu Thr Val Asn Ser Ser Ile Gly 980 985 990 Phe Asp Ile Ala Ile Phe Asp Asn Gly Val Gln Tyr Ser Trp Asn Asp 995 1000 1005 Lys Thr Asn Ser Gln Phe Ile Glu Thr Asp Asn Tyr Gly Ile Leu Thr 1010 1015 1020 Met Ala Asp Ser Val Lys Phe Ala Ser Ala Pro Lys Gly Thr Ala Ile 1025 1030 1035 1040 Ile Asp Ala Glu Leu Asp Asp Thr Trp Lys Asn Ala Gln Glu Ile Thr 1045 1050 1055 Thr Asp Thr Lys Val Thr Val Thr Gly Thr Val Tyr Asp Ser Ala Tyr 1060 1065 1070 Ala Lys Ala Lys Met Met Trp Asp Glu Asn Ser Ile Tyr Val Tyr Ala 1075 1080 1085 Ile Val Tyr Asp Leu Leu Leu Asn Lys Ala Asn Thr Asn Pro Trp Glu 1090 1095 1100 Gln Asp Ser Ile Glu Ile Phe Val Asp Glu Asn Asn His Lys Thr Pro 1105 1110 1115 1120 Tyr Tyr Glu Asn Asp Asp Val Gln Tyr Arg Val Asn Tyr Glu Asn Thr 1125 1130 1135 Gln Thr Phe Gly Thr Asn Gly Ala Pro Gln Asn Phe Ile Thr Ala Thr 1140 1145 1150 Lys Ile Ile Pro Asn Gly Tyr Ile Val Glu Ala Gln Val Tyr Met Arg 1155 1160 1165 Thr Thr Lys Leu Ser Glu Gly Met Val Ile Gly Phe Asp Ile Gln Val 1170 1175 1180 Asn Asp Ala Asp His Thr Gly Lys Arg Val Gly Val Leu Thr Trp Asn 1185 1190 1195 1200 Asp Lys Val Gly Asn Asn Tyr Arg Asp Thr Thr Arg Phe Arg Cys Leu 1205 1210 1215 Glu Leu Val Ala Ala Pro Val Ser Gln Pro Pro Ile Gln Ala Pro Ser 1220 1225 1230 Pro Ser Gln Pro Thr Thr Ile Thr Tyr Ile Leu Thr Pro Thr Pro Thr 1235 1240 1245 Gln Pro Ser Thr Gln Thr Gln Gln Gln Pro Ala Gln Gln Pro Ser Gln 1250 1255 1260 Gln Gln Gln Gln Pro Gln Gln Gln Gln Pro Ala Gln Thr Gln Gln Pro 1265 1270 1275 1280 Gln Thr Gln Pro Ala Gln Lys Pro Gln Asn Val Val Ser Ile Lys Ile 1285 1290 1295 Asp Gln Thr Lys Ala Glu Thr Phe Thr Val Gly Ala Asp Thr Lys Val 1300 1305 1310 Val Val Pro Gln Gly Ser Val Thr Gly Ala Asn 1315 1320 <210> 313 <211> 1392 <212> DNA <213> Bacteria <400> 313 gtgaaacgtc tatccgcgct gaccgccgtc gtattgttag cgctaacaac tcacgtcgcc 60 gccgctgacc ccgcgccacc cgccaccggc cccgccatcg acttccgggc cgaactccag 120 cccatcgacg gattcggctt ctccatggcc ttccagcggg ccgacctgct gcacggcgcg 180 cgcggcctca gccccgccaa gcggcgcgag gtgctcgacc tgctgctcga caaggagagg 240 ggcgcgggcc tgtcgatcct gcgcctgggc atcgggtcgt cgaccgaccg ggtctacgac 300 cacatgccga cgatcctgcc gaccgatccc ggcgggccgg acgccccgcc gaagtacgtc 360 tgggacggct gggacggcgg ccaggtctgg ctcgccaagg aggccaaggc gtacggcgtc 420 aagcggttct tcgccgacgc ctggagcgcg ccggccttca tgaagaccaa cggcagcgag 480 aacgacggcg gcgagctccg gcccgaatgg cgccaggcct acgcgaacta cctcgtcaag 540 tacgcgaagt tctaccaacg ggaaggcatc ccgatcaccg acctggggtt caccaacgaa 600 cccgactggg cggcgaccta cgcctcgatg cgtttcaccc cgcagcaggc cgtcgacttc 660 ctcaaggtgc tcgggccgac cgtccgcgcg tccggactga agaccggcgt cgtctgctgc 720 gacgcggcgg gctgggaccg gcaggtcgcc tacaccgagg ccatcgaggc ggaccccgag 780 gccgccaagg ccgtgcggac cgtcaccggc caccgctaca gcggtccgac cacggtcccg 840 cagcccaccg acaagcgggt ctggatgtcg gagtggtcac cggacggcac cacctggaac 900 gagaactggg acgacggcag cggctacgac ggcctcaccg tcgccgccga catccagaac 960 accctcaccg tcggcaacgc caacgcctac gtctactgga ccggcgcgtc cctcggcgcc 1020 acccggggac tcatccagct cgccaacccc ggcgactcct accgggtgtc caagcggtac 1080 tgggcgctgg ccgccttcag ccgcttcatc cgccccgacg ccgtccgcgt accggtcacg 1140 aacgccgacc cggccctgag cgtcacggcc ttccgcaaca ccgacggcag ccgcgtgatc 1200 gagatcctca acacggcgac caccgagaag tccgcccagt tcgccctccg cggcggccac 1260 gaccggcacc ccgagggcta cgtcaccgac gagacccgct cgatcacccc ggcccacgtc 1320 gcctccgcgc gcggtacgac cctcaaggcc acgctcgccc cgcgcgcgct gaccacgatc 1380 gtcctcgact ga 1392 <210> 314 <211> 463 <212> PRT <213> Bacteria <220> <221> SIGNAL <222> (1)...(22) <400> 314 Met Lys Arg Leu Ser Ala Leu Thr Ala Val Val Leu Leu Ala Leu Thr 1 5 10 15 Thr His Val Ala Ala Ala Asp Pro Ala Pro Pro Ala Thr Gly Pro Ala 20 25 30 Ile Asp Phe Arg Ala Glu Leu Gln Pro Ile Asp Gly Phe Gly Phe Ser 35 40 45 Met Ala Phe Gln Arg Ala Asp Leu Leu His Gly Ala Arg Gly Leu Ser 50 55 60 Pro Ala Lys Arg Arg Glu Val Leu Asp Leu Leu Leu Asp Lys Glu Arg 65 70 75 80 Gly Ala Gly Leu Ser Ile Leu Arg Leu Gly Ile Gly Ser Ser Thr Asp 85 90 95 Arg Val Tyr Asp His Met Pro Thr Ile Leu Pro Thr Asp Pro Gly Gly 100 105 110 Pro Asp Ala Pro Pro Lys Tyr Val Trp Asp Gly Trp Asp Gly Gly Gln 115 120 125 Val Trp Leu Ala Lys Glu Ala Lys Ala Tyr Gly Val Lys Arg Phe Phe 130 135 140 Ala Asp Ala Trp Ser Ala Pro Ala Phe Met Lys Thr Asn Gly Ser Glu 145 150 155 160 Asn Asp Gly Gly Glu Leu Arg Pro Glu Trp Arg Gln Ala Tyr Ala Asn 165 170 175 Tyr Leu Val Lys Tyr Ala Lys Phe Tyr Gln Arg Glu Gly Ile Pro Ile 180 185 190 Thr Asp Leu Gly Phe Thr Asn Glu Pro Asp Trp Ala Ala Thr Tyr Ala 195 200 205 Ser Met Arg Phe Thr Pro Gln Gln Ala Val Asp Phe Leu Lys Val Leu 210 215 220 Gly Pro Thr Val Arg Ala Ser Gly Leu Lys Thr Gly Val Val Cys Cys 225 230 235 240 Asp Ala Ala Gly Trp Asp Arg Gln Val Ala Tyr Thr Glu Ala Ile Glu 245 250 255 Ala Asp Pro Glu Ala Ala Lys Ala Val Arg Thr Val Thr Gly His Arg 260 265 270 Tyr Ser Gly Pro Thr Thr Val Pro Gln Pro Thr Asp Lys Arg Val Trp 275 280 285 Met Ser Glu Trp Ser Pro Asp Gly Thr Thr Trp Asn Glu Asn Trp Asp 290 295 300 Asp Gly Ser Gly Tyr Asp Gly Leu Thr Val Ala Ala Asp Ile Gln Asn 305 310 315 320 Thr Leu Thr Val Gly Asn Ala Asn Ala Tyr Val Tyr Trp Thr Gly Ala 325 330 335 Ser Leu Gly Ala Thr Arg Gly Leu Ile Gln Leu Ala Asn Pro Gly Asp 340 345 350 Ser Tyr Arg Val Ser Lys Arg Tyr Trp Ala Leu Ala Ala Phe Ser Arg 355 360 365 Phe Ile Arg Pro Asp Ala Val Arg Val Pro Val Thr Asn Ala Asp Pro 370 375 380 Ala Leu Ser Val Thr Ala Phe Arg Asn Thr Asp Gly Ser Arg Val Ile 385 390 395 400 Glu Ile Leu Asn Thr Ala Thr Thr Glu Lys Ser Ala Gln Phe Ala Leu 405 410 415 Arg Gly Gly His Asp Arg His Pro Glu Gly Tyr Val Thr Asp Glu Thr 420 425 430 Arg Ser Ile Thr Pro Ala His Val Ala Ser Ala Arg Gly Thr Thr Leu 435 440 445 Lys Ala Thr Leu Ala Pro Arg Ala Leu Thr Thr Ile Val Leu Asp 450 455 460 <210> 315 <211> 1224 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 315 atgcggaacg tcgtgcgtaa accattgaca atcggactcg ctttaacact attattgccc 60 atgggaatga cggcaacatc agcgaagaat gcagattcct atgcgaaaaa acctcacatc 120 agcgcattga atgccccaca attggatcaa cgctacaaaa acgagttcac gattggtgcg 180 gcagtagaac cttatcaact acaaaatgaa aaagacgtac aaatgctaaa gcgccacttc 240 aacagcattg ttgccgagaa cgtaatgaaa ccgatcagca ttcaacctga ggaaggaaaa 300 ttcaattttg aacaagcgga tcgaattgtg aagttcgcta aggcaaatgg catggatatt 360 cgcttccata cactcgtttg gcacagccaa gtacctcaat ggttctttct tgacaaggaa 420 ggcaagccaa tggttaatga aacagatcca gtgaaacgtg aacaaaataa acaactgctg 480 ttaaaacgac ttgaaactca tattaaaacg atcgtcgagc ggtacaaaga tgacattaag 540 tactgggacg ttgtaaatga ggttgtgggg gacgacggaa aactgcgcaa ctctccatgg 600 tatcaaatcg ccggcatcga ttatattaaa gtggcattcc aaacagcgag aaaatatggc 660 ggcaacaaga ttaaacttta tatcaatgat tacaataccg aagtggaacc aaagcgaagc 720 gctctttata acttggtgaa gcaattaaaa gaagagggcg ttcctattga cggcatcggc 780 catcaatccc acattcaaat cggctggcct tctgaagcag aaatcgagaa aacgattaac 840 atgttcgccg ctctcggctt agacaaccaa atcactgagc ttgatgtgag catgtacggt 900 tggccgccgc gcgcttaccc gacgtatgac gccattccaa aacaaaagtt tttggatcag 960 gcagcgcgct atgatcgttt gttcaaactg tatgaaaagt tgagcgataa aattagcaac 1020 gtcaccttct ggggcatcgc cgacaatcat acgtggctcg acagccgtgc ggatgtgtac 1080 tatgacgcca acgggaatgt tgtggttgac ccgaacgctc cgtacgcaaa agtggaaaaa 1140 gggaaaggaa aagatgcgcc gttcgttttt ggaccggatt acaaagtcaa acccgcatat 1200 tgggctatta tcgaccacaa atag 1224 <210> 316 <211> 407 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(28) <400> 316 Met Arg Asn Val Val Arg Lys Pro Leu Thr Ile Gly Leu Ala Leu Thr 1 5 10 15 Leu Leu Leu Pro Met Gly Met Thr Ala Thr Ser Ala Lys Asn Ala Asp 20 25 30 Ser Tyr Ala Lys Lys Pro His Ile Ser Ala Leu Asn Ala Pro Gln Leu 35 40 45 Asp Gln Arg Tyr Lys Asn Glu Phe Thr Ile Gly Ala Ala Val Glu Pro 50 55 60 Tyr Gln Leu Gln Asn Glu Lys Asp Val Gln Met Leu Lys Arg His Phe 65 70 75 80 Asn Ser Ile Val Ala Glu Asn Val Met Lys Pro Ile Ser Ile Gln Pro 85 90 95 Glu Glu Gly Lys Phe Asn Phe Glu Gln Ala Asp Arg Ile Val Lys Phe 100 105 110 Ala Lys Ala Asn Gly Met Asp Ile Arg Phe His Thr Leu Val Trp His 115 120 125 Ser Gln Val Pro Gln Trp Phe Phe Leu Asp Lys Glu Gly Lys Pro Met 130 135 140 Val Asn Glu Thr Asp Pro Val Lys Arg Glu Gln Asn Lys Gln Leu Leu 145 150 155 160 Leu Lys Arg Leu Glu Thr His Ile Lys Thr Ile Val Glu Arg Tyr Lys 165 170 175 Asp Asp Ile Lys Tyr Trp Asp Val Val Asn Glu Val Val Gly Asp Asp 180 185 190 Gly Lys Leu Arg Asn Ser Pro Trp Tyr Gln Ile Ala Gly Ile Asp Tyr 195 200 205 Ile Lys Val Ala Phe Gln Thr Ala Arg Lys Tyr Gly Gly Asn Lys Ile 210 215 220 Lys Leu Tyr Ile Asn Asp Tyr Asn Thr Glu Val Glu Pro Lys Arg Ser 225 230 235 240 Ala Leu Tyr Asn Leu Val Lys Gln Leu Lys Glu Glu Gly Val Pro Ile 245 250 255 Asp Gly Ile Gly His Gln Ser His Ile Gln Ile Gly Trp Pro Ser Glu 260 265 270 Ala Glu Ile Glu Lys Thr Ile Asn Met Phe Ala Ala Leu Gly Leu Asp 275 280 285 Asn Gln Ile Thr Glu Leu Asp Val Ser Met Tyr Gly Trp Pro Pro Arg 290 295 300 Ala Tyr Pro Thr Tyr Asp Ala Ile Pro Lys Gln Lys Phe Leu Asp Gln 305 310 315 320 Ala Ala Arg Tyr Asp Arg Leu Phe Lys Leu Tyr Glu Lys Leu Ser Asp 325 330 335 Lys Ile Ser Asn Val Thr Phe Trp Gly Ile Ala Asp Asn His Thr Trp 340 345 350 Leu Asp Ser Arg Ala Asp Val Tyr Tyr Asp Ala Asn Gly Asn Val Val 355 360 365 Val Asp Pro Asn Ala Pro Tyr Ala Lys Val Glu Lys Gly Lys Gly Lys 370 375 380 Asp Ala Pro Phe Val Phe Gly Pro Asp Tyr Lys Val Lys Pro Ala Tyr 385 390 395 400 Trp Ala Ile Ile Asp His Lys 405 <210> 317 <211> 1695 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 317 gtggctggaa gctcgctcac gagcaacggc ctctcggcca ttctctcgct ccagtcggac 60 tggggcagcg gttactgcgc gacggtagaa cttcagaacg tcggcggaac tccgatcacg 120 gcgtgggagg tccaggtgga gctcgctggg acgaccgtga acagcagcca cagcgcggcg 180 ttctcctcga caggcacccg cctggtcgcc aagcccttgt cctggaacgc gacgctggca 240 cccgccgcca agacgacctt cggcttctgc gcggccgctc cgagcgcagc ggcgcgcccg 300 tccgtggtgc aagtgacagc gaacggctcc gccaccggaa cgggcggaac gagcggcggc 360 ggcacgggcg gctcgaccgc tacgggcggc tcgaccgcta cgggcggctc cggtgggtcg 420 accgcgggag tgtgcgcggc aacctacgag gccgagagca tgctccacag caccggcaac 480 gccatcagcg gcggctggaa catctattcg aacggcaaca tcaccgccac gcactccttc 540 gcagccggct cgaatcgact caccgtgcac gccaagggcg accaggccaa cggggcgccc 600 atcatgcgcg tcagcgtggg caacaccgtc gtcggcgagg tgccagtgcc ggtgaccgtg 660 tggacaccgt actgcttcga ctacgccgcg gcgagcgcag gcgcgcagac cgtcaagatc 720 gagttcacga acgactacaa tggcggcacc ggcgccgacc gcaatctgca cgtggacaag 780 gtcgcggtgc agtgcggcgc gagctgcaac agcgggagcg gagggggcac cggcggctcg 840 agcggaagcg gcggcacctc ggccaccggc ggctccgcca gcggtggcgc ggcagggacg 900 acctgcacga acgttcgtcc cactggaacc gactgggacg cggcgacctg cgacatgtgg 960 gcctcgcaaa ctagcgagtg cagcgcggcc tggatgatcg acaaccatta ctgcgaccag 1020 agctgcgggc gctgctcggg cgggagcggg accggtggca cgaacacggg aggcaccggc 1080 ggtggagtga ccccgagtac ctgcacggag cccaattctc agcagtgctc cacctacaag 1140 gtcgggactc actgcggcct cacctacgag atctggaccg acggctccgc gggctgcatg 1200 acgaacacct cctacgggtt cctcgccaat tggagccagg ggaacgcaaa ctacctggct 1260 cgcaagggcg ttcggcccgg ctcgtcgcga ccggtcgtga cgtacagcgc gaactaccag 1320 ccgaacggga attcctacct ggggatctac ggttggacgc agaacccgct cgtcgagtac 1380 tacatcatcg atagctgggg gagctggcgt ccaccgggga cccaggcgat gggcaccgtc 1440 caggtggacg gcgggaccta cgatatctac cggagcgagc gggtgaacaa gccctcgatc 1500 gagggcaaca agaccttctg gcagtactgg agcgtccgca cccagaagcg caccagtggg 1560 accatcaccg tggctccgca cttcgccgcg tgggcggcat ccggactgca gatgggctcc 1620 ttctacgagg tctccctggt ggtggagggc tacaacagct ccggcagcgc cgacgtaacg 1680 gtgtcgttcc ggtag 1695 <210> 318 <211> 564 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <400> 318 Met Ala Gly Ser Ser Leu Thr Ser Asn Gly Leu Ser Ala Ile Leu Ser 1 5 10 15 Leu Gln Ser Asp Trp Gly Ser Gly Tyr Cys Ala Thr Val Glu Leu Gln 20 25 30 Asn Val Gly Gly Thr Pro Ile Thr Ala Trp Glu Val Gln Val Glu Leu 35 40 45 Ala Gly Thr Thr Val Asn Ser Ser His Ser Ala Ala Phe Ser Ser Thr 50 55 60 Gly Thr Arg Leu Val Ala Lys Pro Leu Ser Trp Asn Ala Thr Leu Ala 65 70 75 80 Pro Ala Ala Lys Thr Thr Phe Gly Phe Cys Ala Ala Ala Pro Ser Ala 85 90 95 Ala Ala Arg Pro Ser Val Val Gln Val Thr Ala Asn Gly Ser Ala Thr 100 105 110 Gly Thr Gly Gly Thr Ser Gly Gly Gly Thr Gly Gly Ser Thr Ala Thr 115 120 125 Gly Gly Ser Thr Ala Thr Gly Gly Ser Gly Gly Ser Thr Ala Gly Val 130 135 140 Cys Ala Ala Thr Tyr Glu Ala Glu Ser Met Leu His Ser Thr Gly Asn 145 150 155 160 Ala Ile Ser Gly Gly Trp Asn Ile Tyr Ser Asn Gly Asn Ile Thr Ala 165 170 175 Thr His Ser Phe Ala Ala Gly Ser Asn Arg Leu Thr Val His Ala Lys 180 185 190 Gly Asp Gln Ala Asn Gly Ala Pro Ile Met Arg Val Ser Val Gly Asn 195 200 205 Thr Val Val Gly Glu Val Pro Val Pro Val Thr Val Trp Thr Pro Tyr 210 215 220 Cys Phe Asp Tyr Ala Ala Ala Ser Ala Gly Ala Gln Thr Val Lys Ile 225 230 235 240 Glu Phe Thr Asn Asp Tyr Asn Gly Gly Thr Gly Ala Asp Arg Asn Leu 245 250 255 His Val Asp Lys Val Ala Val Gln Cys Gly Ala Ser Cys Asn Ser Gly 260 265 270 Ser Gly Gly Gly Thr Gly Gly Ser Ser Gly Ser Gly Gly Thr Ser Ala 275 280 285 Thr Gly Gly Ser Ala Ser Gly Gly Ala Ala Gly Thr Thr Cys Thr Asn 290 295 300 Val Arg Pro Thr Gly Thr Asp Trp Asp Ala Ala Thr Cys Asp Met Trp 305 310 315 320 Ala Ser Gln Thr Ser Glu Cys Ser Ala Ala Trp Met Ile Asp Asn His 325 330 335 Tyr Cys Asp Gln Ser Cys Gly Arg Cys Ser Gly Gly Ser Gly Thr Gly 340 345 350 Gly Thr Asn Thr Gly Gly Thr Gly Gly Gly Val Thr Pro Ser Thr Cys 355 360 365 Thr Glu Pro Asn Ser Gln Gln Cys Ser Thr Tyr Lys Val Gly Thr His 370 375 380 Cys Gly Leu Thr Tyr Glu Ile Trp Thr Asp Gly Ser Ala Gly Cys Met 385 390 395 400 Thr Asn Thr Ser Tyr Gly Phe Leu Ala Asn Trp Ser Gln Gly Asn Ala 405 410 415 Asn Tyr Leu Ala Arg Lys Gly Val Arg Pro Gly Ser Ser Arg Pro Val 420 425 430 Val Thr Tyr Ser Ala Asn Tyr Gln Pro Asn Gly Asn Ser Tyr Leu Gly 435 440 445 Ile Tyr Gly Trp Thr Gln Asn Pro Leu Val Glu Tyr Tyr Ile Ile Asp 450 455 460 Ser Trp Gly Ser Trp Arg Pro Pro Gly Thr Gln Ala Met Gly Thr Val 465 470 475 480 Gln Val Asp Gly Gly Thr Tyr Asp Ile Tyr Arg Ser Glu Arg Val Asn 485 490 495 Lys Pro Ser Ile Glu Gly Asn Lys Thr Phe Trp Gln Tyr Trp Ser Val 500 505 510 Arg Thr Gln Lys Arg Thr Ser Gly Thr Ile Thr Val Ala Pro His Phe 515 520 525 Ala Ala Trp Ala Ala Ser Gly Leu Gln Met Gly Ser Phe Tyr Glu Val 530 535 540 Ser Leu Val Val Glu Gly Tyr Asn Ser Ser Gly Ser Ala Asp Val Thr 545 550 555 560 Val Ser Phe Arg <210> 319 <211> 1095 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 319 atgaaggtga cccgaacagc tgtcgcgggc attgtcgccg cagcggtcct catcacgatc 60 ggcacgtcga ccgcgtcggc tgaggatgaa ccaaccagcg agaacacgtc gacggatcag 120 ccgttgcgcg tcctggcagc caaagccggg atcgcgttcg gcacggccgt cgacatgaac 180 gcgtacaaca acgacgcgac ctaccgtgag ctcgtcggcc aggagttctc gagcgtcacg 240 gccgagaacg tcatgaagtg gcagctcctc gagccgcagc gaggggtcta caactggggt 300 ccggccgatc agctcgtgcg cgtagccaac gagaacggcc agaaggtgcg cgggcacacg 360 ctcatctggc acaaccagct gcccacctgg cttaccagcg gagtcgcctc cggtgagatc 420 acaccggacg agctccggca gctcctgagg aaccacatct tcacggtgat gcgccacttc 480 aagggcgaga tccaccagtg ggatgtcgcc aacgaggtca tcgacgacag cggcaacctg 540 cgcaacacga tctggctgca gaacctgggt ccgagctaca tcgcggacgc gttccggtgg 600 gctcgcaagg ccgacccgga cgccgccctc tatctgaacg actacaacgt cgagggcccg 660 aacgccaagg ccgatgcgta ctacgccctg gtcaagcagc tcctcgccga cgacgtgccg 720 gtggacggct tcggaataca ggggcacctc ggtgtgcagt tcggcttctg gcccgcgagt 780 gcggtggccg acaacatggg gcgcttcgag gcactcggcc tgcagacggc ggtcaccgag 840 gcggatgtcc ggatgatcat gccgcccgac gaggacaagc tggccgcaca ggcacgtggc 900 tacagcacgt tggtccaggg ctgcctgatg gccaagcgtt gcaggtcgtt caccgtctgg 960 ggcttcaccg acaagtactc ctgggttccg ggcaccttcc ccggccaggg cgcggcgaac 1020 ctcctggccg aggacttcca gcccaagccg gcttactacg ccgtccagga tgacctcgcg 1080 cgcgccggac ggtag 1095 <210> 320 <211> 364 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(27) <400> 320 Met Lys Val Thr Arg Thr Ala Val Ala Gly Ile Val Ala Ala Ala Val 1 5 10 15 Leu Ile Thr Ile Gly Thr Ser Thr Ala Ser Ala Glu Asp Glu Pro Thr 20 25 30 Ser Glu Asn Thr Ser Thr Asp Gln Pro Leu Arg Val Leu Ala Ala Lys 35 40 45 Ala Gly Ile Ala Phe Gly Thr Ala Val Asp Met Asn Ala Tyr Asn Asn 50 55 60 Asp Ala Thr Tyr Arg Glu Leu Val Gly Gln Glu Phe Ser Ser Val Thr 65 70 75 80 Ala Glu Asn Val Met Lys Trp Gln Leu Leu Glu Pro Gln Arg Gly Val 85 90 95 Tyr Asn Trp Gly Pro Ala Asp Gln Leu Val Arg Val Ala Asn Glu Asn 100 105 110 Gly Gln Lys Val Arg Gly His Thr Leu Ile Trp His Asn Gln Leu Pro 115 120 125 Thr Trp Leu Thr Ser Gly Val Ala Ser Gly Glu Ile Thr Pro Asp Glu 130 135 140 Leu Arg Gln Leu Leu Arg Asn His Ile Phe Thr Val Met Arg His Phe 145 150 155 160 Lys Gly Glu Ile His Gln Trp Asp Val Ala Asn Glu Val Ile Asp Asp 165 170 175 Ser Gly Asn Leu Arg Asn Thr Ile Trp Leu Gln Asn Leu Gly Pro Ser 180 185 190 Tyr Ile Ala Asp Ala Phe Arg Trp Ala Arg Lys Ala Asp Pro Asp Ala 195 200 205 Ala Leu Tyr Leu Asn Asp Tyr Asn Val Glu Gly Pro Asn Ala Lys Ala 210 215 220 Asp Ala Tyr Tyr Ala Leu Val Lys Gln Leu Leu Ala Asp Asp Val Pro 225 230 235 240 Val Asp Gly Phe Gly Ile Gln Gly His Leu Gly Val Gln Phe Gly Phe 245 250 255 Trp Pro Ala Ser Ala Val Ala Asp Asn Met Gly Arg Phe Glu Ala Leu 260 265 270 Gly Leu Gln Thr Ala Val Thr Glu Ala Asp Val Arg Met Ile Met Pro 275 280 285 Pro Asp Glu Asp Lys Leu Ala Ala Gln Ala Arg Gly Tyr Ser Thr Leu 290 295 300 Val Gln Gly Cys Leu Met Ala Lys Arg Cys Arg Ser Phe Thr Val Trp 305 310 315 320 Gly Phe Thr Asp Lys Tyr Ser Trp Val Pro Gly Thr Phe Pro Gly Gln 325 330 335 Gly Ala Ala Asn Leu Leu Ala Glu Asp Phe Gln Pro Lys Pro Ala Tyr 340 345 350 Tyr Ala Val Gln Asp Asp Leu Ala Arg Ala Gly Arg 355 360 <210> 321 <211> 1608 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 321 gtggactggt gggacgtgga tattttttcc gcgaaggaaa tcacccaccc gcaactggca 60 accttcctgg atgcctcacg agaccatcgc aagccggtca tgatcggcga gatgacccca 120 cgccacgtcg gcgtgatcga ggggcagaaa tgctgggatg aatggtttgg cccgatgatt 180 gatctgctca aacgtcgccc cgaaatcaag gccacggcct atatcaactg ggaatggcgc 240 gagtggtccg accgcctcgg cttccgctgg cacaactggg gcgacgcccg catcgagggc 300 aacgcccttg ttcgtgatcg ctgggtgcag gaactctccc accccatcta tctccacgcg 360 gcgcgcgacg gatcttgtcc gctgccgcca atcaccgccc tcccatccgc gaccccgtcg 420 ctccagaccg tgttccagga ccatttcctg atgggtgctg ccttgaatgt gaggcagttc 480 accgaaaacg acgcaaccaa gaccgctctc atcaagaagc aattcaacac catcacgccc 540 gagaatgttc tcaagtgggg gccggttcat cctgagccca accggttcaa cttcgaatcc 600 accgatcgtt acgtggactt tggtgtgaag aaccggatgt tcatcgtcgg ccacaccctc 660 gtctggcacc accagacacc cgcctgggtg tttcaagatt cccaaggcca gccgctcgac 720 cgggatggac tgctcaatcg cttgagcaac cacatccaca cggtggttgg acgctacaag 780 ggccgcatcc acgggtggga tatggtgaac gaggccttga acgatgacgg caccctccgc 840 cctagccaat ggcttaaaat catcggcccc gactacattg ccaaagcgtt tgcccttgcc 900 cacgccgccg accctgccgc tgaactgtat tacaacgatt acagtctcga tcatcccgcc 960 aagtgtgctg gtgcgatcgc gctggtgaag cagctccaga cgaatggcat atccattgcc 1020 gggattggca cgcagaccca cgtcggactc aacggacctt ccccccagtc ggtggatgat 1080 tcattgacgg cctttggcca gctcggcgtg aaggtcatgg ttaccgaact cgacgttgat 1140 gtgctgcccg ccgccagcca aaatcaaaac gcggatctca accagcccgc cttgtccaat 1200 cccgccctca atcccgccct caatccctat cccgatgggc tgccgcaagc cgtccaggac 1260 aaactggccg ctcgctatgc ggaactcttc gccgtgttcg tcaagcacgc cgacaaaatc 1320 agccgcgtca cgttctggtg cgtcaccgac ggcgactcct ggctgaacaa ctggcccgtg 1380 cgtggccgcg tcaactatcc gctgctgttc gaccgtgcca gccagcccaa gcccgccttc 1440 gatgcggtca ttcgcgtcgc caaggacccg ccgacggttt cgcacaatct caccccgctc 1500 cacgatgcgg cgcgggtcct ggtcaatccg cacaagggct ggtaccacca ctacccggac 1560 aatcacatca acaagtatga gatcgcccgc gatgccgacc tgacggaa 1608 <210> 322 <211> 536 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <400> 322 Met Asp Trp Trp Asp Val Asp Ile Phe Ser Ala Lys Glu Ile Thr His 1 5 10 15 Pro Gln Leu Ala Thr Phe Leu Asp Ala Ser Arg Asp His Arg Lys Pro 20 25 30 Val Met Ile Gly Glu Met Thr Pro Arg His Val Gly Val Ile Glu Gly 35 40 45 Gln Lys Cys Trp Asp Glu Trp Phe Gly Pro Met Ile Asp Leu Leu Lys 50 55 60 Arg Arg Pro Glu Ile Lys Ala Thr Ala Tyr Ile Asn Trp Glu Trp Arg 65 70 75 80 Glu Trp Ser Asp Arg Leu Gly Phe Arg Trp His Asn Trp Gly Asp Ala 85 90 95 Arg Ile Glu Gly Asn Ala Leu Val Arg Asp Arg Trp Val Gln Glu Leu 100 105 110 Ser His Pro Ile Tyr Leu His Ala Ala Arg Asp Gly Ser Cys Pro Leu 115 120 125 Pro Pro Ile Thr Ala Leu Pro Ser Ala Thr Pro Ser Leu Gln Thr Val 130 135 140 Phe Gln Asp His Phe Leu Met Gly Ala Ala Leu Asn Val Arg Gln Phe 145 150 155 160 Thr Glu Asn Asp Ala Thr Lys Thr Ala Leu Ile Lys Lys Gln Phe Asn 165 170 175 Thr Ile Thr Pro Glu Asn Val Leu Lys Trp Gly Pro Val His Pro Glu 180 185 190 Pro Asn Arg Phe Asn Phe Glu Ser Thr Asp Arg Tyr Val Asp Phe Gly 195 200 205 Val Lys Asn Arg Met Phe Ile Val Gly His Thr Leu Val Trp His His 210 215 220 Gln Thr Pro Ala Trp Val Phe Gln Asp Ser Gln Gly Gln Pro Leu Asp 225 230 235 240 Arg Asp Gly Leu Leu Asn Arg Leu Ser Asn His Ile His Thr Val Val 245 250 255 Gly Arg Tyr Lys Gly Arg Ile His Gly Trp Asp Met Val Asn Glu Ala 260 265 270 Leu Asn Asp Asp Gly Thr Leu Arg Pro Ser Gln Trp Leu Lys Ile Ile 275 280 285 Gly Pro Asp Tyr Ile Ala Lys Ala Phe Ala Leu Ala His Ala Ala Asp 290 295 300 Pro Ala Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Leu Asp His Pro Ala 305 310 315 320 Lys Cys Ala Gly Ala Ile Ala Leu Val Lys Gln Leu Gln Thr Asn Gly 325 330 335 Ile Ser Ile Ala Gly Ile Gly Thr Gln Thr His Val Gly Leu Asn Gly 340 345 350 Pro Ser Pro Gln Ser Val Asp Asp Ser Leu Thr Ala Phe Gly Gln Leu 355 360 365 Gly Val Lys Val Met Val Thr Glu Leu Asp Val Asp Val Leu Pro Ala 370 375 380 Ala Ser Gln Asn Gln Asn Ala Asp Leu Asn Gln Pro Ala Leu Ser Asn 385 390 395 400 Pro Ala Leu Asn Pro Ala Leu Asn Pro Tyr Pro Asp Gly Leu Pro Gln 405 410 415 Ala Val Gln Asp Lys Leu Ala Ala Arg Tyr Ala Glu Leu Phe Ala Val 420 425 430 Phe Val Lys His Ala Asp Lys Ile Ser Arg Val Thr Phe Trp Cys Val 435 440 445 Thr Asp Gly Asp Ser Trp Leu Asn Asn Trp Pro Val Arg Gly Arg Val 450 455 460 Asn Tyr Pro Leu Leu Phe Asp Arg Ala Ser Gln Pro Lys Pro Ala Phe 465 470 475 480 Asp Ala Val Ile Arg Val Ala Lys Asp Pro Pro Thr Val Ser His Asn 485 490 495 Leu Thr Pro Leu His Asp Ala Ala Arg Val Leu Val Asn Pro His Lys 500 505 510 Gly Trp Tyr His His Tyr Pro Asp Asn His Ile Asn Lys Tyr Glu Ile 515 520 525 Ala Arg Asp Ala Asp Leu Thr Glu 530 535 <210> 323 <211> 2355 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 323 atgatgctca atgcccgttg tatccaactt atgaagttgt tgcttcgctc ttctctttat 60 cttaccgctg acaaattggc gcaatcattg aatgtatcca agcgaacgat ttattacgat 120 atacaaaaaa cgaatgaatg gttgcatcat gaagggctga agccgattca atatgcgcgc 180 gggctcggat ttcgcttgga tgatgaagtg aaacaagaaa taacaacaaa gtggaacaca 240 ttacaacctg cccgacatta cacatatcag tcatgggagc gaaaagcttg gattggttta 300 tggattttga ctcgcgttca tccactgtat ttgtctgatt ttttagagaa attacatgta 360 agcaggagca cgttgttaaa tgacataaag gaactgaaag aagattggca gtcatttcag 420 ttgcgattgt cattccatcg caaaaaaggg tatttttcat caggggaaga aatccaaaaa 480 aggaaattga tgattcgtta tattcatcaa atattagcgg cgatggatga ccagcatttc 540 gctgcagaat tgtcagctga gtgtcaatgg ccaatctttg attggatttg ccaattcgag 600 tctacttttt ctattcgcta taccggtgag gttattcaaa ctttacctat ttacctcgca 660 ttgttccaaa gacggtgggc tagaggcaaa tttgtgcaaa tggacgagca agaaaaagaa 720 gtgctaaggt caatgcggga ataccagatt gctgatcatc tcgttagacg aattgaaaac 780 gtttccgaaa tatctattcc cgatgacgag gtttgttatt tgacgaccca tttactcagt 840 tttcgagttg cagatgacaa gcaaatcgat cataacgatg acatcactac tttgaaacga 900 atcattcgac atatggtgga tgattttcaa acttatgcct gtgtacaatt caagcgtcgc 960 gaagagttgg aaaaaaattt attggttcat atgaagcctg cctattatcg actgaaatac 1020 ggttttcatc tgcaaaacga tctgaccgaa tcggtcaaag cgaactatca agatttattt 1080 accttaacga aaaaagtcgt ccatcattta gaaagtgtag ttggccagcc ggtcagcgac 1140 gatgaaattg cttatatcgc catgcatttt ggcggatggt tggacagaga gggggtgtcg 1200 gttccagtac ggaaaaaggt gttgatcgtc tgcgagagcg ggattggaac atcgcgaatg 1260 ttgcaaaaac aattggatca acgctacaaa aacgagttca cgattggtgc ggcagtagaa 1320 ccttatcaac tacaaaatga aaaagacgta caaatgctaa agcgccactt caacagcatt 1380 gttgccgaga acgtaatgaa accgatcagc attcaacctg aggaaggaaa attcaatttt 1440 gaacaagcgg atcgaattgt gaagttcgct aaggcaaatg gcatggatat tcgcttccat 1500 acactcgttt ggcacagcca agtacctcaa tggttctttc ttgacaagga aggcaagcca 1560 atggttaatg aaacagatcc agtgaaacgt gaacaaaata aacaactgct gttaaaacga 1620 cttgaaactc atattaaaac gatcgtcgag cggtacaaag atgacattaa gtactgggac 1680 gttgtaaatg aggttgtggg ggacgacgga aaactgcgca actctccatg gtatcaaatc 1740 gccggcatcg attatattaa agtggcattc caaacagcga gaaaatatgg cggcaacaag 1800 attaaacttt atatcaatga ttacaatacc gaagtggaac caaagcgaag cgctctttat 1860 aacttggtga agcaattaaa agaagagggc gttcctattg acggcatcgg ccatcaatcc 1920 cacattcaaa tcggctggcc ttctgaagca gaaatcgaga aaacgattaa catgttcgcc 1980 gctctcggct tagacaacca aatcactgag cttgatgtga gcatgtacgg ttggccgccg 2040 cgcgcttacc cgacgtatga cgccattcca aaacaaaagt ttttggatca ggcagcgcgc 2100 tatgatcgtt tgttcaaact gtatgaaaag ttgagcgata aaattagcaa cgtcaccttc 2160 tggggcatcg ccgacaatca tacgtggctc gacagccgtg cggatgtgta ctatgacgcc 2220 aacgggaatg ttgtggttga cccgaacgct ccgtacgcaa aagtggaaaa agggaaagga 2280 aaagatgcgc cgttcgtttt tggaccggat tacaaagtca aacccgcata ttgggctatt 2340 atcgaccaca aatag 2355 <210> 324 <211> 784 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <400> 324 Met Met Leu Asn Ala Arg Cys Ile Gln Leu Met Lys Leu Leu Leu Arg 1 5 10 15 Ser Ser Leu Tyr Leu Thr Ala Asp Lys Leu Ala Gln Ser Leu Asn Val 20 25 30 Ser Lys Arg Thr Ile Tyr Tyr Asp Ile Gln Lys Thr Asn Glu Trp Leu 35 40 45 His His Glu Gly Leu Lys Pro Ile Gln Tyr Ala Arg Gly Leu Gly Phe 50 55 60 Arg Leu Asp Asp Glu Val Lys Gln Glu Ile Thr Thr Lys Trp Asn Thr 65 70 75 80 Leu Gln Pro Ala Arg His Tyr Thr Tyr Gln Ser Trp Glu Arg Lys Ala 85 90 95 Trp Ile Gly Leu Trp Ile Leu Thr Arg Val His Pro Leu Tyr Leu Ser 100 105 110 Asp Phe Leu Glu Lys Leu His Val Ser Arg Ser Thr Leu Leu Asn Asp 115 120 125 Ile Lys Glu Leu Lys Glu Asp Trp Gln Ser Phe Gln Leu Arg Leu Ser 130 135 140 Phe His Arg Lys Lys Gly Tyr Phe Ser Ser Gly Glu Glu Ile Gln Lys 145 150 155 160 Arg Lys Leu Met Ile Arg Tyr Ile His Gln Ile Leu Ala Ala Met Asp 165 170 175 Asp Gln His Phe Ala Ala Glu Leu Ser Ala Glu Cys Gln Trp Pro Ile 180 185 190 Phe Asp Trp Ile Cys Gln Phe Glu Ser Thr Phe Ser Ile Arg Tyr Thr 195 200 205 Gly Glu Val Ile Gln Thr Leu Pro Ile Tyr Leu Ala Leu Phe Gln Arg 210 215 220 Arg Trp Ala Arg Gly Lys Phe Val Gln Met Asp Glu Gln Glu Lys Glu 225 230 235 240 Val Leu Arg Ser Met Arg Glu Tyr Gln Ile Ala Asp His Leu Val Arg 245 250 255 Arg Ile Glu Asn Val Ser Glu Ile Ser Ile Pro Asp Asp Glu Val Cys 260 265 270 Tyr Leu Thr Thr His Leu Leu Ser Phe Arg Val Ala Asp Asp Lys Gln 275 280 285 Ile Asp His Asn Asp Asp Ile Thr Thr Leu Lys Arg Ile Ile Arg His 290 295 300 Met Val Asp Asp Phe Gln Thr Tyr Ala Cys Val Gln Phe Lys Arg Arg 305 310 315 320 Glu Glu Leu Glu Lys Asn Leu Leu Val His Met Lys Pro Ala Tyr Tyr 325 330 335 Arg Leu Lys Tyr Gly Phe His Leu Gln Asn Asp Leu Thr Glu Ser Val 340 345 350 Lys Ala Asn Tyr Gln Asp Leu Phe Thr Leu Thr Lys Lys Val Val His 355 360 365 His Leu Glu Ser Val Val Gly Gln Pro Val Ser Asp Asp Glu Ile Ala 370 375 380 Tyr Ile Ala Met His Phe Gly Gly Trp Leu Asp Arg Glu Gly Val Ser 385 390 395 400 Val Pro Val Arg Lys Lys Val Leu Ile Val Cys Glu Ser Gly Ile Gly 405 410 415 Thr Ser Arg Met Leu Gln Lys Gln Leu Asp Gln Arg Tyr Lys Asn Glu 420 425 430 Phe Thr Ile Gly Ala Ala Val Glu Pro Tyr Gln Leu Gln Asn Glu Lys 435 440 445 Asp Val Gln Met Leu Lys Arg His Phe Asn Ser Ile Val Ala Glu Asn 450 455 460 Val Met Lys Pro Ile Ser Ile Gln Pro Glu Glu Gly Lys Phe Asn Phe 465 470 475 480 Glu Gln Ala Asp Arg Ile Val Lys Phe Ala Lys Ala Asn Gly Met Asp 485 490 495 Ile Arg Phe His Thr Leu Val Trp His Ser Gln Val Pro Gln Trp Phe 500 505 510 Phe Leu Asp Lys Glu Gly Lys Pro Met Val Asn Glu Thr Asp Pro Val 515 520 525 Lys Arg Glu Gln Asn Lys Gln Leu Leu Leu Lys Arg Leu Glu Thr His 530 535 540 Ile Lys Thr Ile Val Glu Arg Tyr Lys Asp Asp Ile Lys Tyr Trp Asp 545 550 555 560 Val Val Asn Glu Val Val Gly Asp Asp Gly Lys Leu Arg Asn Ser Pro 565 570 575 Trp Tyr Gln Ile Ala Gly Ile Asp Tyr Ile Lys Val Ala Phe Gln Thr 580 585 590 Ala Arg Lys Tyr Gly Gly Asn Lys Ile Lys Leu Tyr Ile Asn Asp Tyr 595 600 605 Asn Thr Glu Val Glu Pro Lys Arg Ser Ala Leu Tyr Asn Leu Val Lys 610 615 620 Gln Leu Lys Glu Glu Gly Val Pro Ile Asp Gly Ile Gly His Gln Ser 625 630 635 640 His Ile Gln Ile Gly Trp Pro Ser Glu Ala Glu Ile Glu Lys Thr Ile 645 650 655 Asn Met Phe Ala Ala Leu Gly Leu Asp Asn Gln Ile Thr Glu Leu Asp 660 665 670 Val Ser Met Tyr Gly Trp Pro Pro Arg Ala Tyr Pro Thr Tyr Asp Ala 675 680 685 Ile Pro Lys Gln Lys Phe Leu Asp Gln Ala Ala Arg Tyr Asp Arg Leu 690 695 700 Phe Lys Leu Tyr Glu Lys Leu Ser Asp Lys Ile Ser Asn Val Thr Phe 705 710 715 720 Trp Gly Ile Ala Asp Asn His Thr Trp Leu Asp Ser Arg Ala Asp Val 725 730 735 Tyr Tyr Asp Ala Asn Gly Asn Val Val Val Asp Pro Asn Ala Pro Tyr 740 745 750 Ala Lys Val Glu Lys Gly Lys Gly Lys Asp Ala Pro Phe Val Phe Gly 755 760 765 Pro Asp Tyr Lys Val Lys Pro Ala Tyr Trp Ala Ile Ile Asp His Lys 770 775 780 <210> 325 <211> 1146 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 325 atgactattt cccgccggaa atttatgtgg ggcacagctg cactcctggc caccacccag 60 ctcaaaaccc gcgctctcgc cgctgccatg gccagcacag gcatcaagga cgccttcaag 120 ggcgacttcc atatcggcac cgccatcagc aacgctaccc tgcaaaacca ggatgccacc 180 atgctggatt tgatcaagcg cgaatttaat gcaattaccg ctgaaaattg catgaagtgg 240 gagcctattc gcccacagct ggatcagtgg aattgggagc tggccgaccg ctttgtggat 300 ttcggcgtta aaaacaagat gtatgtggta ggtcacacgc tgatttggca cagccaggcg 360 ccagcgcaca tttatctcga cgccgatggt aagcccaaca gtcgcgatgc ccagttgaaa 420 gtaatggagg agcacatacg taccctggcg ggccgctaca aaggaaagat agacgcctgg 480 gacgtggtta acgaagcagt ggaggatgat ggcagctggc gtcaaaccgg ctggtacaaa 540 aacatgggtg aagaatatat cgcccatgcc ttccgcttgg cagccgaggt agaccccaac 600 gccaagctac tctacaacga ctacaacgag gctgtacccg ccaagcgtga tgcgattatt 660 cgggtggtaa aaggcgtgca gaaggctggc gcacccattc acggtgtggg gatgcaaggg 720 cacatgagcc tgtcacatcc ggatttcgcg gagttcgaaa aatccataat cgaatacgcc 780 aagttggggg tgaaggtgca cgttaccgaa ctggatatcg acgtgttgcc actggcgtgg 840 aacctgagtg cggaaatttc caatcgcttt gaataccgcc cagagatgga tccttatcgc 900 gaaggtttgc ccgccaaagt cgaggaggag ctagcggctc gttacgaggc gctgtttaaa 960 atcctgctgc gtcatcgcga caaaattgag cgtgtgacca cttggggcac caacgactca 1020 gagacctggt taaatggctt ccccattccg gggcgcatga attacccaat gctgttcgat 1080 cgtaataacc agcccaagtt ggcctatcac cggctgctgg cactcaaaca aaagaaaagt 1140 cagtaa 1146 <210> 326 <211> 381 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(27) <400> 326 Met Thr Ile Ser Arg Arg Lys Phe Met Trp Gly Thr Ala Ala Leu Leu 1 5 10 15 Ala Thr Thr Gln Leu Lys Thr Arg Ala Leu Ala Ala Ala Met Ala Ser 20 25 30 Thr Gly Ile Lys Asp Ala Phe Lys Gly Asp Phe His Ile Gly Thr Ala 35 40 45 Ile Ser Asn Ala Thr Leu Gln Asn Gln Asp Ala Thr Met Leu Asp Leu 50 55 60 Ile Lys Arg Glu Phe Asn Ala Ile Thr Ala Glu Asn Cys Met Lys Trp 65 70 75 80 Glu Pro Ile Arg Pro Gln Leu Asp Gln Trp Asn Trp Glu Leu Ala Asp 85 90 95 Arg Phe Val Asp Phe Gly Val Lys Asn Lys Met Tyr Val Val Gly His 100 105 110 Thr Leu Ile Trp His Ser Gln Ala Pro Ala His Ile Tyr Leu Asp Ala 115 120 125 Asp Gly Lys Pro Asn Ser Arg Asp Ala Gln Leu Lys Val Met Glu Glu 130 135 140 His Ile Arg Thr Leu Ala Gly Arg Tyr Lys Gly Lys Ile Asp Ala Trp 145 150 155 160 Asp Val Val Asn Glu Ala Val Glu Asp Asp Gly Ser Trp Arg Gln Thr 165 170 175 Gly Trp Tyr Lys Asn Met Gly Glu Glu Tyr Ile Ala His Ala Phe Arg 180 185 190 Leu Ala Ala Glu Val Asp Pro Asn Ala Lys Leu Leu Tyr Asn Asp Tyr 195 200 205 Asn Glu Ala Val Pro Ala Lys Arg Asp Ala Ile Ile Arg Val Val Lys 210 215 220 Gly Val Gln Lys Ala Gly Ala Pro Ile His Gly Val Gly Met Gln Gly 225 230 235 240 His Met Ser Leu Ser His Pro Asp Phe Ala Glu Phe Glu Lys Ser Ile 245 250 255 Ile Glu Tyr Ala Lys Leu Gly Val Lys Val His Val Thr Glu Leu Asp 260 265 270 Ile Asp Val Leu Pro Leu Ala Trp Asn Leu Ser Ala Glu Ile Ser Asn 275 280 285 Arg Phe Glu Tyr Arg Pro Glu Met Asp Pro Tyr Arg Glu Gly Leu Pro 290 295 300 Ala Lys Val Glu Glu Glu Leu Ala Ala Arg Tyr Glu Ala Leu Phe Lys 305 310 315 320 Ile Leu Leu Arg His Arg Asp Lys Ile Glu Arg Val Thr Thr Trp Gly 325 330 335 Thr Asn Asp Ser Glu Thr Trp Leu Asn Gly Phe Pro Ile Pro Gly Arg 340 345 350 Met Asn Tyr Pro Met Leu Phe Asp Arg Asn Asn Gln Pro Lys Leu Ala 355 360 365 Tyr His Arg Leu Leu Ala Leu Lys Gln Lys Lys Ser Gln 370 375 380 <210> 327 <211> 1500 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 327 atgaaacgtt cagtctctat ctttatcgca tgtttagtaa tgacagtatt aacaattagc 60 ggtgtcgcgg caccagaagc atctgcagca ggggcgaaaa cgcctgtagc ccttaatggc 120 cagcttagca ttaaaggtac tcagctagtc aatcaaaacg gaaaatcggt gcagctgaag 180 gggatcagct cacacggttt gcagtggttc ggcgattatg tcaataaaga ctctttaaaa 240 tggctaagag acgattgggg aattaccgtc ttccgagcgg caatgtacac ggctgaaggc 300 ggttatatag agaatccgtc tgtgaaaaat aaagtcaaag aagctgttga agcggcaaaa 360 gagctcggga tatatgtcat cattgactgg catattttaa atgacggcaa tccaaatcaa 420 aataaagaga aggcgaagga attctttaag gaaatgtcga gcctttacgg aagcacacca 480 aacgttattt atgaaattgc taatgaaccg aacggtgatg taaattggaa gcgcgatatc 540 aaaccgtatg cggaggaagt gatttccgtt atccgtaaaa atgacccgga taacatcatt 600 attaccggaa ctggcacttg gagtcaggat gtcaatgatg ctgctgatga tcagcttaag 660 gatgcaaacg tcatgtacgc gcttcatttt tatgcaggta cacacggcca gtatttaagg 720 gataaagccg attatgcgct cagcaaagga gcgccgattt ttgtaacgga atgggggacg 780 agtgacgctt ccggaaatgg cggggtcttc cttgaccagt cgagggaatg gctgaattat 840 ctcgacaaca agaaaatcag ctgggtaaac tggaaccttt ctgataagca ggaatcttcc 900 tcagctttaa agccgggggc atctaaaaca ggcggctggc cgttatcaga tttatccgct 960 tcagggacat ttgtaaggga aaagatccgt ggctcccaac attcgactga agacagatct 1020 gagacaccaa agcaagataa acccgtacag gaaaacagcc tatctgtgca atacagaaca 1080 ggggatggaa gtgtgaacag caaccaaatc cgtcctcaga tccatgtgaa aaacaacagc 1140 aagaccaccg ttaatttaaa aaatgtaact gtccgctact ggtataacac gaaaaacaaa 1200 ggccaaaact tcgactgtga ctacgcgaag atcggatgca gcaatgtgac gcacaagttt 1260 gtgacattac aaaaacctgt aaaaggtgca gatgcctatc tggaacttgg gtttaaaaac 1320 gggacactgt caccgggagc aaacactgga gaaatccaaa ttcgtcttca caatgaggat 1380 tggggcaatt attcacaaat cggggattat tctttttctc agtcaaatac gtttaaagat 1440 acaaaaaaaa tcacattata taataacgga aaactaattt ggggaactga acccaaatag 1500 <210> 328 <211> 499 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(29) <400> 328 Met Lys Arg Ser Val Ser Ile Phe Ile Ala Cys Leu Val Met Thr Val 1 5 10 15 Leu Thr Ile Ser Gly Val Ala Ala Pro Glu Ala Ser Ala Ala Gly Ala 20 25 30 Lys Thr Pro Val Ala Leu Asn Gly Gln Leu Ser Ile Lys Gly Thr Gln 35 40 45 Leu Val Asn Gln Asn Gly Lys Ser Val Gln Leu Lys Gly Ile Ser Ser 50 55 60 His Gly Leu Gln Trp Phe Gly Asp Tyr Val Asn Lys Asp Ser Leu Lys 65 70 75 80 Trp Leu Arg Asp Asp Trp Gly Ile Thr Val Phe Arg Ala Ala Met Tyr 85 90 95 Thr Ala Glu Gly Gly Tyr Ile Glu Asn Pro Ser Val Lys Asn Lys Val 100 105 110 Lys Glu Ala Val Glu Ala Ala Lys Glu Leu Gly Ile Tyr Val Ile Ile 115 120 125 Asp Trp His Ile Leu Asn Asp Gly Asn Pro Asn Gln Asn Lys Glu Lys 130 135 140 Ala Lys Glu Phe Phe Lys Glu Met Ser Ser Leu Tyr Gly Ser Thr Pro 145 150 155 160 Asn Val Ile Tyr Glu Ile Ala Asn Glu Pro Asn Gly Asp Val Asn Trp 165 170 175 Lys Arg Asp Ile Lys Pro Tyr Ala Glu Glu Val Ile Ser Val Ile Arg 180 185 190 Lys Asn Asp Pro Asp Asn Ile Ile Ile Thr Gly Thr Gly Thr Trp Ser 195 200 205 Gln Asp Val Asn Asp Ala Ala Asp Asp Gln Leu Lys Asp Ala Asn Val 210 215 220 Met Tyr Ala Leu His Phe Tyr Ala Gly Thr His Gly Gln Tyr Leu Arg 225 230 235 240 Asp Lys Ala Asp Tyr Ala Leu Ser Lys Gly Ala Pro Ile Phe Val Thr 245 250 255 Glu Trp Gly Thr Ser Asp Ala Ser Gly Asn Gly Gly Val Phe Leu Asp 260 265 270 Gln Ser Arg Glu Trp Leu Asn Tyr Leu Asp Asn Lys Lys Ile Ser Trp 275 280 285 Val Asn Trp Asn Leu Ser Asp Lys Gln Glu Ser Ser Ser Ala Leu Lys 290 295 300 Pro Gly Ala Ser Lys Thr Gly Gly Trp Pro Leu Ser Asp Leu Ser Ala 305 310 315 320 Ser Gly Thr Phe Val Arg Glu Lys Ile Arg Gly Ser Gln His Ser Thr 325 330 335 Glu Asp Arg Ser Glu Thr Pro Lys Gln Asp Lys Pro Val Gln Glu Asn 340 345 350 Ser Leu Ser Val Gln Tyr Arg Thr Gly Asp Gly Ser Val Asn Ser Asn 355 360 365 Gln Ile Arg Pro Gln Ile His Val Lys Asn Asn Ser Lys Thr Thr Val 370 375 380 Asn Leu Lys Asn Val Thr Val Arg Tyr Trp Tyr Asn Thr Lys Asn Lys 385 390 395 400 Gly Gln Asn Phe Asp Cys Asp Tyr Ala Lys Ile Gly Cys Ser Asn Val 405 410 415 Thr His Lys Phe Val Thr Leu Gln Lys Pro Val Lys Gly Ala Asp Ala 420 425 430 Tyr Leu Glu Leu Gly Phe Lys Asn Gly Thr Leu Ser Pro Gly Ala Asn 435 440 445 Thr Gly Glu Ile Gln Ile Arg Leu His Asn Glu Asp Trp Gly Asn Tyr 450 455 460 Ser Gln Ile Gly Asp Tyr Ser Phe Ser Gln Ser Asn Thr Phe Lys Asp 465 470 475 480 Thr Lys Lys Ile Thr Leu Tyr Asn Asn Gly Lys Leu Ile Trp Gly Thr 485 490 495 Glu Pro Lys <210> 329 <211> 2268 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 329 atgaggaacg ttcaggaaat aggaggcagt atgtacaaaa aggcttttct tgtactggca 60 ttgtttttgc tgttggcggc ggtggcgctc ccgtctgtgg gggctgcgcc gcaggggccg 120 cgcctgcgcg atgtggcggg cgacatttta gtgggttacg cctccagaaa cgatttctgg 180 aacatgtctg actcagccca atacacagaa gttgcccgca ctgagttcaa cttcatgacg 240 cccgaaaacg ccatgaagtg ggacgccatt catcccgcgc aaaactcata cagttttgcc 300 caggccgacc ggcacgtgca gtttgcccag gccaacaaca tggccgtgca tggacatgcc 360 ctcgtgtggc acagccaaaa tccaggctgg ctgaccaatg gcaactggtc ccgcagccaa 420 ttgatcaaca tcatgaacga ccacattgac acggtcgccg gccgttatgc aggtgaggtg 480 ctggtgtggg acgtggtcaa tcaggcgttt aatgaggatg gaacttatcg cagcaccatc 540 tggtacaacg ggatcggaca ggaatatatc gacctggcct ttacccgcgc ccgcgccgcc 600 gatcctcatg ccaaactcat ttacaacgat tacaacattg gctggttaaa cagtaagtcg 660 aatggcgtct acaacatggc cgccgatatg gtcaggcgcg gtgtgcccat cgacggcgtt 720 ggtttccaga tgcacctgga acggggcggc gtcagcggca gcagtctggc gagcaacatg 780 cagcgtttcg ccgatttggg attggaagtt tacatcaccg aattggacgt gcgcattccc 840 caaaacccaa cccagcagga tttgcaggct caggcggcag tttaccaaac ggtgacgaat 900 cgctgtttgg cgcagcctgc ctgcaaggcg ttgcaggtct ggggcatccc cgacaaatat 960 tcctgggtac cggacgtatt ccccggcacg ggcgcgcctc tgttgtttaa cgacaactat 1020 gaggccaaac ccgcctatta tgccgtccag gcagagttga tggccgcgaa tccgcagccc 1080 acaaacacac cgggaacgcc cgctcatacc ccttcggcca cgtctacgtc tgcggccact 1140 gctacgcccc cggcaacggc cacggcgacc gccaccaccc cctccggcgg cggcgtttgc 1200 gccgttgatt acgtcattgc caaccagtgg ggcaatggct ttcaggccaa cgtcaccatc 1260 accaatcaca gcgccgcgcc ggtgaacggc tataccctgg cctggaccca cgcgccgggg 1320 cagattgtca ccagcggctg gaacgtaacc atcgcccaaa gcggcagcgc cgtcagcgcc 1380 agcaacccgg ccggttattg gaacggtgtg atcggagcca acggcggcaa gatttctttt 1440 ggtttccagg gatctctggc gggcggcagc gcggtcgcgc ccacttattt tgccttgaac 1500 ggcgctgcct gtaacggggc cgtccttccg cctactgcca ccttcacgcc ttcaccgacg 1560 gctaccatgt gtccccaggc aacgcctgaa ctgcttgtcg tgcagccggt gacttcaccc 1620 actacccaac tgtctcaaac gctggtggtg cgtttaggca acggcgaatg ggtgcgcgct 1680 gccggaccgg caggcgttgt caccgtcact gcgccggacc cggatggtta tttccgcctg 1740 acgataccgc tggcagccaa taccagcaac gccattctgg tagaagggcg ggtgcgggtt 1800 atcacccatt caaatggctg cacctatggc ggttatacct tgagcagaac cgtaacgatt 1860 gtgcaagcca gcagcccagt caccttaacg ccgactgcca caccttcccc caccgccacg 1920 gcaacgccta cggtaaccgc cacgtcgccg tcaggcgcct gcaccgtcgc ctacgccatc 1980 accaacgact ggggcagcgg tttcaccgcc aacgttaccc tcaccaatac tggcggaagc 2040 gccctcaacg gctggaccct ggcctatgcc tttcccggca atcaaaccat cagcaacgcc 2100 tggaacggaa cggccgttca gtccggcagc agcgtcagcg tcaccaacgc cggttggaat 2160 ggcagcctgc cgcccaacgt ctccgccagc tttggcttcc aggcgagcta cagcggcaat 2220 aacagcgtcc ctgccagctt tacgctgaac ggcgcgcttt gccattga 2268 <210> 330 <211> 755 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(35) <400> 330 Met Arg Asn Val Gln Glu Ile Gly Gly Ser Met Tyr Lys Lys Ala Phe 1 5 10 15 Leu Val Leu Ala Leu Phe Leu Leu Leu Ala Ala Val Ala Leu Pro Ser 20 25 30 Val Gly Ala Ala Pro Gln Gly Pro Arg Leu Arg Asp Val Ala Gly Asp 35 40 45 Ile Leu Val Gly Tyr Ala Ser Arg Asn Asp Phe Trp Asn Met Ser Asp 50 55 60 Ser Ala Gln Tyr Thr Glu Val Ala Arg Thr Glu Phe Asn Phe Met Thr 65 70 75 80 Pro Glu Asn Ala Met Lys Trp Asp Ala Ile His Pro Ala Gln Asn Ser 85 90 95 Tyr Ser Phe Ala Gln Ala Asp Arg His Val Gln Phe Ala Gln Ala Asn 100 105 110 Asn Met Ala Val His Gly His Ala Leu Val Trp His Ser Gln Asn Pro 115 120 125 Gly Trp Leu Thr Asn Gly Asn Trp Ser Arg Ser Gln Leu Ile Asn Ile 130 135 140 Met Asn Asp His Ile Asp Thr Val Ala Gly Arg Tyr Ala Gly Glu Val 145 150 155 160 Leu Val Trp Asp Val Val Asn Gln Ala Phe Asn Glu Asp Gly Thr Tyr 165 170 175 Arg Ser Thr Ile Trp Tyr Asn Gly Ile Gly Gln Glu Tyr Ile Asp Leu 180 185 190 Ala Phe Thr Arg Ala Arg Ala Ala Asp Pro His Ala Lys Leu Ile Tyr 195 200 205 Asn Asp Tyr Asn Ile Gly Trp Leu Asn Ser Lys Ser Asn Gly Val Tyr 210 215 220 Asn Met Ala Ala Asp Met Val Arg Arg Gly Val Pro Ile Asp Gly Val 225 230 235 240 Gly Phe Gln Met His Leu Glu Arg Gly Gly Val Ser Gly Ser Ser Leu 245 250 255 Ala Ser Asn Met Gln Arg Phe Ala Asp Leu Gly Leu Glu Val Tyr Ile 260 265 270 Thr Glu Leu Asp Val Arg Ile Pro Gln Asn Pro Thr Gln Gln Asp Leu 275 280 285 Gln Ala Gln Ala Ala Val Tyr Gln Thr Val Thr Asn Arg Cys Leu Ala 290 295 300 Gln Pro Ala Cys Lys Ala Leu Gln Val Trp Gly Ile Pro Asp Lys Tyr 305 310 315 320 Ser Trp Val Pro Asp Val Phe Pro Gly Thr Gly Ala Pro Leu Leu Phe 325 330 335 Asn Asp Asn Tyr Glu Ala Lys Pro Ala Tyr Tyr Ala Val Gln Ala Glu 340 345 350 Leu Met Ala Ala Asn Pro Gln Pro Thr Asn Thr Pro Gly Thr Pro Ala 355 360 365 His Thr Pro Ser Ala Thr Ser Thr Ser Ala Ala Thr Ala Thr Pro Pro 370 375 380 Ala Thr Ala Thr Ala Thr Ala Thr Thr Pro Ser Gly Gly Gly Val Cys 385 390 395 400 Ala Val Asp Tyr Val Ile Ala Asn Gln Trp Gly Asn Gly Phe Gln Ala 405 410 415 Asn Val Thr Ile Thr Asn His Ser Ala Ala Pro Val Asn Gly Tyr Thr 420 425 430 Leu Ala Trp Thr His Ala Pro Gly Gln Ile Val Thr Ser Gly Trp Asn 435 440 445 Val Thr Ile Ala Gln Ser Gly Ser Ala Val Ser Ala Ser Asn Pro Ala 450 455 460 Gly Tyr Trp Asn Gly Val Ile Gly Ala Asn Gly Gly Lys Ile Ser Phe 465 470 475 480 Gly Phe Gln Gly Ser Leu Ala Gly Gly Ser Ala Val Ala Pro Thr Tyr 485 490 495 Phe Ala Leu Asn Gly Ala Ala Cys Asn Gly Ala Val Leu Pro Pro Thr 500 505 510 Ala Thr Phe Thr Pro Ser Pro Thr Ala Thr Met Cys Pro Gln Ala Thr 515 520 525 Pro Glu Leu Leu Val Val Gln Pro Val Thr Ser Pro Thr Thr Gln Leu 530 535 540 Ser Gln Thr Leu Val Val Arg Leu Gly Asn Gly Glu Trp Val Arg Ala 545 550 555 560 Ala Gly Pro Ala Gly Val Val Thr Val Thr Ala Pro Asp Pro Asp Gly 565 570 575 Tyr Phe Arg Leu Thr Ile Pro Leu Ala Ala Asn Thr Ser Asn Ala Ile 580 585 590 Leu Val Glu Gly Arg Val Arg Val Ile Thr His Ser Asn Gly Cys Thr 595 600 605 Tyr Gly Gly Tyr Thr Leu Ser Arg Thr Val Thr Ile Val Gln Ala Ser 610 615 620 Ser Pro Val Thr Leu Thr Pro Thr Ala Thr Pro Ser Pro Thr Ala Thr 625 630 635 640 Ala Thr Pro Thr Val Thr Ala Thr Ser Pro Ser Gly Ala Cys Thr Val 645 650 655 Ala Tyr Ala Ile Thr Asn Asp Trp Gly Ser Gly Phe Thr Ala Asn Val 660 665 670 Thr Leu Thr Asn Thr Gly Gly Ser Ala Leu Asn Gly Trp Thr Leu Ala 675 680 685 Tyr Ala Phe Pro Gly Asn Gln Thr Ile Ser Asn Ala Trp Asn Gly Thr 690 695 700 Ala Val Gln Ser Gly Ser Ser Val Ser Val Thr Asn Ala Gly Trp Asn 705 710 715 720 Gly Ser Leu Pro Pro Asn Val Ser Ala Ser Phe Gly Phe Gln Ala Ser 725 730 735 Tyr Ser Gly Asn Asn Ser Val Pro Ala Ser Phe Thr Leu Asn Gly Ala 740 745 750 Leu Cys His 755 <210> 331 <211> 1242 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 331 gtgttcaagg gcttgcgcta tttgctgttg ctgtgcctga gtgcgggact ggtctttgcc 60 tgtgcgccac ggtctgtgac cgccccaccc gatgggctaa gcgggcaaat taggctcctg 120 cgccaaggaa ccctcactgt ccttgtccag aatgcccaag ggcaacccat tgccaacgcc 180 aaggtggtag ctgctcagca aacccatgcc ttcccctttg gtgttgcctt agatacagca 240 atgtttgagc cttccccgcc acccgcagcc aactggtacc gcaacaccgc tcgccaaaat 300 tttaatgccg ctgtccatga aaacgccctc aagtggtatg cccttgaacc ggagcagggc 360 aagctggact ttacgatggc ggatcgcatc ctcgcttgga gtgaagccca aggctggccg 420 atgcgggggc acaccctctt ttgggaagtt gagcaattta accccccatg gctgaaaacg 480 ctgccaccag agcaactgcg ggctgccgtc aagaaccatg ccatgacggt gtgtcgccat 540 taccgcgggc gaatcaatga atttgatgtc aataatgaaa tgctccacgg taactttttc 600 cgcagtcgtt tgggaaacgg catagttaaa gagatgttcg agtggtgccg cgagggtaac 660 cccgaggccg tcctttatgt gaacgactac ggcattattg agggcgatcg cctcgacgac 720 tacgtgcagc agattcgcga tttactgggg caaggggttc ccattggtgg cattggcatt 780 caagcccatt tggaatatcc cttggatgca gccaagatga aacgcgccct tgataccctt 840 gcccaattca acctgcccct aaaaatcact gaagttagtg tcagccttgc cgacgagcag 900 cagcaggcgg agacactgcg ccaaatctac cgcattggtt ttgcccatcc agccgtcaaa 960 gagatcctcc tgtggggatt ttgggaaggc aaccactggc gaccccaagc aggactgtac 1020 cgtcgcgact tttccgccaa acctgctgcc gaagcctatc gacaactcct ctttcaggag 1080 tggtggacca ccagcaacgg caaaactaat gccgatgggc gctggcagac ccgcggctat 1140 gcggggcgct atcgcctcac agtaacggcc aacggccaga ccattaaccg cgacattgac 1200 ctaccagact tggagagaac cgtgaccgta caattcccat ga 1242 <210> 332 <211> 413 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(28) <400> 332 Met Phe Lys Gly Leu Arg Tyr Leu Leu Leu Leu Cys Leu Ser Ala Gly 1 5 10 15 Leu Val Phe Ala Cys Ala Pro Arg Ser Val Thr Ala Pro Pro Asp Gly 20 25 30 Leu Ser Gly Gln Ile Arg Leu Leu Arg Gln Gly Thr Leu Thr Val Leu 35 40 45 Val Gln Asn Ala Gln Gly Gln Pro Ile Ala Asn Ala Lys Val Val Ala 50 55 60 Ala Gln Gln Thr His Ala Phe Pro Phe Gly Val Ala Leu Asp Thr Ala 65 70 75 80 Met Phe Glu Pro Ser Pro Pro Pro Ala Ala Asn Trp Tyr Arg Asn Thr 85 90 95 Ala Arg Gln Asn Phe Asn Ala Ala Val His Glu Asn Ala Leu Lys Trp 100 105 110 Tyr Ala Leu Glu Pro Glu Gln Gly Lys Leu Asp Phe Thr Met Ala Asp 115 120 125 Arg Ile Leu Ala Trp Ser Glu Ala Gln Gly Trp Pro Met Arg Gly His 130 135 140 Thr Leu Phe Trp Glu Val Glu Gln Phe Asn Pro Pro Trp Leu Lys Thr 145 150 155 160 Leu Pro Pro Glu Gln Leu Arg Ala Ala Val Lys Asn His Ala Met Thr 165 170 175 Val Cys Arg His Tyr Arg Gly Arg Ile Asn Glu Phe Asp Val Asn Asn 180 185 190 Glu Met Leu His Gly Asn Phe Phe Arg Ser Arg Leu Gly Asn Gly Ile 195 200 205 Val Lys Glu Met Phe Glu Trp Cys Arg Glu Gly Asn Pro Glu Ala Val 210 215 220 Leu Tyr Val Asn Asp Tyr Gly Ile Ile Glu Gly Asp Arg Leu Asp Asp 225 230 235 240 Tyr Val Gln Gln Ile Arg Asp Leu Leu Gly Gln Gly Val Pro Ile Gly 245 250 255 Gly Ile Gly Ile Gln Ala His Leu Glu Tyr Pro Leu Asp Ala Ala Lys 260 265 270 Met Lys Arg Ala Leu Asp Thr Leu Ala Gln Phe Asn Leu Pro Leu Lys 275 280 285 Ile Thr Glu Val Ser Val Ser Leu Ala Asp Glu Gln Gln Gln Ala Glu 290 295 300 Thr Leu Arg Gln Ile Tyr Arg Ile Gly Phe Ala His Pro Ala Val Lys 305 310 315 320 Glu Ile Leu Leu Trp Gly Phe Trp Glu Gly Asn His Trp Arg Pro Gln 325 330 335 Ala Gly Leu Tyr Arg Arg Asp Phe Ser Ala Lys Pro Ala Ala Glu Ala 340 345 350 Tyr Arg Gln Leu Leu Phe Gln Glu Trp Trp Thr Thr Ser Asn Gly Lys 355 360 365 Thr Asn Ala Asp Gly Arg Trp Gln Thr Arg Gly Tyr Ala Gly Arg Tyr 370 375 380 Arg Leu Thr Val Thr Ala Asn Gly Gln Thr Ile Asn Arg Asp Ile Asp 385 390 395 400 Leu Pro Asp Leu Glu Arg Thr Val Thr Val Gln Phe Pro 405 410 <210> 333 <211> 1152 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 333 atgaaaagac aatttattgg acgattgaga cttgtcacta tcctttcaat catagtgatt 60 atgggatgtg cttcaaacaa aagtgatcag aatgttgata acctaaagga cgccttcgac 120 ggtttgttcc ttattggaac tgccatgaat accccccaga tcaccggaca ggatacccgg 180 acgcttgaat tgatcaaaaa acacatgaac tccattgtgg cagaaaacgt tatgaaaagc 240 ggactaatac agcccagcga aggggagttc gacttctcac ttgccgacca gtttgtgcaa 300 ttcggtgttg acaacaacat gcacatcgta gggcataccc ttatctggca ttcgcaggct 360 ccagggtggt tttttgtgga tgaaaacggt aatgatgtta gtcccgaagt tcttaagcaa 420 aggatgaaag accacatcta cacagtagtt ggccgttaca aaggcaaagt gcacggttgg 480 gatgtggtga atgaatgtat cgttgacgat gggtcatggc gcaacagcaa gttttaccag 540 atcctgggtg aagactttgt aaagtatgcc ttccagtttg cttcagaagc cgacccgaat 600 gctgaattgt attacaacga ttattccatg gcacttcccg gccgccgcca gggagtcgta 660 aacatggtaa aaaatctaca ggcacaaggt attaaaattg acggaatagg aatgcagggc 720 cacctgatga tcgaccatcc atcccttgaa gatttcgaaa ccagtttgct tgcctttgcc 780 gatctgggtg tacatgttat gatcactgag cttgatgtat ctgtacttcc ttttcctacc 840 cgcaacctcg gtgctgatgt atctctaaac atagcttaca acactgaact gaacccctat 900 cccgatggat tgcctgatga tgtggcccaa aaacttcatg atcgctggct cgatatatat 960 cgtttattta taaaacatca cgacaagatc acccgtgtta ctacctgggg tacagccgat 1020 ggtatgtcat ggaagaacaa ctggcccatt cgtggacgca cagactttcc tttattattc 1080 gaccgcgatt ttcaacccaa accggtagta gctgatatta tcaaagaagc attggctgca 1140 aagagaaaat ag 1152 <210> 334 <211> 383 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(30) <400> 334 Met Lys Arg Gln Phe Ile Gly Arg Leu Arg Leu Val Thr Ile Leu Ser 1 5 10 15 Ile Ile Val Ile Met Gly Cys Ala Ser Asn Lys Ser Asp Gln Asn Val 20 25 30 Asp Asn Leu Lys Asp Ala Phe Asp Gly Leu Phe Leu Ile Gly Thr Ala 35 40 45 Met Asn Thr Pro Gln Ile Thr Gly Gln Asp Thr Arg Thr Leu Glu Leu 50 55 60 Ile Lys Lys His Met Asn Ser Ile Val Ala Glu Asn Val Met Lys Ser 65 70 75 80 Gly Leu Ile Gln Pro Ser Glu Gly Glu Phe Asp Phe Ser Leu Ala Asp 85 90 95 Gln Phe Val Gln Phe Gly Val Asp Asn Asn Met His Ile Val Gly His 100 105 110 Thr Leu Ile Trp His Ser Gln Ala Pro Gly Trp Phe Phe Val Asp Glu 115 120 125 Asn Gly Asn Asp Val Ser Pro Glu Val Leu Lys Gln Arg Met Lys Asp 130 135 140 His Ile Tyr Thr Val Val Gly Arg Tyr Lys Gly Lys Val His Gly Trp 145 150 155 160 Asp Val Val Asn Glu Cys Ile Val Asp Asp Gly Ser Trp Arg Asn Ser 165 170 175 Lys Phe Tyr Gln Ile Leu Gly Glu Asp Phe Val Lys Tyr Ala Phe Gln 180 185 190 Phe Ala Ser Glu Ala Asp Pro Asn Ala Glu Leu Tyr Tyr Asn Asp Tyr 195 200 205 Ser Met Ala Leu Pro Gly Arg Arg Gln Gly Val Val Asn Met Val Lys 210 215 220 Asn Leu Gln Ala Gln Gly Ile Lys Ile Asp Gly Ile Gly Met Gln Gly 225 230 235 240 His Leu Met Ile Asp His Pro Ser Leu Glu Asp Phe Glu Thr Ser Leu 245 250 255 Leu Ala Phe Ala Asp Leu Gly Val His Val Met Ile Thr Glu Leu Asp 260 265 270 Val Ser Val Leu Pro Phe Pro Thr Arg Asn Leu Gly Ala Asp Val Ser 275 280 285 Leu Asn Ile Ala Tyr Asn Thr Glu Leu Asn Pro Tyr Pro Asp Gly Leu 290 295 300 Pro Asp Asp Val Ala Gln Lys Leu His Asp Arg Trp Leu Asp Ile Tyr 305 310 315 320 Arg Leu Phe Ile Lys His His Asp Lys Ile Thr Arg Val Thr Thr Trp 325 330 335 Gly Thr Ala Asp Gly Met Ser Trp Lys Asn Asn Trp Pro Ile Arg Gly 340 345 350 Arg Thr Asp Phe Pro Leu Leu Phe Asp Arg Asp Phe Gln Pro Lys Pro 355 360 365 Val Val Ala Asp Ile Ile Lys Glu Ala Leu Ala Ala Lys Arg Lys 370 375 380 <210> 335 <211> 849 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 335 atgattccaa ggatcgtcct ggccgtccgc atatccccta cttttctcag cccacaaaaa 60 ggggtaataa aaatgataaa gcgggctttt atgataaccc tggcggcctt cctcctcctt 120 ttcgccctaa attccctgcc tatccatgcc ggggccgaag gcggggagga aaagtttacc 180 cccaaggtca tcgtggagca cggtttcgag aataacgact tccacggttg ggtcccccgg 240 ggcggggtcg ggaccatttc cattaccaat gaggcggccc atagcgggtc ctcctgcctg 300 aagatcaccg gccggactca agcttggcat atgccgcggg tggagatcac caagtactta 360 gaaaagggag ctaagtataa gatcgaattg tacgtcaagc tccccgcggg cacctcgccg 420 cgcaagttcc agctggcggt tctcacccgt tatctcgaag gcaaccagac cagggacaaa 480 gaggactcca tctcggacga ggtggaggtg accgccgata cctggaccaa ggtcgagggc 540 gagtacgtct tcgacccggc ggccatcggc gcctacgtct acccctacct caagggcgac 600 cccgcagggg cctatgcccc ctatctcatc gatgatttca agatcaccac gatcgccccc 660 gcccccaaga agaccgccgc taccgccgcg gcaaaagagg cagaagagcc cttaatcgag 720 accgatatac catccttaaa agacgtctgc gcgtcctact tcgagatcgg cgcggccatc 780 gagccatatg agttattctc caagccccac gatcagctgc tccggaaaca tttcaacacc 840 gttggttga 849 <210> 336 <211> 282 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(50) <400> 336 Met Ile Pro Arg Ile Val Leu Ala Val Arg Ile Ser Pro Thr Phe Leu 1 5 10 15 Ser Pro Gln Lys Gly Val Ile Lys Met Ile Lys Arg Ala Phe Met Ile 20 25 30 Thr Leu Ala Ala Phe Leu Leu Leu Phe Ala Leu Asn Ser Leu Pro Ile 35 40 45 His Ala Gly Ala Glu Gly Gly Glu Glu Lys Phe Thr Pro Lys Val Ile 50 55 60 Val Glu His Gly Phe Glu Asn Asn Asp Phe His Gly Trp Val Pro Arg 65 70 75 80 Gly Gly Val Gly Thr Ile Ser Ile Thr Asn Glu Ala Ala His Ser Gly 85 90 95 Ser Ser Cys Leu Lys Ile Thr Gly Arg Thr Gln Ala Trp His Met Pro 100 105 110 Arg Val Glu Ile Thr Lys Tyr Leu Glu Lys Gly Ala Lys Tyr Lys Ile 115 120 125 Glu Leu Tyr Val Lys Leu Pro Ala Gly Thr Ser Pro Arg Lys Phe Gln 130 135 140 Leu Ala Val Leu Thr Arg Tyr Leu Glu Gly Asn Gln Thr Arg Asp Lys 145 150 155 160 Glu Asp Ser Ile Ser Asp Glu Val Glu Val Thr Ala Asp Thr Trp Thr 165 170 175 Lys Val Glu Gly Glu Tyr Val Phe Asp Pro Ala Ala Ile Gly Ala Tyr 180 185 190 Val Tyr Pro Tyr Leu Lys Gly Asp Pro Ala Gly Ala Tyr Ala Pro Tyr 195 200 205 Leu Ile Asp Asp Phe Lys Ile Thr Thr Ile Ala Pro Ala Pro Lys Lys 210 215 220 Thr Ala Ala Thr Ala Ala Ala Lys Glu Ala Glu Glu Pro Leu Ile Glu 225 230 235 240 Thr Asp Ile Pro Ser Leu Lys Asp Val Cys Ala Ser Tyr Phe Glu Ile 245 250 255 Gly Ala Ala Ile Glu Pro Tyr Glu Leu Phe Ser Lys Pro His Asp Gln 260 265 270 Leu Leu Arg Lys His Phe Asn Thr Val Gly 275 280 <210> 337 <211> 870 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 337 atgaagcccg acagcgtgct ggatgtaaac gccagcaaaa agctctccgc ccaggatgaa 60 accgccgtgg cggtgaaatt cgacgccgcc cgcgccctgc tggattttgt caaggaaaac 120 gggctcaagg tgcacggtca cgtgctggta tggcattccc agacgccgga agccttcttc 180 cacgagggct atgatgccgc caggccctac gtggggcggg acgtgatgct ggggcgcatg 240 aaaaactaca tcaaggccgt gtttgaatac actgagacca attaccccgg cgtcatcgtc 300 tcctgggacg tagtgaacga agccatcgac gacggcacca acaagctgcg ccagtccaac 360 tggttcaaaa ccgttggcga ggatttcgtg ctccgcgcct ttgaatacgc caggaaatac 420 gcccccgaag gcacgctgct ttattacaac gattacaaca ccgccatgcc cggcaagctg 480 aacggcatcg ccaatctgct caaagccctc atcgccgagg gcaacatcga cggctacggc 540 ttccaaatgc accacagcgt gggcttcccc tccatggaaa tgatttccgc gtctgtggag 600 cgcatcgccg gcatgggcct taagctccgg gtcagcgaat tggacgtggg caccgacgga 660 aacaccgaaa gcagcttcac caagcaggcg gaaaaatacg ccgccatcat gcggctgctg 720 ctggattata aggatcaaat ggaagccgtg caggtatggg gcctcaccga cgatatgagc 780 tggcgccggg ccaactatcc cctgctcttc gacggcaaat tcaaccccaa gcccgccttc 840 tacgccgtgg ctgacccata cgcaaaataa 870 <210> 338 <211> 289 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <400> 338 Met Lys Pro Asp Ser Val Leu Asp Val Asn Ala Ser Lys Lys Leu Ser 1 5 10 15 Ala Gln Asp Glu Thr Ala Val Ala Val Lys Phe Asp Ala Ala Arg Ala 20 25 30 Leu Leu Asp Phe Val Lys Glu Asn Gly Leu Lys Val His Gly His Val 35 40 45 Leu Val Trp His Ser Gln Thr Pro Glu Ala Phe Phe His Glu Gly Tyr 50 55 60 Asp Ala Ala Arg Pro Tyr Val Gly Arg Asp Val Met Leu Gly Arg Met 65 70 75 80 Lys Asn Tyr Ile Lys Ala Val Phe Glu Tyr Thr Glu Thr Asn Tyr Pro 85 90 95 Gly Val Ile Val Ser Trp Asp Val Val Asn Glu Ala Ile Asp Asp Gly 100 105 110 Thr Asn Lys Leu Arg Gln Ser Asn Trp Phe Lys Thr Val Gly Glu Asp 115 120 125 Phe Val Leu Arg Ala Phe Glu Tyr Ala Arg Lys Tyr Ala Pro Glu Gly 130 135 140 Thr Leu Leu Tyr Tyr Asn Asp Tyr Asn Thr Ala Met Pro Gly Lys Leu 145 150 155 160 Asn Gly Ile Ala Asn Leu Leu Lys Ala Leu Ile Ala Glu Gly Asn Ile 165 170 175 Asp Gly Tyr Gly Phe Gln Met His His Ser Val Gly Phe Pro Ser Met 180 185 190 Glu Met Ile Ser Ala Ser Val Glu Arg Ile Ala Gly Met Gly Leu Lys 195 200 205 Leu Arg Val Ser Glu Leu Asp Val Gly Thr Asp Gly Asn Thr Glu Ser 210 215 220 Ser Phe Thr Lys Gln Ala Glu Lys Tyr Ala Ala Ile Met Arg Leu Leu 225 230 235 240 Leu Asp Tyr Lys Asp Gln Met Glu Ala Val Gln Val Trp Gly Leu Thr 245 250 255 Asp Asp Met Ser Trp Arg Arg Ala Asn Tyr Pro Leu Leu Phe Asp Gly 260 265 270 Lys Phe Asn Pro Lys Pro Ala Phe Tyr Ala Val Ala Asp Pro Tyr Ala 275 280 285 Lys <210> 339 <211> 1125 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 339 atgcctatgg agcgacccac tttcttgcgg tttcttgcct tttttcttct ttttaccatg 60 attttcgccg ccggagggtg ccgacccctt gccccttcac ggatggagat cgagacggat 120 atcccctccc tcaaggaagt cgccgcttct tatttcgaga tcggcgcggc cgtcgagccg 180 tatcagttat cctctccacc ccacgatgcc cttctgcgga aacattttaa ctgcctcgtg 240 gcggagaacg tcatgaagcc cgcctccatc cagccatcgg aggggtattt caactggacc 300 gaagcggaca agatcgtgaa ctacgccaaa gcccacggga tgaagctccg cttccatacc 360 ctcgtctggc ataatcaggt cccggattgg ttcttcgcgg gtaacgacaa aacccgcctt 420 ttgcagcgct tggagaatca tatccggact atcattaaaa gatatggcga taaggtcgac 480 tattgggacg tggtgaacga agtaatagac gacaacggcg gtatgcgaaa cagcaagtgg 540 taccagatca ccgggaagga ctacatcaag accgccttcc gggtggcaga cgacgagctc 600 aggaagaatg ggtggaggaa agaaggtcgt cagctctata tcaacgacta caacacccat 660 aacccaacga agagagaggg gatctggcgc ttgatccaag agctccgggc ggaagggatt 720 cccgtcgacg gagtaggcca ccagacgcat atcaatatcg aatggccgcc cgtaagccag 780 atcgtggaat cgatccgctt cttcggcgaa aaaggcctcg ataaccaggt gaccgagctg 840 gatgtgagca tctatacgaa tgacaaggat tcacatggta gttatcaggc catcccgcag 900 gaagtcttca tcaagcaggg taatcgctac aaggaactct ttgaagggct aaaaagtgta 960 aaaaactacc tcagcaacgt caccttctgg ggcatggcgg acgatcatac ctggctgaac 1020 cgttggccca tcgaacggcc cgatgctcct cttcctttcg atatctatct caaggccaag 1080 ccggcgtatt gggggatcgt ggatgctttg aagctttcgc ggtga 1125 <210> 340 <211> 374 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(23) <400> 340 Met Pro Met Glu Arg Pro Thr Phe Leu Arg Phe Leu Ala Phe Phe Leu 1 5 10 15 Leu Phe Thr Met Ile Phe Ala Ala Gly Gly Cys Arg Pro Leu Ala Pro 20 25 30 Ser Arg Met Glu Ile Glu Thr Asp Ile Pro Ser Leu Lys Glu Val Ala 35 40 45 Ala Ser Tyr Phe Glu Ile Gly Ala Ala Val Glu Pro Tyr Gln Leu Ser 50 55 60 Ser Pro Pro His Asp Ala Leu Leu Arg Lys His Phe Asn Cys Leu Val 65 70 75 80 Ala Glu Asn Val Met Lys Pro Ala Ser Ile Gln Pro Ser Glu Gly Tyr 85 90 95 Phe Asn Trp Thr Glu Ala Asp Lys Ile Val Asn Tyr Ala Lys Ala His 100 105 110 Gly Met Lys Leu Arg Phe His Thr Leu Val Trp His Asn Gln Val Pro 115 120 125 Asp Trp Phe Phe Ala Gly Asn Asp Lys Thr Arg Leu Leu Gln Arg Leu 130 135 140 Glu Asn His Ile Arg Thr Ile Ile Lys Arg Tyr Gly Asp Lys Val Asp 145 150 155 160 Tyr Trp Asp Val Val Asn Glu Val Ile Asp Asp Asn Gly Gly Met Arg 165 170 175 Asn Ser Lys Trp Tyr Gln Ile Thr Gly Lys Asp Tyr Ile Lys Thr Ala 180 185 190 Phe Arg Val Ala Asp Asp Glu Leu Arg Lys Asn Gly Trp Arg Lys Glu 195 200 205 Gly Arg Gln Leu Tyr Ile Asn Asp Tyr Asn Thr His Asn Pro Thr Lys 210 215 220 Arg Glu Gly Ile Trp Arg Leu Ile Gln Glu Leu Arg Ala Glu Gly Ile 225 230 235 240 Pro Val Asp Gly Val Gly His Gln Thr His Ile Asn Ile Glu Trp Pro 245 250 255 Pro Val Ser Gln Ile Val Glu Ser Ile Arg Phe Phe Gly Glu Lys Gly 260 265 270 Leu Asp Asn Gln Val Thr Glu Leu Asp Val Ser Ile Tyr Thr Asn Asp 275 280 285 Lys Asp Ser His Gly Ser Tyr Gln Ala Ile Pro Gln Glu Val Phe Ile 290 295 300 Lys Gln Gly Asn Arg Tyr Lys Glu Leu Phe Glu Gly Leu Lys Ser Val 305 310 315 320 Lys Asn Tyr Leu Ser Asn Val Thr Phe Trp Gly Met Ala Asp Asp His 325 330 335 Thr Trp Leu Asn Arg Trp Pro Ile Glu Arg Pro Asp Ala Pro Leu Pro 340 345 350 Phe Asp Ile Tyr Leu Lys Ala Lys Pro Ala Tyr Trp Gly Ile Val Asp 355 360 365 Ala Leu Lys Leu Ser Arg 370 <210> 341 <211> 1347 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 341 atgacaatta acaacaaaac tacagcgagt cctagtattc ccagcaccca caattccctc 60 ccgtcgcttc gcacactgtt taccaccagc ctgctcacgc tggccctgac cgcctgcggt 120 ggttcttcca gcagcgacaa ggacccttca agctccagct ccagtgaatc atcaagttcc 180 agcgaatcct cgagctcagc ttccagcgaa tcctcgagca gtgagtccag cagtagctct 240 tccgcgggcc atttctccat cgagccggac ttccagctct acagcctggc caacttcccg 300 gtgggcgtgg cggtctccgc cgccaacgag aacgacagca tcttcaacag tccggatgcc 360 gccgaacgtc aggccgttat tattgagcac ttctctcagc tcaccgccgg caacatcatg 420 aaaatgagct acctgcagcc gagtcaaggc aacttcacct tcgatgacgc cgacgagttg 480 gttaacttcg cccaagccaa tggcatgacc gtacacggcc actccaccat ctggcacgcg 540 gactaccaag taccgaactt catgagaaac tttgaaggtg accaggagga atgggcagaa 600 attctgaccg atcacgtcac taccatcatc gagcacttcc ccgacgatgt ggtcatcagc 660 tgggacgtgg tgaacgaggc tgtcgatcaa ggcacggcga acggctggcg ccattcggtg 720 ttctacaatg cattcgacgc cccggaagaa ggcgacattc ccgaatacat caaagtcgct 780 ttccgcgccg cgcgcgaggc tgacgccaac gtagacctct actacaacga ctacgacaat 840 accgccaatg cccagcgcct ggccaaaaca ctgcaaattg ccgaggtact ggacgccgaa 900 ggcaccattg acggcgtcgg tttccagatg cacgcctaca tggattaccc gagcctgacc 960 cattttgaaa acgccttccg gcaagtcgtc gacctggggc tcaaagtgaa agttaccgag 1020 ctggacgtat ccgtagtcaa cccctacggc ggcgaagcac ctccacaacc ggaatacgac 1080 aaagaactgg ccggcgcgca aaaactgcgc ttctgccaaa tcgccgaagt ttacatgaac 1140 actgtacccg aggagttacg cggtggcttc accgtctggg gcctgaccga tgatgaaagt 1200 tggctgatgc aacagttcag aaacgccacc ggcgccgact acgacgacgt ctggccgtta 1260 ctgttcaatg ccgacaaatc cgccaaaccg gcactgcaag gcgtggccga cgcctttacc 1320 ggacaaacct gcacctccga gttctaa 1347 <210> 342 <211> 448 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(45) <400> 342 Met Thr Ile Asn Asn Lys Thr Thr Ala Ser Pro Ser Ile Pro Ser Thr 1 5 10 15 His Asn Ser Leu Pro Ser Leu Arg Thr Leu Phe Thr Thr Ser Leu Leu 20 25 30 Thr Leu Ala Leu Thr Ala Cys Gly Gly Ser Ser Ser Ser Asp Lys Asp 35 40 45 Pro Ser Ser Ser Ser Ser Ser Glu Ser Ser Ser Ser Ser Glu Ser Ser 50 55 60 Ser Ser Ala Ser Ser Glu Ser Ser Ser Ser Glu Ser Ser Ser Ser Ser 65 70 75 80 Ser Ala Gly His Phe Ser Ile Glu Pro Asp Phe Gln Leu Tyr Ser Leu 85 90 95 Ala Asn Phe Pro Val Gly Val Ala Val Ser Ala Ala Asn Glu Asn Asp 100 105 110 Ser Ile Phe Asn Ser Pro Asp Ala Ala Glu Arg Gln Ala Val Ile Ile 115 120 125 Glu His Phe Ser Gln Leu Thr Ala Gly Asn Ile Met Lys Met Ser Tyr 130 135 140 Leu Gln Pro Ser Gln Gly Asn Phe Thr Phe Asp Asp Ala Asp Glu Leu 145 150 155 160 Val Asn Phe Ala Gln Ala Asn Gly Met Thr Val His Gly His Ser Thr 165 170 175 Ile Trp His Ala Asp Tyr Gln Val Pro Asn Phe Met Arg Asn Phe Glu 180 185 190 Gly Asp Gln Glu Glu Trp Ala Glu Ile Leu Thr Asp His Val Thr Thr 195 200 205 Ile Ile Glu His Phe Pro Asp Asp Val Val Ile Ser Trp Asp Val Val 210 215 220 Asn Glu Ala Val Asp Gln Gly Thr Ala Asn Gly Trp Arg His Ser Val 225 230 235 240 Phe Tyr Asn Ala Phe Asp Ala Pro Glu Glu Gly Asp Ile Pro Glu Tyr 245 250 255 Ile Lys Val Ala Phe Arg Ala Ala Arg Glu Ala Asp Ala Asn Val Asp 260 265 270 Leu Tyr Tyr Asn Asp Tyr Asp Asn Thr Ala Asn Ala Gln Arg Leu Ala 275 280 285 Lys Thr Leu Gln Ile Ala Glu Val Leu Asp Ala Glu Gly Thr Ile Asp 290 295 300 Gly Val Gly Phe Gln Met His Ala Tyr Met Asp Tyr Pro Ser Leu Thr 305 310 315 320 His Phe Glu Asn Ala Phe Arg Gln Val Val Asp Leu Gly Leu Lys Val 325 330 335 Lys Val Thr Glu Leu Asp Val Ser Val Val Asn Pro Tyr Gly Gly Glu 340 345 350 Ala Pro Pro Gln Pro Glu Tyr Asp Lys Glu Leu Ala Gly Ala Gln Lys 355 360 365 Leu Arg Phe Cys Gln Ile Ala Glu Val Tyr Met Asn Thr Val Pro Glu 370 375 380 Glu Leu Arg Gly Gly Phe Thr Val Trp Gly Leu Thr Asp Asp Glu Ser 385 390 395 400 Trp Leu Met Gln Gln Phe Arg Asn Ala Thr Gly Ala Asp Tyr Asp Asp 405 410 415 Val Trp Pro Leu Leu Phe Asn Ala Asp Lys Ser Ala Lys Pro Ala Leu 420 425 430 Gln Gly Val Ala Asp Ala Phe Thr Gly Gln Thr Cys Thr Ser Glu Phe 435 440 445 <210> 343 <211> 2217 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 343 atggtggagc acgaagctga gcttcatgat taccgcgaac gaatatgcga agttgcttgg 60 caattcgctg ggcctggagg gcgagaaggc aaagcggatt ttgcgggaaa tcaacaactg 120 gctgttttga agatgaaatt atcgagaggg agggggcatg gcgttttgaa acgagcaggt 180 ctgattgggc ttattgcagc gatattgggc tgcgcggcgc tgcttatgca caatgagatc 240 tcatccctgg gaattcagct gagatcatgg ctcagaggga gcgacaatgt gaacgctagc 300 tgggaaaagg attggaagac ggctgctaac gagcaaatcg agcagctccg caagcgcaat 360 gtggagatcg aggtcgtcga tctgaacgga aacccgctgc ctggggctac cgttcgcgcg 420 gttcagcgca cgcatcagtt tggcttcggc accgccatca accgaacggc gttgagcaat 480 ccggtgtacg ccgattttgt caaaaaccgt ttcgaatggg tgaccttcga gaacgaggcc 540 aagtggctct ggaatgaggc cgtacaaggg cgggtctatt atcgggaggc cgatcagctg 600 ctcgaatttg ccaggcaaaa cgggctgaag gtgcgcggac ataatctgtt ctgggaggcg 660 gagaaatatc agccgcagtg ggtgaagagt ctgacgggcg ctgcgctgaa ggaagcgatc 720 gataaccggc tgaacagcgc cgtcctgcat tttaagggca attttctgca ctgggacgtc 780 aacaacgaaa tgtttcacgg cagcttcttc aaggatcgcc tgggggaaga aatctggacc 840 tatatgtata agcgaacccg ggaactcgat cccggcgtca agctgttcgt caacgattac 900 aattttatcg agtacccgcc ggagcgggat tataaccagg tcattcaagc gctcatcgat 960 cgggggatgc cgattgacgg catcggcgcg caagggcatt ttaacggagt catcgatccc 1020 ttgttcgtta agggaagact ggataagctg gctgagctga atctgccgat ctggattacc 1080 gaattcgatt ccacgcataa ggacgagaga gtccgtgccg ataatctgga gaagatgtat 1140 cggctggcgt tcgcccatcc ggcggtcgaa gggattgtca tgtggggctt ctgggcgggc 1200 tcccattgga agggcactga cggcgcgatc gtgaatcaag actggacgct caatgccgcc 1260 ggacagcgat accagcagct tatggatgaa tggacgacgg tcgtcgaagg cacgaccgat 1320 cagcgcggca tgttttcgtt ccgggggttc cacggaacct acgatatgct ggtcgattac 1380 cctggagcgg cggctgtgaa gcagtccttt accttggagc ccggctctgg caatgcgaag 1440 ctgcacattc cgttcgacgt tcaggacaag tccatcccgg aggctcctgc caagctcagc 1500 gccgctgccg cggattccca ggttatgctg agctggagca aggtcaacgg ggcaaccggc 1560 tatacggtta aaagcgcggt cagcgccgac ggtccctata cgccgattgc ccatcagctg 1620 ctcaccgaga ccttcacgca catcggtcta gtgaaccgga aagattatta ttacgtggtg 1680 agcgccagca accatctagg tgagagcccg gattccgccc cgatccgggc cactccgcgt 1740 gccgcgggcg agttacaaac gaatctcgtg cttcagtacc gctccgctga tggagataac 1800 aactatcaaa tgaagcctca gttcacgatc aagaacgcag gcaaagtgcc catcccgtta 1860 agcgagctga cgatccgcta ctatttcacg ccggagagca cgcagccggt ggataccagg 1920 atcgactggg cccaattcgg agcagagcat gtccagacga cggtcgttcc gccatccgat 1980 gccgcggcgc acgcctatgt cgagctcagc ttcctggagt cggcaggggc catcccttcc 2040 gatacgacat taggcaatat tcagctgcgc atctttaaca gcgatggctc ttcgttcgat 2100 aaaacgaacg attattcctt cgacccgacg aaaaaggctt atacggcgtg ggagaaggtc 2160 acgctttatc ggaacgggga actggtttgg gggatagagc cttggggcgc gaagtaa 2217 <210> 344 <211> 738 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <400> 344 Met Val Glu His Glu Ala Glu Leu His Asp Tyr Arg Glu Arg Ile Cys 1 5 10 15 Glu Val Ala Trp Gln Phe Ala Gly Pro Gly Gly Arg Glu Gly Lys Ala 20 25 30 Asp Phe Ala Gly Asn Gln Gln Leu Ala Val Leu Lys Met Lys Leu Ser 35 40 45 Arg Gly Arg Gly His Gly Val Leu Lys Arg Ala Gly Leu Ile Gly Leu 50 55 60 Ile Ala Ala Ile Leu Gly Cys Ala Ala Leu Leu Met His Asn Glu Ile 65 70 75 80 Ser Ser Leu Gly Ile Gln Leu Arg Ser Trp Leu Arg Gly Ser Asp Asn 85 90 95 Val Asn Ala Ser Trp Glu Lys Asp Trp Lys Thr Ala Ala Asn Glu Gln 100 105 110 Ile Glu Gln Leu Arg Lys Arg Asn Val Glu Ile Glu Val Val Asp Leu 115 120 125 Asn Gly Asn Pro Leu Pro Gly Ala Thr Val Arg Ala Val Gln Arg Thr 130 135 140 His Gln Phe Gly Phe Gly Thr Ala Ile Asn Arg Thr Ala Leu Ser Asn 145 150 155 160 Pro Val Tyr Ala Asp Phe Val Lys Asn Arg Phe Glu Trp Val Thr Phe 165 170 175 Glu Asn Glu Ala Lys Trp Leu Trp Asn Glu Ala Val Gln Gly Arg Val 180 185 190 Tyr Tyr Arg Glu Ala Asp Gln Leu Leu Glu Phe Ala Arg Gln Asn Gly 195 200 205 Leu Lys Val Arg Gly His Asn Leu Phe Trp Glu Ala Glu Lys Tyr Gln 210 215 220 Pro Gln Trp Val Lys Ser Leu Thr Gly Ala Ala Leu Lys Glu Ala Ile 225 230 235 240 Asp Asn Arg Leu Asn Ser Ala Val Leu His Phe Lys Gly Asn Phe Leu 245 250 255 His Trp Asp Val Asn Asn Glu Met Phe His Gly Ser Phe Phe Lys Asp 260 265 270 Arg Leu Gly Glu Glu Ile Trp Thr Tyr Met Tyr Lys Arg Thr Arg Glu 275 280 285 Leu Asp Pro Gly Val Lys Leu Phe Val Asn Asp Tyr Asn Phe Ile Glu 290 295 300 Tyr Pro Pro Glu Arg Asp Tyr Asn Gln Val Ile Gln Ala Leu Ile Asp 305 310 315 320 Arg Gly Met Pro Ile Asp Gly Ile Gly Ala Gln Gly His Phe Asn Gly 325 330 335 Val Ile Asp Pro Leu Phe Val Lys Gly Arg Leu Asp Lys Leu Ala Glu 340 345 350 Leu Asn Leu Pro Ile Trp Ile Thr Glu Phe Asp Ser Thr His Lys Asp 355 360 365 Glu Arg Val Arg Ala Asp Asn Leu Glu Lys Met Tyr Arg Leu Ala Phe 370 375 380 Ala His Pro Ala Val Glu Gly Ile Val Met Trp Gly Phe Trp Ala Gly 385 390 395 400 Ser His Trp Lys Gly Thr Asp Gly Ala Ile Val Asn Gln Asp Trp Thr 405 410 415 Leu Asn Ala Ala Gly Gln Arg Tyr Gln Gln Leu Met Asp Glu Trp Thr 420 425 430 Thr Val Val Glu Gly Thr Thr Asp Gln Arg Gly Met Phe Ser Phe Arg 435 440 445 Gly Phe His Gly Thr Tyr Asp Met Leu Val Asp Tyr Pro Gly Ala Ala 450 455 460 Ala Val Lys Gln Ser Phe Thr Leu Glu Pro Gly Ser Gly Asn Ala Lys 465 470 475 480 Leu His Ile Pro Phe Asp Val Gln Asp Lys Ser Ile Pro Glu Ala Pro 485 490 495 Ala Lys Leu Ser Ala Ala Ala Ala Asp Ser Gln Val Met Leu Ser Trp 500 505 510 Ser Lys Val Asn Gly Ala Thr Gly Tyr Thr Val Lys Ser Ala Val Ser 515 520 525 Ala Asp Gly Pro Tyr Thr Pro Ile Ala His Gln Leu Leu Thr Glu Thr 530 535 540 Phe Thr His Ile Gly Leu Val Asn Arg Lys Asp Tyr Tyr Tyr Val Val 545 550 555 560 Ser Ala Ser Asn His Leu Gly Glu Ser Pro Asp Ser Ala Pro Ile Arg 565 570 575 Ala Thr Pro Arg Ala Ala Gly Glu Leu Gln Thr Asn Leu Val Leu Gln 580 585 590 Tyr Arg Ser Ala Asp Gly Asp Asn Asn Tyr Gln Met Lys Pro Gln Phe 595 600 605 Thr Ile Lys Asn Ala Gly Lys Val Pro Ile Pro Leu Ser Glu Leu Thr 610 615 620 Ile Arg Tyr Tyr Phe Thr Pro Glu Ser Thr Gln Pro Val Asp Thr Arg 625 630 635 640 Ile Asp Trp Ala Gln Phe Gly Ala Glu His Val Gln Thr Thr Val Val 645 650 655 Pro Pro Ser Asp Ala Ala Ala His Ala Tyr Val Glu Leu Ser Phe Leu 660 665 670 Glu Ser Ala Gly Ala Ile Pro Ser Asp Thr Thr Leu Gly Asn Ile Gln 675 680 685 Leu Arg Ile Phe Asn Ser Asp Gly Ser Ser Phe Asp Lys Thr Asn Asp 690 695 700 Tyr Ser Phe Asp Pro Thr Lys Lys Ala Tyr Thr Ala Trp Glu Lys Val 705 710 715 720 Thr Leu Tyr Arg Asn Gly Glu Leu Val Trp Gly Ile Glu Pro Trp Gly 725 730 735 Ala Lys <210> 345 <211> 849 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 345 atgaagatga cctacatgca tccggctgaa gatacttact cgtttggtca agcggatcag 60 ttggtcaact gggcgaaagc gaatggtatt ggcgtgcacg gccacactct ggtttggcac 120 tccgaatacc aggtacccaa ttggatgaaa aattactctg gtgatgcaac tgcattccaa 180 accatgctca acacccatgt gaaaactgtg gctgagcatt ttgctggcga actggacagc 240 tgggacgttg tgaatgaagt gctggagccg ggctccaatg gttgctggcg tgaaaactct 300 ctgttctacc agaagcttgg caaagacttt gtcgcgaacg cattccgtgc agctcgcgag 360 ggcgatccca atgcagactt gtattacaac gattactcga ctgaaaatgg tgtaacttcc 420 gatgagaagt tcagttgttt gttggaacta gtcgatgagc ttctggaagc ggacgtgccg 480 attacaggtg ttggtttcca aatgcacgtg caggcgacgt ggcctagcaa tgccaacatc 540 ggcaaggcat tcaaagccat cgcggatcgc ggtctgaaag ttaaaatttc tgagctcgat 600 gttcctgtta acaaccctta cggaaccact aatttcccgc aatacagcag ttttaccgcg 660 gaagccgccg agctgcagaa gcagcgctac aagggcatta tgcaagcgta ccttgataac 720 gtaccggcca acctgcgtgg tggtttcacc gtgtggggcg tttgggatgg cgatagctgg 780 atcatgacgt tcagccagta caccaacgct aacgccaacg actggccact gttgttcacc 840 gggccgtag 849 <210> 346 <211> 282 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <400> 346 Met Lys Met Thr Tyr Met His Pro Ala Glu Asp Thr Tyr Ser Phe Gly 1 5 10 15 Gln Ala Asp Gln Leu Val Asn Trp Ala Lys Ala Asn Gly Ile Gly Val 20 25 30 His Gly His Thr Leu Val Trp His Ser Glu Tyr Gln Val Pro Asn Trp 35 40 45 Met Lys Asn Tyr Ser Gly Asp Ala Thr Ala Phe Gln Thr Met Leu Asn 50 55 60 Thr His Val Lys Thr Val Ala Glu His Phe Ala Gly Glu Leu Asp Ser 65 70 75 80 Trp Asp Val Val Asn Glu Val Leu Glu Pro Gly Ser Asn Gly Cys Trp 85 90 95 Arg Glu Asn Ser Leu Phe Tyr Gln Lys Leu Gly Lys Asp Phe Val Ala 100 105 110 Asn Ala Phe Arg Ala Ala Arg Glu Gly Asp Pro Asn Ala Asp Leu Tyr 115 120 125 Tyr Asn Asp Tyr Ser Thr Glu Asn Gly Val Thr Ser Asp Glu Lys Phe 130 135 140 Ser Cys Leu Leu Glu Leu Val Asp Glu Leu Leu Glu Ala Asp Val Pro 145 150 155 160 Ile Thr Gly Val Gly Phe Gln Met His Val Gln Ala Thr Trp Pro Ser 165 170 175 Asn Ala Asn Ile Gly Lys Ala Phe Lys Ala Ile Ala Asp Arg Gly Leu 180 185 190 Lys Val Lys Ile Ser Glu Leu Asp Val Pro Val Asn Asn Pro Tyr Gly 195 200 205 Thr Thr Asn Phe Pro Gln Tyr Ser Ser Phe Thr Ala Glu Ala Ala Glu 210 215 220 Leu Gln Lys Gln Arg Tyr Lys Gly Ile Met Gln Ala Tyr Leu Asp Asn 225 230 235 240 Val Pro Ala Asn Leu Arg Gly Gly Phe Thr Val Trp Gly Val Trp Asp 245 250 255 Gly Asp Ser Trp Ile Met Thr Phe Ser Gln Tyr Thr Asn Ala Asn Ala 260 265 270 Asn Asp Trp Pro Leu Leu Phe Thr Gly Pro 275 280 <210> 347 <211> 1794 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 347 atgcccgttt tgttcgccct gtttcttgtt gcctcgtcct gcgcggcgca gtcgctggcc 60 gggccggttt ccctgcttgg cggagatgcg ggcgcggcgt tccgctatac cgggccatcg 120 gcgggcgcgg cgagcggctc ggccgaatgg gtggcggtgg agaacatgcc gttcacgcac 180 gcctggcggc tgcgcacgaa tccgctgccg gagagcggcg gcaacgaatg ggacctgcgc 240 atccgcgccc gcggagcggc ggctgtttcg gcaggggaca agatcctggc cgagttctgg 300 atgcgctgcg tggagcccga aaacggcgac tgcattctgc gcctgaacgt ggagcgcgac 360 gggtcgccgt ggaccaaatc catcagcaac ccctacccgg tgggccggga gtggcggcgg 420 ttccgcgtgc tgttcgagat gcgggagagc tacgccgccg gcggctacat gatcgatttc 480 tggatgggcc agcaggtgca gacggcggaa gtgggcggga tttccctgct gaattacggt 540 ccgcaggcca cggccgagca gcttggcctg gaccggtttt atgagggcgc ggcggcggac 600 gccgcgtggc ggcaggcggc cgagcagcgg atcgaggaga tccggaaagc gggcatgatc 660 atcgtggcgg tgacgccgga cggcgagccg atcgagggcg ctgaaatccg ggcgaagctg 720 aagcggcacg cgttcgggtg gggcacggct gtggcggcat cacggcttct ggggacggga 780 acggacagcg agcgctaccg caacttcatc cgcgagaact tcaacatggc ggtgctcgag 840 aacgacctga aatggggccc gttcgaagag aaccgcaacc gcgcgatgaa cgcgctgcgc 900 tggctgcatg agaacgggat cacgtggatc cgcgggcaca atctcgtctg gccgggctgg 960 cggtggatgc cgaacgacgt gcgcaacctg gcgaacaatc ccgaggcgct gcggcagcgg 1020 attctggacc gcatccggga cacggccacg gccacgcgcg ggctggtggt gcactgggac 1080 gtcgtcaacg agccggtggc cgagcgcgac gtgctgaaca ttctgggcga cgaggtgatg 1140 gcggactggt tccgcgccgc gaaggagtgc gatcccgagg cgaggatgtt catcaatgag 1200 tacgacattc tggcggcgaa cggggccaat ctgcggaagc agaacgcgta ttaccgcatg 1260 atcgagatgc tgttgaagct cgaggcgccg gtggagggca tcggcttcca gggccacttc 1320 gacacggcca cgccgccgga gcggatgctg gagatcatga accggtacgc ccggctcggg 1380 ctgccgatcg ccatcaccga gtacgatttc gccacggcgg acgaggagct gcaggcgcag 1440 ttcacgcgcg acctgatgat tctcgccttc agccatccgg cggtttcgga cttcctgatg 1500 tggggcttct gggaagggag ccactggaag ccgctgggcg ccatgatccg gcgcgactgg 1560 agcgagaagc cgatgtaccg cgtctggcgc gagctgatct tcgagcgctg gcagacggat 1620 gaaacaggcg tgacgccgga gcacggtgcc atctacgtgc ggggcttcaa gggcgactac 1680 gagatcacgg tgaaggcggg cgggcaggaa gtccgggtgc cgtacacgct gaaagaagac 1740 ggccaggtgc tgtgggtgac ggtgggcggg gcttctgaag agcgcgtgca gtaa 1794 <210> 348 <211> 597 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(20) <400> 348 Met Pro Val Leu Phe Ala Leu Phe Leu Val Ala Ser Ser Cys Ala Ala 1 5 10 15 Gln Ser Leu Ala Gly Pro Val Ser Leu Leu Gly Gly Asp Ala Gly Ala 20 25 30 Ala Phe Arg Tyr Thr Gly Pro Ser Ala Gly Ala Ala Ser Gly Ser Ala 35 40 45 Glu Trp Val Ala Val Glu Asn Met Pro Phe Thr His Ala Trp Arg Leu 50 55 60 Arg Thr Asn Pro Leu Pro Glu Ser Gly Gly Asn Glu Trp Asp Leu Arg 65 70 75 80 Ile Arg Ala Arg Gly Ala Ala Ala Val Ser Ala Gly Asp Lys Ile Leu 85 90 95 Ala Glu Phe Trp Met Arg Cys Val Glu Pro Glu Asn Gly Asp Cys Ile 100 105 110 Leu Arg Leu Asn Val Glu Arg Asp Gly Ser Pro Trp Thr Lys Ser Ile 115 120 125 Ser Asn Pro Tyr Pro Val Gly Arg Glu Trp Arg Arg Phe Arg Val Leu 130 135 140 Phe Glu Met Arg Glu Ser Tyr Ala Ala Gly Gly Tyr Met Ile Asp Phe 145 150 155 160 Trp Met Gly Gln Gln Val Gln Thr Ala Glu Val Gly Gly Ile Ser Leu 165 170 175 Leu Asn Tyr Gly Pro Gln Ala Thr Ala Glu Gln Leu Gly Leu Asp Arg 180 185 190 Phe Tyr Glu Gly Ala Ala Ala Asp Ala Ala Trp Arg Gln Ala Ala Glu 195 200 205 Gln Arg Ile Glu Glu Ile Arg Lys Ala Gly Met Ile Ile Val Ala Val 210 215 220 Thr Pro Asp Gly Glu Pro Ile Glu Gly Ala Glu Ile Arg Ala Lys Leu 225 230 235 240 Lys Arg His Ala Phe Gly Trp Gly Thr Ala Val Ala Ala Ser Arg Leu 245 250 255 Leu Gly Thr Gly Thr Asp Ser Glu Arg Tyr Arg Asn Phe Ile Arg Glu 260 265 270 Asn Phe Asn Met Ala Val Leu Glu Asn Asp Leu Lys Trp Gly Pro Phe 275 280 285 Glu Glu Asn Arg Asn Arg Ala Met Asn Ala Leu Arg Trp Leu His Glu 290 295 300 Asn Gly Ile Thr Trp Ile Arg Gly His Asn Leu Val Trp Pro Gly Trp 305 310 315 320 Arg Trp Met Pro Asn Asp Val Arg Asn Leu Ala Asn Asn Pro Glu Ala 325 330 335 Leu Arg Gln Arg Ile Leu Asp Arg Ile Arg Asp Thr Ala Thr Ala Thr 340 345 350 Arg Gly Leu Val Val His Trp Asp Val Val Asn Glu Pro Val Ala Glu 355 360 365 Arg Asp Val Leu Asn Ile Leu Gly Asp Glu Val Met Ala Asp Trp Phe 370 375 380 Arg Ala Ala Lys Glu Cys Asp Pro Glu Ala Arg Met Phe Ile Asn Glu 385 390 395 400 Tyr Asp Ile Leu Ala Ala Asn Gly Ala Asn Leu Arg Lys Gln Asn Ala 405 410 415 Tyr Tyr Arg Met Ile Glu Met Leu Leu Lys Leu Glu Ala Pro Val Glu 420 425 430 Gly Ile Gly Phe Gln Gly His Phe Asp Thr Ala Thr Pro Pro Glu Arg 435 440 445 Met Leu Glu Ile Met Asn Arg Tyr Ala Arg Leu Gly Leu Pro Ile Ala 450 455 460 Ile Thr Glu Tyr Asp Phe Ala Thr Ala Asp Glu Glu Leu Gln Ala Gln 465 470 475 480 Phe Thr Arg Asp Leu Met Ile Leu Ala Phe Ser His Pro Ala Val Ser 485 490 495 Asp Phe Leu Met Trp Gly Phe Trp Glu Gly Ser His Trp Lys Pro Leu 500 505 510 Gly Ala Met Ile Arg Arg Asp Trp Ser Glu Lys Pro Met Tyr Arg Val 515 520 525 Trp Arg Glu Leu Ile Phe Glu Arg Trp Gln Thr Asp Glu Thr Gly Val 530 535 540 Thr Pro Glu His Gly Ala Ile Tyr Val Arg Gly Phe Lys Gly Asp Tyr 545 550 555 560 Glu Ile Thr Val Lys Ala Gly Gly Gln Glu Val Arg Val Pro Tyr Thr 565 570 575 Leu Lys Glu Asp Gly Gln Val Leu Trp Val Thr Val Gly Gly Ala Ser 580 585 590 Glu Glu Arg Val Gln 595 <210> 349 <211> 1794 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 349 atgcccgttt tgttcgccct gtttcttgtt gcctcgtcct gcgcggcgca gtcgctggcc 60 gggccggttt ccctgcttgg cggagatgcg ggcgcggcgt tccgctatac cgggccatcg 120 gcgggcgcgg cgagcggctc ggccgaatgg gtggcggtgg agaacatgcc gttcacgcac 180 gcctggcggc tgcgcacgaa tccgctgccg gagagcggcg gcaacgaatg ggacctgcgc 240 atccgcgccc gcggagcggc ggctgtttcg gcaggggaca agatcctggc cgagttctgg 300 atgcgctgcg tggagcccga aaacggcgac tgcattctgc gcctgaacgt ggagcgcgac 360 gggtcgccgt ggaccaaatc catcagcaac ccctacccgg tgggccggga gtggcggcgg 420 ttccgcgtgc tgttcgagat gcgggagagc tacgccgccg gcggctacat gatcgatttc 480 tggatgggcc agcaggtgca gacggcggaa gtgggcggga tttccctgct gaattacggt 540 ccgcaggcca cggccgagca gcttggcctg gaccggttct atgaaggcgc ggcggcggac 600 gccgcgtggc ggcaggcggc cgagcagcgg atcgaggaga tccggaaagc gggcatgatc 660 atcgtggcgg tgacgccgga cggcgagccg atcgaaggcg ccgagatccg ggcgaagctg 720 aagcggcacg cgttcgggtg gggcacggcg gtggcggcat cacggcttct ggggacggga 780 acggacagcg agcgctaccg caacttcatc cgcgagaact tcaacatggc ggtgctcgag 840 aacgacctga aatggggccc gttcgaggag aaccgcgccc gcgcaatgaa cgcgctgcgc 900 tggctgcatg agaacgggat cacgtggatc cgcgggcaca atctcgtctg gccaggctgg 960 cggtggatgc cgagcgacgt gcgcaacctg gcgaacaatc ccgaagccct gcggcagcgg 1020 attctggacc gcatccggga cacggccacc gccacgcgcg ggctggtcgt gcactgggac 1080 gtcgtcaacg agccggtggc cgagcgcgac gtgctgaaca ttctgggcga cgaggtgatg 1140 gcggactggt tccgcgccgc gaaggagtgc gatcccgagg cgaggatgtt catcaacgaa 1200 tacgacattc tggcggcgaa cggggccaac ctgcggaagc agaacgcgta ctaccgcatg 1260 atcgagatgc tgttgaagct cgaggcgccg gtagagggca tcggcttcca gggccatttc 1320 gacacggcta cgccgccgga gcggatgctg gagatcatga accggtacgc ccggctcggg 1380 ctgccgatcg ccatcaccga gtacgatttc gccacggtag acgaagagct gcaggcgcag 1440 ttcacgcgcg acctgatgat tctcgctttc agccatccgg cggtttcgga cttcttgatg 1500 tggggcttct gggaagggag ccactggaag ccgctgggcg ccatgatccg gcgcgactgg 1560 agcgagaagc cgatgtaccg cgtctggcgc gagctgatct tcgagcgctg gcagacggat 1620 gaaacgggag tgacgccgga gcacggggcc atctacgtgc ggggcttcaa gggcgactac 1680 gaaatcacgg tgaaggctgg cgggcaggaa gtccgggtgc cgtacacgct gaaagaagac 1740 ggccaggtgc tgtgggtgac ggtgggcggt acttctgaag agcaggcgcc gtaa 1794 <210> 350 <211> 597 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(20) <400> 350 Met Pro Val Leu Phe Ala Leu Phe Leu Val Ala Ser Ser Cys Ala Ala 1 5 10 15 Gln Ser Leu Ala Gly Pro Val Ser Leu Leu Gly Gly Asp Ala Gly Ala 20 25 30 Ala Phe Arg Tyr Thr Gly Pro Ser Ala Gly Ala Ala Ser Gly Ser Ala 35 40 45 Glu Trp Val Ala Val Glu Asn Met Pro Phe Thr His Ala Trp Arg Leu 50 55 60 Arg Thr Asn Pro Leu Pro Glu Ser Gly Gly Asn Glu Trp Asp Leu Arg 65 70 75 80 Ile Arg Ala Arg Gly Ala Ala Ala Val Ser Ala Gly Asp Lys Ile Leu 85 90 95 Ala Glu Phe Trp Met Arg Cys Val Glu Pro Glu Asn Gly Asp Cys Ile 100 105 110 Leu Arg Leu Asn Val Glu Arg Asp Gly Ser Pro Trp Thr Lys Ser Ile 115 120 125 Ser Asn Pro Tyr Pro Val Gly Arg Glu Trp Arg Arg Phe Arg Val Leu 130 135 140 Phe Glu Met Arg Glu Ser Tyr Ala Ala Gly Gly Tyr Met Ile Asp Phe 145 150 155 160 Trp Met Gly Gln Gln Val Gln Thr Ala Glu Val Gly Gly Ile Ser Leu 165 170 175 Leu Asn Tyr Gly Pro Gln Ala Thr Ala Glu Gln Leu Gly Leu Asp Arg 180 185 190 Phe Tyr Glu Gly Ala Ala Ala Asp Ala Ala Trp Arg Gln Ala Ala Glu 195 200 205 Gln Arg Ile Glu Glu Ile Arg Lys Ala Gly Met Ile Ile Val Ala Val 210 215 220 Thr Pro Asp Gly Glu Pro Ile Glu Gly Ala Glu Ile Arg Ala Lys Leu 225 230 235 240 Lys Arg His Ala Phe Gly Trp Gly Thr Ala Val Ala Ala Ser Arg Leu 245 250 255 Leu Gly Thr Gly Thr Asp Ser Glu Arg Tyr Arg Asn Phe Ile Arg Glu 260 265 270 Asn Phe Asn Met Ala Val Leu Glu Asn Asp Leu Lys Trp Gly Pro Phe 275 280 285 Glu Glu Asn Arg Ala Arg Ala Met Asn Ala Leu Arg Trp Leu His Glu 290 295 300 Asn Gly Ile Thr Trp Ile Arg Gly His Asn Leu Val Trp Pro Gly Trp 305 310 315 320 Arg Trp Met Pro Ser Asp Val Arg Asn Leu Ala Asn Asn Pro Glu Ala 325 330 335 Leu Arg Gln Arg Ile Leu Asp Arg Ile Arg Asp Thr Ala Thr Ala Thr 340 345 350 Arg Gly Leu Val Val His Trp Asp Val Val Asn Glu Pro Val Ala Glu 355 360 365 Arg Asp Val Leu Asn Ile Leu Gly Asp Glu Val Met Ala Asp Trp Phe 370 375 380 Arg Ala Ala Lys Glu Cys Asp Pro Glu Ala Arg Met Phe Ile Asn Glu 385 390 395 400 Tyr Asp Ile Leu Ala Ala Asn Gly Ala Asn Leu Arg Lys Gln Asn Ala 405 410 415 Tyr Tyr Arg Met Ile Glu Met Leu Leu Lys Leu Glu Ala Pro Val Glu 420 425 430 Gly Ile Gly Phe Gln Gly His Phe Asp Thr Ala Thr Pro Pro Glu Arg 435 440 445 Met Leu Glu Ile Met Asn Arg Tyr Ala Arg Leu Gly Leu Pro Ile Ala 450 455 460 Ile Thr Glu Tyr Asp Phe Ala Thr Val Asp Glu Glu Leu Gln Ala Gln 465 470 475 480 Phe Thr Arg Asp Leu Met Ile Leu Ala Phe Ser His Pro Ala Val Ser 485 490 495 Asp Phe Leu Met Trp Gly Phe Trp Glu Gly Ser His Trp Lys Pro Leu 500 505 510 Gly Ala Met Ile Arg Arg Asp Trp Ser Glu Lys Pro Met Tyr Arg Val 515 520 525 Trp Arg Glu Leu Ile Phe Glu Arg Trp Gln Thr Asp Glu Thr Gly Val 530 535 540 Thr Pro Glu His Gly Ala Ile Tyr Val Arg Gly Phe Lys Gly Asp Tyr 545 550 555 560 Glu Ile Thr Val Lys Ala Gly Gly Gln Glu Val Arg Val Pro Tyr Thr 565 570 575 Leu Lys Glu Asp Gly Gln Val Leu Trp Val Thr Val Gly Gly Thr Ser 580 585 590 Glu Glu Gln Ala Pro 595 <210> 351 <211> 1860 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 351 atgcaccttc caaattaccg ctcgctcgca acggcgctca gtcgctacag ttgctcggcg 60 ctgctggccg tcagtcttgt ggcctgcggg ggcaataatg accaagatcc gccgaccccg 120 gagccaactc cggtcccaac gccgactcca actccaaccc cgaccccgac tccggagcca 180 accccgactc cgactccgga gcccactccg actccagagc caactccgac gccgaccccg 240 gaaccaacac cgacgccgga gccgacgcca acaccggatc ccggggccga ctaccagccg 300 cccagcaatg acattgccgt caatggcgac gtggaaagcg gtactaccaa ctggggtgca 360 cgcggttcgg catccattag ccgagtcact ttagagagct ttgaaggtga tgccagcttg 420 agtgttaccg gccgagaaga cgactggcat ggcgccacct tctctgtagg ccatctgacc 480 ccgggtaata gctatgaagt ggctgcgtgg gtcaagttag cctcaggcga gcccaacaca 540 gtggtcaaaa tcacgggtaa gcgcgagggc gagagcgcga cttacgaaga gtacacggat 600 gtcggtacgg cattggctac cgacggtagc tggaccgaaa ttaccggcac ttatattcct 660 gatagcgcca gcccatttga atattttatt gtggagaccc aagagggtgg accgaccgtt 720 agcttctacg tggacgcgtt ttcagtggcc ggtgaggtgg aagatacgcc agcgccaacg 780 ccgcccccaa ccgctccgcc accgagtggc tcaggcctag cggaactagt ggatttcccg 840 gtgggcgttg ccgttgcggt agctagtttt gccaataacg atttcctgag taacacgcaa 900 caacaagata tcgtgcttaa caattttagt gaaattgttg cggagaatca gatgaagatg 960 gaatatttca acgatgacta ctccaacccc agggcagatc aactggtcag ctgggccaat 1020 gagcgaggta ttcgggttca cggccacgct ttggtctggc acgcgcaagc agcgtcatgg 1080 gtcagtcctc cggtaagcaa ctttcgcgag cgttatgtca accatgttcg tggtgtggca 1140 tcccggtatg cggacacggt agtaagctgg gatgtcgtca atgaagcttt gaccgatgat 1200 gatgtctccc cgggtggaag ctactaccgg caatctgagt tctaccgaca gttcaatggc 1260 ccagagttca ttgatatcgc tttccgtgaa gctcgagagg cagcccccaa tgcgctgctt 1320 tactacaacg actacaatat tgagaacgga ctggacaaaa ccgatggttt gattcagcta 1380 cttgagaggt tgagggataa tgacgtgccc attgatggcg tgggcttcca aatgcatgtt 1440 ttgttggatt ggcccgatat cagcactatt cgacgttcct gggagcgcgc attagcggtt 1500 gaccccgatg accgtatgct tttaaaaata acggaactcg atgtgcgtat caacaatccc 1560 tacgacgata atctcgaaag aggcatcgtt cactccagcc ggggtgactg cgatgacatt 1620 tccggggtct gcgaaggctt tgagcggcaa gccgctcgtt accgggagat tattgaggcc 1680 tactttgacg tcgtgccacc gcaccgccga ggtggcatca gtgtttgggg tattgccgac 1740 cattatagtt ggtattatac ccatgaaggc tatgtcgatt ggcccctttt gtgggacagg 1800 aacctacagc caaagcctgc ttacaacgct gtttatgaag ctctgcagca gggccaataa 1860 <210> 352 <211> 619 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(73) <400> 352 Met His Leu Pro Asn Tyr Arg Ser Leu Ala Thr Ala Leu Ser Arg Tyr 1 5 10 15 Ser Cys Ser Ala Leu Leu Ala Val Ser Leu Val Ala Cys Gly Gly Asn 20 25 30 Asn Asp Gln Asp Pro Pro Thr Pro Glu Pro Thr Pro Val Pro Thr Pro 35 40 45 Thr Pro Thr Pro Thr Pro Thr Pro Thr Pro Glu Pro Thr Pro Thr Pro 50 55 60 Thr Pro Glu Pro Thr Pro Thr Pro Glu Pro Thr Pro Thr Pro Thr Pro 65 70 75 80 Glu Pro Thr Pro Thr Pro Glu Pro Thr Pro Thr Pro Asp Pro Gly Ala 85 90 95 Asp Tyr Gln Pro Pro Ser Asn Asp Ile Ala Val Asn Gly Asp Val Glu 100 105 110 Ser Gly Thr Thr Asn Trp Gly Ala Arg Gly Ser Ala Ser Ile Ser Arg 115 120 125 Val Thr Leu Glu Ser Phe Glu Gly Asp Ala Ser Leu Ser Val Thr Gly 130 135 140 Arg Glu Asp Asp Trp His Gly Ala Thr Phe Ser Val Gly His Leu Thr 145 150 155 160 Pro Gly Asn Ser Tyr Glu Val Ala Ala Trp Val Lys Leu Ala Ser Gly 165 170 175 Glu Pro Asn Thr Val Val Lys Ile Thr Gly Lys Arg Glu Gly Glu Ser 180 185 190 Ala Thr Tyr Glu Glu Tyr Thr Asp Val Gly Thr Ala Leu Ala Thr Asp 195 200 205 Gly Ser Trp Thr Glu Ile Thr Gly Thr Tyr Ile Pro Asp Ser Ala Ser 210 215 220 Pro Phe Glu Tyr Phe Ile Val Glu Thr Gln Glu Gly Gly Pro Thr Val 225 230 235 240 Ser Phe Tyr Val Asp Ala Phe Ser Val Ala Gly Glu Val Glu Asp Thr 245 250 255 Pro Ala Pro Thr Pro Pro Pro Thr Ala Pro Pro Pro Ser Gly Ser Gly 260 265 270 Leu Ala Glu Leu Val Asp Phe Pro Val Gly Val Ala Val Ala Val Ala 275 280 285 Ser Phe Ala Asn Asn Asp Phe Leu Ser Asn Thr Gln Gln Gln Asp Ile 290 295 300 Val Leu Asn Asn Phe Ser Glu Ile Val Ala Glu Asn Gln Met Lys Met 305 310 315 320 Glu Tyr Phe Asn Asp Asp Tyr Ser Asn Pro Arg Ala Asp Gln Leu Val 325 330 335 Ser Trp Ala Asn Glu Arg Gly Ile Arg Val His Gly His Ala Leu Val 340 345 350 Trp His Ala Gln Ala Ala Ser Trp Val Ser Pro Pro Val Ser Asn Phe 355 360 365 Arg Glu Arg Tyr Val Asn His Val Arg Gly Val Ala Ser Arg Tyr Ala 370 375 380 Asp Thr Val Val Ser Trp Asp Val Val Asn Glu Ala Leu Thr Asp Asp 385 390 395 400 Asp Val Ser Pro Gly Gly Ser Tyr Tyr Arg Gln Ser Glu Phe Tyr Arg 405 410 415 Gln Phe Asn Gly Pro Glu Phe Ile Asp Ile Ala Phe Arg Glu Ala Arg 420 425 430 Glu Ala Ala Pro Asn Ala Leu Leu Tyr Tyr Asn Asp Tyr Asn Ile Glu 435 440 445 Asn Gly Leu Asp Lys Thr Asp Gly Leu Ile Gln Leu Leu Glu Arg Leu 450 455 460 Arg Asp Asn Asp Val Pro Ile Asp Gly Val Gly Phe Gln Met His Val 465 470 475 480 Leu Leu Asp Trp Pro Asp Ile Ser Thr Ile Arg Arg Ser Trp Glu Arg 485 490 495 Ala Leu Ala Val Asp Pro Asp Asp Arg Met Leu Leu Lys Ile Thr Glu 500 505 510 Leu Asp Val Arg Ile Asn Asn Pro Tyr Asp Asp Asn Leu Glu Arg Gly 515 520 525 Ile Val His Ser Ser Arg Gly Asp Cys Asp Asp Ile Ser Gly Val Cys 530 535 540 Glu Gly Phe Glu Arg Gln Ala Ala Arg Tyr Arg Glu Ile Ile Glu Ala 545 550 555 560 Tyr Phe Asp Val Val Pro Pro His Arg Arg Gly Gly Ile Ser Val Trp 565 570 575 Gly Ile Ala Asp His Tyr Ser Trp Tyr Tyr Thr His Glu Gly Tyr Val 580 585 590 Asp Trp Pro Leu Leu Trp Asp Arg Asn Leu Gln Pro Lys Pro Ala Tyr 595 600 605 Asn Ala Val Tyr Glu Ala Leu Gln Gln Gly Gln 610 615 <210> 353 <211> 1983 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 353 atggtttgct cggccgccct cggggcgacc gccgtcagtg cccaaacctt gagcaacaac 60 tcaaccggta ccaacaacgg tttctactac accttttgga aggactcggg cagcgcgacc 120 atgaccctcg cagcgggtgg tcgttacacc tcccaatgga ccaacaacac caataactgg 180 gtgggtggta aaggctggaa cccgggcaat agcacccgcg tgatcagcta ttccggtaac 240 tatggcgtca gcaatagcca aaattcctac ctggccttgt acggctggac ccgcagcccg 300 ctgattgaat actacgtgat cgaaagctac ggctcctaca acccggcatc ctgctctggc 360 ggtaccaata tgggtagctt ccagagtgat ggcgcgacct acgatgtgcg ccgttgccag 420 cgcgtgcaac agccatccat cgatggcacc caaaccttct accaatattt cagcgtgcgc 480 aatccgaaaa aaggcttcgg ccaaatttcc ggcaccatca cctttgctaa ccacgcagcc 540 ttttgggcga gcaagggcat gaacctgggt gcccataact atcaagtaat ggcgaccgag 600 ggttatcaaa gtaccggcag ttccgatatc acagtgagtg aaggccccat caacggcggc 660 accagcagca cgcccccggt aacaaccagc agcagtgcca gctcagtggc aacgggcggt 720 ggtaacaccg gtagtggcgt agtggtgcgc gcgcgcggcg tcgcgggcgg cgagcatatt 780 aacctgcgta tcggtggcaa taccgtcgcc agctggaacc tcaccaccag cttccaggat 840 ctcagctaca gcggcaccgc gtcgggcgat atccaggtgc aatatgacaa cgacggcggc 900 agccgcgatg tcgtagtgga ttacatccgc gttaacggcg aaacccgcca ggcggaggat 960 atgagctaca acaccgcctt gtacgcgaat ggttcctgcg gtggcggcgg caattccgaa 1020 ctgatgcact gcaatggcgt gatcggtttt ggctacacct atgattgctt cagcggcaac 1080 tgctccggcg gcagcacggg gggtggcaac actggcacca gcagcagcgc ggcgagcgcc 1140 ggtggtggca acagcaactg ctccggctat gttggtatta ctttcgacga tggcccaacc 1200 gctaacactc ccaccctggt taacctgttg aagcaaaaca acctgacgcc ggtaacctgg 1260 ttcaaccagg gcaacaacgt ggttgccaat gccaattaca tggcccagca attgagcgtt 1320 ggtgaagtac ataaccacag ctacagccat ccgcaaatgg gcagcatgac ctaccaacag 1380 gtttatgacg agttgaaccg tgccaaccag gctatccaaa ccgcgggtgc acccaagcca 1440 accctgttcc gcccacctta tggcaccgtt aactccacca tccaacaagc ggcccaggcc 1500 ttgggtttgc gggtgatcac ctgggatgtg gattcgcaag actggaatgg cgccactgcc 1560 tcggccatcg ccagcgcagc taaccgcctg acaaacggcc aggtaatcct gatgcacgac 1620 ggcagctaca ccaacaccaa tgccgctatt gcccagatcg cctccagcct gcgcgccaag 1680 ggcttgtgcc cgggtcgtat cgatccggca accggccgag ccgttgctcc tgcgggtggc 1740 aatactggcg gcggtactgt gtcaagcagc actcgcagca gcactccggt agtggtaagc 1800 agcagccgta gcagcagtag tgttgccgct ggcggcgcct gccaatgcaa ttggtggggc 1860 acccgttacc cgatctgtac gtccactgcc agtggttggg gttgggagaa caaccgcagc 1920 tgtatcacca ccagcacctg taacagtcag ggccctggcg gtggtggggt agtgtgtaac 1980 taa 1983 <210> 354 <211> 660 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(18) <400> 354 Met Val Cys Ser Ala Ala Leu Gly Ala Thr Ala Val Ser Ala Gln Thr 1 5 10 15 Leu Ser Asn Asn Ser Thr Gly Thr Asn Asn Gly Phe Tyr Tyr Thr Phe 20 25 30 Trp Lys Asp Ser Gly Ser Ala Thr Met Thr Leu Ala Ala Gly Gly Arg 35 40 45 Tyr Thr Ser Gln Trp Thr Asn Asn Thr Asn Asn Trp Val Gly Gly Lys 50 55 60 Gly Trp Asn Pro Gly Asn Ser Thr Arg Val Ile Ser Tyr Ser Gly Asn 65 70 75 80 Tyr Gly Val Ser Asn Ser Gln Asn Ser Tyr Leu Ala Leu Tyr Gly Trp 85 90 95 Thr Arg Ser Pro Leu Ile Glu Tyr Tyr Val Ile Glu Ser Tyr Gly Ser 100 105 110 Tyr Asn Pro Ala Ser Cys Ser Gly Gly Thr Asn Met Gly Ser Phe Gln 115 120 125 Ser Asp Gly Ala Thr Tyr Asp Val Arg Arg Cys Gln Arg Val Gln Gln 130 135 140 Pro Ser Ile Asp Gly Thr Gln Thr Phe Tyr Gln Tyr Phe Ser Val Arg 145 150 155 160 Asn Pro Lys Lys Gly Phe Gly Gln Ile Ser Gly Thr Ile Thr Phe Ala 165 170 175 Asn His Ala Ala Phe Trp Ala Ser Lys Gly Met Asn Leu Gly Ala His 180 185 190 Asn Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln Ser Thr Gly Ser Ser 195 200 205 Asp Ile Thr Val Ser Glu Gly Pro Ile Asn Gly Gly Thr Ser Ser Thr 210 215 220 Pro Pro Val Thr Thr Ser Ser Ser Ala Ser Ser Val Ala Thr Gly Gly 225 230 235 240 Gly Asn Thr Gly Ser Gly Val Val Val Arg Ala Arg Gly Val Ala Gly 245 250 255 Gly Glu His Ile Asn Leu Arg Ile Gly Gly Asn Thr Val Ala Ser Trp 260 265 270 Asn Leu Thr Thr Ser Phe Gln Asp Leu Ser Tyr Ser Gly Thr Ala Ser 275 280 285 Gly Asp Ile Gln Val Gln Tyr Asp Asn Asp Gly Gly Ser Arg Asp Val 290 295 300 Val Val Asp Tyr Ile Arg Val Asn Gly Glu Thr Arg Gln Ala Glu Asp 305 310 315 320 Met Ser Tyr Asn Thr Ala Leu Tyr Ala Asn Gly Ser Cys Gly Gly Gly 325 330 335 Gly Asn Ser Glu Leu Met His Cys Asn Gly Val Ile Gly Phe Gly Tyr 340 345 350 Thr Tyr Asp Cys Phe Ser Gly Asn Cys Ser Gly Gly Ser Thr Gly Gly 355 360 365 Gly Asn Thr Gly Thr Ser Ser Ser Ala Ala Ser Ala Gly Gly Gly Asn 370 375 380 Ser Asn Cys Ser Gly Tyr Val Gly Ile Thr Phe Asp Asp Gly Pro Thr 385 390 395 400 Ala Asn Thr Pro Thr Leu Val Asn Leu Leu Lys Gln Asn Asn Leu Thr 405 410 415 Pro Val Thr Trp Phe Asn Gln Gly Asn Asn Val Val Ala Asn Ala Asn 420 425 430 Tyr Met Ala Gln Gln Leu Ser Val Gly Glu Val His Asn His Ser Tyr 435 440 445 Ser His Pro Gln Met Gly Ser Met Thr Tyr Gln Gln Val Tyr Asp Glu 450 455 460 Leu Asn Arg Ala Asn Gln Ala Ile Gln Thr Ala Gly Ala Pro Lys Pro 465 470 475 480 Thr Leu Phe Arg Pro Pro Tyr Gly Thr Val Asn Ser Thr Ile Gln Gln 485 490 495 Ala Ala Gln Ala Leu Gly Leu Arg Val Ile Thr Trp Asp Val Asp Ser 500 505 510 Gln Asp Trp Asn Gly Ala Thr Ala Ser Ala Ile Ala Ser Ala Ala Asn 515 520 525 Arg Leu Thr Asn Gly Gln Val Ile Leu Met His Asp Gly Ser Tyr Thr 530 535 540 Asn Thr Asn Ala Ala Ile Ala Gln Ile Ala Ser Ser Leu Arg Ala Lys 545 550 555 560 Gly Leu Cys Pro Gly Arg Ile Asp Pro Ala Thr Gly Arg Ala Val Ala 565 570 575 Pro Ala Gly Gly Asn Thr Gly Gly Gly Thr Val Ser Ser Ser Thr Arg 580 585 590 Ser Ser Thr Pro Val Val Val Ser Ser Ser Arg Ser Ser Ser Ser Val 595 600 605 Ala Ala Gly Gly Ala Cys Gln Cys Asn Trp Trp Gly Thr Arg Tyr Pro 610 615 620 Ile Cys Thr Ser Thr Ala Ser Gly Trp Gly Trp Glu Asn Asn Arg Ser 625 630 635 640 Cys Ile Thr Thr Ser Thr Cys Asn Ser Gln Gly Pro Gly Gly Gly Gly 645 650 655 Val Val Cys Asn 660 <210> 355 <211> 1125 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 355 atgaaacgaa ccatcttctt aagactctta gccggcgccc tcctctccgc cgcggccctc 60 gcggccgggg ggtgccggcc ctctagtccc ccgaaggtcg agatcgaggc caatatcccc 120 tccctcaaag aggtctgcgc ttcttatttc gagatcggcg cggccgtcga gccgtatcag 180 ttatcctctc caccccacga tgcccttctg cggaaacatt ttaactgcct cgtggcggag 240 aacgtcatga agcccgcctc catccagcct tcggaggggt atttcaactg gaccgaagca 300 gacaagatcg tgaactacgc caaagcccac gggatgaagc tccgcttcca taccctcgtc 360 tggcataatc aggtcccgga ttggttcttc gcgggtaacg acaaaaccct ccttttgcag 420 cgcttggaga atcatatccg gactatcatt aaaagatatg gcgataaggt cgactattgg 480 gacgtggtaa atgaggctat agacccgagc caaccggatg gcatgaggag gagcaaatgg 540 taccagatca ccgggaagga ctacatcaag accgccttcc gggtggcaga cgacgagctc 600 aggaagaatg ggtggaggaa agaaggtcgt cagctctata tcaacgacta caacacccat 660 gatccgacga agagagagta catctggcgc ttgatcgatg agcttcaaac ggaagggatt 720 cccgtcgacg gagtaggcca ccagacgcat atcaatatcg aatggccgcc cgtaaaccag 780 atcgtggact cgatccgctt cttcggggaa aaaggcctcg ataaccaggt gaccgagctg 840 gatgtgagca tatatacgga tagatccagt tcctacggga gttaccaagc gatcccgcag 900 gaagtcttca tcaagcaggg taatcgctac aaggaactct ttgaagggct aaaaagtgta 960 aaaaactacc tcagcaacgt caccttctgg ggcatggcgg acgatcatac ctggctgaac 1020 cattggccca tcgaacggcc cgatgctcct cttcctttcg atatctatct caaggccaag 1080 ccggcgtatt gggggatcgt ggatgctttg aagctttcgc ggtga 1125 <210> 356 <211> 374 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(21) <400> 356 Met Lys Arg Thr Ile Phe Leu Arg Leu Leu Ala Gly Ala Leu Leu Ser 1 5 10 15 Ala Ala Ala Leu Ala Ala Gly Gly Cys Arg Pro Ser Ser Pro Pro Lys 20 25 30 Val Glu Ile Glu Ala Asn Ile Pro Ser Leu Lys Glu Val Cys Ala Ser 35 40 45 Tyr Phe Glu Ile Gly Ala Ala Val Glu Pro Tyr Gln Leu Ser Ser Pro 50 55 60 Pro His Asp Ala Leu Leu Arg Lys His Phe Asn Cys Leu Val Ala Glu 65 70 75 80 Asn Val Met Lys Pro Ala Ser Ile Gln Pro Ser Glu Gly Tyr Phe Asn 85 90 95 Trp Thr Glu Ala Asp Lys Ile Val Asn Tyr Ala Lys Ala His Gly Met 100 105 110 Lys Leu Arg Phe His Thr Leu Val Trp His Asn Gln Val Pro Asp Trp 115 120 125 Phe Phe Ala Gly Asn Asp Lys Thr Leu Leu Leu Gln Arg Leu Glu Asn 130 135 140 His Ile Arg Thr Ile Ile Lys Arg Tyr Gly Asp Lys Val Asp Tyr Trp 145 150 155 160 Asp Val Val Asn Glu Ala Ile Asp Pro Ser Gln Pro Asp Gly Met Arg 165 170 175 Arg Ser Lys Trp Tyr Gln Ile Thr Gly Lys Asp Tyr Ile Lys Thr Ala 180 185 190 Phe Arg Val Ala Asp Asp Glu Leu Arg Lys Asn Gly Trp Arg Lys Glu 195 200 205 Gly Arg Gln Leu Tyr Ile Asn Asp Tyr Asn Thr His Asp Pro Thr Lys 210 215 220 Arg Glu Tyr Ile Trp Arg Leu Ile Asp Glu Leu Gln Thr Glu Gly Ile 225 230 235 240 Pro Val Asp Gly Val Gly His Gln Thr His Ile Asn Ile Glu Trp Pro 245 250 255 Pro Val Asn Gln Ile Val Asp Ser Ile Arg Phe Phe Gly Glu Lys Gly 260 265 270 Leu Asp Asn Gln Val Thr Glu Leu Asp Val Ser Ile Tyr Thr Asp Arg 275 280 285 Ser Ser Ser Tyr Gly Ser Tyr Gln Ala Ile Pro Gln Glu Val Phe Ile 290 295 300 Lys Gln Gly Asn Arg Tyr Lys Glu Leu Phe Glu Gly Leu Lys Ser Val 305 310 315 320 Lys Asn Tyr Leu Ser Asn Val Thr Phe Trp Gly Met Ala Asp Asp His 325 330 335 Thr Trp Leu Asn His Trp Pro Ile Glu Arg Pro Asp Ala Pro Leu Pro 340 345 350 Phe Asp Ile Tyr Leu Lys Ala Lys Pro Ala Tyr Trp Gly Ile Val Asp 355 360 365 Ala Leu Lys Leu Ser Arg 370 <210> 357 <211> 1155 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 357 atgaataact tcagaaatac atttctaatc gtcgttgtac tggcggtcgt cgtcggcgtg 60 ctgccggcct gcgaagccgg tccgccggaa aatacaagtt cgtccctgca ggaggcatat 120 gcagatgtgt ttctgatcgg caccgcgctc aatctggcac agatcgacgg aagggatgaa 180 caaggcgtac gtctggtgga gcggcatttt aatgcgatta caccagagaa cattacaaaa 240 tggggaccga tacatccggc gccgggcgaa tataatttcg gaccggccga ccggtttgtt 300 gaattcggtg aagcccacga catgttcatg ataggccata cgcttgtatg gcacagccag 360 acgcccggat gggtattcga ggatgaagcc ggaaatccgc tcggccgcga cgagctcatc 420 gaacgcatgc gcgatcatat ccataccgtc gtcggacggt accggggtag aatacacgca 480 tgggacgtcg tcaacgaagc gttgaatgaa gacggaaccc tgcgggaatc cccctggtac 540 cgtatcatcg gcgaggatta cctgttgaaa gcgttcgagt tcgcgcatga agcggacccg 600 gatgccgagc tgtactataa cgattattct ctcgaaaatc ccgccaagcg ggcgggggcg 660 gtacgcctgg tccggtacct gcaggagaac ggggcgccga tacacgggat cggtacccag 720 ggacactact ctcttgactg gccatcgctc gacgagatcg aaagaaccat caccgatttc 780 gccgcgttgg acgtggacgt catggttacc gaacttgaaa tcgacgtcct cccttccgcg 840 ttcgagtatc agggggccga tattgcgatg cgggcggaac tcgaagagcg gttgaatccg 900 tatcccgacg aactgccggc cgaggtcgat gaagcgctta cacagcggta tcgggacatc 960 ttcgaggtat ttctgcggca cagcgacgtt cttacgcgcg taacgttctg gggggtgacc 1020 gatggagatt cgtggaagaa taactggccg gtaccgggaa ggacgaatta tccgctgctg 1080 ttcgaccgcg aatggcagcc aaaaccagca ttttattccg tgatcgaagt tgcggatgag 1140 atgctgaatg aataa 1155 <210> 358 <211> 384 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(25) <400> 358 Met Asn Asn Phe Arg Asn Thr Phe Leu Ile Val Val Val Leu Ala Val 1 5 10 15 Val Val Gly Val Leu Pro Ala Cys Glu Ala Gly Pro Pro Glu Asn Thr 20 25 30 Ser Ser Ser Leu Gln Glu Ala Tyr Ala Asp Val Phe Leu Ile Gly Thr 35 40 45 Ala Leu Asn Leu Ala Gln Ile Asp Gly Arg Asp Glu Gln Gly Val Arg 50 55 60 Leu Val Glu Arg His Phe Asn Ala Ile Thr Pro Glu Asn Ile Thr Lys 65 70 75 80 Trp Gly Pro Ile His Pro Ala Pro Gly Glu Tyr Asn Phe Gly Pro Ala 85 90 95 Asp Arg Phe Val Glu Phe Gly Glu Ala His Asp Met Phe Met Ile Gly 100 105 110 His Thr Leu Val Trp His Ser Gln Thr Pro Gly Trp Val Phe Glu Asp 115 120 125 Glu Ala Gly Asn Pro Leu Gly Arg Asp Glu Leu Ile Glu Arg Met Arg 130 135 140 Asp His Ile His Thr Val Val Gly Arg Tyr Arg Gly Arg Ile His Ala 145 150 155 160 Trp Asp Val Val Asn Glu Ala Leu Asn Glu Asp Gly Thr Leu Arg Glu 165 170 175 Ser Pro Trp Tyr Arg Ile Ile Gly Glu Asp Tyr Leu Leu Lys Ala Phe 180 185 190 Glu Phe Ala His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr Asn Asp 195 200 205 Tyr Ser Leu Glu Asn Pro Ala Lys Arg Ala Gly Ala Val Arg Leu Val 210 215 220 Arg Tyr Leu Gln Glu Asn Gly Ala Pro Ile His Gly Ile Gly Thr Gln 225 230 235 240 Gly His Tyr Ser Leu Asp Trp Pro Ser Leu Asp Glu Ile Glu Arg Thr 245 250 255 Ile Thr Asp Phe Ala Ala Leu Asp Val Asp Val Met Val Thr Glu Leu 260 265 270 Glu Ile Asp Val Leu Pro Ser Ala Phe Glu Tyr Gln Gly Ala Asp Ile 275 280 285 Ala Met Arg Ala Glu Leu Glu Glu Arg Leu Asn Pro Tyr Pro Asp Glu 290 295 300 Leu Pro Ala Glu Val Asp Glu Ala Leu Thr Gln Arg Tyr Arg Asp Ile 305 310 315 320 Phe Glu Val Phe Leu Arg His Ser Asp Val Leu Thr Arg Val Thr Phe 325 330 335 Trp Gly Val Thr Asp Gly Asp Ser Trp Lys Asn Asn Trp Pro Val Pro 340 345 350 Gly Arg Thr Asn Tyr Pro Leu Leu Phe Asp Arg Glu Trp Gln Pro Lys 355 360 365 Pro Ala Phe Tyr Ser Val Ile Glu Val Ala Asp Glu Met Leu Asn Glu 370 375 380 <210> 359 <211> 2724 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 359 atgacccggt ctgtacgacc aagagcatgg ggggccggcc tactggccct cgcgatggtg 60 gcgacagtcg cccccacggc caccggccac agccacgaca cggcagagcc cgtcgtcgtg 120 gtctacaccg acttcgagaa cgacagcatc gagccgtggg cgcagtccgg cggcccgacg 180 ctgaacatcg tcgaggtcga cggcgggcac gcgctgcgcg tcggcaacca ccagaacacc 240 tgggacggca tccagaccca gcccgccacc acgcggatcg agccgggtgt cgagcacacc 300 ctgtcgatgc gcgtccggct cgtgggcgac ggcacggcga cgacgccggc ccggtggatc 360 ggccgcgacc ccggagccga gaacggctac cagtggatcg gtaacacgac gatctcgacc 420 gagagctgga cgaccatccg gggaacgtgg ctccctcggg cggacgcgaa cgcctcggag 480 ctctatgtct accccgaggt cacaccggtg gccggcttcg actacctcct cgatgacctg 540 ctcatcgagc gtgctgcccc tgtcgacggc ggcgccccgg gcaccgtcgt ctacaccgct 600 ggattcgaga cggacctgga cggctgggag gcacgcgccg acggcgtcgg tgtcggccag 660 ctcgaccgga ccgacgcgga gtcggccgag ggcgactggt ccgcgatcgt gaccgaccgc 720 acctcgcacg gccacggcct gcgcctggac gtcacggaca tcatggacgc gggcgtcacg 780 tacgagatca gcgcccaggt gaagttcgcc gggaccggtg gtccgggcaa catctggctg 840 agccaggagc tggtcgtgga cgggggtagc acctacggca ccgtcctcca ggtccctggc 900 gtcacctcga cagcctggac gcagatcacc acgaactacg tcacgccgac ggccgaccag 960 ctgttcctct acttcgagac gaactggccg gacggcatcg aggacgactt cctcctcgac 1020 gacgtccgca tccgtgtcgc ccctcgggcg atcatccagg aggacctcac tccgctgatg 1080 gacacgctgg acgtgcccat gggtgtcgcg atcgaccagc gtgagacctc cggcagcctc 1140 gcggacctcc tgctgctgca cttcgaccag gtcacggccg agaaccacat gaagccggag 1200 gcgtggtacg acgcggcggg caacttccgc atccacccgc aggcccgcgc catcatggac 1260 ttcgcggcgg agaacgacct gcgcgtcttc ggtcacgtcc tggtgtggca cggccagacc 1320 ccggacttct tcttcacgca cgcggacggc accccgctga cctcgagcga ggccgaccag 1380 gcgatcctgc gcgaccgcat gcgcacgcac atcttcaacg tcgccgaggc cctctccgag 1440 tggggcgagt acggcggcga caacccgctc gtggcctggg acgtcgtcaa cgaggtcgtc 1500 tccgacagcg gcgagcacag cgacggcctg cgccgtagcc gctggtacga cgtgctgggc 1560 gaggagttca tcgacctggc gttcatctac gcgaaccagg cgttcaacgg tgagttcgcc 1620 gctgacgacg ccaaccaccc ggtcacgctc ttcatcaacg actacaacac cgagcagtcc 1680 ggcaagcaga accggtacgc cgcgctcatc gaccgcctca tcgagcgcga ggtcccgatc 1740 gacgccgtgg ggcaccagtt ccacgtcagc ctggccatgc ccatcgcgaa cctgcgcggc 1800 gccctcgagc gcttccagga caccgggctg atccagggcg tcaccgagct cgacgtcacc 1860 gtcggcaaca acccgaccga ggcgctgctc gtcgagcagg gctactacta ccgggacgcc 1920 ttccggctgt tccgtgagtt cacggaggac ctctactcgg tcaccgtgtg gggtctcacc 1980 gacgaccgca gctggcgcag cgctcaggcg ccgctgctgt tcgacgcggg cctgcaggcc 2040 aagccggcct actacggcgc catcgacgcc gacctggacg cacgcgtgcg tgcggcctac 2100 gtgttcgccg aggacatcgc cctcgacgag gccgcgctga cgagccccac ctgggaccgt 2160 ctgccgctgc accagatcga cggggccggc gagttccagc tccgctgggc ggccgaccac 2220 ctcacggtgt tcgtccacgt caccgacggt gacgaggtcg agatcgtgct cggcgacgag 2280 acctacacgg tctcgtcgga cggcgagggc gacctggacg cggtcaccgc ggccggggag 2340 aacggctcct ggaccgctgt ggtccgcgtg ccgctcacgg ccgagcaggg cgacaccgcc 2400 cagttcgacc tccggatcat cgacggcgcc accacctccg ggtggaacgt cgaaggtgtc 2460 ctgggcaccc tgaccctggt cgaggagctg tccttcgtcg aggtcgtcga ggcggccgac 2520 cggccgacca tcgacggcga gatcgacgcc gtgtgggagg acgccaacgt cgtcaccacg 2580 gacgtccgta tcgagggcgc tgctgacggc gcgaaggccg agatccggac cctgtgggac 2640 aacaacacgc tgttcgtcct cgcggagatc gccgacccgg tgatcgacgt gacggcctcc 2700 agcccgtggg agcaggactc gctc 2724 <210> 360 <211> 908 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(31) <400> 360 Met Thr Arg Ser Val Arg Pro Arg Ala Trp Gly Ala Gly Leu Leu Ala 1 5 10 15 Leu Ala Met Val Ala Thr Val Ala Pro Thr Ala Thr Gly His Ser His 20 25 30 Asp Thr Ala Glu Pro Val Val Val Val Tyr Thr Asp Phe Glu Asn Asp 35 40 45 Ser Ile Glu Pro Trp Ala Gln Ser Gly Gly Pro Thr Leu Asn Ile Val 50 55 60 Glu Val Asp Gly Gly His Ala Leu Arg Val Gly Asn His Gln Asn Thr 65 70 75 80 Trp Asp Gly Ile Gln Thr Gln Pro Ala Thr Thr Arg Ile Glu Pro Gly 85 90 95 Val Glu His Thr Leu Ser Met Arg Val Arg Leu Val Gly Asp Gly Thr 100 105 110 Ala Thr Thr Pro Ala Arg Trp Ile Gly Arg Asp Pro Gly Ala Glu Asn 115 120 125 Gly Tyr Gln Trp Ile Gly Asn Thr Thr Ile Ser Thr Glu Ser Trp Thr 130 135 140 Thr Ile Arg Gly Thr Trp Leu Pro Arg Ala Asp Ala Asn Ala Ser Glu 145 150 155 160 Leu Tyr Val Tyr Pro Glu Val Thr Pro Val Ala Gly Phe Asp Tyr Leu 165 170 175 Leu Asp Asp Leu Leu Ile Glu Arg Ala Ala Pro Val Asp Gly Gly Ala 180 185 190 Pro Gly Thr Val Val Tyr Thr Ala Gly Phe Glu Thr Asp Leu Asp Gly 195 200 205 Trp Glu Ala Arg Ala Asp Gly Val Gly Val Gly Gln Leu Asp Arg Thr 210 215 220 Asp Ala Glu Ser Ala Glu Gly Asp Trp Ser Ala Ile Val Thr Asp Arg 225 230 235 240 Thr Ser His Gly His Gly Leu Arg Leu Asp Val Thr Asp Ile Met Asp 245 250 255 Ala Gly Val Thr Tyr Glu Ile Ser Ala Gln Val Lys Phe Ala Gly Thr 260 265 270 Gly Gly Pro Gly Asn Ile Trp Leu Ser Gln Glu Leu Val Val Asp Gly 275 280 285 Gly Ser Thr Tyr Gly Thr Val Leu Gln Val Pro Gly Val Thr Ser Thr 290 295 300 Ala Trp Thr Gln Ile Thr Thr Asn Tyr Val Thr Pro Thr Ala Asp Gln 305 310 315 320 Leu Phe Leu Tyr Phe Glu Thr Asn Trp Pro Asp Gly Ile Glu Asp Asp 325 330 335 Phe Leu Leu Asp Asp Val Arg Ile Arg Val Ala Pro Arg Ala Ile Ile 340 345 350 Gln Glu Asp Leu Thr Pro Leu Met Asp Thr Leu Asp Val Pro Met Gly 355 360 365 Val Ala Ile Asp Gln Arg Glu Thr Ser Gly Ser Leu Ala Asp Leu Leu 370 375 380 Leu Leu His Phe Asp Gln Val Thr Ala Glu Asn His Met Lys Pro Glu 385 390 395 400 Ala Trp Tyr Asp Ala Ala Gly Asn Phe Arg Ile His Pro Gln Ala Arg 405 410 415 Ala Ile Met Asp Phe Ala Ala Glu Asn Asp Leu Arg Val Phe Gly His 420 425 430 Val Leu Val Trp His Gly Gln Thr Pro Asp Phe Phe Phe Thr His Ala 435 440 445 Asp Gly Thr Pro Leu Thr Ser Ser Glu Ala Asp Gln Ala Ile Leu Arg 450 455 460 Asp Arg Met Arg Thr His Ile Phe Asn Val Ala Glu Ala Leu Ser Glu 465 470 475 480 Trp Gly Glu Tyr Gly Gly Asp Asn Pro Leu Val Ala Trp Asp Val Val 485 490 495 Asn Glu Val Val Ser Asp Ser Gly Glu His Ser Asp Gly Leu Arg Arg 500 505 510 Ser Arg Trp Tyr Asp Val Leu Gly Glu Glu Phe Ile Asp Leu Ala Phe 515 520 525 Ile Tyr Ala Asn Gln Ala Phe Asn Gly Glu Phe Ala Ala Asp Asp Ala 530 535 540 Asn His Pro Val Thr Leu Phe Ile Asn Asp Tyr Asn Thr Glu Gln Ser 545 550 555 560 Gly Lys Gln Asn Arg Tyr Ala Ala Leu Ile Asp Arg Leu Ile Glu Arg 565 570 575 Glu Val Pro Ile Asp Ala Val Gly His Gln Phe His Val Ser Leu Ala 580 585 590 Met Pro Ile Ala Asn Leu Arg Gly Ala Leu Glu Arg Phe Gln Asp Thr 595 600 605 Gly Leu Ile Gln Gly Val Thr Glu Leu Asp Val Thr Val Gly Asn Asn 610 615 620 Pro Thr Glu Ala Leu Leu Val Glu Gln Gly Tyr Tyr Tyr Arg Asp Ala 625 630 635 640 Phe Arg Leu Phe Arg Glu Phe Thr Glu Asp Leu Tyr Ser Val Thr Val 645 650 655 Trp Gly Leu Thr Asp Asp Arg Ser Trp Arg Ser Ala Gln Ala Pro Leu 660 665 670 Leu Phe Asp Ala Gly Leu Gln Ala Lys Pro Ala Tyr Tyr Gly Ala Ile 675 680 685 Asp Ala Asp Leu Asp Ala Arg Val Arg Ala Ala Tyr Val Phe Ala Glu 690 695 700 Asp Ile Ala Leu Asp Glu Ala Ala Leu Thr Ser Pro Thr Trp Asp Arg 705 710 715 720 Leu Pro Leu His Gln Ile Asp Gly Ala Gly Glu Phe Gln Leu Arg Trp 725 730 735 Ala Ala Asp His Leu Thr Val Phe Val His Val Thr Asp Gly Asp Glu 740 745 750 Val Glu Ile Val Leu Gly Asp Glu Thr Tyr Thr Val Ser Ser Asp Gly 755 760 765 Glu Gly Asp Leu Asp Ala Val Thr Ala Ala Gly Glu Asn Gly Ser Trp 770 775 780 Thr Ala Val Val Arg Val Pro Leu Thr Ala Glu Gln Gly Asp Thr Ala 785 790 795 800 Gln Phe Asp Leu Arg Ile Ile Asp Gly Ala Thr Thr Ser Gly Trp Asn 805 810 815 Val Glu Gly Val Leu Gly Thr Leu Thr Leu Val Glu Glu Leu Ser Phe 820 825 830 Val Glu Val Val Glu Ala Ala Asp Arg Pro Thr Ile Asp Gly Glu Ile 835 840 845 Asp Ala Val Trp Glu Asp Ala Asn Val Val Thr Thr Asp Val Arg Ile 850 855 860 Glu Gly Ala Ala Asp Gly Ala Lys Ala Glu Ile Arg Thr Leu Trp Asp 865 870 875 880 Asn Asn Thr Leu Phe Val Leu Ala Glu Ile Ala Asp Pro Val Ile Asp 885 890 895 Val Thr Ala Ser Ser Pro Trp Glu Gln Asp Ser Leu 900 905 <210> 361 <211> 5040 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 361 atggcaagaa gtaagcgagt attagcatgg attatgtcta gtgtgcttct gatatccatg 60 gcgatgccat ccttcgcatc aggtgattca agccaagtgc caagggttat atttgaaaca 120 ggttttgaaa cgggattaga tggcttcaaa ggacggggta gtgccacctt aactcgaacg 180 actgatgaaa cgcaagcagg cgactattcg gttcttgtga gcaatcggct tgagcactgg 240 aatggggcat cattgccact tacaggcttc gttctaccag gtaatacata tgaatttgtt 300 ggttacataa aagcaaaagc agatgtagca gacaattatg tcatgagtgg tgagtacaat 360 gaggggattt ctggaaatca atatccatgg atatctaatc gtttgttaac ggttcaagat 420 ggctttgttg agtttagagg tgaactaacc atactagagg atatgacgtc ctttaatcta 480 aactttgaac atcaaaatgc tgaagtggaa ttttatttag attctgttca ggttattcta 540 atcgaagaag gtcaagtcaa tgacttacca atgaatgtaa gaagagcgcc acttacactt 600 gctgaaactc ccttacatga gatttgggca gatcacttta ctattggcaa tatttatacg 660 ccaggttttc gcacagatat acgtggtgag gtattagccc atcattttaa tgtgatcaca 720 gctgaaaata ttatgaagcc agatcatttg caaagggaac aaggtatttt tacttttagt 780 gcttccaacg atatgatgga atttgccaga gcaaataatc aagaagtcat tggacatact 840 ttggtgtggc attctcaatc cttcccatgg tttgaagctt taaatccaac acgtgatgaa 900 gctatagcca ttatgcatgc ccatattgaa actgttatgg gacattttaa tgaaaactac 960 ccaggtgtca ttacaggatg ggatgttttg aatgaagcca ttcaaccaag acagggtcaa 1020 gatcctgaaa attggcgctt gcatttaagg gataccaaat ggttacgtgc cattggtgat 1080 gattatattg ccatcgcttt taacaaagcc catgaaatgg atccagatgc tattctttat 1140 tataatgatt ataatgataa tgactatttt aaagcaacca ttataaaagc catggtgcag 1200 gagttgcgta atgaaggcgt gcccattcat cgtattggga tgcaaggtca ttataattta 1260 cagacaccat taaactctat tagaaccagc gttgagcgtt ttagtgaaat tactggtcat 1320 gaagatctac cacctattgg cattagtttc acagaaattg atgtaacggt accagggttt 1380 gaaagtgcag cccgtttacc tgaagaggta gaaattcgcc aagctcagtt ttatgctcaa 1440 ttaatgcaga ttttaagaga caacagcgat gtgattcatc gtgttacttt ctggggtatg 1500 tctgatcgtg aatcatggcg tgcagatcgt catcctaaca tgttagatcc tcagtatggt 1560 ccaaagcatg tctttcatgc tatagccaat ccagaggctt tccttacggc ctacccatta 1620 ccagagacgc cagatgctca aacagcctat gcatctcaag gtcaaccagt tgtggggcag 1680 tttaatttgg atgcgtatca aaattcagaa gtaataccag tggctaatca aatgacagcc 1740 cataatggcg caacagcggt tgcaagggtg gtttggcacg aagatgctat ttatatttta 1800 gccaatgtca gcgatgccac accgaatgta gcagcttcgg ctgcccatga gcaagactca 1860 cttgaggtat ttatttcaaa tacggattca agaatttcta attatatgcc aggtgactat 1920 caactgagat ttaatcgtgc cggcgtgcat acatatggtt cgactggttc gattgaaggt 1980 atgacctttg cggtacaaga tggtccaata ggttatcaag ttgaagtgcg tattccctta 2040 gaaaatgaag tctatgttgg cagaagactt ggttttgact tacaagtcaa tgatgcatgg 2100 gaagttggcg gtacttctgg ccgacaagca tttgctaaat ggaatgatca cactgacaat 2160 ggctggcagt ctacagagtt ttggggctgg ttattattac aaggcgatgc ggcacctgtc 2220 ttacccgttg tattagtgga agaaggcttt gaaacggatt taggttcatt ccaaccaagg 2280 ggtagtagta cactgactcg aacccaagag gttagtcatg aaggcgacta ttccgtattg 2340 gttagcaacc gtgtcaacaa ctggaacggt gcgtcattac cgttaacagg cattgttcaa 2400 ccaggcaaca cttatgagtt tgttggttac attagagcaa aagcagatgt aactggatca 2460 tatatcatga gtggtgagtt taataatgga tctggtgtat tagaaaacgg tagtattaat 2520 cgatggccat ggctatcaaa ccgttcatta acgatagcag atggttttgt tgagtttaag 2580 tcagaactaa ccatacctag tgacatgacg acgtttaact tgaactttga acaccaaaat 2640 gctgaagtag aattttactt agatgctgtt caagtcactt tgattgcaga agctgatgta 2700 acaccagtgg acccaccagt agacccacca gtagagccag aaattacagt ggtctattca 2760 atggtagatg atgcagccat tcaagggatt gaagtgggaa caacaggcac tgctgaagat 2820 ttttcggata ttagtgaagc tttattagta tctggttcac cagttgttac tgctgtagca 2880 catccagaag aagcaggaaa gatcggtata gagcttagta atcgagcaga gaattggcat 2940 gcgctagact ttatgttccc agccataggt gtgcagcggg gtgggagcta tcgatttgtg 3000 gccagtggcc gtatggcaga aggaacaggt aattcaaatc gtagaatgca gtggaatcaa 3060 acggatgcgc catggagtga aatatcaggt tctagaacca atgtggcacc tgcagcaacc 3120 acatggacca ttgacgtgac tttaagtcga ttacagatca acacattatt aaacgctggt 3180 caaagaggtc ttcgaattca aacgggtaat gcaccaactg tgaccattac cattgacgat 3240 gtgtttgttt atcagattgg tgacattgac acagcaggtt taccattacc accacaatgg 3300 aattttgatt tgccaagatt atcagaatta ttcgagccat attttggtct tggtaacatt 3360 tattcaaccg aaacattaat gaacgctaat gaaacaaaaa gagcattttt acatcacttt 3420 aacgtgatta cagcagaaaa tggtcataaa ccatccagta ttgcagggcc agaaaatagc 3480 tttacagtac cagaacctga gcaattcaac tttacggatg cagaccgaat tgtaaacttt 3540 gctgttgaaa atgacattga attagtagga catgcacttg tatggcattc acaaagtcca 3600 aactggctgt ttagaagtgc ggctaacaca ccgctaacaa gagcagaagc caaagagcgc 3660 atggcatatt acatgaaaac tgtttcagag catttcgaag cacaaggtac attaggcgca 3720 ttttatggtt gggatgttgt gaatgaagcc atcgccagtg gtggtggtac attcgtagat 3780 caaccaggtc attggcgcac gcaaatgcga acatcatcac catggttcca agcatttaac 3840 aatggattag atgtagaagc cggtgaacat gccagtgatt atattttcta tgcatactat 3900 tatgcaagaa agtatttccc aacatcgatc ctatactaca acgattacaa cgatgaaata 3960 ccaaacaagc gagacaatat cgctcaaatg gtagaagaga taaatgcact ttgggaagca 4020 catgaagaat atgatggtcg cttactgatt gaatccatcg gtatgcaaag tcattatcac 4080 atggaaggtt ggacaaccag cgtagacaat gtaagagctg ctttagatcg atacattgca 4140 acaggtgcaa gagtcagtgt gactgagtta gatatcactt atggtggtca tggtagtaat 4200 gcatatgcat cacttacacc agaacaatta gcggcacaag cggagcgata tgcagagata 4260 tttacattgt atttagagcg tgcagatcag ttaagccgtg tatccatctg gggtatgtct 4320 gatgctaaca gctggagaag ttctggattc ccattactat ttgacagttc acttaatgct 4380 aaaccagcat ttaatgccat tgtagaatta gttaaaaact gggagacacc aacagttgta 4440 gcaccagtga ttcaaacaag aacactagca ccattagaaa gtggtgaaag agtctttacc 4500 atgttagatg tggtaagagg atctaatgca cctgtatggt ttagcataac agacggtgca 4560 ttaccagaag gtataatcct tcattctaga acaggtattt tagaaggaac accagttgaa 4620 gatggtcact atagctttac tgtaactgct agaaattacg gcggttcaac aagtcaagcg 4680 ctgactttaa cagtaggtca tccagtagca ccaccagtaa cgccaccagt aacgccacca 4740 accgtaatca ttgatgaatc ggatatacca caggctggtc caggccttag ggcaccacag 4800 attgttgtaa ccgttcaaga aggcagtgaa gtaacgtttg atcttgaaaa attagaagaa 4860 gttatggcat cactttcaag tcaagtgcca ttggtgttag atgttgaatt ggaagattct 4920 atcatcacct tggatcaaac attacttaaa cgattaacag acaaggcggc tggaatcgaa 4980 atacaagcag atggatttag ttatatgctt ccagcagagg tattagaggc aattctttgg 5040 <210> 362 <211> 1680 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(26) <400> 362 Met Ala Arg Ser Lys Arg Val Leu Ala Trp Ile Met Ser Ser Val Leu 1 5 10 15 Leu Ile Ser Met Ala Met Pro Ser Phe Ala Ser Gly Asp Ser Ser Gln 20 25 30 Val Pro Arg Val Ile Phe Glu Thr Gly Phe Glu Thr Gly Leu Asp Gly 35 40 45 Phe Lys Gly Arg Gly Ser Ala Thr Leu Thr Arg Thr Thr Asp Glu Thr 50 55 60 Gln Ala Gly Asp Tyr Ser Val Leu Val Ser Asn Arg Leu Glu His Trp 65 70 75 80 Asn Gly Ala Ser Leu Pro Leu Thr Gly Phe Val Leu Pro Gly Asn Thr 85 90 95 Tyr Glu Phe Val Gly Tyr Ile Lys Ala Lys Ala Asp Val Ala Asp Asn 100 105 110 Tyr Val Met Ser Gly Glu Tyr Asn Glu Gly Ile Ser Gly Asn Gln Tyr 115 120 125 Pro Trp Ile Ser Asn Arg Leu Leu Thr Val Gln Asp Gly Phe Val Glu 130 135 140 Phe Arg Gly Glu Leu Thr Ile Leu Glu Asp Met Thr Ser Phe Asn Leu 145 150 155 160 Asn Phe Glu His Gln Asn Ala Glu Val Glu Phe Tyr Leu Asp Ser Val 165 170 175 Gln Val Ile Leu Ile Glu Glu Gly Gln Val Asn Asp Leu Pro Met Asn 180 185 190 Val Arg Arg Ala Pro Leu Thr Leu Ala Glu Thr Pro Leu His Glu Ile 195 200 205 Trp Ala Asp His Phe Thr Ile Gly Asn Ile Tyr Thr Pro Gly Phe Arg 210 215 220 Thr Asp Ile Arg Gly Glu Val Leu Ala His His Phe Asn Val Ile Thr 225 230 235 240 Ala Glu Asn Ile Met Lys Pro Asp His Leu Gln Arg Glu Gln Gly Ile 245 250 255 Phe Thr Phe Ser Ala Ser Asn Asp Met Met Glu Phe Ala Arg Ala Asn 260 265 270 Asn Gln Glu Val Ile Gly His Thr Leu Val Trp His Ser Gln Ser Phe 275 280 285 Pro Trp Phe Glu Ala Leu Asn Pro Thr Arg Asp Glu Ala Ile Ala Ile 290 295 300 Met His Ala His Ile Glu Thr Val Met Gly His Phe Asn Glu Asn Tyr 305 310 315 320 Pro Gly Val Ile Thr Gly Trp Asp Val Leu Asn Glu Ala Ile Gln Pro 325 330 335 Arg Gln Gly Gln Asp Pro Glu Asn Trp Arg Leu His Leu Arg Asp Thr 340 345 350 Lys Trp Leu Arg Ala Ile Gly Asp Asp Tyr Ile Ala Ile Ala Phe Asn 355 360 365 Lys Ala His Glu Met Asp Pro Asp Ala Ile Leu Tyr Tyr Asn Asp Tyr 370 375 380 Asn Asp Asn Asp Tyr Phe Lys Ala Thr Ile Ile Lys Ala Met Val Gln 385 390 395 400 Glu Leu Arg Asn Glu Gly Val Pro Ile His Arg Ile Gly Met Gln Gly 405 410 415 His Tyr Asn Leu Gln Thr Pro Leu Asn Ser Ile Arg Thr Ser Val Glu 420 425 430 Arg Phe Ser Glu Ile Thr Gly His Glu Asp Leu Pro Pro Ile Gly Ile 435 440 445 Ser Phe Thr Glu Ile Asp Val Thr Val Pro Gly Phe Glu Ser Ala Ala 450 455 460 Arg Leu Pro Glu Glu Val Glu Ile Arg Gln Ala Gln Phe Tyr Ala Gln 465 470 475 480 Leu Met Gln Ile Leu Arg Asp Asn Ser Asp Val Ile His Arg Val Thr 485 490 495 Phe Trp Gly Met Ser Asp Arg Glu Ser Trp Arg Ala Asp Arg His Pro 500 505 510 Asn Met Leu Asp Pro Gln Tyr Gly Pro Lys His Val Phe His Ala Ile 515 520 525 Ala Asn Pro Glu Ala Phe Leu Thr Ala Tyr Pro Leu Pro Glu Thr Pro 530 535 540 Asp Ala Gln Thr Ala Tyr Ala Ser Gln Gly Gln Pro Val Val Gly Gln 545 550 555 560 Phe Asn Leu Asp Ala Tyr Gln Asn Ser Glu Val Ile Pro Val Ala Asn 565 570 575 Gln Met Thr Ala His Asn Gly Ala Thr Ala Val Ala Arg Val Val Trp 580 585 590 His Glu Asp Ala Ile Tyr Ile Leu Ala Asn Val Ser Asp Ala Thr Pro 595 600 605 Asn Val Ala Ala Ser Ala Ala His Glu Gln Asp Ser Leu Glu Val Phe 610 615 620 Ile Ser Asn Thr Asp Ser Arg Ile Ser Asn Tyr Met Pro Gly Asp Tyr 625 630 635 640 Gln Leu Arg Phe Asn Arg Ala Gly Val His Thr Tyr Gly Ser Thr Gly 645 650 655 Ser Ile Glu Gly Met Thr Phe Ala Val Gln Asp Gly Pro Ile Gly Tyr 660 665 670 Gln Val Glu Val Arg Ile Pro Leu Glu Asn Glu Val Tyr Val Gly Arg 675 680 685 Arg Leu Gly Phe Asp Leu Gln Val Asn Asp Ala Trp Glu Val Gly Gly 690 695 700 Thr Ser Gly Arg Gln Ala Phe Ala Lys Trp Asn Asp His Thr Asp Asn 705 710 715 720 Gly Trp Gln Ser Thr Glu Phe Trp Gly Trp Leu Leu Leu Gln Gly Asp 725 730 735 Ala Ala Pro Val Leu Pro Val Val Leu Val Glu Glu Gly Phe Glu Thr 740 745 750 Asp Leu Gly Ser Phe Gln Pro Arg Gly Ser Ser Thr Leu Thr Arg Thr 755 760 765 Gln Glu Val Ser His Glu Gly Asp Tyr Ser Val Leu Val Ser Asn Arg 770 775 780 Val Asn Asn Trp Asn Gly Ala Ser Leu Pro Leu Thr Gly Ile Val Gln 785 790 795 800 Pro Gly Asn Thr Tyr Glu Phe Val Gly Tyr Ile Arg Ala Lys Ala Asp 805 810 815 Val Thr Gly Ser Tyr Ile Met Ser Gly Glu Phe Asn Asn Gly Ser Gly 820 825 830 Val Leu Glu Asn Gly Ser Ile Asn Arg Trp Pro Trp Leu Ser Asn Arg 835 840 845 Ser Leu Thr Ile Ala Asp Gly Phe Val Glu Phe Lys Ser Glu Leu Thr 850 855 860 Ile Pro Ser Asp Met Thr Thr Phe Asn Leu Asn Phe Glu His Gln Asn 865 870 875 880 Ala Glu Val Glu Phe Tyr Leu Asp Ala Val Gln Val Thr Leu Ile Ala 885 890 895 Glu Ala Asp Val Thr Pro Val Asp Pro Pro Val Asp Pro Pro Val Glu 900 905 910 Pro Glu Ile Thr Val Val Tyr Ser Met Val Asp Asp Ala Ala Ile Gln 915 920 925 Gly Ile Glu Val Gly Thr Thr Gly Thr Ala Glu Asp Phe Ser Asp Ile 930 935 940 Ser Glu Ala Leu Leu Val Ser Gly Ser Pro Val Val Thr Ala Val Ala 945 950 955 960 His Pro Glu Glu Ala Gly Lys Ile Gly Ile Glu Leu Ser Asn Arg Ala 965 970 975 Glu Asn Trp His Ala Leu Asp Phe Met Phe Pro Ala Ile Gly Val Gln 980 985 990 Arg Gly Gly Ser Tyr Arg Phe Val Ala Ser Gly Arg Met Ala Glu Gly 995 1000 1005 Thr Gly Asn Ser Asn Arg Arg Met Gln Trp Asn Gln Thr Asp Ala Pro 1010 1015 1020 Trp Ser Glu Ile Ser Gly Ser Arg Thr Asn Val Ala Pro Ala Ala Thr 1025 1030 1035 1040 Thr Trp Thr Ile Asp Val Thr Leu Ser Arg Leu Gln Ile Asn Thr Leu 1045 1050 1055 Leu Asn Ala Gly Gln Arg Gly Leu Arg Ile Gln Thr Gly Asn Ala Pro 1060 1065 1070 Thr Val Thr Ile Thr Ile Asp Asp Val Phe Val Tyr Gln Ile Gly Asp 1075 1080 1085 Ile Asp Thr Ala Gly Leu Pro Leu Pro Pro Gln Trp Asn Phe Asp Leu 1090 1095 1100 Pro Arg Leu Ser Glu Leu Phe Glu Pro Tyr Phe Gly Leu Gly Asn Ile 1105 1110 1115 1120 Tyr Ser Thr Glu Thr Leu Met Asn Ala Asn Glu Thr Lys Arg Ala Phe 1125 1130 1135 Leu His His Phe Asn Val Ile Thr Ala Glu Asn Gly His Lys Pro Ser 1140 1145 1150 Ser Ile Ala Gly Pro Glu Asn Ser Phe Thr Val Pro Glu Pro Glu Gln 1155 1160 1165 Phe Asn Phe Thr Asp Ala Asp Arg Ile Val Asn Phe Ala Val Glu Asn 1170 1175 1180 Asp Ile Glu Leu Val Gly His Ala Leu Val Trp His Ser Gln Ser Pro 1185 1190 1195 1200 Asn Trp Leu Phe Arg Ser Ala Ala Asn Thr Pro Leu Thr Arg Ala Glu 1205 1210 1215 Ala Lys Glu Arg Met Ala Tyr Tyr Met Lys Thr Val Ser Glu His Phe 1220 1225 1230 Glu Ala Gln Gly Thr Leu Gly Ala Phe Tyr Gly Trp Asp Val Val Asn 1235 1240 1245 Glu Ala Ile Ala Ser Gly Gly Gly Thr Phe Val Asp Gln Pro Gly His 1250 1255 1260 Trp Arg Thr Gln Met Arg Thr Ser Ser Pro Trp Phe Gln Ala Phe Asn 1265 1270 1275 1280 Asn Gly Leu Asp Val Glu Ala Gly Glu His Ala Ser Asp Tyr Ile Phe 1285 1290 1295 Tyr Ala Tyr Tyr Tyr Ala Arg Lys Tyr Phe Pro Thr Ser Ile Leu Tyr 1300 1305 1310 Tyr Asn Asp Tyr Asn Asp Glu Ile Pro Asn Lys Arg Asp Asn Ile Ala 1315 1320 1325 Gln Met Val Glu Glu Ile Asn Ala Leu Trp Glu Ala His Glu Glu Tyr 1330 1335 1340 Asp Gly Arg Leu Leu Ile Glu Ser Ile Gly Met Gln Ser His Tyr His 1345 1350 1355 1360 Met Glu Gly Trp Thr Thr Ser Val Asp Asn Val Arg Ala Ala Leu Asp 1365 1370 1375 Arg Tyr Ile Ala Thr Gly Ala Arg Val Ser Val Thr Glu Leu Asp Ile 1380 1385 1390 Thr Tyr Gly Gly His Gly Ser Asn Ala Tyr Ala Ser Leu Thr Pro Glu 1395 1400 1405 Gln Leu Ala Ala Gln Ala Glu Arg Tyr Ala Glu Ile Phe Thr Leu Tyr 1410 1415 1420 Leu Glu Arg Ala Asp Gln Leu Ser Arg Val Ser Ile Trp Gly Met Ser 1425 1430 1435 1440 Asp Ala Asn Ser Trp Arg Ser Ser Gly Phe Pro Leu Leu Phe Asp Ser 1445 1450 1455 Ser Leu Asn Ala Lys Pro Ala Phe Asn Ala Ile Val Glu Leu Val Lys 1460 1465 1470 Asn Trp Glu Thr Pro Thr Val Val Ala Pro Val Ile Gln Thr Arg Thr 1475 1480 1485 Leu Ala Pro Leu Glu Ser Gly Glu Arg Val Phe Thr Met Leu Asp Val 1490 1495 1500 Val Arg Gly Ser Asn Ala Pro Val Trp Phe Ser Ile Thr Asp Gly Ala 1505 1510 1515 1520 Leu Pro Glu Gly Ile Ile Leu His Ser Arg Thr Gly Ile Leu Glu Gly 1525 1530 1535 Thr Pro Val Glu Asp Gly His Tyr Ser Phe Thr Val Thr Ala Arg Asn 1540 1545 1550 Tyr Gly Gly Ser Thr Ser Gln Ala Leu Thr Leu Thr Val Gly His Pro 1555 1560 1565 Val Ala Pro Pro Val Thr Pro Pro Val Thr Pro Pro Thr Val Ile Ile 1570 1575 1580 Asp Glu Ser Asp Ile Pro Gln Ala Gly Pro Gly Leu Arg Ala Pro Gln 1585 1590 1595 1600 Ile Val Val Thr Val Gln Glu Gly Ser Glu Val Thr Phe Asp Leu Glu 1605 1610 1615 Lys Leu Glu Glu Val Met Ala Ser Leu Ser Ser Gln Val Pro Leu Val 1620 1625 1630 Leu Asp Val Glu Leu Glu Asp Ser Ile Ile Thr Leu Asp Gln Thr Leu 1635 1640 1645 Leu Lys Arg Leu Thr Asp Lys Ala Ala Gly Ile Glu Ile Gln Ala Asp 1650 1655 1660 Gly Phe Ser Tyr Met Leu Pro Ala Glu Val Leu Glu Ala Ile Leu Trp 1665 1670 1675 1680 <210> 363 <211> 1317 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 363 gtgaccaccc gcgcacaggt tcttgatcag gcgctggcac tgggccaccg gtgtggctgg 60 gaaaaactca gcctggacgc catcgccagg gcgctgggcc gttttggcag cctggctctg 120 tgtgtcgcgc tgttgagcgc ctgcggcagt agtagtagct ccctggatga tccgggtgct 180 ggcagcagtt cttccagctc tgagagcagc caaagctcca gcgccagttc ccaggctgat 240 ggcgacggta cccaggacag cctctacgcc caggcggact tccctgtagg ggttgcggtg 300 caggtggcca attgggagcc tttcagcctg tttaccgcgc ccgatgccgc tgcgcgtcag 360 aacctggttg cccgacactt ctccgaagtg accgcgacca acgtcatgaa aatgtcctat 420 atgcgcacca acagtggtgg ttttaccgac gcgccggcgc gtccgctgat tgattttgcc 480 cgcgccaatg gcatcaaagt gcacggtcac gcactggtct ggcatgcgga ttatcaggtg 540 ccaaatgtgt ttcgtgacta cgaaggggac aattggcagg ggcttttaac cgagcatgtc 600 gagggcgtta tggggctgtt tgacgacacc gtggtaagtt gggatgtcgt aaacgaagcg 660 gttgataccg gctcacctga cggctggcgc cggtcgattt tctataattt tgcgccgccg 720 gaagcagggc aggtgccgga atatattgaa gtggcttacc aggccgctcg agaggccaat 780 ccggaagtga ccctctacta caacgatttt gacaacacgg ccaataccgg gcgcctcaac 840 aagaccctgg aaattgccga tcgcctgaaa gagctggacg cgatcgacgg tatcgggttc 900 cagatgcacg cctatatgaa ctacccgagt attgcgcagt ttcgcaatgc ctttcaggaa 960 gtggtcgatc gtgacctgaa agtcaaagtc accgagctgg acattgccat cgtcaaccct 1020 tacggcagct cgacgcctcc gccgctgccg gagtttgatc aggcgctggc cgacgcccaa 1080 ggtgtccgtt actgccagat tgccgaggcc tatctggatg tcgttcctgc cgagctgcgg 1140 ggtggtttca ccgtctgggg cctgaccgat gacgacagct ggctgatggg agcgttcgcg 1200 tccgcaaccg gcgcccaata cgaccaggtc tatccggtgt tgtttgacga taatctgcaa 1260 gccaagcccg cgttctttgg cgtcaagcgc gccctccgcg gcgaaccctg cgagtaa 1317 <210> 364 <211> 438 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <400> 364 Met Thr Thr Arg Ala Gln Val Leu Asp Gln Ala Leu Ala Leu Gly His 1 5 10 15 Arg Cys Gly Trp Glu Lys Leu Ser Leu Asp Ala Ile Ala Arg Ala Leu 20 25 30 Gly Arg Phe Gly Ser Leu Ala Leu Cys Val Ala Leu Leu Ser Ala Cys 35 40 45 Gly Ser Ser Ser Ser Ser Leu Asp Asp Pro Gly Ala Gly Ser Ser Ser 50 55 60 Ser Ser Ser Glu Ser Ser Gln Ser Ser Ser Ala Ser Ser Gln Ala Asp 65 70 75 80 Gly Asp Gly Thr Gln Asp Ser Leu Tyr Ala Gln Ala Asp Phe Pro Val 85 90 95 Gly Val Ala Val Gln Val Ala Asn Trp Glu Pro Phe Ser Leu Phe Thr 100 105 110 Ala Pro Asp Ala Ala Ala Arg Gln Asn Leu Val Ala Arg His Phe Ser 115 120 125 Glu Val Thr Ala Thr Asn Val Met Lys Met Ser Tyr Met Arg Thr Asn 130 135 140 Ser Gly Gly Phe Thr Asp Ala Pro Ala Arg Pro Leu Ile Asp Phe Ala 145 150 155 160 Arg Ala Asn Gly Ile Lys Val His Gly His Ala Leu Val Trp His Ala 165 170 175 Asp Tyr Gln Val Pro Asn Val Phe Arg Asp Tyr Glu Gly Asp Asn Trp 180 185 190 Gln Gly Leu Leu Thr Glu His Val Glu Gly Val Met Gly Leu Phe Asp 195 200 205 Asp Thr Val Val Ser Trp Asp Val Val Asn Glu Ala Val Asp Thr Gly 210 215 220 Ser Pro Asp Gly Trp Arg Arg Ser Ile Phe Tyr Asn Phe Ala Pro Pro 225 230 235 240 Glu Ala Gly Gln Val Pro Glu Tyr Ile Glu Val Ala Tyr Gln Ala Ala 245 250 255 Arg Glu Ala Asn Pro Glu Val Thr Leu Tyr Tyr Asn Asp Phe Asp Asn 260 265 270 Thr Ala Asn Thr Gly Arg Leu Asn Lys Thr Leu Glu Ile Ala Asp Arg 275 280 285 Leu Lys Glu Leu Asp Ala Ile Asp Gly Ile Gly Phe Gln Met His Ala 290 295 300 Tyr Met Asn Tyr Pro Ser Ile Ala Gln Phe Arg Asn Ala Phe Gln Glu 305 310 315 320 Val Val Asp Arg Asp Leu Lys Val Lys Val Thr Glu Leu Asp Ile Ala 325 330 335 Ile Val Asn Pro Tyr Gly Ser Ser Thr Pro Pro Pro Leu Pro Glu Phe 340 345 350 Asp Gln Ala Leu Ala Asp Ala Gln Gly Val Arg Tyr Cys Gln Ile Ala 355 360 365 Glu Ala Tyr Leu Asp Val Val Pro Ala Glu Leu Arg Gly Gly Phe Thr 370 375 380 Val Trp Gly Leu Thr Asp Asp Asp Ser Trp Leu Met Gly Ala Phe Ala 385 390 395 400 Ser Ala Thr Gly Ala Gln Tyr Asp Gln Val Tyr Pro Val Leu Phe Asp 405 410 415 Asp Asn Leu Gln Ala Lys Pro Ala Phe Phe Gly Val Lys Arg Ala Leu 420 425 430 Arg Gly Glu Pro Cys Glu 435 <210> 365 <211> 3246 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 365 atgaaccact tcgcttcaaa atcgctgcgc atggcgtggc aacccggact gcttgcgaca 60 accgtgctgc cgttggcggc tgccgcccca ataccagcgc cgaatacgga taccaaagtg 120 agcaatactt cgtccatcac cactccggct gcggctccac agtcgcagcc acaaccaacg 180 caagacgcaa acgctcccgc accgcttaaa gcggctttcc gggataagtt tctcatcggc 240 gcggtgctga gtgacgctgc gctgcgaggc agtgcgcccg acaaggtggc gatagccacc 300 acgcacttta acgcgctcac cgccgaaaac gccatgaagc cagacgcgat gcaaccgcgc 360 gaagggcagt tcaacttcgc tgcaggcgat cggctcgtcg aactcgccga aaaaagcggc 420 ggtgtgccca tcggccacac gctggtgtgg cacgcgcaaa caccgaagtg gttttttgaa 480 gggccggatg gacagcccgc gacgcgcgaa ctggctttgg agcgcatgcg caaacacatt 540 tccactgtgg tggggcgcta caaagggcgc atcaaggagt gggatgtggt gaacgaagcc 600 atcaacgacg gacccggtgt gctgcgtccc tctccctggc tcaaagccat cggcgaagat 660 tacatcgccg aagccttccg cgccgcgcac gccgccgacc ccgacgcgat tttgatttat 720 aacgattaca acatcgaact gggctacaaa cggcccaaag cgctgcaact cctaaaatcg 780 ctcattgacc agaaagtgcc gattcacgcc gtgggcattc agggtcactg gcgcatggac 840 aacccgaact tcgccgaagt ggaacaggcc atcaaagagt tttcggcgct ggggttgaaa 900 gtcatgatca ccgaactcga catcggcgtg ctgccgacgc gttatcaggg cgcggatatt 960 tcagcgaccg aaaccatgac gcccgaacag cgcgccgtga tgaaccccta tacggacgga 1020 ttgccggacg atgtggcgca aaagcacgcc gagcgctatc gccaggcgtt tgagatgttc 1080 ctgcggcaca aagacaaaat cagtcgtgtg acattttggg gtgtggacga cggcacttcg 1140 tggctgaacg gtttcccggt gcgcggccgc accgattatc cgctgctatt tgatcgtcag 1200 ggcaagccaa aacccgcctt tttcgcggtg caaaacgcgg cgatgggcgc aacagcgcaa 1260 ccgagcgcca gcgctcccgc aacgcatggc gccgctcctg catccaccaa cattcgcggc 1320 gccgagtttc ctcgcgtgga aagcgacggg cgggtgacgt ttcgcatcaa agcgcctgac 1380 gcgcaaaaag tgcaatttga tttaggtaag ccttacgacg ccacccgcga cgccgagggc 1440 aactggacgg cgaccacaga gccacaagtg cccggcttcc attattattt tttgattgtc 1500 gatggagtgc gcgtggccga cccggcgagc gaaacctttt acggtgcggg ccgccagatg 1560 agcggcatcg aaattcccga tcccgacagc gcgttttatt cgccgcaaaa cgtgccgcat 1620 ggcgaagtgc gcgaacgctg gtatttttcc aacaccacgc aggcgtggcg gcgcatcttc 1680 atttatacgc cgccgggtta cgacaccgat caggccatgc gttttcctgt gctgtatttg 1740 cagcacggcg gtggcgaaga cgaacgcggc tggcccaatc aggggcgcgt gagctttatc 1800 atggacaatc tcatcgcgca gggcaaagcc aaaccgatgc tggtggtgat ggagcaaggc 1860 tatgcgcgca agcccgatga accgcaggtg ccgctgcgcc cgcccggaag caacgccgga 1920 gcgatgccgc ccgactttaa tcgcatgttc gccacgctgg gcgaagtgtt caccaaagac 1980 ctgattccgt ttattgacgc aaattaccgc accaaaaccg agcgcgaaaa ccgcgcgatg 2040 gccggacttt cgatgggtgg aatgcaaagt ttcatcatcg gcctggcgaa caccgatcta 2100 ttcgcgcacc tcggcggttt cagcggcgcg ggtggtggtt ttggcggcgg cgccttcgac 2160 gccaaaaccg cgcacggcgg tgtgatggcc gatgccgatg ccttcaacaa aaaagttcgc 2220 acgatgtttc tcagcatcgg cactgccgag aacgagcgtt ttcagagcag cgtgcgcggt 2280 taccgcgacg cgctgaccaa agcgggcatc aaaaccacgt tctacgaatc gcccggcact 2340 tcgcacgagt ggctgacatg gcgccgcagc ctgcgcgaat tcgcgccgct cttgtttcaa 2400 gaggccaaca cgcagatcga gcgcggcccc aatgcccgcc cgattgcgcc gcagccgatt 2460 gttcttggcc cgggcgacaa gcccgccttc cctccggcgc cctccggttt cgatgcgcgg 2520 cgcgatggca ttccgcacgg cgaaattaaa cttgtggaat acccttctgc cacggtcggc 2580 accacgcgca agatgcaggt ctatacgccg ccgggctaca acccgcaaga agaatatccc 2640 gtgctctatt tgctgcacgg catcggcggc gacgagtggg aatggaaaaa tggcggcacg 2700 cccgaagtga ttctcgacaa cctctacgct gagaagaaac tccagccgat gatcgtggtg 2760 atgcccaatg ggcgcgcgca aaaagacgac cgtcctatcg gcaacgtgtt cgcttccgct 2820 ccggcgtttg cgacgtttga gaaagatttg ctgaacgaca ttatcccctt tgttgagaag 2880 aattacccga ccaaaaccgg cccgcaaaat cgcgctttgg ccggtctttc gatgggcggc 2940 gggcaatctc tcaactttgg cctcggcaac ctcgacacct tcgcgtgggt tggcggcttt 3000 tcgtccgcgc ccaacacgcg cagcggcgca agtctactgg ccaatcccga cgacgccaaa 3060 aagaagctga agctgctgtg ggtttcgtgc ggcgataaag acaatttgat gtttatcagc 3120 cagcgcacgc accgttatct tgccgagaat aacgtgccgc acatctggca tgtacagccc 3180 ggcggacacg acttcaaggt gtggaagcaa gacctgtata acttcgccca actgctattc 3240 cgttaa 3246 <210> 366 <211> 1081 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(65) <400> 366 Met Asn His Phe Ala Ser Lys Ser Leu Arg Met Ala Trp Gln Pro Gly 1 5 10 15 Leu Leu Ala Thr Thr Val Leu Pro Leu Ala Ala Ala Ala Pro Ile Pro 20 25 30 Ala Pro Asn Thr Asp Thr Lys Val Ser Asn Thr Ser Ser Ile Thr Thr 35 40 45 Pro Ala Ala Ala Pro Gln Ser Gln Pro Gln Pro Thr Gln Asp Ala Asn 50 55 60 Ala Pro Ala Pro Leu Lys Ala Ala Phe Arg Asp Lys Phe Leu Ile Gly 65 70 75 80 Ala Val Leu Ser Asp Ala Ala Leu Arg Gly Ser Ala Pro Asp Lys Val 85 90 95 Ala Ile Ala Thr Thr His Phe Asn Ala Leu Thr Ala Glu Asn Ala Met 100 105 110 Lys Pro Asp Ala Met Gln Pro Arg Glu Gly Gln Phe Asn Phe Ala Ala 115 120 125 Gly Asp Arg Leu Val Glu Leu Ala Glu Lys Ser Gly Gly Val Pro Ile 130 135 140 Gly His Thr Leu Val Trp His Ala Gln Thr Pro Lys Trp Phe Phe Glu 145 150 155 160 Gly Pro Asp Gly Gln Pro Ala Thr Arg Glu Leu Ala Leu Glu Arg Met 165 170 175 Arg Lys His Ile Ser Thr Val Val Gly Arg Tyr Lys Gly Arg Ile Lys 180 185 190 Glu Trp Asp Val Val Asn Glu Ala Ile Asn Asp Gly Pro Gly Val Leu 195 200 205 Arg Pro Ser Pro Trp Leu Lys Ala Ile Gly Glu Asp Tyr Ile Ala Glu 210 215 220 Ala Phe Arg Ala Ala His Ala Ala Asp Pro Asp Ala Ile Leu Ile Tyr 225 230 235 240 Asn Asp Tyr Asn Ile Glu Leu Gly Tyr Lys Arg Pro Lys Ala Leu Gln 245 250 255 Leu Leu Lys Ser Leu Ile Asp Gln Lys Val Pro Ile His Ala Val Gly 260 265 270 Ile Gln Gly His Trp Arg Met Asp Asn Pro Asn Phe Ala Glu Val Glu 275 280 285 Gln Ala Ile Lys Glu Phe Ser Ala Leu Gly Leu Lys Val Met Ile Thr 290 295 300 Glu Leu Asp Ile Gly Val Leu Pro Thr Arg Tyr Gln Gly Ala Asp Ile 305 310 315 320 Ser Ala Thr Glu Thr Met Thr Pro Glu Gln Arg Ala Val Met Asn Pro 325 330 335 Tyr Thr Asp Gly Leu Pro Asp Asp Val Ala Gln Lys His Ala Glu Arg 340 345 350 Tyr Arg Gln Ala Phe Glu Met Phe Leu Arg His Lys Asp Lys Ile Ser 355 360 365 Arg Val Thr Phe Trp Gly Val Asp Asp Gly Thr Ser Trp Leu Asn Gly 370 375 380 Phe Pro Val Arg Gly Arg Thr Asp Tyr Pro Leu Leu Phe Asp Arg Gln 385 390 395 400 Gly Lys Pro Lys Pro Ala Phe Phe Ala Val Gln Asn Ala Ala Met Gly 405 410 415 Ala Thr Ala Gln Pro Ser Ala Ser Ala Pro Ala Thr His Gly Ala Ala 420 425 430 Pro Ala Ser Thr Asn Ile Arg Gly Ala Glu Phe Pro Arg Val Glu Ser 435 440 445 Asp Gly Arg Val Thr Phe Arg Ile Lys Ala Pro Asp Ala Gln Lys Val 450 455 460 Gln Phe Asp Leu Gly Lys Pro Tyr Asp Ala Thr Arg Asp Ala Glu Gly 465 470 475 480 Asn Trp Thr Ala Thr Thr Glu Pro Gln Val Pro Gly Phe His Tyr Tyr 485 490 495 Phe Leu Ile Val Asp Gly Val Arg Val Ala Asp Pro Ala Ser Glu Thr 500 505 510 Phe Tyr Gly Ala Gly Arg Gln Met Ser Gly Ile Glu Ile Pro Asp Pro 515 520 525 Asp Ser Ala Phe Tyr Ser Pro Gln Asn Val Pro His Gly Glu Val Arg 530 535 540 Glu Arg Trp Tyr Phe Ser Asn Thr Thr Gln Ala Trp Arg Arg Ile Phe 545 550 555 560 Ile Tyr Thr Pro Pro Gly Tyr Asp Thr Asp Gln Ala Met Arg Phe Pro 565 570 575 Val Leu Tyr Leu Gln His Gly Gly Gly Glu Asp Glu Arg Gly Trp Pro 580 585 590 Asn Gln Gly Arg Val Ser Phe Ile Met Asp Asn Leu Ile Ala Gln Gly 595 600 605 Lys Ala Lys Pro Met Leu Val Val Met Glu Gln Gly Tyr Ala Arg Lys 610 615 620 Pro Asp Glu Pro Gln Val Pro Leu Arg Pro Pro Gly Ser Asn Ala Gly 625 630 635 640 Ala Met Pro Pro Asp Phe Asn Arg Met Phe Ala Thr Leu Gly Glu Val 645 650 655 Phe Thr Lys Asp Leu Ile Pro Phe Ile Asp Ala Asn Tyr Arg Thr Lys 660 665 670 Thr Glu Arg Glu Asn Arg Ala Met Ala Gly Leu Ser Met Gly Gly Met 675 680 685 Gln Ser Phe Ile Ile Gly Leu Ala Asn Thr Asp Leu Phe Ala His Leu 690 695 700 Gly Gly Phe Ser Gly Ala Gly Gly Gly Phe Gly Gly Gly Ala Phe Asp 705 710 715 720 Ala Lys Thr Ala His Gly Gly Val Met Ala Asp Ala Asp Ala Phe Asn 725 730 735 Lys Lys Val Arg Thr Met Phe Leu Ser Ile Gly Thr Ala Glu Asn Glu 740 745 750 Arg Phe Gln Ser Ser Val Arg Gly Tyr Arg Asp Ala Leu Thr Lys Ala 755 760 765 Gly Ile Lys Thr Thr Phe Tyr Glu Ser Pro Gly Thr Ser His Glu Trp 770 775 780 Leu Thr Trp Arg Arg Ser Leu Arg Glu Phe Ala Pro Leu Leu Phe Gln 785 790 795 800 Glu Ala Asn Thr Gln Ile Glu Arg Gly Pro Asn Ala Arg Pro Ile Ala 805 810 815 Pro Gln Pro Ile Val Leu Gly Pro Gly Asp Lys Pro Ala Phe Pro Pro 820 825 830 Ala Pro Ser Gly Phe Asp Ala Arg Arg Asp Gly Ile Pro His Gly Glu 835 840 845 Ile Lys Leu Val Glu Tyr Pro Ser Ala Thr Val Gly Thr Thr Arg Lys 850 855 860 Met Gln Val Tyr Thr Pro Pro Gly Tyr Asn Pro Gln Glu Glu Tyr Pro 865 870 875 880 Val Leu Tyr Leu Leu His Gly Ile Gly Gly Asp Glu Trp Glu Trp Lys 885 890 895 Asn Gly Gly Thr Pro Glu Val Ile Leu Asp Asn Leu Tyr Ala Glu Lys 900 905 910 Lys Leu Gln Pro Met Ile Val Val Met Pro Asn Gly Arg Ala Gln Lys 915 920 925 Asp Asp Arg Pro Ile Gly Asn Val Phe Ala Ser Ala Pro Ala Phe Ala 930 935 940 Thr Phe Glu Lys Asp Leu Leu Asn Asp Ile Ile Pro Phe Val Glu Lys 945 950 955 960 Asn Tyr Pro Thr Lys Thr Gly Pro Gln Asn Arg Ala Leu Ala Gly Leu 965 970 975 Ser Met Gly Gly Gly Gln Ser Leu Asn Phe Gly Leu Gly Asn Leu Asp 980 985 990 Thr Phe Ala Trp Val Gly Gly Phe Ser Ser Ala Pro Asn Thr Arg Ser 995 1000 1005 Gly Ala Ser Leu Leu Ala Asn Pro Asp Asp Ala Lys Lys Lys Leu Lys 1010 1015 1020 Leu Leu Trp Val Ser Cys Gly Asp Lys Asp Asn Leu Met Phe Ile Ser 1025 1030 1035 1040 Gln Arg Thr His Arg Tyr Leu Ala Glu Asn Asn Val Pro His Ile Trp 1045 1050 1055 His Val Gln Pro Gly Gly His Asp Phe Lys Val Trp Lys Gln Asp Leu 1060 1065 1070 Tyr Asn Phe Ala Gln Leu Leu Phe Arg 1075 1080 <210> 367 <211> 1338 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 367 atgaaaagaa ttggattact atttatggcg ttggcgctaa ccgcatttat ggcgcagcat 60 tcgtccgctc aaaggatttg caataaccaa acagggaccc atggtggatt ctactacaca 120 tggtggagtg atgggggtgg atctgcatgt ataacaatgg gcgatggcgg taactacagc 180 acccaatgga gcaataccgg taactttgta ggcggtaagg gttggagcac aggaagatcc 240 aaccgcgtaa ttagttacaa tgctggtaac tggtcgccat cgggtaatgc ttacctatgt 300 ttatatggct ggactaccaa cccgcttgtt gagtactacg tagttgatag ctggggttct 360 tggagacctc ccggagcaac atcgcaggga acagtaaata ctgatggtgg cacctatgag 420 atatacagaa ctcagcgtgt aaaccagcca tctattcagg ggaatactac tttctatcag 480 tattggagcg ttagaacctc taaaagggcc actggaagca atgctaccat caccttccag 540 aaccacgtaa atgcttgggc aagtaggggt tggaacttgg gagctcatag ctatcaggta 600 ctggctaccg agggttatca gagcagcgga agttcaaata ttactgtttg ggaaggtggt 660 tcaagtggag gttcttcagg tggaagcacc ggaggcagca ctggaggtgg atcacacgag 720 atcattgtaa gagcccgtgg tgtagtaggt tcagagcaaa ttaggcttag ggttggcaat 780 acaaccgttg caacttggac ccttactacc ggttataggg actatagggc tactacctca 840 gctactggtg gtattctggt agagtacttc aatgatagcg gcaaccgtga tgttcagatt 900 gattacatta gggtaaacgg ctcaactcgt caatctgaga acatgtcgta caatacaggg 960 gtatggcaga atggctcatg cggcggctcc aatagcgagt ggctacactg caacggagct 1020 attggctacg gcgatgtggt tactggcaga tcaaccgctg ttgaggaagc atttactgct 1080 gccgaggatt gtggctgtga acctaaggca accctattcc ccaaccctgc tggcagtacc 1140 ctcagtatta tgctagacag gcaaccctat ggcgatgtaa gtattagaat atataatacg 1200 gtaggtgcag ttgttcgcac catcaacaat ccagacctac tcactgaggt tgatgtcagt 1260 gcattaaatt ctggaatcta ctttgtagag cttaggtccg aaggacatgt aagcaactac 1320 aaatttatta aaaagtag 1338 <210> 368 <211> 445 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(23) <400> 368 Met Lys Arg Ile Gly Leu Leu Phe Met Ala Leu Ala Leu Thr Ala Phe 1 5 10 15 Met Ala Gln His Ser Ser Ala Gln Arg Ile Cys Asn Asn Gln Thr Gly 20 25 30 Thr His Gly Gly Phe Tyr Tyr Thr Trp Trp Ser Asp Gly Gly Gly Ser 35 40 45 Ala Cys Ile Thr Met Gly Asp Gly Gly Asn Tyr Ser Thr Gln Trp Ser 50 55 60 Asn Thr Gly Asn Phe Val Gly Gly Lys Gly Trp Ser Thr Gly Arg Ser 65 70 75 80 Asn Arg Val Ile Ser Tyr Asn Ala Gly Asn Trp Ser Pro Ser Gly Asn 85 90 95 Ala Tyr Leu Cys Leu Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr 100 105 110 Tyr Val Val Asp Ser Trp Gly Ser Trp Arg Pro Pro Gly Ala Thr Ser 115 120 125 Gln Gly Thr Val Asn Thr Asp Gly Gly Thr Tyr Glu Ile Tyr Arg Thr 130 135 140 Gln Arg Val Asn Gln Pro Ser Ile Gln Gly Asn Thr Thr Phe Tyr Gln 145 150 155 160 Tyr Trp Ser Val Arg Thr Ser Lys Arg Ala Thr Gly Ser Asn Ala Thr 165 170 175 Ile Thr Phe Gln Asn His Val Asn Ala Trp Ala Ser Arg Gly Trp Asn 180 185 190 Leu Gly Ala His Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln Ser 195 200 205 Ser Gly Ser Ser Asn Ile Thr Val Trp Glu Gly Gly Ser Ser Gly Gly 210 215 220 Ser Ser Gly Gly Ser Thr Gly Gly Ser Thr Gly Gly Gly Ser His Glu 225 230 235 240 Ile Ile Val Arg Ala Arg Gly Val Val Gly Ser Glu Gln Ile Arg Leu 245 250 255 Arg Val Gly Asn Thr Thr Val Ala Thr Trp Thr Leu Thr Thr Gly Tyr 260 265 270 Arg Asp Tyr Arg Ala Thr Thr Ser Ala Thr Gly Gly Ile Leu Val Glu 275 280 285 Tyr Phe Asn Asp Ser Gly Asn Arg Asp Val Gln Ile Asp Tyr Ile Arg 290 295 300 Val Asn Gly Ser Thr Arg Gln Ser Glu Asn Met Ser Tyr Asn Thr Gly 305 310 315 320 Val Trp Gln Asn Gly Ser Cys Gly Gly Ser Asn Ser Glu Trp Leu His 325 330 335 Cys Asn Gly Ala Ile Gly Tyr Gly Asp Val Val Thr Gly Arg Ser Thr 340 345 350 Ala Val Glu Glu Ala Phe Thr Ala Ala Glu Asp Cys Gly Cys Glu Pro 355 360 365 Lys Ala Thr Leu Phe Pro Asn Pro Ala Gly Ser Thr Leu Ser Ile Met 370 375 380 Leu Asp Arg Gln Pro Tyr Gly Asp Val Ser Ile Arg Ile Tyr Asn Thr 385 390 395 400 Val Gly Ala Val Val Arg Thr Ile Asn Asn Pro Asp Leu Leu Thr Glu 405 410 415 Val Asp Val Ser Ala Leu Asn Ser Gly Ile Tyr Phe Val Glu Leu Arg 420 425 430 Ser Glu Gly His Val Ser Asn Tyr Lys Phe Ile Lys Lys 435 440 445 <210> 369 <211> 1077 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 369 atgaaatcat ttatcactgg caaaaaaatt gctgctggac taattactgc agctgctttg 60 agcgcatcta tggtgagcgc gcaaaccctg acttcaaatt ctcaaggcac ccacgacgga 120 tttttctact ctttctggaa ggactcaggc aacgcctcaa tgaacttatt ggcgggcggc 180 cgttatcagt ctagctggaa caccggcacc aacaactggg taggcggtaa aggctggaac 240 ccaggcacta acaaccgtgt aattaactac tctggttact acggtgtgga caactcccaa 300 aactcttacg tcgcgcttta cggctggacc agaaacccat tggttgagta ctacgtgatt 360 gagagctacg gctcatacaa ccctgctagc tgctctggcg gcaccgattt cggtagcttc 420 caaagtgacg gcgccaccta caacgtgcgt cgttgccagc gcgtgcaaca gccttcgatc 480 gatggcaccc agactttcta ccaatacttc agcgtgagaa atccgaaaaa agggtttggg 540 aacatttctg gcaccatcac ctttgctaac cacgtaaact actggagaag cagagggatg 600 aatcttggta accacgatta ccaagttctc gctactgaag gctacagaag cacgggttct 660 tctgacctca ccatcagcca aggcgcaagc aacaacggcg gtggcggcag tagctcaagt 720 gctccatctg ctgggggcgg tagcaagaca atcgtcgtgc gggcacgcgg gactaccgga 780 caagagcaaa tccgtttgcg ggtgaacaac actattgttc agacctggac cttgtccacc 840 accatgcgcg actacaccgt caacactaac ttggcaggcg ggtcattggt tgaatacttc 900 aatgacagcg gcaaccgcga cgtccaagtt gattacatca gcgtaaatgg caatgttcgc 960 caatccgaaa accaaaccta caacaccggt gtctaccaga acggtgcgtg tggcggcggt 1020 aacggccgga gcgagtggct ccattgcaac ggtgcaatcg ggtacggcga tatctaa 1077 <210> 370 <211> 358 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <221> SIGNAL <222> (1)...(27) <400> 370 Met Lys Ser Phe Ile Thr Gly Lys Lys Ile Ala Ala Gly Leu Ile Thr 1 5 10 15 Ala Ala Ala Leu Ser Ala Ser Met Val Ser Ala Gln Thr Leu Thr Ser 20 25 30 Asn Ser Gln Gly Thr His Asp Gly Phe Phe Tyr Ser Phe Trp Lys Asp 35 40 45 Ser Gly Asn Ala Ser Met Asn Leu Leu Ala Gly Gly Arg Tyr Gln Ser 50 55 60 Ser Trp Asn Thr Gly Thr Asn Asn Trp Val Gly Gly Lys Gly Trp Asn 65 70 75 80 Pro Gly Thr Asn Asn Arg Val Ile Asn Tyr Ser Gly Tyr Tyr Gly Val 85 90 95 Asp Asn Ser Gln Asn Ser Tyr Val Ala Leu Tyr Gly Trp Thr Arg Asn 100 105 110 Pro Leu Val Glu Tyr Tyr Val Ile Glu Ser Tyr Gly Ser Tyr Asn Pro 115 120 125 Ala Ser Cys Ser Gly Gly Thr Asp Phe Gly Ser Phe Gln Ser Asp Gly 130 135 140 Ala Thr Tyr Asn Val Arg Arg Cys Gln Arg Val Gln Gln Pro Ser Ile 145 150 155 160 Asp Gly Thr Gln Thr Phe Tyr Gln Tyr Phe Ser Val Arg Asn Pro Lys 165 170 175 Lys Gly Phe Gly Asn Ile Ser Gly Thr Ile Thr Phe Ala Asn His Val 180 185 190 Asn Tyr Trp Arg Ser Arg Gly Met Asn Leu Gly Asn His Asp Tyr Gln 195 200 205 Val Leu Ala Thr Glu Gly Tyr Arg Ser Thr Gly Ser Ser Asp Leu Thr 210 215 220 Ile Ser Gln Gly Ala Ser Asn Asn Gly Gly Gly Gly Ser Ser Ser Ser 225 230 235 240 Ala Pro Ser Ala Gly Gly Gly Ser Lys Thr Ile Val Val Arg Ala Arg 245 250 255 Gly Thr Thr Gly Gln Glu Gln Ile Arg Leu Arg Val Asn Asn Thr Ile 260 265 270 Val Gln Thr Trp Thr Leu Ser Thr Thr Met Arg Asp Tyr Thr Val Asn 275 280 285 Thr Asn Leu Ala Gly Gly Ser Leu Val Glu Tyr Phe Asn Asp Ser Gly 290 295 300 Asn Arg Asp Val Gln Val Asp Tyr Ile Ser Val Asn Gly Asn Val Arg 305 310 315 320 Gln Ser Glu Asn Gln Thr Tyr Asn Thr Gly Val Tyr Gln Asn Gly Ala 325 330 335 Cys Gly Gly Gly Asn Gly Arg Ser Glu Trp Leu His Cys Asn Gly Ala 340 345 350 Ile Gly Tyr Gly Asp Ile 355 <210> 371 <211> 1245 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 371 gtgaccggga tcgcgagaaa aggcgtatgg tccgtgattt ccggaacttt cactgccggg 60 gattacgatt cctacctgct gtatgtcgaa acacaggacc agggcggcgg acacccgacg 120 ctgagctttg aaatccggaa cttcagactg acggcaccgg aaggcatcgc tccgccgaag 180 gcgacagaag aaccggctga cgcggcagag gcgacgcctg ttccggcact gagcgagatt 240 ccgggcctga aggacgtcta cgcggactac tttgacttcg gcgctgcggc gccgcagtat 300 gcattcggcc tcggccagac ccagctgcag gacctgatga tcagccagtt cagcatcctg 360 acccctgaaa acgaactgaa accggacagc gtgcttgatg tccagacgag taaaaaactg 420 gcggcagaag acgaaaccgc ggtggcgatc aggctgaacg ccgcaacgcc gctgctgaag 480 ttcgcgcaga agaacggcat caaagtgcac ggccatgtgc tggtatggca cagccagacg 540 ccggaagctt tcttccatga aggatacgat accaagaaac cctatgtgac gagagaggtt 600 atgctcggcc gcctggaaaa ctatatccgt gaagtgctga cgcagacaga ggaacagttc 660 ccgggcgtga tcgtcagctg ggacgtcgtg aacgaggcga tcgacgacgg tactcactgg 720 ctgcggaaga cttccagctg gtacaaagtc gtcggcgagg atttcctgaa cagggctttt 780 gaatacgcca ggaaatacgc cgcggagggc gtgctgctgt actacaacga ttacagcacg 840 gcaaattcgg ctaaactgat gggcatcacg aagctgctga agcagctgat tccagacggg 900 aatatcgacg gctacggatt ccagatgcac catgacctcg gctggccgag catcgacctt 960 atggcggcag ctgtgaagca gattgccggc ctggggctga aactgcgcgt cagcgaactg 1020 gatatcggcg tatccaagaa caatcaggaa aactatgaca aacaggccaa acgctacaag 1080 gaaatgctga acctgatgct gcagtacgcg gaccagacgg aagccgtgca ggtctggggc 1140 ctgacggaca acatgagctg gagaaccggc aaatacccgc tgctgttcga cagcgcggca 1200 aaaccgaaaa aggcgttctt cgcggtgatt gaagccgcag aggaa 1245 <210> 372 <211> 415 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <400> 372 Met Thr Gly Ile Ala Arg Lys Gly Val Trp Ser Val Ile Ser Gly Thr 1 5 10 15 Phe Thr Ala Gly Asp Tyr Asp Ser Tyr Leu Leu Tyr Val Glu Thr Gln 20 25 30 Asp Gln Gly Gly Gly His Pro Thr Leu Ser Phe Glu Ile Arg Asn Phe 35 40 45 Arg Leu Thr Ala Pro Glu Gly Ile Ala Pro Pro Lys Ala Thr Glu Glu 50 55 60 Pro Ala Asp Ala Ala Glu Ala Thr Pro Val Pro Ala Leu Ser Glu Ile 65 70 75 80 Pro Gly Leu Lys Asp Val Tyr Ala Asp Tyr Phe Asp Phe Gly Ala Ala 85 90 95 Ala Pro Gln Tyr Ala Phe Gly Leu Gly Gln Thr Gln Leu Gln Asp Leu 100 105 110 Met Ile Ser Gln Phe Ser Ile Leu Thr Pro Glu Asn Glu Leu Lys Pro 115 120 125 Asp Ser Val Leu Asp Val Gln Thr Ser Lys Lys Leu Ala Ala Glu Asp 130 135 140 Glu Thr Ala Val Ala Ile Arg Leu Asn Ala Ala Thr Pro Leu Leu Lys 145 150 155 160 Phe Ala Gln Lys Asn Gly Ile Lys Val His Gly His Val Leu Val Trp 165 170 175 His Ser Gln Thr Pro Glu Ala Phe Phe His Glu Gly Tyr Asp Thr Lys 180 185 190 Lys Pro Tyr Val Thr Arg Glu Val Met Leu Gly Arg Leu Glu Asn Tyr 195 200 205 Ile Arg Glu Val Leu Thr Gln Thr Glu Glu Gln Phe Pro Gly Val Ile 210 215 220 Val Ser Trp Asp Val Val Asn Glu Ala Ile Asp Asp Gly Thr His Trp 225 230 235 240 Leu Arg Lys Thr Ser Ser Trp Tyr Lys Val Val Gly Glu Asp Phe Leu 245 250 255 Asn Arg Ala Phe Glu Tyr Ala Arg Lys Tyr Ala Ala Glu Gly Val Leu 260 265 270 Leu Tyr Tyr Asn Asp Tyr Ser Thr Ala Asn Ser Ala Lys Leu Met Gly 275 280 285 Ile Thr Lys Leu Leu Lys Gln Leu Ile Pro Asp Gly Asn Ile Asp Gly 290 295 300 Tyr Gly Phe Gln Met His His Asp Leu Gly Trp Pro Ser Ile Asp Leu 305 310 315 320 Met Ala Ala Ala Val Lys Gln Ile Ala Gly Leu Gly Leu Lys Leu Arg 325 330 335 Val Ser Glu Leu Asp Ile Gly Val Ser Lys Asn Asn Gln Glu Asn Tyr 340 345 350 Asp Lys Gln Ala Lys Arg Tyr Lys Glu Met Leu Asn Leu Met Leu Gln 355 360 365 Tyr Ala Asp Gln Thr Glu Ala Val Gln Val Trp Gly Leu Thr Asp Asn 370 375 380 Met Ser Trp Arg Thr Gly Lys Tyr Pro Leu Leu Phe Asp Ser Ala Ala 385 390 395 400 Lys Pro Lys Lys Ala Phe Phe Ala Val Ile Glu Ala Ala Glu Glu 405 410 415 <210> 373 <211> 1539 <212> DNA <213> Unknown <220> <223> Obtained from an environmental sample. <400> 373 ttgattggct gcgtcatgtc gccgccggaa gcgggaagtc cccgttttga tcttttaacc 60 cggcacttta atgtcatcac cgcggaaaac gccatgaagc ccgcgtcgtt gcagcgcgaa 120 aagggggtgt ttacttttga acaggcggac atgatggtgg acgcggtatt ggagcgggga 180 ctgaagatcc acggacatac tctggcctgg caccagcagt ctccggagtg gatgaatcat 240 gaggggattt cccgggacga agccgtggaa aatctcaccg tccacgccaa aaccgcggcc 300 gctcatttta gggggcgggt catatcctgg gatgtactca acgaggcgat cattgacaat 360 ccccccaacc ccggggattg gcgggcatcc ctcaggcaaa gcccctggta caaagccata 420 ggcccggatt acgtggagct tgtgttcaag gcggccaggg aggcggaccc ggaggcaaaa 480 ctttattata acgattacaa ccttgataac cggaacaagg ccctggcggt ttacaacatg 540 gtcagggaac tgaacgaaaa gaatccgaat ccgggcggca ggcccctcat cgacggcgtg 600 ggcatgcagg gccattaccg cctgaatacc aataccgata acgtgaggct gtcgctggaa 660 cggtttattt ccctgggggt cgaggtcagc atcacggagc tcgatataca ggccggttcg 720 gattcaaacc agacagagcg gcagcgggtg gaacagggcc tggtctatgc cgctttgttt 780 accattttcc gggaacacgc ggcaaacata ggccgggtaa ctttttgggg acttgacgac 840 ggggcaagct ggcgttccgc ggcgagtccc tgcctctttg ataaaaacct caacgcaaaa 900 cctgcctttt acgcggtcct ggacccggat tcctttattg cggaaaacag cgccctgctg 960 atcagggaag cgaaagaggg agaggcttat tatggtacgc ctgctttagg cgccgtccct 1020 gatcccctct gggacagggc gccttccctc ccggtggatc agtacctcat ggcctggcag 1080 ggcgcttcgg gaagggcaaa agtcctctgg gacgaaaaaa atctctatgt gctggtccgg 1140 gttgaaaacg cggaaataaa caaggacagt tccaacagct acgaacagga ttcggtcgaa 1200 atttttattg atgaggataa ccggaaaagt tcctttttca gggaggatga cgggcagtac 1260 cgggtcaatt ttgccaacga ggcgggcttt aacccctcgt ccgccggggc ggggtttgtt 1320 tcggccgccg cggtggatgg aaaatcctat accgttacca tgaagattcc ctttaaaaca 1380 atagtccccg gagcggggac gcgtatcggg tttgatgtcc agatcaacgg cgcgtcggcc 1440 agggggatac gggagagcgt ggcggtatgg aatgatacca cgggcaattc atttcaggat 1500 acctcaggtt acggggtact gcggttagta aaaaagtaa 1539 <210> 374 <211> 512 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample. <400> 374 Met Ile Gly Cys Val Met Ser Pro Pro Glu Ala Gly Ser Pro Arg Phe 1 5 10 15 Asp Leu Leu Thr Arg His Phe Asn Val Ile Thr Ala Glu Asn Ala Met 20 25 30 Lys Pro Ala Ser Leu Gln Arg Glu Lys Gly Val Phe Thr Phe Glu Gln 35 40 45 Ala Asp Met Met Val Asp Ala Val Leu Glu Arg Gly Leu Lys Ile His 50 55 60 Gly His Thr Leu Ala Trp His Gln Gln Ser Pro Glu Trp Met Asn His 65 70 75 80 Glu Gly Ile Ser Arg Asp Glu Ala Val Glu Asn Leu Thr Val His Ala 85 90 95 Lys Thr Ala Ala Ala His Phe Arg Gly Arg Val Ile Ser Trp Asp Val 100 105 110 Leu Asn Glu Ala Ile Ile Asp Asn Pro Pro Asn Pro Gly Asp Trp Arg 115 120 125 Ala Ser Leu Arg Gln Ser Pro Trp Tyr Lys Ala Ile Gly Pro Asp Tyr 130 135 140 Val Glu Leu Val Phe Lys Ala Ala Arg Glu Ala Asp Pro Glu Ala Lys 145 150 155 160 Leu Tyr Tyr Asn Asp Tyr Asn Leu Asp Asn Arg Asn Lys Ala Leu Ala 165 170 175 Val Tyr Asn Met Val Arg Glu Leu Asn Glu Lys Asn Pro Asn Pro Gly 180 185 190 Gly Arg Pro Leu Ile Asp Gly Val Gly Met Gln Gly His Tyr Arg Leu 195 200 205 Asn Thr Asn Thr Asp Asn Val Arg Leu Ser Leu Glu Arg Phe Ile Ser 210 215 220 Leu Gly Val Glu Val Ser Ile Thr Glu Leu Asp Ile Gln Ala Gly Ser 225 230 235 240 Asp Ser Asn Gln Thr Glu Arg Gln Arg Val Glu Gln Gly Leu Val Tyr 245 250 255 Ala Ala Leu Phe Thr Ile Phe Arg Glu His Ala Ala Asn Ile Gly Arg 260 265 270 Val Thr Phe Trp Gly Leu Asp Asp Gly Ala Ser Trp Arg Ser Ala Ala 275 280 285 Ser Pro Cys Leu Phe Asp Lys Asn Leu Asn Ala Lys Pro Ala Phe Tyr 290 295 300 Ala Val Leu Asp Pro Asp Ser Phe Ile Ala Glu Asn Ser Ala Leu Leu 305 310 315 320 Ile Arg Glu Ala Lys Glu Gly Glu Ala Tyr Tyr Gly Thr Pro Ala Leu 325 330 335 Gly Ala Val Pro Asp Pro Leu Trp Asp Arg Ala Pro Ser Leu Pro Val 340 345 350 Asp Gln Tyr Leu Met Ala Trp Gln Gly Ala Ser Gly Arg Ala Lys Val 355 360 365 Leu Trp Asp Glu Lys Asn Leu Tyr Val Leu Val Arg Val Glu Asn Ala 370 375 380 Glu Ile Asn Lys Asp Ser Ser Asn Ser Tyr Glu Gln Asp Ser Val Glu 385 390 395 400 Ile Phe Ile Asp Glu Asp Asn Arg Lys Ser Ser Phe Phe Arg Glu Asp 405 410 415 Asp Gly Gln Tyr Arg Val Asn Phe Ala Asn Glu Ala Gly Phe Asn Pro 420 425 430 Ser Ser Ala Gly Ala Gly Phe Val Ser Ala Ala Ala Val Asp Gly Lys 435 440 445 Ser Tyr Thr Val Thr Met Lys Ile Pro Phe Lys Thr Ile Val Pro Gly 450 455 460 Ala Gly Thr Arg Ile Gly Phe Asp Val Gln Ile Asn Gly Ala Ser Ala 465 470 475 480 Arg Gly Ile Arg Glu Ser Val Ala Val Trp Asn Asp Thr Thr Gly Asn 485 490 495 Ser Phe Gln Asp Thr Ser Gly Tyr Gly Val Leu Arg Leu Val Lys Lys 500 505 510 <210> 375 <211> 570 <212> DNA <213> Artificial Sequence <220> <223> Synthetically generated polynucleotide <400> 375 atggccctta tggcttcgac attctactgg cacttgtgga ctgatggtat agggacagta 60 aatgctacca atggatctga tggcaattac agcgtttcat ggtcaaattg cgggaatttt 120 gttgttggta aaggctggac taccggatca gcaactaggg taataaacta taatgcccac 180 gccttttcgg tagtgggtaa tgcttatttg gctctttatg ggtggacgag aaattcactc 240 atagaatatt acgtcgttga tagctggggg acttatagac ctactggaac ttataaaggc 300 actgtgacta gtgatggagg gacttatgac atatacacga ctacacgaac caacgcacct 360 tccattgacg gcaataatac aactttcacc cagttctgga gtgttaggca gtcgaagaga 420 ccgattggta ccaacaatac catcaccttt agcaaccatg ttaacgcctg gaagagtaaa 480 ggaatgaatt tggggagtag ttggtcttat caggtattag caacagaggg ctatcaaagt 540 agtgggtact ctaacgtaac ggtctggtaa 570 <210> 376 <211> 189 <212> PRT <213> Artificial Sequence <220> <223> Synthetically generated polypeptide <400> 376 Met Ala Leu Met Ala Ser Thr Phe Tyr Trp His Leu Trp Thr Asp Gly 1 5 10 15 Ile Gly Thr Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val 20 25 30 Ser Trp Ser Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr 35 40 45 Gly Ser Ala Thr Arg Val Ile Asn Tyr Asn Ala His Ala Phe Ser Val 50 55 60 Val Gly Asn Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu 65 70 75 80 Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly 85 90 95 Thr Tyr Lys Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr 100 105 110 Thr Thr Thr Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr 115 120 125 Phe Thr Gln Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr 130 135 140 Asn Asn Thr Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys 145 150 155 160 Gly Met Asn Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu 165 170 175 Gly Tyr Gln Ser Ser Gly Tyr Ser Asn Val Thr Val Trp 180 185 <210> 377 <211> 570 <212> DNA <213> Artificial Sequence <220> <223> Synthetically generated polynucleotide <400> 377 atggccctta tggcttcgac attctactgg cacttgtgga ctgatggtat agggacagta 60 aatgctacca atggatctga tggcaattac agcgtttcat ggtcaaattg cgggaatttt 120 gttgttggta aaggctggac taccggatca gcaactaggg taataaacta taatgcccac 180 gccttttcgg tagtgggtaa tgcttatttg gctctttatg ggtggacgag aaatccactc 240 atagaatatt acgtcgttga tagctggggg acttatagac ctactggaac ttataaaggc 300 actgtgacta gtgatggagg gacttatgac atatacacga ctacacgaac caacgcacct 360 tccattgacg gcaataatac aactttcacc cagttctgga gtgttaggca gtcgaagaga 420 ccgattggta ccaacaatac catcaccttt agcaaccatg ttaacgcctg gaagagtaaa 480 ggaatgaatt tggggagtag ttggtcttat caggtattag caacagaggg ctatcaaagt 540 agtgggtact ctaacgtaac ggtctggtaa 570 <210> 378 <211> 189 <212> PRT <213> Artificial Sequence <220> <223> Synthetically generated polypeptide <400> 378 Met Ala Leu Met Ala Ser Thr Phe Tyr Trp His Leu Trp Thr Asp Gly 1 5 10 15 Ile Gly Thr Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val 20 25 30 Ser Trp Ser Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr 35 40 45 Gly Ser Ala Thr Arg Val Ile Asn Tyr Asn Ala His Ala Phe Ser Val 50 55 60 Val Gly Asn Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Pro Leu 65 70 75 80 Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly 85 90 95 Thr Tyr Lys Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr 100 105 110 Thr Thr Thr Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr 115 120 125 Phe Thr Gln Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr 130 135 140 Asn Asn Thr Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys 145 150 155 160 Gly Met Asn Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu 165 170 175 Gly Tyr Gln Ser Ser Gly Tyr Ser Asn Val Thr Val Trp 180 185 <210> 379 <211> 570 <212> DNA <213> Artificial Sequence <220> <223> Synthetically generated polynucleotide. <400> 379 atggccctta tggcttcgac attctactgg cacaattgga ctgatggtat agggacagta 60 aatgctacca atggatctga tggcaattac agcgtttcat ggtcaaattg cgggaatttt 120 gttgttggta aaggctggac taccggatca gcaactaggg taataaacta taatgcccac 180 gccttttcgc cggtgggtaa tgcttatttg gctctttatg ggtggacgag aaattcactc 240 atagaatatt acgtcgttga tagctggggg acttatagac ctactggaac ttataaaggc 300 actgtgacta gtgatggagg gacttatgac atatacacga ctacacgaac caacgcacct 360 tccattgacg gcaataatac aactttcacc cagttctgga gtgttaggca gtcgaagaga 420 ccgattggta ccaacaatac catcaccttt agcaaccatg ttaacgcctg gaagagtaaa 480 ggaatgaatt tggggagtag ttggtcttat caggtattag caacagaggg ctatcaaagt 540 agtgggtact ctaacgtaac ggtctggtaa 570 <210> 380 <211> 189 <212> PRT <213> Artificial Sequence <220> <223> Synthetically generated polypeptide. <400> 380 Met Ala Leu Met Ala Ser Thr Phe Tyr Trp His Asn Trp Thr Asp Gly 1 5 10 15 Ile Gly Thr Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val 20 25 30 Ser Trp Ser Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr 35 40 45 Gly Ser Ala Thr Arg Val Ile Asn Tyr Asn Ala His Ala Phe Ser Pro 50 55 60 Val Gly Asn Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu 65 70 75 80 Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly 85 90 95 Thr Tyr Lys Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr 100 105 110 Thr Thr Thr Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr 115 120 125 Phe Thr Gln Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr 130 135 140 Asn Asn Thr Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys 145 150 155 160 Gly Met Asn Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu 165 170 175 Gly Tyr Gln Ser Ser Gly Tyr Ser Asn Val Thr Val Trp 180 185

Claims (215)

  1. 약 100개 이상의 잔기로 이루어진 영역에 걸쳐 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379의 서열에 대해 50% 이상의서열 동일성을 보유하는 핵산 서열을 포함하는 분리된 핵산 또는 재조합 핵산으로서, 상기 핵산은 자일라나제 활성을 보유하는 하나 이상의 폴리펩티드를 암호화하고, 상기 서열 동일성은 서열 비교 알고리즘에 의한 분석 또는 시각 검사를 통해 결정한 것인 분리된 핵산 또는 재조합 핵산.
  2. 제1항에 있어서, 상기 서열 동일성은 약 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63% 또는 64% 이상인 분리된 핵산 또는 재조합 핵산.
  3. 제1항에 있어서, 상기 서열 동일성은 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379의 서열에 대해 약 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성인 분리된 핵산 또는 재조합 핵산.
  4. 제1항에 있어서, 상기 서열 동일성은 약 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150개 이상의 잔기로 이루어진 영역, 전장 유전자 또는 전사체에 걸친 것인 분리된 핵산 또는 재조합 핵산.
  5. 제1항에 있어서, 상기 핵산 서열은 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379의 서열을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  6. 제1항에 있어서, 상기 핵산은 서열 번호 2, 서열 번호 4, 서열 번호 6, 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18, 서열 번호 20, 서열 번호 22, 서열 번호 24, 서열 번호 26, 서열 번호 28, 서열 번호 30, 서열 번호 32, 서열 번호 34, 서열 번호 36, 서열 번호 38, 서열 번호 40,서열 번호 42, 서열 번호 44, 서열 번호 46, 서열 번호 48, 서열 번호 50, 서열 번호 52, 서열 번호 54, 서열 번호 56, 서열 번호 58, 서열 번호 60, 서열 번호 62, 서열 번호 64, 서열 번호 66, 서열 번호 68, 서열 번호 70, 서열 번호 72, 서열 번호 74, 서열 번호 76, 서열 번호 78, 서열 번호 80, 서열 번호 82, 서열 번호 84, 서열 번호 86, 서열 번호 88, 서열 번호 90, 서열 번호 92, 서열 번호 94, 서열 번호 96, 서열 번호 98, 서열 번호 100, 서열 번호 102, 서열 번호 104, 서열 번호 106, 서열 번호 108, 서열 번호 110, 서열 번호 112, 서열 번호 114, 서열 번호 116, 서열 번호 118, 서열 번호 120, 서열 번호 122, 서열 번호 124, 서열 번호 126, 서열 번호 128, 서열 번호 130, 서열 번호 132, 서열 번호 134, 서열 번호 136, 서열 번호 138, 서열 번호 140, 서열 번호 142, 서열 번호 144, 서열 번호 146, 서열 번호 148, 서열 번호 150, 서열 번호 152, 서열 번호 154, 서열 번호 156, 서열 번호 158, 서열 번호 160, 서열 번호 162, 서열 번호 164, 서열 번호 166, 서열 번호 168, 서열 번호 170, 서열 번호 172, 서열 번호 174, 서열 번호 176, 서열 번호 178, 서열 번호 180, 서열 번호 182, 서열 번호 184, 서열 번호 186, 서열 번호 188, 서열 번호 190, 서열 번호 192, 서열 번호 194, 서열 번호 196, 서열 번호 198, 서열 번호 200, 서열 번호 202, 서열 번호 204, 서열 번호 206, 서열 번호 208, 서열 번호 210, 서열 번호 212, 서열 번호 214, 서열 번호 216, 서열 번호 218, 서열 번호 220, 서열 번호 222, 서열 번호 224, 서열 번호 226, 서열 번호 228, 서열 번호 230, 서열 번호 232, 서열 번호 234, 서열 번호 236, 서열 번호 238, 서열 번호 240, 서열 번호 242, 서열 번호 244, 서열 번호246, 서열 번호 248, 서열 번호 250, 서열 번호 252, 서열 번호 254, 서열 번호 256, 서열 번호 258, 서열 번호 260, 서열 번호 262, 서열 번호 264, 서열 번호 266, 서열 번호 268, 서열 번호 270, 서열 번호 272, 서열 번호 274, 서열 번호 276, 서열 번호 278, 서열 번호 280, 서열 번호 282, 서열 번호 284, 서열 번호 286, 서열 번호 288, 서열 번호 290, 서열 번호 292, 서열 번호 294, 서열 번호 296, 서열 번호 298, 서열 번호 300, 서열 번호 302, 서열 번호 304, 서열 번호 306, 서열 번호 308, 서열 번호 310, 서열 번호 312, 서열 번호 314, 서열 번호 316, 서열 번호 318, 서열 번호 320, 서열 번호 322, 서열 번호 324, 서열 번호 326, 서열 번호 328, 서열 번호 330, 서열 번호 332, 서열 번호 334, 서열 번호 336, 서열 번호 338, 서열 번호 340, 서열 번호 342, 서열 번호 344, 서열 번호 346, 서열 번호 348, 서열 번호 350, 서열 번호 352, 서열 번호 354, 서열 번호 356, 서열 번호 358, 서열 번호 360, 서열 번호 362, 서열 번호 364, 서열 번호 366, 서열 번호 368, 서열 번호 370, 서열 번호 372, 서열 번호 374, 서열 번호 376, 서열 번호 378 또는 서열 번호 380의 서열을 보유하는 폴리펩티드를 암호화하는 것인 분리된 핵산 또는 재조합 핵산.
  7. 제1항에 있어서, 상기 서열 비교 알고리즘은 BLAST 버젼 2.2.2 알고리즘이며, 이때 필터링 세팅은 blastall-p blastp-d "nr pataa" -F F로 설정하고, 모든 다른 옵션은 디폴트로 설정하는 것인 분리된 핵산 또는 재조합 핵산.
  8. 제1항에 있어서, 상기 자일라나제 활성은 내부 β-1,4-자일로시드 결합의 가수분해를 촉진하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  9. 제8항에 있어서, 상기 자일라나제 활성은 엔도-1,4-베타-자일라나제 활성을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  10. 제1항에 있어서, 상기 자일라나제 활성은 더 적은 분자량의 자일로즈와 자일로-올리고머를 생성하기 위한 자일란의 가수분해를 촉진하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  11. 제10항에 있어서, 상기 자일란은 아라비노자일란을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  12. 제11항에 있어서, 상기 아라비노자일란은 수용성 아라비노자일란을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  13. 제12항에 있어서, 상기 수용성 아라비노자일란은 반죽 또는 빵류 제품을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  14. 제1항에 있어서, 상기 자일라나제 활성은 1,4-β-글리코시드-결합된 D-자일로피라노즈를 포함하는 다당류를 가수분해하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  15. 제1항에 있어서, 상기 자일라나제 활성은 헤미셀룰로즈를 가수분해하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  16. 제15항에 있어서, 상기 자일라나제 활성은 목재 또는 종이 펄프 또는 종이 제품내 헤미셀룰로즈를 가수분해하는 것을 포함하는 것인 분리된 핵산 또는 재조합핵산.
  17. 제8항에 있어서, 상기 자일라나제 활성은 사료 또는 식품 중 자일란의 가수분해를 촉진하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  18. 제17항에 있어서, 상기 사료 또는 식품은 곡물이 주성분인 동물 사료, 맥아즙 또는 맥주, 우유 또는 유제품, 과일 또는 채소를 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  19. 제1항에 있어서, 상기 자일란 활성은 미생물 세포 또는 식물 세포중 자알린의 가수분해를 촉진하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  20. 제1항에 있어서, 상기 자일라나제 활성은 열안정성인 분리된 핵산 또는 재조합 핵산.
  21. 제20항에 있어서, 상기 폴리펩티드는 약 37℃∼약 95℃, 또는 약 55℃∼약 85℃, 또는 약 70℃∼약 75℃, 또는 약 70℃∼약 95℃, 또는 약 90℃∼약 95℃의 온도를 포함하는 조건 하에서 자일라나제 활성을 보유하는 것인 분리된 핵산 또는 재조합 핵산.
  22. 제1항에 있어서, 상기 자일라나제 활성은 내열성인 분리된 핵산 또는 재조합 핵산.
  23. 제22항에 있어서, 상기 폴리펩티드는 약 37℃∼약 95℃, 또는 약 55℃∼약 85℃, 또는 약 70℃∼약 75℃, 또는 약 90℃∼약 95℃ 범위의 온도에 노출후 자일라나제 활성을 보유하는 것인 분리된 핵산 또는 재조합
  24. 엄격한 조건 하에서 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51,서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379를 포함하는 핵산에 하이브리드화하는 서열을 포함하며, 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 것인 분리된 핵산 또는 재조합 핵산.
  25. 제24항에 있어서, 상기 핵산은 길이가 약 50, 75, 100, 150, 200, 300, 400, 500, 600, 700, 800, 900, 1000개 이상의 잔기이거나, 유전자 또는 전사체의 전체 길이인 분리된 핵산 또는 재조합 핵산.
  26. 제24항에 있어서, 상기 엄격한 조건은 약 65℃의 온도에서 약 15분 동안 0.2X SSC 중에서 세척하는 단계를 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  27. 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산을 동정하기 위한 핵산 프로브로서, 상기 프로브는 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379를 포함하는 서열의 10개 이상의 연속 염기를 포함하고 결합 또는 하이브리드화에 의해 핵산을 동정하는 것인 핵산 프로브.
  28. 제27항에 있어서, 상기 프로브는 약 10∼50, 약 20∼60, 약 30∼70, 약 40∼80, 약 60∼100 또는 약 50∼150개의 연속 염기를 포함하는 올리고뉴클레오티드를 포함하는 것인 핵산 프로브.
  29. 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산을 동정하기 위한 핵산 프로브로서, 상기 프로브는 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379의 서열에 대해 50% 이상의 서열 동일성을 보유하는 핵산 서열의 약 10개 이상의 연속 잔기를 포함하는 핵산을 포함하며, 상기 서열 동일성은 서열 비교 알고리즘 또는 시각 검사를 통해 결정된 것인 핵산 프로브.
  30. 제29항에 있어서, 상기 프로브는 약 10∼50, 약 20∼60, 약 30∼70, 약 40∼80, 약 60∼100 또는 약 50∼150개 이상의 연속 염기를 포함하는 올리고뉴클레오티드를 포함하는 것인 핵산 프로브.
  31. 자일라나제 할성을 보유하는 폴리펩티드를 암호화하는 핵산을 증폭하기 위한 증폭 프라이머 쌍으로서, 상기 프라이머 쌍은 제1항 또는 제24항의 서열 또는 이의하위서열을 포함하는 핵산을 증폭시킬 수 있는 것인 증폭 프라이머 쌍.
  32. 제31항에 있어서, 상기 다수의 증폭 프라이머 서열 쌍은 상기 서열의 약 10∼50개의 연속 염기 또는 상기 서열의 약 12, 13, 14, 15, 16, 17, 18, 19, 20,21, 22, 23, 24, 25, 26, 27, 28, 29, 30개 이상의 연속 염기를 포함하는 것인 증폭 프라이머 쌍.
  33. 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379의 대략 최초 (5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30개 이상의 잔기로 나타낸 서열을 보유하는 제1 요소 및 상기 제1 요소의 상보성 스트랜드의 대략 최초 (5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30개 이상의 잔기로 나타낸 서열을 보유하는 제2 요소를 포함하는 증폭 프라이머 쌍.
  34. 제33항의 증폭 프라이머 쌍을 이용하는 폴리뉴클레오티드의 증폭에 의해 생성된, 자일라나제를 암호화하는 핵산.
  35. 제34항에 있어서, 상기 증폭은 폴리머라제 연쇄 반응(PCR)에 의한 것인 자일라나제를 암호화하는 핵산.
  36. 제34항에 있어서, 상기 핵산은 유전자 라이브러리의 증폭에 의해 생성된 것인 자일라나제를 암호화하는 핵산.
  37. 제34항에 있어서, 상기 유전자 라이브러리는 환경 라이브러리인 자일라나제를 암호화하는 핵산.
  38. 제34항의 자일라나제를 암호화하는 핵산에 의해 암호화된 분리된 자일라나제 또는 재조합 자일라나제.
  39. 제1항 또는 제24항의 핵산 서열 또는 이의 하위서열을 증폭킬 수 있는 증폭 프라이머 서열 쌍을 이용하여 주형 핵산을 증폭시키는 단계를 포함하는, 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산의 증폭 방법.
  40. 제1항 또는 제24항의 서열을 포함하는 핵산을 포함하는 발현 카세트.
  41. 제1항 또는 제24항의 서열을 포함하는 핵산을 포함하는 벡터.
  42. 제1항 또는 제24항의 서열을 포함하는 핵산을 포함하는 클로닝 비히클로서, 상기 클로닝 비히클은 바이러스 벡터, 플라스미드, 파지, 파지미드, 코스미드, 포스미드, 박테리오파지 또는 인공 염색체를 포함하는 것인 클로닝 비히클.
  43. 제42항에 있어서, 상기 바이러스 벡터는 아데노바이러스 벡터, 레트로바이러스 벡터 또는 아데노-관련 바이러스 벡터를 포함하는 것인 클로닝 비히클.
  44. 제42항에 있어서, 박테리아 인공 염색체(BAC), 플라스미드, 박테리오파지 P1-유도된 벡터(PAC), 효모 인공 염색체(YAC) 또는 포유류 인공 염색체(MAC)를 포함하는 것인 클로닝 벡터.
  45. 제1항 또는 제24항의 서열을 포함하는 핵산을 포함하는 형질전환 세포.
  46. 제40항의 발현 카세트를 포함하는 형질전환 세포.
  47. 제40항에 있어서, 상기 세포는 박테리아 세포, 포유류 세포, 진균 세포, 효모 세포, 곤충 세포 또는 식물 세포인 형질전환 세포.
  48. 제1항 또는 제24항의 서열을 포함하는 트랜스게닉 비인간 동물.
  49. 제48항에 있어서, 상기 동물은 마우스인 트랜스게닉 비인간 동물.
  50. 제1항 또는 제24항의 서열을 포함하는 트랜스게닉 식물
  51. 제50항에 있어서, 상기 식물이 옥수수 식물, 사탕수수 식물, 감자 식물, 토마토 식물, 밀 식물, 오일시드 식물, 평자씨 식물, 대두 식물, 쌀 식물, 보리 식물, 잔디 또는 담배 식물인 트랜스게닉 식물.
  52. 제1항 또는 제24항의 서열을 포함하는 트랜스게닉 종자.
  53. 제52항에 있어서, 상기 종자는 옥수수 종자, 밀 낟알, 오일시드, 평자씨, 대두 종자, 종려 종자, 해바라기씨, 참깨씨, 쌀, 보리, 땅콩 또는 담배 식물 종자인 트랜스게닉 종자.
  54. 엄격한 조건 하에서 제1항 또는 제24항의 서열 또는 이의 하위서열에 상보적이거나, 또는 하이브리드화할 수 있는 핵산 서열을 포함하는 안티센스 올리고뉴클레오티드.
  55. 제49항에 있어서, 상기 안티센스 올리고뉴클레오티드는 길이가 약 10∼50, 약 20∼60, 약 30∼70, 약 40∼80 또는 약 60∼100개의 염기인 안티센스 올리고뉴클레오티드.
  56. 엄격한 조건 하에서 제1항 또는 제24항의 서열에 상보적이거나, 또는 하이브리드화할 수 있는 핵산 서열을 포함하는 안티센스 올리고뉴클레오티드를 세포에 투여하거나, 또는 세포 내에서 발현시키는 단계를 포함하는, 세포 내에서 자일라나제 메세지의 번역을 억제하는 방법.
  57. 제1항 또는 제24항의 서열의 하위서열을 포함하는 이본쇄 억제성 RNA(RNAi) 분자.
  58. 제52항에 있어서, 상기 RNAi는 길이가 약 15, 16, 17, 18, 19, 20, 21, 22,23, 24, 25개 이상의 이중 뉴클레오티드인 이본쇄 억제성 RNA(RNAi) 분자.
  59. 이본쇄 억제성 RNA(RNAi)를 세포에 투여하거나, 또는 세포 내에서 발현시키는 단계를 포함하는, 세포 내에서 자일라나제의 발현을 억제하는 방법으로서, 상기 RNA는 제1항 또는 제24항의 서열의 하위서열을 포함하는 것인 방법.
  60. (i) 약 100개 이상의 잔기로 이루어진 영역에 걸쳐 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379의 서열에 대해 50% 이상의 서열 동일성을 보유하거나(이때, 상기 서열 동일성은 서열 비교 알고리즘에 의한 분석 또는 시각 검사를 통해 결정한 것임) 또는
    (ii) 약 100개 이상의 잔기로 이루어진 영역에 걸쳐 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379의 서열에 대해 50% 이상의 서열 동일성을 보유(이때, 상기 서열 동일성은 서열 비교 알고리즘에 의한 분석 또는 시각 검사를 통해 결정한 것임)하는 핵산에 의해 암호화되거나, 또는 엄격한 조건 하에서 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379의 서열에 하이브리드화할 수 있는 핵산에 의해 암호화된 분리된 폴리펩티드 또는 재조합 폴리펩티드.
  61. 제60항에 있어서, 상기 서열 동일성은 일정 영역에 걸쳐 약 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상, 또는 100%인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
  62. 제60항에 있어서, 상기 서열 동일성은 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050개 이상의 잔기로 이루어진 영역 또는 효소의 전체 길이에 걸친 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
  63. 제60항에 있어서, 상기 폴리펩티드는 서열 번호 2, 서열 번호 4, 서열 번호 6, 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18, 서열 번호 20, 서열 번호 22, 서열 번호 24, 서열 번호 26, 서열 번호28, 서열 번호 30, 서열 번호 32, 서열 번호 34, 서열 번호 36, 서열 번호 38, 서열 번호 40, 서열 번호 42, 서열 번호 44, 서열 번호 46, 서열 번호 48, 서열 번호 50, 서열 번호 52, 서열 번호 54, 서열 번호 56, 서열 번호 58, 서열 번호 60, 서열 번호 62, 서열 번호 64, 서열 번호 66, 서열 번호 68, 서열 번호 70, 서열 번호 72, 서열 번호 74, 서열 번호 76, 서열 번호 78, 서열 번호 80, 서열 번호 82, 서열 번호 84, 서열 번호 86, 서열 번호 88, 서열 번호 90, 서열 번호 92, 서열 번호 94, 서열 번호 96, 서열 번호 98, 서열 번호 100, 서열 번호 102, 서열 번호 104, 서열 번호 106, 서열 번호 108, 서열 번호 110, 서열 번호 112, 서열 번호 114, 서열 번호 116, 서열 번호 118, 서열 번호 120, 서열 번호 122, 서열 번호 124, 서열 번호 126, 서열 번호 128, 서열 번호 130, 서열 번호 132, 서열 번호 134, 서열 번호 136, 서열 번호 138, 서열 번호 140, 서열 번호 142, 서열 번호 144, 서열 번호 146, 서열 번호 148, 서열 번호 150, 서열 번호 152, 서열 번호 154, 서열 번호 156, 서열 번호 158, 서열 번호 160, 서열 번호 162, 서열 번호 164, 서열 번호 166, 서열 번호 168, 서열 번호 170, 서열 번호 172, 서열 번호 174, 서열 번호 176, 서열 번호 178, 서열 번호 180, 서열 번호 182, 서열 번호 184, 서열 번호 186, 서열 번호 188, 서열 번호 190, 서열 번호 192, 서열 번호 194, 서열 번호 196, 서열 번호 198, 서열 번호 200, 서열 번호 202, 서열 번호 204, 서열 번호 206, 서열 번호 208, 서열 번호 210, 서열 번호 212, 서열 번호 214, 서열 번호 216, 서열 번호 218, 서열 번호 220, 서열 번호 222, 서열 번호 224, 서열 번호 226, 서열 번호 228, 서열 번호 230, 서열 번호 232, 서열 번호 234, 서열 번호236, 서열 번호 238, 서열 번호 240, 서열 번호 242, 서열 번호 244, 서열 번호 246, 서열 번호 248, 서열 번호 250, 서열 번호 252, 서열 번호 254, 서열 번호 256, 서열 번호 258, 서열 번호 260, 서열 번호 262, 서열 번호 264, 서열 번호 266, 서열 번호 268, 서열 번호 270, 서열 번호 272, 서열 번호 274, 서열 번호 276, 서열 번호 278, 서열 번호 280, 서열 번호 282, 서열 번호 284, 서열 번호 286, 서열 번호 288, 서열 번호 290, 서열 번호 292, 서열 번호 294, 서열 번호 296, 서열 번호 298, 서열 번호 300, 서열 번호 302, 서열 번호 304, 서열 번호 306, 서열 번호 308, 서열 번호 310, 서열 번호 312, 서열 번호 314, 서열 번호 316, 서열 번호 318, 서열 번호 320, 서열 번호 322, 서열 번호 324, 서열 번호 326, 서열 번호 328, 서열 번호 330, 서열 번호 332, 서열 번호 334, 서열 번호 336, 서열 번호 338, 서열 번호 340, 서열 번호 342, 서열 번호 344, 서열 번호 346, 서열 번호 348, 서열 번호 350, 서열 번호 352, 서열 번호 354, 서열 번호 356, 서열 번호 358, 서열 번호 360, 서열 번호 362, 서열 번호 364, 서열 번호 366, 서열 번호 368, 서열 번호 370, 서열 번호 372, 서열 번호 374, 서열 번호 376, 서열 번호 378 또는 서열 번호 380의 서열을 보유하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
  64. 제60항에 있어서, 상기 폴리펩티드는 자일라나제 활성을 보유하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
  65. 제64항에 있어서, 상기 자일라나제 활성은 내부 β-1,4-자일로시드 결합의 가수분해를 촉진하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  66. 제65항에 있어서, 상기 자일라나제 활성은 엔도-1,4-베타-자일라나제 활성을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  67. 제64항에 있어서, 상기 자일라나제 활성은 더 적은 분자량의 자일로즈와 자일로-올리고머를 생성하기 위한 자일란의 가수분해를 촉진하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  68. 제67항에 있어서, 상기 자일란은 아라비노자일란을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  69. 제68항에 있어서, 상기 아라비노자일란은 수용성 아라비노자일란을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  70. 제69항에 있어서, 상기 수용성 아라비노자일란은 반죽 또는 빵류 제품을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  71. 제64항에 있어서, 상기 자일라나제 활성은 1,4-β-글리코시드-결합된 D-자일로피라노즈를 포함하는 다당류를 가수분해하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  72. 제64항에 있어서, 상기 자일라나제 활성은 헤미셀룰로즈를 가수분해하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  73. 제72항에 있어서, 상기 자일라나제 활성은 목재 또는 종이 펄프 또는 종이 제품내 헤미셀룰로즈를 가수분해하는 것을 포함하는 것인 분리된 핵산 또는 재조합핵산.
  74. 제73항에 있어서, 상기 자일라나제 활성은 사료 또는 식품 중 자일란의 가수분해를 촉진하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  75. 제74항에 있어서, 상기 사료 또는 식품은 곡물이 주성분인 동물 사료, 맥아즙 또는 맥주, 우유 또는 유제품, 과일 또는 채소를 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  76. 제64항에 있어서, 상기 자일란 활성은 미생물 세포 또는 식물 세포중 자알린의 가수분해를 촉진하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  77. 제64항에 있어서, 상기 자일라나제 활성은 열안정성인 분리된 핵산 또는 재조합 핵산.
  78. 제77항에 있어서 상기 폴리펩티드는 약 1℃∼약 5℃, 약 5℃∼약 15℃, 약 15℃∼약 25℃, 약 25℃∼약 37℃, 약 37℃∼약 95℃, 약 55℃∼약 85℃, 약 70℃∼약 95℃, 약 70℃∼약 75℃ 또는 약 90℃∼약 95℃의 온도를 포함하는 조건 하에서 자일라나제 활성을 보유하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
  79. 제64항에 있어서, 상기 자일라나제 활성은 내열성인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
  80. 제79항에 있어서, 상기 폴리펩티드는 약 1℃∼약 5℃, 약 5℃∼약 15℃, 약 15℃∼약 25℃, 약 25℃∼약 37℃, 약 37℃∼약 95℃, 약 55℃∼약 85℃, 약 70℃∼약 75℃ 또는 약 90℃∼약 95℃ 범위의 온도에 노출 후 자일라나제 활성을 보유하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
  81. 제60항의 폴리펩티드를 포함하고, 신호 서열 또는 프리프로 서열이 결여된 분리된 폴리펩티드 또는 재조합 폴리펩티드.
  82. 제60항의 폴리펩티드를 포함하고, 이종 신호 서열 또는 이종 프리프로 서열을 보유하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
  83. 제64항에 있어서, 상기 자일라나제 활성은 약 37℃에서 단백질 1 mg당 약 100∼약 1000 유닛, 단백질 1 mg당 약 500∼약 750 유닛, 단백질 1 mg당 약 500∼약 1200 유닛 또는 단백질 1 mg당 약 750∼약 1000 유닛 범위의 특이 활성을 포함하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
  84. 제79항에 있어서, 상기 내열성은 고온으로 가열한 후 37℃에서 자일라나제의 특이 활성의 1/2 이상을 보유하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
  85. 제79항에 있어서, 상기 내열성은 고온으로 가열한 후 37℃에서 단백질 1 mg 당 약 500∼약 1200 유닛 범위의 특이 활성을 보유하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
  86. 제60항에 있어서, 상기 폴리펩티드는 하나 이상의 글리코실화 부위를 포함하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
  87. 제86항에 있어서, 상기 글리코실화는 N-연결 글리코실화인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
  88. 제87항에 있어서, 상기 폴리펩티드는 피. 파스토리스(P. pastoris) 또는 에스. 폼브(S. pombe)에서 발현된 후 글리코실화되는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
  89. 제64항에 있어서, 상기 폴리펩티드는 약 pH 6.5, pH 6.0, pH 5.5, pH 5.0, pH 4.5 또는 pH 4.0을 포함하는 조건 하에서 자일라나제 활성을 보유하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
  90. 제64항에 있어서, 상기 폴리펩티드는 약 pH 7.5, pH 8. 0, pH 8.5, pH 9, pH 9.5, pH 10 또는 pH 10.5를 포함하는 조건 하에서 자일라나제 활성을 보유하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
  91. 제60항의 폴리펩티드를 포함하는 단백질 제제로서, 상기 단백질 제제는 액체, 고체 또는 젤을 포함하는 것인 단백질 제제.
  92. 제60항의 폴리펩티드 및 제2 도메인을 포함하는 이종이량체.
  93. 제92항에 있어서, 상기 제2 도메인은 폴리펩티드이고, 상기 이종이량체는 융합 단백질인 이종이량체.
  94. 제92항에 있어서, 상기 제2 도메인은 에피토프 또는 태그인 이종이량체.
  95. 제60항의 폴리펩티드를 포함하는 동종이량체.
  96. 제60항의 서열 또는 이의 하위서열을 포함하는, 고정화된 폴리펩티드.
  97. 제96항에 있어서, 상기 폴리펩티드는 세포, 금속, 수지, 중합체, 세라믹, 유리, 마이크로전극, 흑연 입자, 비드, 젤, 플레이트, 어레이 또는 모세관 위에 고정화된 것인 고정화된 폴리펩티드.
  98. 제60항의 고정화된 폴리펩티드를 포함하는 어레이.
  99. 제1항 또는 제24항의 고정화된 핵산을 포함하는 어레이.
  100. 제60항의 폴리펩티드에 특이적으로 결합하는 분리된 항체 또는 재조합 항체.
  101. 제100항에 있어서, 상기 항체는 모노클로날 항체 또는 폴리클로날 항체인 분리된 항체 또는 재조합 항체.
  102. 제60항의 폴리펩티드에 특이적으로 결합하는 항체를 포함하는 하이브리도마.
  103. (a) 제100항의 항체를 제공하는 단계;
    (b) 폴리펩티드를 포함하는 샘플을 제공하는 단계; 및
    (c) 상기 단계 (b)의 샘플과 상기 단계 (a)의 항체를, 상기 항체가 상기 폴리펩티드에 특이적으로 결합함으로써 자일라나제 활성을 보유하는 폴리펩티드를 동정할 수 있는 조건하에서 접촉시키는 단계
    를 포함하는 자일라나제 활성을 보유하는 폴리펩티드의 분리 또는 동정 방법.
  104. 비인간 동물에게, 체액성 면역 반응을 생성함으로써 항자일라나제 항체를 제조하기에 충분한 양으로 제1항 또는 제24항의 핵산 또는 이의 하위서열을 투여하는 단계를 포함하는, 항자일라나제 항체의 제조 방법.
  105. 비인간 동물에게, 체액성 면역 반응을 생성함으로써 항자일라나제 항체를 제조하기에 충분한 양으로 제60항의 폴리펩티드 또는 이의 하위서열을 투여하는 단계를 포함하는, 항자일라나제 항체의 제조 방법.
  106. (a) 제1항 또는 제24항의 서열을 포함하고, 프로모터에 작동가능하게 연결된 핵산을 제공하는 단계; 및
    (b) 폴리펩티드의 발현이 가능한 조건 하에서 상기 단계 (a)의 핵산을 발현시켜 재조합 폴리펩티드를 생성하는 단계
    를 포함하는, 재조합 폴리펩티드의 제조 방법.
  107. 제106항에 있어서, 상기 단계 (a)의 핵산을 이용하여 숙주 세포를 형질전환시키고, 이어서 상기 단계 (a)의 핵산을 발현시킴으로써 형질전환된 세포 내에서 재조합 폴리펩티드를 생성하는 단계를 더 포함하는 것인 방법.
  108. (a) 제64항의 폴리펩티드를 제공하는 단계;
    (b) 자일라나제 기질을 제공하는 단계; 및
    (c) 상기 단계 (b)의 기질과 상기 폴리펩티드를 접촉시키고, 반응 생성물 양의 증가 또는 기질 양의 감소를 검출하는 단계로서, 상기 반응 생성물 양의 증가 또는 기질 양의 감소는 자일라나제 활성을 보유하는 폴리펩티드를 검출하는 것인 단계
    를 포함하는, 자일라나제 활성을 보유하는 폴리펩티드의 동정 방법.
  109. (a) 제64항의 폴리펩티드를 제공하는 단계;
    (b) 테스트 기질을 제공하는 단계;
    (c) 상기 단계 (a)의 폴리펩티드와 상기 단계 (b)의 테스트 기질을 접촉시키고 반응 생성물 양의 증가 또는 기질 양의 감소를 검출하는 단계로서, 상기 반응생성물 양의 증가 또는 기질 양의 감소는 자일라나제 활성을 보유하는 폴리펩티드를 검출하는 것인 단계
    를 포함하는, 자일라나제 기질의 동정 방법.
  110. (a) 핵산의 폴리펩티드로의 번역이 가능한 조건 하에서 제1항 또는 제24항의 서열을 보유하는 핵산 또는 상기 서열을 포함하는 벡터를 발현시키는 단계;
    (b) 테스트 화합물을 제공하는 단계;
    (c) 상기 테스트 화합물과 상기 폴리펩티드를 접촉시키는 단계; 및
    (d) 상기 단계 (b)의 테스트 화합물이 상기 폴리펩티드에 특이적으로 결합하는 지 여부를 결정하는 단계
    를 포함하는, 테스트 화합물이 폴리펩티드에 특이적으로 결합하는 지 여부를 결정하는 방법.
  111. (a) 제60항의 폴리펩티드를 제공하는 단계;
    (b) 테스트 화합물을 제공하는 단계;
    (c) 상기 폴리펩티드와 상기 테스트 화합물을 접촉시키는 단계; 및
    (d) 상기 단계 (b)의 테스트 화합물이 상기 폴리펩티드에 특이적으로 결합하는 지 여부를 결정하는 단계
    를 포함하는, 테스트 화합물이 폴리펩티드에 특이적으로 결합하는 지 여부를 결정하는 방법.
  112. (a) 제64항의 폴리펩티드를 제공하는 단계;
    (b) 테스트 화합물을 제공하는 단계;
    (c) 상기 단계 (a)의 폴리펩티드와 상기 단계 (b)의 테스트 화합물을 접촉시키고 자일라나제 활성을 측정하는 단계로서, 테스트 화합물의 부재 하에서의 활성과 비교한 테스트 화합물 존재 하에서 측정된 자일라나제 활성의 변화가, 테스트 화합물이 자일라나제 활성을 조절하는 지 여부에 대한 결정을 제공하는 단계
    를 포함하는, 자일라나제 활성 조절제의 동정 방법.
  113. 제112항에 있어서, 상기 자일라나제 활성은 자일라나제 기질을 제공하고, 기질의 감소량 또는 반응 생성물의 증가량, 또는 기질의 증가량 또는 반응 생성물의 감소량을 검출함으로써 측정하는 것인 방법.
  114. 제113항에 있어서, 테스트 화합물 부재시 기질 또는 반응 생성물의 양과 비교한 테스트 화합물 존재시 기질의 감소량 또는 반응 생성물의 증가량은 자일라나제 활성의 활성제로서 테스트 화합물을 동정하는 것인 방법.
  115. 제113항에 있어서, 테스트 화합물 부재시 기질 또는 반응 생성물의 양과 비교한 테스트 화합물 존재시 기질의 증가량 또는 반응 생성물의 감소량은 자일라나제 활성의 활성제로서 테스트 화합물을 동정하는 것인 방법.
  116. 프로쎄서 및 데이타 저장 장치를 포함하는 컴퓨터 시스템으로서, 상기 데이타 저장 장치에는 폴리펩티드 서열 또는 핵산 서열이 저장되어 있고, 상기 폴리펩티드 서열은 제60항의 서열을 포함하고, 제1항 또는 제24항의 핵산에 의해 암호화된 폴리펩티드인 컴퓨터 시스템.
  117. 제115항에 있어서, 서열 비교 알고리즘, 및 저장된 하나 이상의 참조 서열을 보유하는 데이타 저장 장치를 더 포함하는 것인 컴퓨터 시스템.
  118. 제117항에 있어서, 상기 서열 비교 알고리즘은 다형태를 나타내는 컴퓨터 프로그램을 포함하는 것인 컴퓨터 시스템.
  119. 제117항에 있어서, 상기 서열내의 하나 이상의 특징을 확인하는 확인자를 더 포함하는 것인 컴퓨터 시스템.
  120. 저장된 폴리펩티드 서열 또는 핵산 서열을 보유하는 컴퓨터 판독가능한 매체로서, 상기 폴리펩티드 서열은 제60항의 폴리펩티드 또는 제1항 또는 제24항의 핵산에 의해 암호화된 폴리펩티드를 포함하는 것인 컴퓨터 판독가능한 매체.
  121. (a) 서열 내의 하나 이상의 특징을 확인하는 컴퓨터 프로그램을 이용하여 서열을 판독하는 단계로서, 상기 서열은 폴리펩티드 서열 또는 핵산 서열을 포함하고, 상기 폴리펩티드 서열은 제60항의 폴리펩티드 또는 제1항 또는 제24항의 핵산에 의해 암호화된 폴리펩티드를 포함하는 것인 단계; 및
    (b) 상기 컴퓨터 프로그램을 이용하여 상기 서열 내의 하나 이상의 특징을 확인하는 단계
    를 포함하는, 서열내의 특징을 확인하는 방법.
  122. (a) 서열을 비교하는 컴퓨터 프로그램을 이용하여 제1 서열 및 제2 서열을 판독하는 단계로서, 상기 제1 서열은 폴리펩티드 서열 또는 핵산 서열을 포함하고, 상기 폴리펩티드 서열은 제60항의 폴리펩티드 또는 제1항 또는 제24항의 핵산에 의해 암호화된 폴리펩티드를 포함하는 것인 단계; 및
    (b) 상기 컴퓨터 프로그램을 이용하여 상기 제1 서열 및 제2 서열 사이의 차이를 결정하는 단계
    를 포함하는, 제1 서열과 제2 서열의 비교 방법.
  123. 제122항에 있어서, 상기 제1 서열과 제2 서열 사이의 차이를 결정하는 단계는 다형태를 확인하는 단계를 더 포함하는 것인 방법.
  124. 제123항에 있어서, 서열내의 하나 이상의 특징을 확인하는 확인자를 더 포함하는 것인 방법.
  125. 제124항에 있어서, 컴퓨터 프로그램을 이용하여 상기 제1 서열을 판독하는 단계 및 상기 서열내의 하나 이상의 특징을 확인하는 단계를 포함하는 것인 방법.
  126. (a) 제31항 또는 제33항의 증폭 프라이머 서열 쌍을 제공하는 단계;
    (b) 환경 샘플로부터 핵산을 분리하거나 환경 샘플을 처리하여 샘플내의 핵산이 하이브리드화를 위해 상기 증폭 프라이머 쌍에 접근가능하도록 하는 단계;
    (c) 상기 단계 (b)의 핵산과 상기 단계 (a)의 증폭 프라이머 쌍을 조합하고, 환경 샘플로부터 핵산을 증폭함으로써 환경 샘플로부터 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산을 분리 또는 회수하는 단계
    를 포함하는, 환경 샘플로부터 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산의 분리 또는 회수 방법.
  127. 상기 증폭 프라이머 서열 쌍의 각각의 요소가 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379의 서열 또는 이의 하위서열의 약 10∼50개 이상의 연속 염기를 포함하는 올리고뉴클레오티드를 포함하는 것인 방법.
  128. (a) 제1항 또는 제24항의 서열 또는 이의 하위서열을 포함하는 폴리뉴클레오티드 프로브를 제공하는 단계;
    (b) 환경 샘플로부터 핵산을 분리하거나 환경 샘플을 처리하여 상기 샘플내의 핵산이 하이브리드화를 위해 상기 단계 (a)의 폴리뉴클레오티드 프로브에 접근가능하도록 하는 단계;
    (c) 상기 단계 (b)의 분리된 핵산 또는 처리된 환경 샘플과 상기 단계 (a)의폴리뉴클레오티드 프로브를 조합하는 단계; 및
    (d) 상기 단계 (a)의 폴리뉴클레오티드 프로브와 특이적으로 하이브리드화하는 핵산을 분리하여 환경 샘플로부터 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산을 분리 또는 회수하는 단계
    를 포함하는, 환경 샘플로부터 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산의 분리 또는 회수 방법.
  129. 제127항 또는 제128항에 있어서, 상기 환경 샘플은 물 샘플, 액체 샘플, 토양 샘플, 공기 샘플 또는 생물학적 샘플을 포함하는 것인 방법.
  130. 제129항에 있어서, 상기 생물학적 샘플은 박테리아 세포, 원생동물 세포, 곤충 세포, 효모 세포, 식물 세포, 진균 세포 또는 포유류 세포로부터 유래한 것인 방법.
  131. (a) 제1항 또는 제24항의 서열을 포함하는 주형 핵산을 제공하는 단계; 및
    (b) 상기 주형 서열내의 하나 이상의 뉴클레오티드를 변형, 결실 또는 첨가하거나, 또는 상기 변형, 결실 또는 첨가를 조합하여 주형 핵산의 변이체를 생성하는 단계
    를 포함하는, 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산의 변이체의 생성 방법.
  132. 제131항에 있어서, 상기 변이체 핵산을 발현시켜 변이체 자일라나제 폴리펩티드를 생성하는 단계를 더 포함하는 것인 방법.
  133. 제131항에 있어서, 상기 변형, 첨가 또는 결실은 에러-프론 PCR, 셔플링, 올리고뉴클레오티드-지정 돌연변이유발법, 어셈블리 PCR, 성별 PCR 돌연변이유발법, 생체내 돌연변이유발법, 카세트 돌연변이유발법, 반복 앙상블 돌연변이유발법, 지수 앙상블 돌연변이유발법, 부위 특이성 돌연변이유발법, 유전자 재어셈블리, 유전자 위치 포화 돌연변이유발법(GSSM(상표명)), 합성 연결 재어셈블리(SLR) 및 이의 조합을 포함하는 방법에 의해 도입하는 것인 방법.
  134. 제131항에 있어서, 상기 변형, 첨가 또는 결실은 재조합, 반복 서열 재조합, 포스포티오에이트-변형된 DNA 돌연변이유발법, 우리실-함유 주형 돌연변이유발법, 갭핑된 이중체 돌연변이유발법, 점 부정합 수복 돌연변이유발법, 수복-결여 숙주 균주 돌연변이유발법, 화학적 돌연변이유발법, 방사원성 돌연변이유발법, 결실 돌연변이유발법, 제한-선택 돌연변이유발법, 제한-정제 돌연변이유발법, 인공 유전자 합성, 앙상블 돌연변이유발법, 키메라 핵산 다량체 생성 및 이의 조합을 포함하는 방법에 의해 도입하는 것인 방법.
  135. 제131항에 있어서, 상기 방법은 주형 핵산에 의해 암호화된 폴리펩티드의 활성이나 안정성과는 변경된 또는 상이한 활성 또는 변경된 또는 상이한 안정성을 보유하는 자일라나제가 생성될 때까지 되풀이하여 반복하는 것인 방법.
  136. 제135항에 있어서, 상기 변이체 자일라나제 폴리펩티드는 내열성이고, 고온에서 노출후 일부 활성을 보유하는 것인 방법.
  137. 제135항에 있어서, 상기 변이체 자일라나제 폴리펩티드는 주형 핵산에 의해 암호화된 자일라나제와 비교시 증가된 글리코실화를 보유하는 것인 방법.
  138. 제135항에 있어서, 상기 변이체 자일라나제 폴리펩티드는 고온 하에서 자일라나제 활성을 보유하며, 상기 주형 핵산에 의해 암호화된 자일라나제는 고온 하에서 불활성인 것인 방법.
  139. 제131항에 있어서, 상기 방법은 주형 핵산의 코돈 사용 용법과는 변경된 코돈 사용 용법을 보유하는 자일라나제 암호 서열이 생성될 때까지 되풀이하여 반복하는 것인 방법.
  140. 제131항에 있어서, 상기 방법은 주형 핵산 보다 더 높거나 또는 더 낮은 수준의 메세지 발현 수준 또는 안정성을 보유하는 자일라나제 유전자가 생성될 때까지 되풀이하여 반복하는 것인 방법.
  141. (a) 제1항 내지 제24항의 서열을 포함하는 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산을 제공하는 단계; 및
    (b) 상기 단계 (a)의 핵산에서 바람직하지 않은 코돈 또는 덜 바람직한 코돈을 확인하고, 이를 대체된 코돈과 동일한 아미노산을 암호화하는 바람직한 코돈 또는 통상적으로 사용되는 코돈으로 대체함으로써 핵산을 숙주 세포 내에서 그의 발현을 증가시키도록 변형시키는 단계로서, 이때 바람직한 코돈은 숙주 세포의 유전자 내의 암호 서열에서 과도하게 나타나는 코돈이며, 바람직하지 않은 코돈 또는 덜 바람직한 코돈은 숙주 세포 내의 유전자 내의 암호 서열에서 과소하게 나타나는 코돈인 단계
    를 포함하는, 숙주 세포 내에서 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산의 발현을 증가시키기 위한 상기 핵산내 코돈의 변형 방법.
  142. (a) 제1항 또는 제24항의 서열을 포함하는 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산을 제공하는 단계; 및
    (b) 상기 단계 (a)의 핵산내의 코돈을 확인하고, 이를 대체된 코돈과 동일한 아미노산을 암호화하는 상이한 코돈으로 대체함으로써 자일라나제를 암호화하는 핵산내의 코돈을 변형시키는 단계
    를 포함하는, 자일라나제 폴리펩티드를 암호화하는 핵산내의 코돈 변형 방법.
  143. (a) 제1항 또는 제24항의 서열을 포함하는 자일라나제 폴리펩티드를 암호화하는 핵산을 제공하는 단계; 및
    (b) 상기 단계 (a)의 핵산에서 바람직하지 않은 코돈 또는 덜 바람직한 코돈을 확인하고, 이를 대체된 코돈과 동일한 아미노산을 암호화하는 바람직한 코돈 또는 통상적으로 사용되는 코돈으로 대체함으로써 핵산을 숙주 세포 내에서 그의 발현을 증가시키도록 변형시키는 단계로서, 이때 바람직한 코돈은 숙주 세포의 유전자 내의 암호 서열에서 과도하게 나타나는 코돈이며, 바람직하지 않은 코돈 또는 덜 바람직한 코돈은 숙주 세포 내의 유전자 내의 암호 서열에서 과소하게 나타나는 코돈인 단계
    를 포함하는, 숙주 세포 내에서 자일라나제 폴리펩티드를 암호화하는 핵산의 발현을 증가시키기 위한 상기 핵산내 코돈의 변형 방법.
  144. (a) 제1항 또는 제24항의 서열을 포함하는 자일라나제 폴리펩티드를 암호화하는 핵산을 제공하는 단계; 및
    (b) 상기 단계 (a)의 핵산에서 하나 이상의 바람직한 코돈을 확인하고, 이를 대체된 코돈과 동일한 아미노산을 암호화하는 바람직하지 않은 코돈 또는 덜 바람직한 코돈으로 대체함으로써 핵산을 숙주 세포 내에서 그의 발현을 증가시키도록 변형시키는 단계로서, 이때 바람직한 코돈은 숙주 세포의 유전자 내의 암호 서열에서 과도하게 나타나는 코돈이며, 바람직하지 않은 코돈 또는 덜 바람직한 코돈은숙주 세포 내의 유전자 내의 암호 서열에서 과소하게 나타나는 코돈인 단계
    를 포함하는, 숙주 세포 내에서 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산의 발현을 감소시키기 위한 상기 핵산내 코돈의 변형 방법.
  145. 제144항에 있어서, 상기 숙주 세포는 박테리아 세포, 진균 세포, 곤충 세포, 효모 세포, 식물 세포 또는 포유류 세포인 방법.
  146. (a) 제1 활성 부위 또는 제1 기질 결합 부위를 암호화하는 제1 핵산을 제공하는 단계로서, 상기 제1 핵산 서열은 엄격한 조건 하에서 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379의 서열 또는 이의 하위서열에 하이브리드화하는 서열을 포함하고, 상기 핵산 서열은 자일라나제 활성 부위 또는 자일라나제 기질 결합 부위를 암호화하는 것인 단계;
    (b) 제1 핵산 내의 다수의 표적화된 코돈에서 자연 발생하는 아미노산 변이체를 암호화하는 돌연변이원성 올리고뉴클레오티드 세트를 제공하는 단계; 및
    (c) 돌연변이유발된 각각의 아미노산 코돈에서 일정 범위의 아미노산 변이를 활성 부위 암호화하거나 또는 기질 결합 부위 암호화하는 변이체 핵산 세트를 생성하는 돌연변이원성 올리고뉴클레오티드 세트를 이용하여 다수의 변형된 자일라나제 활성 부위 또는 기질 결합 부위를 암호화하는 핵산 라이브러리를 생성하는 단계
    를 포함하는, 다수의 변형된 자일라나제 활성 부위 또는 기질 결합 부위를 암호화하는 핵산 라이브러리의 생성 방법으로서, 상기 변형된 활성 부위 또는 기질 결합 부위는 제1 활성 부위 또는 제1 기질 결합 부위를 암호화하는 서열을 포함하는 제1 핵산으로부터 유래하는 것인 방법.
  147. 제145항에 있어서, 최적화된 유도 진화 시스템, 유전자 부위-포화 돌연변이유발법(GSSM; 상표명) 또는 합성 연결 재어셈블리(SLR)를 포함하는 방법에 의해 상기 단계 (a)의 제1 핵산을 돌연변이유발시키는 단계를 포함하는 것인 방법.
  148. 제145항에 있어서, 에러-프론 PCR, 셔플링, 올리고뉴클레오티드-지정 돌연변이유발법, 어셈블리 PCR, 성별 PCR 돌연변이유발법, 생체내 돌연변이유발법, 카세트 돌연변이유발법, 반복 앙상블 돌연변이유발법, 지수 앙상블 돌연변이유발법, 부위 특이성 돌연변이유발법, 유전자 재어셈블리, 유전자 위치 포화 돌연변이유발법(GSSM(상표명)), 합성 연결 재어셈블리(SLR) 및 이의 조합을 포함하는 방법에 의해 상기 단계 (a)의 제1 핵산 또는 변이체를 돌연변이유발시키는 단계를 포함하는 것인 방법.
  149. 제145항에 있어서, 재조합, 반복 서열 재조합, 포스포티오에이트-변형된 DNA 돌연변이유발법, 우리실-함유 주형 돌연변이유발법, 갭핑된 이중체 돌연변이유발법, 점 부정합 수복 돌연변이유발법, 수복-결여 숙주 균주 돌연변이유발법, 화학적 돌연변이유발법, 방사원성 돌연변이유발법, 결실 돌연변이유발법, 제한-선택 돌연변이유발법, 제한-정제 돌연변이유발법, 인공 유전자 합성, 앙상블 돌연변이유발법, 키메라 핵산 다량체 생성 및 이의 조합을 포함하는 방법에 의해 상기 단계 (a)의 제1 핵산 또는 변이체를 돌연변이유발시키는 것인 방법.
  150. (a) 소분자를 합성 또는 변형시킬 수 있는 다수의 생합성 효소를 제공하는단계로서, 상기 효소중 하나는 제1항 또는 제24항의 서열을 포함하는 핵산에 의해 암호화된 자일라나제 효소를 포함하는 것인 단계;
    (b) 상기 단계 (a)의 효소중 하나 이상을 위한 기질을 제공하는 단계; 및
    (c) 일련의 생촉매 반응에 의해 소분자를 생성하기 위해 다수의 생촉매 반응을 용이하게 하는 조건 하에서 상기 효소와 상기 단계 (b)의 기질을 반응시키는 단계
    를 포함하는, 소분자의 제조 방법.
  151. (a) 제64항의 폴리펩티드 또는 제1항 또는 제24항의 핵산 서열을 포함하는 핵산에 의해 암호화된 폴리펩티드를 포함하는 자일라나제 효소를 제공하는 단계;
    (b) 소분자를 제공하는 단계; 및
    (c) 자일라나제 효소에 의해 촉진되는 효소 반응을 용이하게 하는 조건 하에서 상기 단계 (a)의 효소와 상기 단계 (b)의 소분자를 접촉시켜 자일라나제 효소 반응에 의해 소분자를 변형시키는 단계
    를 포함하는, 소분자의 변형 방법.
  152. 제151항에 있어서, 상기 단계 (a)의 효소를 위한 다수의 소분자 기질을 포함하여 자일라나제 효소에 의해 촉진된 하나 이상의 효소 반응에 의해 생성된 변형된 소분자 라이브러리를 생성하는 단계를 포함하는 것인 방법.
  153. 제151항에 있어서, 상기 효소에 의한 다수의 생촉매 반응을 용이하게 하는 조건 하에서 다수의 추가 효소를 포함하여 다수의 효소 반응에 의해 생성된 변형된 소분자 라이브러리를 형성하는 단계를 더 포함하는 것인 방법.
  154. 제153항에 있어서, 상기 라이브러리를 테스트하여 소정 활성을 나타내는 특정 변형된 소분자가 상기 라이브러리 내에 존재하는 지 여부를 결정하는 단계를 더 포함하는 것인 방법.
  155. 제154항에 있어서, 상기 라이브러리를 테스트하는 단계는 소정 활성을 보유하는 특정 변형된 소분자의 존재 또는 부재에 대해 변형된 소분자의 일부분을 테스트하고 소정 활성의 특정 변형된 소분자를 생성하는 하나 이상의 특이적인 생촉매 반응을 확인함으로써 상기 라이브러리내 다수의 변형된 소분자의 일부분을 생성하기 위해 사용된 생촉매 반응중 하나를 제외한 모두를 전체적으로 제거하는 단계를 더 포함하는 것인 방법.
  156. (a) 제64항의 폴리펩티드 또는 제1항 또는 제24항의 핵산에 의해 암호화된 폴리펩티드를 포함하는 자일라나제 효소를 제공하는 단계;
    (b) 상기 단계 (a)의 서열로부터 다수의 아미노산 잔기를 결실시켜 자일라나제 효소의 기능적 단편을 결정하는 단계
    를 포함하는, 자일라나제 효소의 기능적 단편의 결정 방법.
  157. 제156항에 있어서, 상기 자일라나제 활성은 자일라나제 기질을 제공하고 기질의 감소량 또는 반응 생성물의 증가량을 검출함으로써 측정하는 것인 방법.
  158. (a) 세포의 유전 조성물을 변형하여 변형된 세포를 제조하는 단계로서, 상기 유전 조성물은 제1항 또는 제24항의 서열을 포함하는 핵산을 세포에 첨가함으로써 변경되는 것인 단계;
    (b) 상기 변형된 세포를 배양하여 다수의 변형된 세포를 생성하는 단계;
    (c) 상기 단계 (b) 세포 배양을 실시간으로 모니터링함으로써 상기 세포의 하나 이상의 대사 매개변수를 측정하는 단계; 및
    (d) 상기 단계 (c)의 데이타를 분석하여 측정된 매개변수가 유사한 조건 하에서 변형되지 않은 세포의 필적하는 측정치와 상이한지 여부를 결정함으로써, 실시간 대사 플럭스 분석을 이용하여 세포 내에서 조작된 표현형을 확인하는 단계
    를 포함하는, 실시간 대사 플럭스 분석을 이용하는 신규 또는 변형된 표현형의 전체 세포 조작 방법.
  159. 제158항에 있어서, 상기 세포의 유전 조성물은 세포내 서열의 결실 또는 서열의 변형 또는 유전자 발현의 녹아웃을 포함하는 방법에 의해 변경되는 것인 방법.
  160. 제158항에 있어서, 새롭게 조작된 표현형을 포함하는 세포를 선택하는 단계를 더 포함하는 것인 방법.
  161. 제160항에 있어서, 선택된 세포를 배양함으로써 새롭게 조작된 표현형을 포함하는 신규한 세포 균주를 생성하는 단계를 더 포함하는 것인 방법.
  162. 서열 번호 2, 서열 번호 4, 서열 번호 6, 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18, 서열 번호 20, 서열 번호 22, 서열 번호 24, 서열 번호 26, 서열 번호 28, 서열 번호 30, 서열 번호 32, 서열 번호 34, 서열 번호 36, 서열 번호 38, 서열 번호 40, 서열 번호 42, 서열 번호 44, 서열 번호 46, 서열 번호 48, 서열 번호 50, 서열 번호 52, 서열 번호 54, 서열 번호 56, 서열 번호 58, 서열 번호 60, 서열 번호 62, 서열 번호 64, 서열 번호 66, 서열 번호 68, 서열 번호 70, 서열 번호 72, 서열 번호 74, 서열 번호 76, 서열 번호 78, 서열 번호 80, 서열 번호 82, 서열 번호 84, 서열 번호 86, 서열 번호 88, 서열 번호 90, 서열 번호 92, 서열 번호 94, 서열 번호 96, 서열 번호 98, 서열 번호 100, 서열 번호 102, 서열 번호 104, 서열 번호 106, 서열 번호 108, 서열 번호 110, 서열 번호 112, 서열 번호 114, 서열 번호 116, 서열 번호 118, 서열 번호 120, 서열 번호 122, 서열 번호 124, 서열 번호 126, 서열 번호 128, 서열 번호 130, 서열 번호 132, 서열 번호 134, 서열 번호 136, 서열 번호 138, 서열 번호 140, 서열 번호 142, 서열 번호 144, 서열 번호 146, 서열 번호 148, 서열 번호150, 서열 번호 152, 서열 번호 154, 서열 번호 156, 서열 번호 158, 서열 번호 160, 서열 번호 162, 서열 번호 164, 서열 번호 166, 서열 번호 168, 서열 번호 170, 서열 번호 172, 서열 번호 174, 서열 번호 176, 서열 번호 178, 서열 번호 180, 서열 번호 182, 서열 번호 184, 서열 번호 186, 서열 번호 188, 서열 번호 190, 서열 번호 192, 서열 번호 194, 서열 번호 196, 서열 번호 198, 서열 번호 200, 서열 번호 202, 서열 번호 204, 서열 번호 206, 서열 번호 208, 서열 번호 210, 서열 번호 212, 서열 번호 214, 서열 번호 216, 서열 번호 218, 서열 번호 220, 서열 번호 222, 서열 번호 224, 서열 번호 226, 서열 번호 228, 서열 번호 230, 서열 번호 232, 서열 번호 234, 서열 번호 236, 서열 번호 238, 서열 번호 240, 서열 번호 242, 서열 번호 244, 서열 번호 246, 서열 번호 248, 서열 번호 250, 서열 번호 252, 서열 번호 254, 서열 번호 256, 서열 번호 258, 서열 번호 260, 서열 번호 262, 서열 번호 264, 서열 번호 266, 서열 번호 268, 서열 번호 270, 서열 번호 272, 서열 번호 274, 서열 번호 276, 서열 번호 278, 서열 번호 280, 서열 번호 282, 서열 번호 284, 서열 번호 286, 서열 번호 288, 서열 번호 290, 서열 번호 292, 서열 번호 294, 서열 번호 296, 서열 번호 298, 서열 번호 300, 서열 번호 302, 서열 번호 304, 서열 번호 306, 서열 번호 308, 서열 번호 310, 서열 번호 312, 서열 번호 314, 서열 번호 316, 서열 번호 318, 서열 번호 320, 서열 번호 322, 서열 번호 324, 서열 번호 326, 서열 번호 328, 서열 번호 330, 서열 번호 332, 서열 번호 334, 서열 번호 336, 서열 번호 338, 서열 번호 340, 서열 번호 342, 서열 번호 344, 서열 번호 346, 서열 번호 348, 서열 번호350, 서열 번호 352, 서열 번호 354, 서열 번호 356, 서열 번호 358, 서열 번호 360, 서열 번호 362, 서열 번호 364, 서열 번호 366, 서열 번호 368, 서열 번호 370, 서열 번호 372, 서열 번호 374, 서열 번호 376, 서열 번호 378 또는 서열 번호 380의 잔기 1∼14, 1∼15, 1∼16, 1∼17, 1∼18, 1∼19, 1∼20, 1∼21, 1∼22, 1∼23, 1∼24, 1∼25, 1∼26, 1∼27, 1∼28, 1∼29, 1∼30, 1∼31, 1∼32, 1∼33, 1∼34, 1∼35, 1∼36, 1∼37, 1∼38, 1∼40, 1∼41, 1∼42, 1∼43 또는 1∼44의 서열로 구성되거나, 또는 표 4의 서열로 구성된 분리된 신호 서열 또는 재조합 신호 서열.
  163. 적어도 제162항의 서열을 보유하는 신호 펩티드(SP)를 포함하는 제1 도메인, 및 적어도 이종 폴리펩티드 또는 펩티드를 포함하는 제2 도메인을 포함하는 키메라 폴리펩티드로서, 상기 이종 폴리펩티드 또는 펩티드는 신호 펩티드(SP)와 자연 결합하지 않는 것인 키메라 폴리펩티드.
  164. 제163항에 있어서, 상기 이종 폴리펩티드 또는 펩티드는 자일라나제가 아닌 것인 키메라 폴리펩티드.
  165. 제163항에 있어서, 상기 이종 폴리펩티드 또는 펩티드는 상기 신호 펩티드(SP) 또는 자일라나제 촉매 도메인(CD)의 아미노 단부, 카르복시 단부 또는 이들 양 단부인 키메라 폴리펩티드.
  166. 키메라 폴리펩티드를 암호화하는 분리된 핵산 또는 재조합 핵산으로서, 상기 키메라 폴리펩티드는 적어도 제162항의 서열을 보유하는 신호 펩티드(SP)를 포함하는 제1 도메인 및 적어도 이종 폴리펩티드 또는 펩티드를 포함하는 제2 도메인을 포함하고, 상기 이종 폴리펩티드 또는 펩티드는 상기 신호 펩티드(SP)와 자연적으로 결합되지 않는 것인 분리된 핵산 또는 재조합 핵산.
  167. 자일라나제 폴리펩티드의 내열성 또는 열안정성의 증가 방법으로서, 상기 방법은 자일라나제를 글리코실화시켜 자일라나제의 내열성 또는 열안정성을 증가시키는 단계를 포함하고, 이때 상기 폴리펩티드는 제60항의 폴리펩티드 또는 제1항 또는 제24항의 핵산에 의해 암호화된 폴리펩티드의 30개 이상의 연속 아미노산을 포함하는 것인 방법.
  168. 제1항 또는 제24항의 핵산 서열을 포함하는 벡터를 발현시키는 단계를 포함하는, 세포 내에서 재조합 자일라나제를 과다발현시키는 방법으로서, 상기 과다발현은 고활성 프로모터, 2시스트론성 벡터를 이용하거나 또는 상기 벡터의 유전자 증폭에 의해 수행하는 것인 방법.
  169. (a) 이종 핵산 서열을 세포 내로 도입시켜 형질전환된 식물 세포를 형성하는 단계로서, 상기 이종 핵산 서열은 제1항 또는 제24항의 서열을 포함하는 것인 단계; 및
    (b) 상기 형질전환된 세포로부터 트랜스게닉 식물을 생성하는 단계
    를 포함하는, 트랜스게닉 식물의 제조 방법.
  170. 제169항에 있어서, 상기 단계 (a)는 식물 세포 원형질체의 전기적천공법 또는 미세주입법에 의해 이종 핵산 서열을 도입하는 단계를 더 포함하는 것인 방법.
  171. 제169항에 있어서, 상기 단계 (a)는 DNA 입자 투하 또는 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) 숙주를 이용하여 식물 조직에 직접적으로 이종 핵산 서열을 도입하는 단계를 포함하는 것인 방법.
  172. (a) 프로모터에 작동가능하게 연결된 이종 핵산 서열로 식물 세포를 형질전환하는 단계로서, 상기 이종 핵산 서열은 제1항 또는 제24항의 서열을 포함하는 것인 단계;
    (b) 상기 이종 핵산 서열이 식물 세포 내에서 발현하는 조건 하에서 식물을 성장시키는 단계
    를 포함하는, 식물 세포 내에서 이종 핵산 서열의 발현 방법.
  173. (a) 제64항의 자일라나제 활성을 보유하는 폴리펩티드 또는 제1항 또는 제24항의 핵산에 의해 암호화된 폴리펩티드를 제공하는 단계;
    (b) 자일란을 포함하는 조성물을 제공하는 단계; 및
    (c) 자일라나제가 자일란을 함유하는 조성물을 가수분해, 분해 또는 붕괴시키는 조건 하에서 상기 단계 (a)의 폴리펩티드와 상기 단계 (b)의 조성물을 접촉시키는 단계
    를 포함하는, 자일란을 함유하는 조성물의 가수분해, 분해 또는 붕괴 방법.
  174. 제173항에 있어서, 상기 조성물은 식물 세포, 박테리아 세포, 효모 세포, 곤충 세포 또는 동물 세포를 포함하는 것인 방법.
  175. 제64항의 폴리펩티드를 포함하는 반죽 또는 빵류 제품.
  176. 반죽을 컨디셔닝하기에 충분한 조건 하에서 제64항의 하나 이상의 폴리펩티드와 반죽 또는 빵류 제품을 접촉시키는 단계를 포함하는, 반죽 컨디셔닝 방법.
  177. 제64항의 폴리펩티드를 포함하는 음료.
  178. 음료의 점도를 감소시키기에 충분한 조건 하에서 음료 또는 음료 전구체에 제64항의 하나 이상의 폴리펩티드를 투여하는 단계를 포함하는, 음료 제조 방법.
  179. 제178항에 있어서, 상기 음료 또는 음료 전구체는 맥아즙 또는 맥주인 방법.
  180. 제64항의 폴리펩티드를 포함하는, 식품, 사료 또는 영양보조식품.
  181. 제64항의 폴리펩티드의 30개 이상의 연속 아미노산을 포함하는 자일라나제 효소를 함유하는 영양보조식품을 제조하는 단계; 및
    동물에게 상기 영양보조식품을 투여하여 동물에 의해 소화된 사료 또는 식품내에 함유된 자일란의 이용을 증가시키는 단계
    를 포함하는, 동물 사료내 영양보조식품으로서 자일라나제의 이용 방법.
  182. 제181항에 있어서, 상기 동물은 인간인 방법.
  183. 제181항에 있어서, 상기 동물은 인간인 방법.
  184. 제181항에 있어서, 상기 동물은 반추동물 또는 단위동물인 방법
  185. 제181항에 있어서, 상기 자일라나제 효소는 박테리아, 효모, 식물, 곤충, 진균 및 동물로 구성되는 군으로부터 선택되는 유기체 내에서 자일라나제를 암호화하는 폴리뉴클레오티드의 발현에 의해 제조하는 것인 방법.
  186. 제185항에 있어서, 상기 유기체는 에스. 폼브(S. pombe), 에스. 세레비재(S.cerevisiae), 피치아 파스토리스(Pichia pastoris), 슈도모나스종(Pseudomonassp.) , 이. 콜라이(E. coli), 스트렙토마이세스종(Streptomycessp.), 바실러스종(Bacillussp.) 및 락토바실러스종(Lactobacillussp.)으로 구성되는 군으로부터 선택하는 것인 방법.
  187. 열안정성 재조합 자일라나제 효소를 포함하는 식용 효소 전달 매트릭스.
  188. 제187항에 있어서, 제64항의 폴리펩티드를 포함하는 식용 효소 전달 매트릭스.
  189. 과립성 식용 담체와 열가소성 재조합 자일라나제 효소를 포함하는 펠릿 형태의 식용 효소 전달 매트릭스를 제조하는 단계로서, 상기 펠릿은 그 내부에 함유된 자일라나제 효소를 수성 매체 내에 용이하게 분산시키는 것인 단계; 및
    상기 식용 효소 전달 매트릭스를 동물에게 투여하는 단계
    를 포함하는, 동물에게 자일라나제 보조식품을 전달하는 방법.
  190. 제189항에 있어서, 상기 재조합 자일라나제 효소는 제64항의 폴리펩티드를 포함하는 것인 방법.
  191. 제189항에 있어서, 상기 과립성 식용 담체는 곡물 배아(grain germ), 오일을제거한 곡물 배아, 건초, 알팔파, 티모시, 콩껍질, 해바라기씨 밀 및 밀 미드(wheat midd)로 구성되는 군으로부터 선택한 담체를 포함하는 것인 방법.
  192. 제189항에 있어서, 상기 식용 담체는 오일을 제거한 곡물 배아를 포함하는 것인 방법
  193. 제189항에 있어서, 상기 자일라나제 효소는 펠릿화 조건에서 열안정성을 제공하기 위해 글리코실화하는 것인 방법.
  194. 제189항에 있어서, 상기 전달 매트릭스는 곡물 배아 및 자일라나제를 포함하는 혼합물의 펠릿화에 의해 형성하는 것인 방법.
  195. 제189항에 있어서, 상기 펠릿화 조건은 스팀 적용을 포함하는 것인 방법.
  196. 제189항에 있어서, 상기 펠릿화 조건은 약 80℃ 이상의 온도를 약 5분 동안 적용하는 과정을 포함하고, 상기 효소는 효소 1 mg 당 350 유닛 이상 내지 약 900 유닛의 특이 활성을 보유하는 것인 방법.
  197. 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 서열 및 신호 서열을 포함하는 분리된 핵산 또는 재조합 핵산으로서, 상기 핵산은 제1항의 서열을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
  198. 제197항에 있어서, 상기 신호 서열은 다른 자일라나제 또는 비자일라나제 효소로부터 유래한 것인 분리된 핵산 또는 재조합 핵산.
  199. 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 서열을 포함하는 분리된 핵산 또는 재조합 핵산으로서, 상기 서열은 신호 서열 및 제1항의 서열을 포함하는 핵산을 함유하지 않는 것인 분리된 핵산 분자 또는 재조합 핵산 분자.
  200. 하기 돌연변이중 하나 이상을 함유하는 서열 번호 189의 서열을 포함하는 분리된 핵산 또는 재조합 핵산: 위치 22∼24의 뉴클레오티드는 TTC, 위치 31∼33의 뉴클레오티드는 CAC, 위치 34∼36의 뉴클레오티드는 TTG, 위치 49∼51의 뉴클레오티드는 ATA, 위치 31∼33의 뉴클레오티드는 CAT, 위치 67∼69의 뉴클레오티드는 ACG, 위치 178∼180의 뉴클레오티드는 CAC, 위치 190∼192의 뉴클레오티드는 TGT, 위치 190∼192의 뉴클레오티드는 GTA, 위치 190∼192의 뉴클레오티드는 GTT, 위치 193∼195의 뉴클레오티드는 GTG, 위치 202∼204의 뉴클레오티드는 GCT, 위치 235∼237의 뉴클레오티드는 CCA, 또는 위치 235∼237의 뉴클레오티드는 CCC.
  201. 제200항의 서열을 포함하는 핵산 서열의 제조 방법으로서, 서열 번호 189중의 돌연변이는 유전자 부위 포화 돌연변이유발법(GSSM; 상표명)에 의해 얻는 것인방법.
  202. 하기 돌연변이중 하나 이상을 함유하는 서열 번호 190을 포함하는 아미노산을 포함하는 분리된 폴리펩티드 또는 재조합 폴리펩티드: 아미노산 위치 8의 아스파르트산은 페닐알라닌, 아미노산 위치 11의 글루타민은 히스티딘, 아미노산 위치 12의 아스파라긴은 루신, 아미노산 위치 17의 글리신은 이소루신, 아미노산 위치 23의 트레오닌은 야생형 코돈 이외의 코돈에 의해 암호화된 트레오닌, 아미노산 위치 60의 글리신은 히스티딘, 아미노산 위치 64의 프롤린은 시스테인, 아미노산 위치 64의 프롤린은 발린, 아미노산 위치 65의 세린은 발린, 아미노산 위치 68의 글리신은 이소루신, 아미노산 위치 68의 글리신은 알라닌, 또는 아미노산 위치 79의 발린은 프롤린.
  203. 목재 또는 목제품과 제64항의 폴리펩티드를 접촉시키는 단계를 포함하는, 목재 또는 목제품중 리그닌 감소 방법.
  204. 제64항의 폴리펩티드를 포함하는 세정 조성물.
  205. 제64항의 폴리펩티드를 포함하는 약학 조성물.
  206. 제64항의 폴리펩티드를 투여하는 단계를 포함하는, 자일란을 포함하는 미생물을 동물로부터 제거하거나 동물을 보호하는 방법.
  207. 제206항에 있어서, 상기 미생물은 박테리아인 방법.
  208. 제205항에 있어서, 상기 박테리아는 살모넬라인 방법.
  209. 하기 서열 변이중 하나 이상 또는 모두를 포함하는 서열 번호 189의 서열을 포함하는 분리된 핵산 또는 재조합 핵산: 위치 22∼24의 뉴클레오티드는 TTC, 위치 22∼24의 뉴클레오티드는 TTT, 위치 31∼33의 뉴클레오티드는 CAC, 위치 31∼33의 뉴클레오티드는 CAT, 위치 34∼36의 뉴클레오티드는 TTG, 위치 34∼36의 뉴클레오티드는 TTA, 위치 34∼36의 뉴클레오티드는 CTC, 위치 34∼36의 뉴클레오티드는 CTT, 위치 34∼36의 뉴클레오티드는 CTA, 위치 34∼36의 뉴클레오티드는 CTG, 위치 49∼51의 뉴클레오티드는 ATA, 위치 49∼51의 뉴클레오티드는 ATT, 위치 49∼51의 뉴클레오티드는 ATC, 위치 178∼180의 뉴클레오티드는 CAC, 위치 178∼180의 뉴클레오티드는 CAT, 위치 190∼192의 뉴클레오티드는 TGT, 위치 190∼192의 뉴클레오티드는 TGC, 위치 190∼192의 뉴클레오티드는 GTA, 위치 190∼192의 뉴클레오티드는 GTT, 위치 190∼192의 뉴클레오티드는 GTC, 위치 190∼192의 뉴클레오티드는 GTG, 위치 193∼195의 뉴클레오티드는 GTG, 위치 193∼195의 뉴클레오티드는 GTC, 위치 193∼195의 뉴클레오티드는 GTA, 위치 193∼195의 뉴클레오티드는 GTT, 위치 202∼204의 뉴클레오티드는 ATA, 위치 202∼204의 뉴클레오티드는 ATT, 위치 202∼204의 뉴클레오티드는 ATC, 위치 202∼204의 뉴클레오티드는 GCT, 위치 202∼204의 뉴클레오티드는 GCG, 위치 202∼204의 뉴클레오티드는 GCC, 위치 202∼204의 뉴클레오티드는 GCA, 위치 235∼237의 뉴클레오티드는 CCA, 위치 235∼237의 뉴클레오티드는 CCC, 또는 위치 235∼237의 뉴클레오티드는 CCG.
  210. 하기 서열 변이중 하나 이상 또는 모두를 포함하는 서열 번호 190의 서열을 포함하는 아미노산 서열을 포함하는 분리된 폴리펩티드 또는 재조합 폴리펩티드: 아미노산 위치 8의 아스파르트산은 페닐알라닌, 아미노산 위치 11의 글루타민은 히스티딘, 아미노산 위치 12의 아스파라긴은 루신, 아미노산 위치 17의 글리신은 이소루신, 아미노산 위치 23의 트레오닌은 야생형 코돈 이외의 코돈에 의해 암호화된 트레오닌, 아미노산 위치 60의 글리신은 히스티딘, 아미노산 위치 64의 프롤린은 시스테인, 아미노산 위치 64의 프롤린은 발린, 아미노산 위치 65의 세린은 발린, 아미노산 위치 68의 글리신은 이소루신, 아미노산 위치 68의 글리신은 알라닌, 또는 아미노산 위치 79의 세린은 프롤린임.
  211. 표 1 또는 표 2에 기재된 서열 변이중 하나 이상 또는 모두를 포함하는 서열 번호 189의 서열을 포함하는 분리된 핵산 또는 재조합 핵산.
  212. 제211항의 핵산에 의해 암호화된 분리된 폴리펩티드 또는 재조합 폴리펩티드.
  213. 하기 서열 변이중 하나 이상 또는 모두를 포함하는 서열 번호 379의 서열을 포함하는 분리된 핵산 또는 재조합 핵산: 위치 22∼24의 뉴클레오티드는 TTC, 위치 31∼33의 뉴클레오티드는 CAC, 위치 49∼51의 뉴클레오티드는 ATA, 위치 178∼180의 뉴클레오티드는 CAC, 위치 193∼195의 뉴클레오티드는 GTG, 위치 202∼204의 뉴클레오티드는 GCT임.
  214. D8F, Q11H, G17I, G60H, S65V 및/또는 G68A 서열 변이중 하나 이상 또는 모두를 포함하는 서열 번호 380의 서열을 포함하는 분리된 폴리펩티드 또는 재조합 폴리펩티드.
  215. 제210항 또는 제214항에 있어서, 상기 폴리펩티드는 열안정성 자일라나제 활성을 보유하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
KR10-2004-7020345A 2002-06-14 2003-06-16 자일라나제, 이를 암호화하는 핵산, 및 이의 제조 및 사용방법 KR20050010053A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US38929902P 2002-06-14 2002-06-14
US60/389,299 2002-06-14
PCT/US2003/019153 WO2003106654A2 (en) 2002-06-14 2003-06-16 Xylanases, nucleic adics encoding them and methods for making and using them

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020087009502A Division KR20080045764A (ko) 2002-06-14 2003-06-16 자일라나제, 이를 암호화하는 핵산, 및 이의 제조 및 사용방법

Publications (1)

Publication Number Publication Date
KR20050010053A true KR20050010053A (ko) 2005-01-26

Family

ID=29736623

Family Applications (2)

Application Number Title Priority Date Filing Date
KR10-2004-7020345A KR20050010053A (ko) 2002-06-14 2003-06-16 자일라나제, 이를 암호화하는 핵산, 및 이의 제조 및 사용방법
KR1020087009502A KR20080045764A (ko) 2002-06-14 2003-06-16 자일라나제, 이를 암호화하는 핵산, 및 이의 제조 및 사용방법

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020087009502A KR20080045764A (ko) 2002-06-14 2003-06-16 자일라나제, 이를 암호화하는 핵산, 및 이의 제조 및 사용방법

Country Status (14)

Country Link
US (4) US7547534B2 (ko)
EP (4) EP2298904B1 (ko)
KR (2) KR20050010053A (ko)
CN (2) CN1675365A (ko)
AU (1) AU2003251549B2 (ko)
BR (2) BR0312121A (ko)
CA (1) CA2488916C (ko)
DK (2) DK2298904T3 (ko)
EA (1) EA200500019A1 (ko)
ES (1) ES2394708T3 (ko)
MX (1) MXPA04012614A (ko)
NZ (1) NZ537597A (ko)
WO (1) WO2003106654A2 (ko)
ZA (2) ZA200500171B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9816078B2 (en) 2009-11-19 2017-11-14 Solis Biodyne Oü Compositions for increasing polypeptide stability and activity, and related methods

Families Citing this family (94)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050010053A (ko) 2002-06-14 2005-01-26 다이버사 코포레이션 자일라나제, 이를 암호화하는 핵산, 및 이의 제조 및 사용방법
DK1618183T3 (en) 2003-04-29 2015-02-23 Danisco Us Inc New Bacillus cellulase 029cel
CA2548723A1 (en) 2003-12-19 2005-06-19 Syngenta Participations Ag Microbially expressed xylanases and their use as feed additives and other uses
EP1725115A1 (en) * 2004-02-11 2006-11-29 Novozymes A/S Preparation of dough-based product with xylanase
WO2005079585A1 (en) * 2004-02-20 2005-09-01 Novozymes A/S Preparation of dough-based product
ES2377408T3 (es) 2004-03-25 2012-03-27 Iogen Bio-Products Corporation Xilanasas modificadas que exhiben expresión mejorada
US7316998B2 (en) 2004-05-27 2008-01-08 Acceleron Pharma Inc. Cerberus/Coco derivatives and uses thereof
EP1614747A1 (en) * 2004-07-06 2006-01-11 Gesellschaft für Biotechnologische Forschung mbH et al New esterases from rumen
US7024796B2 (en) * 2004-07-19 2006-04-11 Earthrenew, Inc. Process and apparatus for manufacture of fertilizer products from manure and sewage
US20070084077A1 (en) * 2004-07-19 2007-04-19 Gorbell Brian N Control system for gas turbine in material treatment unit
US7024800B2 (en) * 2004-07-19 2006-04-11 Earthrenew, Inc. Process and system for drying and heat treating materials
US7685737B2 (en) 2004-07-19 2010-03-30 Earthrenew, Inc. Process and system for drying and heat treating materials
JP4836701B2 (ja) * 2005-07-26 2011-12-14 花王株式会社 アルカリキシラナーゼ
US20070163316A1 (en) * 2006-01-18 2007-07-19 Earthrenew Organics Ltd. High organic matter products and related systems for restoring organic matter and nutrients in soil
US7610692B2 (en) * 2006-01-18 2009-11-03 Earthrenew, Inc. Systems for prevention of HAP emissions and for efficient drying/dehydration processes
CA2946924A1 (en) * 2006-02-14 2007-08-23 Bp Corporation North America Inc. Xylanases, nucleic acids encoding them and methods for making and using them
WO2007115391A1 (en) 2006-04-12 2007-10-18 National Research Council Of Cananda Modification of xylanases to increase thermophilicity, thermostability and alkalophilicity
US8877478B2 (en) * 2006-09-21 2014-11-04 Verenium Corporation Phytases, nucleic acids encoding them and methods for making and using them
CN101522045A (zh) 2006-09-29 2009-09-02 诺维信公司 用于动物饲料的木聚糖酶
AU2008307371B2 (en) * 2007-10-03 2015-05-28 Bp Corporation North America Inc. Xylanases, nucleic acids encoding them and methods for making and using them
EP2238243B1 (en) 2007-11-30 2019-01-09 Novozymes A/S Polypeptides having arabinofuranosidase activity and polynucleotides encoding same
CN101932704A (zh) 2007-12-05 2010-12-29 诺维信公司 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸
WO2009146464A2 (en) * 2008-05-30 2009-12-03 Edenspace Systems Corporation Methods and compositions for modifying levels of lignin and increasing the digestibility of cellulose by the recombinant overexpression of lignocellulolytic enzymes
US8847031B2 (en) * 2008-07-09 2014-09-30 The Board Of Regents For Oklahoma State University Thermocellulases for lignocellulosic degradation
TWI466680B (zh) 2008-08-01 2015-01-01 Oncotherapy Science Inc Melk抗原決定位胜肽及含此胜肽的疫苗
KR101018790B1 (ko) * 2008-08-14 2011-03-03 한국화학연구원 자일라나아제를 생산하는 신규한 페니바실러스 sp. HPL-001 균주, 이로부터 분리한 신규한 자일라나아제 효소 및 이의 생산 방법
EP2382311A4 (en) * 2008-12-23 2012-08-15 POLYPEPTIDES WITH XYLANASE ACTIVITY
MX347545B (es) 2008-12-23 2017-05-02 Dupont Nutrition Biosci Aps Polipeptidos con actividad xilanasa.
US20120040410A1 (en) * 2009-01-19 2012-02-16 The Board Of Regents For Oklahoma State University Thermohemicellulases for lignocellulosic degradation
US9012186B2 (en) 2009-04-27 2015-04-21 The Board Of Trustees Of The University Of Illinois Hemicellulose-degrading enzymes
WO2012015452A1 (en) * 2009-11-11 2012-02-02 International Paper Company Effect of low dose xylanase on pulp in prebleach treatment process
CN106929494B (zh) * 2009-12-09 2021-05-14 诺维信公司 产生gh8木聚糖酶变体的方法
ES2523242T3 (es) * 2009-12-21 2014-11-24 Süd-Chemie Ip Gmbh & Co. Kg Xilanasa termoestable para la hidrólisis selectiva de polisacáridos que contienen pentosa
TWI485245B (zh) 2010-01-25 2015-05-21 Oncotherapy Science Inc 經修飾之melk胜肽及含此胜肽之疫苗
EP2534295B1 (en) 2010-02-12 2018-06-13 Kemira Oyj Method for removing ink from paper
WO2011157231A1 (zh) * 2010-06-18 2011-12-22 中国科学院上海生命科学研究院 新型内切木聚糖酶,其编码基因和应用
US8563284B2 (en) * 2010-10-08 2013-10-22 Jenn Tu Thermostable Paenibacillus xylanases
CN107674882B (zh) * 2011-01-28 2021-06-25 加利福尼亚大学董事会 植物中经空间修饰的基因表达
WO2012142591A2 (en) * 2011-04-14 2012-10-18 The Regents Of The University Of Colorado Compositions, methods and uses for multiplex protein sequence activity relationship mapping
WO2013024909A1 (ko) * 2011-08-12 2013-02-21 한국화학연구원 내열성,광범위 pH,고활성 자일라나아제를 생산하는 신규 페니바실러스 sp.HPL-3 균주,이로부터 분리한 신규 자일라나아제 효소 및 이의 형질전환체를 이용한 이의 대량 생산 방법
CN103998680B (zh) * 2011-10-27 2017-04-26 巴克曼实验室国际公司 用于酶降解处理造纸纤维的方法和组合物及由其制成的纸制品
EP2776561A4 (en) * 2011-11-11 2015-09-02 Novozymes Inc POLYPEPTIDES WITH XYLANASE ACTIVITY AND POLYNUCLEOTIDES THAT CODE
CN104039959A (zh) * 2011-11-11 2014-09-10 诺维信股份有限公司 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸
CN102735642B (zh) * 2012-07-12 2014-07-02 河北大学 一种快速无损鉴别初榨橄榄油和油橄榄果渣油的方法
US8759041B1 (en) * 2013-02-12 2014-06-24 Novozymes Inc. Polypeptides having xylanase activity and polynucleotides encoding same
GB201308853D0 (en) * 2013-03-12 2013-07-03 Verenium Corp Genes encoding xylanase
US9573980B2 (en) 2013-03-15 2017-02-21 Spogen Biotech Inc. Fusion proteins and methods for stimulating plant growth, protecting plants from pathogens, and immobilizing Bacillus spores on plant roots
US9850512B2 (en) 2013-03-15 2017-12-26 The Research Foundation For The State University Of New York Hydrolysis of cellulosic fines in primary clarified sludge of paper mills and the addition of a surfactant to increase the yield
US11981942B2 (en) 2013-07-23 2024-05-14 International N&H Denmark Aps Xylanases for solubilizing arabinoxylan-containing material
BR112016017349A2 (pt) * 2014-01-31 2017-10-17 Danisco Us Inc métodos para melhorar os subprodutos de processos de fermentação usando xilanase
GB201401699D0 (en) * 2014-01-31 2014-03-19 Dupont Nutrition Biosci Aps Protein
CA2938456C (en) 2014-02-11 2022-06-21 The Regents Of The University Of Colorado, A Body Corporate Crispr enabled multiplexed genome engineering
CN103834627B (zh) * 2014-03-11 2015-05-13 云南师范大学 一种低温木聚糖酶XynAGN16及其基因、重组载体、重组菌株
US9951363B2 (en) 2014-03-14 2018-04-24 The Research Foundation for the State University of New York College of Environmental Science and Forestry Enzymatic hydrolysis of old corrugated cardboard (OCC) fines from recycled linerboard mill waste rejects
JP6354462B2 (ja) * 2014-08-29 2018-07-11 本田技研工業株式会社 Ghファミリー10に属する耐熱性キシラナーゼ
BR112017005509A2 (pt) 2014-09-17 2018-08-14 Bayer Cropscience Lp composições que compreendem células recombinantes de bacillus e um outro agente de controle biológico.
BR122023020858A2 (pt) 2014-09-17 2024-01-30 Spogen Biotech Inc Semente de planta revestida com um microrganismo recombinante que expressa uma enzima que catalisa a produção de óxido nítrico
AR101959A1 (es) 2014-09-17 2017-01-25 Bayer Cropscience Lp Composiciones que comprenden células recombinantes de bacillus y un insecticida
WO2016044533A1 (en) 2014-09-17 2016-03-24 Bayer Cropscience Lp Compositions comprising recombinant bacillus cells and a fungicide
CN104450649B (zh) * 2014-11-17 2017-04-05 北京大学 F52‑6蛋白及其编码基因及水解木聚糖的应用
CN105779491A (zh) * 2014-12-25 2016-07-20 中国石油天然气股份有限公司 嗜热β-1,4木聚糖酶-His融合蛋白、其制备方法及应用、其基因工程菌的构建
CN104651337B (zh) * 2015-01-28 2017-11-03 浙江大学 一种木聚糖酶、其编码基因xyn‑lxy及其应用
IL295513B1 (en) * 2016-03-16 2024-04-01 Spogen Biotech Inc Methods for promoting plant health using free enzymes and microorganisms that cause enzyme overexpression
LT3474669T (lt) 2016-06-24 2022-06-10 The Regents Of The University Of Colorado, A Body Corporate Barkodu pažymėtų kombinatorinių bibliotekų generavimo būdai
WO2018007154A1 (en) 2016-07-08 2018-01-11 Novozymes A/S Xylanase variants and polynucleotides encoding same
BR112019000125A2 (pt) * 2016-07-08 2019-07-09 Novozymes As grânulo, polipeptídeo isolado, composição, aditivo de ração animal, ração animal peletizada, métodos de aprimoramento de um ou mais parâmetros de desempenho de um animal, de preparação de uma ração animal, para aprimorar o valor nutricional de uma ração animal, de solubilização de xilana a partir do material à base de planta e de produção do polipeptídeo, polinucleotídeo, construto de ácido nucleico ou vetor de expressão, célula hospedeira recombinante, e, uso do grânulo
JP2019162036A (ja) * 2016-08-05 2019-09-26 味の素株式会社 ヘミセルラーゼ
CN109688843A (zh) 2016-09-16 2019-04-26 诺维信公司 纤维洗涤方法和系统
CN108456667B (zh) * 2017-02-17 2019-10-18 中国科学院微生物研究所 一种木聚糖酶及其编码基因和它们的应用
WO2018234465A1 (en) * 2017-06-22 2018-12-27 Novozymes A/S XYLANASE VARIANTS AND POLYNUCLEOTIDES ENCODING THE SAME
US10011849B1 (en) 2017-06-23 2018-07-03 Inscripta, Inc. Nucleic acid-guided nucleases
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
JP7391827B2 (ja) 2017-07-24 2023-12-05 ノボザイムス アクティーゼルスカブ 湿式製粉におけるgh5及びgh30
BR112020012438A2 (pt) 2018-01-11 2020-11-24 Novozymes A/S composição, ração animal ou aditivo de ração animal, e, método de melhoria da liberação de xilana a partir de alimento para animais.
CN108018274B (zh) * 2018-02-01 2020-05-05 中南民族大学 一种极端耐热木聚糖酶1vbr的突变体xynh及其用途
WO2020009964A1 (en) * 2018-07-06 2020-01-09 Dupont Nutrition Biosciences Aps Xylanase-containing feed additives for cereal-based animal feed
CN109997970B (zh) * 2019-03-07 2022-05-06 青岛红樱桃生物技术有限公司 一类酶活和耐热性提高的酸性木聚糖酶突变体及其编码基因和应用
BR112021017999A2 (pt) 2019-03-11 2022-01-25 Novozymes As Métodos para aperfeiçoar a razão de conversão alimentar de uma ração animal, para gerar um prebiótico in situ em uma ração animal à base de milho, para diminuir a fração de milho insolúvel em uma ração animal à base de milho, para aperfeiçoar a saúde intestinal de um animal monogástrico, para causar um efeito butirogênico em um animal monogástrico, para a produção in situ de prebióticos em animais monogástricos, ração animal enriquecida com enzima, e, uso de glucuronoxilano hidrolase gh30 para preparar uma ração animal enriquecida com enzima
CN110124025B (zh) * 2019-04-22 2022-10-25 肇庆大华农生物药品有限公司 一种禽流感与禽腺病毒4型二联基因工程亚单位疫苗及其制备方法
CN112564485B (zh) * 2019-09-10 2022-03-08 中车株洲电力机车研究所有限公司 Llc谐振变换器及其控制方法
WO2021078839A1 (en) 2019-10-22 2021-04-29 Novozymes A/S Animal feed composition
CN111269903B (zh) * 2020-03-30 2021-08-17 郑州大学 木聚糖酶、基因及其应用
BR112022023230A2 (pt) 2020-05-18 2022-12-27 Dsm Ip Assets Bv Composições de ração animal
EP4152945A1 (en) 2020-05-18 2023-03-29 DSM IP Assets B.V. Animal feed compositions
CN111876398B (zh) * 2020-07-14 2022-03-22 云南师范大学 一种内切木聚糖酶突变体s05f04及其制备方法和应用
CN111690632B (zh) * 2020-07-14 2022-03-18 云南师范大学 一种内切木聚糖酶突变体s23e11及其制备方法和应用
CN111849942B (zh) * 2020-07-14 2022-06-24 云南师范大学 一种内切木聚糖酶突变体s44a09及制备方法和应用
CN111849943B (zh) * 2020-07-14 2022-06-24 云南师范大学 一种内切木聚糖酶突变体s06h03及制备方法和应用
CN111848759B (zh) * 2020-07-27 2022-03-29 齐鲁工业大学 一种活性提高的纤维小体对接蛋白突变体36741及应用
CN112322604B (zh) * 2020-11-03 2022-05-17 南京工业大学 一种高比酶活木聚糖酶突变体及其应用
KR20220085367A (ko) * 2020-12-15 2022-06-22 주식회사 잇다 기능성 발효 녹차 복합 생균제 및 이의 제조방법
EP4026900A3 (en) * 2020-12-17 2022-10-05 Fornia BioSolutions, Inc. Xylanase variants and methods
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections
CN114807093B (zh) * 2022-06-22 2022-09-27 中国农业科学院北京畜牧兽医研究所 一种通过c端添加融合肽段提高木聚糖酶和植酸酶热稳定性的方法

Family Cites Families (117)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2643800C2 (de) * 1976-09-29 1986-10-30 Fritz Werner Industrie-Ausrüstungen GmbH, 6222 Geisenheim Verfahren zur Herstellung von Xylose durch enzymatische Hydrolyse von Xylanen
US4261868A (en) 1979-08-08 1981-04-14 Lever Brothers Company Stabilized enzymatic liquid detergent composition containing a polyalkanolamine and a boron compound
US4404128A (en) 1981-05-29 1983-09-13 The Procter & Gamble Company Enzyme detergent composition
US5021246A (en) 1984-03-30 1991-06-04 Anheuser-Busch, Incorporated Step mashing process for producing low alcohol beer
US5204015A (en) 1984-05-29 1993-04-20 Genencor International, Inc. Subtilisin mutants
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US5780292A (en) 1987-04-29 1998-07-14 Alko Group Ltd. Production of phytate degrading enzymes in trichoderma
GB8610670D0 (en) 1986-05-01 1986-06-04 British Petroleum Co Plc Enzyme
US4966850A (en) * 1987-01-21 1990-10-30 Forintek Canada Corp. Production of thermostable xylanase and cellulase
US4788066A (en) 1987-12-14 1988-11-29 Grain Processing Corporation Preparation of low alcohol beer
US5116746A (en) * 1988-03-04 1992-05-26 Institut Armand Frappier Cellulase-free endo-xylanase enzyme of use in pulp delignification
US5179021A (en) * 1989-02-10 1993-01-12 Gil Inc. (Now Ici Canada Inc.) Pulp bleaching process comprising oxygen delignification and xylanase enzyme treatment
NZ235679A (en) 1989-10-18 1993-01-27 Int Paper Co Bleaching lignocellulosic pulp using (a) treatment with xylanase and (b) one or more chemical bleaching stages
FI89814C (fi) 1990-02-02 1993-11-25 Enso Gutzeit Oy Foerfarande foer blekning av cellulosamassa
US5326477A (en) 1990-05-07 1994-07-05 Bio-Sep, Inc. Process for digesting solid waste
GB9018426D0 (en) * 1990-08-22 1990-10-03 Sandoz Ltd Improvements in or relating to novel compounds
DK203490D0 (da) 1990-08-24 1990-08-24 Novo Nordisk As Fremgangsmaade til behandling af lignocellulosepulp og apparat til udfoerelse af processen
NL9100050A (nl) 1991-01-11 1992-08-03 Heineken Technische Beheer Bv Werkwijze voor het continu bereiden van wort.
FR2672066B1 (fr) * 1991-01-25 1997-01-31 Du Pin Cellulose Traitement enzymatique d'une pate ligno-cellulosique chimique.
US5405624A (en) 1991-02-14 1995-04-11 Bio-Technical Resources Process for producing a product with an intensified beer flavor
FI108800B (fi) * 1991-05-07 2002-03-28 Iogen Corp Menetelmä ja laitteisto entsyymin käyttämiseksi paperimassan valmistuksessa ja valkaisussa
DK175391D0 (da) * 1991-10-18 1991-10-18 Novo Nordisk As Nye enzymer
CA2082185C (en) * 1991-11-26 2004-01-20 Alexander R. Pokora Protease catalyzed treatments of lignocellulose materials
DK87092D0 (da) * 1992-07-02 1992-07-02 Novo Nordisk As Nyt enzym
DK105592D0 (da) 1992-08-26 1992-08-26 Novo Nordisk As Nyt enzym
US5785811A (en) * 1992-11-09 1998-07-28 The Mead Corporation Process for treating lignocellulosic material with soybean peroxidase in the presence of peroxide
BR9307805A (pt) 1992-12-31 1996-07-30 Metallgesellschaft Ag Processo para a preparaçao de cerveja
US6021536A (en) 1993-03-04 2000-02-08 Wasinger; Eric Mechanical desizing and abrading device
US5405769A (en) * 1993-04-08 1995-04-11 National Research Council Of Canada Construction of thermostable mutants of a low molecular mass xylanase
GB2279955B (en) * 1993-07-15 1998-02-18 Solvay Xylanase derived from a Bacillus species, expression vectors for such xylanase and other proteins, host organisms therefor and use thereof
AU7807394A (en) * 1993-10-04 1995-05-01 Novo Nordisk A/S An enzyme preparation comprising a modified enzyme
BE1007651A3 (fr) * 1993-10-22 1995-09-05 Solvay Interox Procede pour le blanchiment d'une pate a papier chimique.
EP0686193B1 (en) * 1993-12-24 2010-08-11 DSM IP Assets B.V. Alkali-tolerant xylanases
BR9507229A (pt) 1994-03-29 1997-09-16 Novo Nordisk As Amilase composição detergente aditivo detergente uso de um detergente e de uma amilase construç~o de dna vetor de expressão recombinante célula e processo para produzir amilase
AUPM493594A0 (en) 1994-04-11 1994-05-05 Biotech International Limited Bacterial xylanase
US5437992A (en) * 1994-04-28 1995-08-01 Genencor International, Inc. Five thermostable xylanases from microtetraspora flexuosa for use in delignification and/or bleaching of pulp
EP0716702B1 (en) 1994-06-14 2002-08-28 Genencor International, Inc. Thermostable xylanases
EP0769049A1 (en) * 1994-06-15 1997-04-23 Novo Nordisk A/S Pyrodictium xylanase, amylase and pullulanase
US5830732A (en) 1994-07-05 1998-11-03 Mitsui Toatsu Chemicals, Inc. Phytase
BE1008751A3 (fr) 1994-07-26 1996-07-02 Solvay Xylanase, microorganismes la produisant, molecules d'adn, procedes de preparation de cette xylanase et utilisations de celle-ci.
US5503709A (en) * 1994-07-27 1996-04-02 Burton; Steven W. Environmentally improved process for preparing recycled lignocellulosic materials for bleaching
US5935836A (en) * 1994-07-29 1999-08-10 Rohm Enzyme Finland Oy Actinomadura xylanase sequences and methods of use
US5795737A (en) 1994-09-19 1998-08-18 The General Hospital Corporation High level expression of proteins
US5786316A (en) 1994-10-27 1998-07-28 The Procter & Gamble Company Cleaning compositions comprising xylanases
JP3435946B2 (ja) * 1994-12-21 2003-08-11 王子製紙株式会社 耐熱性キシラナーゼ
DE69617641T3 (de) 1995-01-26 2009-10-22 Novozymes A/S Xylanase beinhaltende futterzusätze für tiere
US6093562A (en) 1996-02-05 2000-07-25 Novo Nordisk A/S Amylase variants
AU6298896A (en) 1995-06-28 1997-01-30 Novo Nordisk A/S A cellulase with reduced mobility
US6057103A (en) 1995-07-18 2000-05-02 Diversa Corporation Screening for novel bioactivities
US5958672A (en) 1995-07-18 1999-09-28 Diversa Corporation Protein activity screening of clones having DNA from uncultivated microorganisms
AU6513096A (en) 1995-07-19 1997-02-18 Novo Nordisk A/S Treatment of fabrics
AU7294396A (en) 1995-10-13 1997-04-30 Gist-Brocades B.V. Protein detection
HUP9900738A2 (hu) * 1995-10-17 1999-06-28 Institut National De La Recherche Agronomique Xilanáz, azt kódoló oligonukleotid-szekvencia és alkalmazásai
CN1151247C (zh) 1995-11-15 2004-05-26 诺沃奇梅兹有限公司 用于染色粗斜布的合并脱浆和“石洗”的一步方法
US5939250A (en) 1995-12-07 1999-08-17 Diversa Corporation Production of enzymes having desired activities by mutagenesis
US6537776B1 (en) 1999-06-14 2003-03-25 Diversa Corporation Synthetic ligation reassembly in directed evolution
US6361974B1 (en) 1995-12-07 2002-03-26 Diversa Corporation Exonuclease-mediated nucleic acid reassembly in directed evolution
US5830696A (en) 1996-12-05 1998-11-03 Diversa Corporation Directed evolution of thermophilic enzymes
AU1099597A (en) * 1995-12-18 1997-07-14 Rohm Enzyme Finland Oy Novel xylanases and uses thereof
EP0874893A2 (en) * 1995-12-29 1998-11-04 The Procter & Gamble Company Detergent compositions comprising immobilized enzymes
EP0877799A1 (en) 1996-01-29 1998-11-18 Novo Nordisk A/S Process for desizing cellulosic fabric
US6197070B1 (en) 1996-05-15 2001-03-06 The Procter & Gamble Company Detergent compositions comprising alpha combination of α-amylases for malodor stripping
US5759840A (en) * 1996-09-09 1998-06-02 National Research Council Of Canada Modification of xylanase to improve thermophilicity, alkalophilicity and thermostability
US6326341B1 (en) 1996-09-11 2001-12-04 The Procter & Gamble Company Low foaming automatic dishwashing compositions
EP1011620A1 (en) 1996-10-11 2000-06-28 Novo Nordisk A/S CELLULOSE BINDING DOMAINS (CBDs) FOR ORAL CARE PRODUCTS
US6069122A (en) 1997-06-16 2000-05-30 The Procter & Gamble Company Dishwashing detergent compositions containing organic diamines for improved grease cleaning, sudsing, low temperature stability and dissolution
AU743305C (en) 1997-01-17 2006-03-30 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
DE19703364A1 (de) 1997-01-30 1998-08-06 Henkel Ecolab Gmbh & Co Ohg Pastenförmiges Wasch- und Reinigungsmittel
US6023065A (en) 1997-03-10 2000-02-08 Alberta Research Council Method and apparatus for monitoring and controlling characteristics of process effluents
JP4263248B2 (ja) 1997-03-18 2009-05-13 ノボザイムス アクティーゼルスカブ Dnaのシャッフリングによるライブラリーの作成方法
US5948653A (en) 1997-03-21 1999-09-07 Pati; Sushma Sequence alterations using homologous recombination
US6153410A (en) 1997-03-25 2000-11-28 California Institute Of Technology Recombination of polynucleotide sequences using random or defined primers
GB2327345B (en) 1997-07-18 1999-06-23 Finnfeeds Int Ltd Use of an enzyme for manufacturing an agent for controlling bacterial infection
CA2308119C (en) 1997-10-30 2014-06-03 Novo Nordisk A/S .alpha.-amylase mutants
JP3905310B2 (ja) 1997-11-10 2007-04-18 ザ プロクター アンド ギャンブル カンパニー 洗剤タブレツトの製法
US6187580B1 (en) 1997-11-24 2001-02-13 Novo Nordisk A/S Pectate lyases
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
US6015703A (en) * 1998-03-10 2000-01-18 Iogen Corporation Genetic constructs and genetically modified microbes for enhanced production of beta-glucosidase
JP2003527450A (ja) 1998-05-01 2003-09-16 ノボ ノルディスク アクティーゼルスカブ N−ヒドロキシアセトアニリドの様な増強剤
DE19824705A1 (de) 1998-06-03 1999-12-09 Henkel Kgaa Amylase und Protease enthaltende Wasch- und Reinigungsmittel
JP4335995B2 (ja) 1998-07-22 2009-09-30 昭 神谷 環境保全型粒状洗浄用組成物
EP1109912A1 (en) * 1998-09-04 2001-06-27 University Of Georgia Research Foundation, Inc. Phenolic acid esterases, coding sequences and methods
US5980581A (en) 1998-09-08 1999-11-09 The Virkler Company Process for desizing and cleaning woven fabrics and garments
EP1129252A1 (en) * 1998-09-17 2001-09-05 Novozymes North America, Inc. Methods for deinking and decolorizing printed paper
EP1131447B2 (en) 1998-11-16 2011-10-12 National Research Council Of Canada Thermostable xylanases
CA2356255C (en) * 1998-12-23 2011-02-22 Danisco A/S Use of a xylanase in the preparation of dough
US6376246B1 (en) 1999-02-05 2002-04-23 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6368861B1 (en) 1999-01-19 2002-04-09 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6436675B1 (en) 1999-09-28 2002-08-20 Maxygen, Inc. Use of codon-varied oligonucleotide synthesis for synthetic shuffling
FR2788782B1 (fr) * 1999-01-25 2003-01-31 Gie Agro Ind Produit multienzymatique a activites glucoamylasique, proteolytique et xylanasique et procede pour sa production par fermentation a l'etat solide de son de ble avec aspergillus niger
US6024766A (en) 1999-01-27 2000-02-15 Wasinger; Eric M. Process for enzymatic desizing of garments and enzyme deactivation
JP2000245356A (ja) 1999-02-26 2000-09-12 Fuji Oil Co Ltd マンノース含有コプラミール組成物
CN1266903A (zh) * 1999-03-15 2000-09-20 财团法人生物技术开发中心 重组木聚糖酶、其制备方法及应用
US6511824B1 (en) 1999-03-17 2003-01-28 Exelixis, Inc. Nucleic acids and polypeptides of invertebrate TWIK channels and methods of use
US6824646B2 (en) * 1999-03-23 2004-11-30 Oji Paper Co., Ltd. Process for oxygen bleaching and enzyme treating lignocellulosic pulp with liquid treatment and recovery
US6309871B1 (en) 1999-03-31 2001-10-30 Novozymes A/S Polypeptides having alkaline α-amylase activity
CN1390260A (zh) 1999-09-09 2003-01-08 伊奥根生物产品公司 蛋白在基因修饰真菌中的表达
AU7476600A (en) * 1999-12-30 2001-07-16 Genencor International, Inc. Trichoderma reesei xylanase
US6531644B1 (en) 2000-01-14 2003-03-11 Exelixis, Inc. Methods for identifying anti-cancer drug targets
DE60136267D1 (de) * 2000-02-17 2008-12-04 Biogasol Ipr Aps Methode zur behandlung von lignin- und zellulosehaltigen stoffen
BR0108750A (pt) * 2000-03-08 2002-12-24 Danisco Variantes da xilanase que apresentam sensibilidade alterada para inibidores da xilanase
US6399123B1 (en) 2000-05-25 2002-06-04 University Of Missouri Board Of Curators Oligosaccharide removal from animal feed
CA2410917C (en) * 2000-05-31 2012-11-27 Wing L. Sung Modified xylanases exhibiting increased thermophilicity and alkalophilicity
CA2425671A1 (en) 2000-10-12 2002-04-18 Exelixis, Inc. Human ect2 and methods of use
AU2002230784A1 (en) 2000-11-10 2002-05-21 Xencor Novel thermostable alkaliphilic xylanase
WO2002052100A2 (en) 2000-12-22 2002-07-04 Iogen Bio-Products Corporation Alkaline extraction stages comprising xylanase
AU2002229430A1 (en) 2001-01-18 2002-07-30 Iogen Bio-Products Corporation Use of xylanase in pulp bleaching
GB0121387D0 (en) 2001-09-04 2001-10-24 Danisco Modified hydrolases
WO2003074780A1 (en) 2002-03-06 2003-09-12 Iogen Bio-Products Corporation Xylanase treatment of chemical pulp
US20040005674A1 (en) 2002-04-30 2004-01-08 Athenix Corporation Methods for enzymatic hydrolysis of lignocellulose
KR20050010053A (ko) 2002-06-14 2005-01-26 다이버사 코포레이션 자일라나제, 이를 암호화하는 핵산, 및 이의 제조 및 사용방법
US7033077B2 (en) * 2002-07-16 2006-04-25 Peter Taylor Sealable bags made of plastics or other materials and method of making plastic sheeting for manufacturing sealable bags
US20040112555A1 (en) * 2002-12-03 2004-06-17 Jeffrey Tolan Bleaching stage using xylanase with hydrogen peroxide, peracids, or a combination thereof
WO2004066945A2 (en) 2003-01-24 2004-08-12 Diversa Corporation Enzymes and the nucleic acids encoding them and methods for making and using them
CA2946924A1 (en) 2006-02-14 2007-08-23 Bp Corporation North America Inc. Xylanases, nucleic acids encoding them and methods for making and using them
CN109738224B (zh) 2013-06-21 2021-07-16 伯乐生命医学产品有限公司 具有流体收集管的微流体系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9816078B2 (en) 2009-11-19 2017-11-14 Solis Biodyne Oü Compositions for increasing polypeptide stability and activity, and related methods
KR20180128086A (ko) * 2009-11-19 2018-11-30 솔리스 바이오다인 오위 폴리펩티드 안정성 및 활성을 증가시키는 조성물 및 관련된 방법
KR20200018726A (ko) * 2009-11-19 2020-02-19 솔리스 바이오다인 오위 폴리펩티드 안정성 및 활성을 증가시키는 조성물 및 관련된 방법
US11118169B2 (en) 2009-11-19 2021-09-14 Solis Biodyne Oü Compositions for increasing polypeptide stability and activity, and related methods

Also Published As

Publication number Publication date
US20090221051A1 (en) 2009-09-03
CN1675365A (zh) 2005-09-28
EP1516053B1 (en) 2012-10-17
US20060003433A1 (en) 2006-01-05
CA2488916C (en) 2016-08-09
ES2394708T3 (es) 2013-02-05
CN101967490B (zh) 2014-07-16
EP2298904B1 (en) 2017-05-24
AU2003251549A1 (en) 2003-12-31
EA200500019A1 (ru) 2006-06-30
BR0312121A (pt) 2007-04-03
EP2305820A1 (en) 2011-04-06
EP1516053A4 (en) 2006-07-12
NZ537597A (en) 2008-07-31
CN101967490A (zh) 2011-02-09
WO2003106654A3 (en) 2004-08-26
WO2003106654A2 (en) 2003-12-24
US20080248160A1 (en) 2008-10-09
ZA200906125B (en) 2015-12-23
DK2298904T3 (en) 2017-09-11
AU2003251549B2 (en) 2008-03-13
BRPI0312121B1 (pt) 2019-10-01
US7547534B2 (en) 2009-06-16
MXPA04012614A (es) 2005-12-14
US20130337507A1 (en) 2013-12-19
ZA200500171B (en) 2010-06-30
EP1516053A2 (en) 2005-03-23
US8728769B2 (en) 2014-05-20
US9765319B2 (en) 2017-09-19
CA2488916A1 (en) 2003-12-24
KR20080045764A (ko) 2008-05-23
EP2314698A1 (en) 2011-04-27
EP2298904A1 (en) 2011-03-23
US7504120B2 (en) 2009-03-17
DK1516053T3 (da) 2013-03-25

Similar Documents

Publication Publication Date Title
DK2298904T3 (en) XYLANASES, NUCLEIC ACIDS, CODING THEM, AND METHODS FOR THE PREPARATION AND USE OF THEM
JP5343212B2 (ja) セルラーゼ、それらをコードする核酸、並びにそれらを作製及び使用する方法
JP6436946B2 (ja) グルカナーゼ、それらをコードする核酸並びにそれらを製造及び使用する方法
KR20050052666A (ko) 프로테아제, 이를 암호화하는 핵산, 및 이를 제조하고사용하는 방법
DK1613733T3 (en) PEKTATLYASER, nucleic acids encoding them, and methods for making and using the
BRPI0707784A2 (pt) xilanases, ácidos nucléicos que as codificam e métodos para produzì-las e usá-las
MX2010003600A (es) Xilanasas, acidos nucleicos que las codifican, y metodos para hacerlas y usarlas.
KR101508249B1 (ko) 알돌라제, 이것을 코딩하는 핵산과 그 제조 방법 및 사용 방법
JP5563990B2 (ja) トランスフェラーゼおよびオキシドレダクターゼ、それらをコードする核酸並びにそれらを製造および使用する方法
HUE030573T2 (en) Phospholipases, their coding nucleic acids, and a method for their production and use
KR20200111172A (ko) 네페탈락톨 산화 환원 효소, 네페탈락톨 합성 효소, 및 네페탈락톤을 생산할 수 있는 미생물
CN101688201A (zh) 植物co2传感器、编码它们的核酸以及制造和使用它们的方法
MXPA05004869A (es) Isomerasas de xilosa, acidos nucleicos que las codifican, y metodos para hacerlas y usarlas.
KR102224897B1 (ko) 신규한 폴리펩타이드 및 이를 포함하는 그람음성균에 대한 항생제
JP2006524050A (ja) グルコシダーゼ、それをコードする核酸、並びにその製造および使用方法
CN101287827A (zh) 具有二级酰胺酶活性的酶及其应用方法
KR20230113365A (ko) 뇌 기능의 저하의 예방 혹은 치료, 또는 뇌 기능의유지 혹은 개선을 하기 위한 조성물
CN102618564A (zh) 淀粉酶、编码它们的核酸及其制备和应用方法
GB2479462A (en) Polysaccharide degrading enzymes from Coleoptera insects
AU2016307152A1 (en) A transgenic plant having resistance to a phyto-pathogenic fungus
AU2015210488A1 (en) Xylanases, nucleic acids encoding them and methods for making and using them
AU2008201402A1 (en) Xylanases, nucleic acids encoding them and methods for making and using them

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
N231 Notification of change of applicant
A107 Divisional application of patent
WITB Written withdrawal of application