KR20050010053A - 자일라나제, 이를 암호화하는 핵산, 및 이의 제조 및 사용방법 - Google Patents
자일라나제, 이를 암호화하는 핵산, 및 이의 제조 및 사용방법 Download PDFInfo
- Publication number
- KR20050010053A KR20050010053A KR10-2004-7020345A KR20047020345A KR20050010053A KR 20050010053 A KR20050010053 A KR 20050010053A KR 20047020345 A KR20047020345 A KR 20047020345A KR 20050010053 A KR20050010053 A KR 20050010053A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- nucleic acid
- polypeptide
- sequence
- xylanase
- Prior art date
Links
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 title claims abstract description 336
- 238000000034 method Methods 0.000 title claims abstract description 226
- 150000007523 nucleic acids Chemical class 0.000 title claims description 524
- 102000039446 nucleic acids Human genes 0.000 title claims description 434
- 108020004707 nucleic acids Proteins 0.000 title claims description 434
- 230000000694 effects Effects 0.000 claims abstract description 211
- 229920001221 xylan Polymers 0.000 claims abstract description 52
- 150000004823 xylans Chemical class 0.000 claims abstract description 51
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 38
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 38
- 239000002157 polynucleotide Substances 0.000 claims abstract description 38
- 230000001965 increasing effect Effects 0.000 claims abstract description 13
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 493
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 466
- 229920001184 polypeptide Polymers 0.000 claims description 454
- 230000007613 environmental effect Effects 0.000 claims description 209
- 210000004027 cell Anatomy 0.000 claims description 203
- 239000002773 nucleotide Substances 0.000 claims description 146
- 125000003729 nucleotide group Chemical group 0.000 claims description 146
- 241000196324 Embryophyta Species 0.000 claims description 122
- 108090000623 proteins and genes Proteins 0.000 claims description 120
- 102000004190 Enzymes Human genes 0.000 claims description 97
- 108090000790 Enzymes Proteins 0.000 claims description 97
- 235000001014 amino acid Nutrition 0.000 claims description 97
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 90
- 230000014509 gene expression Effects 0.000 claims description 88
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 85
- 239000013598 vector Substances 0.000 claims description 83
- 108020004705 Codon Proteins 0.000 claims description 73
- 239000000758 substrate Substances 0.000 claims description 63
- 229940024606 amino acid Drugs 0.000 claims description 58
- 241001465754 Metazoa Species 0.000 claims description 57
- 235000018102 proteins Nutrition 0.000 claims description 57
- 102000004169 proteins and genes Human genes 0.000 claims description 57
- 239000000523 sample Substances 0.000 claims description 57
- 150000001413 amino acids Chemical class 0.000 claims description 55
- 239000012634 fragment Substances 0.000 claims description 54
- 231100000350 mutagenesis Toxicity 0.000 claims description 52
- 238000002703 mutagenesis Methods 0.000 claims description 51
- 239000000203 mixture Substances 0.000 claims description 47
- 238000012360 testing method Methods 0.000 claims description 47
- 230000035772 mutation Effects 0.000 claims description 42
- 108020004414 DNA Proteins 0.000 claims description 40
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 38
- 230000003321 amplification Effects 0.000 claims description 35
- 150000001875 compounds Chemical class 0.000 claims description 35
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 35
- 230000001580 bacterial effect Effects 0.000 claims description 34
- 235000013305 food Nutrition 0.000 claims description 30
- 239000013612 plasmid Substances 0.000 claims description 30
- 210000001519 tissue Anatomy 0.000 claims description 30
- 230000027455 binding Effects 0.000 claims description 28
- 150000003384 small molecules Chemical class 0.000 claims description 28
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 27
- 108091034117 Oligonucleotide Proteins 0.000 claims description 26
- 230000007062 hydrolysis Effects 0.000 claims description 25
- 238000006460 hydrolysis reaction Methods 0.000 claims description 25
- 238000004519 manufacturing process Methods 0.000 claims description 25
- 230000000295 complement effect Effects 0.000 claims description 24
- 108091026890 Coding region Proteins 0.000 claims description 23
- 235000013339 cereals Nutrition 0.000 claims description 23
- 239000007795 chemical reaction product Substances 0.000 claims description 22
- 230000009261 transgenic effect Effects 0.000 claims description 22
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 claims description 19
- 229920001131 Pulp (paper) Polymers 0.000 claims description 19
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 claims description 19
- 230000003301 hydrolyzing effect Effects 0.000 claims description 19
- 238000006243 chemical reaction Methods 0.000 claims description 18
- 230000009368 gene silencing by RNA Effects 0.000 claims description 18
- 238000003752 polymerase chain reaction Methods 0.000 claims description 18
- 235000013361 beverage Nutrition 0.000 claims description 17
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- 238000009396 hybridization Methods 0.000 claims description 17
- 108091030071 RNAI Proteins 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 16
- 235000015872 dietary supplement Nutrition 0.000 claims description 16
- 241000894006 Bacteria Species 0.000 claims description 15
- 240000008042 Zea mays Species 0.000 claims description 15
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 15
- 239000002023 wood Substances 0.000 claims description 15
- 239000004471 Glycine Substances 0.000 claims description 14
- 241000238631 Hexapoda Species 0.000 claims description 14
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 claims description 14
- 230000015572 biosynthetic process Effects 0.000 claims description 14
- 238000010367 cloning Methods 0.000 claims description 14
- 238000012217 deletion Methods 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 14
- 239000000047 product Substances 0.000 claims description 14
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 13
- 230000007423 decrease Effects 0.000 claims description 13
- 230000037430 deletion Effects 0.000 claims description 13
- 230000001939 inductive effect Effects 0.000 claims description 13
- 239000004474 valine Substances 0.000 claims description 13
- 230000002068 genetic effect Effects 0.000 claims description 12
- 239000000126 substance Substances 0.000 claims description 12
- 229920002488 Hemicellulose Polymers 0.000 claims description 11
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims description 11
- 235000013365 dairy product Nutrition 0.000 claims description 11
- 238000002741 site-directed mutagenesis Methods 0.000 claims description 11
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 11
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 10
- 238000007792 addition Methods 0.000 claims description 10
- 230000002210 biocatalytic effect Effects 0.000 claims description 10
- 230000004048 modification Effects 0.000 claims description 10
- 238000012986 modification Methods 0.000 claims description 10
- 230000006798 recombination Effects 0.000 claims description 10
- 238000003786 synthesis reaction Methods 0.000 claims description 10
- 238000013519 translation Methods 0.000 claims description 10
- 241000588724 Escherichia coli Species 0.000 claims description 9
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 9
- 241000209140 Triticum Species 0.000 claims description 9
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 9
- UGXQOOQUZRUVSS-ZZXKWVIFSA-N [5-[3,5-dihydroxy-2-(1,3,4-trihydroxy-5-oxopentan-2-yl)oxyoxan-4-yl]oxy-3,4-dihydroxyoxolan-2-yl]methyl (e)-3-(4-hydroxyphenyl)prop-2-enoate Chemical compound OC1C(OC(CO)C(O)C(O)C=O)OCC(O)C1OC1C(O)C(O)C(COC(=O)\C=C\C=2C=CC(O)=CC=2)O1 UGXQOOQUZRUVSS-ZZXKWVIFSA-N 0.000 claims description 9
- 229920000617 arabinoxylan Polymers 0.000 claims description 9
- 238000006911 enzymatic reaction Methods 0.000 claims description 9
- 102000037865 fusion proteins Human genes 0.000 claims description 9
- 108020001507 fusion proteins Proteins 0.000 claims description 9
- 230000013595 glycosylation Effects 0.000 claims description 9
- 238000006206 glycosylation reaction Methods 0.000 claims description 9
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 9
- 210000004962 mammalian cell Anatomy 0.000 claims description 9
- 229920001282 polysaccharide Polymers 0.000 claims description 9
- 239000005017 polysaccharide Substances 0.000 claims description 9
- 150000004804 polysaccharides Chemical class 0.000 claims description 9
- 238000005215 recombination Methods 0.000 claims description 9
- 210000005253 yeast cell Anatomy 0.000 claims description 9
- 244000061456 Solanum tuberosum Species 0.000 claims description 8
- 239000000074 antisense oligonucleotide Substances 0.000 claims description 8
- 238000012230 antisense oligonucleotides Methods 0.000 claims description 8
- 235000013405 beer Nutrition 0.000 claims description 8
- 235000011389 fruit/vegetable juice Nutrition 0.000 claims description 8
- 230000002538 fungal effect Effects 0.000 claims description 8
- 210000001161 mammalian embryo Anatomy 0.000 claims description 8
- 230000000813 microbial effect Effects 0.000 claims description 8
- 238000002360 preparation method Methods 0.000 claims description 8
- 238000012546 transfer Methods 0.000 claims description 8
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 7
- 244000068988 Glycine max Species 0.000 claims description 7
- 240000005979 Hordeum vulgare Species 0.000 claims description 7
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 claims description 7
- 241000282849 Ruminantia Species 0.000 claims description 7
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 7
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 7
- 239000004473 Threonine Substances 0.000 claims description 7
- 235000021307 Triticum Nutrition 0.000 claims description 7
- 210000004436 artificial bacterial chromosome Anatomy 0.000 claims description 7
- 210000001106 artificial yeast chromosome Anatomy 0.000 claims description 7
- 230000003197 catalytic effect Effects 0.000 claims description 7
- 238000013500 data storage Methods 0.000 claims description 7
- 235000013399 edible fruits Nutrition 0.000 claims description 7
- 229960000310 isoleucine Drugs 0.000 claims description 7
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 7
- 239000007788 liquid Substances 0.000 claims description 7
- 239000002609 medium Substances 0.000 claims description 7
- 239000002245 particle Substances 0.000 claims description 7
- 230000001131 transforming effect Effects 0.000 claims description 7
- 235000010469 Glycine max Nutrition 0.000 claims description 6
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 6
- 108020004711 Nucleic Acid Probes Proteins 0.000 claims description 6
- 235000007164 Oryza sativa Nutrition 0.000 claims description 6
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 6
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 6
- 238000004113 cell culture Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 6
- 235000005822 corn Nutrition 0.000 claims description 6
- 238000012258 culturing Methods 0.000 claims description 6
- 239000000499 gel Substances 0.000 claims description 6
- 239000000833 heterodimer Substances 0.000 claims description 6
- 230000002401 inhibitory effect Effects 0.000 claims description 6
- 210000000723 mammalian artificial chromosome Anatomy 0.000 claims description 6
- 244000005700 microbiome Species 0.000 claims description 6
- 239000002853 nucleic acid probe Substances 0.000 claims description 6
- 238000005453 pelletization Methods 0.000 claims description 6
- 235000009566 rice Nutrition 0.000 claims description 6
- 239000013603 viral vector Substances 0.000 claims description 6
- 238000011179 visual inspection Methods 0.000 claims description 6
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 claims description 5
- 108010001817 Endo-1,4-beta Xylanases Proteins 0.000 claims description 5
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 5
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 claims description 5
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 5
- 244000061176 Nicotiana tabacum Species 0.000 claims description 5
- 108700005078 Synthetic Genes Proteins 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 5
- 235000009582 asparagine Nutrition 0.000 claims description 5
- 229960001230 asparagine Drugs 0.000 claims description 5
- 238000012219 cassette mutagenesis Methods 0.000 claims description 5
- 235000018417 cysteine Nutrition 0.000 claims description 5
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims description 5
- YERABYSOHUZTPQ-UHFFFAOYSA-P endo-1,4-beta-Xylanase Chemical compound C=1C=CC=CC=1C[N+](CC)(CC)CCCNC(C(C=1)=O)=CC(=O)C=1NCCC[N+](CC)(CC)CC1=CC=CC=C1 YERABYSOHUZTPQ-UHFFFAOYSA-P 0.000 claims description 5
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 5
- 238000001727 in vivo Methods 0.000 claims description 5
- 230000003834 intracellular effect Effects 0.000 claims description 5
- 230000002503 metabolic effect Effects 0.000 claims description 5
- 235000013336 milk Nutrition 0.000 claims description 5
- 239000008267 milk Substances 0.000 claims description 5
- 210000004080 milk Anatomy 0.000 claims description 5
- 239000002243 precursor Substances 0.000 claims description 5
- 239000007787 solid Substances 0.000 claims description 5
- 235000020238 sunflower seed Nutrition 0.000 claims description 5
- 235000013311 vegetables Nutrition 0.000 claims description 5
- 108700010070 Codon Usage Proteins 0.000 claims description 4
- 241000235058 Komagataella pastoris Species 0.000 claims description 4
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 4
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims description 4
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 4
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 claims description 4
- 235000004279 alanine Nutrition 0.000 claims description 4
- 125000000539 amino acid group Chemical group 0.000 claims description 4
- 210000004507 artificial chromosome Anatomy 0.000 claims description 4
- 235000003704 aspartic acid Nutrition 0.000 claims description 4
- 238000007845 assembly PCR Methods 0.000 claims description 4
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 4
- 239000012472 biological sample Substances 0.000 claims description 4
- 230000001851 biosynthetic effect Effects 0.000 claims description 4
- 235000012180 bread and bread product Nutrition 0.000 claims description 4
- 239000013599 cloning vector Substances 0.000 claims description 4
- 238000010438 heat treatment Methods 0.000 claims description 4
- 230000006698 induction Effects 0.000 claims description 4
- 229910052751 metal Inorganic materials 0.000 claims description 4
- 239000002184 metal Substances 0.000 claims description 4
- 239000008188 pellet Substances 0.000 claims description 4
- 239000008194 pharmaceutical composition Substances 0.000 claims description 4
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims description 4
- 230000001177 retroviral effect Effects 0.000 claims description 4
- 229910052717 sulfur Inorganic materials 0.000 claims description 4
- 241000589155 Agrobacterium tumefaciens Species 0.000 claims description 3
- 230000004544 DNA amplification Effects 0.000 claims description 3
- 241000233866 Fungi Species 0.000 claims description 3
- 108020004511 Recombinant DNA Proteins 0.000 claims description 3
- 241000607142 Salmonella Species 0.000 claims description 3
- 210000004102 animal cell Anatomy 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 230000028996 humoral immune response Effects 0.000 claims description 3
- 229920005610 lignin Polymers 0.000 claims description 3
- 231100000219 mutagenic Toxicity 0.000 claims description 3
- 230000003505 mutagenic effect Effects 0.000 claims description 3
- 230000002018 overexpression Effects 0.000 claims description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 3
- 241001515965 unidentified phage Species 0.000 claims description 3
- 238000005406 washing Methods 0.000 claims description 3
- 235000017060 Arachis glabrata Nutrition 0.000 claims description 2
- 244000105624 Arachis hypogaea Species 0.000 claims description 2
- 235000010777 Arachis hypogaea Nutrition 0.000 claims description 2
- 235000018262 Arachis monticola Nutrition 0.000 claims description 2
- 241000194110 Bacillus sp. (in: Bacteria) Species 0.000 claims description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 2
- 241001057636 Dracaena deremensis Species 0.000 claims description 2
- 241000702191 Escherichia virus P1 Species 0.000 claims description 2
- 102220486246 Glucosidase 2 subunit beta_S65V_mutation Human genes 0.000 claims description 2
- 241000186610 Lactobacillus sp. Species 0.000 claims description 2
- 241000589774 Pseudomonas sp. Species 0.000 claims description 2
- 235000003434 Sesamum indicum Nutrition 0.000 claims description 2
- 241000592344 Spermatophyta Species 0.000 claims description 2
- 241000187180 Streptomyces sp. Species 0.000 claims description 2
- 239000012736 aqueous medium Substances 0.000 claims description 2
- 239000011324 bead Substances 0.000 claims description 2
- 239000000919 ceramic Substances 0.000 claims description 2
- 239000011521 glass Substances 0.000 claims description 2
- 230000001279 glycosylating effect Effects 0.000 claims description 2
- 239000010439 graphite Substances 0.000 claims description 2
- 229910002804 graphite Inorganic materials 0.000 claims description 2
- 239000000710 homodimer Substances 0.000 claims description 2
- 210000004408 hybridoma Anatomy 0.000 claims description 2
- 238000005259 measurement Methods 0.000 claims description 2
- 238000000520 microinjection Methods 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 claims description 2
- 235000020232 peanut Nutrition 0.000 claims description 2
- 229920000642 polymer Polymers 0.000 claims description 2
- 210000001938 protoplast Anatomy 0.000 claims description 2
- 230000002285 radioactive effect Effects 0.000 claims description 2
- 230000009467 reduction Effects 0.000 claims description 2
- 229920005989 resin Polymers 0.000 claims description 2
- 239000011347 resin Substances 0.000 claims description 2
- 102200006421 rs1064794292 Human genes 0.000 claims description 2
- 239000002689 soil Substances 0.000 claims description 2
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 230000001737 promoting effect Effects 0.000 claims 9
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 claims 3
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 claims 3
- 240000007594 Oryza sativa Species 0.000 claims 2
- 239000013543 active substance Substances 0.000 claims 2
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 claims 2
- 206010064571 Gene mutation Diseases 0.000 claims 1
- 240000004658 Medicago sativa Species 0.000 claims 1
- 230000004988 N-glycosylation Effects 0.000 claims 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 claims 1
- 240000000111 Saccharum officinarum Species 0.000 claims 1
- 244000000231 Sesamum indicum Species 0.000 claims 1
- 240000003768 Solanum lycopersicum Species 0.000 claims 1
- 229940009098 aspartate Drugs 0.000 claims 1
- 210000004899 c-terminal region Anatomy 0.000 claims 1
- 238000005553 drilling Methods 0.000 claims 1
- 230000004907 flux Effects 0.000 claims 1
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 claims 1
- 230000033607 mismatch repair Effects 0.000 claims 1
- 238000006384 oligomerization reaction Methods 0.000 claims 1
- 235000014594 pastries Nutrition 0.000 claims 1
- 230000003252 repetitive effect Effects 0.000 claims 1
- 102220036761 rs143914387 Human genes 0.000 claims 1
- 239000013589 supplement Substances 0.000 claims 1
- 229920001169 thermoplastic Polymers 0.000 claims 1
- 239000004416 thermosoftening plastic Substances 0.000 claims 1
- 239000010456 wollastonite Substances 0.000 claims 1
- 229910052882 wollastonite Inorganic materials 0.000 claims 1
- 229940088598 enzyme Drugs 0.000 description 67
- 239000013604 expression vector Substances 0.000 description 28
- 238000013518 transcription Methods 0.000 description 21
- 230000035897 transcription Effects 0.000 description 20
- 241000700605 Viruses Species 0.000 description 16
- 239000003623 enhancer Substances 0.000 description 16
- 239000000123 paper Substances 0.000 description 15
- 239000013615 primer Substances 0.000 description 15
- 239000002585 base Substances 0.000 description 14
- 239000000463 material Substances 0.000 description 14
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 12
- 239000004744 fabric Substances 0.000 description 11
- 239000003550 marker Substances 0.000 description 10
- 239000003921 oil Substances 0.000 description 10
- 235000019198 oils Nutrition 0.000 description 10
- 230000001105 regulatory effect Effects 0.000 description 10
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 9
- 210000003527 eukaryotic cell Anatomy 0.000 description 9
- 235000009973 maize Nutrition 0.000 description 9
- 238000000746 purification Methods 0.000 description 9
- 238000006467 substitution reaction Methods 0.000 description 9
- 230000002103 transcriptional effect Effects 0.000 description 9
- 230000014616 translation Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 241000209094 Oryza Species 0.000 description 7
- 230000015556 catabolic process Effects 0.000 description 7
- 238000003776 cleavage reaction Methods 0.000 description 7
- -1 dentures Substances 0.000 description 7
- 239000004009 herbicide Substances 0.000 description 7
- 235000015097 nutrients Nutrition 0.000 description 7
- 239000003981 vehicle Substances 0.000 description 7
- 241000701489 Cauliflower mosaic virus Species 0.000 description 6
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 6
- 235000002595 Solanum tuberosum Nutrition 0.000 description 6
- 230000000692 anti-sense effect Effects 0.000 description 6
- 230000002759 chromosomal effect Effects 0.000 description 6
- 238000006731 degradation reaction Methods 0.000 description 6
- 238000011161 development Methods 0.000 description 6
- 230000018109 developmental process Effects 0.000 description 6
- 238000005755 formation reaction Methods 0.000 description 6
- 230000008488 polyadenylation Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000002829 reductive effect Effects 0.000 description 6
- 239000004753 textile Substances 0.000 description 6
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 5
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 5
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 5
- 229930193140 Neomycin Natural products 0.000 description 5
- 108020005091 Replication Origin Proteins 0.000 description 5
- 239000004098 Tetracycline Substances 0.000 description 5
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 5
- 229960000723 ampicillin Drugs 0.000 description 5
- 235000015173 baked goods and baking mixes Nutrition 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- 230000012010 growth Effects 0.000 description 5
- 230000002363 herbicidal effect Effects 0.000 description 5
- 229960004927 neomycin Drugs 0.000 description 5
- 108091008146 restriction endonucleases Proteins 0.000 description 5
- 230000007017 scission Effects 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 229960002180 tetracycline Drugs 0.000 description 5
- 229930101283 tetracycline Natural products 0.000 description 5
- 235000019364 tetracycline Nutrition 0.000 description 5
- 150000003522 tetracyclines Chemical class 0.000 description 5
- 241000701161 unidentified adenovirus Species 0.000 description 5
- 244000075850 Avena orientalis Species 0.000 description 4
- 235000007319 Avena orientalis Nutrition 0.000 description 4
- 229920000742 Cotton Polymers 0.000 description 4
- 101000969137 Mus musculus Metallothionein-1 Proteins 0.000 description 4
- 241000208125 Nicotiana Species 0.000 description 4
- 108091093037 Peptide nucleic acid Proteins 0.000 description 4
- 241000187747 Streptomyces Species 0.000 description 4
- 108010022394 Threonine synthase Proteins 0.000 description 4
- 102000006601 Thymidine Kinase Human genes 0.000 description 4
- 108020004440 Thymidine kinase Proteins 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 239000000427 antigen Substances 0.000 description 4
- 108091007433 antigens Proteins 0.000 description 4
- 102000036639 antigens Human genes 0.000 description 4
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 4
- 150000001720 carbohydrates Chemical class 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 238000004587 chromatography analysis Methods 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 239000003974 emollient agent Substances 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000009472 formulation Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 101150066555 lacZ gene Proteins 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000011282 treatment Methods 0.000 description 4
- 230000003612 virological effect Effects 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- 241000219194 Arabidopsis Species 0.000 description 3
- 102100029727 Enteropeptidase Human genes 0.000 description 3
- 108010013369 Enteropeptidase Proteins 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- 241000219823 Medicago Species 0.000 description 3
- 108091000080 Phosphotransferase Proteins 0.000 description 3
- 108020005202 Viral DNA Proteins 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N acetic acid Substances CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 239000003674 animal food additive Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 235000014633 carbohydrates Nutrition 0.000 description 3
- 210000002421 cell wall Anatomy 0.000 description 3
- 229920002678 cellulose Polymers 0.000 description 3
- 239000001913 cellulose Substances 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 230000000593 degrading effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 239000003599 detergent Substances 0.000 description 3
- 102000004419 dihydrofolate reductase Human genes 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 101150109249 lacI gene Proteins 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 238000010647 peptide synthesis reaction Methods 0.000 description 3
- 102000020233 phosphotransferase Human genes 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 230000005030 transcription termination Effects 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- 241000701447 unidentified baculovirus Species 0.000 description 3
- 241001430294 unidentified retrovirus Species 0.000 description 3
- 229910052720 vanadium Inorganic materials 0.000 description 3
- JLIDBLDQVAYHNE-YKALOCIXSA-N (+)-Abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\[C@@]1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-YKALOCIXSA-N 0.000 description 2
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- GZCWLCBFPRFLKL-UHFFFAOYSA-N 1-prop-2-ynoxypropan-2-ol Chemical compound CC(O)COCC#C GZCWLCBFPRFLKL-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 108010051457 Acid Phosphatase Proteins 0.000 description 2
- 102000013563 Acid Phosphatase Human genes 0.000 description 2
- 229930192334 Auxin Natural products 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- KHBQMWCZKVMBLN-UHFFFAOYSA-N Benzenesulfonamide Chemical compound NS(=O)(=O)C1=CC=CC=C1 KHBQMWCZKVMBLN-UHFFFAOYSA-N 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 240000002791 Brassica napus Species 0.000 description 2
- 108091062157 Cis-regulatory element Proteins 0.000 description 2
- 241000701022 Cytomegalovirus Species 0.000 description 2
- 230000009946 DNA mutation Effects 0.000 description 2
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 102000009123 Fibrin Human genes 0.000 description 2
- 108010073385 Fibrin Proteins 0.000 description 2
- BWGVNKXGVNDBDI-UHFFFAOYSA-N Fibrin monomer Chemical compound CNC(=O)CNC(=O)CN BWGVNKXGVNDBDI-UHFFFAOYSA-N 0.000 description 2
- 101000798222 Homo sapiens Antizyme inhibitor 2 Proteins 0.000 description 2
- MHAJPDPJQMAIIY-UHFFFAOYSA-N Hydrogen peroxide Chemical compound OO MHAJPDPJQMAIIY-UHFFFAOYSA-N 0.000 description 2
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 2
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 108091005461 Nucleic proteins Proteins 0.000 description 2
- 108010038807 Oligopeptides Proteins 0.000 description 2
- 102000015636 Oligopeptides Human genes 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 2
- 230000006819 RNA synthesis Effects 0.000 description 2
- 206010037742 Rabies Diseases 0.000 description 2
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 2
- 241000191940 Staphylococcus Species 0.000 description 2
- 101150006914 TRP1 gene Proteins 0.000 description 2
- 208000036142 Viral infection Diseases 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 239000006053 animal diet Substances 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 239000002363 auxin Substances 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 235000015895 biscuits Nutrition 0.000 description 2
- 238000004061 bleaching Methods 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 108010089934 carbohydrase Proteins 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 230000024245 cell differentiation Effects 0.000 description 2
- 229960005091 chloramphenicol Drugs 0.000 description 2
- 238000012411 cloning technique Methods 0.000 description 2
- 230000003750 conditioning effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 235000014510 cooky Nutrition 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 235000005911 diet Nutrition 0.000 description 2
- 230000037213 diet Effects 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- OSVXSBDYLRYLIG-UHFFFAOYSA-N dioxidochlorine(.) Chemical compound O=Cl=O OSVXSBDYLRYLIG-UHFFFAOYSA-N 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 229950003499 fibrin Drugs 0.000 description 2
- 239000000796 flavoring agent Substances 0.000 description 2
- 235000019634 flavors Nutrition 0.000 description 2
- 238000005206 flow analysis Methods 0.000 description 2
- 229910052731 fluorine Inorganic materials 0.000 description 2
- 235000015203 fruit juice Nutrition 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 210000003736 gastrointestinal content Anatomy 0.000 description 2
- 210000001035 gastrointestinal tract Anatomy 0.000 description 2
- 239000008187 granular material Substances 0.000 description 2
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 230000002163 immunogen Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- 229910052740 iodine Inorganic materials 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 210000000287 oocyte Anatomy 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 239000006072 paste Substances 0.000 description 2
- 210000003800 pharynx Anatomy 0.000 description 2
- 239000012071 phase Substances 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 230000000069 prophylactic effect Effects 0.000 description 2
- YGSDEFSMJLZEOE-UHFFFAOYSA-N salicylic acid Chemical compound OC(=O)C1=CC=CC=C1O YGSDEFSMJLZEOE-UHFFFAOYSA-N 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 235000020357 syrup Nutrition 0.000 description 2
- 239000006188 syrup Substances 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 230000014621 translational initiation Effects 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 229960005486 vaccine Drugs 0.000 description 2
- 235000015192 vegetable juice Nutrition 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- 125000003088 (fluoren-9-ylmethoxy)carbonyl group Chemical group 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- ZIIUUSVHCHPIQD-UHFFFAOYSA-N 2,4,6-trimethyl-N-[3-(trifluoromethyl)phenyl]benzenesulfonamide Chemical compound CC1=CC(C)=CC(C)=C1S(=O)(=O)NC1=CC=CC(C(F)(F)F)=C1 ZIIUUSVHCHPIQD-UHFFFAOYSA-N 0.000 description 1
- ZBMRKNMTMPPMMK-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid;azane Chemical compound [NH4+].CP(O)(=O)CCC(N)C([O-])=O ZBMRKNMTMPPMMK-UHFFFAOYSA-N 0.000 description 1
- OSJPPGNTCRNQQC-UWTATZPHSA-N 3-phospho-D-glyceric acid Chemical compound OC(=O)[C@H](O)COP(O)(O)=O OSJPPGNTCRNQQC-UWTATZPHSA-N 0.000 description 1
- ODHCTXKNWHHXJC-VKHMYHEASA-N 5-oxo-L-proline Chemical compound OC(=O)[C@@H]1CCC(=O)N1 ODHCTXKNWHHXJC-VKHMYHEASA-N 0.000 description 1
- 230000005730 ADP ribosylation Effects 0.000 description 1
- 101000818108 Acholeplasma phage L2 Uncharacterized 81.3 kDa protein Proteins 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- 241000589156 Agrobacterium rhizogenes Species 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 244000144725 Amygdalus communis Species 0.000 description 1
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 1
- 108700007757 Arabidopsis GSTF8 Proteins 0.000 description 1
- 108700040922 Arabidopsis LFY Proteins 0.000 description 1
- 101100215339 Arabidopsis thaliana ACT11 gene Proteins 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 101150077012 BEL1 gene Proteins 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 241001515826 Cassava vein mosaic virus Species 0.000 description 1
- 108010059892 Cellulase Proteins 0.000 description 1
- 239000004155 Chlorine dioxide Substances 0.000 description 1
- 208000003495 Coccidiosis Diseases 0.000 description 1
- 108010047041 Complementarity Determining Regions Proteins 0.000 description 1
- 229940126062 Compound A Drugs 0.000 description 1
- 241000557626 Corvus corax Species 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 108010082495 Dietary Plant Proteins Proteins 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 101710111935 Endo-beta-1,4-glucanase Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- 240000000731 Fagus sylvatica Species 0.000 description 1
- 235000010099 Fagus sylvatica Nutrition 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 1
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 1
- 240000002024 Gossypium herbaceum Species 0.000 description 1
- 235000004341 Gossypium herbaceum Nutrition 0.000 description 1
- 101150094780 Gpc2 gene Proteins 0.000 description 1
- 101000912350 Haemophilus phage HP1 (strain HP1c1) DNA N-6-adenine-methyltransferase Proteins 0.000 description 1
- NLDMNSXOCDLTTB-UHFFFAOYSA-N Heterophylliin A Natural products O1C2COC(=O)C3=CC(O)=C(O)C(O)=C3C3=C(O)C(O)=C(O)C=C3C(=O)OC2C(OC(=O)C=2C=C(O)C(O)=C(O)C=2)C(O)C1OC(=O)C1=CC(O)=C(O)C(O)=C1 NLDMNSXOCDLTTB-UHFFFAOYSA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 1
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 1
- 206010023076 Isosporiasis Diseases 0.000 description 1
- 101000790844 Klebsiella pneumoniae Uncharacterized 24.8 kDa protein in cps region Proteins 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 241000227653 Lycopersicon Species 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 108010011756 Milk Proteins Proteins 0.000 description 1
- 102000014171 Milk Proteins Human genes 0.000 description 1
- 101100217138 Mus musculus Actr10 gene Proteins 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 235000011464 Pachycereus pringlei Nutrition 0.000 description 1
- 235000011466 Pachycereus weberi Nutrition 0.000 description 1
- 240000006939 Pachycereus weberi Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 108010064785 Phospholipases Proteins 0.000 description 1
- 102000015439 Phospholipases Human genes 0.000 description 1
- 241000404883 Pisa Species 0.000 description 1
- 241000219843 Pisum Species 0.000 description 1
- 235000010582 Pisum sativum Nutrition 0.000 description 1
- 208000020584 Polyploidy Diseases 0.000 description 1
- 241000709992 Potato virus X Species 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 1
- 102000004389 Ribonucleoproteins Human genes 0.000 description 1
- 108010081734 Ribonucleoproteins Proteins 0.000 description 1
- 101150012041 SK2 gene Proteins 0.000 description 1
- 101150090744 SPL3 gene Proteins 0.000 description 1
- 244000040738 Sesamum orientale Species 0.000 description 1
- 101150019148 Slc7a3 gene Proteins 0.000 description 1
- 235000000644 Solanum quadriloculatum Nutrition 0.000 description 1
- 241000589324 Solanum quadriloculatum Species 0.000 description 1
- 241000256248 Spodoptera Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 1
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 235000019486 Sunflower oil Nutrition 0.000 description 1
- 102000002933 Thioredoxin Human genes 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- 241000723873 Tobacco mosaic virus Species 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 240000001717 Vaccinium macrocarpon Species 0.000 description 1
- 235000012545 Vaccinium macrocarpon Nutrition 0.000 description 1
- 235000002118 Vaccinium oxycoccus Nutrition 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 1
- HMNZFMSWFCAGGW-XPWSMXQVSA-N [3-[hydroxy(2-hydroxyethoxy)phosphoryl]oxy-2-[(e)-octadec-9-enoyl]oxypropyl] (e)-octadec-9-enoate Chemical compound CCCCCCCC\C=C\CCCCCCCC(=O)OCC(COP(O)(=O)OCCO)OC(=O)CCCCCCC\C=C\CCCCCCCC HMNZFMSWFCAGGW-XPWSMXQVSA-N 0.000 description 1
- 238000011481 absorbance measurement Methods 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 239000002154 agricultural waste Substances 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 238000004873 anchoring Methods 0.000 description 1
- 235000019728 animal nutrition Nutrition 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 150000001450 anions Chemical class 0.000 description 1
- 239000004599 antimicrobial Substances 0.000 description 1
- 150000001479 arabinose derivatives Chemical class 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 125000000637 arginyl group Chemical class N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 230000010516 arginylation Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- JCSJTDYCNQHPRJ-FDVJSPBESA-N beta-D-Xylp-(1->4)-beta-D-Xylp-(1->4)-D-Xylp Chemical compound O[C@@H]1[C@@H](O)[C@H](O)CO[C@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O)C(O)OC2)O)OC1 JCSJTDYCNQHPRJ-FDVJSPBESA-N 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 239000007844 bleaching agent Substances 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 239000000828 canola oil Substances 0.000 description 1
- 235000019519 canola oil Nutrition 0.000 description 1
- 238000005277 cation exchange chromatography Methods 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 229940106157 cellulase Drugs 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 210000001638 cerebellum Anatomy 0.000 description 1
- 235000013351 cheese Nutrition 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 229940112822 chewing gum Drugs 0.000 description 1
- 235000015218 chewing gum Nutrition 0.000 description 1
- 210000000991 chicken egg Anatomy 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 235000019398 chlorine dioxide Nutrition 0.000 description 1
- VJYIFXVZLXQVHO-UHFFFAOYSA-N chlorsulfuron Chemical compound COC1=NC(C)=NC(NC(=O)NS(=O)(=O)C=2C(=CC=CC=2)Cl)=N1 VJYIFXVZLXQVHO-UHFFFAOYSA-N 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 235000019504 cigarettes Nutrition 0.000 description 1
- 239000004927 clay Substances 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 239000007891 compressed tablet Substances 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 235000004634 cranberry Nutrition 0.000 description 1
- 239000006071 cream Substances 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 239000000287 crude extract Substances 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 238000005202 decontamination Methods 0.000 description 1
- 230000003588 decontaminative effect Effects 0.000 description 1
- 230000018044 dehydration Effects 0.000 description 1
- 238000006297 dehydration reaction Methods 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- FCRACOPGPMPSHN-UHFFFAOYSA-N desoxyabscisic acid Natural products OC(=O)C=C(C)C=CC1C(C)=CC(=O)CC1(C)C FCRACOPGPMPSHN-UHFFFAOYSA-N 0.000 description 1
- 235000013325 dietary fiber Nutrition 0.000 description 1
- 238000000113 differential scanning calorimetry Methods 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- 229960003276 erythromycin Drugs 0.000 description 1
- ZINJLDJMHCUBIP-UHFFFAOYSA-N ethametsulfuron-methyl Chemical compound CCOC1=NC(NC)=NC(NC(=O)NS(=O)(=O)C=2C(=CC=CC=2)C(=O)OC)=N1 ZINJLDJMHCUBIP-UHFFFAOYSA-N 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- 241001233957 eudicotyledons Species 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 239000006052 feed supplement Substances 0.000 description 1
- 239000012847 fine chemical Substances 0.000 description 1
- 235000010037 flour treatment agent Nutrition 0.000 description 1
- 230000009661 flower growth Effects 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 210000004186 follicle cell Anatomy 0.000 description 1
- 230000022244 formylation Effects 0.000 description 1
- 238000006170 formylation reaction Methods 0.000 description 1
- 230000004345 fruit ripening Effects 0.000 description 1
- 235000012055 fruits and vegetables Nutrition 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 230000006251 gamma-carboxylation Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 125000000291 glutamic acid group Chemical class N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- 125000000404 glutamine group Chemical class N[C@@H](CCC(N)=O)C(=O)* 0.000 description 1
- 125000003976 glyceryl group Chemical group [H]C([*])([H])C(O[H])([H])C(O[H])([H])[H] 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 150000003278 haem Chemical class 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 230000003054 hormonal effect Effects 0.000 description 1
- 210000000688 human artificial chromosome Anatomy 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 239000010903 husk Substances 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000004191 hydrophobic interaction chromatography Methods 0.000 description 1
- 229910052588 hydroxylapatite Inorganic materials 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000026045 iodination Effects 0.000 description 1
- 238000006192 iodination reaction Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 235000015110 jellies Nutrition 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 230000006651 lactation Effects 0.000 description 1
- JJTUDXZGHPGLLC-UHFFFAOYSA-N lactide Chemical compound CC1OC(=O)C(C)OC1=O JJTUDXZGHPGLLC-UHFFFAOYSA-N 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 125000005647 linker group Chemical group 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 239000007937 lozenge Substances 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 210000004779 membrane envelope Anatomy 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 235000021239 milk protein Nutrition 0.000 description 1
- 230000011278 mitosis Effects 0.000 description 1
- ZAHQPTJLOCWVPG-UHFFFAOYSA-N mitoxantrone dihydrochloride Chemical compound Cl.Cl.O=C1C2=C(O)C=CC(O)=C2C(=O)C2=C1C(NCCNCCO)=CC=C2NCCNCCO ZAHQPTJLOCWVPG-UHFFFAOYSA-N 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000002324 mouth wash Substances 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 230000037125 natural defense Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 239000004006 olive oil Substances 0.000 description 1
- 235000008390 olive oil Nutrition 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- FJKROLUGYXJWQN-UHFFFAOYSA-N papa-hydroxy-benzoic acid Natural products OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000006320 pegylation Effects 0.000 description 1
- XYJRXVWERLGGKC-UHFFFAOYSA-D pentacalcium;hydroxide;triphosphate Chemical compound [OH-].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O XYJRXVWERLGGKC-UHFFFAOYSA-D 0.000 description 1
- 239000000816 peptidomimetic Substances 0.000 description 1
- 229940080469 phosphocellulose Drugs 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000003375 plant hormone Substances 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000013823 prenylation Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 229940043131 pyroglutamate Drugs 0.000 description 1
- 230000006340 racemization Effects 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000006722 reduction reaction Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000012465 retentate Substances 0.000 description 1
- 210000001995 reticulocyte Anatomy 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 229960004889 salicylic acid Drugs 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000002804 saturated mutagenesis Methods 0.000 description 1
- 238000009738 saturating Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 239000002002 slurry Substances 0.000 description 1
- 210000000813 small intestine Anatomy 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 235000014347 soups Nutrition 0.000 description 1
- 239000003549 soybean oil Substances 0.000 description 1
- 235000012424 soybean oil Nutrition 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 239000002438 stress hormone Substances 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000019635 sulfation Effects 0.000 description 1
- 238000005670 sulfation reaction Methods 0.000 description 1
- 239000002600 sunflower oil Substances 0.000 description 1
- 229920001864 tannin Polymers 0.000 description 1
- 235000018553 tannin Nutrition 0.000 description 1
- 239000001648 tannin Substances 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 108060008226 thioredoxin Proteins 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- 239000000606 toothpaste Substances 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 239000005418 vegetable material Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 235000014101 wine Nutrition 0.000 description 1
- 210000002268 wool Anatomy 0.000 description 1
- 235000013618 yogurt Nutrition 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2477—Hemicellulases not provided in a preceding group
- C12N9/248—Xylanases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2477—Hemicellulases not provided in a preceding group
- C12N9/248—Xylanases
- C12N9/2482—Endo-1,4-beta-xylanase (3.2.1.8)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/14—Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01008—Endo-1,4-beta-xylanase (3.2.1.8)
-
- D—TEXTILES; PAPER
- D21—PAPER-MAKING; PRODUCTION OF CELLULOSE
- D21C—PRODUCTION OF CELLULOSE BY REMOVING NON-CELLULOSE SUBSTANCES FROM CELLULOSE-CONTAINING MATERIALS; REGENERATION OF PULPING LIQUORS; APPARATUS THEREFOR
- D21C5/00—Other processes for obtaining cellulose, e.g. cooking cotton linters ; Processes characterised by the choice of cellulose-containing starting materials
- D21C5/005—Treatment of cellulose-containing material with microorganisms or enzymes
-
- D—TEXTILES; PAPER
- D21—PAPER-MAKING; PRODUCTION OF CELLULOSE
- D21H—PULP COMPOSITIONS; PREPARATION THEREOF NOT COVERED BY SUBCLASSES D21C OR D21D; IMPREGNATING OR COATING OF PAPER; TREATMENT OF FINISHED PAPER NOT COVERED BY CLASS B31 OR SUBCLASS D21G; PAPER NOT OTHERWISE PROVIDED FOR
- D21H17/00—Non-fibrous material added to the pulp, characterised by its constitution; Paper-impregnating material characterised by its constitution
- D21H17/005—Microorganisms or enzymes
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/05—Animals comprising random inserted nucleic acids (transgenic)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
- Paper (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Fodder In General (AREA)
Abstract
본 발명은 자일라나제 및 자일라나제를 암호화하는 폴리뉴크레오티드에 관한 것이다. 또한, 본 발명은 신규 자일라나제의 구성 방법 및 이의 사용 방법도 제공한다. 자일라나제는 증가된 pH 및 온도에서 증가된 활성 및 안정성을 보유한다.
Description
자일라나제(예컨대, 엔도-1,4-베타-자일라나제, EC 3.2.1.8)는 자일란 내의 내부 β-1,4-자일로시드계 연결기를 가수분해하여, 보다 작은 분자량의 자일로스 및 자일로-올리고머를 생성시킨다. 자일란은 1,4-β-글리코시드가 연결된 D-자일로피라노즈로부터 형성된 다당류이다. 자일라나제는 상업적 가치가 상당하며, 제빵, 및 과일과 야채 가공을 위한 식품 산업, 농업용 폐기물의 파괴, 동물 사료의 제조 및 펄프 및 종이의 제조에서 사용된다. 자일라나제는 진균류 및 박테리아에 의해형성된다.
아라비노자일라나제는 다양성 및 성장 조건에 따라서 2.5 내지 7.1%w/w를 나타내는 곡류의 주요 비전분 다당류이다. 이 다당류는 산화적 조건 하에서 점성 용액을 생성시키거나, 심지어는 겔화하도록 하는 물리화학적 성질을 가진다. 게다가, 아라비노자일란은 높은 수분결합력을 가지고, 단백질 발포를 안정화시키는 역할을 할 수 있다. 이 모든 특징들은 양조, 제빵, 동물 영양섭취 및 제지를 포함하는 수가지 산업에 있어 문제를 제기한다. 양조 용도에 있어, 자일란의 존재는 맥아즙 여과성 및 헤이즈 형성 관련 문제를 초래한다. 제빵 용도(특히 쿠키 및 크래커의 용도)에 있어, 이 아라비노자일란은 비스킷 크기의 기계화 및 감소화를 어렵게 하는 끈적한 도우를 생성시킨다. 게다가, 이 탄수화물은 바삭거림을 실추시키고 저장 수명을 감소시키는 제빵 제품의 급속한 재함수와 관련이 있다. 곡류 식이법을 이용한 단위 동물의 사료 용도에서, 아라비노자일란은 장 내용물의 점도에 기여하는 주요 인자이기 때문에, 사료의 분해성 및 동물의 성장 속도에 악영향을 준다. 반추 동물의 경우, 이 다당류는 섬유소 섭취의 실질적인 성분을 나타내고, 아라비노자일란의 더욱 완전한 분해(digestion)는 보다 높은 사료 전환 효능을 촉진하게 된다.
자일라나제는 현재 수용성 아라비노자일란의 가수분해를 위한 도우 가공에서 첨가제(도우 컨디셔너)로서 사용된다. 제빵 용도(특히 쿠키 및 크래커 용도)에서, 아라비노자일란은 비스킷 크기의 기계화 및 감소화를 어렵게 하는 끈적한 도우를 생성시킨다. 게다가, 이 탄수화물은 바삭거림을 실추시키고 저장 수명을 감소시키는 제빵 제품의 급속한 재함수와 관련이 있다.
동물 사료에 있어 자일란 분해의 증진은 중요한 탄수화물 및 단백질 사료 영양소의 유용성 및 분해성을 향상시킬 수 있다. 곡류 식이법을 이용한 단위 동물의 사료 용도에서, 아라비노자일란은 장 내용물의 점도에 기여하는 주요 인자이기 때문에, 사료의 분해성 및 동물의 성장 속도에 악영향을 준다. 반추 동물의 경우, 이 다당류는 섬유소 섭취의 실질적인 성분을 나타내고, 아라비노자일란의 더욱 완전한 분해는 보다 높은 사료 전환 효능을 촉진하게 된다. 동물 사료 자일라나제는 동물의 위 내에서 활성적인 것이 바람직하다. 이는 사료 효소가, 37℃에서, 또한 단위 동물의 경우에는 낮은 pH(pH 2 내지 4)에서, 또한 반추 동물의 경우에는 중성 부근의 pH(pH 6.5 내지 7)에서 높은 활성을 가질 것을 요한다. 효소는 또한 동물 장의 자일라나제에 대한 내성, 및 사료 펠릿화와 관련된 고온에서의 안정성을 가져야 한다. 이로써, 당업계에서는 높은 특이적 활성, 35℃ 내지 40℃ 및 pH 2 내지 4에서의 활성, SGF 에서 30분 초과의 반감기 및 제형된 상태에서 85℃에서 5분 초과의 반감기를 가지는 단위동물 사료용 자일라나제 사료 첨가제가 필요하다. 반추동물 사료에서는, 높은 특이적 활성, 35℃ 내지 40℃ 및 pH 6.5 내지 7.0에서의 활성, SRF 에서의 30분 초과의 반감기 및 농축 건조 분말로서의 안정성을 갖는 자일라나제 사료 첨가제가 필요하다.
자일라나제는 또한 수많은 다른 용도들에서도 사용된다. 예를 들어, 자일라나제는 젖소의 우유 단백질 제조에 있어 양질을 향상시키고(예컨대, Kung, L. 등, J. Dairy Science, 2000년 1월, 83: 115-122 참고), 돼지의 위 및 소장에서의 가용성 당류의 양을 증가시키며(예컨대, van der Meulen, J. 등, Arch. Tierernahr,2001 54 : 101-115 참고), 닭의 달걀 생산 효능 및 달걀 수율을 향상시키는데(예컨대, Jaroni, D. 등, Poult. Sci., 1999 June 78: 841-847 참고) 사용된다. 부가적으로, 자일라나제는 화학적 펄프의 생물표백 및 처리(예컨대, U.S. 특허 No. 5,202,249 참고), 목재 또는 종이 펄프의 생물표백 및 처리(예컨대, U.S. 특허 No. 5,179,021, 5,116,746, 5,407,827, 5,405,769, 5,395,765, 5,369,024, 5,457,045, 5,434,071, 5,498,534, 5,591,304, 5,645,686, 5,725,732, 5,759,840, 5,834,301, 5,871,730 및 6,057,438 참고), 목재 내의 리그닌의 감소 및 목재 변형(예컨대, U.S. 특허 No. 5,486,468 및 5,770,012 참고)에 유용하고, 또한 분(flour), 도우 및 빵 향상제로서(예컨대, U.S. 특허 No. 5,108,765 및 5,306,633 참고), 상기 설명된 바와 같은 사료 첨가제 및/또는 보충물로서(예컨대, U.S. 특허 No. 5,432,074, 5,429,828, 5,612,055, 5,720,971, 5,981,233, 5,948,667, 6,099,844, 6,132,727 및 6,132,716) 유용하며, 셀룰로스 용액의 제조(예컨대, U.S. 특허 No. 5,760,211 참고)에 유용한 것으로 나타났다. 자일라나제 활성을 갖는 세제 조성물은 과일, 야채 및/또는 진흙 및 점토 화합물에 유용하다(예컨대, U.S. 특허 No. 5,786, 316 참고).
자일라나제는 또한 콕시듐증의 치료 및/또는 예방 제제를 제조하기 위한, 카르보하이드라제(당질분해효소) 및/또는 자일라나제의 사용 방법 및 조성물에서 유용하다. 제조된 제제는 곡류 기재의 동물 사료의 형태일 수 있다(예컨대, U.S. 특허 No. 5,624,678 참고). 자일라나제의 부가적 용도에는, 수용성 식이 섬유소의 제조(예컨대, U.S. 특허 No. 5,622,738 참고), 전분의 여과성, 분리 및 제조의 향상(예컨대, U.S. 특허 No. 4,960,705 및 5,023,176 참고), 및 음료 산업에서는 맥아즙 또는 맥주의 여과성의 향상(예컨대, U.S. 특허 No. 4,746,517 참고), 효소 조성물에서는 가축의 젖 분비 촉진 및 젖의 품질 향상(예컨대, U.S. 특허 No. 4,144,354 참고), 식물 물질의 점도 감소(예컨대, U.S. 특허 No. 5,874,274), 잼, 마아말레이드, 젤리, 쥬스, 페이스트, 스프, 살사 등과 같은 식품의 점도 또는 겔 강도의 증가(예컨대, U.S. 특허 No. 6,036,981 참고)에서의 용도들이 포함된다. 자일라나제는 또한 특히 셀룰로스의 존재 하에서 그 자일라나제가 선택성을 갖는 헤미셀룰로스의 가수분해에 사용될 수도 있다. 부가적으로, 셀룰라아제 풍부의 농축액(retentate)은 셀룰로스의 가수분해에 적당하다(예컨대, U.S. 특허 No. 4,725,544 참고).
자일라나제의 각종 용도들에는, 에탄올의 제조(예컨대, PCT 출원 No. WO0043496 및 WO8100857 참고), 에탄올을 생성하는 미생물의 형질전환(예컨대, PCT 출원 No. WO99/46362 참고), 포도주양조 탄닌 및 효소계 조성물의 제조(예컨대, PCT 출원 No. WO0164830 참고), 식물의 자연 방어의 자극(예컨대, PCT 출원 No.WO0130161 참고), 헤미셀룰로스 기재로부터의 당 제조(예컨대, PCT 출원 No. WO9203541 참고), 과일, 야채, 진흙 또는 점토 함유 토양의 세정(예컨대, PCT 출원 No. WO9613568 참고), 맥주 여과 막의 세정(예컨대, PCT 출원 No. WO9623579 참고), 미생물 세포의 살생 또는 억제 방법(예컨대, PCT 출원 No. WO9732480 참고) 및 2 가지 UV 흡수 측정값의 비를 이용하여 스펙트럼을 비교함에 의한 목재 펄프 표백으로부터의 가공수의 특성 결정(예컨대, PCT 출원 No. WO9840721 참고)의 용도들이포함된다.
종이 및 펄프 산업에 사용되는 자일라나제에 관해서는, 자일라나제를 많은 원(source)들로부터 분리시켜 왔다. 특히, 이에 대해 U.S. 특허 No. 6,083,733 및 6,140,095 및 6,346,407를 참고로 한다. 특히, U.S. 특허 No. 6,140,095는 알칼리 내성의 자일라나제에 관한 것으로 나타나 있다. 그러나, 당업계에서, 효소가 65℃ 내지 75℃의 온도 범위 및 약 pH 10에서 활성적인 종이 및 펄프 산업에 자일라나제가 사용될 필요가 여전히 있는 것으로 나타나 있다. 부가적으로 종이 및 펄프 산업에서 유용한 본 발명의 효소는 이산화염소와 같은 표백 화학물질의 필요를 감소시킬 것이다.
본원에 논의된 공보들은 본 출원의 출원일 이전에 단지 그 개시 내용만을 위해 제공된 것들이다. 본원에서는 그 어떠한 것도 본원이 종래 발명으로 인해 그와 같은 개시내용을 선행할 수 없도록 하는 승인으로서 간주되지 않도록 한다.
발명의 개요
본 발명은, 적어도 약 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500개, 또는 그 이상의 잔기의 부위 상에서, 본 발명의 예시적 핵산, 예컨대 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19,서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379에 대해, 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%,78%, 79%, 80%, 81%,82%, 83%, 84%, 85%,86%, 87%,88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상, 또는 완전(100%)의 서열 상동성을 갖는 핵산 서열을 포함하는 분리 또는 재조합 핵산으로서, 자일라나제 활성을 갖는 하나 이상의 폴리펩티드를 암호화하는 핵산을 제공하고, 여기에서 서열 상동성은 서열 비교 알고리즘을 이용하는 분석 또는 시각적 조사에 의해 결정된다.
또한 본 발명의 예시적 핵산에는 또한 서열 번호 2, 서열 번호 4, 서열 번호 6, 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18, 서열 번호 20, 서열 번호 22, 서열 번호 24, 서열 번호 26, 서열 번호 28, 서열 번호 30, 서열 번호 32, 서열 번호 34, 서열 번호 36, 서열 번호 38, 서열 번호 40, 서열 번호 42, 서열 번호 44, 서열 번호 46, 서열 번호 48, 서열 번호 50, 서열 번호 52, 서열 번호 54, 서열 번호 56, 서열 번호 58, 서열 번호 60, 서열 번호 62, 서열 번호 64, 서열 번호 66, 서열 번호 68, 서열 번호 70, 서열 번호 72, 서열 번호 74, 서열 번호 76, 서열 번호 78, 서열 번호 80, 서열 번호 82, 서열 번호 84, 서열 번호 86, 서열 번호 88, 서열 번호 90, 서열 번호 92, 서열 번호 94, 서열 번호 96, 서열 번호 98, 서열 번호 100, 서열 번호 102, 서열 번호 104, 서열 번호 106, 서열 번호 108, 서열 번호 110, 서열 번호 112, 서열 번호 114, 서열 번호 116, 서열 번호 118, 서열 번호 120, 서열 번호 122, 서열 번호 124, 서열 번호 126, 서열 번호 128, 서열 번호 130, 서열 번호 132, 서열 번호 134, 서열 번호 136, 서열 번호 138, 서열 번호 140, 서열 번호 142, 서열 번호 144, 서열 번호 146, 서열 번호 148, 서열 번호 150, 서열 번호 152, 서열 번호 154, 서열 번호 156, 서열 번호 158, 서열 번호 160, 서열 번호 162, 서열 번호 164, 서열 번호 166, 서열 번호 168, 서열 번호 170, 서열 번호 172, 서열 번호 174, 서열 번호176, 서열 번호 178, 서열 번호 180, 서열 번호 182, 서열 번호 184, 서열 번호 186, 서열 번호 188, 서열 번호 190, 서열 번호 192, 서열 번호 194, 서열 번호 196, 서열 번호 198, 서열 번호 200, 서열 번호 202, 서열 번호 204, 서열 번호 206, 서열 번호 208, 서열 번호 210, 서열 번호 212, 서열 번호 214, 서열 번호 216, 서열 번호 218, 서열 번호 220, 서열 번호 222, 서열 번호 224, 서열 번호 226, 서열 번호 228, 서열 번호 230, 서열 번호 232, 서열 번호 234, 서열 번호 236, 서열 번호 23 8, 서열 번호 240, 서열 번호 242, 서열 번호 244, 서열 번호 246, 서열 번호 248, 서열 번호 250, 서열 번호 252, 서열 번호 254, 서열 번호 256, 서열 번호 258, 서열 번호 260, 서열 번호 262, 서열 번호 264, 서열 번호 266, 서열 번호 268, 서열 번호 270, 서열 번호 272, 서열 번호 274, 서열 번호 276, 서열 번호 278, 서열 번호 280, 서열 번호 282, 서열 번호 284, 서열 번호 286, 서열 번호 288, 서열 번호 290, 서열 번호 292, 서열 번호 294, 서열 번호 296, 서열 번호 298, 서열 번호 300, 서열 번호 302, 서열 번호 304, 서열 번호 306, 서열 번호 308, 서열 번호 310, 서열 번호 312, 서열 번호 314, 서열 번호 316, 서열 번호 318, 서열 번호 320, 서열 번호 322, 서열 번호 324, 서열 번호 326, 서열 번호 328, 서열 번호 330, 서열 번호 332, 서열 번호 334, 서열 번호 336, 서열 번호 338, 서열 번호 340, 서열 번호 342, 서열 번호 334, 서열 번호 336, 서열 번호 338, 서열 번호 340, 서열 번호 342, 서열 번호 344, 서열 번호 346, 서열 번호 348, 서열 번호 350, 서열 번호 352, 서열 번호 354, 서열 번호 356, 서열 번호 358, 서열 번호 360, 서열 번호 362, 서열 번호 364, 서열 번호366, 서열 번호 368, 서열 번호 370, 서열 번호 372, 서열 번호 374, 서열 번호 376, 서열 번호 378 또는 서열 번호 380에 표시되는 서열, 및 그것의 서브서열을 갖는 폴리펩티드를 암호화하는 분리 또는 재조합 핵산 및 그것의 변이체도 포함된다. 한 측면에서, 폴리펩티드는 자일라나제 활성을 가진다.
한 측면에서, 본 발명은 또한 혼합 배양물로부터 유도된다는 공통된 신규성을 갖는 자일라나제를 암호화하는 핵산을 제공한다. 본 발명은, 적어도 약 50, 75, 100, 150, 200,250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150개 또는 그 이상의 서열 부위 상에서, 본 발명의 예시적 핵산, 예컨대 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 655 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 or 서열 번호 379에 대해, 적어도 약 10, 15, 20, 25, 30, 35, 40, 45, 50%, 51%, 52%,53%, 54%, 55%, 56%, 57%, 58%,59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%,82%, 83%,84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%,94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상, 또는 완전한(100%) 서열 상동성을 갖는 핵산 서열을 포함하는 혼합 배양물로부터 분리된 자일라나제를 암호화하는 핵산을 제공한다.
한 측면에서, 본 발명은 또한 환경적 원(source), 예컨대 혼합된 환경적 원, 박테리아 원 및/또는 원시세균 원으로부터 유도된다는 공통된 신규성을 갖는 자일라나제를 암호화하는 핵산을 제공하며, 이에 대해 표 3을 참고로 한다. 한 측면에서, 본 발명은 환경적 원, 예컨대 혼합된 환경적 원, 박테리아 원 및/또는 원시세균 원으로부터 분리된 자일라나제를 암호화하는 핵산으로서, 적어도 약 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200개 또는 그 이상의 잔기의 부위 상에서, 본 발명의 예시적 핵산에 대해, 적어도 약 10, 15, 20, 25, 30, 35, 40, 45, 50%, 51%, 52%, 53%,54%, 55%, 56%,57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%,66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%,82%, 83%, 84%, 85%, 86%, 87%,88%,89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%,98%, 99%, 또는 그 이상, 또는 완전한(100%) 서열 상동성을 갖는 핵산 서열을 포함하는 핵산을 제공하며, 여기에서 그 핵산은 자일라나제 활성을 갖는 하나 이상의 폴리펩티드를 암호화하고, 서열 상동성은 서열 비교 알고리즘을 이용하는 분석 또는 시각적 조사에 의해 결정된다.
한 측면에서, 본 발명은 또한 공통적인 글리코시다아제 부류, 예컨대 이하 표 5에 나와 있는 부류 5, 6, 8, 10, 11, 26 또는 30으로부터 유도된다는 공통된 신규성을 갖는 자일라나제를 암호화하는 핵산도 제공한다.
한 측면에서, 서열 비교 알고리즘은, 필터링 세팅은 -p blastp -d "nr pataa" -FF로 블라스트값을 설정하고, 다른 모든 옵션은 디폴트값으로 설정하는 BLAST 버전 2.2.2 알고리즘이다.
본 발명의 또 다른 측면은, 본 발명의 핵산 서열, 그와 실질적으로 동일한 서열 및 그것과 상보적인 서열의 10개 이상의 연속 염기들을 포함하는 분리 또는 재조합 핵산이다.
한 측면에서, 자일라나제 활성은 내부 β-l,4-자일로시드계 연결기의 가수분해에서 촉매 작용하는 것을 포함한다. 한 측면에서, 자일라나제 활성은 엔도-1,4-베타-자일라나제 활성을 포함한다.
한 측면에서, 자일라나제 활성은 자일란을 가수분해하여 보다 작은 분자량의 자일로스 및 자일로-올리고머를 생성하는 것을 포함한다. 한 측면에서, 자일란은수용성 아라비노자일란과 같은 아라비노자일란을 포함한다. 수용성 아라비노자일란은 반죽 또는 빵류 제품을 포함할 수 있다.
한 측면에서, 자일라나제 활성은 1,4-β-글리코시드가 연결된 D-자일로피라노즈를 포함하는 다당류를 가수분해하는 것을 포함한다. 한 측면에서, 자일라나제 활성은 헤미셀룰로스를 가수분해하는 것을 포함한다. 한 측면에서, 자일라나제 활성은 목재 또는 종이 펄프 또는 종이 제품에서 헤미셀룰로스를 가수분해하는 것을 포함한다. 한 측면에서, 본 발명은 목재 또는 목재품을 본 발명의 폴리펩티드와 접촉시키는 것을 포함하는 목재 또는 목재품 내의 리그닌을 감소시키는 방법을 제공한다.
한 측면에서, 자일라나제 활성은 음료 또는 사료 또는 식품 내의 자일란의 가수분해에 촉매작용하는 것을 포함한다. 사료 또는 식품은 곡류 기재의 동물 사료, 맥아즙 또는 맥주, 우유 또는 유제품, 과일 또는 야채를 포함할 수 있다. 한 측면에서, 본 발명은 본 발명의 폴리펩티드를 포함하는 식품, 사료 또는 음료 또는 음료 전구체를 제공한다. 식품은 반죽 또는 빵류 제품일 수 있다. 음료 또는 음료 전구체는 맥주 또는 맥아즙일 수 있다.
한 측면에서, 본 발명은 도우의 컨디셔닝에 충분한 조건 하에, 반죽 또는 빵류 제품을 본 발명의 하나 이상의 폴리펩티드와 접촉시키는 것을 포함하는 도우의 컨디셔닝 방법을 제공한다. 한 측면에서, 본 발명은 음료의 점도를 감소시키기에 충분한 조건 하에 음료 또는 음료 전구체에 본 발명의 폴리펩티드를 투여하는 것을 포함하는 음료의 제조 방법을 제공한다.
한 측면에서, 자일라나제 활성은 세포, 예컨대 식물 세포 또는 미생물 세포 내에서의 자일란의 가수분해에 촉매작용하는 것을 포함한다.
한 측면에서, 분리 또는 재조합 핵산은 열안정성의 자일라나제 활성을 갖는 폴리펩티드를 암호화한다. 폴리펩티드는 약 37℃ 내지 약 95℃, 약 55℃ 내지 약 85℃, 약 70℃ 내지 약 95℃, 또는 약 90℃ 내지 약 95℃의 온도 범위를 포함하는 조건 하에서 자일라나제 활성을 가질 수 있다.
또 다른 한 측면에서, 분리 또는 재조합 핵산은 내열성의 자일라나제 활성을 갖는 폴리펩티드를 암호화한다. 폴리펩티드는 37℃초과 내지 약 95℃범위의 온도, 또는 55℃초과 내지 약 85℃의 범위 내 임의의 온도에 노출된 후, 자일라나제 활성을 가질 수 있다. 폴리펩티드는 약 1℃ 내지 약 5℃, 약 5℃ 내지 약 15℃, 약 15℃ 내지 약 25℃, 약 25℃ 내지 약 37℃, 약 37℃ 내지 약 95℃의 범위, 약 55℃ 내지 약 85℃, 약 70℃ 내지 약 75℃, 또는 약 90℃ 내지 약 95℃, 또는 그 이상의 온도에 노출된 후에 자일라나제 활성을 가질 수 있다. 한 측면에서, 폴리펩티드는 pH 4.5에서 90℃초과 내지 약 95℃범위의 온도에 노출된 후, 자일라나제 활성을 보유한다.
본 발명은, 본 발명의 서열, 예컨대 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 2 1, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 13 5, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379에 표시되는 서열, 또는 그것의 절편 또는 서브서열을 포함하는 핵산에 대해 엄격한 조건 하에서 하이브리드화하는 서열을 포함하는 분리 또는 재조합 핵산을 제공한다. 한 측면에서, 핵산은 자일라나제 활성을 갖는 폴리펩티드를 암호화한다. 핵산은 적어도 약 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200개 또는 그 이상 잔기들의 길이, 또는 유전자 또는 전사체의 총길이를 가질 수 있다. 한 측면에서, 엄격한 조건은 약 15분간 약 65℃의 온도에서 0.2X SSC에서의 세척을 포함하는 세척 단계를포함한다.
본 발명은 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산을 동정하기 위한 핵산 프로브로서, 본 발명의 서열, 또는 그것의 절편 또는 서브서열의 적어도 약 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000개 또는 그 이상의 연속 염기를 포함하고, 결합 또는 하이브리드화에 의해 핵산을 동정하는 핵산 프로브를 제공한다. 프로브는 본 발명의 서열, 또는 그것의 절편 또는 서브서열을 포함하는 서열의 적어도 약 10 내지 50, 약 20 내지 60, 약 30 내지 70, 약 40 내지 80, 또는 약 60 내지 100의 연속 염기들을 포함하는 올리고뉴클레오티드를 포함할 수 있다.
본 발명은, 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산을 동정하기 위한 핵산 프로브로서, 본 발명의 핵산에 대해, 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%,69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%,82%,83%, 84%, 85%, 86%,87%,88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%,98%, 99%, 또는 그 이상, 또는 완전한(100%) 서열 상동성을 갖는, 적어도 약 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000개 또는 그 이상의 잔기를 갖는 서열을 포함하는 핵산을 포함하는 프로브를 제공하며, 여기에서 서열 상동성은 서열 비교 알고리즘을 이용하는 분석 또는 시각적 조사에 의해 결정된다.
프로브는 본 발명의 핵산 서열 또는 그것의 서브서열의 적어도 약 10 내지 50, 약 20 내지 60, 약 30 내지 70, 약 40 내지 80, 또는 약 60 내지 100의 연속 염기를 갖는 올리고뉴클레오티드를 포함할 수 있다.
본 발명은 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산을 증폭시키기 위한 증폭 프라이머 쌍으로서, 본 발명의 서열, 또는 그것의 절편을 포함하는 핵산을 증폭시킬 수 있는 증폭 프라이머 쌍을 제공한다. 증폭 프라이머 서열 쌍의 하나 또는 각 원은 서열의 적어도 약 10 내지 50개의 연속 염기, 또는 서열의 약 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30개 또는 그 이상의 연속 염기를 포함하는 올리고뉴클레오티드를 포함할 수 있다.
본 발명은 본 발명의 핵산의 대략 처음의(즉, 5' 말단으로부터) 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30개 또는 그 이상의 잔기에 의해 표시되는 서열을 갖는 제1 원, 및 그 제1 원의 상보 가닥의 대략 처음의(즉, 5' 말단으로부터) 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30개 또는 그 이상의 잔기에 의해 나타나는 서열을 갖는 제2 원을 포함하는 프라이머 쌍을 제공한다.
본 발명은, 본 발명의 증폭 프라이머 쌍을 이용하는, 증폭, 예컨대 폴리머라아제 연쇄 반응(PCR)에 의해 발생되는 자일라나제를 암호화하는 핵산을 제공한다. 본 발명은, 본 발명의 증폭 프라이머 쌍을 이용하는, 증폭, 예컨대 폴리머라아제 연쇄 반응(PCR)에 의해 발생되는 자일라나제를 제공한다. 본 발명은, 본 발명의 증폭 프라이머 쌍을 이용하는, 증폭, 예컨대 폴리머라아제 연쇄 반응(PCR)에 의한 자일라나제의 제조 방법을 제공한다. 한 측면에서, 증폭 프라이머 쌍은 라이브러리, 예컨대 환경적 라이브러리와 같은 유전자 라이브러리로부터 핵산을 증폭시킨다.
본 발명은, 본 발명의 핵산 서열, 또는 그것의 절편 또는 서브서열을 증폭시킬 수 있는 증폭 프라이머 서열 쌍을 이용하여, 주형 핵산을 증폭시키는 것을 포함하는, 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산의 증폭 방법을 제공한다.
본 발명은 본 발명의 핵산 또는 그것의 서브서열을 포함하는 발현 카세트를 제공한다. 한 측면에서, 발현 카세트 는 프로모터에 작동적으로 연결되는 핵산을 포함할 수 있다. 프로모터는 바이러스, 박테리아, 포유동물 또는 식물의 프로모터일 수 있다. 한 측면에서, 식물 프로모터는 감자, 벼, 옥수수, 밀, 담배 또는 보리 프로모터일 수 있다. 프로모터는 구성 프로모터일 수 있다. 구성 프로모터는 CaMV35S를 포함할 수 있다. 또 다른 측면에서, 프로모터는 유도성 프로모터일 수 있다. 한 측면에서, 프로모터는 조직-특이적 프로모터, 또는 환경적 제어 또는 발달적 제어 프로모터일 수 있다. 이에 따라, 프로모터는 예를 들어 씨-, 잎-, 뿌리-, 줄기-특이적 또는 이탈-유도적 프로모터일 수 있다. 한 측면에서, 발현 카세트는 식물 또는 식물 바이러스 발현 벡터를 추가로 포함할 수 있다.
본 발명은 본 발명의 발현 카세트(예컨대, 벡터) 또는 본 발명의 핵산을 포함하는 클로닝 비히클을 제공한다. 클로닝 비히클은 바이러스 벡터, 플라스미드, 파지, 파지미드, 코스미드, 포스미드, 박테리오파지 또는 인공 염색체일 수 있다. 바이러스 벡터는 아데노바이러스 벡터, 레트로바이러스 벡터 또는 아데노-관련 바이러스 벡터를 포함할 수 있다. 클로닝 비히클은 박테리아 인공 염색체(BAC), 플라스미드, 박테리오파지 P-1 유도 벡터(PAC), 효모 인공 염색체(YAC), 또는 포유동물 인공 염색체(MAC)를 포함할 수 있다.
본 발명은 본 발명의 핵산 또는 본 발명의 발현 카세트(예컨대, 벡터) 또는 본 발명의 클로닝 비히클을 포함하는 형질전환된 세포를 제공한다. 한 측면에서, 형질전환된 세포는 박테리아 세포, 포유동물 세포, 진균류 세포, 효모 세포, 곤충 세포 또는 식물 세포일 수 있다. 한 측면에서, 식물 세포는 곡류, 감자, 밀, 벼, 옥수수, 담배 또는 보리 세포일 수 있다.
본 발명은 본 발명의 핵산 또는 본 발명의 발현 카세트(예컨대, 벡터)를 포함하는 유전자이식 비인간 동물을 제공한다. 한 측면에서, 동물은 마우스이다.
본 발명은 본 발명의 핵산 본 발명의 발현 카세트(예컨대, 벡터)를 포함하는 유전자이식 식물을 제공한다. 유전자이식 식물은 곡류 식물, 옥수수 식물, 감자 식물, 토마토 식물, 밀 식물, 유종자 식물, 평지씨 식물, 대두 식물, 벼 식물, 보리 식물 또는 담배 식물일 수 있다.
본 발명은 본 발명의 핵산 본 발명의 발현 카세트(예컨대, 벡터)를 포함하는 유전자이식 씨를 제공한다. 유전자이식 씨는 곡류 식물, 옥수수 씨, 밀 커넬(낟알), 유종자, 평지씨, 대두 씨, 팜 커넬, 해바라기 씨, 참깨 씨, 땅콩 또는 담배 식물 씨일 수 있다.
본 발명은 본 발명의 핵산에 대해 상보적이거나 그것에 대해 엄격한 조건 하에 하이브리드화할 수 있는 핵산 서열을 포함하는 안티센스 올리고뉴클레오티드를제공한다. 본 발명은 본 발명의 핵산에 대해 상보적이거나 그것에 대해 엄격한 조건 하에 하이브리드화할 수 있는 핵산 서열을 포함하는 안티센스 올리고뉴클레오티드를 세포에 투여하거나 그것을 세포 내에서 발현시키는 것을 포함하는, 세포 내의 자일라나제 메시지의 번역을 억제하는 방법을 제공한다. 한 측면에서, 안티센스 올리고뉴클레오티드는 약 10 내지 50개, 약 20 내지 60개, 약 30 내지 70개, 약 40 내지 80개, 또는 약 60 내지 100개의 염기의 길이를 가질 수 있다.
본 발명은 본 발명의 핵산에 대해 상보적이거나 그것에 대해 엄격한 조건 하에 하이브리드화할 수 있는 핵산 서열을 포함하는 안티센스 올리고뉴클레오티드를 세포에 투여하거나 그것을 세포 내에서 발현시키는 것을 포함하는, 세포 내의 자일라나제 메시지의 번역을 억제하는 방법을 제공한다. 본 발명은 본 발명의 서열의 서브서열을 포함하는 이중가닥의 억제 RNA(RNAi) 분자를 제공한다. 한 측면에서, RNAi은 약 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25개 또는 그 이상의 이중구조 뉴클레오티드의 길이를 가진다. 본 발명은 이중가닥의 억제 RNA(iRNA)를 세포에 투여하거나, 그것을 세포 내에서 발현시키는 것을 포함하는, 세포 내의 자일라나제의 발현을 억제하는 방법을 제공하며, 여기에서 RNA는 본 발명의 서열의 서브서열을 포함한다.
본 발명은 적어도 약 25, 50, 75, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350개 또는 그 이상의 잔기의 부위 상에서, 또는 폴리펩티드의 전체 길이 상에서, 본 발명의 예시적 폴리펩티드 또는 펩티드에 대해, 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%,66%, 67%, 68%,69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상, 또는 완전한(100%) 서열 상동성을 갖는 아미노산 서열을 포함하는 분리 또는 재조합 폴리펩티드를 제공하며, 서열 상동성은 서열 비교 알고리즘을 이용하는 분석 또는 시각적 조사에 의해 결정된다. 본 발명의 예시적 폴리펩티드 또는 펩티드 서열에는, 서열 번호 2, 서열 번호 4, 서열 번호 6, 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18, 서열 번호 20, 서열 번호 22, 서열 번호 24, 서열 번호 26, 서열 번호 28, 서열 번호 30, 서열 번호 32, 서열 번호 34, 서열 번호 36, 서열 번호 38, 서열 번호 40, 서열 번호 42, 서열 번호 44, 서열 번호 46, 서열 번호 48, 서열 번호 50, 서열 번호 52, 서열 번호 54, 서열 번호 56, 서열 번호 58, 서열 번호 60, 서열 번호 62, 서열 번호 64, 서열 번호 66, 서열 번호 68, 서열 번호 70, 서열 번호 72, 서열 번호 74, 서열 번호 76, 서열 번호 78, 서열 번호 80, 서열 번호 82, 서열 번호 84, 서열 번호 86, 서열 번호 88, 서열 번호 90, 서열 번호 92, 서열 번호 94, 서열 번호 96, 서열 번호 98, 서열 번호 100, 서열 번호 102, 서열 번호 104, 서열 번호 106, 서열 번호 108, 서열 번호 110, 서열 번호 112, 서열 번호 114, 서열 번호 116, 서열 번호 118, 서열 번호 120, 서열 번호 122, 서열 번호 124, 서열 번호 126, 서열 번호 128, 서열 번호 130, 서열 번호 132, 서열 번호 134, 서열 번호 136, 서열 번호 138, 서열 번호 140, 서열 번호 142, 서열 번호 144, 서열 번호 146, 서열 번호 148, 서열 번호 150, 서열 번호 152, 서열 번호 154, 서열 번호156, 서열 번호 158, 서열 번호 160, 서열 번호 162, 서열 번호 164, 서열 번호 166, 서열 번호 168, 서열 번호 170, 서열 번호 172, 서열 번호 174, 서열 번호 176, 서열 번호 178, 서열 번호 180, 서열 번호 182, 서열 번호 184, 서열 번호 186, 서열 번호 188, 서열 번호 190, 서열 번호 192, 서열 번호 194, 서열 번호 196, 서열 번호 198, 서열 번호 200, 서열 번호 202, 서열 번호 204, 서열 번호 206, 서열 번호 208, 서열 번호 210, 서열 번호 212, 서열 번호 214, 서열 번호 216, 서열 번호 218, 서열 번호 220, 서열 번호 222, 서열 번호 224, 서열 번호 226, 서열 번호 228, 서열 번호 230, 서열 번호 232, 서열 번호 234, 서열 번호 236, 서열 번호 238, 서열 번호 240, 서열 번호 242, 서열 번호 244, 서열 번호 246, 서열 번호 248, 서열 번호 250, 서열 번호 252, 서열 번호 254, 서열 번호 256, 서열 번호 258, 서열 번호 260, 서열 번호 262, 서열 번호 264, 서열 번호 266, 서열 번호 268, 서열 번호 270, 서열 번호 272, 서열 번호 274, 서열 번호 276, 서열 번호 278, 서열 번호 280, 서열 번호 282, 서열 번호 284, 서열 번호 286, 서열 번호 288, 서열 번호 290, 서열 번호 292, 서열 번호 294, 서열 번호 296, 서열 번호 298, 서열 번호 300, 서열 번호 302, 서열 번호 304, 서열 번호 306, 서열 번호 308, 서열 번호 310, 서열 번호 312, 서열 번호 314, 서열 번호 316, 서열 번호 318, 서열 번호 320, 서열 번호 322, 서열 번호 324, 서열 번호 326, 서열 번호 328, 서열 번호 330, 서열 번호 332, 서열 번호 334, 서열 번호 336, 서열 번호 338, 서열 번호 340, 서열 번호 342, 서열 번호 344, 서열 번호 346, 서열 번호 348, 서열 번호 350, 서열 번호 352, 서열 번호 354, 서열 번호356, 서열 번호 358, 서열 번호 360, 서열 번호 362, 서열 번호 364, 서열 번호 366, 서열 번호 368, 서열 번호 370, 서열 번호 372, 서열 번호 374, 서열 번호 376, 서열 번호 378 또는 서열 번호 380, 및 그것의 서브서열 및 그것의 변이체가 포함된다. 예시적 폴리펩티드에는 또한 적어도 약 10,15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600개 또는 그 이상의 잔기들의 길이, 또는 효소의 총길이를 갖는 절편이 포함된다. 본 발명의 예시적 폴리펩티드 또는 펩티드 서열에는 본 발명의 핵산에 의해 암호화된 서열이 포함된다. 본 발명의 예시적 폴리펩티드 또는 펩티드 서열에는 본 발명의 항체에 의해 특이적으로 결합된 폴리펩티드 또는 펩티드가 포함된다. 한 측면에서, 본 발명의 폴리펩티드는 하나 이상의 자일라나제 활성을 가진다.
본 발명의 또 다른 측면은, 본 발명의 폴리펩티드 또는 펩티드 서열, 그것과 실질적으로 동일한 서열, 및 그것과 상보적인 서열의 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 100개, 또는 그 이상의 연속 염기를 포함하는 분리 또는 재조합 폴리펩티드 또는 펩티드를 제공한다. 펩티드는 예컨대 면역원성 절편, 모티브(예컨대, 결합 부위), 시그널 서열, 프리프로 서열 또는 활성 부위일 수 있다.
본 발명은 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 서열, 및 시그널 서열을 포함하는 분리 또는 재조합 핵산으로서, 본 발명의 서열을 포함하는 핵산을 제공한다. 시그널 서열은 또 다른 자일라나제 또는 비-자일라나제(이종) 효소로부터 유도될 수 있다. 본 발명은 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 서열을 포함하는 분리 또는 재조합 핵산으로서, 서열이 시그널 서열을 함유하지 않고 핵산이 본 발명의 서열을 포함하는 분리 또는 재조합 핵산을 제공한다.
한 측면에서, 자일라나제 활성은 내부 β-1,4-자일로시드계 연결기의 가수분해에서 촉매 작용하는 것을 포함한다. 한 측면에서, 자일라나제 활성은 엔도-1,4-베타-자일라나제 활성을 포함한다. 한 측면에서, 자일라나제 활성은 자일란을 가수분해하여, 보다 작은 분자량의 자일로스 및 자일로-올리고머를 생성시키는 것을 포함한다. 한 측면에서, 자일란은 수용성 아라비노자일란과 같은 아라비노자일란을 포함한다. 수용성 아라비노자일란은 반죽 또는 빵류 제품을 포함할 수 있다.
한 측면에서, 자일라나제 활성은 1,4-β-글리코시드가 연결된 D-자일로피라노즈를 포함하는 다당류의 가수분해를 포함한다. 한 측면에서, 자일라나제 활성은 헤미셀룰로스의 가수분해를 포함한다. 한 측면에서, 자일라나제 활성은 목재 또는 종이 펄프 또는 종이 제품 내의 헤미셀룰로스의 가수분해를 포함한다.
한 측면에서, 자일라나제 활성은 사료 또는 식품 내의 자일란의 가수분해에 촉매작용하는 것을 포함한다. 사료 또는 식품은 곡류 기재의 동물 사료, 맥아즙 또는 맥주, 우유 또는 유제품, 과일 또는 야채를 포함할 수 있다.
한 측면에서, 자일라나제 활성은 세포, 예컨대 식물 세포 또는 미생물 세포에 내의 자일란의 가수분해에 촉매작용하는 것을 포함한다.
한 측면에서, 자일라나제 활성은 열 안정성을 가진다. 폴리펩티드는 약 1℃ 내지 약 5℃, 약 5℃ 내지 약 15℃, 약 15℃ 내지 약 25℃, 약 25℃ 내지 약 37℃, 약 37℃ 내지 약 95℃, 약 55℃ 내지 약 85℃, 약 70℃ 내지 약 75℃, 또는 약 90℃ 내지 약 95℃, 또는 그 이상의 온도 범위를 포함하는 조건 하에서 자일라나제 활성을 보유할 수 있다. 또 다른 한 측면에서, 자일라나제 활성 내열성을 가질 수 있다. 폴리펩티드는 37℃초과 내지 약 95℃, 또는 55℃초과 내지 약 85℃범위의 온도에 노출된 후에 자일라나제 활성을 보유할 수 있다. 한 측면에서, 폴리펩티드는 pH 4.5에서 90℃초과 내지 약 95℃범위의 온도에 노출된 후에 자일라나제 활성을 보유할 수 있다.
한 측면에서, 분리 또는 재조합 폴리펩티드는 시그널 서열이 결여된 본 발명의 폴리펩티드를 포함할 수 있다. 한 측면에서, 분리 또는 재조합 폴리펩티드는 이종 자일라나제 또는 비-자일라나제 시그널 서열과 같은 이종 시그널 서열을 포함하는 본 발명의 폴리펩티드를 포함할 수 있다.
한 측면에서, 본 발명은 본 발명의 시그널 서열을 포함하는 제1 도메인 및 적어도 제2 도메인을 포함하는 키메라 단백질을 제공한다. 그 단백질은 융합 단백질일 수 있다. 제2 도메인은 효소를 포함할 수 있다. 효소는 자일라나제일 수 있다.
본 발명은 본 발명의 신호 펩티드(SP), 프리프로 서열 및/또는 촉매적 도메인(CD)을 포함하는 제1 도메인, 및 이종 폴리펩티드 또는 펩티드를 포함하는 적어도 제2 도메인을 포함하는 키메라 폴리펩티드로서, 상기 이종 폴리펩티드 또는 펩티드가 신호 펩티드(SP), 프리프로 서열 및/또는 촉매적 도메인(CD) 과 본래 연합되지 않는 키메라 폴리펩티드를 제공한다. 한 측면에서, 이종 폴리펩티드 또는 펩티드는 자일라나제가 아니다. 이종 폴리펩티드 또는 펩티드는 신호 펩티드(SP), 프리프로 서열 및/또는 촉매적 도메인(CD)의 양 말단에 있거나, 그에 대해 아미노 말단 또는 카르복시 말단일 수 있다.
본 발명은 키메라 폴리펩티드를 암호화하는 분리 또는 재조합 핵산으로서, 키메라 폴리펩티드가 본 발명의 신호 펩티드(SP), 프리프로 서열 및/또는 촉매적 도메인(CD)을 포함하는 제1 도메인, 및 이종 폴리펩티드 또는 펩티드를 포함하는 적어도 제2 도메인을 포함하고, 이종 폴리펩티드 또는 펩티드가 신호 펩티드(SP), 프리프로 서열 및/또는 촉매적 도메인(CD) 과 본래 연합되지 않는 분리 또는 재조합 핵산을 제공한다.
본 발명은 본 발명의 폴리펩티드의 잔기 1 내지 14, 1 내지 15, 1 내지 16, 1 내지 17, 1 내지 18, 1 내지 19, 1 내지 20, 1 내지 21, 1 내지 22, 1 내지 23, 1 내지 24, 1 내지 25, 1 내지 26, 1 내지 27, 1 내지 28, 1 내지 28, 1 내지 30, 1 내지 31, 1 내지 32, 1 내지 33, 1 내지 34, 1 내지 35, 1 내지 36, 1 내지 37, 1 내지 38, 1 내지 40, 1 내지 41, 1 내지 42, 1 내지 43 또는 1 내지 44에 표시되는 서열, 예컨대, 서열 번호 2, 서열 번호 4, 서열 번호 6, 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18, 서열 번호 20, 서열 번호 22, 서열 번호 24, 서열 번호 26, 서열 번호 28, 서열 번호 30, 서열 번호 32, 서열 번호 34, 서열 번호 36, 서열 번호 38, 서열 번호 40, 서열 번호 42, 서열 번호 44, 서열 번호 46, 서열 번호 48, 서열 번호 50, 서열 번호 52, 서열 번호 54, 서열 번호 56, 서열 번호 58, 서열 번호 60, 서열 번호 62, 서열 번호 64, 서열 번호 66, 서열 번호 68, 서열 번호 70, 서열 번호 72, 서열 번호 74, 서열 번호 76, 서열 번호 78, 서열 번호 80, 서열 번호 82, 서열 번호 84, 서열 번호 86, 서열 번호 88, 서열 번호 90, 서열 번호 92, 서열 번호 94, 서열 번호 96, 서열 번호 98, 서열 번호 100, 서열 번호 102, 서열 번호 104, 서열 번호 106, 서열 번호 108, 서열 번호 110, 서열 번호 112, 서열 번호 114, 서열 번호 116, 서열 번호 118, 서열 번호 120, 서열 번호 122, 서열 번호 124, 서열 번호 126, 서열 번호 128, 서열 번호 130, 서열 번호 132, 서열 번호 134, 서열 번호 136, 서열 번호 138, 서열 번호 140, 서열 번호 142, 서열 번호 144, 서열 번호 146, 서열 번호 148, 서열 번호 150, 서열 번호 152, 서열 번호 154, 서열 번호 156, 서열 번호 158, 서열 번호 160, 서열 번호 162, 서열 번호 164, 서열 번호 166, 서열 번호 168, 서열 번호 170, 서열 번호 172, 서열 번호 174, 서열 번호 176, 서열 번호 178, 서열 번호 180, 서열 번호 182, 서열 번호 184, 서열 번호 186, 서열 번호 188, 서열 번호 190, 서열 번호 192, 서열 번호 194, 서열 번호 196, 서열 번호 198, 서열 번호 200, 서열 번호 202, 서열 번호 204, 서열 번호 206, 서열 번호 208, 서열 번호 210, 서열 번호 212, 서열 번호 214, 서열 번호 216, 서열 번호 218, 서열 번호 220, 서열 번호 222, 서열 번호 224, 서열 번호 226, 서열 번호 228, 서열 번호 230, 서열 번호 232, 서열 번호 234, 서열 번호 236, 서열 번호 238, 서열 번호 240, 서열 번호 242, 서열 번호 244, 서열 번호 246, 서열 번호 248, 서열 번호 250, 서열 번호 252, 서열 번호 254, 서열 번호 256, 서열 번호 258, 서열 번호 260, 서열 번호 262, 서열 번호 264, 서열 번호 266, 서열 번호 268, 서열 번호 270, 서열 번호 272, 서열 번호 274, 서열 번호 276, 서열 번호278, 서열 번호 280, 서열 번호 282, 서열 번호 284, 서열 번호 286, 서열 번호 288, 서열 번호 290, 서열 번호 292, 서열 번호 294, 서열 번호 296, 서열 번호 298, 서열 번호 300, 서열 번호 302, 서열 번호 304, 서열 번호 306, 서열 번호 308, 서열 번호 310, 서열 번호 312, 서열 번호 314, 서열 번호 316, 서열 번호 318, 서열 번호 320, 서열 번호 322, 서열 번호 324, 서열 번호 326, 서열 번호 328, 서열 번호 330, 서열 번호 332, 서열 번호 334, 서열 번호 336, 서열 번호 338, 서열 번호 340, 서열 번호 342, 서열 번호 344, 서열 번호 346, 서열 번호 348, 서열 번호 350, 서열 번호 352, 서열 번호 354, 서열 번호 356, 서열 번호 358, 서열 번호 360, 서열 번호 362, 서열 번호 364, 서열 번호 366, 서열 번호 368, 서열 번호 370, 서열 번호 372, 서열 번호 374, 서열 번호 376, 서열 번호 378 또는 서열 번호 380으로 구성된 분리 또는 재조합 시그널 서열(예컨대, 신호 펩티드)을 제공한다.
한 측면에서, 자일라나제 활성은 약 37℃에서 약 1 내지 약 1200 단위/단백질 mg 범위, 또는 약 100 내지 약 1000 단위/단백질 mg 범위의 특이적 활성을 포함한다. 또 다른 한 측면에서, 자일라나제 활성은 약 100 내지 약 1000 단위/단백질 mg 범위, 또는 약 500 내지 약 750 단위/단백질 mg 범위의 특이적 활성을 포함한다. 대안적으로, 자일라나제 활성은 37℃에서 약 1 내지 약 750 단위/단백질 mg 범위, 또는 약 500 내지 약 1200 단위/단백질 mg 범위의 특이적 활성을 포함한다. 한 측면에서, 자일라나제 활성은 37℃에서 약 1 내지 약 500 단위/단백질 mg 범위, 또는 약 750 내지 약 1000 단위/단백질 mg 범위의 특이적 활성을 포함한다. 또 다른한 측면에서, 자일라나제 활성은 37℃에서 약 1 내지 약 250 단위/단백질 mg 범위의 특이적 활성을 포함한다. 대안적으로, 자일라나제 활성은 약 37℃에서 약 1 내지 약 100 단위/단백질 mg 범위의 특이적 활성을 포함한다. 또 다른 한 측면에서, 내열성은 승온으로 가열된 후에, 37℃에서 자일라나제의 특이적 활성의 반 이상을 보유하는 것을 포함한다. 대안적으로, 내열성은 승온으로 가열된 후에, 37℃에서 약 1 내지 약 1200 단위/단백질 mg 범위, 또는 약 500 내지 약 1000 단위/단백질 mg 범위의 특이적 활성을 보유하는 것을 포함할 수 있다. 또 다른 한 측면에서, 내열성은 승온으로 가열된 후에, 37℃에서 약 1 내지 약 500 단위/단백질 mg 범위의 특이적 활성을 보유하는 것을 포함할 수 있다.
본 발명은 하나 이상의 글리코실화 부위를 포함하는 본 발명의 분리 또는 재조합 폴리펩티드를 제공한다. 한 측면에서, 글리코실화는 N-연결의 글리코실화일 수 있다. 한 측면에서, 폴리펩티드는P. 파스토리스(pastoris)또는S. 폼베(pombe)에서 발현된 후에 글리코실화될 수 있다.
한 측면에서, 폴리펩티드는 약 pH 6.5, pH 6, pH 5.5, pH 5, pH 4.5 또는 pH 4를 포함하는 조건 하에서 자일라나제 활성을 보유할 수 있다. 또 다른 한 측면에서, 폴리펩티드는 약 pH 7, pH 7.5, pH 8.0, pH 8.5, pH 9, pH 9.5, pH 10, pH 10.5 또는 pH 11을 포함하는 조건 하에서, 자일라나제 활성을 보유할 수 있다. 한 측면에서, 폴리펩티드는 약 pH 6.5, pH 6, pH 5.5, pH 5, pH 4.5 또는 pH 4를 포함하는 조건에 노출된 후에, 자일라나제 활성을 보유할 수 있다. 또 다른 한 측면에서, 폴리펩티드는 약 pH 7, pH 7.5, pH 8.0, pH 8.5, pH 9, pH 9.5, pH 10, pH10.5 또는 pH 11을 포함하는 조건에 노출된 후에, 자일라나제 활성을 보유할 수 있다.
본 발명은 본 발명의 폴리펩티드를 포함하는 단백질 제제로서, 액체, 고체 또는 겔을 포함하는 단백질 제제를 제공한다.
본 발명은 본 발명의 폴리펩티드 및 제2 단백질 또는 도메인을 포함하는 이종이량체를 제공한다. 이종이량체의 제2 원은 상이한 인지질분해효소, 상이한 효소 또는 또 다른 단백질일 수 있다. 한 측면에서, 제2 도메인은 폴리펩티드일 수 있고, 이종이량체는 융합 단백질일 수 있다. 한 측면에서, 제2 도메인은 동위원소 또는 표지일 수 있다. 한 측면에서, 본 발명은 본 발명의 폴리펩티드를 포함하는 동종이량체를 제공한다.
본 발명은 자일라나제 활성을 갖는 고정화 폴리펩티드로서, 본 발명의 폴리펩티드, 본 발명의 핵산에 의해 암호화되는 폴리펩티드 또는 본 발명의 폴리펩티드를 포함하는 폴리펩티드, 및 제 도메인을 포함하는 고정화 폴리펩티드를 제공한다. 한 측면에서, 폴리펩티드는 세포, 금속, 수지, 중합체, 세라믹, 유리, 미세전극, 흑연 전극, 비이드, 겔, 플레이트, 어레이 또는 모세관 상에 고정화될 수 있다.
본 발명은 본 발명의 고정화 핵산을 포함하는 어레이를 제공한다. 본 발명은 본 발명의 항체를 포함하는 어레이를 제공한다.
본 발명은 본 발명의 폴리펩티드 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드에 특이적으로 결합하는 분리 또는 재조합 항체를 제공한다. 항체는 단일클론 또는 다중클론 항체일 수 있다. 본 발명은 본 발명의 항체, 예컨대 본 발명의폴리펩티드 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드에 특이적으로 결합하는 항체를 포함하는 하이브리도마를 제공한다.
본 발명은 하기 단계들을 포함하는, 자일라나제 활성을 갖는 폴리펩티드의 분리 또는 동정 방법을 제공한다:
(a) 본 발명의 항체를 제공하는 단계;
(b) 폴리펩티드를 포함하는 샘플을 제공하는 단계; 및
(c) 항체가 폴리펩티드에 특이적으로 결합할 수 있는 조건 하에, 단계(b)의 샘플과 단계(a)의 항체를 접촉시킴으로써, 자일라나제 활성을 갖는 폴리펩티드를 분리 또는 동정하는 단계.
본 발명은 체액성 면역 반응을 일으키기에 충분한 양의 본 발명의 핵산 또는 본 발명의 폴리펩티드 또는 그것의 서브서열을 비인간 동물에게 투여함으로써, 안티-자일라나제 항체를 제조하는 것을 포함하는, 안티-자일라나제 항체의 제조 방법을 제공한다. 본 발명은 면역 반응을 일으키기에 충분한 양의 본 발명의 핵산 또는 본 발명의 폴리펩티드 또는 그것의 서브서열을 비인간 동물에게 투여하는 것을 포함하는, 안티-자일라나제 면역의 제조 방법을 제공한다.
본 발명은 하기 단계들을 포함하는, 재조합 폴리펩티드의 제조 방법을 제공한다:
(a) 프로모터에 작동적으로 연결된 본 발명의 핵산을 제공하는 단계; 및
(b) 폴리펩티드의 발현을 허용하는 조건 하에서 단계(a)의 핵산을 발현시킴으로써, 재조합 폴리펩티드를 제조하는 단계. 한 측면에서, 본 방법은 숙주 세포를단계(a)의 핵산으로 형질변환시킨 후, 단계(a)의 핵산을 발현시킴으로써, 형질전환된 세포 내의 재조합 폴리펩티드를 제조함을 추가로 포함할 수 있다.
본 발명은 하기 단계들을 포함하는, 자일라나제 활성을 갖는 폴리펩티드의 동정 방법을 제공한다:
(a) 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 제공하는 단계;
(b) 자일라나제 기질을 제공하는 단계; 및
(c) 단계(a)의 폴리펩티드 또는 그것의 변이체를 단계(b)의 기질과 접촉시키고, 기질의 양의 감소 또는 반응 생성물의 양의 증가를 탐지하는 단계(여기에서, 기질의 양의 감소 또는 반응 생성물의 양의 증가는 자일라나제 활성을 갖는 폴리펩티드를 탐지함).
본 발명은 하기 단계들을 포함하는, 자일라나제 기질의 동정 방법을 제공한다:
(a) 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 제공하는 단계;
(b) 테스트 기질을 제공하는 단계; 및
(c) 단계(a)의 폴리펩티드와 단계(b)의 테스트 기질을 접촉시키고, 기질의 양의 감소 또는 반응 생성물의 양의 증가를 탐지하는 단계(여기에서, 기질의 양의 감소 또는 반응 생성물의 양의 증가 자일라나제 활성을 갖는 자일라나제 기질로서의 테스트 기질을 탐지함).
본 발명은 하기 단계들을 포함하는, 시험 화합물이 폴리펩티드에 특이적으로 결합하는지의 여부를 결정하는 방법을 제공한다:
(a) 핵산이 폴리펩티드로 번역되는 것을 허용하는 조건 하에, 핵산, 또는 핵산을 포함하는 벡터를 발현시킴(여기에서, 핵산은 본 발명의 핵산을 포함함), 또는 본 발명의 폴리펩티드를 제공하는 단계;
(b) 시험 화합물을 제공하는 단계;
(c) 폴리펩티드와 시험 화합물을 접촉시키는 단계; 및
(d) 단계(b)의 시험 화합물이 폴리펩티드에 특이적으로 결합하는지의 여부를 결정하는 단계.
본 발명은 하기 단계들을 포함하는, 자일라나제 활성의 조절자의 동정 방법을 제공한다:
(a) 본 발명의 폴리펩티드 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 제공하는 단계;
(b) 시험 화합물을 제공하는 단계;
(c) 단계(a)의 폴리펩티드와 단계(b)의 시험 화합물을 접촉시키고, 자일라나제의 활성을 측정하는 단계(여기에서, 시험 화합물의 부재 하에서와 대비하여, 시험 화합물의 존재 하에 측정된 자일라나제 활성의 변화는 시험 화합물이 자일라나제 활성을 조절한다는 결정을 제공함). 한 측면에서, 자일라나제 활성은 자일라나제 기질을 제공하고, 기질 양의 감소 또는 반응 생성물의 양의 증가, 또는 기질의 양의 증가 또는 반응 생성물의 양의 감소를 탐지함으로써 측정될 수 있다. 시험 화합물의 부재 하에서의 기질 또는 반응 생성물의 양과 대비하여, 시험 화합물의 존재 하에서의 기질 양의 감소 또는 반응 생성물의 양의 증가는 자일라나제 활성의 활성화제로서 시험 화합물을 동정한다. 시험 화합물의 부재 하에서의 기질 또는 반응 생성물의 양과 대비하여, 시험 화합물의 존재 하에서의 기질의 양의 증가 또는 반응 생성물의 양의 감소는 자일라나제 활성의 억제제로서 시험 화합물을 동정한다.
본 발명은 프로세서 및 데이터 저장 장치를 포함하는 컴퓨터 시스템으로서, 상기 데이터 저장 장치가 본 발명의 폴리펩티드 서열 또는 핵산 서열(예컨대, 본 발명의 핵산에 의해 암호화되는 폴리펩티드)을 저장하고 있는 컴퓨터 시스템을 제공한다. 한 측면에서, 컴퓨터 시스템은 서열 비교 알고리즘, 및 하나 이상의 참조 서열을 저장하고 있는 데이터 저장 장치를 추가로 포함할 수 있다. 또 다른 한 측면에서, 서열 비교 알고리즘은 다형성을 지적하는 컴퓨터 시스템을 포함한다. 한 측면에서, 컴퓨터 시스템은 상기 서열 내의 하나 이상의 특징(feature)을 확인하는 확인자를 추가로 포함할 수 있다. 본 발명은 본 발명의 폴리펩티드 서열 또는 핵산 서열을 저장하고 있는 컴퓨터 판독가능 매체를 제공한다. 본 발명은 하기 단계들을 포함하는 서열 내의 특징을 동정하는 방법을 제공한다:
(a) 서열 내의 하나 이상의 특징을 동정하는 컴퓨터 프로그램을 이용하여 서열을 판독하는 단계(여기에서, 서열은 본 발명의 폴리펩티드 서열 또는 핵산 서열을 포함함); 및
(b) 서열 내의 하나 이상의 특징을 컴퓨터 프로그램으로 확인하는 단계.
본 발명은 하기 단계들을 포함하는, 제1 서열 및 제2 서열을 비교하는 방법을 제공한다:
(a) 서열을 비교하는 컴퓨터 프로그램을 이용하여 제1 서열 및 제2 서열을 판독하는 단계(여기에서, 제1 서열은 본 발명의 폴리펩티드 서열 또는 핵산 서열을 포함함); 및
(b) 컴퓨터 프로그램을 이용하여 제1 서열 및 제2 서열 간의 차이를 결정하는 단계. 제1 서열 및 제2 서열 간의 차이를 결정하는 단계는 다형태를 동정하는 단계를 추가로 포함할 수 있다. 한 측면에서, 본 방법은 서열 내의 하나 이상의 특징을 동정하는 확인자를 추가로 포함할 수 있다. 또 다른 한 측면에서, 본 방법은 컴퓨터 프로그램을 이용하여 제1 서열을 읽고, 서열 내의 하나 이상의 특징을 동정하는 것을 포함할 수 있다.
본 발명은 하기 단계들을 포함하는, 환경적 샘플로부터 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산을 분리 또는 회수하기 위한 방법을 제공한다:
(a) 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산을 증폭시키기 위한 증폭 프라이머 서열 쌍을 제공하는 단계(여기에서, 프라이머 쌍은 본 발명의 핵산을 증폭시킬 수 있음);
(b) 환경적 샘플로부터 핵산을 분리하거나, 환경적 샘플을 샘플 내의 핵산이 증폭 프라이머 쌍에 대해 하이브리드화되기 용이하도록 처리하는 단계; 및
(c) 단계(b)의 핵산을 단계(a)의 증폭 프라이머 쌍과 조합하고, 환경적 샘플로부터 핵산을 증폭시킴으로써, 환경적 샘플로부터 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산을 분리 또는 회수하는 단계. 증폭 프라이머 서열 쌍의 하나 또는 각 원은 본 발명의 서열의 적어도 약 10 내지 50개의 연속 염기들을 갖는 올리고뉴클레오티드를 포함할 수 있다. 한 측면에서, 증폭 프라이머 서열 쌍은 본 발명의 증폭 쌍이다.
본 발명은 하기 단계들을 포함하는, 환경적 샘플로부터 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산을 분리 또는 회수하기 위한 방법을 제공한다:
(a) 본 발명의 핵산 또는 그것의 서브서열을 포함하는 폴리뉴클레오티드 프로브를 제공하는 단계;
(b) 환경적 샘플로부터 핵산을 분리하거나, 환경적 샘플을 샘플 내의 핵산이 단계(a)의 폴리뉴클레오티드 프로브에 대해 하이브리드화되기 용이하도록 처리하는 단계;
(c) 단계(b)의 분리된 핵산 또는 처리된 환경적 샘플을 단계(a)의 폴리뉴클레오티드 프로브와 조합하는 단계; 및
(d) 단계(a)의 폴리뉴클레오티드 프로브와 특이적으로 하이브리드화하는 핵산을 분리함으로써, 환경적 샘플로부터 핵산을 증폭시킴으로써, 환경적 샘플로부터 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산을 분리 또는 회수하는 단계. 환경적 샘플에는 물 샘플, 액체 샘플, 토양 샘플, 공기 샘플 또는 생물학적 샘플이 포함될 수 있다. 한 측면에서, 생물학적 샘플은 박테리아 세포, 원생동물문 세포, 곤충 세포, 효모 세포, 식물 세포, 진균류 세포 또는 포유동물 세포로부터 유도될 수 있다.
본 발명은 하기 단계들을 포함하는, 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산의 변이체를 발생시키는 방법을 제공한다:
(a) 본 발명의 핵산을 포함하는 주형 핵산을 제공하는 단계; 및
(b) 주형 서열 또는 그것의 조합물에서의 하나 이상의 뉴클레오티드를 변형, 결실 또는 부가하여, 주형 핵산의 변이체를 발생시키는 단계. 한 측면에서, 본 방법은 변이체 핵산을 발현시켜, 변이체 자일라나제 폴리펩티드를 발생시키는 것을 추가로 포함할 수 있다. 변형, 부가 또는 결실은 에러프론(error-prone) PCR, 셔플링, 올리고뉴클레오티드-지정 돌연변이, 어셈블리 PCR, 성별 PCR 돌연변이, 생체내 돌연변이, 카세트 돌연변이, 순환 앙상블(recursive ensemble) 돌연변이, 지수 앙상블(exponential ensemble) 돌연변이, 부위 특이적 돌연변이, 유전자 리어셈블리(예컨대, GeneReassemblyTM, 예컨대 U.S. 특허 No. 6,537,776 참고), 유전자 부위 포화 돌연변이(GSSMTM), 합성 접합 리어셈블리(SLR) 또는 그것의 조합물을 포함하는 방법에 의해 도입될 수 있다. 또 다른 한 측면에서, 변형, 부가 또는 결실은 재조합, 순환 서열 재조합, 포스포티오에이트-변형 DNA 돌연변이, 우라실 함유의 주형 돌연변이, 갭핑 이중(gapped duplex) 돌연변이, 점 부정합 쌍 수복 돌연변이, 수복-결핍 숙주 균주 돌연변이, 화학적 돌연변이, 방사능에 의한 돌연변이, 결실 돌연변이, 제한-선택 돌연변이, 제한-정제 돌연변이, 인공 유전자 합성, 앙상블 돌연변이, 키메라 핵산 다량체 생성 및 그것의 조합을 포함하는 방법에 의해 도입된다.
한 측면에서, 본 발명은 주형 핵산에 의해 암호화된 폴리펩티드에서 변형되거나 그와 상이한 활성, 또는 그 폴리펩티드에서 변형되거나 그와 상이한 안정성을 갖는 자일라나제가 제조될 때까지, 되풀이하여 반복될 수 있다. 한 측면에서, 변이체 자일라나제 폴리펩티드는 내열성을 가지고, 승온에 노출된 후에 약간의 활성을 보유한다. 또 다른 한 측면에서, 변이체 자일라나제 폴리펩티드는 주형 핵산에 의해 암호화된 자일라나제에 비해, 증가된 글리코실화를 가진다. 대안적으로, 변이체 자일라나제 폴리펩티드는 높은 온도에서 자일라나제 활성을 가지며, 여기에서 주형 핵산에 의해 암호화된 자일라나제는 높은 온도에서 활성을 가지지 않는다. 한 측면에서, 본 방법은 주형 핵산의 코돈 이용에서 변형된 코돈 이용을 갖는 자일라나제 암호화 서열이 제조될 때까지 되풀이하여 반복될 수 있다. 또 다른 한 측면에서, 본 방법은 주형 핵산의 경우보다 메시지 발현 또는 안정성의 수준이 더 높거나 더 낮은 자일라나제 유전자가 제조될 때까지 되풀이하여 반복될 수 있다.
한 측면에서, 본 발명은 하기 돌연변이들 중 하나 이상을 갖는 서열 번호 189에서 표시되는 서열을 포함하는 분리 또는 재조합 핵산을 제공한다: 위치 22 내지 24의 뉴클레오티드가 TTC이거나, 위치 31 내지 33의 뉴클레오티드가 CAC이거나, 위치 34 내지 36의 뉴클레오티드가 TTG이거나, 위치 49 내지 51의 뉴클레오티드가 ATA이거나, 위치 31 내지 33의 뉴클레오티드가 CAT이거나, 위치 67 내지 69의 뉴클레오티드가 ACG이고, 위치178 내지 180의 뉴클레오티드가 CAC이거나, 위치 190 내지 192의 뉴클레오티드가 TGT이거나, 위치 190 내지 192의 뉴클레오티드가 GTA이거나, 위치 190 내지 192의 뉴클레오티드가 GTT이거나, 위치 193 내지 195의 뉴클레오티드가 GTG이거나, 위치 202 내지 204의 뉴클레오티드가 GCT이거나, 위치 235 내지 237의 뉴클레오티드가 CCA이거나 위치 235 내지 237의 뉴클레오티드가 CCC 임. 한 측면에서, 본 발명은 상기 서열을 포함하는 핵산의 제조 방법으로서, 서열 번호 189에서의 돌연변이가 유전자 부위 포화 돌연변이(GSSMTM)에 의해 수득되는 방법을 제공한다.
한 측면에서, 본 발명은 하기 돌연변이들 중 하나 이상을 갖는 서열 번호 190 을 포함하는 분리 또는 재조합 핵산을 제공한다:
아미노산 위치 8의 아스파르트산이 페닐알라닌이거나, 아미노산 위치 11의 글루타민이 히스티딘이거나, 아미노산 위치 12의 아스파라긴이 류신이거나, 아미노산 위치 17의 글리신이 이소류신이거나, 아미노산 위치 23의 트레오닌이 야생형 코돈 이외의 코돈에 의해 암호화된 트레오닌이거나, 아미노산 위치 60의 글리신이 히스티딘이거나, 아미노산 위치 64의 프롤린이 시스테인이거나, 아미노산 위치 64의 프롤린이 발린이거나, 아미노산 위치 65의 세린이 발린이거나, 아미노산 위치 68의 글리신이 이소류신이거나, 아미노산 위치 68의 글리신이 알라닌이거나 아미노산 위치 79의 발린이 프롤린임.
본 발명은 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산 내의 코돈을 숙주 세포 내에서의 발현이 증가되도록 변형시키는 방법으로서, 하기 단계들을 포함하는 방법을 제공한다:
(a) 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 본 발명의 핵산을 제공하는 단계; 및
(b) 단계(a)의 핵산 내의 바람직하지 않거나 덜 바람직한 코돈을 동정하여, 그것을 바람직하거나 중간적으로 사용되는 코돈으로 대체하는 단계(여기에서, 바람직한 코돈은 숙주 세포 내의 유전자 내 서열을 암호화할 때 과다 표출되는 코돈이고, 바람직하지 않거나 덜 바람직한 코돈은 숙주 세포 내의 유전자의 서열을 암호화함에 있어 과소 표출되는 코돈임)으로써, 핵산을 숙주 세포 내에서의 발현이 증가되도록 변형시킴.
본 발명은 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산 내의 코돈을 변형시키는 방법으로서, 하기 단계들을 포함하는 방법을 제공한다:
(a) 본 발명의 핵산을 제공하는 단계; 및
(b) 단계(a)의 핵산 내의 코돈을 동정하여, 그것을 대체 코돈과 동일한 아미노산을 암호화하는 상이한 코돈으로 대체함으로써, 자일라나제를 암호화하는 핵산 내의 코돈을 변형시키는 단계.
본 발명은 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산 내의 코돈을 숙주 세포 내에서의 발현이 증가되도록 변형시키는 방법으로서, 하기 단계들을 포함하는 방법을 제공한다:
(a) 자일라나제 폴리펩티드를 암호화하는 본 발명의 핵산을 제공하는 단계; 및
(b) 단계(a)의 핵산 내의 바람직하지 않거나 덜 바람직한 코돈을 동정하여, 그것을 바람직하거나 중간적으로 사용되는 코돈으로 대체하는 단계(여기에서, 바람직한 코돈은 숙주 세포 내의 유전자 내 서열을 암호화할 때 과다 표출되는 코돈이고, 바람직하지 않거나 덜 바람직한 코돈은 숙주 세포 내의 유전자의 서열을 암호화함에 있어 과소 표출되는 코돈임)로서, 핵산을 숙주 세포 내에서의 발현이 증가되도록 변형시키는 것인 단계.
본 발명은 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 핵산 내의 코돈을 숙주 세포 내에서의 발현이 감소되도록 변형시키는 방법으로서, 하기 단계들을 포함하는 방법을 제공한다:
(a) 본 발명의 핵산을 제공하는 단계; 및
(b) 단계(a)의 핵산 내의 하나 이상의 바람직한 코돈을 동정하여, 그것을 대체 코돈과 동일한 아미노산을 암호화하는 바람직하지 않거나 덜 바람직한 코돈으로 대체함으로써(여기에서, 바람직한 코돈은 숙주 세포 내의 유전자 내 서열을 암호화할 때 과다 표출되는 코돈이고, 바람직하지 않거나 덜 바람직한 코돈은 숙주 세포 내의 유전자의 서열을 암호화함에 있어 과소 표출되는 코돈임), 핵산을 숙주 세포 내에서의 발현이 감소되도록 변형시키는 단계. 한 측면에서, 숙주 세포는 박테리아 세포, 진균류 세포, 곤충 세포, 효모 세포, 식물 세포 또는 포유동물 세포일 수 있다.
본 발명은 제1 활성 부위 또는 제1 기질 결합 부위를 암호화하는 서열을 포함하는 제1 핵산으로부터 유도되는 복수의 변형된 자일라나제 활성 부위 또는 기질 결합 부위를 암호화하는 핵산의 라이브러리의 제조 방법으로서, 하기 단계들을 포함하는 방법을 제공한다:
(a) 제1 활성 부위 또는 제1 기질 결합 부위를 암호화하는 제1 핵산을 제공하는 단계(여기에서, 제1 핵산 서열은 본 발명의 핵산에 대해 엄격한 조건 하에 하이브리드화하는 서열을 포함하고, 핵산은 자일라나제 활성 부위 또는 자일라나제 기질 결합 부위를 암호화함);
(b) 제1 핵산 내의 복수의 표적 코돈에서 자연 발생적 아미노산 변이체를 암호화하는 한 세트의 돌연변이성 올리고뉴클레오티드를 제공하는 단계; 및
(c) 돌연변이성 올리고뉴클레오티드 세트를 이용하여, 돌연변이화된 각 아미노산 코돈에서 일정 범위의 아미노산 변형을 암호화하는 한 세트의 활성 부위-암호화 또는 기질 결합 부위-암호화의 변이체 핵산을 생성시킴으로써, 복수의 변형된 자일라나제 활성 부위 또는 기질 결합 부위를 암호화하는 핵산의 라이브러리를 생성하는 단계. 한 측면에서, 본 방법은 최적화 지정 전개 시스템, 유전자 부위-포화 돌연변이(GSSMTM), 합성 접합 리어셈블리(SLR), 에러 프론 PCR, 셔플링, 올리고뉴클레오티드-지정 돌연변이, 어셈블리 PCR, 성적 PCR 돌연변이, 생체내 돌연변이, 카세트 돌연변이, 순환 앙상블 돌연변이, 지수 앙상블 돌연변이, 부위-특이적 돌연변이, 유전자 리어셈블리(GeneReassemblyTM, U.S. 특허 No. 6,537,776), 유전자 부위 포화 돌연변이(GSSMTM), 합성 접합 리어셈블리(SLR) 및 그것의 조합 방법을 포함하는 방법에 의해, 단계(a)의 제1 핵산을 돌연변이화하는 것을 포함한다. 또 다른 한 측면에서, 재조합, 순환 서열 재조합, 포스포티오에이트-변형 DNA 돌연변이, 우라실 함유 주형 돌연변이, 갭핑 이중 돌연변이, 점 부정합 쌍 수복 돌연변이, 수복-결핍 숙주 균주 돌연변이, 화학적 돌연변이, 방사능에 의한 돌연변이, 결실 돌연변이, 제한-선택 돌연변이, 제한-정제 돌연변이, 인공 유전자 합성, 앙상블 돌연변이, 키메라 핵산 다량체 생성 및 그것의 조합 방법을 포함하는 방법에 의해 단계(a)의 제1 핵산 또는 변이체를 돌연변이화하는 것을 포함한다.
본 발명은 하기 단계들을 포함하는 작은 분자들의 제조 방법을 제공한다:
(a) 작은 분자를 합성 또는 변형시킬 수 있는 복수의 생합성 효소를 제공하는 단계(여기에서, 효소들 중 하나는 본 발명의 핵산에 의해 암호화되는 자일라나제 효소를 포함함);
(b) 단계(a)의 효소들 중 하나 이상을 위한 기질을 제공하는 단계; 및
(c) 복수의 생촉매적 반응을 촉진하는 조건 하에서 단계(b)의 기질을 효소와 반응시켜, 일련의 생촉매적 반응에 의해 작은 분자를 생성시키는 단계.
본 발명은 하기 단계들을 포함하는 작은 분자의 변형 방법을 제공한다:
(a) 자일라나제 효소를 제공하는 단계(여기에서, 효소는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드, 또는 그것의 서브서열을 포함함);
(b) 작은 분자를 제공하는 단계; 및
(c) 자일라나제 효소가 촉매 작용하는 효소 반응을 촉진하는 조건 하에서 단계(a)의 효소를 단계(b)의 작은 분자와 반응시킴으로써, 자일라나제 효소 반응에 의해 작은 분자를 변형시키는 단계. 한 측면에서, 본 발명은 단계(a)의 효소를 위한 복수의 작은 분자 기질을 포함함으로써, 자일라나제 효소가 촉매 작용하는 하나 이상의 효소 반응에 의해 생성되는 변형된 작은 분자의 라이브러리를 생성시킬 수있다. 한 측면에서, 본 방법은 효소에 의한 복수의 생촉매적 반응을 촉진하는 조건 하에서 복수의 부가적 효소들을 포함하여, 복수의 효소 반응에 의해 생성되는 변형된 작은 분자의 라이브러리를 형성시킬 수 있다. 또 다른 한 측면에서, 본 방법은 원하는 활성을 나타내는 특별한 변형된 작은 분자가 라이브러리 내에 존재하는지의 여부를 결정하기 위해 라이브러리를 시험하는 단계를 추가로 포함할 수 있다. 라이브러리의 시험 단계는, 원하는 활성을 갖는 특별한 변형된 작은 분자의 존재 또는 부재에 대해 변형된 작은 분자의 부분을 시험하고 원하는 활성을 갖는 특별한 변형된 작은 분자를 생성하는 하나 이상의 특이적 생촉매적 반응을 식별함으로써, 라이브러리 내의 복수의 변형된 작은 분자들을 생성시키는데 사용되는 생촉매적 반응들 중 하나를 제외한 모든 반응을 계통적으로 제거하는 단계를 추가로 포함할 수 있다.
본 발명은 하기 단계들을 포함하는, 자일라나제 효소의 기능적 절편을 결정하는 방법을 제공한다:
(a) 자일라나제 효소를 제공하는 단계(여기에서, 효소는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드, 또는 그것의 서브서열을 포함함); 및
(b) 단계(a)의 서열로부터 복수의 아미노산 잔기를 제거하고, 나머지 서브서열을 자일라나제 활성에 대해 시험함으로써, 자일라나제 효소의 기능적 절편을 결정하는 단계. 한 측면에서, 자일라나제 활성은 자일라나제 기질을 제공하고, 기질의 양의 감소 또는 반응 생성물의 양의 증가를 탐지함으로써 측정된다.
본 발명은 실시간 대사 흐름 분석을 이용함으로써 신규 또는 변형 표현형의 전체 세포 공학처리를 하는 방법으로서, 하기 단계들을 포함하는 방법을 제공한다:
(a) 세포의 유전 조성물을 변형시킴으로써 변형 세포를 제조하는 단계(여기에서, 유전 조성물은 본 발명의 핵산을 세포에 부가함으로써 변형됨);
(b) 변형 세포를 배양하여, 복수의 변형 세포를 생성시키는 단계;
(c) 실시간으로 단계(b)의 세포 배양물을 모니터함으로써, 세포의 하나 이상의 대사 파라미터를 측정하는 단계; 및
(d) 단계(c)의 데이터를 분석하여, 측정된 파라미터가 유사한 조건 하에서 변형 세포에서의 필적할만한 측정과 상이한지의 여부를 결정함으로써, 실시간 대사 흐름 분석을 이용하여 세포 내 공학처리된 표현형을 식별하는 단계. 한 측면에서, 세포의 유전 조성물은 서열의 결실, 또는 세포 내의 서열의 변형, 또는 유전자 발현의 정지를 포함하는 방법에 의해 변형될 수 있다. 한 측면에서, 본 방법은 새로이 공학처리된 표현형을 갖는 세포를 선택하는 것을 추가로 포함할 수 있다. 또 다른 한 측면에서, 본 방법은 선택된 세포를 배양함으로써, 새로이 공학처리된 표현형을 갖는 신규 세포 균주를 생성시킴을 포함할 수 있다.
본 발명은 자일라나제 폴리펩티드를 글리코실화하는 것을 포함하는, 자일라나제 폴리펩티드의 내열성 또는 열안정성을 증가시키는 방법으로서, 폴리펩티드가 본 발명의 폴리펩티드 또는 본 발명의 핵산 서열에 의해 암호화되는 폴리펩티드의 30개 이상의 연속 아미노산을 포함함으로써, 자일라나제 폴리펩티드의 내열성 또는 열안정성을 증가시키는 방법을 제공한다. 한 측면에서, 자일라나제 특이적 활성은약 37℃초과 내지 약 95℃범위의 온도에서 열안정성 또는 내열성을 가질 수 있다.
본 발명은 본 발명의 핵산 또는 본 발명의 핵산 서열을 갖는 핵산을 포함하는 벡터를 발현시키는 것을 포함하는, 세포 내의 재조합 자일라나제 폴리펩티드를 과다발현시키는 방법을 제공하며, 여기에서 서열 상동성은 서열 비교 알고리즘을 이용하는 분석 또는 시각적 조사에 의해 결정되며, 과다발현은 높은 활성 프로모터, 디시스트로닉 벡터의 이용, 또는 벡터의 유전자 증폭에 의해 행해진다.
본 발명은 하기 단계들을 포함하는 유전자이식 식물의 제조 방법을 제공한다:
(a) 이종 핵산 서열을 세포에 도입하는 단계(여기에서, 이종 핵산 서열은 본 발명의 핵산 서열을 포함함으로써, 형질전환된 식물 세포를 생성시킴); 및
(b) 형질전환된 세포로부터 유전자이식 식물을 제조하는 단계. 한 측면에서, 단계(a)는 식물 세포 원형질의 전기천공법 또는 미세주입법에 의해 이종 핵산 서열을 도입하는 것을 추가로 포함할 수 있다. 또 다른 한 측면에서, 단계(a)는 DNA 입자 충돌에 의해 이종 핵산 서열을 식물 조직에 직접적으로 도입하는 것을 추가로 포함할 수 있다. 대안적으로, 단계(a)는 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) 숙주를 이용하여, 이종 핵산 서열을 식물 세포 DNA에 도입하는 것을 추가로 포함할 수 있다. 한 측면에서, 식물 세포는 감자, 옥수수, 쌀, 밀, 담배 또는 보리 세포일 수 있다.
본 발명은 하기 단계들을 포함하는 식물 세포 내의 이종 핵산 서열을 발현시키는 방법을 제공한다:
(a) 프로모터에 작동적으로 연결된 이종 핵산 서열을 이용하여 식물 세포를 형질전환시키는 단계(여기에서, 이종 핵산 서열은 본 발명의 핵산을 포함함); 및
(b) 이종 핵산 서열이 식물 세포 내에서 발현되는 조건 하에서 식물을 성장시키는 단계.
본 발명은 하기 단계들을 포함하는 식물 세포 내의 이종 핵산 서열을 발현시키는 방법을 제공한다:
(a) 프로모터에 작동적으로 연결된 이종 핵산 서열을 이용하여 식물 세포를 형질전환시키는 단계(여기에서, 이종 핵산 서열은 본 발명의 핵산을 포함함); 및
(b) 이종 핵산 서열이 식물 세포 내에서 발현되는 조건 하에서 식물을 성장시키는 단계.
본 발명은 하기 단계들을 포함하는 자일란 함유의 조성물을 가수분해, 파괴 또는 붕괴시키는 방법을 제공한다:
(a) 자일라나제 활성을 갖는 본 발명의 폴리펩티드를 제공하는 단계;
(b) 자일란을 포함하는 조성물을 제공하는 단계; 및
(c) 자일라나제가 자일란 함유의 조성물을 가수분해, 분해 또는 붕괴시키는 조건 하에서, 단계(a)의 폴리펩티드를 단계(b)의 조성물과 접촉시키는 단계. 한 측면에서, 본 조성물은 식물 세포, 박테리아 세포, 효모 세포, 곤충 세포 또는 동물 세포를 포함한다. 이에 따라, 본 조성물은 임의의 식물 또는 식물 부분, 임의의 자일란 함유의 식품 또는 사료, 폐기물 등을 포함할 수 있다.
본 발명은 하기 단계들을 포함하는 자일란 함유의 조성물을 액화 또는 제거하는 방법을 제공한다:
(a) 자일라나제 활성을 갖는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 제공하는 단계;
(b) 자일란을 포함하는 조성물을 제공하는 단계; 및
(c) 자일라나제가 자일란 함유의 조성물을 제거, 연화 또는 액화시키는 조건 하에서, 단계(a)의 폴리펩티드를 단계(b)의 조성물과 접촉시키는 단계.
본 발명은 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 포함하는 세제 조성물로서, 폴리펩티드가 자일라나제 활성을 갖는 세제 조성물을 제공한다. 자일라나제는 비표면활성 자일라나제 또는 표면활성 자일라나제일 수 있다. 자일라나제는 비수성 액체 조성물, 캐스트 고체, 과립 형태, 미립 형태, 압착 정제, 겔 형태, 페이스트 또는 슬러리 형태로 제형화될 수 있다. 본 발명은 하기 단계들을 포함하는 목적물의 세정 방법을 제공한다:
(a) 자일라나제 활성을 갖는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 포함하는 조성물을 제공하는 단계;
(b) 목적물을 제공하는 단계; 및
(c) 조성물이 목적물을 세정하는 조건 하에서, 단계(a)의 폴리펩티드를 단계(b)의 목적물과 접촉시키는 단계.
본 발명은 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 포함하는, 예컨대 실 등의 텍스타일 또는 패브릭을 제공한다. 한 측면에서, 텍스타일 또는 패브릭은 자일란-함유의 섬유를 포함한다. 본 발명은 하기단계들을 포함하는 텍스타일 또는 패브릭의 처리(예컨대, 조성물로부터의 오염 제거) 방법을 제공한다:
(a) 자일라나제 활성을 갖는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 포함하는 조성물을 제공하는 단계;
(b) 자일란을 포함하는 텍스타일 또는 패브릭을 제공하는 단계; 및
(c) 텍스타일 또는 패브릭을 처리하는(예컨대, 오염을 제거하는) 조건 하에서, 단계(a)의 폴리펩티드를 단계(b)의 조성물과 접촉시키는 단계.
본 발명은 하기 단계들을 포함하는 패브릭의 피니쉬를 향상시키는 방법을 제공한다:
(a) 자일라나제 활성을 갖는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 포함하는 조성물을 제공하는 단계;
(b) 패브릭을 제공하는 단계; 및
(c) 폴리펩티드가 패브릭을 처리함으로써, 패브릭의 피니쉬를 향상시킬 수 있는 조건 하에서, 단계(a)의 폴리펩티드를 단계(b)의 패브릭과 접촉시키는 단계. 한 측면에서, 패브릭은 울 또는 실크이다.
본 발명은 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 포함하는 사료 또는 식품을 제공한다. 본 발명은 하기 단계들을 포함하는, 사료 또는 식품 내의 자일란을 동물에 의해 소비되기 전에 가수분해하는 방법을 제공한다:
(a) 본 발명의 자일라나제, 또는 본 발명의 핵산에 의해 암호화되는 자일라나제를 포함하는 사료 물질을 수득하는 단계; 및
(b) 자일란의 가수분해 및 처리된 식품 또는 사료의 형성을 일으키기에 충분한 시간 동안 충분한 양의 사료 또는 식품 물질에 단계(a)의 폴리펩티드를 첨가함으로써, 식품 또는 사료 내의 자일란을 동물에 의해 소비되기 전에 가수분해시키는 단계.
한 측면에서, 본 발명은 하기 단계들을 포함하는, 사료 또는 식물 내의 자일란을 동물에 의해 소비되기 전에 가수분해하는 방법을 제공한다:
(a) 본 발명의 자일라나제, 또는 본 발명의 핵산에 의해 암호화되는 자일라나제를 포함하는 사료 물질을 수득하는 단계;
(b) 단계(a)의 폴리펩티드를 사료 또는 식품 물질에 첨가하는 단계; 및
(c) 사료 또는 식품 물질을 동물에게 투여하는 단계(여기에서, 소비 후, 자일라나제는 동물의 소화관 내에서 사료 또는 식품 내의 자일란의 가수분해를 일으킴). 식품 또는 사료는 예컨대 곡류, 그레인, 옥수수 등일 수 있다.
본 발명은 본 발명의 폴리펩티드, 예컨대 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 포함하는 동물용 식품 또는 영양 보충물을 제공한다. 한 측면에서, 식품 또는 영양 보충물 내의 폴리펩티드는 가수분해될 수 있다. 본 발명은 본 발명의 폴리펩티드, 예컨대 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 포함하는 식용성 효소 전달 매트릭스를 제공한다.
한 측면에서, 전달 매트릭스는 펠릿을 포함한다. 한 측면에서, 폴리펩티드는 글리코실화될 수 있다. 한 측면에서, 자일라나제 활성은 내열성을 가진다. 또 다른한 측면에서, 자일라나제 활성은 열안정성을 가진다.
본 발명은 본 발명의 폴리펩티드를 포함하는 식품, 사료 또는 영양 보충물을 제공한다. 본 발명은 동물 식이요법에 있어 자일라나제를 영양 보충물로서 이용하는 방법으로서, 본 발명의 폴리펩티드의 30개 이상의 연속 아미노산을 포함하는 자일라나제 효소를 함유하는 영양 보충물을 제조함; 및 영양 보충물을 동물에게 투여하여, 동물에 의해 분해되는 사료 또는 식품 내에 함유된 자일란의 이용을 증가시킴을 포함하는 방법을 제공한다. 동물은 인간, 반추 동물 또는 단위 동물일 수 있다. 자일라나제 효소는 박테리아, 효모, 식물, 곤충, 진균류 및 동물로 구성된 군으로부터 선택되는 유기체 내의 자일라나제를 암호화하는 폴리뉴클레오티드의 발현에 의해 제조될 수 있다. 유기체는 에스. 폼베(S. pombe),에스. 세레비재(S. cerevisiae),피치아 파스토리스(Pichia pastoris),슈도모나스 종(Pseudomonas sp.),이. 콜라이(E.coli),스트렙토마이세스 종(Streptomyces sp.),바실러스 종(Bacillus sp.)및 락토바실러스 종(Lactobacillus sp.)으로 구성된 군으로부터 선택될 수 있다.
본 발명은 열안정성 재조합 자일라나제 효소를 포함하는 효소 전달 매트릭스, 예컨대 본 발명의 폴리펩티드를 포함하는 식용성 효소 전달 매트릭스를 제공한다. 본 발명은 자일라나제 보출물을 동물에게 전달하는 방법으로서, 그래뉼리트 식용성 담체 및 열안정성 재조합 자일라나제 효소를 포함하는 펠릿 형태의 식용성 효소 전달 매트릭스를 제조함(여기에서, 펠릿은 그 안에 함유된 자일라나제 효소를 용이하게 분산시킴), 및 식용성 효소 전달 매트릭스를 동물에게 투여함을 포함하는방법을 제공한다. 재조합 자일라나제 효소는 본 발명의 폴리펩티드를 포함할 수 있다. 과립성 식용 담체는 곡물 배아(germ), 오일이 제거된 곡물 배아, 건초, 알팔파, 티모시, 대두 껍질, 해바라기 씨분 및 밀 미드로 구성된 군으로부터 선택되는 담체를 포함할 수 있다. 식용성 담체는 오일이 소비된 곡물 배아를 포함할 수 있다. 자일라나제 효소는 글리코실화되어, 펠릿화 조건 하에서 열안정성을 제공할 수 있다. 전달 매트릭스는 곡물 배아 및 자일라나제를 포함하는 혼합물을 펠릿화함으로써 형성될 수 있다. 펠릿화 조건은 스팀의 적용을 포함할 수 있다. 펠릿화 조건은 약 5분간 약 80℃ 이상의 온도의 적용을 포함할 수 있고, 효소는 350 이상 내지 약 900 유닛/효소 mg의 특이적 활성을 보유한다.
본 발명은 하기 단계들을 포함하는 낙농 제품의 조직 및 풍미를 향상시키는 방법을 제공한다:
(a) 자일라나제 활성을 갖는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 자일라나제를 제공하는 단계;
(b) 유제품을 제공하는 단계; 및
(c) 자일라나제가 유제품의 조직 또는 풍미를 향상시킬 수 있는 조건 하에서, 단계(a)의 폴리펩티드를 단계(b)의 낙농 제품과 접촉시키는 단계. 한 측면에서, 낙농 제품은 치즈 또는 요구르트를 포함한다. 본 발명은 본 발명의 자일라나제를 포함하는 낙농 제품을 제공하거나, 본 발명의 핵산에 의해 암호화된다.
본 발명은 하기 단계들을 포함하는 오일 풍부 식물 물질로부터의 오일 추출을 향상시키는 방법을 제공한다:
(a) 자일라나제 활성을 갖는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 자일라나제를 제공하는 단계;
(b) 오일 풍부 식물 물질을 제공하는 단계; 및
(c) 단계(a)의 폴리펩티드를 오일 풍부 식물 물질과 접촉시키는 단계. 한 측면에서, 오일 풍부 식물 물질은 오일 풍부 씨를 포함한다. 오일은 대두 오일, 올리브 오일, 평지씨(카놀라) 오일 또는 해바라기 오일일 수 있다.
본 발명은 하기 단계들을 포함하는 과일 또는 야채 쥬스, 시럽, 퓨레 또는 추출물의 제조 방법을 제공한다:
(a) 자일라나제 활성을 갖는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 자일라나제를 제공하는 단계;
(b) 과일 또는 야채 물질을 포함하는 조성물 또는 액체를 제공하는 단계; 및
(c) 단계(a)의 폴리펩티드를 조성물과 접촉시킴으로써, 과일 또는 야채 쥬스, 시럽, 퓨레 또는 추출물을 제조하는 단계.
본 발명은 본 발명의 자일라나제, 또는 본 발명의 핵산에 의해 암호화되는 폴리펩티드를 포함하는 종이 또는 종이 제품, 또는 종이 펄프를 제공한다. 본 발명은 하기 단계들을 포함하는, 종이, 또는 종이 또는 목재 펄프의 처리 방법을 제공한다:
(a) 자일라나제 활성을 갖는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 자일라나제를 제공하는 단계;
(b) 종이, 또는 종이 또는 목재 펄프를 포함하는 조성물을 제공하는 단계;및
(c) 자일라나제가 종이, 또는 종이 또는 목재 펄프를 처리할 수 있는 조건 하에서, 단계(a)의 폴리펩티드를 단계(b)의 조성물과 접촉시키는 단계. 한 측면에서, 약제학적 조성물은 분해 보조제 또는 항미생물제(예컨대, 살모넬라균(Salmonella)에 대한 미생물제) 로서 작용한다. 한 측면에서, 처리는 예방적이다. 한 측면에서, 본 발명은 자일라나제 활성을 갖는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 자일라나제를 포함하는 구강 케어 제품을 제공한다. 구강 케어 제품은 치약, 덴탈 크림, 겔 또는 치아 분말제, 치의, 구강청결제, 전- 또는 후-브러슁 린스 제형물, 츄잉검, 로젠지 또는 캔디를 포함할 수 있다. 본 발명은 자일라나제 활성을 갖는 본 발명의 폴리펩티드, 또는 본 발명의 핵산에 의해 암호화되는 자일라나제를 포함하는 콘택트렌즈 클렌징 조성물을 제공한다.
한 측면에서, 본 발명은 본 발명의 폴리펩티드를 투여하는 것을 포함하는, 자일란을 갖는 미생물로부터 동물을 제거 또는 보호하는 방법을 제공한다. 미생물은 자일란을 포함하는 박테리아, 예컨대 살로넬라균일 수 있다.
본 발명은 서열 번호 189에 표시되는 서열, 및 서열 번호 189와 50% 이상의 서열 상동성을 갖는 상기 서열의 변이체를 가지고, 자일라나제 활성을 갖는 폴리펩티드를 코팅하는 분리 핵산을 제공한다. 한 측면에서, 폴리펩티드는 자일라나제 활성, 예컨대 열안정성을 갖는 자일라나제 활성을 가진다.
본 발명은, 하기 서열 변이체들 중 하나 이상, 또는 모두를 포함하는 서열 번호 189를 갖는 분리 또는 재조합 핵산을 제공한다: 위치 22 내지 24의 뉴클레오티드가 TTC이거나, 위치 22 내지 24의 뉴클레오티드가 TTT이거나, 위치 31 내지 33의 뉴클레오티드가 CAC이거나, 위치 31 내지 33의 뉴클레오티드가 CAT이거나, 위치 34 내지 36의 뉴클레오티드가 TTG이거나, 위치 34 내지 36의 뉴클레오티드가 TTA이거나, 위치 34 내지 36의 뉴클레오티드가 CTC이거나, 위치 34 내지 36의 뉴클레오티드가 CTT이거나, 위치 34 내지 36의 뉴클레오티드가 CTA이거나, 위치 34 내지 36의 뉴클레오티드가 CTG이거나, 위치 49 내지 51의 뉴클레오티드가 ATA이거나, 위치 49 내지 51의 뉴클레오티드가 ATT이거나, 위치 49 내지 51의 뉴클레오티드가 ATC이거나, 위치 178 내지 180의 뉴클레오티드가 CAC이거나, 위치 178 내지 180의 뉴클레오티드가 CAT이거나, 위치 190 내지 192의 뉴클레오티드가 TGT이거나, 위치 190 내지 192의 뉴클레오티드가 TGC이거나, 위치 190 내지 192의 뉴클레오티드가 GTA이거나, 위치 190 내지 192의 뉴클레오티드가 GTT이거나, 위치 190 내지 192의 뉴클레오티드가 GTC이거나, 위치 190 내지 192의 뉴클레오티드가 GTG이거나, 위치 193 내지 195의 뉴클레오티드가 GTG이거나, 위치 193 내지 195의 뉴클레오티드가 GTC이거나, 위치 193 내지 195의 뉴클레오티드가 GTA이거나, 위치 193 내지 195의 뉴클레오티드가 GTT이거나, 위치 202 내지 204의 뉴클레오티드가 ATA이거나, 위치 202 내지 204의 뉴클레오티드가 ATT이거나, 위치 202 내지 204의 뉴클레오티드가 ATC이거나, 위치 202 내지 204의 뉴클레오티드가 GCT이거나, 위치 202 내지 204의 뉴클레오티드가 GCG이거나, 위치 202 내지 204의 뉴클레오티드가 GCC이거나, 위치 202 내지 204의 뉴클레오티드가 GCA이거나, 위치 235 내지 237의 뉴클레오티드가 CCA이거나, 위치 235 내지 237의 뉴클레오티드가 CCC이거나, 위치 235 내지 237의 뉴클레오티드가 CCG 임.
본 발명은 하기 서열 변이체들 중 하나 이상, 또는 모두를 포함하는 서열 번호 190 을 갖는 분리 또는 재조합 폴리펩티드를 제공한다: 아미노산 위치8의 아스파르트산이 페닐알라닌이거나, 아미노산 위치 11의 글루타민이 히스티딘이거나, 아미노산 위치 12의 아스파라긴이 류신이거나, 아미노산 위치 17의 글리신이 이소류신이거나, 아미노산 위치 23의 트레오닌이 야행형 코돈 이외의 코돈에 의해 암호화되는 트레오닌이거나, 아미노산 위치 60의 글리신이 히스티딘이거나, 아미노산 위치 64의 프롤린이 시스테인이거나, 아미노산 위치 64의 프롤린이 발린이거나, 아미노산 위치 65의 세린이 발린이거나, 아미노산 위치68의 글리신이 이소류신이거나, 아미노산 위치 68의 글리신이 알라닌이거나, 아미노산 위치 79의 세린이 프롤린임. 한 측면에서, 폴리펩티드는 자일라나제 활성, 예컨대 열안정성을 갖는 자일라나제 활성을 가진다.
본 발명은 표 1 또는 표 2에서 표시되는 하나 이상, 또는 모든 서열 변형을 포함하는 서열 번호 189를 갖는 분리 또는 재조합 핵산을 제공한다. 본 발명은 표 1 또는 표 2에서 표시되는 하나 이상, 또는 모든 서열 변형을 포함하는 서열 번호 189를 갖는 분리 또는 재조합 폴리펩티드를 제공한다. 한 측면에서, 폴리펩티드는 자일라나제 활성, 예컨대 열안정성을 갖는 자일라나제 활성을 가진다.
본 발명은 하기 서열 변이체들 중 하나 이상, 또는 모두를 포함하는 서열 번호 379를 갖는 분리 또는 재조합 핵산을 제공한다: 위치 22 내지 24의 뉴클레오티드가 TTC이거나, 위치 31 내지 33의 뉴클레오티드가 CAC이거나, 위치 49 내지 51의뉴클레오티드가 ATA이거나, 위치178 내지 180의 뉴클레오티드가 CAC이거나, 위치 193 내지 195의 뉴클레오티드가 GTG이거나, 위치 202 내지 204의 뉴클레오티드가 GCT 임.
본 발명은 하기 서열 변이체들 중 하나 이상, 또는 모두를 포함하는 서열 번호 380 을 갖는 분리 또는 재조합 폴리펩티드를 제공한다: D8F, QllH, G17I, G60H, S65V 및/또는 G68A. 한 측면에서, 폴리펩티드는 자일라나제 활성, 예컨대 열안정성을 갖는 자일라나제 활성을 가진다.
본 발명의 분리 또는 재조합 핵산은 또한 "A 군 핵산 서열"이라고 칭해진다. 본 발명은 A 군 핵산 서열, 그것과 실질적으로 동일한 서열 및 그것과 상보적인 서열에서 표시되는 서열의 10개 이상의 연속 염기들을 포함하는 분리 핵산을 제공한다.
본 발명의 예시적 서열의 기능적 절편을 포함하는 본 발명의 분리 또는 재조합 폴리펩티드는 또한 "B 군 아미노산 서열"이라고 칭해진다. 본 발명의 또 다른 측면은, B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열의 10개 이상의 아미노산을 갖는 폴리펩티드를 암호화하는 분리 또는 재조합 핵산이다. 또 다른 측면에서, 본 발명은 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열을 갖는 정제된 폴리펩티드를 제공한다. 본 발명의 또 다른 측면은, B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열을 갖는 폴리펩티드에 특이적으로 결합하는 분리 또는 정제된 항체이다.
본 발명의 또 다른 측면은 B 군 아미노산 서열 및 그것과 실질적으로 동일한서열의 폴리펩티드들 중 하나의 10개 이상의 연속 아미노산을 갖는 폴리펩티드에 특이적으로 결합하는 분리 또는 정제된 항체, 또는 그것의 결합 절편이다.
본 발명의 또 다른 측면은 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열을 갖는 폴리펩티드의 제조 방법이다. 본 방법은 프로모터에 작동적으로 연결된, 폴리펩티드를 암호화하는 핵산을 숙주 세포에 도입하고, 핵산의 발현을 허용하는 조건 하에서 숙주 세포를 배양하는 것을 포함한다. 본 발명의 또 다른 측면은 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 10개 이상의 연속 아미노산을 갖는 폴리펩티드의 제조 방법이다. 본 방법은 프로모터에 작동적으로 연결된, 폴리펩티드를 암호화하는 핵산을 숙주 세포에 도입하고, 핵산의 발현을 허용하는 조건 하에서 숙주 세포를 배양함으로써, 폴리펩티드를 제조하는 것을 포함한다.
본 발명의 또 다른 측면은 A 군 핵산 서열, 그것과 실질적으로 동일한 서열, A 군 핵산 서열의 서열과 상보적인 서열, 상기 서열의 30개 이상의 연속 뉴클레오티드를 포함하는 절편에서 표시되는 서열을 갖는 핵산을 수득하고, 서열 내의 하나 이상의 뉴클레오티드를 또 다른 뉴클레오티드로 바꾸거나, 서열 내의 하나 이상의 뉴클레오티드를 결실시키거나, 서열 내의 하나 이상의 뉴클레오티드를 부가하는 것을 포함하는 변이체의 생성 방법이다.
본 발명의 또 다른 측면은 A 군 핵산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열, 또는 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열을 저장하고 있는 컴퓨터 판독가능한 매체이다.
본 발명의 또 다른 측면은 A 군 핵산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열, 또는 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열을 갖는 폴리펩티드를 저장하고 있는 데이터 저장 장치, 및 프로세서를 포함하는 컴퓨터 시스템이다.
본 발명의 또 다른 측면은 A 군 핵산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열, 또는 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티드 코드를 갖는 핵산인 제1 서열을 참조 서열과 비교하는 방법이다. 본 방법은 서열을 비교하는 컴퓨터 프로그램의 사용을 통해 제1 서열 및 참조 서열을 읽고, 컴퓨터 프로그램을 이용하여 제1 서열 및 참조 서열 간의 차이를 결정하는 것을 포함한다.
본 발명의 또 다른 측면은 A 군 핵산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열, 또는 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 서열을 갖는 폴리펩티드 내의 특징을 동정하는 방법으로서, 서열 내의 특징을 동정하는 컴퓨터 프로그램의 사용을 통해 서열을 읽음; 및 컴퓨터 프로그램을 이용하여 서열 내의 특징을 동정함을 포함하는 방법이다.
본 발명의 또 다른 측면은, 자일란 또는 그것의 유도체의 파괴에서 촉매 작용하는 방법으로서, 자일란의 파괴를 촉진하는 조건 하에서, 자일란 또는 그것의 유도체를 함유하는 샘플을 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티드를 접촉시키는 단계를 포함하는 방법이다.
본 발명의 또 다른 측면은 B 군 아미노산 서열 및 그것과 실질적으로 동일한서열의 폴리펩티드의 효소적 기능을 보유하는, B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 절편 또는 변이체를 동정하는 검정법이다. 그 검정법은 폴리펩티드 절편 또는 변이체가 기능하도록 하는 조건 하에서, B 군 아미노산 서열, 그것과 실질적으로 동일한 서열의 폴리펩티드, 또는 폴리펩티드 절편 또는 변이체를 기질 분자와 접촉시킴, 및 기질 수준의 감소 또는, 폴리펩티드 및 기질 간의 반응의 특이적 반응 생성물 수준의 증가를 탐지함으로써, 상기 서열의 절편 또는 변이체를 동정함.
본 발명의 또 다른 측면은 A 군 핵산 서열로 구성된 군으로부터 선택되는 핵산 서열의 핵산 표적 영역과 50% 이상 상보적이고, 온화한 조건 내지 매우 엄격 조건 하에서 핵산 표적 영역에 대해 하이브리드화하여, 탐지가능한 표적:프로브 이중체를 형성하는 10개 이상의 연속 뉴클레오티드의 한 세그먼트를 가지는, 약 10 내지 50개의 뉴클레오티드의 길이를 갖는 올리고뉴클레오티드의 핵산 프로브이다.
본 발명의 또 다른 측면은 A 군 핵산 서열 중 하나의 하나 이상의 절편과 동일하거나 그와 전부 상보적인 서열을 갖는 자일라나제 유전자의 분리 또는 동정을 위한 폴리뉴클레오티드 프로브이다.
또 다른 측면에서, 본 발명은 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열로부터 선택된 아미노산 서열을 갖는 폴리펩티드를 포함하는, 액체인 단백질 제제를 제공한다.
본 발명의 또 다른 측면은 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열로부터 선택된 아미노산 서열을 갖는 폴리펩티드를 포함하는, 고체인 단백질제제를 제공한다.
본 발명의 또 다른 측면은 A 군 핵산 서열, 그것과 실질적으로 동일한 서열 및 그것과 상보적인 서열로부터 선택되는 폴리뉴클레오티드에 의해 암호화되는 하나 이상의 폴리펩티드와 하나 이상의 작은 분자를 혼합하여, 하나 이상의 생촉매적 반응을 통해 하나 이상의 변형된 작은 분자를 제조하는 단계를 포함하는 작은 분자의 변형 방법으로서, 하나 이상의 폴리펩티드가 자일라나제 활성을 가지는 방법을 제공한다.
본 발명의 또 다른 측면은 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 서열의 클로닝 벡터로서, 상기 서열이 A 군 핵산 서열, 그것과 실질적으로 동일한 서열 및 그것과 상보적인 서열로부터 선택되는 클로닝 벡터이다.
본 발명의 또 다른 측면은 자일라나제 활성을 갖는 폴리펩티드를 코팅하는 서열을 포함하는 숙주 세포로서, 상기 서열이 A 군 핵산 서열, 그것과 실질적으로 동일한 서열 및 그것과 상보적인 서열로부터 선택되는 숙주 세포이다.
또 다른 측면에서, 본 발명은 A 군 핵산 서열, 그것과 실질적으로 동일한 서열, 그것과 상보적인 서열로부터 선택되는 서열을 갖는 폴리뉴클레오티드 및, 엄격함이 낮은 조건, 중간인 조건 및 높은 조건 하에서 상기 서열들 중 임의의 서열을 갖는 핵산에 대해 하이브리드화하는 분리된 핵산을 포함하는 숙주 세포에서 복제가능한 발현 벡터를 제공한다.
또 다른 한 측면에서, 본 발명은 도우를 컨디셔닝하기에 충분한 조건 하에서, 도우를 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 하나 이상의폴리펩티드와 접촉시키는 것을 포함하는 도우의 컨디셔닝 방법을 제공한다.
본 발명의 또 다른 측면은 맥아즙 또는 맥주의 점도를 감소시키기에 충분한 조건 하에서, B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 하나 이상의 폴리펩티드의 투여를 포함하는 음료 제조 방법이다.
본 발명의 자일라나제는 포유동물 사료 내의 고분자량의 아라비노자일란을 파괴하는데 사용된다. 본 발명의 자일라나제의 첨가는 분해성을 향상시킴으로써 성장 속도를 자극하고, 이는 또한 동물의 새끼의 품질을 향상시킨다. 자일라나제는 위장관을 통해, 장내 점도를 감소시키고, 췌장 효소의 확산을 증가시키는 기능을 한다. 부가적으로, 본 발명의 자일라나제는 사료 그레인 및 식물성 단백질의 배젖 세포벽의 처리에 사용될 수 있다. 본 발명의 한 측면에서, 본 발명의 신규 자일라나제를 동물에게 투여하여, 식품 내의 자일란의 유용을 증가시킨다. 본 발명의 자일라나제의 그러한 활성은 세포벽 내의 영양성분들을 유리시키면서 불용성 세포벽 물질을 파괴하여, 동물에게 유용될 수 있도록 한다. 그것은 또한 헤미셀룰로스를 영양 당으로 변화시켜, 세포벽 내에 이전에 포획된 영양성분들이 해리되도록 한다. 자일라나제는 또한 반추 미생물총을 위한 영양원일 수 있는 화합물을 생성시킨다.
본 발명의 또 다른 측면은 동물의 식이법에 있어서 자일라나제를 영양 보충물로 이용하는 방법으로서, B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 30개 이상의 연속 아미노산을 포함하는 재조합 자일라나제 효소를 갖는 영양 보충물을 제조함, 및 그 영양 보충물을 동물에게 투여하여, 동물에 의해 분해되는 식품 내에 함유된 자일란의 유용을 증가시킴을 포함하는 방법을 제공한다.
본 발명의 또 다른 측면에서, 동물에게 자일라나제 보충물을 전달하는 방법으로서, 그래뉼리트 식용성 담체 및 열안정성을 갖는 재조합 자일라나제 효소를 포함하는 펠릿 형태의 식용성 효소 전달 매트릭스를 제조함(여기에서 입자는, 수성 매질 내에 함유된 자일라나제 효소를 용이하게 분산시킴), 및 식용성 효소 전달 매트릭스를 동물에게 투여함을 포함하는 방법을 제공한다. 그래뉼리트 식용성 담체는 오일이 소비된 곡물 배아, 건초, 알팔파, 큰조아재비, 콩 꼬투리, 해바라기 씨분 및 보리 미드로 구성된 군으로부터 선택되는 담체를 포함할 수 있다. 자일라나제 효소는 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열에서 표시되는 아미노산 서열을 가질 수 있다.
또 다른 한 측면에서, 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 서열을 포함하는 분리된 핵산으로서, 서열이 A 군 핵산 서열, 그것과 실질적으로 동일한 서열 및 그것과 상보적인 서열로부터 선택되고, 서열이 시그널 서열을 함유하는 분리된 핵산을 제공한다. 본 발명은 또한 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 서열을 포함하는 분리된 핵산으로서, 서열이 A 군 핵산 서열, 그것과 실질적으로 동일한 서열 및 그것과 상보적인 서열로부터 선택되고, 서열이 또 다른 자일라나제로부터 시그널 서열을 함유하는 분리된 핵산을 제공한다. 부가적으로, 본 발명은 자일라나제 활성을 갖는 폴리펩티드를 암호화하는 서열을 포함하는 분리된 핵산으로서, 서열이 A 군 핵산 서열, 그것과 실질적으로 동일한 서열 및 그것과 상보적인 서열로부터 선택되고, 서열이 시그널 서열을 함유하지 않는 분리된 핵산을 제공한다.
본 발명의 또 다른 측면은 서열 번호 189의 돌연변이인 분리된 핵산을 제공한다. 또 다른 측면은 서열 번호 190의 돌연변이인 아미노산 서열을 제공한다.
본 발명의 하나 이상의 구현예의 상세한 설명은 이하 첨부 도면 및 발명의 상세한 설명에 의해 설명된다. 본 발명의 다른 특성, 목적 및 이점은 발명의 상세한 설명 및 도면으로부터, 또한 특허청구범위로부터 명백해질 것이다.
본원에 인용된 모든 공보, 특허, 특허 출원, GenBank 서열 및 ATCC 수탁은 모든 목적을 위해 본원에 명시적으로 인용된다.
관련 출원 상호 참조
본 출원은 35 U.S.C. §119(e) 규정 하에 2002년 6월 14일에 출원된 미국 가출원 제60/389,299호를 기초로 하여 우선권을 주장한다. 상기 출원은 전체적으로 모든 목적을 위해 명백히 본원에 참조 인용된다.
본 발명은 효소, 그 효소를 암호화하는 폴리뉴클레오티드, 그러한 폴리뉴클레오티드 및 폴리펩티드의 용도, 더욱 상세하게는 자일라나제 활성을 갖는 효소, 예컨대 내부 β-1,4-자일로시드계 연결기 또는 엔도-β-1,4-글루카나제 연결기의 가수분해에서 촉매 작용하는 효소에 관한 것이다.
하기 도면은 본 발명의 측면들을 설명하기 위한 것으로서, 특허청구범위에 의한 본 발명의 범주를 제한하지 않는 것으로 한다.
특허 또는 출원 파일은 하나 이상의 칼라 도면을 포함한다.
칼라 도면(들)이 포함된 본 특허 또는 특허 출원 공보의 복사본은 요청 시에 필요한 비용을 청구함으로써 제공될 것이다.
도 1은 컴퓨터 시스템의 블록 다이어그램이다.
도 2는 새로운 서열 및 데이터베이스 내의 서열 간의 상동성 수준을 결정하기 위해, 새로운 뉴클레오티드 또는 단백질 서열을 서열의 데이터베이스와 비교하는 방법의 한 측면을 설명하는 플로우 다이어그램이다.
도 3은 2개의 서열이 상동성을 갖는지의 여부를 결정하기 위한 컴퓨터에서의 방법의 한 측면을 설명하는 플로우 다이어그램이다.
도 4는 서열 내의 특징의 존재를 탐지하기 위한 확인자 프로세스 300의 한측면을 설명하는 플로우 다이어그램이다.
도 5는 야생형 서열(서열 번호 189 및 190)와 8x 돌연변이(서열 번호 375 및 376), 표 1에서의 돌연변이체 D, F, H, I, S, V, X 및 AA의 조합체의 활성을 비교하는 그래프이다.
도 6A는 이하 실시예 5에서 상세히 설명되는 바와 같이, 서열 번호 190(서열 번호 189에 의해 암호화됨)의 유전자 부위 포화 돌연변이(GSSMTM)에 의해 생성되는 서열 번호 378(서열 번호 377 에 의해 암호화됨)의 9개의 단일 부위 아미노산 돌연변이체를 설명한다.
도 6B는 이하 실시예 5에서 상세히 설명되는 바와 같이, 각 효소에 대한 DSC 에 의해 결정되는 융점 전이 중간점(Tm)에서의 서열 번호 190 및 서열 번호 378의 풀림을 설명한다.
도 7A은 이하 실시예 5에서 상세히 설명되는 바와 같이, 효소 서열 번호 190 및 서열 번호 378에 대한 pH 및 온도 활성 프로파일을 설명한다.
도 7B은 이하 실시예 5에서 상세히 설명되는 바와 같이, 효소 서열 번호 190 및 서열 번호 378에 대한 속도/온도 활성 최적점을 설명한다.
도 7C은 이하 실시예 5에서 상세히 설명되는 바와 같이, 효소 서열 번호 190 및 서열 번호 378에 대한 내열성/잔류 활성을 설명한다.
도 8A은 이하 실시예 5에서 상세히 설명되는 바와 같이, 내열성 및 활성이 향상된 돌연변이체에 대해 구축되고 선별된 9 GSSMTM점돌연변이의 모든 가능한 조합의 GeneReassemblyTM라이브러리를 설명한다.
도 8B 이하 실시예 5에서 상세히 설명되는 바와 같이, 최적 온도 및 pH 6.0에서, 서열 번호 190("야생형")와 대비되는 "6X-2" 변이체 및 "9X" 변이체(서열 번호 378)의 상대적 활성을 설명한다.
도 9A는 이하 실시예 5에서 상세히 설명되는 바와 같이, 서열 번호 190("야생형") 및 "9X" 변이체(서열 번호 378) 효소에 의한 올리고자일란 (Xyl)3, (Xyl)4, (Xyl)5 및 (Xyl)6의 가수분해 후에 수득되는 지문을 설명한다.
도 9B는 이하 실시예 5에서 상세히 설명되는 바와 같이, 서열 번호 190("야생형") 및 "9X" 변이체(서열 번호 378) 효소에 의한 너도밤나무 자일란의 가수분해 후에 수득되는 지문을 설명한다.
도10A는 이하 실시예 5에서 상세히 설명되는 바와 같이, GSSMTM진화에 의해 수득되는 서열 번호 190("야생형")에 비한, 열안정성(Tm으로 표시)의 향상 수준을 설명하는 도시적 다이어그램이다.
도10B는 이하 실시예 5에서 상세히 설명되는 바와 같이, GSSMTM및 GeneReassemblyTM기술을 조합함으로써 수득되는 서열 번호 378 및 서열 번호 380의 형태의 효소 향상의 "적합성 다이어그램" 을 설명한다.
도 11은 이하 실시예 6에서 상세히 설명되는 바와 같이, 본 발명의 자일라나제가 종이 펄프를 예비 처리하는데 유용한지의 여부를 결정하기 위한 예시적 통상적 선별 프로토콜의 도시적 흐름 다이어그램을 설명한다.
각종 도면에서의 부호는 요소를 가리킨다.
본 발명은 자일라나제 및 그것을 암호화하는 폴리뉴클레오티드, 및 그것의 제조 및 사용 방법에 관한 것이다. 본 발명의 폴리펩티드의 자일라나제 활성은 가수분해효소 활성을 갖는 효소, 예를 들어 자일란 내에 존재하는 글리코시드계 연결기를 가수분해할 수 있는 효소, 예컨대 자일란, 예컨대, 내부 β-1,4-자일로시드계 연결기의 가수분해에서 촉매 작용하는 효소를 포괄한다. 본 발명의 자일라나제는 식품, 사료, 영양 보충물, 텍스타일, 세제 등을 제조하고/하거나 가공하는데 사용될 수 있다. 본 발명의 자일라나제는 약제학적 조성물 및 식이 보조제에서 사용될 수 있다. 본 발명의 자일라나제는 특히 제빵, 동물 사료, 음료 및 종이 가공에서 유용하다.
정의
용어 "항체"는 항원 또는 동위원소와 특이적으로 결합할 수 있는, 펩티드 또는, 면역글로불린 유전자로부터 유도되거나, 면역글로불린 유전자와 유사하게 모델링되거나, 면역글로불린 유전자에 의해 실질적으로 암호화된 폴리펩티드, 또는 그것의 절편을 포함하고, 이에 대해 예컨대 [Fundamental Immunology, 제3판, W. E. Paul 저, Raven Press, N.Y. (1993); Wilson (1994) J. Immunol. Methods 175: 267-273; Yarmush (1992) J. Biochem. Biophys. Methods 25: 85-97]를 참고로 한다. 용어 "항체"는, (i) Fab 절편, VL, VH, CL 및 CH1 도메인으로 구성된 단가 절편; (ii) F(ab') 2 절편, 힌지 영역에서 디술피드 다리 연결된 2 개의 Fab 절편을 포함하는 이가 절편; (iii) VH 및 CH1 도메인으로 구성된 Fd 절편; (iv) 항체의 단일 암의 VL 및 VH 도메인으로 구성되는 Fv 절편; (v) VH 도메인으로 구성되는 dAb 절편(Ward 등 (1989) Nature 341: 544-546); 및 (vi) 분리된 상보적 결정 영역(CDR)을 포함하는, 항원-결합 부분, 즉 항원 결합능을 보유하는 "항원 결합 부위"(예컨대, 절편, 서브서열, 상보적 결정 영역(CDR))를 포함한다. 단일 사슬 항체는 또한 용어 "항체"에서 참고로 포함된다.
본원에 사용된 용어 "어레이" 또는 "마이크로어레이", 또는 "바이오칩" 또는 "칩"은 이하 더욱 상세히 논의되는 바와 같이, 기질 표면의 일정 면적 상에 고정화된 하나 이상의 폴리펩티드(항체 포함) 또는 핵산을 일정량 각기 포함하는 복수의 표적 성분이다.
본원에 사용된 용어 "컴퓨터", "컴퓨터 프로그램" 및 "프로세서"는 그것의 최광의 일반적 문맥으로 사용되며, 이하 상세히 기술되는 것과 같은 장치들을 모두 포함한다. 특별한 폴리펩티드 또는 단백질"의 암호화 서열" 또는 특별한 폴리펩티드 또는 단백질을 "암호화하는 서열" 은, 적당한 조절 서열의 제어 하에 둘 때, 폴리펩티드 또는 단백질로 전사 및 번역되는 핵산 서열이다.
본원에 사용된 표현 "핵산" 또는 "핵산 서열"은 올리고뉴클레오티드, 뉴클레오티드, 폴리뉴클레오티드, 또는 이들 중 임의의 것의 절편, 단일 가닥 또는 이중 가닥일 수 있거나 센스 또는 안티센스 가닥일 수 있는 게놈 또는 합성 기원의 DNA 또는 RNA, 펩티드 핵산(PNA), 또는 천연 또는 합성 기원의 임의의 DNA-형 또는RNA-형 물질을 가리킨다. 표현 "핵산" 또는 "핵산 서열"은 올리고뉴클레오티드, 뉴클레오티드, 폴리뉴클레오티드, 또는 이들 중 임의의 것의 절편, 단일 가닥 또는 이중 가닥일 수 있거나 센스 또는 안티센스 가닥일 수 있는 게놈 또는 합성 기원의 DNA 또는 RNA (예컨대, mRNA, rRNA, tRNA, iRNA), 펩티드 핵산(PNA), 또는 천연 또는 합성 기원의 임의의 DNA-형 또는 RNA-형 물질, 예를 들면 iRNA, 리보뉴클레오 단백질(예컨대, iRNP 등의 이중 가닥 iRNA)을 포함한다. 그 용어는 핵산, 즉 천연 뉴클레오티드의 공지된 상동체를 포함하는 올리고뉴클레오티드를 포괄한다. 그 용어는 또한 합성 골격을 갖는 핵산-형 구조를 포괄하며, 이에 대해서는 예컨대 [Mata (1997) Toxicol. Appl. Pharmacol. 144: 189-197;Strauss-Soukup (1997) Biochemistry 36: 8692-8698; Samstag (1996) Antisense Nucleic Acid Drug Dev 6: 153-156]를 참고로 한다. "올리고뉴클레오티드"에는 화학적으로 합성될 수 있는 단일 가닥의 폴리데옥시뉴클레오티드 또는 2개의 상보적 폴리데옥시뉴클레오티드 가닥을 포함한다. 그러한 합성 올리고뉴클레오티드는 5' 인산염을 가지지 않고, 키나아제의 존재 하에서 ATP 를 갖는 인산염을 첨가하지 않고는 또 다른 올리고뉴클레오티드와 접합되지 않을 것이다. 합성 올리고뉴클레오티드는 탈인산화되지 않은 절편에 접합될 수 있다.
특별한 폴리펩티드 또는 단백질의 "암호화 서열" 또는 특별한 폴리펩티드 또는 단백질을 "암호화하는 뉴클레오티드 서열"은 적당한 조절 서열을 제어하는 경우에서는 폴리펩티드 또는 단백질로 전사 및 번역되는 핵산 서열이다.
용어 "유전자"는 폴리펩티드 사슬의 생성에 관여하는 DNA의 세그먼트를 의미하고; 그것은 적용가능한 경우에는 개별적인 암호화 세그먼트들(엑손) 간의 삽입 서열(인트론)을 비롯하여, 암호화 영역의 선행 및 후행 영역을 포함한다. 본원에 사용된 "작동적으로 연결된" 이라는 표현은 2개 이상의 핵산(예컨대, DNA) 세그먼트들 간의 기능적 관계를 가리킨다. 전형적으로, 그것은 전사된 서열에 대한 전사적 조절 서열의 기능적 관계를 가리킨다. 예를 들어, 프로모터는, 그것이 적당한 숙주 세포 또는 다른 발현 시스템 내의 암호화 서열의 전사를 자극 또는 조절할 경우, 본 발명의 핵산과 같은 암호화 서열에 작동적으로 연결된다. 일반적으로, 전사된 서열에 작동적으로 연결된 프로모터 전사적 조절 서열은 전사된 서열과 물리적으로 접해 있고, 즉 시스-작용한다. 그러나 인핸서와 같은 일부 전사적 조절 서열은 전사가 증진되는 암호화 서열에 물리적으로 접해있거나 매우 근접하게 위치할 필요가 없다.
본원에 사용된 용어 "발현 카세트"는 본 서열과 상용적인 숙주 내에서 구조적 유전자의 발현에 영향을 줄 수 있는 뉴클레오티드 서열(즉, 본 발명의 자일라나제와 같은 단백질 암호화 서열)을 가리킨다. 발현 카세트는 폴리펩티드 암호화 서열에, 또한 임의적으로는 전사 종결 시그널 등의 다른 서열에 작동적으로 연결된 하나 이상의 프로모터를 포함한다. 발현 수행에 필요하거나 도움이 되는 부가적인 인자, 예컨대 인핸서가 사용될 수 있다. 이에 따라서, 발현 카세트는 또한 플라스미드, 발현 벡터, 재조합 바이러스, 임의의 형태의 재조합 "네이키드 DNA" 벡터 등을 포함한다. "벡터"는 세포를 감염시키거나, 트랜스펙션시키거나, 일시적 또는 영구적으로 형질도입할 수 있는 핵산을 포함한다. 벡터는 네이키드 핵산, 또는 단백질이나 지질과 복합화된 핵산일 수 있음을 인지할 것이다. 벡터는 임의적으로 바이러스 및/또는 박테리아 핵산 및/또는 단백질, 및/또는 막(예컨대, 세포막,바이러스 지질 엔벨로프 등)을 포함한다. 벡터는 비제한적으로 DNA의 절편이 부착되거나 복제될 수 있는 레플리콘(예컨대, RNA 레플리콘, 박테리오파지)을 포함한다. 이에 따라, 벡터는 비제한적으로 RNA, 자동적 자기-복제의 원형 또는 선형 DNA 또는 RNA(예컨대, 플라스미드, 바이러스 등, 예컨대 U.S. 특허 No. 5,217,879 참고)을 포함하고, 발현 및 비발현 플라스미드를 모두 포함한다. 세포 배양물의 재조합 미생물이 "발현 벡터" 를 호스팅하는 것으로 기재할 경우, 이는 원형 및 선형 DNA, 및 숙주 염색체(들)에 혼입된 염색체 외부의 DNA를 모두 포함한다. 벡터가 숙주 세포에 의해 유지되고 있는 경우, 이 벡터는 자발적 구조로서의 유사분열 중에 세포에 의해 안정하게 복제되거나,혹은 숙주의 게놈 내에 혼입된다.
본원에 사용된 용어 "프로모터"는 세포 내의 암호화 서열의 전사를 유도할 수 있는 모든 세포들, 예컨대, 식물 세포를 포함한다. 이에 따라, 본 발명의 구성에 사용된 프로모터는 시스-작용 전사적 조절 성분 및, 유전자의 전사 시간 및/또는 속도를 조절 또는 제어하는 조절 서열을 포함한다. 예를 들어, 프로모터는 전사 조절에 관여하는, 인핸서, 프로모터, 전사 종결자, 복제 기원, 염색체 삽입 서열, 5' 및 3' 비번역 영역, 또는 인트론 서열을 포함하는, 시스-작용의 전사적 조절 성분일 수 있다. 이 시스-작용의 서열은 전형적으로 전사를 수행(작동/비작동, 조절, 제어 등) 하기 위해 단백질 또는 다른 생체분자들과 통상적으로 상호작용한다. "구성" 프로모터는 전개 또는 세포 분화의 대부분의 환경적 조건 및 상태 하에서 연속으로 발현을 유도하는 것들이다. "유도가능한" 또는 "제어가능한" 프로모터는 환경적 조건 또는 전개 조건의 영향 하에서 본 발명의 핵산의 발현을 주도한다. 유도성 프로모터에 의해 전사에 영향을 줄 수 있는 환경적 조건의 예는 혐기성 조건, 승온, 건조(수분 고갈), 또는 광 존재를 포함한다.
"조직-특이적" 프로모터는 예컨대 식물 또는 동물 내의 특별한 세포 또는 조직 또는 기관에서 단지 활성을 갖는 전사 조절 성분이다. 조직-특이적 조절은 주어진 조직에 특이적인 단백질을 암호화하는 유전자가 확실히 발현되도록 하는 특정한 고유 인자에 의해 달성될 수 있다. 그러한 인자는 포유동물 및 식물 내에 존재하여, 특정 조직의 엔벨로프를 허용하는 것으로 알려져 있다.
용어 "식물"은 식물의 전체, 식물의 부분(예컨대, 잎, 줄기, 꽃, 뿌리 등), 식물 원형질, 씨 및 식물 세포 및 그것의 자손을 포함한다. 본원의 방법에 사용될 수 있는 식물의 부류는 일반적으로 나자 식물 을 비롯하여 피자 식물(단자엽 및 쌍자엽 식물)을 포함하는, 형질전환 기술을 적용할 수 있는 고급 식물 부류와 같이 넓은 범위이다. 그것은 배수체, 이수체, 반수체 및 반접합자 상태를 포함하는 다양한 수체 수준의 식물을 포함한다. 본원에 사용된 용어 "유전자이식 식물"은 이종 핵산 서열이 삽입된 식물 또는 식물 세포, 예컨대, 본 발명의 핵산 및 각종 재조합 작제물(예컨대, 발현 카세트)을 포함한다.
"플라스미드"는 비제한적으로 시중 입수가능하고, 공개적으로 입수가능하거나, 공개된 절차에 따라 이용가능한 플라스미드로부터 구축될 수 있다. 그러한 것들과 동등한 플라스미드가 당업계에 알려져 있고, 당업자에게 명백하다.
본원에 사용된 "아미노산" 또는 "아미노산 서열"은 올리고펩티드, 펩티드, 폴리펩티드 또는 단백질 서열, 또는 그것들 중 임의의 것의 절편, 부분 또는 서브유니트, 및 천연 또는 합성 분자를 가리킨다.
"아미노산" 또는 "아미노산 서열"은 올리고펩티드, 펩티드, 폴리펩티드 또는 단백질 서열, 또는 그것들 중 임의의 것의 절편, 부분 또는 서브유니트, 및 천연 또는 합성 분자를 가리킨다. 본원에 사용된 용어 "폴리펩티드"는 펩티드 결합 또는 변형된 펩티드 결합에 의해 상호 연결된 아미노산, 즉 펩티드 등가근을 가리키고, 20개의 유전자로 암호화된 아미노산 이외의 변형된 아미노산을 함유할 수 있다. 폴리펩티드는 전사후 가공과 같은 천연 공정, 또는 당업계에 공지된 화학적 변형 기술에 의해 변형될 수 있다. 변형은 펩티드 골격, 아미노산 측쇄 및 아미노 또는 카르복실 말단을 포함하는, 폴리펩티드 내의 임의의 부분에서 일어날 수 있다. 동일한 유형의 변형이 주어진 폴리펩티드 내의 수개 부위에서 동일한 정도 또는 다양한 정도로 존재할 수 있음을 인지한다. 또한 주어진 폴리펩티드는 많은 유형의 변형을 가질 수 있다. 변형은 아세틸화, 아실화, ADP-리보실화, 아미드화, 플라빈의 공유 결합, 헴 단자의 공유 결합, 뉴클레오티드 또는 뉴클레오티드 유도체의 공유 결합, 지질 또는 지질 유도체의 공유 결합, 포스피티딜리노시톨의 공유 결합, 가교 고리화, 디술피드 결합 형성, 탈메틸화, 공유 가교결합의 형성, 시스테인의 형성, 파이로글루타메이트의 형성, 포르밀화, 감마-카르복실화, 글리코실화, GPI 앵커 형성, 히드록실화, 요오드화, 메틸화, 미리스토일화, 산화, 페길화, 자일란 가수분해효소 가공, 인산화, 프레닐화, 라세미화, 셀레노일화, 술페이트화 및, 아르기닐화와 같은, 단백질에 대한 아미노산의 전달-RNA 매개 부가를 포함한다[Creighton, T. E., Proteins-Structure and Molecular Properties 제2판, W. H. Freeman and Company, N.Y. (1993);Posttranslational Covalent Modification of Proteins, B. C. Johnson 저, Academic Press, N.Y., pp. 1-12 (1983) 참고]. 본 발명의 펩티드 및 폴리펩티드는 또한 이하 더욱 상세하게 기재되는, 모든 "미메틱" 및 "펩티도미메틱" 을 포함한다.
본원에 사용된 용어 "분리(된)"는 물질이 본래의 환경(예컨대, 천연 발생될 경우에는 천연 환경)에서 제거됨을 의미한다. 예를 들어, 살아있는 동물 내에 존재하는 천연 발생의 폴리뉴클레오티드 또는 폴리펩티드는 분리되지 않으나, 자연계 내에 공존하는 물질들 중 일부 또는 모두로부터 분리된 동일한 폴리뉴클레오티드 또는 폴리펩티드가 분리된다. 그러한 폴리뉴클레오티드는 벡터의 일부일 수 있고/있거나 및/또는 상기 폴리뉴클레오티드 또는 폴리펩티드는 조성물의 일부일 수 있고, 상기 벡터 또는 조성물은 그것의 천연 환경의 일부가 아님에 분리될 수 있다. 본원에 사용된 "정제(된)"는 절대적인 순수를 요하지 않으며, 상대적인 정의로 의도된다. 라이브러리로부터 수득된 개별적 핵산은 전기영동 상동성을 갖도록 통상적으로 정제화되었다. 이 클론으로부터 수득된 서열은 라이브러리 또는 총 인간 DNA 로부터 직접적으로 수득될 수 없었다. 본 발명의 정제된 핵산은 적어도 104내지 106배로 유기체 내의 나머지 게놈 DNA으로부터 정제되었다. 그러나, 용어 "정제(된)"는 또한 1 차원 이상의 등급, 전형적으로는 2 또는 3 차원, 더욱 통상적으로는4 또는 5 차원의 등급만큼, 나머지 게놈 DNA 또는 라이브러리 또는 다른 환경 내의 다른 서열로부터 정제된 핵산을 포함한다.
본원에 사용된 용어 "재조합" 은, 핵산이 천연 환경 내에서는 인접하지 않은 "골격" 핵산에 인접하고 있음을 의미한다. 부가적으로, 용어 "풍부"는 핵산이 핵산 골격 분자의 집단 중, 핵산 삽입부의 수가 5% 이상을 나타내는 것을 의미한다. 본 발명에 따른 골격 분자는 발현 벡터, 자기 복제 핵산, 바이러스, 일체화 핵산 및, 당 핵산 삽입부를 유지 또는 조작하는데 사용되는 다른 벡터 또는 핵산과 같은 핵산들을 포함한다. 통상적으로, 풍부 핵산은, 재조합 골격 분자의 집단 중 핵산 삽입부의 수가 15% 이상을 나타낸다. 더욱 통상적으로는, 재조합 골격 분자의 집단 중 핵산 삽입부의 수가 50% 이상을 나타낸다. 한 측면에서, 풍부 핵산은 재조합 골격 분자의 집단 중 핵산 삽입부의 수가 90% 이상을 나타낸다.
"재조합" 폴리펩티드 또는 단백질은 재조합 DNA 기술에 의해 제조된, 즉 원하는 폴리펩티드 또는 단백질을 암호화하는 외인성 DNA 작제물에 의해 형질전환된 세포로부터 제조된 폴리펩티드 또는 단백질을 가리킨다. "합성" 폴리펩티드 또는 단백질은 화학적 합성에 의해 제조된 것들이다. 고체상 화학적 펩티드 합성법은 또한 본 발명의 폴리펩티드 또는 절편을 합성하는데 사용될 수 있다. 그러한 방법은 1960년대 초반 이후로 당업계에 공지되어 왔고[Merrifield, R. B., J. Am. Chem. Soc., 85: 2149-2154,1963] (또한 Stewart, J. M. 및 Young, J. D., Solid Phase Peptide Synthesis, 제2판, Pierce Chemical Co., Rockford, Ill., pp.11-12) 참고), 시중 입수가능한 실험용 펩티드 설계 및 합성 키트(Cambridge ResearchBiochemicals)에 최근 이용되었다. 그러한 시중 입수가능한 실험용 키트는 일반적으로 [H. M. Geysen 등,Proc. Natl. Acad. Sci.미국, 81: 3998 (1984)] 의 교시 내용을 이용하였고, 단일 플레이트에 모두 연결되는 다수의 "로드(rod)" 또는 "핀"의 끝에 펩티드의 합성을 제공한다. 그러한 시스템을 이용할 경우, 로드 또는 핀의 플레이트를, 핀 또는 로드의 끝에 적당한 아미노산을 부착 또는 앵커시키기 위한 용액을 함유하는 상응하는 웰 또는 저장부의 두 번째 플레이트에 전환 및 삽입한다. 그러한 공정 단계, 즉 로드 및 핀의 끝을 적당한 용액에 전환 및 삽입하는 단계를 반복함으로써, 아미노산이 원하는데 펩티드에 구축된다. 게다가, 수많은 입수가능한 FMOC 펩티드 합성 시스템이 이용가능하다. 예를 들어, 폴리펩티드 또는 절편의 어셈브리를 어플라이드 바이오시스템사(Applied Biosystems, Inc.)의 모델 431A 자동화 펩티드 합성기를 이용하여 고체 지지체 상에 행할 수 있다. 그러한 장치는 직접적 합성, 또는 다른 공지된 기술들과 조합될 수 있는 일련의 절편 합성에 의해, 본 발명의 펩티드를 수득할 수 있게 한다.
프로모터 서열은 프로모터에서 전사를 개시하는 RNA 폴리머라아제는 암호화서열을 mRNA로 전사할 때, 암호화 서열에 "작동적으로 연결된다".
"플라스미드"는 대문자 및/또는 숫자에 의해 선행 및/또는 후행되는 소문자 "p"로 표시된다. 본원에서의 출발 플라스미드는 비제한적으로 시중 입수가능하고, 공개적으로 입수가능하거나, 공지된 절차에 따라 입수가능한 플라스미드로부터 구축될 수 있다. 게다가, 본원에 기재된 것들과 동등한 플라스미드가 당업계에 알려져 있고, 당업자에게 명백할 것이다.
DNA의 "분해" DNA 내의 특정 서열에서만 작용하는 제한 효소로 DNA의 촉매적 절단을 가리킨다. 본원에 사용된 각종 제한 효소들은 입수 가능하고, 그것들의 반응 조건, 조인자 및 다른 요건들은 당업자에게 공지된 바대로 이용된다. 분석적 목적을 위해, 통상 1 ㎍의 플라스미드 또는 DNA 절편을 약 20 ㎖의 완충액 내의 약 2 단위의 효소와 함께 사용된다. 플라스미드 구축을 위해 DNA 절편을 분리하기 위한 목적으로, 통상 5 내지 50 ㎍의 DNA를 더 큰 체적 내의 20 내지 250 단위의 효소로 분해한다. 특별한 제한 효소에 대한 적당한 완충액 및 기질 양은 제조업자에 의해 특정화된다. 37℃에서 약 1 시간의 배양 시간이 일반적으로 사용되나, 공급업자의 지시에 따라 다양할 수 있다. 분해 후에, 겔 전기영동을 수행하여, 원하는 절편을 분리할 수 있다.
2개의 핵산 또는 폴리펩티드에 관한 기재에서의 표현 "실질적으로 동일한"은 공지된 서열 비교 알고리즘들 중 하나를 이용하거나 시각적으로 조사하여 측정 시, 최대 대등성에 대해 비교하여 배열할 때, 예컨대 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%,87%,88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%,96%, 97%, 98%, 99%, 또는 그 이상의 뉴클레오티드 또는 아미노산 잔기(서열) 상동성을 갖는 2개 이상의 서열을 가리킨다. 통상적으로, 실질적인 상동성은 약 100개 이상의 잔기로 된 영역에 존재하고, 가장 통상적으로는 서열이 약 150 내지 200개 이상의 잔기들에서 실질적으로 동일하다. 일부 측면에서, 서열은 전체 길이의 암호화 영역에서 실질적으로 동일하다.
부가적으로, "실질적으로 동일한" 아미노산 서열은 하나 이상의 보존적 또는 비보존적 아미노산 치환, 결실 또는 삽입에 의해 참조 서열과 상이하게 된 서열로서, 특히 사익 치환이 분자의 활성 부위가 아닌 부위에서 일어날 때의 서열이며, 여기에서 단 폴리펩티드는 본질적으로 기능적 성질을 보유한다. 보존적 아미노산 치환은 예를 들어 하나의 아미노산을 동일 부류의 또 다른 아미노산으로 치환하는 것이다(예컨대, 소수성 아미노산, 예컨대 이소류신, 발린, 류신 또는 메티오닌의 또 다른 아미노산으로의 치환, 또는 하나의 극성 아미노산의 또 다른 아미노산으로의 치환, 예컨대 아르기닌의 리신으로의 치환, 글루탐산의 아스파르트산으로의 치환, 또는 글루타민의 아스파라긴으로의 치환). 하나 이상 아미노산은 예를 들어 자일라나제 폴리펩티드로부터 결실될 수 있고, 이에 생물학적 활성을 상당히 변경시키지 않으면서 폴리펩티드의 구조를 변형시킬 수 있다. 예를 들어, 자일라나제 생물학적 활성을 위해 필요하지 않은 아미노- 또는 카르복실-말단의 아미노산을 제거할 수 있다. 본 발명의 변형된 폴리펩티드 서열은, 변형된 폴리펩티드 서열을 자일라나제 기질과 접촉시키고, 변형된 폴리펩티드가 검정에서 특이적 기질의 양을 감소시키거나, 기능적 자일라나제 폴리펩티드와 기질의 효소적 반응의 생체생성물을 증가시키는지의 여부를 결정하는 것을 포함하는, 임의의 수의 방법들에 의해 자일라나제 생물학적 활성에 대해 검정될 수 있다.
본원에 사용된 "절편"은 2개 이상의 상이한 형태로 존재할 수 있는 천연 발생 단백질의 부분이다. 절편은 천연 발생 단백질과 동일하거나 실질적으로 동일한아미노산 서열을 가질 수 있다. 표현 "실질적으로 동일한"은, 아미노산 서열이 전적으로는 아니나 대체로 동일하고, 그와 관계된 서열의 하나 이상의 기능적 활성을 보유하는 것을 의미한다. 일반적으로, 2개의 아미노산 서열은, 그것들이 85% 이상 동일할 경우에, "실질적으로 동일하거나", "실질적으로 상동성을 가진다". 천연 발생 단백질로서 상이한 3차원 구조를 가지는 절편이 또한 포함된다. 그것의 한 예는, 절단에 의해 변형되어, 상당히 높은 활성을 갖는 성숙 효소를 생성시킬 수 있는 낮은 활성의 프로단백질과 같은 "프로형(pro-form)"의 분자이다.
"하이브리드화"는 핵산 가닥이 염기가 쌍을 지음으로써 상보적 가닥과 연합되는 공정을 가리킨다. 하이브리드화 반응은 당해 서열이 낮은 농도로 존재하고 있는 샘플 내에서도 동정될 수 있도록 민감하고 선택적이어야 한다. 적당하게, 엄격한 조건은 예를 들어 프리하이브리드화 및 하이브리드화 용액 내에서 염 또는 포름아미드의 농도에 의해, 또는 하이브리드화 온도에 의해 정의될 수 있고, 당업계에 공지되어 있다. 특히, 엄격성은 염의 농도를 감소시키고, 포름아미드의 농도를 증가시키거나, 하이브리드화 온도를 승온시킴으로써 증가될 수 있다. 대안적 측면에서, 본 발명의 핵산은 본원에 설명된, 엄격성이 다양한 조건(예컨대, 엄격성이 높거나, 중간이거나, 낮은 조건) 하에서 하이브리드화되는 능력에 의해 정의된다.
예를 들어, 엄격성이 높은 조건 하에서의 하이브리드화는 약 37℃ 내지 42℃에서 약 50% 포름아미드 내에서 일어날 수 있다. 하이브리드화는 약 30℃ 내지 35℃에서 약 35% 내지 25% 포름아미드 내에서 엄격성이 감소된 조건 하에서 일어날 수 있다. 특히, 하이브리드화는 42℃에서의 엄격성이 높은 조건 하에서, 50% 포름아미드, 5X SSPE, 0.3% SDS 및 200 n/ml 전단 및 변성 연어 정자 DNA 내에서 일어날 수 있다. 하이브리드화는 상기 기술한 바와 같은 엄격성이 감소된 조건 하에서, 단 35℃의 감소된 온도에서 35% 포름아미드 내에서 일어날 수 있다. 특별한 수준의 엄격성에 대응하는 온도 범위는, 당해 핵산의 퓨린:피리미딘의 비를 계산하고, 이에 따라 온도를 조정함으로써 더 좁아질 수 있다. 상기 범위 및 조건에서의 다양화는 당업계에 공지되어 있다.
용어 "변이체"는 본 발명의 자일라나제의 생물학적 활성을 여전히 보유하는, 하나 이상의 염기 쌍, 코돈, 인트론, 엑손 또는 아미노산 잔기에서(각기) 변형된 본 발명의 폴리뉴클레오티드 또는 폴리펩티드를 가리킨다. 변이체는 예를 들어 에러 프론 PCR, 셔플링, 올리고뉴클레오티드-지정 돌연변이, 어셈블리 PCR, 성적 PCR 돌연변이, 생체내 돌연변이, 카세트 돌연변이, 순환 앙상블 돌연변이, 지수 앙상블 돌연변이, 부위-특이적 돌연변이, 유전자 리어셈블리(예를 들어, GeneReassemblyTM, 예컨대 U.S. 특허 No. 6,537,776 참고), GSSMTM및 그것의 조합 방법을 포함하는 방법과 같은 임의의 수의 방법들에 의해 제조될 수 있다.
표 1 및 표 2는 GSSMTM에 의해 서열 번호 189(서열 번호 190 암호화)을 돌연변이화시킴으로써 수득되는 변이체들을 열거하고 있다 본 발명은 표 1 및 표 2에 표시된 서열들 중 하나 이상 또는 모두를 갖는 핵산, 즉 서열 번호 189의 변이체인 서열을 갖는 핵산 (여기에서, 변이체들은 표 1 및 표 2에 표시되어 있음), 및 이들 변이체에 의해 암호화되는 폴리펩티드를 제공한다.
(표 1 및 표 2에 나와 있는) 이들 GSSMTM변이체들에게 내열성에 대해 시험하였다 (이하 실시예 참고). 돌연변이체 D, F, G, H,I, J, K, S, T, U, V, W, X, Y, Z, AA, DD 및 EE는 표 1의 돌연변이체들 중 내열성이 가장 높은 것으로 나타났다. 돌연변이체들은 또한 조합되어, 보다 큰 돌연변이를 형성할 수 있다. 예를 들어, 표 1의 돌연변이체 D, F, H,I, S, V, X 및 AA를 조합하여, 서열 번호 375(폴리펩티드 암호화의 핵산) 및 서열 번호 376(아미노산 서열)에서 표시되는 서열을 갖는, "8x"라고 하는 보다 큰 돌연변이체를 형성한다. 도 5는 야생형 서열(서열 번호 189 및190)의 활성을 8x 돌연변이체(서열 번호 259 및 260)와 비교하는 그래프이다. 야생형 및 8x 돌연변이체의 비교 시, 양자의 최적 온도가 65℃이고, 양자의 최적 pH 가 5.5임이 밝혀졌다. 야생형 서열은 65℃에서 1분 미만 동안 안정성을 유지하는 것이 밝혀졌고, 반면 8x 돌연변이체(서열 번호 375 및 376)는 85도에서 10분 초과 동안 안정성을 유지한다는 것이 밝혀졌다. 사용된 기질은 AZO-AZO-자일란이었다. 한 측면에서, 8x 돌연변이체(서열 번호 375 및 376)는 GSSMTM에 의해 진화시켰다. 또 다른 한 측면에서, 야생형은 내열성 진화에 대해 GSSMTM모(parent)이다.
내열성에 있어 "야생형"(서열 번호 189)보다 "향상"되거나 최상으로 변형된 변이체 (서열 번호 189)를 생성시키는, 표 2에 나와 있는 코돈 변이체가 강조되었다. 상기 언급된 바와 같이, 본 발명은 핵산, 및 표 2 및 표1에 표시된 하나, 수개 또는 모두의 변이체들을 포함하고, 상기 핵산을 암호화하는 폴리펩티드를 제공한다.
한 측면에서, B 군 아미노산 서열들 중 아미노산 서열(서열 번호 208)의 아미노산 서열은 단일 아미노산 돌연변이에 의해 변형된다. 한 특정 측면에서, 돌연변이는 아스파라긴의 아스파르트산으로의 돌연변이이다. 수득된 아미노산 서열 및 대응하는 핵산 서열이 서열 번호 252 및 서열 번호 251에 각기 표시되어 있다. 서열 번호 208의 돌연변이와 같이, 효소의 최적 pH 가 향상된 단일 아미노산 돌연변이가 자일라나제에 대해 당업계에 알려져 있다(예컨대, Joshi, M., Sidhu, G., Pot, I., Brayer, G., Withers, S., McIntosh, L., J. Mol. Bio. 299, 255-279 (2000) 참고). 또한 상기 단일 아미노산 돌연변이에서, 서열의 일부를 서브클로닝 공정에서 제거될 수 있는 것으로 나타났다. 예를 들어, 서열 번호 207 및 서열 번호 251 은 서열이 배열된 영역 상에서, 단지 하나의 뉴클레오티드만이 상이하다. 그러나, 서브클로닝에서 서열 번호 207의 N-말단에 있는 78 뉴클레오티드 영역을 서열 번호 251의 N-말단으로부터 제거되는 것으로 나타났다. 부가적으로, 서열 번호 251 내의 첫 번째 3개의 뉴클레오티드를 ATG로 변경시킨 후, 서열 번호 251의 6 번째 뉴클레오티드에서 점돌연변이를 일으켰다.
용어 "포화 돌연변이", "유전자 부위 포화 돌연변이" 또는 "GSSMTM"는, 이하 상세하게 기술되는 바와 같은, 올리고뉴클레오티드 프라이머를 분해하여, 폴리뉴클레오티드에 점돌연변이를 도입하는 방법을 포함한다.
용어 "최적화 지정 진화 시스템" 또는 "최적화 지정 진화"는 이하 상세하게 설명되는 바와 같은, 관련 핵산 서열, 예컨대 관련 유전자의 절편을 리어셈블링하는 방법을 포함한다.
용어 "합성 접합 리어셈블리" 또는"SLR" 는 이하 상세하게 설명되는 바와 같은, 비-확률론적 양식으로 올리고뉴클레오티드 절편을 접합시키는 방법을 포함한다.
핵산의 생성 및 조작
본 발명은 본 발명의 폴리펩티드를 암호화하는, 발현 벡터와 같은 발현 카세트를 포함하는 핵산(예컨대, 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379; 서열 번호 2, 서열 번호 4, 서열 번호 6, 서열 번호 8,10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18, 서열 번호 20, 서열 번호 22, 서열 번호 24, 서열 번호 26, 서열 번호 28, 서열 번호 30, 서열 번호 32, 서열 번호 34, 서열 번호 36, 서열 번호 38, 서열 번호 40, 서열 번호 42, 서열 번호 44, 서열 번호 46, 서열 번호 48, 서열 번호 50, 서열 번호 52, 서열 번호 54, 서열 번호 56, 서열 번호 58, 서열 번호 60, 서열 번호 62, 서열 번호 64, 서열 번호 66, 서열 번호 68, 서열 번호 70, 서열 번호 72, 서열 번호 74, 서열 번호 76, 서열 번호 78, 서열 번호 80, 서열 번호 82, 서열 번호 84, 서열 번호 86, 서열 번호 88, 서열 번호 90, 서열 번호 92, 서열 번호 94, 서열 번호 96, 서열 번호 98, 서열 번호 100, 서열 번호 102, 서열 번호 104, 서열 번호 106, 서열 번호 108, 서열 번호 110, 서열 번호 112, 서열 번호 114, 서열 번호 116, 서열 번호 118, 서열 번호 120, 서열 번호 122, 서열 번호 124, 서열 번호 126, 서열 번호 128, 서열 번호 130, 서열 번호 132, 서열 번호 134, 서열 번호 136, 서열 번호 138, 서열 번호 140, 서열 번호 142, 서열 번호 144, 서열 번호 146, 서열 번호 148, 서열 번호 150, 서열 번호 152, 서열 번호 154, 서열 번호 156, 서열 번호 158, 서열 번호160, 서열 번호 162, 서열 번호 164, 서열 번호 166, 서열 번호 168, 서열 번호 170, 서열 번호 172, 서열 번호 174, 서열 번호 176, 서열 번호 178, 서열 번호 180, 서열 번호 182, 서열 번호 184, 서열 번호 186, 서열 번호 188, 서열 번호 190, 서열 번호 192, 서열 번호 194, 서열 번호 196, 서열 번호 198, 서열 번호 200, 서열 번호 202, 서열 번호 204, 서열 번호 206, 서열 번호 208, 서열 번호 210, 서열 번호 212, 서열 번호 214, 서열 번호 216, 서열 번호218, 서열 번호 220, 서열 번호 222, 서열 번호 224, 서열 번호 226, 서열 번호 228, 서열 번호 230, 서열 번호 232, 서열 번호 234, 서열 번호 236, 서열 번호 238, 서열 번호 240, 서열 번호 242, 서열 번호 244, 서열 번호 246, 서열 번호 248, 서열 번호 250, 서열 번호 252, 서열 번호 254, 서열 번호 256, 서열 번호 258, 서열 번호 260, 서열 번호 262, 서열 번호 264, 서열 번호266, 서열 번호 268, 서열 번호 270, 서열 번호 272, 서열 번호 274, 서열 번호 276, 서열 번호 278, 서열 번호 280, 서열 번호 282, 서열 번호 284, 서열 번호 286, 서열 번호 288, 서열 번호 290, 서열 번호 292, 서열 번호 294, 서열 번호 296, 서열 번호 298, 서열 번호 300, 서열 번호 302, 서열 번호 304, 서열 번호 306, 서열 번호 308, 서열 번호 310, 서열 번호 312, 서열 번호 314, 서열 번호 316. 서열 번호 318, 서열 번호 320, 서열 번호 322, 서열 번호 324, 서열 번호 326, 서열 번호 328, 서열 번호 330, 서열 번호 332, 서열 번호 334, 서열 번호 336, 서열 번호 338, 서열 번호 340, 서열 번호 342, 서열 번호 344, 서열 번호 346, 서열 번호 348, 서열 번호 350, 서열 번호 352, 서열 번호 354, 서열 번호 356, 서열 번호 358, 서열 번호 360, 서열 번호 362, 서열 번호 364, 서열 번호 366, 서열 번호 368, 서열 번호 370, 서열 번호 372, 서열 번호 374, 서열 번호 376, 서열 번호 378 또는 서열 번호 380에 표시된 폴리펩티드를 암호화하는 핵산)을 제공한다. 본 발명은 또한 본 발명의 핵산을 이용하여, 새로운 자일라나제 서열을 발견하는 방법을 포함한다. 본 발명은 또한 자일라나제 유전자의 발현, 전사, 및 본 발명의 핵산을 이용하는 폴리펩티드를 억제하는 방법을 포함한다. 또한 예컨대 합성 접합리어셈블리, 최적화 지정 진화 시스템 및/또는 포화 돌연변이에 의해, 본 발명의 핵산을 변형시키는 방법도 제공된다.
본 발명의 핵산은 예컨대, cDNA 라이브러리의 클로닝 및 발현, PCR에 의한 메시지 또는 게놈 DNA의 증폭 등에 의해 제조, 분리 및/또는 조작될 수 있다. 예를 들어, 하기 본 발명의 예시적 서열은 하기 원들로부터 초기에 유도되었다:
[표 3]
서열 번호 : 원(source)
1, 2 : 박테리아 원
101, 102 : 환경적 원
103, 104 : 박테리아 원
105, 106 : 환경적 원
107, 108 : 박테리아 원
109, 110 : 환경적 원
11, 12 : 환경적 원
111, 112 : 환경적 원
113, 114 : 환경적 원
115, 116 : 환경적 원
117, 118 : 환경적 원
119, 120 : 환경적 원
121, 122 : 환경적 원
123, 124 : 환경적 원
125, 126 : 환경적 원
127, 128 : 환경적 원
129, 130 : 박테리아 원
13, 14 : 환경적 원
131, 132 : 환경적 원
133, 134 : 환경적 원
135, 136 : 환경적 원
137, 138 : 환경적 원
139, 140 : 환경적 원
141, 142 : 환경적 원
143, 144 : 박테리아 원
145, 146 : 진핵세포 원
147, 148 : 환경적 원
149, 150 : 환경적 원
15, 16 : 환경적 원
151, 152 : 환경적 원
153, 154 : 환경적 원
155, 156 : 환경적 원
157, 158 : 환경적 원
159, 160 : 환경적 원
161, 162 : 환경적 원
163, 164 : 환경적 원
165, 166 : 환경적 원
167, 168 : 환경적 원
169, 170 : 환경적 원
17, 18 : 박테리아 원
171, 172 : 환경적 원
173, 174 : 환경적 원
175, 176 : 환경적 원
177, 178 : 환경적 원
179, 180 : 환경적 원
181, 182 : 환경적 원
183, 184 : 환경적 원
185, 186 : 환경적 원
187, 188 : 환경적 원
189, 190 : 환경적 원
19, 20 : 환경적 원
191, 192 : 환경적 원
193, 194 : 환경적 원
195, 196 : 환경적 원
197, 198 : 환경적 원
199, 200 : 환경적 원
201, 202 : 환경적 원
203, 204 : 환경적 원
205, 206 : 환경적 원
207, 208 : 환경적 원
209, 210 : 환경적 원
21, 22 : 환경적 원
211, 212 : 환경적 원
213, 214 : 환경적 원
215, 216 : 환경적 원
217, 218 : 환경적 원
219, 220 : 환경적 원
221, 222 : 환경적 원
223, 224 : 환경적 원
225, 226 : 환경적 원
227, 228 : 환경적 원
229, 230 : 환경적 원
23, 24 : 환경적 원
231, 232 : 박테리아 원
233, 234 : 환경적 원
235, 236 : 환경적 원
237, 238 : 환경적 원
239, 240 : 환경적 원
241, 242 : 환경적 원
243, 244 : 환경적 원
245, 246 : 환경적 원
247, 248 : 환경적 원
249, 250 : 환경적 원
25, 26 : 환경적 원
251, 252 : 환경적 원
253, 254 : 환경적 원
255, 256 : 환경적 원
257, 258 : 환경적 원
259, 260 : 환경적 원
261, 262 : 환경적 원
263, 264 : 환경적 원
265, 266 : 환경적 원
267, 268 : 박테리아 원
269, 270 : 환경적 원
27, 28 : 환경적 원
271, 272 : 환경적 원
273, 274 : 환경적 원
275, 276 : 환경적 원
277, 278 : 환경적 원
279, 280 : 환경적 원
281, 282 : 환경적 원
283, 284 : 환경적 원
285, 286 : 환경적 원
287, 288 : 환경적 원
289, 290 : 환경적 원
29, 30 : 원시세균 원
291, 292 : 환경적 원
293, 294 : 환경적 원
295, 296 : 환경적 원
297, 298 : 환경적 원
299, 300 : 환경적 원
3, 4 : 환경적 원
301, 302 : 환경적 원
303, 304 : 환경적 원
305, 306 : 박테리아 원
307, 308 : 환경적 원
309, 310 : 환경적 원
31, 32 : 환경적 원
311, 312 : 환경적 원
313, 314 : 박테리아 원
315, 316 : 환경적 원
317, 318 : 환경적 원
319, 320 : 환경적 원
321, 322 : 환경적 원
323, 324 : 환경적 원
325, 326 : 환경적 원
327, 328 : 환경적 원
329, 330 : 환경적 원
33, 34 : 환경적 원
331, 332 : 환경적 원
333, 334 : 환경적 원
335, 336 : 환경적 원
337, 338 : 환경적 원
339, 340 : 환경적 원
341, 342 : 환경적 원
343, 344 : 환경적 원
345, 346 : 환경적 원
347, 348 : 환경적 원
349, 350 : 환경적 원
35, 36 : 환경적 원
351, 352 : 환경적 원
353, 354 : 환경적 원
355, 356 : 환경적 원
357, 358 : 환경적 원
359, 360 : 환경적 원
361, 362 : 환경적 원
363, 364 : 환경적 원
365, 366 : 환경적 원
367, 368 : 환경적 원
369, 370 : 환경적 원
37, 38 : 환경적 원
371, 372 : 환경적 원
373, 374 : 환경적 원
375, 376 : 인공적 원
377, 378 : 인공적 원
39, 40 : 환경적 원
41, 42 : 환경적 원
43, 44 : 환경적 원
45, 46 : 환경적 원
47, 48 : 환경적 원
49, 50 : 환경적 원
5, 6 : 환경적 원
51, 52 : 환경적 원
53, 54 : 박테리아 원
55, 56 : 환경적 원
57, 58 : 환경적 원
59, 60 : 환경적 원
61, 62 : 환경적 원
63, 64 : 환경적 원
65, 66 : 환경적 원
67, 68 : 환경적 원
69, 70 : 환경적 원
7, 8 : 환경적 원
71, 72 : 환경적 원
73, 74 : 환경적 원
75, 76 : 환경적 원
77, 78 : 환경적 원
79, 80 : 환경적 원
81, 82 : 환경적 원
83, 84 : 환경적 원
85, 86 : 박테리아 원
87, 88 : 환경적 원
89, 90 : 박테리아 원
9, 10 : 환경적 원
91, 92 : 환경적 원
93, 94 : 환경적 원
95, 96 : 환경적 원
97, 98 : 환경적 원
99, 100 : 환경적 원
한 측면에서, 본 발명은 환경 원 또는 박테리아 원, 또는 원시세균 원으로부터 유도된다는 공통된 신규성을 갖는 자일라나제를 암호화하는 핵산을 제공한다.
본 발명의 방법을 수행할 때, 상동성 유전자는 본원에 기재된 바와 같이, 주형 핵산을 조작함으로써 변형될 수 있다. 본 발명은 과학 문헌 및 특허 문헌에 잘기재되어 있는, 당업계에 공지된 임의의 방법 또는 프로토콜 또는 장치를 이용하여 수행될 수 있다.
본 발명의 한 측면은, A 군 핵산 서열 및 그것과 실질적으로 동일한 서열, 그것과 상보적인 서열 중 하나, 또는 A 군 핵산 서열(또는 그것과 상보적인 서열)의 서열들 중 하나의 적어도 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 또는 500개의 연속 염기들을 갖는 절편을 포함하는 분리된 핵산이다. 분리된 핵산은 cDNA, 게놈 DNA 및 합성 DNA를 포함하는 DNA를 포함할 수 있다. DNA는 이중 가닥 또는 단일 가닥일 수 있고, 단일 가닥인 경우, 암호화 가닥 또는 비암호화(안티센스) 가닥일 수 있다. 대안적으로, 분리된 핵산은 RNA를 포함할 수 있다.
이하 보다 상세하게 논의되는 바와 같이, A 군 핵산 서열 및 그것과 실질적으로 동일한 서열 중 하나의 분리된 핵산은, B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티들 중 하나, 또는 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티드들 중 하나의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개의 연속 아미노산들을 포함하는 절편을 제조하는데 사용될 수 있다.
따라서, 본 발명의 또 다른 측면은 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티드들 중 하나, 또는 B 군 아미노산 서열의 폴리펩티드들 중 하나의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개의 연속 아미노산들을 포함하는 절편을 암호화하는 분리된 핵산이다. 이들 핵산의 암호화 서열은 A 군 핵산 서열 또는 그것의 절편의 핵산들 중 하나의 암호화 서열들 중 하나와 동일할 수 있거나, B 군 아미노산 서열, 그것과 실질적으로 동일한 서열의 폴리펩티드들 중 하나, 및 B 군 아미노산 서열의 폴리펩티드들 중 하나의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개의 연속 아미노산을 포함하는 절편 중 하나를 암호화하는 상이한 암호화 서열일 수 있으며, 이는 유전 코드의 풍부 또는 퇴화의 결과이다. 유전 코드는 당업자에게 공지되어 있고, 예컨대, [B. Lewin, Genes VI, 옥스포드 대학 출판부(Oxford University Press), 1997]의 제214면에서 수득될 수 있다.
B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티드들 중 하나를 암호화하는 분리된 핵산은, 비제한적으로 하기 것들을 포함할 수 있다: 단지, A 군 핵산 서열 및 그것과 실질적으로 동일한 서열 중 하나의 암호화 서열 및 부가적 암호화 서열, 예컨대 리더 서열 또는 프로단백질 서열 및 비-암호화 서열, 예컨대 암호화 서열의 인트론 또는 5' 및/또는 3' 비-암호화 서열. 본원에 사용된 용어 "폴리펩티드를 암호화하는 폴리뉴클레오티드"는 부가적 암호화 및/또는 비-암호화 서열을 포함하는 폴리뉴클레오티드를 비롯한, 폴리펩티드용 암호화 서열만을 포함하는 폴리뉴클레오티드를 포괄한다.
대안적으로, A 군 핵산 서열 및 그것과 실질적으로 동일한 서열의 핵산 서열은 통상적 기술, 예컨대 부위 지정 돌연변이, 또는 당업자에게 잘 알려진 다른 기술들을 이용하여 돌연변이화하여, A 군 핵산 서열 및 그것과 실질적으로 동일한 서열의 폴리뉴클레오티드에 침묵 변화를 도입할 수 있다. 본원에 사용된 "침묵 변화"는 예를 들어 폴리뉴클레오티드에 의해 암호화되는 아미노산 서열을 변형시키지 않는 변화를 포함한다. 그러한 변화는 숙주 유기체에 빈번하게 일어나는 코돈 또는 코돈 쌍을 도입함으로써, 폴리펩티드를 암호화하는 벡터를 함유하는 숙주 세포에 의해 생성되는 폴리펩티드의 수준을 증가시키기 위해 바람직할 수 있다.
본 발명은 또한 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티드에 있어, 아미노산 치환, 부가, 결실, 융합 및 절단을 가져오는, 뉴클레오티드 변화를 갖는 폴리뉴클레오티드에 관한 것이다. 그러한 뉴클레오티드 변화는 부위 지정 돌연변이, 무작위 화학적 돌연변이, 엑소뉴클레아제 III 결실 및 기타 재조합 재조합 DNA 기술과 같은 기술들을 이용하여 도입될 수 있다. 대안적으로, 그러한 뉴클레오티드 변화는, 본원에서 제공된 바와 같은 엄격성이 높거나 중간이거나 낮은 조건 하에서, A 군 핵산 서열 및 그것과 실질적으로 동일한 서열(또는 그것과 상보적인 서열)의 서열들 중 하나의 적어도 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 또는 500개의 연속 염기들을 포함하는 프로브에 대해 특이적으로 하이브리드화하는 핵산을 동정함으로써 분리되는 천연 발생적 대립유전자형질의 변이체일 수 있다.
일반 기술
본 발명에 사용되는 핵산은, 그것이 RNA, iRNA, 안티센스 핵산, cDNA, 게놈 DNA, 벡터, 바이러스 또는 그것의 하이브리드인지와 상관없이, 유전공학 처리, 증폭 및/또는 발현/재조합 생성되는 각종 원들로부터 분리될 수 있다. 상기 핵산들로부터 생성된 재조합 폴리펩티드(예컨대, 자일라나제)는 개별적으로 분리되거나 클로닝되어, 원하는 활성에 대해 시험한다. 박테리아, 포유동물, 효모, 곤충 또는 식물 세포 발현 시스템을 포함하는 임의의 재조합 발현 시스템이 사용될 수 있다.
대안적으로, 이들 핵산은 예컨대, [Adams(1983) J. Am. Chem. Soc. 105: 661; Belousov (1997) Nucleic Acids Res. 25: 3440-3444; renkel (1995) Free Radio. Biol. Med. 19: 373-380; Blommers (1994) Biochemistry 33:7886-7896; Narang (1979) Meth. Enzymol. 68: 90; Brown (1979) Meth. Enzymol. 68: 109; Beaucage (1981) Tetra. Lett. 22: 1859; U.S. 특허 No. 4,458,066]에 기재된 바와 같은 공지된 화학적 합성 기술에 의해 생체외 합성될 수 있다. 예컨대 서브클로닝, 프로브 라벨링(예컨대, 클레노우(Klenow) 폴리머라아제, 닉(nick) 번역, 증폭을 이용하는 무작위-프라이머 라벨링), 시퀀싱, 하이브리드화 등과 같은 핵산의 조작을 위한 기술이 과학 문헌 및 특허 문헌에 잘 기재되어 있으며, 이에 대해 예컨대, [Sambrook 저, MOLECULAR CLONING : A LABORATORY MANUAL(제2판), 제1-3권, Cold Spring Harbor Laboratory (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Ausubel 저, John Wiley & Sons, Inc., N.Y. (1997); LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY: HYBRIDIZATION WITH NUCLEIC ACID PROBES, 파트 I. Theory and Nucleic Acid Preparation, Tijssen 저, Elsevier, N.Y. (1993)]를 참고로 한다.
본 발명의 방법을 수행하는데 사용되는 핵산을 수득하여 조작하는 또 다른 유용한 수단은, 게놈 샘플로부터 클로닝하고, 원할 경우 예컨대, 게놈 클론 또는 cDNA 클론으로부터 분리 또는 증폭된 삽입부를 선별하여 재클로닝하는 것이다.
본 발명의 방법에 사용되는 핵산의 원은 예컨대, 포유동물 인공 염색체(MAC)에 함유된 게놈 또는 cDNA 라이브러리(예컨대, U.S. 특허 No. 5,721,118 및 6,025,155를 참고로 함); 인간 인공 염색체(예컨대, Rosenfeld (1997) Nat. Genet. 15: 333-335를 참고로 함); 효모 인공 염색체(YAC); 박테리아 인공 염색체(BAC); P1 인공 염색체(예컨대, Woon (1998) Genomics 50: 306-316를 참고로 함); PI-유도 벡터(PAC)(예컨대, Kern (1997) Biotechniques 23: 120-124를 참고로 함); 코스미드, 재조합 바이러스, 파지 또는 플라스미드를 포함한다.
한 측면에서, 본 발명의 폴리펩티드를 암호화하는 핵산을, 번역된 폴리펩티드 또는 그것의 절편의 분비를 주도할 수 있는 리더 서열을 이용하여 적당한 상에서 어셈블링한다.
본 발명은 융합 단백질 및 그것을 암호화하는 핵산을 제공한다. 본 발명의 폴리펩티드는 증가된 안정성 또는 단순화된 정제와 같은 원하는 특성을 부여하는 N-말단 동정 펩티드 등의 이종 펩티드 또는 폴리펩티드에 융합될 수 있다. 본 발명의 펩티드 및 폴리펩티드를 또한, 연결되어 있는 하나 이상의 부가적 도메인을 이용하여, 예컨대 더욱 면역원성을 갖는 펩티드를 생성시켜, 재조합 합성된 펩티드를 더욱 용이하게 분리하고, 이로써 항체 및 항체-발현 B 세포 등을 동정함으로써, 융합 단백질로서 합성 및 발현될 수 있다. 탐지 및 정제를 용이하게 하는 도메인은 예를 들어 금속 킬레이트화 펩티드, 예컨대 고정화된 금속 상의 정제를 허용하는 폴리히스티딘 관 및 히스티딘-트립토판 모듈, 고정화된 면역글로불린 상에 정제를 허용하는 단백질 A 도메인, 및 FLAGS 확장/친화성 정제 시스템(Immunex Corp., 미국 워싱턴주 시애틀 소재)에서 이용되는 도메인을 포함한다. 정제 도메인 및 모티브-포함의 펩티드 또는 폴리펩티드 간의 인자 Xa 또는 엔테로키나아제(Invitrogen, 미국 캘리포니아주 샌디에고 소재)와 같은 절단가능한 링커 서열을 포함한다. 예를 들어, 발현 벡터는 6 개의 히스티딘 잔기에 연결된 동위원소-암호화의 핵산 서열, 및 그 다음에는 티오레독신 및 엔테로키나아제 절단 부위를 포함할 수 있다(예컨대, Williams (1995) Biochemistry 34: 1787-1797; Dobeli (1998) Protein Expr. Purif. 12: 404-414을 참고로 한다). 히스티딘 잔기는 탐지 및 정제를 용이하게 하고, 한편 엔테로키나아제 절단 부위는 나머지 융합 단백질로부터 동위 원소를 정제하는 수단을 제공한다. 융합 단백질을 암호화하는 벡터 및 융합 단백질의 적용이 과학 문헌 및 특허 문헌에 잘 기재되어 있으며, 이는 예컨대 [Kroll (1993) DNA Cell. Biol., 12: 441-53]을 참고로 한다.
전사 및 번역 조절 서열
본 발명은 예컨대 프로모터 또는 인핸서와 같은 발현(예컨대, 전사 또는 번역) 조절 서열(들)에 작동적으로 연결되어, RNA 합성/발현을 주도 또는 조절하는 본 발명의 핵산(예컨대, DNA) 서열을 제공한다. 발현 조절 서열은 발현 벡터 내에 있을 수 있다. 발현 조절 서열은 발현 벡터 내에 있을 수 있다. 예시적 박테리아 프로모터는 lacI, lacZ, T3, T7, gpt, 람다 PR, PL 및 trp 를 포함한다. 예시적 진핵세포 프로모터는 조기 발현 CMV, HSV 티미딘 키나아제, 조기 및 후기 발현 SV40, 레트로바이러스로부터의 LTR 및 마우스 메탈로티오네인 I을 포함한다.
박테리아 내에서 폴리펩티드를 발현하는데 적당한 프로모터는 E. coli lac 또는 trp 프로모터, lacI 프로모터, lacZ 프로모터, T3 프로모터, T7 프로모터,gpt 프로모터, 람다 PR 프로모터, 람다 PL 프로모터, 3-포스포글리세레이트 키나아제(PGK)와 같은 당분해 효소를 암호화하는 오페론으로부터의 프로모터, 및 산 포스파타아제 프로모터를 포함한다. 진핵세포 프로모터는 조기 발현 CMV 프로모터, HSV 티미딘 키나아제 프로모터, 열 쇼크 프로모터, 조기 및 후기 SV40 프로모터, 레트로바이러스로부터의 LTR, 및 마우스 메탈로티오네인-I 프로모터를 포함한다. 원핵 또는 진핵 세포, 또는 그것의 바이러스 내의 유전자 발현을 조절하는 것으로 알려진 다른 프로모터가 또한 사용될 수 있다. 박테리아 내의 폴리펩티드 또는 그것의 절편을 발현하는데 적당한 프로모터는E. coli lac또는trp프로모터,lacI프로모터,lacZ프로모터,T3프로모터,T7프로모터,gpt프로모터,람다 P R 프로모터,람다 P L 프로모터, 3-포스포글리세레이트 키나아제(PGK)와 같은 당분해 효소를 암호화하는 오페론으로부터의 프로모터, 및 산 포스파타아제 프로모터를 포함한다 진균류 프로모터는 α인자 프로모터를 포함한다. 진핵세포 프로모터는 CMV 조기 발현 프로모터, HSV 티미딘 키나아제 프로모터, 열 쇼크 프로모터, 조기 및 후기 발현 SV40 프로모터, 레트로바이러스로부터의 LTR 및 마우스 메탈로티오네인-I 프로모터를 포함한다. 원핵 또는 진핵 세포, 또는 그것의 바이러스 내의 유전자 발현을 조절하는 것으로 알려진 다른 프로모터도 또한 사용될 수 있다.
조직-특이적 식물 프로모터
본 발명은 조직-특이적 방식으로 발현될 수 있는, 예컨대 조직-특이적 방식으로 본 발명의 자일라나제를 발현할 수 있는 발현 카세트를 제공한다. 본 발명은또한 조직-특이적 방식으로 본 발명의 자일라나제를 발현하는 식물 또는 씨를 제공한다. 조직-특이성은 씨, 줄기, 잎, 뿌리, 과실 등에 대한 특이성일 수 있다.
한 측면에서, 식물의 특정 부분 또는 씨 또는 식물 전체에 통해 발현하는데 CaMV 35S 프로모터와 같은 구성 프로모터를 사용할 수 있다. 예를 들어, 과다발현의 경우, 식물, 예컨대, 재생 식물과 같은 식물의 일부 또는 모든 조직들 내의 핵산의 발현을 주도하는 식물 프로모터 절편을 이용할 수 있다. 그러한 프로모터는 본원에서 "구성" 프로모터를 가리키며, 전개 또는 세포 분화의 대부분의 환경적 조건 및 상태 하에서 활성적이다. 구성 프로모터의 예는 꽃양배추 모자이크 바이러스(CaMV) 35S 전사 개시 영역, 아그로박테리움 투메파시엔의 T-DNA로부터 유도되는 1'- 또는 2'-프로모터, 및 당업자에 공지된 다양한 식물 유전자로부터의 다른 전사 개시 영역을 포함한다. 그러한 유전자는 예컨대, 아라비도프시스 유래의ACT11(Huang (1996)Plant Mol. Biol.33: 125-139);아라비도프시스(Arabidopsis)유래의Cat3(GenBank No. U43147, Zhong (1996)Mol. Gen. Genet.251: 196-203);브라시카 나푸스(Brassica napus)유래의 스테아로일-아실 담체 단백질 변성효소를 암호화하는 유전자(Genbank No. X74782, Solocombe (1994)Plant Physiol.104: 1167-1176); 옥수수 유래의GPcl(GenBank No. X15596; Martinez (1989)J. Mol. Biol.208: 551-565); 옥수수 유래의Gpc2(GenBank No. U45855, Manjunath (1997)Plant Mol. Biol.33: 97-112); U.S. 특허 No. 4,962,028; 5,633,440에 기재되어 있는 식물 프로모터를 포함한다.
본 발명은 예컨대, 토바모바이러스 서브게놈 프로모터를 포함할 수 있는 바이러스로부터 유도된 조직-특이적 또는 구성 프로모터(Kumagai (1995) Proc. Natl. Acad. Sci. USA 92: 1679-1683; 강한 체관부-특이적 리포터 유전자 발현을 유도하는 프로모터를 갖는, 감염된 쌀 식물에서 체관부 세포에서만 복제를 하는 쌀 텅그로 바실러스형 바이러스(RTBV); 혈관 성분, 잎살 세포 및 뿌리끝에서 최고의 활성을 갖는 카사바 엽맥 모자이크 바이러스(CVMV) 프로모터(Verdaguer(1996) Plant Mol. Biol. 31: 1129-1139)를 이용한다.
대안적으로, 식물 프로모터는 특정 조직, 기관 또는 세포 유형에서 자일라나제-발현 핵산을 주도할 수 있고(즉, 조직-특이적 프로모터), 그와 다르게는 더욱 정교한 환경적 또는 전개 조절 하에, 또는 유도성 프로모터의 조절 하에 놓일 수 있다. 전사에 영향을 줄 수 있는 환경적 조건의 예는 혐기성 조건, 승온, 광 존재, 또는 화학물질/호르몬의 분무를 포함한다. 예를 들어, 본 발명은 옥수수 유래의 건조-유도성 프로모터(Busk (1997) 이하 동일); 감자로부터 유도되는 저온, 건조 및 고염분 유도성 프로모터(Kirch (1997) Plant Mol. Biol. 33: 897-909). 을 포함한다.
조직-특이적 프로모터는 조직 내에서 전개 단계의 특정 시간 틀 내에서만 전사를 촉진할 수 있다. 예컨대,아라비도프시스(Arabidopsis)LEAFY 유전자 프로모터를 특징으로 하는 [Blazquez (1998) 식물 세포 10: 791-800]를 참고로 한다. 또한,A. 탈리아나(thaliana)꽃 정체성 결정 유전자 AP1의 프로모터 영역 내의 보존된 서열 모티브를 인식하는 전사 인자 SPL3 를 기재하고 있는 [Cardon (1997)Plant J12: 367-77]; 및 정체성 결정 프로모터 eIF4 를 기재하고 있는 [Mandel(1995) Plant Molecular Biology, Vol. 29, pp 995-1004]를 참고로 한다. 특별한 조직의 수명 사이클 전체에 걸쳐 활성적인 조직 특이적 프로모터를 사용할 수 있다. 한 측면에서, 본 발명의 핵산은 면섬유 세포 내에만 주로 활성적인 프로모터에 작동적으로 연결된다. 한 측면에서, 본 발명의 핵산은 [Rinehart (1996) 이하 동일]에 기재된 바와 같이, 면섬유 세포 신장의 단계 중에 주로 활성적인 프로모터에 작동적으로 연결된다. 핵산은 면섬유 세포(Ibid) 내에서 우선적으로 발현되는 Fbl2A 유전자 프로모터에 작동적으로 연결될 수 있다. 또한, 면섬유-특이적 프로모터, 유전자이식 면 식물의 구축 방법에 대해 기재하고 있는 [John (1997) Proc. Natl. Acad. Sci. USA 89: 5769-5773; John 등, U.S. 특허 No. 5,608,148 및 5,602,321]을 참고로 한다. 뿌리-특이적 프로모터는 본 발명의 핵산을 발현하는데 사용될 수 있다. 뿌리-특이적 프로모터의 예는, 알코올 탈수소화효소 유전자로부터의 프로모터를 포함한다[DeLisle (1990) Int. Rev. Cytol. 123: 39-60]. 본 발명의 핵산을 발현하는데 사용될 수 있는 다른 프로모터는 예컨대, 난세포-특이적, 배아-특이적, 배적-특이적, 외피-특이적, 씨 코트-특이적 프로모터, 또는 이들의 일부 조합 프로모터; 잎-특이적 프로모터(예컨대, 옥수수 내의 잎-특이적 프로모터에 대해 기재하고 있는 Busk (1997) Plant J. 11: 1285-1295 를 참고함);아그로박테리움 리조게네스(Agrobacterium rhizogenes)로부터의 ORF13 프로모터(뿌리에서 높은 활성을 나타냄, 예컨대 Hansen (1997) 이하 동일 참고); 옥수수 화분 특이적 프로모터(예컨대, Guerrero (1990) Mol. Gen. Genet. 224: 161-168 참고); 과실 노화 및 잎 이탈 및 보다 적은 정도의 꽃 이탈 중에 활성적인 토마토 프로모터(예컨대,Blume (1997) Plant J. 12: 731-746 참고); 감자 SK2 유전자로부터의 암술-특이적 프로모터(예컨대, Ficker (1997) Plant Mol. Biol. 35: 425431 참고); 외래 유전자를 활성적으로 성장하는 신초 또는 섬유의 표피층에 발현시키는 것을 목표로 하는 것을 유용한 도구로 만드는 유전자이식 알팔파의 성장 및 꽃 생장점의 표피 조직에서 활성적인 완두콩으로부터의 Blec4 유전자; 난세포-특이적 BEL1 유전자 (예컨대 Reiser (1995) Cell 83 : 735-742, GenBank No. U39944 참고); 및/또는 분열조직 및/또는 급속 분할 세포에서 높은 전사 수준을 부여할 수 있는 식물 프로모터 영역에 대해 기재하고 있는 Klee의 U.S. 특허 No. 5,589,583의 프로모터를 포함한다.
대안적으로, 옥신과 같은 식물 호르몬에 노출 시에 유도가능한 식물 프로모터를 본 발명의 핵산을 발현하는데 사용한다. 예를 들어, 본 발명은 대두(Glycine max L.) 내의 옥신-반응 원소 E1 프로모터 절편(AuxREs) (Liu (1997) Plant Physiol. 115: 397-407); 옥신-반응성아라비도프시스(Arabidopsis)GST6 프로모터 (또한 살리실산 및 과산화수소에 대해 반응성임) (Chen (1996) Plant J. 10: 955-966); 담배로부터의 옥신-유도성 parC 프로모터 (Sakai (1996) 37: 906-913); 식물 바이오틴 반응성 성분(Streit (1997) Mol. Plant Microbe Interact. 10: 933-937); 및 스트레스 호르몬 아브시스산에 대해 반응성인 프로모터(Sheen (1996) Science 274: 1900-1902)를 사용할 수 있다.
본 발명의 핵산은 또한, 제초제 또는 항생제와 같은 식물에 투여될 수 있는 화학적 시약에 대해 노출 시에 유도될 수 있는 식물 프로모터에 작동적으로 연결될 수 있다. 예를 들어, 벤젠술폰아미드 제초제 완화제에 의해 활성화된 옥수수 In2-2프로모터를 사용할 수 있고(De Veylder (1997) Plant Cell Physiol. 38: 568-577); 상이한 제초제 완화제의 적용은 뿌리, 배수조직 및 생장점 분열조직에서의 발현을 포함한 유전자 발현 패턴을 유도한다. 암호화 서열은, 아베나 사티바(Avena sativa) L. (귀리) 아르기닌 데카르복시나아제 유전자를 함유하는 유전자이식 담배 식물과 함께 기재된 바와 같은 예컨대 테트라사이클린-유도성 프로모터 (Masgrau (1997) Plant J. 11: 465-473); 또는 살리실산-반응성 성분 (Stange (1997) Plant J. 11: 1315-1324)의 조절 하에 있을 수 있다. 화학적-유도(예컨대, 호르몬- 또는 살충제-) 프로모터, 즉 당 기술분야에서 유전자이식 식물에 적용될 수 있는 화학 물질에 대해 반응성인 프로모터를 이용하여, 본 발명의 폴리펩티드의 발현을 식물의 특별한 전개 단계에서 유도할 수 있다. 이에 따라, 본 발명은 또한 작물의 임의의 전개 단계에서 유도가능하며, 숙주가 옥수수, 쌀, 보리, 밀, 감자 또는 다른 작물들과 같은 식물 종에 제한되지 않는 폴리펩티드를 위한 유도성 유전자 암호화를 갖는 유전자이식 식물을 제공한다.
당업자라면 조직-특이적 식물 프로모터가 표적 조직 외의 조직에서 작동적으로 연결된 서열의 발현을 유도할 수 있음을 인식할 것이다. 이에 따라, 조직-특이적 프로모터는 표적 조직 또는 세포 유형에서 우선적으로 발현을 유도하나, 다른 조직에서도 일부 발현을 초래할 수도 있는 것이다.
본 발명의 핵산은 또한 화학적 시약에 노출 시에 유도가능한 식물 프로모터에 작동적으로 연결될 수 있다. 이 시약은 예컨대, 유전자이식 식물에 분무되는 등, 그 적용이 가능한 제초제, 합성 옥신 또는 항생제를 포함한다. 본 발명의 자일라나제-생성 핵산의 유도성 발현은 사육자가 최적의 자일라나제 발현 및/또는 활성을 갖는 식물을 선택하도록 한다. 이에 따라, 식물 부분의 전개가 조절될 수 있다. 이러한 식으로, 본 발명은 식물 및 식물 부분의 수확을 용이하게 하는 수단을 제공한다. 예를 들어, 각종 구현예에서, 벤젠술폰아미드 제초제 완화제에 의해 활성화된 옥수수 In2-2 프로모터를 사용할 수 있고(De Veylder (1997) Plant Cell Physiol. 38: 568-577) ; 상이한 제초제 완화제의 적용은 뿌리, 배수조직 및 생장점 분열조직에서의 발현을 포함한 유전자 발현 패턴을 유도한다. 암호화 서열은,아베나 사티바(Avena sativa) L.(귀리) 아르기닌 데카르복시나아제 유전자를 함유하는 유전자이식 담배 식물과 함께 기재된 바와 같은 예컨대 테트라사이클린-유도성 프로모터(Masgrau(1997) Plant J. 11: 465-473); 또는 살리실산-반응성 성분(Stange (1997) Plant J. 11: 1315-1324)의 조절 하에 있을 수 있다.
일부 측면에서, 적절한 폴리펩티드 발현은 암호화 영역의 3'-말단에 폴리아데닐화 영역을 요할 수 있다. 폴리아데닐화 영역은 천연 유전자, 다양한 다른 식물(또는 동물 등) 유전자, 또는아그로박테리아(Agrobacterial)T-DNA 내의 유전자로부터 유도될 수 있다.
발현 벡터 및 클로닝 비히클
본 발명은 본 발명의 핵산, 예컨대 본 발명의 자일라나제를 암호화하는 서열을 포함하는 발현 벡터 및 클로닝 비히클을 제공한다. 본 발명의 발현 벡터 및 클로닝 비히클은 바이러스 입자, 바쿨로바이러스, 파지, 플라스미드, 파지미드, 코스미드, 포스미드, 박테리아 인공 염색체, 바이러스 DNA(예컨대, 우두, 아데노바이러스, 계두 바이러스, 가성 광견병 및 SV40의 유도체), PI-기재의 인공 염색체, 효모 플라스미드, 효모 인공 염색체 및, 당해 특정 숙주에 대해 특이적인 임의의 다른 벡터(예컨대, 바실러스, 아스퍼질러스 및 효모)를 포함할 수 있다. 본 발명의 벡터는, 염색체성, 비-염색체성 및 합성 DNA 서열을 포함할 수 있다. 많은 수의 적당한 벡터가 당업자에게 공지되어 있고, 시중 입수가능하다. 예시적 벡터는 하기 것들을 포함한다: 박테리아: pQE 벡터(Qiagen), pBluescript 플라스미드, pNH 벡터, 람다-ZAP 벡터 (Stratagene), ptrc99a, pKK223-3, pDR540, pRIT2T (Pharmacia); 진핵세포: pXTl, pSG5 (Stratagene), pSVK3, pBPV, pMSG, pSVLSV40 (Pharmacia). 그러나, 임의의 다른 플라스미드 또는 다른 벡터가, 그것이 숙주 내에서 복제가능하고 생존가능하다면 사용될 수 있다. 적은 복제 수 또는 큰 복제 수의 벡터를 본 발명에서 사용할 수 있다.
발현 벡터는 프로모터, 번역 개시를 위한 리보솜 결합 부위 및 전사 종결자를 포함할 수 있다. 벡터는 또한 발현 증폭을 위한 적당한 서열을 포함할 수 있다. 포유동물 발현 벡터는 복제 기원, 임의의 필요한 리보솜 결합 부위, 폴리아데닐화 부위, 스플라이스(접합) 도너 및 어셉터 부위, 전사 종결 서열 및 5' 측부 비-전사 서열을 포함할 수 있다. 일부 측면에서, SV40 스플라이스 및 폴리아데닐화 부위로부터 유도된 DNA 서열을 사용하여, 요구되는 비-전사 유전 요소를 제공할 수 있다.
한 측면에서, 발현 벡터는 통상적으로, 벡터를 함유하는 숙주 세포의 선택을 허용하기 위해, 하나 이상 선택가능한 마커 유전자를 함유한다. 그러한 선택가능한 마커는 디히드로폴레이트 환원효소를 암호화하는 유전자, 또는 진핵세포 배양물을위한 네오마이신 내성을 부여하는 유전자, E. coli 내에서 테트라사이클린 또는 암피실린 내성을 부여하는 유전자, 및S. 세레비지아에(cerevisiae)TRP1 유전자를 포함한다. 클로르암페시콜 전달효소(CAT) 벡터 또는 선택가능한 마커를 갖는 다른 벡터를 이용하여, 임의의 원하는 유전자로부터 프로모터 영역을 선택할 수 있다.
진핵세포 내에서 폴리펩티드 또는 그것의 절편을 발현하기 위한 벡터는 또한 발현 수준을 증가시키기 위해 인핸서를 함유할 수 있다. 인핸서는 전사를 증진하기 위해 프로모터 상에 작용하고, 길이가 통상 약 10 내지 약 300 bp인 DNA의 시스-작용 원소이다. 그 예는 복제 기원 bp 100 내지 270의 후측에 있는 SV40 인핸서, 사이토메갈로바이러스 조기 프로모터 인핸서, 복제 기원의 후측에 있는 폴리오마 인핸서, 및 아데노바이러스 인핸서를 포함한다.
핵산 서열은 다양한 절차들에 의해 벡터에 삽입될 수 있다. 일반적으로, 서열은 적당한 제한 엔도뉴클레아제로 삽입부 및 벡터를 분해한 후, 벡터 내에 원하는 위치에 접합된다. 대안적으로, 삽입부 및 벡터의 양자 모두의 블런트 말단이 접합될 수 있다. 다양한 클로닝 기술이, 당업계에 공지되어 있으며, 예컨대 Ausubel 및 Sambrook 등에 의해 공지되어 있다. 그러한 절차 및 기타 절차는 당업자의 범주 내에 포함되는 것으로 한다.
벡터는 플라스미드, 바이러스 입자 또는 파지의 형태일 수 있다. 다른 벡터는 염색체성, 비-염색체성 및 합성 DNA 서열, SV40의 유도체; 박테리아 플라스미드, 파지 DNA, 바쿨로바이러스, 효모 플라스미드, 플라스미드와 파지 DNA의 조합으로부터 유도된 벡터, 바이러스 DNA, 예컨대 우두, 아데노바이러스, 계두 바이러스및 가성 광견병을 포함한다. 원핵 및 진핵 생물계 숙주에 사용하기 위한 다양한 클로닝 및 발현 벡터가 예컨대 Sambrook 에 의해 기재되어 있다.
사용될 수 있는 특별한 박테리아 벡터는, 공지된 클로닝 벡터 pBR322 (ATCC 37017), pKK223-3 (Pharmacia Fine Chemicals, 스웨덴 우프살라 소재), GEM1 (Promega Biotec, 미국 위스콘신주 매디슨 소재) pQE70, pQE60, pQE-9 (Qiagen), pD10, psiX174 pBluescript II KS, pNH8A, pNH16a, pNH18A, pNH46A (Stratagene), ptrc99a, pKK223-3, pKK233-3, DR540, pRIT5 (Pharmacia), pKK232-8 및 pCM7 를 포함하는 유전 요소를 포함하는 시중 입수가능한 플라스미드를 포함한다. 특히 진핵세포 벡터는 pSV2CAT, pOG44, pXTl, pSG (Stratagene) pSVK3, pBPV, pMSG 및 pSVL(Pharmacia)를 포함한다. 그러나, 임의의 다른 벡터도 숙주 세포 내에서 복제가능하고 생존가능하다면 사용될 수 있다.
본 발명의 핵산은 발현 카세트, 벡터 또는 바이러스 내에서 발현될 수 있고, 식물 세포 및 씨 내에서 안정하게 발현될 수 있다. 한 예시적인 일시 발현 시스템은 유전자부체 발현 시스템, 예컨대 초고도 코일 DNA를 함유하는 유전자부체 미니-염색체의 전사에 의해 핵 내에서 생성된 꽃양배추 모자이크 바이러스(CaMV)의 바이러스 RNA 유전자를 이용하며, 이에 대해서는 예컨대, [Covey (1990) Proc. Natl. Acad. Sci. USA 87: 1633-1637]를 참고로 한다. 대안적으로, 암호화 서열, 즉 본 발명의 서열의 모두 또는 서브-절편을, 숙주 염색체 DNA의 일체적 일부가 되는 식물 숙주 세포 게놈에 삽입할 수 있다. 센스 또는 안티센스 전사가 이런 식으로 발현될 수 있다. 본 발명의 핵산으로부터의 서열(예컨대, 프로모터 또는 암호화 영역)을 포함하는 벡터는 식물 세포 또는 씨에 대해 선택가능한 표현형을 부여하는 마커 유전자를 포함할 수 있다. 예를 들어, 마커는 살생제 내성, 특히 항생 내성, 예컨대 카나마이신, G418, 블레오마이신, 하이그로마이신에 대한 내성, 또는 제초제 내성, 예컨대 클로로술푸론 또는 바스타(Basta)에 대한 내성을 암호화할 수 있다.
식물 내에서 핵산 및 단백질을 발현할 수 있는 발현 벡터가 당업계에 공지되어 있고, 이는, 예컨대아그로박테리움 spp., 감자 바이러스 X(예컨대, Angell (1997) EMBO J. 16: 3675-3684 참고), 담배 모자이크 바이러스(예컨대, Casper (1996) Gene 173: 69-73 참고), 토마토 부쉬 왜화 바이러스(예컨대, Hillman (1989) Virology 169: 42-50 참고), 담배 에취 바이러스(예컨대, Dolja (1997) Virology 234: 243-252참고), 강낭콩 금빛 누른 모자이크 바이러스(예컨대, Morinaga (1993) Microbiol. Immunol. 37: 471-476 참고), 꽃양배추 모자이크 바이러스(예컨대, Cecchini (1997) Mol. Plant Microbe Interact. 10: 1094-1101 참고), 옥수수 Ac/Ds 전위성 성분(예컨대, Rubin (1997) Mol. Cell. Biol. 17: 6294-6302; Kunze (1996) Curr. Top. Microbiol. Immunol. 204: 161-194 참고), 및 옥수수 억제자-변이자(Spm) 전위성 성분(예컨대, Schlappi (1996) Plant Mol. Biol. 32: 717-725 참고); 및 그것들의 유도체로부터의 벡터를 포함할 수 있다.
한 측면에서, 발현 벡터는 두 개의 유기체, 예를 들어 발현을 위한 포유동물 세포 또는 곤충 세포에서, 또한 클로닝 및 증폭을 위한 원핵세포 숙주 내에서 유지될 수 있도록 하는 2 개의 복제 시스템을 가질 수 있다. 또한, 발현 벡터의 일체화를 위해, 발현 벡터는 숙주 세포 게놈에 대해 상동성인 하나 이상의 서열을 가질 수 있다. 그것은 발현 작제물의 측면에 설수 있는 2 개의 상동성 서열을 가질 수 있다. 일체화 벡터는 벡터에 포함되기에 적당한 상동성 서열을 선택함으로써, 숙주 세포 내의 특이적 위치에 지정될 수 있다. 일체화 벡터를 위한 작제물이 당업계에 공지되어 있다.
본 발명의 발현 벡터는 또한 형질변환된 박테리아 균주의 선택을 허용하는 선택가능한 마커 유전자, 예컨대 박테리아가 암피실린, 클로로암페니콜, 에리트로마이신, 카나마이신, 네오마이신 및 테트라사이클린과 같은 약물에 대해 내성을 가질 수 있도록 하는 유전자를 포함할 수 있다. 선택가능한 마커는 또한 생합성 유전자, 예컨대 히스티딘, 트립토판 및 류신 생합성 경로에서의 생합성 유전자를 포함할 수 있다.
발현 벡터 내의 DNA 서열은 적당한 발현 조절 서열(들)(프로모터)에 작동적으로 연결되어, RNA 합성을 주도한다. 특히 박테리아 프로모터라고 하는 것은, lacI, lacZ, T3,T7, gpt, 람다 PR, PL및 trp을 포함한다. 진핵세포 프로모터는 조기 발현 CMV, HSV 티미딘 키나아제, 조기 및 후기 발현 SV40, LTR, 및 마우스 메탈로티오네인 I을 포함한다 적당한 벡터 및 프로모터의 선택은 당업자의 수준 내에 포함된다. 발현 벡터는 또한 번역 개시를 위한 리보솜 결합 부위 및 전자 종결자를 함유한다. 벡터는 또한 발현 증폭을 위해 적당한 서열을 포함할 수 있다. 프로모터 영역은 클로르암페니콜 전달효소(CAT) 벡터, 또는 선택가능한 마커를 갖는 기타 벡터를 이용하여 임의의 원하는 유전자로부터 선택될 수 있다. 게다가, 발현 벡터는 바람직하게 하나 이상의 선택가능한 마커 유전자를 함유하여, 예컨대 디히드로폴레이트 환원효소, 또는 진핵세포 배양물을 위한 네오마이신 내성, E. coli 내에서의 테트라사이클린 또는 암피실린 내성과 같은, 형질전환된 숙주 세포의 선택을 위한 표현형을 제공한다.
포유동물 발현 벡터는 또한 복제 기원, 임의의 필요한 리보솜 결합 부위, 폴리아데닐화 부위, 스플라이스 도너 및 어셉터 부위, 전사 종결 서열 및 5' 측부 비-전사 서열을 포함할 수 있다. 일부 측면에서, SV40 스플라이스 및 폴리아데닐화 부위로부터 유도된 DNA 서열을 사용하여, 요구되는 비-전사 유전 요소를 제공할 수 있다.
진핵세포 내에서 폴리펩티드 또는 그것의 절편을 발현하기 위한 벡터는 또한 발현 수준을 증가시키기 위해 인핸서를 함유할 수 있다. 인핸서는 전사를 증진하기 위해 프로모터 상에 작용하고, 길이가 통상 약 10 내지 약 300 bp인DNA의 시스-작용 원소이다. 그 예는 복제 기원 bp 100 내지 270의 후측에 있는 SV40 인핸서, 사이토메갈로바이러스 조기 프로모터 인핸서, 복제 기원의 후측에 있는 폴리오마 인핸서, 및 아데노바이러스 인핸서를 포함한다.
부가적으로, 발현 벡터는 통상적으로 벡터를 함유하는 숙주 세포의 선택을 허용하기 위해, 하나 이상 선택가능한 마커 유전자를 함유한다. 그러한 선택가능한 마커는 디히드로폴레이트 환원효소를 암호화하는 유전자, 또는 진핵세포 배양물을 위한 네오마이신 내성을 부여하는 유전자,E. coli내에서 테트라사이클린 또는 암피실린 내성을 부여하는 유전자, 및 에스. 세레비재 TRP1 유전자를 포함한다.
일부 측면에서, B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티드들 중 하나, 또는 그것의 적어도 약 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는150개 연속 아미노산을 포함하는 절편을 암호화하는 핵산을 적당한 상에서 번역된 폴리펩티드 또는 그것의 절편의 분비를 주도할 수 있는 리더 서열과 함께 어셈블링한다. 임의적으로, 핵산은 B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티드들 중 하나, 또는 그것의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개 연속 아미노산을 포함하는 절편이 이종 펩티드 또는 폴리펩티드, 예컨대 증가된 안정성 또는 단순화된 정제와 같은 원하는 특성을 부여하는 N-말단 동정 펩티드에 융합된 융합 폴리펩티드를 암호화할 수 있다.
핵산 서열은 다양한 절차들에 의해 벡터에 삽입될 수 있다. 일반적으로, 서열은 적당한 제한 엔도뉴클레아제로 삽입부 및 벡터를 분해한 후, 벡터 내에 원하는 위치에 접합된다.
대안적으로, 삽입부 및 벡터의 양자 모두의 블런트 말단이 접합될 수 있다. 다양한 클로닝 기술이 [Ausubel 등의 Current Protocols in Molecular Biology, John Wiley 503 Sons, Inc. (1997) 및 Sambrook 등, Molecular Cloning: A Laboratory Manual 제2판, Cold Spring Harbor Laboratory Press (1989)]에 공지되어 있다. 그러한 절차 및 기타 절차는 당업자의 범주 내에 포함되는 것으로 한다.
벡터는 예를 들어 플라스미드, 바이러스 입자 또는 파지의 형태일 수 있다. 다른 벡터는 염색체성, 비-염색체성 및 합성 DNA 서열, SV40의 유도체; 박테리아플라스미드, 파지 DNA, 바쿨로바이러스, 효모 플라스미드, 플라스미드와 파지 DNA의 조합으로부터 유도된 벡터, 바이러스 DNA, 예컨대 우두, 아데노바이러스, 계두 바이러스 및 가성 광견병을 포함한다. 원핵 및 진핵 생물계 숙주에 사용하기 위한 다양한 클로닝 및 발현 벡터가 [Sambrook 등의 Molecular Cloning: A Laboratory Manual, 제2판, Cold Spring Harbor, N.Y. (1989)]에 기재되어 있다.
숙주 세포 및 형질전환된 세포
본 발명은 본 발명의 핵산 서열, 예컨대, 본 발명의 자일라나제 또는 본 발명의 벡터를 암호화하는 서열을 포함하는 형질전환된 세포를 제공한다. 숙주 세포는 당업자에게 잘 알려진 임의의 숙주 세포들일 수 있고, 이는 원핵 세포, 진핵 세포, 예컨대 박테리아 세포, 진균류 세포, 효모 세포, 포유동물 세포, 곤충 세포 또는 식물 세포를 포함한다. 예시적 박테리아 세포는 이. 콜라이(E. coli),스트렙토마이세스(Streptomyces),바실러스 섭틸리스(Bacillus subtilis),살모넬라 티피무리움(Salmonella typhimurium)및, 슈도모나스(Pseudomonas),스트렙토마이세스(Streptomyces)및 스타필로코쿠스(Staphylococcus)속에 속하는 각종 종들을 포함한다. 예시적 곤충 세포는 드로소필라(Drosophila) S2및 스포도프테라(Spodoptera) Sf9를 포함한다. 예시적 동물 세포는 CHO, COS 또는 바우스 흑색종(Bowes melanoma) 또는 임의의 마우스 또는 인간 세포주를 포함한다. 적당한 숙주의 선택은 당업자의 역량 내이다. 매우 다양한 고급 식물 종들의 형질전환 기술들이 공지되어 있고, 기술 및 과학 문헌에 기재되어 있다. 이에 대해, 예컨대 [Weising (1988) Ann. Rev. Genet. 22: 421-477; U.S. 특허 No. 5,750,870]를 참고로 한다.
벡터는 형질전환, 트랜스펙션, 형질도입, 바이러스 감염, 유전자 총 또는 Ti-매개 유전자 전달을 포함하는 다양한 기술들 중 임의의 기술을 이용하여 숙주 세포에 도입될 수 있다. 특별한 방법은 인산칼슘 트랜스펙션, DEAE-Dextran 매개 트랜스펙션, 리포펙션 또는 전기천공[Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology (1986)]을 포함한다.
한 측면에서, 본 발명의 핵산 또는 벡터를 선별을 위한 세포에 도입하여, 후속되는 핵산의 발현에 적당한 방식으로 핵산이 세포에 들어가게 된다. 도입 방법은 대체로 표적 세포 유형에 의해 정해진다. 예시적 방법은 CaPO4석출법, 리포솜 융합, 리포펙션(예컨대, LIPOFECTINTM), 전기천공, 바이러스 감염 등을 포함한다. 후보 핵산은 안정하게 숙주 세포의 게놈으로 일체화될 수 있거나(예를 들어, 레트로바이러스 도입을 이용), 세포질에 일시적으로 또는 안정하게 존재할 수 있다(즉, 표준 조절 서열, 선택 마커 등을 이용하여, 전통적인 플라스미드의 이용을 통해). 많은 약제학적으로 중요한 선별이 인간 또는 모델 포유동물 세포 표적을 필요로 하기 때문에, 그러한 표적을 트랜스펙션할 수 있는 레트로바이러스 벡터를 사용할 수 있다.
적당한 경우, 공학처리된 숙주 세포를, 프로모터의 활성화, 형질변이체의 선택 또는 본 발명의 유전자 증폭에 적당하게 변형된 통상적인 영양 배지에서 배양할 수 있다. 적당한 숙주 균주의 형질전환 및 적당한 세포 밀도에 대한 숙주 균주의성질에 따라, 선택된 프로모터는 적당한 수단(예컨대, 온도 이동 또는 화학적 유도)을 이용하여 유도될 수 있고, 세포는 원하는 폴리펩티드 또는 그것의 절편을 생성시키도록 하는 부가적 기간동안 배양될 수 있다.
세포는 원심분리 및 물리적 또는 화학적 수단에 의한 붕괴로써 수득될 수 있고, 이에 수득된 조질의 추출물을 추가 정제를 위해 보유한다. 단백질의 발현을 위해 이용되는 미생물 세포는 냉해동 사이클링, 초음파처리, 기계적 붕괴 또는 세포 분해제의 이용을 포함하는 임의의 통상적인 방법에 의해 붕괴될 수 있다. 그러한 방법은 당업자에게 공지되어 있다. 발현된 폴리펩티드 또는 그것의 절편은 황산암모늄 또는 에탄올 석출, 산 추출, 음이온 또는 양이온 교환 크로마토그래피, 포스포셀룰로스 크로마토그래피, 소수성 상호작용 크로마토그래피, 친수성 크로마토그래피, 히드록시라파타이트 크로마토그래피 및 레시틴 크로마토그래피를 포함하는 방법에 의해 재조합 세포 배양물로부터 회수 및 정제될 수 있다. 폴리펩티드의 형상(configuration)을 완성할 때, 필요한 경우, 단백질 재풀림 단계를 이용할 수 있다. 원할 경우, 고성능 액체 크로마토그래피(HPLC)를 최종 정제 단계를 위해 이용할 수 있다.
숙주 세포 내의 작제물을 통상적 방식으로 이용하여, 재조합 서열에 의해 암호화되는 유전자 산물을 생성할 수 있다. 재조합 생성 절차에서 이용되는 숙주에 따라, 벡터를 함유하는 숙주 세포에 의해 생성되는 폴리펩티드는 글리코실화되거나, 비-글리코실화될 수 있다. 본 발명의 폴리펩티드는 개시 메티오닌 아미노산 잔기를 포함하거나 포함하지 않을 수 있다.
세포-비함유 번역 시스템을 또한 이용하여, 본 발명의 폴리펩티드를 생성시킬 수 있다. 세포-비함유 번역 시스템은 폴리펩티드 또는 그것의 절편을 암호화하는 핵산에 작동적으로 연결된 프로모터를 포함하는 DNA 작제물로부터 전사된 mRNA를 사용할 수 있다. 일부 측면에서, DNA 작제물은 생체외 전사 반응을 수행하기 전에 선형화될 수 있다. 이어서, 전사된 mRNA를 토끼 망상적혈구 추출물과 같은 적당한 세포-비함유 번역 추출물과 함께 항온처리하여, 원하는 폴리펩티드 또는 그것의 절편을 생성시킨다.
발현 벡터는 하나 이상 선택가능성 마커 유전자를 함유하여, 디히드로폴레이트 환원효소 또는 진핵세포 배양물을 위한 네오마이신 내성,E. coli내에서 테트라사이클린 또는 암피실린 내성과 같은 형질전환된 숙주 세포의 선택을 위한 표현형을 제공할 수 있다.
당해 폴리뉴클레오티드, 예컨대 본 발명의 핵산을 함유하는 숙주 세포를, 프로모터의 활성화, 형질전환체의 선택 또는 유전자의 증폭에 적당하게 변형된 통상적인 영양 배지에서 배양할 수 있다. 배양 조건, 예컨대 온도, pH 등은 발현을 위해 선택된 숙주 세포에서 이전에 사용된 것들과 동일하고, 이는 당업자에게 명백할 것이다. 이어서, 특이화 효소 활성을 갖는 것으로 동정된 클론을 시퀀싱하여, 증진된 활성을 갖는 효소를 암호화하는 폴리뉴클레오티드 서열을 동정한다.
본 발명은 본 발명의 핵산, 예컨대, 약 100개 이상의 잔기로 된 영역 상에, 핵산 A 군 핵산 서열의 서열에 대해, 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%,62%,63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%,72%, 73%, 74%, 75%, 76%, 77%,78%, 79%,80%, 81%, 82%,83%, 84%, 85%,86%, 87%, 88%,89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 상동성을 갖는 핵산 서열을 포함하는 핵산(여기에서 서열 상동성은 서열 비교 알고리즘을 이용하는 분석 또는 시각적 조사에 의해 결정됨), 또는 A 군 핵산 서열, 또는 그것의 서브서열에서 표시되는 핵산 서열에 대해 엄격한 조건 하에 하이브리드화하는 핵산을 갖는 벡터를 발현하는 것을 포함하는 세포 내에서의 재조합 자일라나제을 과다발현시키는 방법을 제공한다. 과다발현은 임의의 수단, 예컨대 고활성 프로모터, 디시스트로닉 벡터 또는 벡터의 유전자 증폭을 이용하여 수행될 수 있다.
본 발명의 핵산은 임의의 생체내 또는 생체외 발현 시스템에서 발현될 수 있다. 임의의 세포 배양물 시스템을 이용하여, 박테리아, 곤충, 효모, 진균류 또는 포유동물 배양물을 포함하는 재조합 단백질을 발현 또는 과다발현시킬 수 있다. 과다발현은 프로모터, 인핸서, 벡터(예컨대, 레플리콘 벡터, 디시스트로닉 벡터의 이용) (예컨대, Gurtu (1996) Biochem. Biophys. Res. Commun. 229: 295-8 참고), 매질, 배양 시스템 등의 적당한 선택에 의해 수행될 수 있다. 한 측면에서, 세포계 내에서, 예컨대 글루타민 합성효소와 같은 선택 마커를 이용하는 유전자 증폭(예컨대, Sanders (1987) Dev. Biol. Stand. 66: 55-63 참고)을 이용하여, 본 발명의 폴리펩티드를 과다발현시킨다.
이러한 접근법에 관한 부가적인 상세한 설명이 공개된 문헌에 나와 있고/있거나, 당업자에게 알려져 있다. 특히 비제한적 예시, 예컨대 공개적으로 입수가능한 문헌은 EP 0659215(WO 9403612 Al) (Nevalainen 등); Lapidot, A., Mechaly, A., Shoham, Y., "바실러스 스테아로써모필러스T-6으로부터의 열안정성 자일라나제의 과다발현 및 단일단계 정제(Overexpression and single-step purification of a thermostable Xylanase fromBacillus stearothermophilusT-6)", J. Biotechnol. Nov 51: 259-64(1996); Luthi, E., Jasmat, N. B., Bergquist, P.L., "매우 호열성인칼도셀럼 사카로라이티쿰으로부터의 자일라나제(Xylanase from the extremely thermophilic bacteriumCaldocellum saccharolyticum):에쉐리키아 콜라이내의 유전자의 과다발현 및 유전자 산물의 특성화(overexpression of the gene inEscherichia coliand characterization of the gene product)", Appl. Environ. Microbiol. Sep 56: 2677-83(1990); 및 Sung, W.L., Luk, C.K., Zahab, D.M., Wakarchuk, W., "바실러스 섭틸리스의 과다발현 및에쉐리키아 콜라이내의 서큘란스 자일라나제(Overexpression of theBacillus subtilisandcirculansXylanase inEscherichia coli)", Protein Expr. Purif. Jun 4: 200-6 (1993)"]을 포함하며, 단 이 참고문헌들은 본원의 본 발명에 따른 효소를 교시하고 있지 않다.
숙주 세포는 원핵 세포, 진핵 세포, 포유동물 세포, 곤충 세포 또는 식물 세포를 포함하는 당업자에게 자명한 임의의 숙주 세포일 수 있다. 적당한 숙주의 전형적인 예로서, 박테리아 세포, 예컨대E. coli, 스트렙토마이세스(Streptomyces), 바실러스 섭틸리스(Bacillus subtilis), 살모넬라 티피무리움(Salmonella typhimurium)및,슈도모나스(Pseudomonas), 스트렙토마이세스(Streptomyces)및스타필로코쿠스(Staphylococcus)속에 속하는 각종 종들, 진균류 세포, 예컨대 효모, 곤충 세포, 예컨대드로소필라(Drosophila) S2및스포도프테라(Spodoptera) Sf9, 동물 세포, 예컨대 CHO, COS 또는 바우스 흑색종 및 아데노바이러스를 들 수 있다. 적당한 숙주의 선택은 당업자의 역량 내에 속한다.
벡터는 형질전환, 트랜스펙션, 형질도입, 바이러스 감염, 유전자 총 또는 Ti-매개 유전자 전달을 포함하는 다양한 기술들 중 임의의 기술을 이용하여 숙주 세포에 도입될 수 있다. 특별한 방법은 인산칼슘 트랜스펙션, DEAE-Dextran 매개 트랜스펙션, 리포펙션 또는 전기천공[Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology (1986)]을 포함한다.
적당한 경우, 공학처리된 숙주 세포를, 프로모터의 활성화, 형질변이체의 선택 또는 본 발명의 유전자 증폭에 적당하게 변형된 통상적인 영양 배지에서 배양할 수 있다. 적당한 숙주 균주의 형질전환 및 적당한 세포 밀도에 대한 숙주 균주의 성질에 따라, 선택된 프로모터는 적당한 수단(예컨대, 온도 이동 또는 화학적 유도)을 이용하여 유도될 수 있고, 세포는 원하는 폴리펩티드 또는 그것의 절편을 생성시키도록 하는 부가적 기간동안 배양될 수 있다.
세포는 원심분리 및 물리적 또는 화학적 수단에 의한 붕괴로써 수득될 수 있고, 이에 수득된 조질의 추출물을 추가 정제를 위해 보유한다. 단백질의 발현을 위해 이용되는 미생물 세포는 냉해동 사이클링, 초음파처리, 기계적 붕괴 또는 세포 분해제의 이용을 포함하는 임의의 통상적인 방법에 의해 붕괴될 수 있다. 그러한 방법은 당업자에게 공지되어 있다. 발현된 폴리펩티드 또는 그것의 절편은 황산암모늄 또는 에탄올 석출, 산 추출, 음이온 또는 양이온 교환 크로마토그래피, 포스포셀룰로스 크로마토그래피, 소수성 상호작용 크로마토그래피, 친수성 크로마토그래피, 히드록시라파타이트 크로마토그래피 및 레시틴 크로마토그래피를 포함하는 방법에 의해 재조합 세포 배양물로부터 회수 및 정제될 수 있다. 폴리펩티드의 형상(configuration)을 완성할 때, 필요한 경우, 단백질 재풀림 단계를 이용할 수 있다. 원할 경우, 고성능 액체 크로마토그래피(HPLC)를 최종 정제 단계를 위해 이용할 수 있다.
각종 포유동물 세포 배양 시스템을 또한 이용하여, 재조합 단백질을 발현시킬 수 있다. 포유동물 발현 시스템의 예는 원숭이 신장 섬유아세포의 COS-7 세포주 [Gluzman 기재, Cell, 23: 175 (1981)] 및 상용가능한 벡터로부터 단백질을 발현시킬 수 있는 기타 세포주, 예컨대 C127, 3T3, CHO, HeLa 및 BHK 세포주를 포함한다.
숙주 세포 내의 작제물을 통상적 방식으로 이용하여, 재조합 서열에 의해 암호화되는 유전자 산물을 생성할 수 있다. 재조합 생성 절차에서 이용되는 숙주에 따라, 벡터를 함유하는 숙주 세포에 의해 생성되는 폴리펩티드는 글리코실화되거나, 비-글리코실화될 수 있다. 본 발명의 폴리펩티드는 개시 메티오닌 아미노산 잔기를 포함하거나 포함하지 않을 수 있다.
대안적으로, B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티드, 또는 그것의 적어도5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개의 연속 아미노산들을 포함하는 절편을 통상적인 펩티드 합성기로써 합성 제조할 수 있다. 다른 측면에서, 폴리펩티드의 절편 또는 부분을 이용하여, 펩티드 합성에 의해 대응하는 전장 폴리펩티드를 생성시킬 수 있으므로, 절편을 전장 폴리펩티드의 제조를 위한 중간체로서 이용할 수 있다.
폴리펩티드를 암호화하는 핵산 또는 그것의 절편에 작동적으로 연결된 프로모터를 포함하는 DNA 작제물로부터 전사된 mRNA를 이용하여, B 군 아미노산 서열 및 그것과 실질적으로 동일한 서열의 폴리펩티드, 또는 그것의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개의 연속 아미노산을 포함하는 절편 중 하나를 생성시키기 위해, 세포-비함유 번역 시스템을 또한 이용할 수 있다. 한 측면에서, DNA 작제물은 생체외 전사 반응을 수행하기 전에 선형화될 수 있다. 이어서, 전사된 mRNA를 토끼 망상적혈구 추출물과 같은 적당한 세포-비함유 번역 추출물과 함께 항온처리하여, 원하는 폴리펩티드 또는 그것의 절편을 생성시킨다.
핵산의 증폭
본 발명의 실행에 있어서, 본 발명의 핵산 및 본 발명의 자일라나제를 암호화하는 핵산, 또는 본 발명의 변형 핵산은 증폭에 의해 복제될 수 있다. 증폭은 본 발명의 핵산의 클로닝 또는 변형을 위해서도 사용될 수 있다. 따라서 본 발명은 본 발명의 핵산의 증폭을 위한 증폭용 프라이머 서열 쌍을 제공한다. 당 업계의 숙련자라면 일부 또는 전장의 이러한 서열을 위한 증폭용 프라이머 서열 상을 고안할 수 있다.
하나의 태양에 있어서, 본 발명은 본 발명의 프라이머쌍, 예를 들어 본 발명의 핵산의 대략 첫번째의 (5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개의 잔기, 및 상보성 가닥의 대략 첫번째의 (5') 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개의 잔기에 의해 나타내어지는 프라이머쌍에 의해 증폭되는 핵산을 제공한다.
본 발명은 자일라나제 활성을 가지는 폴리펩티드를 암호화하는 핵산을 증폭시키기 위한 증폭용 프라이머 서열 쌍을 제공하는데, 이 프라이머쌍은 본 발명의 서열, 또는 그의 단편 또는 서브서열을 포함하는 핵산을 증폭시킬 수 있다. 증폭용 프라이머 서열 쌍 중 하나 또는 그의 각각의 구성원은 이 서열의 적어도 약 10 내지 50개의 연속 염기, 또는 이 서열의 약 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개의 연속 염기를 포함하는 올리고뉴클레오티드를 포함할 수 있다. 본 발명은 본 발명의 핵산의 대략 첫번째 (5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개의 잔기에 의해 나타내어지는 서열을 가지는 제1 구성원과, 제1 구성원의 상보성 가닥의 대략 첫번째의 (5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개의 잔기에 의해 나타내어지는 서열을 가지는 제2 구성원을 포함하는 증폭용 프라이머쌍을 제공한다. 본 발명은 본 발명의 증폭용 프라이머쌍을 이용한 증폭, 예를 들어 폴리머라제 연쇄 반응 (PCR)에 의해 생성되는 자일라나제를 제공한다. 본 발명은 본 발명의 증폭용 프라이머쌍을 사용한 증폭, 예를 들어 폴리머라제 연쇄 반응 (PCR)에 의한 자일라나제의 제조 방법을 제공한다. 하나의 태양에 있어서, 증폭용 프라이머쌍은 라이브러리, 에를 들어 유전자 라이브러리, 예를 들어 환경적 라이브러리로부터 핵산을 증폭시킨다.
증폭 반응은 샘플 중 핵산의 양 (예를 들어 세포 샘플 중 메시지의 양)의 정량화, 핵산의 표지 (예를 들어 핵산을 어레이 또는 블롯에 적용하기 위한 것임),핵산의 검출, 또는 샘플 중 특정 핵산의 양의 정량화를 위하여 또한 사용될 수 있다. 본 발명의 하나의 태양에 있어서, 세포 또는 cDNA 라이브러리로부터 단리되는 메시지를 증폭시킨다.
숙련자라면 적합한 올리고뉴클레오티드 증폭용 프라이머를 선택 및 고안할 수 있다. 증폭 방법은 또한 당 업계에 잘 알려져 있으며, 예를 들어 폴리머라제 연쇄 반응, PCR (예를 들어 문헌[PCR PROTOCOLS, A GUIDE TO METHODS AND APPLICATIONS, ed. Innis, Academic Press, N.Y. (1990)] 및 문헌[PCR STRATEGIES (1995), ed. Innis, Academic Press, Inc., N.Y.] 참조), 리가제 연쇄 반응 (ligase chain reaction, LCR) (예를 들어 문헌[Wu (1989) Genomics 4: 560]; 문헌[Landegren (1988) Science 241: 1077]; 문헌[Barringer (1990) Gene 89: 117] 참조); 전사 증폭법 (예를 들어 문헌[Kwoh (1989) Proc. Natl. Acad. Sci. USA 86: 1173] 참조); 및 자가-지속성 (self-sustained) 서열 복제법 (예를 들어 문헌[Guatelli (1990) Proc. Natl. Acad. Sci. USA 87: 1874] 참조); Q Beta 레플리카제 증폭법 (예를 들어 문헌[Smith (1997) J. Clin. Microbiol. 35: 1477-1491] 참조), 자동화 Q-베타 레플리카제 증폭 분석법 (예를 들어 문헌[Burg (1996) Mol. Cell. Probes 10: 257-271] 참조) 및 기타 RNA 폴리머라제 매개 기술 (예를 들어 NASBA (Cangene, 미국 온타리오주 미시사우가 소재) 참조; 또한 문헌[Berger (1987) Methods Enzymol. 152: 307-316]; 문헌[Sambrook]; 문헌[Ausubel]; 미국 특허 제4,683,195호 및 동 제4,683,202호; 문헌[Sooknanan (1995) Biotechnology 13: 563-564]을 참조)을 포함한다.
서열 동일성 정도의 결정
본 발명은 본 발명의 예시적 핵산 (예를 들어 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 199, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379)에 대하여 적어도 약 50, 75, 100, 150, 200, 250, 300, 350, 400, 450,500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550개 이상의 잔기의 영역에 걸쳐 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그보다 큰, 또는 완전한 (100%) 서열 동일성을 가지는 서열을 포함하는 핵산을 제공한다. 본 발명은 본 발명의 예시적 폴리펩티드에 대하여 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78% 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그보다 큰, 또는 완전한 (100%) 서열 동일성을 가지는 서열을 포함하는 폴리펩티드를 제공한다. 서열 동일성의 정도 (상동성)는 본 명세서에 기술된 것을 비롯한 디폴트 파라미터를 가지는 BLAST 2.2.2 또는 FASTA 버전 3.Ot78을 포함하는 임의의 컴퓨터 프로그램 및 관련 파라미터를 사용하여 결정할 수 있다.
본 핵산 서열은 "그룹 A"의 핵산 서열로도 칭해지며, 이는 그에 실질적으로 동일한 서열과, 그룹 A의 핵산 서열에 상동성인 서열 및 그의 단편과 전술한 서열 모두에 상보성인 서열을 포함한다. 본 발명의 핵산 서열은 본 발명의 예시적 서열의 적어도 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, 또는 500개의 연속 뉴클레오티드 (예를 들어 그룹 A의 핵산 서열)와 그에 실질적으로 동일한 서열을 포함할 수 있다. 그룹 A의 핵산 서열의 상동성 서열 및 단편과 그에 실질적으로 동일한 서열은 이 서열에 적어도 99%, 98%, 97%, 96%, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50%의 상동성을 가지는 서열을 나타낸다. 상동성은 디폴트 파라미터를 가지는 FASTA 버전 3.Ot78을 비롯한 본 명세서에 기술된 컴퓨터 프로그램 및 파라미터 중 임의의 것을 사용하여 결정할 수 있다. 상동성 서열은 그룹 A의 핵산 서열에 나타낸 핵산 서열 중 우리딘이 티민을 대체한 RNA 서열도 포함한다. 상동성 서열은 본 명세서에 기술된 임의의 절차의 사용에 의해 수득될 수 있거나 서열 결정 오류의 보정에 의해 생길 수 있다. 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열이 전통적인 1문자 포맷 (문헌[Stryer, Lubert. Biochemistry, 3rd Ed., W. H Freeman & Co., New York.]의 뒤쪽 겉면 안쪽을 참조) 또는 뉴클레오티드의 실체(identity)를 서열로 기록하는 임의의 다른 포맷으로 표시될 수 있음을 알아야 한다.
본 특허 명세서의 다른 곳에서 확인되는 다양한 서열 비교 프로그램이 본 발명의 이러한 태양에서의 사용을 위하여 특별히 고려된다. 단백질 및/또는 핵산 서열 상동성은 당 업계에 공지된 다양한 서열 비교 알고리즘 및 프로그램 중 임의의 것을 사용하여 평가할 수 있다. 이러한 알고리즘 및 프로그램은 TBLASTN, BLASTP, FASTA, TFASTA 및 CLUSTALW를 포함하지만 그에 한정되는 것은 전혀 아니다 (문헌[Pearson and Lipman, Proc. NatI. Acad. Sci. USA 85 (8): 2444-2448, 1988]; 문헌[Altschul et al., J. Mol. Biol. 215 (3): 403-410, 1990]; 문헌[Thompson et al.. Nucleic Acids Res. 22 (2): 4673-4680, 1994]; 문헌[Higgins et al.,Methods Enzymol. 266:383-402, 1996]; 문헌[Altschul et al., J. Mol. Biol. 215 (3): 403-410, 1990]; 문헌[Altschul et al., Nature Genetics 3: 266-272, 1993]).
상동성 또는 동일성은 서열 분석 소프트웨어 (예를 들어 Sequence Analysis Software Package of the Genetics Computer Group, University of Wisconsin Biotechnology Center, 미국 53705 위스콘신주 매디슨 유니버시티 애비뉴 1710)의 사용에 의해 종종 측정된다. 이러한 소프트웨어는 다양한 결실, 치환 및 기타 변형에 대하여 상동성의 정도를 지정함으로써 유사한 서열을 매치시킨다. 2개 이상의 핵산 또는 폴리펩티드 서열의 정황에서 "상동성" 및 "동일성"이라는 용어는 임의의 갯수의 서열 비교 알고리즘을 사용하거나 수동 배열 및 육안 검사에 의해 측정되는 명시된 영역 또는 비교 창에서의 최대 상응성에 대한 비교 및 배열시 명기된 퍼센트의 동일한 아미노산 잔기 또는 뉴클레오티드를 가지거나 동일한 2개 이상의 서열 또는 서브서열을 나타낸다.
서열 비교에 있어서, 일반적으로 하나의 서열이 시험 서열이 비교되는 참조 서열로 작용한다. 서열 비교 알고리즘의 사용시 시험 및 참조 서열이 컴퓨터에 입력되며, 필요할 경우 서브서열 동등물 (coordinate)이 지정되며 서열 알고리즘 프로그램 파라미터가 지정된다. 디폴트 프로그램 파라미터가 이용될 수 있거나, 대안적인 파라미터가 지정될 수 있다. 이어서 서열 비교 알고리즘에 의해 프로그램 파라미터에 기초하여 참조 서열에 대한 시험 서열의 서열 동일성 퍼센트가 계산된다.
본 명세서에 사용되는 바와 같이 "비교 창"은 20 내지 600, 일반적으로는 약 50 내지 약 200, 더 일반적으로는 약 100 내지 약 150으로 구성된 군으로부터 선택되는 연속 위치의 갯수 중 임의의 하나의 절편에 대한 참조를 포함하는데, 여기서 서열은 2개의 서열을 최적으로 배열한 후 동일한 갯수의 연속 위치의 참조 서열과 비교할 수 있다. 비교를 위한 서열 배열 방법은 당 업계에 잘 알려져 있다. 비교를 위한 최적의 서열 배열은 예를 들어 문헌[Smith & Waterman, Adv. Appl. Math. 2:482, 1981]의 국소적 상동성 알고리즘, 문헌[Needleman & Wunsch, J. Mol. Biol 48:443, 1970]의 상동성 배열 알고리즘, 문헌[person & Lipman, Proc. Nafl. Acad. Sci. USA 85:2444, 1988]의 유사성 탐색 방법, 이러한 알고리즘의 컴퓨터화 도구 (Wisconsin Genetics Software Package의 GAP, BESTFIT, FASTA 및 TFASTA, Genetics Computer Group, 미국 위스콘신주 매디슨 사이언스 닥터. 575), 또는 수동 배열 및 육안 검사에 의해 행해질 수 있다. 다른 상동성 또는 동일성 결정 알고리즘은 예를 들어 BLAST 프로그램 (Basic Local Alignment Search Tool at the National Center for Biological Information) 외에도, ALIGN, AMAS (Analysis of Multiply Aligned Sequences), AMPS (Protein Multiple Sequence Alignment), ASSET (Aligned Segment Statistical Evaluation Tool), BANDS, BESTSCOR, BIOSCAN (Biological Sequence Comparative Analysis Node), BLIMPS (BLocks IMProved Searcher), FASTA, Intervals & Points, BMB, CLUSTAL V, CLUSTAL W. CONSENSUS, LCONSENSUS, WCONSENSUS, Smith-Waterman 알고리즘, DARWIN, Las Vegas 알고리즘, FNAT (Forced Nucleotide Alignment Tool), Framealign, Framesearch, DYNAMIC,FILTER, FSAP (Fristensky Sequence Analysis Package), GAP (Global Alignment Program), GENAL, GIBBS, GenQuest, ISSC (Sensitive Sequence Comparison), LALIGN (Local Sequence Alignment), LCP (Local Content Program), MACAW (Multiple Alignment Construction & Analysis Workbench), MAP (Multiple Alignment Program), MBLKP, MBLKN, PEVA (Pattern-Induced Multi-sequence Alignment), SAGA (Sequence Alignment by Genetic Algorithm) 및 WHAT-IF를 포함한다. 이러한 배열 프로그램은 게놈 데이터베이스를 스크리닝하여 실질적으로 동일한 서열을 가지는 폴리뉴클레오티드 서열을 확인하는 데에도 사용될 수 있다. 다수의 게놈 데이터베이스가 이용가능한데, 예를 들어 인간 게놈의 상당한 부분이 인간 게놈 서열 결정 프로젝트 (Human Genome Sequencing Project)의 일부로 이용가능하다(J. Roach, http://weber.u.Washington.edu/~roach/human_genome_progress 2.html) (Gibbs, 1995). 예를 들어 엠. 게니탈리움 (M genitalium) (Fraser et al., 1995), 엠, 잔나쉬이 (M. jannaschii) (Bult et al., 1996), 에이치. 인플루엔자에 (H. influenzae) (Fleischmann et aL, 1995), 이. 콜라이 (E. coli) (Blattner et al., 1997) 및 효소 (에스. 세레비지아에 (S. cerevisiae)) (Mewes et al., 1997) 및 디. 멜라노가스터 (D. melanogaster) (Adams et al., 2000)를 비롯한 적어도 21개의 다른 게놈이 이미 서열 결정되었다. 모델 유기체, 예를 들어 생쥐, 씨. 엘레간스 (C. elegans) 및 아라비돕시스 (Arabadopsis) sp.의 게놈의 서열 결정도 상당히 진행되었다. 일부 기능 상의 정보가 주석으로 달린 게놈 정보를 포함하는 여러 데이터베이스가 상이한 조직에 의해 유지되며 인터넷을 통하여 접근가능하다.
유용한 알고리즘의 일례로는 BLAST 및 BLAST 2.0 알고리즘이 있는데 이는 문헌[Altschul et al., Nuc. Acids Res. 25:3389-3402, 1977] 및 문헌[Altschul et al., J. Mol. Biol. 215:403-410, 1990]에 각각 기술되어 있다. BLAST 분석을 수행하기 위한 소프트웨어는 National Center for Biotechnology Information을 통하여 공식적으로 이용가능하다. 이러한 알고리즘은, 먼저 쿼리 (query) 서열에 있어서의 길이 W의 짧은 워드 (word)의 확인에 의해 고 스코어링 서열 쌍 (high scoring sequence pairs, HSPs)를 확인하는 것을 포함하는데, 상기 HSP는 데이터베이스 서열에 있어서 동일 길이의 워드와 배열될 경우 일부 양의 값의 역 (threshold) 스코어 T에 매치되거나 상기 T를 만족시킨다. T는 근접한 워드 스코어 역으로 칭해진다 (문헌[Altschul et al., supra]). 이러한 초기 근접 워드 히트 (hit)는 그를 포함하는 더 긴 HSP를 찾기 위한 탐색을 시작하기 위한 종자 (seed)로 작용한다. 워드 히트는 누적 배열 스코어가 증가될 수 있게 하는 한 각각의 서열을 따라 양 방향으로 연장된다. 누적 스코어는 뉴클레오티드 서열에 있어서 파라미터 M (매칭 잔기의 쌍의 보상 (reward) 스코어; 항상 >0)을 사용하여 계산한다. 아미노산 서열에 있어서, 스코어링 매트릭스를 사용하여 누적 스코어를 계산한다. 각 방향으로의 워드 히트의 연장은, 누적 배열 스코어가 그의 최대 성취 값으로부터 양 X만큼 감소될 경우; 하나 이상의 음의 스코어링의 잔기 배열의 축적으로 인하여 누적 스코어가 0 이하로 될 경우; 또는 어느 하나의 서열의 말단에 도달될 경우 정지된다. BLAST 알고리즘 파라미터 W, T 및 X는 이 배열의 민감성 및 속도를 결정한다. BLASTN 프로그램 (뉴클레오티드 서열의 경우)에서는 디폴트로서 11의 워드길이 (W), 10의 기대치 (E), M=5, N=-4 및 양 가닥의 비교가 이용된다. 아미노산 서열에 있어서, BLASTP 프로그램에서는 디폴트로서 3의 워드길이 및 10의 기대치 (E), BLOSUM62 스코어링 매트릭스 (문헌[Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915, 1989] 참조), 50의 배열 (B), 10의 기대치 (E), M=5, N= -4 및 양 가닥의 비교가 이용된다.
BLAST 알고리즘은 또한 두 서열간의 유사성의 통계학적 분석을 수행한다 (예를 들어 문헌[Karlin & Altschul, Proc. Natl. Acad. Sci. USA 90:5873, 1993] 참조). BLAST 알고리즘에 의해 제공되는 하나의 유사성 측도는 가장 작은 합의 확률 (P (N))인데, 이는 두 뉴클레오티드 또는 아미노산 서열간의 매치가 우연히 일어날 확률을 나타낸다. 예를 들어 시험 핵산의 참조 핵산과의 비교에 있어서 가장 작은 합의 확률이 약 0.2 미만, 더 바람직하게는 약 0.01 미만, 가장 바람직하게는 약 0.001 미만일 경우 핵산은 참조 서열에 유사한 것으로 생각된다.
하나의 태양에 있어서, 단백질 및 핵산 서열의 상동성은 Basic Local Alignment Search Tool ("BLAST")를 사용하여 평가한다. 특히 5가지의 특정 BLAST 프로그램을 사용하여 하기 과제를 수행한다:
(1) BLASTP 및 BLAST3은 단백질 서열 데이터베이스에 대하여 아미노산 쿼리 서열을 비교하며;
(2) BLASTN은 뉴클레오티드 서열 데이터베이스에 대하여 뉴클레오티드 쿼리 서열을 비교하며;
(3) BLASTX는 단백질 서열 데이터베이스에 대하여 쿼리 뉴클레오티드 서열 (양 가닥)의 6개의 프레임의 개념의 번역 산물을 비교하며;
(4) TBLASTN은 모든 6개의 판독 프레임에서 번역되는 (양 가닥) 뉴클레오티드 서열에 대하여 쿼리 단백질 서열을 비교하며;
(5) TBLASTX는 뉴클레오티드 서열 데이터베이스의 6개의 프레임의 번역에 대하여 뉴클레오티드 쿼리 서열의 6개의 프레임의 번역을 비교한다.
BLAST 프로그램에 의해 쿼리 아미노산 또는 핵산 서열과 바람직하게는 단백질 또는 핵산 서열 데이터베이스로부터 획득되는 시험 서열 사이의, 본 명세서에서 "높은 스코어링의 절편 쌍"으로 칭해지는 유사한 절편의 확인에 의해 상동성 서열을 확인한다. 높은 스코어링의 절편 쌍은 바람직하게는 스코어링 매트릭스에 의해 확인되는데 (즉, 배열됨), 이들 중 다수는 당 업계에 공지되어 있다. 바람직하게는, 사용되는 스코어링 매트릭스는 BLOSLTM62 매트릭스 (문헌[Gonnet et al., Science 256:1443-1445, 1992]; 문헌[Henikoff and Henikoff, Proteins 17:49-61, 1993])이다. 덜 바람직하게는 PAM 또는 PAM250 매트릭스도 사용될 수 있다 (예를 들어 문헌[Schwartz and Dayhoff, eds., 1978, Matricesfor Detecting Distance Relationships: Atlas ofProtein Sequence and Structure, Washington: National Biomedical Research Foundation] 참조). BLAST 프로그램은 미국 국립 의학 도서관 (U.S. National Library of Medicine)을 통하여 접근가능하다.
상기 알고리즘에 사용되는 파라미터는 연구되는 서열의 길이 및 상동성의 정도에 따라 수정될 수 있다. 일부 태양에 있어서, 파라미터는 사용자의 지시의 부재 하에서 알고리즘에 의해 사용되는 디폴트 파라미터일 수 있다.
컴퓨터 시스템 및 컴퓨터 프로그램 제품
컴퓨터 상에서 (in silico) 서열 동일성, 구조적 상동성, 모티프 등을 결정 및 확인하기 위하여 본 발명의 핵산 또는 폴리펩티드 서열을 컴퓨터에 의해 판독 및 접근될 수 있는 임의의 매체 상에서 저장, 기록 및 조작할 수 있다.
따라서, 본 발명은 본 발명의 핵산 및 폴리펩티드 서열이 기록되거나 저장된 컴퓨터, 컴퓨터 시스템, 컴퓨터 판독가능한 매체, 컴퓨터 프로그램 제품 등을 제공한다. 본 명세서에 사용되는 바와 같이, "기록되는" 및 "저장되는"이라는 용어는 컴퓨터 매체 상에 정보를 저장하는 프로세스를 나타낸다. 숙련자라면 컴퓨터 판독가능한 매체 상에 정보를 기록하는 임의의 공지된 방법을 손쉽게 수정하여 본 발명의 핵산 및/또는 폴리펩티드 서열 중 하나 이상을 포함하는 제품을 생성할 수 있다.
본 발명의 폴리펩티드는 그룹 B의 아미노산 서열의 폴리펩티드 서열, 본 발명의 예시적 서열, 및 그에 실질적으로 동일한 서열과, 전술한 서열 중 임의의 서열의 단편을 포함한다. 실질적으로 동일하거나 상동성인 폴리펩티드 서열은 본 발명의 예시적 서열, 예를 들어 그룹 B의 아미노산 서열의 폴리펩티드 서열에 대하여 적어도 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그보다 큰, 또는 완전한 (100%) 서열 동일성을가지는 폴리펩티드 서열을 나타낸다.
상동성은 디폴트 파라미터 또는 임의의 수정된 파라미터를 포함하는 FASTA 버전 3.Ot78을 비롯하여 본 명세서에 기술된 컴퓨터 프로그램 및 파라미터 중 임의의 것을 사용하여 결정할 수 있다. 상동성 서열은 본 명세서에 기술된 절차 중 임의의 것을 사용하여 수득될 수 있거나 서열 결정 오류의 보정으로부터 생길 수 있다. 본 폴리펩티드 단편은 그룹 B의 아미노산 서열 및 그에 실질적으로 동일한 서열의 폴리펩티드의 적어도 약 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500개 또는 그보다 많은 연속 아미노산을 포함한다. 그룹 B의 아미노산 서열 및 그에 실질적으로 동일한 서열에 나타낸 폴리펩티드 암호는 전통적인 1문자 포맷 또는 3문자 포맷 (문헌[Stryer, Lubert. Biochemisqy, 3rd Ed., W. H Freeman & Co., New York.]의 뒤쪽 겉면 안쪽을 참조) 또는 서열 형태의 폴리펩티드의 신원과 관련된 임의의 다른 포맷으로 표시될 수 있다.
본 발명의 핵산 또는 폴리펩티드 서열은 컴퓨터에 의해 판독 및 접근될 수 있는 임의의 매체 상에서 저장, 기록 및 조작될 수 있다. 본 명세서에 사용되는 바와 같이, "기록되는" 및 "저장되는"이라는 용어는 컴퓨터 매체 상에 정보를 저장하는 프로세스를 나타낸다. 숙련자라면 컴퓨터 판독가능한 매체 상에 정보를 기록하는 현재 공지된 방법 중 임의의 것을 손쉽게 수정하여 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열 중 하나 이상, 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그에 실질적으로 동일한 서열 중 하나 이상을포함하는 제품을 생성할 수 있다. 본 발명의 다른 태양은 그룹 A의 핵산 서열에 나타낸 적어도 2, 5, 10, 15, 또는 20개 이상의 핵산 서열 및 그에 실질적으로 동일한 서열이 기록된 컴퓨터 판독가능한 매체이다.
본 발명의 다른 태양은 그룹 A의 핵산 서열에 나타낸 핵산 서열 중 하나 이상과 그에 실질적으로 동일한 서열이 기록된 컴퓨터 판독가능한 매체이다. 본 발명의 다른 태양은 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 중 하나 이상과 그에 실질적으로 동일한 서열이 기록된 컴퓨터 판독가능한 매체이다. 본 발명의 다른 태양은 상기에 나타낸 서열 중 적어도 2, 5, 10, 15, 또는 20개 이상의 서열이 기록된 컴퓨터 판독가능한 매체이다.
컴퓨터 판독가능한 매체는 자기적으로 판독가능한 매체, 광학적으로 판독가능한 매체, 전자적으로 판독가능한 매체 및 자기/광학적 매체를 포함한다. 예를 들어 컴퓨터 판독가능한 매체는 하드 디스크, 플로피 디스크, 자기 테이프, CD-ROM, 디지털 다기능 디스크 (Digital versatile Disk, DVD), 임의 접근 기억 장치 (Random Access Memory, RAM), 또는 판독 전용 기억 장치 (Read Only Memory, ROM)와, 당 업계의 숙련자에게 공지된 다른 유형의 기타 매체일 수 있다.
본 발명의 태양은 시스템 (예를 들어 인터넷 기반의 시스템), 특히 본 명세서에 기술된 서열 정보를 저장 및 조작하는 컴퓨터 시스템을 포함한다. 컴퓨터 시스템 (100)의 일례가 도 1의 블럭도 형태로 도시되어 있다. 본 명세서에 사용되는 바와 같이 "컴퓨터 시스템"은 그룹 A의 핵산 서열에 나타낸 핵산 서열의 뉴클레오티드 서열 및 그에 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열의 분석에 사용되는 하드웨어 컴포넌트, 소프트웨어 컴포넌트 및 데이터 저장 컴포넌트를 나타낸다. 컴퓨터 시스템 (100)은 일반적으로 서열 데이터의 처리 (processing), 접근 및 조작을 위한 프로세서를 포함한다. 프로세서 (105)는 임의의 잘 알려진 유형의 중앙 처리 장치, 예를 들어 Intel Corporation제의 Pentium III, 또는 Sun, Motorola, Compaq, AMD 또는 International Business Machines제의 유사한 프로세서일 수 있다.
일반적으로 컴퓨터 시스템 (100)은 프로세서 (105)와 데이터를 저장하기 위한 하나 이상의 내부 데이터 저장 컴포넌트 (110)와 데이터 저장 컴포넌트 상에 저장된 데이터의 검색을 위한 하나 이상의 데이터 검색 장치를 포함하는 일반 용도의 시스템이다. 숙련자라면 현재 이용가능한 컴퓨터 시스템 중 임의의 것이 적합하다는 것을 손쉽게 인식할 수 있다.
하나의 특정 태양에 있어서, 컴퓨터 시스템 (100)은 주기억 장치 (115) (바람직하게는 RAM으로 제공됨)에 연결된 버스에 연결된 프로세서 (105) 및 하나 이상의 내부 데이터 저장 장치 (110), 예를 들어 데이터가 기록된 하드 드라이브 및/또는 기타 컴퓨터 판독가능한 매체를 포함한다. 일부 태양에 있어서, 컴퓨터 시스템 (100)은 내부 데이터 저장 장치 (110)에 저장된 데이터의 판독을 위한 하나 이상의 데이터 검색 장치 (118)을 더 포함한다.
데이터 검색 장치 (118)는 예를 들어 플로피 디스크 드라이브, 콤팩트 디스크 드라이브, 자기 테이프 드라이브, 또는 원격 데이터 저장 시스템 (예를 들어 인터넷을 통하여)에 연결될 수 있는 모뎀 등을 나타낼 수 있다. 일부 태양에 있어서, 내부 데이터 저장 장치 (110)는 제어 논리 및/또는 기록 데이터를 포함하는 분리성의 컴퓨터 판독가능한 매체, 예를 들어 플로피 디스크, 콤팩트 디스크, 자기 테이프 등이다. 컴퓨터 시스템 (100)은 데이터 검색 장치에 일단 삽입되면 데이터 저장 컴포넌트로부터 데이터 및/또는 제어 논리를 판독하는 적절한 소프트웨어를 포함하거나 상기 소프트웨어에 의해 프로그래밍될 수 있는 것이 유리하다.
컴퓨터 시스템 (100)은 출력을 컴퓨터 사용자에게 표시해 주는 데에 사용되는 디스플레이 (120)를 포함한다. 컴퓨터 시스템 (100)은 통신망 또는 광역 통신망에서 다른 컴퓨터 시스템 125a-c에 연결되어 컴퓨터 시스템 (100)에 중앙 집중형 접근을 제공할 수 있다는 것을 또한 알아야 한다.
그룹 A의 핵산 서열에 나타낸 핵산 서열의 뉴클레오티드 서열 및 그에 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그에 실질적으로 동일한 서열에 접근하여 이를 처리하기 위한 소프트웨어 (예를 들어 탐색 도구, 비교 도구 및 모델링 도구 등)가 실행 동안 주기억 장치 (115)에 존재할 수 있다.
일부 태양에 있어서, 컴퓨터 시스템 (100)은, 컴퓨터 판독가능한 매체 상에 저장된 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그에 실질적으로 동일한 서열을 컴퓨터 판독가능한 매체 상에 저장된 참조 뉴클레오티드 또는 폴리펩티드 서열 (들)과 비교하기 위한 서열 비교 알고리즘을 더 포함할 수 있다. "서열 비교 알고리즘"은 뉴클레오티드 서열을 데이터 저장 수단 내에 저장된 다른 뉴클레오티드 서열 및/또는 화합물과 비교하기 위하여 컴퓨터 시스템 (100) 상에서 (국소적으로 또는 원격으로) 구현되는 하나 이상의 프로그램을 나타낸다. 예를 들어 서열 비교 알고리즘은 컴퓨터 판독가능한 매체 상에 저장된 그룹 A의 핵산 서열에 나타낸 핵산 서열의 뉴클레오티드 서열 및 그에 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그에 실질적으로 동일한 서열을 컴퓨터 판독가능한 매체 상에 저장된 참조 서열과 비교하여 상동성 또는 구조적 모티프를 확인할 수 있다.
도 2는 새로운 서열 및 데이터베이스의 서열 사이의 상동성의 수준을 결정하기 위하여 새로운 뉴클레오티드 또는 단백질 서열을 데이터베이스의 서열과 비교하기 위한 프로세스 (200)의 하나의 태양을 도시하는 흐름도이다. 서열의 데이터베이스는 컴퓨터 시스템 (100) 내에 저장된 개인 데이터베이스, 또는 인터넷을 통하여 이용가능한 GENBANK와 같은 공공 데이터베이스일 수 있다.
프로세스 (200)는 시작 상태 (201)에서 시작하며, 이어서 비교할 새로운 서열을 컴퓨터 시스템 (100)의 기억 장치에 저장하는 상태 (202)로 이동한다. 상기에 논의된 바와 같이 기억 장치는 RAM 또는 내부 저장 장치를 비롯하여 임의의 유형의 기억 장치일 수 있다.
이어서 프로세스 (200)는 서열의 데이터베이스를 분석 및 비교를 위하여 여는 상태 (204)로 이동한다. 이어서 프로세스 (200)는 데이터베이스에 저장된 제1 서열을 컴퓨터 상의 기억 장치 내로 판독하는 상태 (206)로 이동한다. 이어서 비교를 상태 (210)에서 수행하여 제1 서열이 제2 서열과 동일한지를 결정한다. 이단계는 새로운 서열과 데이터베이스의 제1 서열 사이의 정확한 비교를 수행하는 것에 한정되는 것은 아님을 아는 것이 중요하다. 두 뉴클레오티드 또는 단백질 서열을, 심지어 이들이 동일하지 않다 해도 비교하기 위한 잘 알려진 방법이 숙련자에게 공지되어 있다. 예를 들어 갭이 두 시험 서열들 사이의 상동성 수준을 상승시키기 위하여 하나의 서열 내로 도입될 수 있다. 갭 또는 기타 특징이 비교 동안 서열 내로 도입되는지를 제어하는 파라미터가 컴퓨터 시스템의 사용자에 의해 보통 입력된다.
일단 두 서열의 비교가 상태 (210)에서 수행되면, 두 서열이 동일한지를 결정 상태 (210)에서 결정한다. 물론, "동일"이라는 용어는 절대적으로 동일한 서열에 한정되는 것은 아니다. 사용자에 의해 입력되는 상동성 파라미터 이내인 서열은 프로세스 (200)에서 "동일"로 나타낸다.
두 서열이 동일하다고 결정되면 프로세스 (200)는 데이터베이스로부터의 서열의 명칭이 사용자에게 표시되는 상태 (214)로 이동한다. 상기 상태는 사용자에게 표시된 명칭의 서열이 입력된 상동성 제약 조건을 만족시킨다는 것을 알려준다. 일단 저장된 서열의 명칭이 사용자에게 표시되면, 프로세스 (200)는 더 많은 서열이 데이터베이스에 존재하는지를 결정하는 결정 상태 (218)로 이동한다. 더이상의 서열이 데이터베이스에 존재하지 않으면 프로세스 (200)는 종료 상태 (220)에서 종결된다. 그러나 더 많은 서열이 데이터베이스에 존재하면 프로세스 (200)는 포인터 (pointer)가 데이터베이스 중의 다음 서열로 이동하여 새로운 서열과 비교될 수 있는 상태 (224)로 이동한다. 이러한 방식으로 새로운 서열은 배열되며 데이터베이스 중의 모든 서열과 비교된다.
결정 상태 (212)에서 서열이 상동성이지 않다고 결정되면 프로세스 (200)는 임의의 다른 서열이 비교를 위하여 데이터베이스에서 이용가능한지를 결정하기 위하여 결정 상태 (218)로 즉시 이동한다는 것을 알아야 한다.
따라서 본 발명의 하나의 태양은 프로세서, 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그에 실질적으로 동일한 서열이 저장된 데이터 저장 장치, 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그에 실질적으로 동일한 서열에 비교될 참조 뉴클레오티드 서열 또는 폴리펩티드 서열이 검색가능하게 저장된 데이터 저장 장치 및 비교를 수행하기 위한 서열 비교자를 포함하는 컴퓨터 시스템이다. 서열 비교자는 비교되는 서열간의 상동성 수준을 나타내거나 상기 그룹 A의 핵산 서열 및 그에 실질적으로 동일한 서열의 핵산 코드, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그에 실질적으로 동일한 서열에서 구조적 모티프를 확인할 수 있거나, 상기 핵산 코드 및 폴리펩티드 코드에 비교되는 서열에서 구조적 모티프를 확인할 수 있다. 일부 태양에 있어서, 데이터 저장 장치에는 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그에 실질적으로 동일한 서열 중 적어도 2, 5, 10, 15, 20, 25, 30 또는 40개 이상의 서열이 저장될 수 있다.
본 발명의 다른 태양은 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그에 실질적으로 동일한 서열과 참조 뉴클레오티드 서열 사이의 상동성의 수준을 결정하는 방법이다. 본 방법은 상동성 수준을 결정하는 컴퓨터 프로그램의 사용을 통하여 핵산 코드 또는 폴리펩티드 코드 및 참조 뉴클레오티드 또는 폴리펩티드 서열을 판독하는 단계 및 컴퓨터 프로그램을 이용하여 핵산 코드 또는 폴리펩티드 코드와 참조 뉴클레오티드 또는 폴리펩티드 서열 사이의 상동성을 결정하는 단계를 포함한다. 컴퓨터 프로그램은 본 명세서에서 구체적으로 열거된 것 (예를 들어 디폴트 파라미터를 가지거나 임의의 수정된 파라미터를 가지는 BLAST2N)을 비롯하여 상동성 수준 결정용의 다수의 컴퓨터 프로그램 중 임의의 것일 수 있다. 본 방법은 상기에 기술된 컴퓨터 시스템을 사용하여 구현된다. 본 방법은 컴퓨터 프로그램의 사용을 통하여 상기의 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그에 실질적으로 동일한 서열 중 적어도 2, 5, 10, 15, 20, 25, 30 또는 40개 이상을 판독하는 단계 및 핵산 코드 또는 폴리펩티드 코드 및 참조 뉴클레오티드 서열 또는 폴리펩티드 서열 사이의 상동성을 결정하는 단계에 의해 또한 수행될 수 있다.
도 3은 두 서열이 상동성인지를 결정하기 위한 컴퓨터에서 프로세스 (250)의 하나의 태양을 도시하는 흐름도이다. 프로세스 (250)는 시작 상태 (252)로부터 시작되며 이어서 비교될 제1 서열이 기억 장치에 저장되는 상태 (254)로 이동한다. 이어서 비교될 제2 서열이 상태 (256)에서 기억 장치에 저장된다. 이어서 프로세스 (250)는 제1 서열 중의 첫번째 문자가 판독되는 상태 (260)로 이동하며 이어서 제2 서열의 첫번째 문자가 판독되는 상태 (262)로 이동한다. 서열이 뉴클레이티드 서열이면 문자는 보통 A, T, C, G 또는 U라는 것을 알아야 한다. 서열이 단백질 서열이면 제1 및 서열 서열이 용이하게 비교될 수 있도록 1문자 아미노산 코드인 것이 바람직하다.
이어서 두 문자가 동일한지를 결정 상태 (264)에서 결정한다. 이들이 동일하다면 프로세스 (250)는 제1 및 제2 서열 중의 다음 문자가 판독되는 상태 (268)로 이동한다. 이어서 다음 문자가 동일한지를 결정한다. 이들이 동일하다면 프로세스 (250)는 두 문자가 동일하지 않을때까지 상기 루프를 계속한다. 다음의 두 문자가 동일하지 않다고 결정되면 프로세스 (250)는 결정 상태 (274)로 이동하여 임의의 더 많은 문자가 판독되는 어느 하나의 서열에 있는지를 결정한다.
다른 문자가 더이상 판독되지 않으면 프로세스 (250)는 제1 및 제2 서열 사이의 상동성의 수준이 사용자에게 표시되는 상태 (276)로 이동한다. 상동성의 수준은 제1 서열 중의 총 서열 갯수로부터 동일한 서열들 사이의 문자의 비율을 계산함으로써 결정한다. 따라서, 100개의 제1 뉴클레오티드의 서열 중 모든 문자가 제2 서열의 모든 문자와 배열되면, 상동성 수준은 100%이다.
대안적으로는, 본 컴퓨터 프로그램은, 본 발명에 나타낸 핵산 서열의 뉴클레오티드 서열을 하나 이상의 참조 뉴클레오티드 서열과 비교하여 그룹 A의 핵산 서열 및 그에 실질적으로 동일한 서열의 핵산 코드가 하나 이상의 위치에서 참조 핵산 서열과 다른지를 결정하는 컴퓨터 프로그램일 수 있다. 선택적으로는 이러한프로그램은 참조 폴리뉴클레오티드 또는 그룹 A의 핵산 서열에 나타낸 핵산 및 그에 실질적으로 동일한 서열 중 어느 하나의 서열에 대하여 삽입, 결실 또는 치환된 뉴클레오티드의 길이 및 신원을 기록한다. 하나의 태양에 있어서, 본 컴퓨터 프로그램은 그룹 A에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열이 참조 뉴클레오티드 서열에 대하여 단일 뉴클레오티드 다형성 (single nucleotide polymorphism, SNP)을 포함하는지를 결정하는 프로그램일 수 있다.
따라서, 본 발명의 다른 태양은 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열이 하나 이상의 뉴클레오티드에서 참조 뉴클레오티드 서열과 다른지를 결정하는 방법으로서 핵산 서열들 사이의 차이를 확인하는 컴퓨터 프로그램의 사용을 통하여 상기 핵산 코드와 참조 뉴클레오티드 서열을 판독하는 단계 및 이 핵산 코드와 참조 뉴클레오티드 서열 사이의 차이를 컴퓨터 프로그램을 이용하여 확인하는 단계를 포함한다. 일부 태양에 있어서, 본 컴퓨터 프로그램은 단일 뉴클레오티드 다형성을 확인하는 프로그램이다. 본 방법은 상기에 기술된 컴퓨터 시스템 및 도 3에 도시된 방법에 의해 구현될 수 있다. 본 방법은 컴퓨터 프로그램의 사용을 통하여 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그에 실질적으로 동일한 서열 중 2, 5, 10, 15, 20, 25, 30, 또는 40개 이상의 서열 및 참조 뉴클레오티드 서열을 판독하는 단계 및 핵산 코드와 참조 뉴클레오티드 서열 사이의 차이를 컴퓨터 프로그램을 이용하여 확인하는 단계에 의해서도 수행될 수 있다.
다른 태양에서, 컴퓨터 기반의 시스템은 그룹 A의 핵산 서열에 나타낸 핵산 서열 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 그와 실질적으로동일한 서열 내의 특징을 확인하기 위한 확인자를 추가로 포함할 수도 있다.
"확인자"는 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 그와 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 이와 실질적으로 동일한 서열내의 일부 특징을 확인하는 하나 이상의 프로그램을 말한다. 한 태양에서, 확인자는 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 이와 실질적으로 동일한 서열내의 개봉 판독 프레임을 확인하는 프로그램을 포함할 수도 있다.
도 4는 서열내의 특징의 존재를 검출하기 위한 확인자 프로세스 (300)의 한 태양을 예시하는 흐름도이다. 프로세스 (300)는 시작 상태 (302)에서 시작하여, 특징을 확인할 제1 서열이 컴퓨터 시스템 (100)내의 기억 장치 (115)에 저장되는 상태 (304)로 이동한다. 프로세스 (300)는 이어서 서열 특징의 데이터베이스가 공개되는 상태 (306)로 이동한다. 그러한 데이터베이스는 각 특징의 명칭과 함께 각 특징의 특성의 리스트를 포함할 것이다. 예를 들어, 특징 명칭은 "개시 코돈"일 수 있으며 특성은 "ATG"일 것이다. 다른 예는 특성 명칭은 "TAATAA 박스"이고 특징 특성은 "TAATAA"일 것이다. 그러한 데이터베이스의 예는 위스콘신 대학 유전학 컴퓨터 그룹에 의해 생산된다. 다르게는, 상기 특징들은 알파 헬릭스, 베타 시트와 같은 구조적 폴리펩티드 모티프, 또는 효소 활성 부위, 헬릭스-턴-헬릭스 모티프 또는 당 업계에 공지된 다른 모티프와 같은 기능적 폴리펩티드 모티프일 수 있다.
일단 특징의 데이터베이스가 상태 (306)에서 공개되면, 프로세스 (300)는 제 1 특징이 데이터베이스로부터 판독되는 상태 (308)로 이동한다. 이어서 제1 특징의 특성과 제1 서열의 비교가 상태 (310)에서 이루어진다. 이어서 상기 특징의 특성이 제 1 서열에서 발견되었는지 여부가 결정 상태 (316)에서 결정된다. 만일 특성이 발견되었으면, 프로세스 (300)는 발견된 특징의 명칭이 사용자에게 표시되는 상태 (318)로 이동한다.
이어서 프로세스 (300)는 데이터베이스에 더 이상의 특징이 존재하는지를 결정하는 결정 상태 (320)로 이동한다. 더 이상의 특징이 존재하지 않으면, 프로세스 (300)는 종료 상태 (324)에서 종결된다. 하지만, 더 이상의 특징이 데이터베이스에 존재하면, 프로세스 (300)는 상태 (326)에서 다음 서열 특징을 판독하고, 다음 특징의 특성이 제1 서열에 대하여 비교되는 상태 (310)으로 돌아간다. 만일 특징 특성이 결정 상태 (316)에서 제 1서열에서 발견되지 않으면 프로세스 (300)는 더 이상의 특징이 데이터베이스에 존재하는지를 결정하기 위하여 결정 상태 (320)로 직접 이동함을 주목해야 한다.
따라서, 본 발명의 다른 태양은 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 이와 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 또는 이와 실질적으로 동일한 서열의 특징을 확인하는 방법으로서, 서열 내의 특징을 확인하는 컴퓨터 프로그램을 이용하여 핵산 코드 또는 폴리펩티드 코드를 판독하는 단계 및 핵산 코드내의 특징을 컴퓨터 프로그램으로 확인하는 단계를 포함한다. 한 태양에서, 컴퓨터 프로그램은 개봉 판독 프레임을 확인하는 컴퓨터 프로그램을 포함한다. 상기 방법은 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 이와 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열및 이와 실질적으로 동일한 서열 중 단일 서열 또는 적어도 2, 5, 10, 15, 20, 25, 30, 또는 40개를 컴퓨터 프로그램을 이용하여 판독하고, 상기 핵산 코드 또는 폴리펩티드 코드내의 특징을 컴퓨터 프로그램으로 확인함으로써 수행될 수 있다.
그룹 A의 핵산 서열에 나타낸 핵산 서열 및 이와 실질적으로 동일한 서열, 또는 그룹 B 아미노산 서열에 나타낸 폴리펩티드 서열 및 이와 실질적으로 동일한 서열은 다양한 포맷의 다양한 데이터 프로세서 프로그램에 저장되고 조작될 수 있다. 예를 들어, 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 이와 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 이와 실질적으로 동일한 서열은 마이크로소프트 WORD (등록상표) 또는 WORDPERFECT (등록상표)와 같은 워드 프로세싱 파일내의 텍스트로서, 또는 DB2 (등록상표), SYBASE (등록상표), 또는 ORACLE (등록상표)과 같은 당 업계에 친숙한 다양한 데이터베이스 프로그램내의 ASCII 파일로서 저장될 수 있다. 또한, 많은 컴퓨터 프로그램과 데이터베이스가 서열 비교 알고리즘, 확인자, 또는 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 이와 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 이와 실질적으로 동일한 서열과 비교될 참조 뉴클레오티드 서열 또는 폴리펩티드 서열의 소스로 이용될 수 있다. 하기 목록은 본 발명을 한정하기 위한 것이 아니라 그룹 A의 핵산 서열에 나타낸 핵산 서열 및 이와 실질적으로 동일한 서열, 또는 그룹 B의 아미노산 서열에 나타낸 폴리펩티드 서열 및 이와 실질적으로 동일한 서열에서 유용한 프로그램과 데이터베이스에 대한 지침을 제공하기 위한 것이다.
이용될 수 있는 프로그램과 데이터베이스는 하기를 포함하지만 그에 한정되는 것은 아니다: MacPattem (EMBL), DiscoveryBase (Molecular Applications Group), GeneMine (Molecular Applications Group), Look (Molecular Applications Group), MacLook (Molecular Applications Group), BLAST와 BLAST2 (NCBI), BLASTN과 BLASTX (Altschul et al, J. Mol. Biol. 215. 403,1990), FASTA (Pearson and Lipman, Proc. Natl. Acad. Sci. USA, 85: 2444,1988), FASTDB (Brutlag et al. Comp. App. Biosci. 6:237-245, 1990), Catalyst (Molecular Simulations Inc.), Catalyst/SHAPE (Molecular Simulations Inc.), Cerius2.DBAccess (Molecular Simulations Inc.), HypoGen (Molecular Simulations Inc.), Insight II, (Molecular Simulations Inc.), Discover (Molecular Simulations Inc.), CHARMm (Molecular Simulations Inc.), Felix (Molecular Simulations Inc.), DelPhi, (Molecular Simulations Inc.), QuanteMM, (Molecular Simulations Inc.), Homology (Molecular Simulations Inc.), Modeler (Molecular Simulations Inc.), ISIS (Molecular Simulations Inc.), Quanta/Protein Design (Molecular Simulations Inc.), WebLab (Molecular Simulations Inc.), WebLab Diversity Explorer (Molecular Simulations Inc.), Gene Explorer (Molecular Simulations Inc.), SeqFold (Molecular Simulations Inc.), MDL Available Chemicals Directory database, MDL Drug Data Report data base, Comprehensive Medicinal Chemistry database, Derwents's World Drug Index database, BioByteMasterfiledatabase, Genbank database 및 Genseqn database. 많은 다른 프로그램과 데이터 베이스가 본 발명의 개시 내용에 비추어 당업자에게는 자명할 것이다.
상기 프로그램을 이용하여 검출될 수 있는 모티프는 루이신 지퍼를 암호화하는 서열, 헬릭스-턴-헬릭스 모티프, 글리코실화 부위, 유비퀴틴화 부위, 알파 헬릭스 및 베타 시트, 암호화 단백질의 분비를 지시하는 신호 펩티드를 암호화하는 시그널 서열, 호메오박스와 같은 전사 조절에 관여하는 서열, 산성 스트레치, 효소 활성 부위, 기질 결합 부위 및 효소 절단 부위를 포함한다.
핵산의 하이브리드화
본 발명은 본 발명의 예시적 서열 (예를 들어, 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 1 69, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379)에 엄격한 조건하에서 하이브리드화하는 분리된 또는 재조합 핵산을 제공한다. 엄격한 조건은 매우 엄격한 조건, 중간 엄격도 조건 및/또는 낮은 엄격도 조건일 수 있으며, 여기서 개시된 높은 엄격도 조건 및 감소된 엄격도 조건을 포함한다. 한 태양에서, 하기하는 바와 같이, 핵산이 본 발명 범위내인지를 결정하는 조건을 정하는 것은 세척 조건의 엄격도이다.
다른 태양에서, 엄격한 조건하에서 하이브리드화하는 그들의 능력에 의해 정의되는 본 발명의 핵산은 본 발명의 핵산의 약 5개의 잔기와 전장 사이일 수 있다; 예를 들어, 이들은 길이가 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 55, 60, 65, 70, 75, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000 또는 그 이상 잔기일 수 있다. 전장보다 짧은 핵산 또한 포함된다. 이들 핵산은 예를 들어, 하이브리드화 프로브, 표지화 프로브, PCR 올리고뉴클레오티드 프로브, iRNA (단일 또는 이중쇄), 안티센스 또는 항체 결합 펩티드 (에피토프)를 암호화하는 서열, 모티프, 활성 부위 등으로서 유용할 수 있다.
한 태양에서, 본 발명의 핵산은 약 37℃ 내지 42℃에서 약 50% 포름아미드의 조건을 포함하는 높은 엄격도하에서 그들이 하이브리드화하는 능력에 의해 정의된다. 한 태양에서, 본 발명의 핵산은 약 30℃ 내지 35℃에서 약 35% 내지 25% 포름아미드에서의 조건을 포함하는 감소된 엄격도하에서 그들이 하이브리드화하는 능력에 의해 정의된다.
다르게는, 본 발명의 핵산은 50% 포름아미드, 5X SSPE, 0.3% SDS, 및 cot-1 또는 연어 정자 DNA (예, 200 n/ml 전단되고 변성된 연어 정자 DNA)와 같은 반복 서열 차단 핵산에서 42℃의 조건을 포함하는 높은 엄격도하에서 그들이 하이브리드화하는 능력에 의해 정의된다. 한 태양에서, 본 발명의 핵산은 35℃의 감소된 온도에서 35% 포름아미드를 포함하는 감소된 엄격도 조건하에서 하이브리드화하는 능력에 의해 정의된다.
핵산 하이브리드화 반응에서, 특정 수준의 엄격도를 이루기 위해 이용된 조건은 하이브리드화될 핵산의 특성에 따라 다를 것이다. 예를 들어, 핵산의 하이브리드화 영역의 길이, 상보성의 정도, 뉴클레오티드 서열 조성 (예, GC 대 AT 함량) 및 핵산 유형 (예, RNA 대 DNA)이 하이브리드화 조건을 선택할 때 고려될 수 있다. 추가의 고려 사항은 핵산중 하나가 예를 들어 필터상에 고정되는 지 여부이다.
하이브리드화는 낮은 엄격도, 중간 엄격도 또는 높은 엄격도의 조건하에서 실시될 수 있다. 핵산 하이브리드화의 예로서, 고정된 변성 핵산을 함유한 중합체 막이 먼저 0.9 M NaCl, 50 mM NaH2PO4, pH 7.0, 5.0 mM Na2EDTA, 0.5% SDS, 1OX 덴하르트 및 0.5 mg/ml 폴리리보아데닐산으로 구성된 용액에서 45℃에서 30분동안 예비하이브리드화된다. 약 2 X 107cpm (비활성 4-9 X 108CPM/㎍)의32P 말단-표지된 올리고뉴클레오티드 프로브를 이어서 상기 용액에 첨가한다. 12-16시간동안 항온처리한 후, 상기 막을 실온에서 0.5% SDS를 함유한 1X SET (150 mM NaCl, 20 mM Tris 하이드로클로라이드, pH 7.8, 1 mM Na2EDTA)에서 30분간 세척하고, 이어서 올리고뉴클레오티드 프로브를 위한 Tm-10℃에서 새로운 1X SET에서 30분 세척한다. 이어서 상기 막을 하이브리드화 시그널의 검출을 위해 방사성 필름에 노출시킨다.
전술한 모든 하이브리드화는 높은 엄격도 조건하인 것으로 간주된다.
하이브리드화 후, 필터를 세척하여 임의의 비-특이적으로 결합된 검출가능한 프로브를 제거한다. 필터를 세척하기 위해 이용된 엄격도는 또한 하이브리드화될 핵산의 특성, 하이브리드화될 핵산의 길이, 상보성의 정도, 뉴클레오티드 서열 조성 (예, GC 대 AT 함량) 및 핵산 유형 (예, RNA 대 DNA)에 따라 달라질 것이다. 점차적으로 더 높은 엄격도 조건 세척의 예는 다음과 같다: 실온에서 15분간 2X SSC, 0.1% SDS (낮은 엄격도); 실온에서 30분 내지 1 시간동안 0.1X SSC, 0.5% SDS (중간 엄격도); 하이브리드화 온도와 68℃ 사이에서 15 내지 30분간 0.1X SSC, 0.5% SDS (높은 엄격도); 및 72℃에서 15분동안 0.15M NaCl (매우 높은 엄격도). 최종 낮은 엄격도 세척은 실온에서 0.1 X SSC에서 실시될 수 있다. 상기 예들은 필터를 세척하기 위해 이용될 수 있는 조건의 한 세트의 예시일 뿐이다. 당업자는 다른 엄격도 세척을 위한 많은 레시피가 있음을 알 것이다. 일부 다른 예가 하기에 주어진다.
프로브에 하이브리드화한 핵산은 방사선사진촬영 또는 기타 종래 기술로 확인된다.
상기 절차는 프로브 서열에 대해 감소된 상동성 정도를 갖는 핵산을 확인하기 위해 변형될 수도 있다. 예를 들어, 검출가능한 프로브에 대해 감소된 상동성의 핵산을 얻기 위해서는, 덜 엄격한 조건을 이용할 수 있다. 예를 들어, 하이브리드화 온도는 약 1M의 Na+ 농도를 갖는 하이브리드화 완충액에서 68℃에서 42℃로 5℃ 만큼씩 감소될 수 있다. 하이브리드화 후, 필터를 하이브리드화 온도에서 2X SSC, 0.5% SDS로 세척할 수 있다. 이들 조건은 50℃ 이상에서는 "온건한" 조건 그리고 50℃ 미만에서 "낮은" 조건으로 간주된다. "온건한" 하이브리드화 조건의 구체적인 예는 상기 하이브리드화가 55℃에서 실시될 때이다. "낮은 엄격도" 하이브리드화 조건의 구체적인 예는 상기 하이브리드화가 45℃에서 실시될 때이다.
다르게는, 하이브리드화는 42℃의 온도에서 포름아미드를 함유한 6X SSC와 같은 완충액에서 실시될 수 있다. 이 경우에, 하이브리드화 완충액내의 포름아미드의 농도는 프로브에 대해 감소하는 상동성을 갖는 클론들을 확인하기 위하여 50%에서 0% 로 5% 씩 감소될 수 있다. 하이브리드화 후, 필터는 50℃에서 6X SSC, 0.5% SDS로 세척될 수 있다. 이들 조건은 25% 이상 포름아미드에서는 "온건한" 조건으로, 그리고 25% 이하 포름아미드에서는 "낮은" 조건으로 간주된다. "온건한" 하이브리드화 조건의 구체적인 예는 상기 하이브리드화가 30% 포름아미드에서 실시될 때이다. "낮은 엄격도" 하이브리드화 조건의 구체적인 예는 상기 하이브리드화가 10% 포름아미드에서 실시될 때이다.
하지만, 하이브리드화 포맷의 선택은 중요하지 않다 - 핵산이 본 발명의 범위내인지를 결정하는 조건을 결정하는 것은 세척 조건의 엄격도이다. 본 발명 범위내의 핵산을 확인하기 위해 이용된 세척 조건은 예를 들어, pH 7에서 약 0.02 몰의 염 농도와 적어도 약 50℃ 또는 약 55℃ 내지 약 60℃의 온도; 또는 약 15분간 72℃에서 약 0.15M NaCl의 염 농도; 또는 약 15 내지 약 20분동안 적어도 약 50℃ 또는 약 55℃ 내지 약 60℃의 온도와 약 0.2 X SSC의 염 농도; 또는 하이브리드화 복합체를 0.1% SDS를 함유한 약 2X SSC의 염 농도를 갖는 용액으로 실온에서 15분간 두번 세척하고 이어서 0.1% SDS를 함유한 0.1 X SSC에 의해 68℃에서 15분간 세척하기; 또는 등가의 조건. SSC 완충액과 등가의 조건의 설명을 위해서는 Sambrook, Tijssen 및 Ausubel을 참고한다.
이들 방법은 본 발명의 핵산을 분리하기 위해 이용될 수 있다. 예를 들어, 상기 방법들은 그룹 A의 핵산 서열 및 이와 실질적으로 동일한 서열 중 하나 또는 그것의 적어도 약 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, 또는 500개의 연속 염기를 포함하는 단편 및 여기에 상보적인 서열로 구성된 군으로부터 선택되는 핵산 서열에 적어도 약 97%, 적어도 95%, 적어도 90%, 적어도 85%, 적어도 80%, 적어도 75%, 적어도 70%, 적어도 65%, 적어도 60%, 적어도 55%, 적어도 50% 상동성을 갖는 서열을 갖는 핵산을 분리하기 위해 이용될 수 있다. 상동성은 배열 알고리즘을 이용하여 측정될 수 있다. 예를 들어, 상동성 폴리뉴클레오티드는 여기서 개시된 암호화 서열 중 하나의 자연 발생 대립유전자 변이체인 암호화 서열을 가질 수 있다. 그러한 대립유전자 변이체는 그룹 A의 핵산 서열 또는 이와 상보적인 서열의 핵산과 비교할 때 하나 이상의 뉴클레오티드의 치환, 결실 또는 부가를 가질 수 있다.
부가적으로, 상기 절차는 그룹 B의 아미노산 서열과 이와 실질적으로 동일한 서열중 하나 또는 서열 배열 알고리즘 (예, 디폴트 파리미터를 이용한 FASTA 버젼 3.0t78 알고리즘)을 이용하여 결정할 때 상기 폴리펩티드의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150 연속인 아미노산을 포함하는 단편의 서열을 갖는 폴리펩티드와 적어도 약 99%, 95%, 적어도 90%, 적어도 85%, 적어도 80%, 적어도 75%, 적어도 70%, 적어도 65%, 적어도 60%, 적어도 55%, 또는 적어도 50% 상동성을 갖는 폴리펩티드를 암호화하는 핵산을 분리하기 위해 이용될 수 있다.
올리고뉴클레오티드 프로브와 이를 이용하는 방법
본 발명은 또한 예를 들어 자일라나제 활성을 갖는 폴리펩티드 또는 그 단편을 암호화하는 핵산 또는 자일라나제 유전자를 확인하기 위해 이용될 수 있는 핵산 프로브를 제공한다. 한 태양에서, 상기 프로브는 본 발명의 핵산의 적어도 10 연속 염기를 포함한다. 다르게는, 본 발명의 프로브는 본 발명의 핵산에서 기재된 서열의 적어도 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 110, 120, 130, 150 또는 약 10 내지 50, 약 20 내지 60, 약 30 내지 70개의 연속 염기일 수 있다. 상기 프로브는 결합 및/또는 하이브리드화에 의해 핵산을 확인한다. 상기 프로브는 예를 들어 모세관 어레이를 비롯한 본 발명의 어레이에 이용될 수 있다. 본 발명의 프로브는 또한 다른 핵산 또는 폴리펩티드를 분리하기 위해 이용될 수 있다.
그룹 A의 핵산 서열 및 이와 실질적으로 동일한 서열, 이에 상보적인 서열, 또는 그룹 A의 핵산 서열 및 이와 실질적으로 동일한 서열, 또는 이에 상보적인 서열 중 하나의 적어도 10, 15, 20, 25, 30, 35, 40, 50, 75, 100,150, 200, 300, 400, 또는 500 연속 염기를 포함하는 단편의 분리된 핵산은 또한 토양 샘플과 같은 생물학적 샘플이 본 발명의 핵산 서열을 갖는 유기체 또는 상기 핵산이 얻어진 유기체를 함유하는지를 결정하기 위해 프로브로서 이용될 수 있다. 그러한 절차에서, 상기 핵산이 분리된 유기체를 보유한 생물학적 샘플이 얻어지고 그 샘플로부터 핵산을 얻는다. 상기 핵산을 그안에 존재하는 임의의 상보성 서열에 프로브가 특이적으로 하이브리드화하도록 하는 조건하에서 프로브와 접촉시킨다.
필요할 경우, 프로브가 상보성 서열에 특이적으로 하이브리드화하도록 하는 조건은, 상보성 서열을 함유하는 것으로 알려진 샘플로부터의 상보성 서열 및 상보성 서열을 함유하지 않는 참조 서열과 프로브가 접촉하도록 함으로써 결정될 수 있다. 하이브리드화 완충액의 염 농도, 하이브리드화 완충액의 포름아미드 농도, 또는 하이브리드화 온도와 같은 하이브리드화 조건은 프로브가 상보성 핵산에 특이적으로 하이브리드화하도록 하는 조건을 확인하기 위해 변형될 수 있다.
만일 샘플이 상기 핵산이 분리된 유기체를 함유하면, 프로브의 특이적 하이브리드화가 검출된다. 하이브리드화는 방사성 동위원소, 형광 염료, 또는 검출가능한 생성물의 형성을 촉매할 수 있는 효소와 같은 검출가능한 제제로 프로브를 표지함으로써 검출될 수 있다.
샘플내의 상보성 핵산의 존재를 검출하기 위해 표지된 프로브를 이용하기 위한 많은 방법들이 당업자에게 잘 알려져 있다. 이들은 서던 블롯, 노던 블롯, 콜로니 하이브리드화 과정 및 돗 블롯을 포함한다. 이들 과정의 각각을 위한 프로토콜은 Ausubel et al. Current Protocols in Molecular Biology, John Wiley 503 Sons, Inc. (1997) 및 Sambrook et al., Molecular Cloning. A Laboratory Manual 2nd Ed., Cold Spring Harbor Laboratory Press (1989)에 제공된다.
다르게는, 샘플이 본 발명의 핵산 서열을 함유한 유기체 (예, 상기 핵산이 분리된 유기체)를 함유하는지를 결정하기 위하여 하나보다 많은 프로브 (핵산 샘플내에 존재하는 임의의 상보성 서열에 특이적으로 하이브리드화할 수 있는 적어도 하나)를 증폭 반응에 이용할 수 있다. 일반적으로, 상기 프로브는 올리고뉴클레오티드를 포함한다. 한 태양에서, 증폭 반응은 PCR 반응을 포함할 수 있다. PCR 프로토콜은 상기한 Ausubel과 Sambrook에 개시된다. 다르게는, 증폭은 리가제 연쇄 반응, 3SR, 또는 쇄 치환 반응을 포함할 수도 있다. (Barany, F., "The Ligase Chain Reaction in a PCR World", PCR Methods and Applications 1:5-16,1991; E. Fahy et al., "Selfsustained Sequence Replication (3SR): An Isothermal Transcription-based Amplification System Alternative to PCR", PCR Methods and Applications 1:25-33,1991; 및 Walker G.T. et al., "Strand Displacement Amplification-an Isothermal in vitro DNA Amplification Technique", Nucleic Acid Research 20:1691-1696, 1992 참고). 그러한 과정에서, 샘플내의 핵산은 프로브와 접촉되고, 증폭 반응이 실시되고 임의의 생성된 증폭 생성물이 검출된다.증폭 생성물은 반응 생성물에 대해 젤 전기영동을 실시하고 에티듐 브로마이드와 같은 인터킬레이터로 젤을 염색함으로써 검출될 수 있다. 다르게는, 프로브 중 하나 이상을 방사성 동위원소로 표지하여 방사성 증폭 생성물의 존재를 젤 전기영동 후 방사성사진에 의해 검출할 수 있다.
그룹 A의 핵산 서열의 서열 및 이와 실질적으로 동일한 서열의 말단 근처의 서열로부터 유래한 프로브는 또한 그룹 A의 핵산 서열의 서열 및 이와 실질적으로 동일한 서열의 근처에 위치한 게놈 서열을 함유한 클론을 확인하기 위해 염색체 워킹 과정에 이용될 수도 있다. 그러한 방법은 숙주 유기체로부터 추가의 단백질을 암호화하는 유전자의 분리를 가능하게 한다.
그룹 A의 핵산 서열 및 이와 실질적으로 동일한 서열, 이에 상보적인 서열, 또는 그룹 A의 핵산 서열 및 이와 실질적으로 동일한 서열, 또는 이에 상보적인 서열의 서열 중 하나의 적어도 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, 또는 500 연속 염기를 포함하는 단편의 분리된 핵산을 프로브로 이용하여 관련 핵산을 확인하고 분리할 수 있다. 일부 태양에서, 관련 핵산은 상기 핵산이 분리된 유기체와 다른 유기체로부터의 cDNA 또는 게놈 DNA일 수 있다. 예를 들어, 다른 유기체는 관련 유기체일 수도 있다. 그러한 과정에서, 핵산 샘플은 프로브가 관련 서열에 특이적으로 하이브리드화하도록 하는 조건하에서 프로브와 접촉된다. 관련 유기체로부터의 핵산 서열에의 프로브의 하이브리드화를 이어서 전술한 임의의 방법을 이용하여 검출한다.
검출가능한 프로브에 하이브리드화하는 cDNA 또는 게놈 DNA와 같은 핵산을확인하기 위해 이용된 하이브리드화 조건의 엄격도를 변화시킴으로써, 프로브에 대한 상동성의 정도가 다른 핵산들이 확인되고 분리될 수 있다. 엄격도는 프로브의 융점 이하의 변하는 온도에서 하이브리드화를 실시함으로써 변화될 수 있다. 융점 Tm은 표적 서열의 50%가 완전히 상보적인 프로브에 하이브리드화하는 온도 (한정된 이온 강도와 pH하에서)이다. 매우 엄격한 조건은 구체적 프로브를 위한 Tm과 동일하거나 약 5℃ 낮은 온도로 선택된다. 프로브의 융점은 하기 식을 이용하여 계산될 수 있다:
길이가 14 내지 70 뉴클레오티드인 프로브의 경우, 융점은 식 Tm=81.5+16.6 (log [Na+])+0.41 (G+C 분율)- (600/N) (이때 N은 프로브의 길이)을 이용하여 계산된다.
만일 하이브리드화가 포름아미드를 함유한 용액에서 실시되면, 융점은 식 Tm = 81.5+16.6 (log [Na+])+0.41 (G+C 분율)- (0.63% 포름아미드)- (600/N) (N은 프로브의 길이)을 이용하여 계산될 수 있다.
예비하이브리드화는 6X SSC, 5X 덴하르트 시약, 0.5% SDS, 100㎍ 변성된 단편화된 연어 정자 DNA, 50% 포름아미드에서 실시될 수 있다. SSC와 덴하르트 용액을 위한 식은 상기한 Sambrook 등에 열거된다.
하이브리드화는 검출가능한 프로브를 상기에서 열거한 예비하이브리드화 용액에 첨가함으로써 실시된다. 프로브가 이중쇄 DNA를 포함하는 경우, 프로브는 하이브리드화 용액에 첨가하기 전에 변성시킨다. 필터를 충분한 기간동안 하이브리드화 용액과 접촉시켜 프로브가 프로브에 상보적이거나 상동성인 서열을 함유하는cDNA 또는 게놈 DNA에 하이브리드화하도록 한다. 200 뉴클레오티드 길이가 넘는 프로브의 경우, 하이브리드화는 Tm보다 15-25℃ 낮은 온도에서 실시될 수 있다. 올리고뉴클레오티드 프로브와 같은 더 짧은 프로브의 경우, 하이브리드화는 Tm보다 5-10℃ 낮은 온도에서 실시될 수 있다. 일반적으로, 6X SSC에서의 하이브리드화의 경우, 하이브리드화는 약 68 ℃에서 실시된다. 대개, 50% 포름아미드 함유 용액에서의 하이브리드화의 경우, 하이브리드화는 약 42℃ 에서 실시된다.
자일라나제의 발현 억제
본 발명은 본 발명의 핵산, 예를 들어 자일라나제-암호 핵산에 상보적인 (예를 들어 안티센스 서열) 핵산을 제공한다. 안티센스 서열은 자일라나제-암호 유전자의 수송, 스플라이싱 또는 전사를 억제할 수 있다. 상기 억제는 게놈 DNA 또는 메신저 RNA를 표적화함으로써 이루어질 수 있다. 표적화된 핵산의 전사 또는 기능은 예를 들어 하이브리드화 및/또는 절단에 의해 억제될 수 있다. 본 발명에 의해 제공되는 한 가지 특히 유용한 억제제 세트는 자일라나제 유전자 또는 메시지에 결합할 수 있는 올리고뉴클레오티드를 포함하며, 자일라나제의 생산 또는 기능을 막거나 억제한다. 상기 연합은 서열 특이적 하이브리드화를 통해서일 수 있다. 다른 유용한 억제제 부류는 자일라나제 메시지의 불활성화 또는 절단을 야기하는 올리고뉴클레오티드를 포함한다. 올리고뉴클레오티드는 리보자임과 같은, 그러한 절단을 야기하는 효소 활성을 가질 수 있다. 올리고뉴클레오티드는 화학적으로 변형되거나, 상보성 핵산 서열을 절단할 수 있는 효소 또는 조성물에 결합될 수 있다. 많은 다른 그러한 올리고뉴클레오티드의 풀을 원하는 활성을 갖는 것들에 대해 검사할 수 있다. 따라서, 본 발명은 핵산 및/또는 단백질 수준에서 자일라나제 발현의 억제를 위한 다양한 조성물을 제공하며, 예를 들어 본 발명의 자일라나제 서열을 포함하는 안티센스, iRNA 및 리보자임 및 본 발명의 항-자일라나제 항체가 있다.
자일라나제 발현의 억제는 다양한 산업적 적용을 가질 수 있다. 예를 들어, 자일라나제 발현의 억제는 부패를 늦추거나 막을 수 있다. 부패는 다당류, 예를 들어 구조 다당류가 효소적으로 분해될 때 발생할 수 있다. 이것은 과일 및 야채의 품질이 저하되거나 썩게 할 수 있다. 한 태양에서, 자이라나제의 발현 및/또는 활성을 억제하는 본 발명의 조성물, 예를 들어 항체, 안티센스 올리고뉴클레오티드, 리보자임 및 RNAi의 이용은 부패를 늦추거나 막기 위해 이용된다. 따라서, 한 태양에서, 본 발명은 부패를 늦추거나 막기 위해 본 발명의 항체, 안티센스 올리고뉴클레오티드, 리보자임 및 RNAi를 식물 또는 식물 생성물 (예, 시리얼, 곡물, 과일, 종자, 뿌리, 잎, 등)에 적용하는 것을 포함한 방법 및 조성물을 제공한다. 이들 조성물은 또한 식물 (예, 트랜스제닉 식물) 또는 다른 유기체 (예, 본 발명의 자일라나제 유전자로 형질전환된 박테리아 또는 다른 미생물)에 의해 발현될 수 있다.
자일라나제 발현의 억제를 위한 본 발명의 조성물 (예, 안티센스, iRNA, 리보자임, 항체)은 약학 조성물, 예를 들어 항-병원균 제제로서 또는 다른 치료, 예를 들어 살모넬라를 위한 항균제로서 사용될 수 있다.
안티센스 올리고뉴클레오티드
본 발명은 mRNA를 표적화함으로써 자일란 하이드롤라제 활성 (예, 내부 β-1,4-자일로시드 결합의 가수분해를 촉매)을 억제할 수 있는, 자일라나제 메시지에 결합할 수 있는 안티센스 올리고뉴클레오티드를 제공한다. 안티센스 올리고뉴클레오티드를 고안하기 위한 전략은 과학 문헌 및 특허 문헌에 잘 개시되어 있으며, 당업자는 본 발명의 신규한 시약을 이용하여 그러한 자일라나제 올리고뉴클레오티드를 고안할 수 있다. 예를 들어, 효과적인 안티센스 올리고뉴클레오티드를 스크리닝하기 위한 유전자 워킹/RNA 맵핑 프로토콜이 당업계에 공지되어 있으며, 예를 들어 가능한 안티센스 서열 선별을 위한 쉽고 믿을만한 방법을 제공하기 위한 표준 분자 기술에 기초한 RNA 맵핑 분석을 개시한 Ho (2000) Methods Enzymol. 314:168-183을 참고한다. 또한 Smith (2000) Eur. J. Pharm. Sci. 11: 191을 참고한다.
자연 발생 핵산이 안티센스 올리고뉴클레오티드로 이용된다. 안티센스 올리고뉴클레오티드는 임의의 길이일 수 있으며, 예를 들어 다른 태양에서, 안티센스 올리고뉴클레오티드는 약 5 내지 100, 약 10 내지 80, 약 15 내지 60, 약 18 내지 40사이이다. 적절한 길이는 일반적인 스크리닝에 의해 결정될 수 있다. 안티센스 올리고뉴클레오티드는 임의의 농도로 존재할 수 있다. 적절한 농도는 일반적인 스크리닝에 의해 결정될 수 있다. 가능한 문제를 해결할 수 있는 광범위한 합성, 비자연 발생 뉴클레오티드 및 핵산 유사체가 공지되어 있다. 예를 들어, N- (2-아미노에틸)글리신 유닛과 같은 비이온성 백본을 함유한 펩티드 핵산 (PNAs)이 이용될 수 있다. WO 97/0321 1; WO 96/39154; Mata (1997) Toxicol Appl Pharmacol 144:189-197; Antisense Therapeutics, ed. Agrawal (Humana Press, Totowa, N.J.,1996)에 개시된 대로, 포스포로티오에이트 결합을 가진 안티센스 올리고뉴클레오티드가 또한 이용될 수 있다. 본 발명에 의해 제공된 합성 DNA 백본 유사체를 갖는 안티센스 올리고뉴클레오티드는 또한 전술한 대로, 포스포로-디티오에이트, 메틸포스포네이트, 포스포르아미데이트, 알킬 포스포트리에스테르, 설파메이트, 3'-티오아세탈, 메틸렌 (메틸이미노), 3'-N-카르바메이트, 및 모르폴리노 카르바메이트 핵산을 포함할 수 있다.
조합 화학 방법을 이용하여, 본 발명의 센스 및 안티센스 자일라나제 서열과 같은, 임의의 표적에 대하여 적절한 결합 친화도와 특이성을 갖는 특정 올리고뉴클레오티드를 위해 신속하게 스크리닝될 수 있는 방대한 수의 올리고뉴클레오티드를 생성할 수 있다. (예, Gold (1995) J. of Biol. Chem. 270.13581-13584 참고)
억제성 리보자임
본 발명은 자일라나제 메시지에 결합할 수 잇는 리보자임을 제공한다. 이들 리보자임은 예를 들어 mRNA를 표적화함으로써 자일라나제 활성을 억제할 수 있다. 리보자임을 고안하고 표적화를 위한 자일라나제-특이적 안티센스 서열을 선별하기 위한 전략은 과학 및 특허 문헌에 잘 개시되어 있으며, 당업자는 본 발명의 신규한 시약을 이용하여 그러한 리보자임을 고안할 수 있다. 리보자임은 표적 RNA를 절단하는 RNA의 효소 부분에 인접한 리보자임의 표적 RNA 결합 부분을 통해 표적 RNA에 결합함으로써 작용한다. 따라서, 리보자임은 상보성 염기-쌍형성을 통해 표적 RNA를 인식하고 결합하며, 일단 정확한 부위에 결합되면, 표적 RNA를 효소적으로 절단하여 불활성화시킨다. 그러한 방식으로 표적 RNA를 절단하면, 그 절단이 암호화서열에 발생한 경우 RNA가 암호화 단백질의 합성을 지시하는 능력을 파괴할 것이다. 리보자임이 그 RNA 표적에 결합하여 절단한 후, 리보자임은 그 RNA로부터 유리되어 새로운 표적에 반복하여 결합하고 절단할 수 있다.
일부 경우에, 리보자임의 효소 특성은 치료를 하기 위해 필요한 리보자임의 효과적인 농도가 안티센스 올리고뉴클레오티드의 농도보다 낮을 수 있으므로, 안티센스 기법 (이 경우 핵산 분자는 단지 표적 핵산에 결합하여 핵산의 전사, 번역 또는 다른 분자와의 결합을 차단함)과 같은 다른 기술에 비하여 유익할 수 있다. 이 잠재적인 효과는 리보자임이 효소적으로 작용하는 능력을 반영한다. 따라서, 단일 리보자임 분자는 표적 RNA 분자 다수를 절단할 수 있다. 또한, 리보자임은 일반적으로 결합의 염기 쌍 형성 기작뿐만 아니라 이 분자가 그것이 결합하는 RNA의 발현을 억제하는 기작에 의존하는 억제 특이성을 갖는, 매우 특이적인 억제제이다. 즉, 상기 억제는 RNA 표적의 절단에 의해 야기되며, 따라서 특이성은 비-표적 RNA의 절단 속도에 대한 표적 RNA의 절단 속도의 비율로 정의된다. 이 절단 기작은 염기 쌍 형성에 관련된 것에 더하여 부가적인 요소들에 의존한다. 따라서, 리보자임의 작용의 특이성은 동일한 RNA 부위에 결합하는 안티센스 올리고뉴클레오티드보다 더 클 수 있다.
본 발명의 리보자임, 예를 들어 효소적 리보자임 RNA 분자는 해머해드 모티프, 헤어핀 모티프, 간염 델타 바이러스 모티프, 그룹 I 인트론 모티프 및/또는 RNA 가이드 서열과 연합된 RNaseP-유사 RNA로 형성될 수 있다. 해머해드 모티프의 예는 예를 들어, Rossi (1992) Aids Research and Human Retroviruses 8:183에 개시되고; 헤어핀 모티프는 Hampel (1989) Biochemistry 28:4929, 및 Hampel (1990) Nuc. Acids Res. 18:299에 개시되며; 간염 델타 바이러스 모티프는 Perrotta (1992) Biochemistry 31:16에 개시되며; RNaseP 모티프는 Guerrier-Takada (1983) Cell 35:849에 개시되며; 그리고 그룹 I 인트론은 Cech의 미국 특허 4,987,071호에 개시된다. 이들 특정 모티프의 언급은 제한의 의도가 아니다. 당업자는 본 발명의 리보자임, 예를 들어 본 발명의 효소적 RNA 분자가 표적 유전자 RNA 영역 중 하나 이상에 상보적인 특이적인 기질 결합 부위를 가질 수 있음을 인식할 것이다. 본 발명의 리보자임은 상기 기질 결합 부위내 또는 그 주위에 상기 분자에 RNA 절단 활성을 부여하는 뉴클레오티드 서열을 가질 수 있다.
RNA 간섭 (RANi)
한 태양에서, 본 발명은 본 발명의 자일라나제 서열을 포함하는, RNA 억제 분자, 소위 "RNAi" 분자를 제공한다. 상기 RNAi 분자는 이중쇄 RNA (dsRNA) 분자를 포함한다. RNAi는 자일라나제 유전자의 발현을 억제할 수 있다. 한 태양에서, RNAi는 약 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 또는 그 이상 길이의 이중쇄 뉴클레오티드이다. 본 발명이 어느 특정 작용 기작에 의해 제한되지 않음에도 불구하고, RNAi는 세포에 들어가 내인성 mRNA를 비롯한 유사한 또는 동일한 서열의 단일쇄 RNA (ssRNA)의 분해를 야기할 수 있다. 세포가 이중쇄 RNA (dsRNA)에 노출될 경우, 상동성 유전자로부터의 mRNA는 RNA 간섭 (RNAi)로 불리는 과정에 의해 선택적으로 분해된다. RNAi의 가능한 기본 기작은 특정 유전자 서열에 매치하는 이중쇄 RNA (dsRNA)를 짧은 간섭 RNA로 불리는 작은 조각들로 분해하여, 그 서열에 매치하는 mRNA의 분해를 야기하는 것이다. 한 태양에서, 본 발명의 RNAi는 유전자-사일런싱 치료에 이용되며, 예를 들어, Shuey (2002) Drug Discov. Today 7:1040-1046을 참고한다. 한 태양에서, 본 발명은 본 발명의 RNAi를 이용하여 RNA를 선택적으로 분해하는 방법을 제공한다. 이 방법은 시험관내, 생체외 또는 생체내에서 실시될 수 있다. 한 태양에서, 본 발명의 RNAi 분자는 세포, 기관 또는 동물에서 기능 상실 돌연변이를 생성시키기 위해 이용될 수 있다. RNA를 선택적으로 분해시키기 위해 RNAi 분자를 만들고 이용하는 방법은 당업계에 공지되어 있으며, 예를 들어, 미국 특허 제6,506,559호; 동 제6,511,824호; 동 제6,515,109호; 동 제6,489,127호를 참고한다.
핵산의 변형
본 발명은 본 발명의 핵산, 예를 들어 자일라나제를 암호화하는 핵산의 변이체를 생성하는 방법을 제공한다. 이들 방법은 다양한 조합으로 반복되거나 이용되어 주형 핵산에 의해 암호화되는 자일라나제와 비교하여 변형되거나 상이한 활성 또는 변형되거나 상이한 안정성을 갖는 자일라나제를 생성할 수 있다. 이들 방법은 또한 예를 들어, 유전자/메시지 발현, 메시지 번역 또는 메시지 안정성에서 변화를 생성하기 위해 다양한 조합으로 반복되거나 이용될 수 있다. 다른 태양에서, 세포의 유전적 조성은 예를 들어 상동성 유전자의 생체외 변형 및 이것을 세포내로 삽입함으로써 변형될 수 있다.
본 발명의 핵산은 임의의 수단에 의해 변형될 수 있다. 예를 들어, 임의의 또는 확률적인 방법, 또는, 비-확률적인, 또는 "지시된 진화" 방법이 있으며, 예를들어 미국 특허 6,361,974호를 참고한다. 유전자의 임의 돌연변이 방법은 공지되어 있으며, 예를 들어 미국 특허 5,830,696호를 참고한다. 예를 들어, 뮤타젠을 이용하여 유전자를 임의로 돌연변이시킬 수 있다. 뮤타젠은 예를 들어, 단독 또는 조합된, 자외선 또는 감마선, 또는 화학적 뮤타젠, 예, 미토마이신, 질산, 광활성화된 프소라렌을 포함하며 재조합에 의해 회복가능한 DNA 파괴를 유도한다. 다른 화학적 뮤타젠은 예를 들어, 소듐 비설파이트, 질산, 하이드록실아민, 하이드라진 또는 포름산을 포함한다. 다른 뮤타젠은 뉴클레오티드 전구체의 유사체, 예를 들어 니트로소구아니딘, 5-브로모우라실, 2-아미노퓨린, 또는 아크리딘이다. 이들 제제는 뉴클레오티드 전구체 대신 PCR 반응에 첨가되어 서열을 돌연변이시킬 수 있다. 프로플라빈, 아크리플라빈, 퀴나크린 등과 같은 인터킬레이트제 또한 이용될 수 있다.
분자 생물학의 임의의 기법, 예를 들어, 임의 PCR 돌연변이유발법이 이용될 수 있으며, 예를 들어 Rice (1992) Proc. Natl. Acad. Sci. USA 89:5467-5471를 참고하며; 또는 조합 다중 카세트 돌연변이유발법이 이용될 수 있으며, 예를 들어 Crameri (1995) Biotechniques 18:194-196을 참고한다. 다르게는, 핵산, 예를 들어 유전자는 임의, 또는 "확률적" 단편화 후에 재조립될 수 있으며, 예를 들어 미국 특허 6,291,242호; 6,287,862호; 6,287,861호; 5,955,358호; 5,830,721호; 5,824,514호; 5,811,238호; 및 5,605,793호를 참고한다. 다른 태양에서, 에러-프론 PCR, 셔플링, 올리고뉴클레오티드-지시된 돌연변이유발법, 조립 PCR, 성적 PCR 돌연변이유발법, 생체내 돌연변이유발법, 카세트 돌연변이유발법, 반복 앙상블 돌연변이유발법, 지수 앙상블 돌연변이유발법, 부위-특이적 돌연변이유발법, 유전자 재조립 (예, GeneReassembly (등록상표), 예를 들어 미국 특허 6.537,776호 참고), 유전자 부위 포화 돌연변이유발법 (GSSM (등록상표)), 합성 라이게이션 재조립 (SLR), 재조합, 반복성 서열 재조합, 포스포티오에이트-변형된 DNA 돌연변이유발법, 우라실-함유 주형 돌연변이유발법, 갭을 가진 이중쇄 돌연변이유발법, 점 미스매치 회복 돌연변이유발법, 회복-결핍 숙주 균주 돌연변이유발법, 화학적 돌연변이유발법, 방사능에 의한 돌연변이유발법, 결실 돌연변이유발법, 제한-선별 돌연변이유발법, 제한-정제 돌연변이유발법, 인공 유전자 합성, 앙상블 돌연변이유발법, 키메릭 핵산 다량체 생성, 및/또는 이들 및 다른 방법의 조합에 의해 변형, 부가 또는 결실이 도입된다.
하기 문헌은 본 발명의 방법에 통합될 수 있는 다양한 반복성 재조합 과정 및/또는 방법을 개시한다: Stemmer (1999) "Molecular breeding of viruses for targeting and other clinical properties" Tumor Targeting 4:1-4; Ness (1999) Nature Biotechnology 17:893 -896; Chang (1999) "Evolution of a cytokine using DNA family shuffling" Nature Biotechnology 17:793-797; Minshull (1999) "Protein evolution by molecular breeding" Current Opinion in Chemical Biology 3:284-290; Christians (1999) "Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shuffling" Nature Biotechnology 17:259-264; Crameri (1998) "DNA shuffling of a family of genes from diverse species accelerates directed evolution" Nature 391:288-291; Crameri (1997) "Molecularevolution of an arsenate detoxification pathway by DNA shuffling," Nature Biotechnology 15:436-438; Zhang (1997) "Directed evolution of an effective fucosidase from a galactosidase by DNA shuffling and screening" Proc. Natl. Acad. Sci. USA 94:4504-4509; Patten et al. (1997) "Applications of DNA Shuffling to Pharmaceuticals and Vaccines" Current Opinion in Biotechnology 8:724-733; Crameri et al. (1996) "Construction and evolution of antibody-phage libraries by DNA shuffling" Nature Medicine 2:100-103; Gates et al. (1996) "Affinity selective isolation of ligands from peptide libraries through display on a lac; repressor 'headpiece dimer, " Journal of Molecular Biology 255:373-386; Stemmer (1996) "Sexual PCR and Assembly PCR" In: The Encyclopedia of Molecular Biology. VCH Publishers, New York. pp 457; Crameri and Stemmer (1995) "Combinatorial multiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes" BioTechniques 18: 194-195; Stemmer et al. (1995) "Single-step assembly of a gene and entire plasmid form large numbers of oligodeoxyribonucleotides" Gene, 164:49-53; Stemmer (1995) "The Evolution of Molecular Computation" Science 270: 1510; Stemmer (1995) "Searching Sequence Space" Bio/Technology 13:549-553; Stemmer (1994) "Rapid evolution of a protein in vitro by DNA shuffling" Nature 370:389-391; 및 Stemmer (1994) "DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution." Proc. Natl. Acad. Sci. USA91:10747-10751.
다양성을 생성하는 돌연변이 방법은 예를 들어, 부위-지시된 돌연변이유발법 (Ling et al. (1997) "Approaches to DNA mutagenesis: an overview" Anal Biochem. 254 (2): 157-178; Dale et al. (1996) "Oligonucleotide-directed random mutagenesis using the phosphorothioate method" Methods Mol. Biol. 57:369-374; Smith (1985) "In vitro mutagenesis" Ann. Rev. Genet. 19:423-462; Botstein & Shortle (1 985) "Strategies and applications of in vitro mutagenesis" Science 229:1193-1201; Carter (1986) "Site-directed mutagenesis" Biochem. J. 237:1-7; 및 Kunkel (1987) "The efficiency of oligonucleotide directed mutagenesis" in Nucleic Acids & Molecular Biology (Eckstein, F. and Lilley, D. M. J. eds., Springer Verlag, Berlin)); 우라실 함유 주형을 이용하는 돌연변이 (Kunkel (1985) "Rapid and efficient site-specific mutagenesis without phenotypic selection" Proc. Natl. Acad. Sci. USA 82:488-492; Kunkel et al. (1987) "Rapid and efficient site-specific mutagenesis without phenotypic selection" Methods in Enzymol. 154, 367-382; 및 Bass et al. (1988) "Mutant Tip repressors with new DNA-binding specificities" Science 242:240-245); 올리고뉴클레오티드-지시된 돌연변이유발법 (Methods in Enzymol. 100: 468-500 (1983); Methods in Enzymol. 154: 329-350 (1987); Zoller (1982) "Oligonucleotide-directed mutagenesis using M13 -derived vectors: an efficient and general procedure for the production of point mutations in anyDNA fragment" Nucleic Acids Res. 10:6487-6500; Zoller & Smith (1983) "Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors" Methods in Enzymol. 100:468-500; 및 Zoller (1987) Oligonucleotide-directed mutagenesis: a simple method using two oligonucleotide primers and a single-stranded DNA template" Methods in Enzymol. 154:329-350); 포스포로티오에이트-변형된 DNA 돌연변이유발법 (Taylor (1985) "The use of phosphorothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA" Nucl. Acids Res. 13: 8749-8764; Taylor (1985) "The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA" Nucl. Acids Res. 13: 8765-8787 (1985); Nakamaye (1986) "Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide-directed mutagenesis" Nucl. Acids Res. 14: 9679-9698; Sayers (1988) "Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis" Nucl. Acids Res. 16:791-802; 및 Sayers et al. (1988) "Strand specific cleavage of phosphorothioate containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide" Nucl. Acids Res. 16: 803-814); 갭을 가진 이중쇄 DNA를 이용한 돌연변이 (Kramer et al. (1984) "The gapped duplex DNA approach to oligonucleotide-directed mutation construction" Nucl. Acids Res. 12: 9441-9456; Kramer & Fritz (1987) Methods in Enzymol. "Oligo-nucleotide-directed construction of mutations via gapped duplex DNA" 154:350-367; Kramer (1988) "Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction of mutations" Nucl. Acids Res. 16: 7207; 및 Fritz (1988) "Oligonucleotide-directed construction of mutations: a gapped duplex DNA procedure without enzymatic reactions in vitro" Nucl. Acids Res. 16: 6987-6999)를 포함한다.
본 발명을 실시하기 위해 이용될 수 있는 추가의 프로토콜은 점 미스매치 회복 (Kramer (1984) "Point Mismatch Repair" Cell 38:879-887), 회복-결핍 숙주 균주를 이용한 돌연변이유발법 (Carter et al. (1985) "Improved oligonucleotide site directed mutagenesis using M13 vectors" Nucl. Acids Res. 13: 4431-4443; 및 Carter (1987) "Improved oligonucleotide-directed mutagenesis using M13 vectors" Methods in Enzymol. 154. 382-403), 결실 돌연변이유발법 (Eghtedarzadeh (1986) "Use of oligonucleotides to generate large deletions" Nucl. Acids Res. 14: 5115), 제한-선별 및 제한-선별과 제한-정제 (Wells et al. (1986) "Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin" Phil. Trans. R. Soc. Lond. A 317. 415-423), 전체 유전자 합성에 의한 돌연변이유발법 (Nambiar et al. (1984) "Total synthesis and cloning of a gene coding for the ribonuclease S protein" Science 223: 1299-1301; Sakarriar and Khorana (1988) "Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-bindingprotein (transducin) " Nucl. Acids Res. 14: 6361-6372; Wells et al. (1985) "Cassette mutagenesis: an efficient method for generation of multiple mutations at defined sites" Gene 34:315-323; 및 Grundstrom et al. (1985) "Oligonucleotide-directed mutagenesis by microscale 'shot-gun' gene synthesis" Nucl. Acids Res. 13: 3305-3316), 이중쇄 파괴 회복 (Mandecki (1986); Arnold (1993) "Protein engineering for unusual environments" Current Opinion in Biotechnology 4:450 "Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli: a method for site-specific mutagenesis" Proc. Natl. Acad. Sci. USA, 83:7177-7181)을 포함한다. 상기 방법의 다수에 대한 추가의 상세 사항은 다양한 돌연변이유발 방법의 문제점을 위한 유용한 조절법을 개시하는 Methods in Enzymology Volume 154에 개시되어 있다.
본 발명을 실시하기 위해 이용될 수 있는 프로토콜은 Stemmer의 미국 특허 제5,605,793호 (1997년 2월 25일), "Methods for In Vitro Recombination"; Stemmer 등의 미국 특허 5,811,238호 (1998년 9월 22) "Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination"; Stemmer 등의 미국 특허 제5,830,721호 (1998년 11월 3), "DNA Mutagenesis by Random Fragmentation and Reassembly;" Stemmer 등의 미국 특허 제5,834,252호 (1998년 11월 10) "End-Complementary Polymerase Reaction;" Minshull 등의 미국 특허 5,837,458호 (1998년 11월 17), "Methods and Compositions for Cellular and Metabolic Engineering"; Stemmer와 Crameri의 WO95/22625호, "Mutagenesis by Random Fragmentation and Reassembly"; Stemmer와 Lipschutz의 WO 96/33207호 "End Complementary Polymerase Chain Reaction"; Stemmer와 Crameri의 WO 97/20078호 "Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination"; Minshull 과 Stemmer의 WO 97/35966호 "Methods and Compositions for Cellular and Metabolic Engineering"; Punnonen 등의 WO 99/41402호 "Targeting of Genetic Vaccine Vectors"; Punnonen 등의 WO 99/41383호 "Antigen Library Immunization"; Punnonen 등의 WO 99/41368호 "Optimization of Immunomodulatory Properties of Genetic Vaccines"; Stemmer와 Crameri의 EP 752008호 "DNA Mutagenesis by Random Fragmentation and Reassembly"; Stemmer의 EP 0932670호 "Evolving Cellular DNA Uptake by Recursive Sequence Recombination"; Stemmer 등의 WO 99/23107호 "Modification of Virus Tropism and Host Range by Viral Genomes Shuffling"; Apt 등의 WO 99/21979호 "Human Papillomavirus Vectors"; Cardayre 등의 WO 98/31837호 "Evolution of Whole Cells and Organisms by Recursive Sequence Recombination"; Patten 및 Stemmer의 WO 98/27230호 "Methods for Optimization of Gene Therapy by Recursive Sequence Shuffling and Selection"; WO 00/00632호, "Methods for Generating Highly Diverse Libraries", WO 00/09679, "Methods for Obtaining in Vitro Recombined Polynucleotides Sequence Banks and Resulting Sequences"; Arnold 등의 WO 98/42832호 "Recombination of Polynucleotide Sequence Using Random or Defined Primers"; Arnold 등의 WO99/29902호 "Method for Creating Polynucleotide and Polypeptide Sequences"; Vind 의 WO 98/41653호 "An in Vitro Method for Construction of a DNA Library", Borchert 등의 WO 98/41622호, "Method for Constructing a Library Using DNA Shuffling," 및 Pati와 Zarling의 WO 98/42727호, "Sequence Alterations using Homologous Recombination."에 개시된다.
본 발명을 실시하기 위해 이용될 수 있는 프로토콜은 (다양한 다양성 생성 방법에 관한 상세 사항을 제공함) 예를 들어 1999년 9월 28일에 출원된 Patten 등의 미국 특허 출원 (USSN) 제09/407,800호, "SHUFFLING OF CODON ALTERED GENES" ; del Cardayre 등의 미국 특허 제6,379,964호, "EVOLUTION OF WHOLE CELLS AND ORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION"; Crameri 등의 "OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION", 미국 특허 제6,319,714호; 동 제6,368,861호; 동 제6,376,246호; 동 제6,423,542호; 동 제6,426,224호 및 PCT/US00/01203호; Welch 등의 "USE OF CODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETIC SHUFFLING", 미국 특허 제6,436,675호; 2000년 1월 18일에 Selifonov 등이 출원한 "METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS" (PCT/US00/01202) 및 예를 들어, 2000년 1월 18일에 Selifonov 등이 출원한 "METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS" (미국 특허 출원 제09/618,579호); 2000년 1월 18일에 Selifonov와 Stemmer가 출원한 "METHODS OF POPULATING DATA STRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS" (PCT/US00/01138); 및2000년 9월 6일에 Afffiolter가 출원한 "SINGLE-STRANDED NUCLEIC ACID TEMPLATEMEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENT ISOLATION" (미국 특허 출원 제09/656,549호); 및 미국 특허 제6,177,263호; 동 제6,153,410호에 개시된다.
비-확률적, 또는 "지시된 진화" 방법은 예를 들어 포화 돌연변이 유발법 (GSSMTM), 합성 라이게이션 재조립 (SLR), 또는 그 조합을 이용하여 본 발명의 핵산을 변형시켜 새로운 또는 변형된 특성 (예, 매우 산성 또는 염기성 조건, 높거나 낮은 온도 하에서의 활성 등)을 갖는 자일라나제를 생성한다. 변형된 핵산에 의해 암호화되는 폴리펩티드는 자일란 가수분해 또는 다른 활성에 대해 시험하기 전에 활성에 대해 스크리닝될 수 있다. 예를 들어 모세관 어레이 플랫폼을 이용하는 것과 같은 임의의 시험 양식 또는 프로토콜을 이용할 수 있다. 예를 들어, 미국 특허 제6,361,974호; 동 제6,280,926호; 동 제5,939,250호를 참고한다.
포화 돌연변이유발, 또는 GSSM
TM
일 측면에서, 축퇴성 N,N,G/T 서열을 포함하는 코돈 프라이머를 사용하여 점 돌연변이를 폴리뉴클레오티드, 예컨대 크실라나제 또는 본 발명의 항체에 도입하여, 전범위의 단일 아미노산 치환이 각 아미노산 위치, 예컨대 변형하고자 하는 표적화된 리간드 결합 부위 또는 효소 활성 부위 내의 아미노산 잔기에 나타나는 자손 폴리펩티드 세트를 형성한다. 이들 올리고뉴클레오티드는 인접한 제1 상동성 서열, 축퇴성 N,N,G/T 서열 및 경우에 따라 제2 상동성 서열을 포함할 수 있다.N,N,G/T 서열의 축퇴성은 모든 20개 아미노산에 대한 코돈을 포함하기 때문에, 그러한 올리고뉴클레오티드의 사용으로 얻은 하류 자손 전사 생성물은 폴리펩티드를 따라 각 아미노산 부위에서의 모든 가능한 아미노산 변화를 포함한다. 일 측면에서, 그러한 축퇴성 올리고뉴클레오티드(예컨대 하나의 축퇴성 N,N,G/T 카세트를 포함함)는 어버이 폴리뉴클레오티드 주형의 각각의 본래 코돈을 전체 범위의 코돈 치환시키는 데 사용된다. 또 다른 측면에서, 어버이 폴리뉴클레오티드 주형 내의 2개 이상의 본래 코돈을 전범위의 코돈 치환시키기 위해 2개 이상의 축퇴성 카세트가- 동일한 올리고뉴클레오티드 내인지 여부와 관련없이- 사용된다. 예를 들어, 하나 이상의 N,N,G/T 서열을 하나의 올리고뉴클레오티드에 포함시켜 하나 이상의 부위에 아미노산 돌연변이를 도입할 수 있다. 다수의 N,N,G/T 서열은 직접 인접하고 있거나, 또는 하나 이상의 추가의 뉴클레오티드 서열(들)에 의해 분리되어 있을 수 있다. 또 다른 측면에서, 삽입 및 결실을 도입하기 위해 사용가능한 올리고뉴클레오티드를 단독으로, 또는 N,N,G/T 서열을 함유하는 코돈과 함께 사용하여 아미노산 삽입, 결실 및/또는 치환의 임의의 조합 또는 순열을 도입할 수 있다.
일 측면에서, 2개 이상의 인접하는 아미노산 위치의 동시 돌연변이유발은 인접하는 N,N,G/T 트리플릿, 즉 축퇴성 (N,N,G/T)n 서열을 포함하는 올리고뉴클레오티드를 사용하여 실시한다. 또 다른 측면에서, N,N,G/T 서열보다 축퇴성이 적은 축퇴성 카세트가 사용된다. 예를 들어, 일부 예에서 하나의 N만을 포함하는 축퇴성 트리플릿 서열을 (예컨대 올리고뉴클레오티드 중에) 사용하는 것이 바람직할 수 있으며, 여기서 상기 N은 트리플릿의 제1, 제2 또는 제3 위치내에 있을 수 있다. 임의의 조합 및 순열을 비롯한 임의의 다른 염기를 트리플릿의 남은 2개 위치에 사용할 수 있다. 대안적으로, 일부 예에서는 축퇴성 N,N,N 트리플릿 서열을 (예컨대 올리고뉴클레오티드 중에서) 사용하는 것이 바람직할 수 있다.
일 측면에서, 축퇴성 트리플릿(예, N,N,G/T 트리플릿)을 사용하면 (총 20개 아미노산에 대한) 가능한 전범위의 천연 아미노산을 폴리펩티드 내의 각각의 모든 아미노산 위치로 체계적이고 수월하게 형성할 수 있다(대안적인 측면에서, 이 방법은 아미노산 잔기 또는 코돈, 위치당 모든 가능한 치환보다 적은 형성을 포함한다). 예를 들어, 100 아미노산 폴리펩티드의 경우, 2000개의 특징적인 종(즉, 위치당 20개의 가능한 아미노산 X 100 아미노산 위치)이 형성될 수 있다. 축퇴성 N,N,G/T 트리플릿을 포함하는 올리고뉴클레오티드 또는 올리고뉴클레오티드 세트를 사용하면, 32개의 각 서열은 20개의 가능한 모든 천연 아미노산을 암호화할 수 있다. 따라서, 하나 이상의 그러한 올리고뉴클레오티드를 사용하여 어버이 폴리뉴클레오티드 서열을 포화 돌연변이유발시키는 반응 용기에서, 20개의 특징적인 폴리펩티드를 암호화하는 32개의 특징적인 자손 폴리뉴클레오티드가 형성된다. 대조적으로, 부위 지향적 돌연변이유발에서 비축퇴성 올리고뉴클레오티드의 사용은 반응 용기당 오직 한개의 자손 폴리펩티드 산물을 유도한다. 비축퇴성 올리고뉴클레오티드는 경우에 따라서 개시된 축퇴성 프라이머와 함께 사용될 수 있다; 예를 들어, 비축퇴성 올리고뉴클레오티드를 사용하여 작용 폴리뉴클레오티드 내의 특이적 점 돌연변이를 형성할 수 있다. 이것은 특이적 침묵 점 돌연변이, 상응하는 아미노산 변화를 초래하는 점 돌연변이, 및 종지 코돈의 형성과 폴리펩티드 단편의 상응하는 발현을 유발하는 점 돌연변이를 형성하는 수단을 제공한다.
일 측면에서, 각각의 포화 돌연변이유발 반응 용기는, 어버이 폴리뉴클레오티드에서 돌연변이유발된 코돈 위치에 상응하는 하나의 특이적 아미노산 위치에서 모든 20개의 천연 아미노산이 나타나도록 20개 이상의 자손 폴리펩티드(예, 크실라나제) 분자를 암호화하는 폴리뉴클레오티드를 포함한다(다른 측면에서는 모든 20개 천연 조합 미만을 이용한다). 각 포화 돌연변이유발 반응 용기로부터 형성된 32배 축퇴성 자손 폴리펩티드를 클론 증폭시키고(예컨대, 발현 벡터를 사용하여 적절한 숙주(예, 이.콜리 숙주)로 클로닝시킴), 발현 스크리닝한다. 스크리닝으로 바람직한 성질 변화(어버이 폴리펩티드와 비교하여, 예컨대 알칼리 또는 산성 조건 하에 크실란 가수분해 활성 증가)를 나타내는 각 자손 폴리펩티드가 확인되면, 그 내부에 포함된 상응하게 바람직한 아미노산 치환을 확인하기 위해 서열 결정할 수 있다.
일 측면에서, 본 명세서에 개시된 바와 같이 포화 돌연변이유발을 사용하여 어버이 폴리펩티드 내의 각각의 모든 아미노산 위치를 돌연변이시키면, 하나 이상의 아미노산 위치에서 바람직한 아미노산 변화가 확인될 수 있다. 바람직한 아미노산 치환 전체 또는 일부의 조합을 포함하는 하나 이상의 신규한 자손 분자를 형성할 수 있다. 예를 들어, 2 특이적인 바람직한 아미노산 변화가 폴리펩티드 중 3 아미노산 위치 각각에서 확인되는 경우, 순열은 각 위치(본래 아미노산으로부터의 변화가 없는 경우, 및 2가지 바람직한 변화 각각) 및 3개 위치에서 3가지 가능성을 포함한다. 따라서, 미리 시험된 6개의 단일 점 돌연변이(즉, 3개 위치 각각에서 2개) 및 임의의 위치에서의 무변화인 7 경우를 비롯하여 전체 가능성은 3 x 3 x 3, 즉 27이다.
또 다른 측면에서, 스크리닝과 병행하여, 부위 포화 돌연변이유발을 셔플링, 키메라, 재조합 및 기타 돌연변이유발 과정과 함께 사용할 수 있다. 본 발명은 포화 돌연변이유발을 비롯한 임의의 돌연변이유발 과정(들)을 반복적 방식으로 이용한다. 한가지 적례에서, 임의의 돌연변이유발 과정(들)의 반복적 사용을 스크리닝과 조합하여 이용한다.
또한 본 발명은 전범위의 단일 아미노산 치환이 각 아미노산 위치에서 나타나는(유전자 부위 포화된 돌연변이유발(GSSMTM)) 자손 폴리펩티드 세트를 형성하기 위해서, 점 돌연변이를 폴리뉴클레오티드로 도입하기 위한 (축퇴성 N,N,N 서열을 포함하는) 독점의 코돈 프라이머의 용도를 제공한다. 사용된 올리고뉴클레오티드는 제1 상동성 서열, 축퇴성 N,N,N 서열 및 바람직하지만 필수적인 것은 아닌 제2 상동성 서열을 인접한 상태로 포함한다. N,N,N 서열의 축퇴성은 모든 20개 아미노산에 대한 코돈을 포함하기 때문에, 그러한 올리고뉴클레오티드의 사용으로부터 생긴 하류 자손 번역 생성물은 폴리펩티드를 따라 각 아미노산 부위에서 모든 가능한 아미노산 변화를 포함한다.
일 측면에서, 그러한 하나의 축퇴성 올리고뉴클레오티드(하나의 축퇴성 N,N,N 카세트를 포함함)는 어버이 폴리뉴클레오티드 주형 내의 각각의 본래 코돈을 전범위 코돈 치환시키는 데 사용된다. 또 다른 측면에서, 어버이 폴리뉴클레오티드주형 내의 2개 이상의 본래 코돈을 전범위의 코돈 치환시키기 위해 2개 이상의 축퇴성 N,N,N 카세트가- 동일한 올리고뉴클레오티드 내인지 여부와 관련없이- 사용된다. 따라서, 하나 이상의 N,N,N 서열을 하나의 올리고뉴클레오티드에 포함시켜 하나 이상의 부위에 아미노산 돌연변이를 도입할 수 있다. 다수의 N,N,N 서열은 직접 인접하고 있거나, 또는 하나 이상의 추가의 뉴클레오티드 서열(들)에 의해 분리되어 있을 수 있다. 또 다른 측면에서, 삽입 및 결실을 도입하기 위해 사용가능한 올리고뉴클레오티드를 단독으로, 또는 N,N,N 서열을 함유하는 코돈과 함께 사용하여 아미노산 삽입, 결실 및/또는 치환의 임의의 조합 또는 순열을 도입할 수 있다.
특정 적례에서, 인접하는 N,N,N 트리플릿, 즉 축퇴성 (N,N,N)n서열을 포함하는 올리고뉴클레오티드를 사용하여 2 이상의 인접한 아미노산 위치를 동시에 돌연변이시킬 수 있다.
또 다른 측면에서, 본 발명은 N,N,N 서열보다 축퇴성이 적은 축퇴성 카세트의 사용을 포함한다. 예를 들어, 일부 예에서 하나의 N만을 포함하는 축퇴성 트리플릿 서열을 (예컨대 올리고뉴클레오티드 중에) 사용하는 것이 바람직할 수 있으며, 여기서 상기 N은 트리플릿의 제1, 제2 또는 제3 위치내에 있을 수 있다. 임의의 조합 및 순열을 비롯한 임의의 다른 염기를 트리플릿의 남은 2개 위치에 사용할 수 있다. 대안적으로, 일부 예에서는 축퇴성 N,N,N 트리플릿 서열, N,N.G/T 또는 N,N,G/C 트리플릿 서열을 (예컨대 올리고뉴클레오티드 중에서) 사용하는 것이 바람직할 수 있다.
그러나, 본 명세서 중에 개시된 축퇴성 트리플릿(예, N,N,G/T 또는 N,N,G/C 트리플릿 서열)의 사용은 몇몇 이유로 유리할 것으로 예상된다. 일 측면에서, 본 발명은 (총 20개의 아미노산에 대한) 전범위의 가능한 아미노산의 치환을 폴리펩티드의 각각의 모든 아미노산 위치에 체계적으로 꽤 수월하게 형성하는 수단을 제공한다. 따라서, 100 아미노산 폴리펩티드에 대하여, 본 발명은 2000개의 별개의 종(즉, 위치당 20개의 가능한 아미노산 X 100개 아미노산 위치)을 체계적으로 매우 수월하게 형성하는 방법을 제공한다. 축퇴성 N,NG/T 또는 N,N,G/C 트리플릿 서열을 포함하는 올리고뉴클레오티드를 사용하면 20개의 가능한 아미노산에 대해 암호화하는 32개의 개별 서열이 제공된다. 따라서, 그러한 올리고뉴클레오티드를 사용하여 어버이 폴리뉴클레오티드 서열을 포화 돌연변이유발시키는 반응 용기에서, 20개의 별개의 폴리펩티드를 암호화하는 32개의 별개의 자손 폴리뉴클레오티드가 형성된다. 대조적으로, 부위 지정 돌연변이유발법에서의 비-축퇴성 올리고뉴클레오티드의 사용은 반응 용기당 단 하나의 자손 폴리펩티드 생성물을 유도한다.
본 발명은 또한 개시된 축퇴성 프라이머와 함께 경우에 따라 사용될 수 있는 비축퇴성 올리고뉴클레오티드의 사용에 관한 것이다. 일부 상황에서 작용 폴리뉴클레오티드 내에 특이적 점 돌연변이를 형성하기 위해 비축퇴성 올리고뉴클레오티드를 사용하는 것이 유리할 것으로 예상된다. 이것은 특이적인 침묵 점 돌연변이, 상응하는 아미노산 변화를 초래하는 점 돌연변이 및 종지 코돈의 형성과 폴리펩티드 단편의 상응하는 발현을 유발하는 점 돌연변이를 형성하는 수단을 제공한다.
본 발명의 일 측면에서, 각 포화 돌연변이유발 반응 용기는 적어도 20개의자손 폴리펩티드 분자를 암호화하는 폴리뉴클레오티드를 포함하여 어버이 폴리뉴클레오티드에서 돌연변이된 코돈 위치에 상응하는 하나의 특이적 아미노산 위치에 모든 20개 아미노산이 나타나도록 한다. 각 포화 돌연변이유발 반응 용기로부터 형성된 32배 축퇴성 자손 폴리펩티드를 클론 증폭시키고(예컨대, 발현 벡터를 사용하여 적절한 이.콜리 숙주로 클로닝시킴), 발현 스크리닝한다. 스크리닝으로 (어버이 폴리펩티드와 비교하여) 바람직한 성질 변화를 나타내는 각 자손 폴리펩티드가 확인되면, 그 내부에 포함된 상응하게 바람직한 아미노산 치환을 확인하기 위해 서열 결정할 수 있다.
일 측면에서, 본 명세서에 개시된 바와 같이 포화 돌연변이유발을 사용하여 어버이 폴리펩티드 내의 각각의 모든 아미노산 위치를 돌연변이시키면, 하나 이상의 아미노산 위치에서 바람직한 아미노산 변화가 확인될 수 있다. 바람직한 아미노산 치환 전체 또는 일부의 조합을 포함하는 하나 이상의 신규한 자손 분자를 형성할 수 있다. 예를 들어, 2 특이적인 바람직한 아미노산 변화가 폴리펩티드 중 3 아미노산 위치 각각에서 확인되는 경우, 순열은 각 위치(본래 아미노산으로부터의 변화가 없는 경우, 및 2가지 바람직한 변화 각각) 및 3개 위치에서 3가지 가능성을 포함한다. 따라서, 미리 시험된 6개의 단일 점 돌연변이(즉, 3개 위치 각각에서 2개) 및 임의의 위치에서의 무변화인 7 경우를 비롯하여 전체 가능성은 3 x 3 x 3, 즉 27이다.
따라서, 비제한적인 적례에서, 본 발명은 2 이상의 관련 폴리뉴클레오티드가 적절한 숙주 세포 내로 도입되어 하이브리드 폴리뉴클레오티드가 재조합 및 감법재분류에 의해 형성되는 방법과 같은 추가의 돌연변이화 방법과 함께 포화 돌연변이유발법을 사용하는 것을 제공한다.
전체 유전자 서열을 따라 돌연변이유발시키는 것 외에, 본 발명에서는 폴리뉴클레오티드 서열 내의 임의의 수의 염기 각각을 치환하는 데 돌연변이유발법을 사용할 수 있으며, 이 때 돌연변이화하려는 염기의 수는 바람직하게는 15∼100,000의 모든 정수이다. 따라서, 분자를 따라 모든 위치에서 돌연변이시키는 대신에, 모든 또는 이산된 수의 염기(바람직하게는 총 15∼100,000의 서브세트)를 돌연변이유발시킬 수 있다. 바람직하게는, 폴리뉴클레오티드 서열을 따라 각 위치 또는 위치군을 돌연변이유발하는 데 별도의 뉴클레오티드를 사용한다. 돌연변이하고자 하는 3위치군은 코돈일 수 있다. 돌연변이성 카세트라고도 하는 이종성 카세트를 포함하는 돌연변이성 프라이머를 사용하여 돌연변이를 도입하는 것이 바람직하다. 예시적 카세트는 1∼500 염기를 가질 수 있다. 그러한 이종성 카세트 내의 각 뉴클레오티드 위치는 N, A, C, G, T, A/C, A/G, A/T, C/G, C/T, G/T, C/G/T, A/G/T, A/C/T, A/C/G 또는 E이며, 여기서 E는 A, C, G 또는 T가 아닌 임의의 염기이다(E는 디자이너 올리고뉴클레오티드라고도 언급될 수 있음).
일반적인 의미에서, 포화 돌연변이유발은 돌연변이시키고자 하는 규명된 폴리뉴클레오티드(이 때 돌연변이시키고자 하는 서열은 바람직하게는 약 15∼100,000 염기 길이임) 내의 돌연변이성 카세트의 완전한 세트(이 때, 각 카세트는 바람직하게는 약 1∼500 염기 길이임)를 돌연변이시키는 것을 포함한다. 따라서, 돌연변이군(1∼100 돌연변이)을 돌연변이시키고자 하는 각 카세트에 도입한다. 하나의 카세트 내로 도입하고자 하는 돌연변이의 그룹핑은, 포화 돌연변이 1회 적용 과정에서 제2 카세트로 도입하고자 하는 돌연변이의 제2 그룹핑과 상이하거나 또는 동일할 수 있다. 그러한 그룹핑의 예는 결실, 첨가, 특정 코돈의 그룹핑 및 특정 뉴클레오티드 카세트의 그룹핑이다.
돌연변이시키고자 하는 규명된 서열은 전체 유전자, 경로, cDNA, 전체 오픈 리딩 프레임(ORF) 및 전체 프로모터, 인헨서, 리프레서/트랜스액티베이터, 복제 기점, 인트론, 오퍼레이터 또는 임의의 폴리뉴클레오티드 작용기를 포함한다. 일반적으로, 이러한 목적의 "소정 서열"은 임의의 폴리뉴클레오티드, 즉 15염기 폴리뉴클레오티드 서열과 15∼15,000 염기의 폴리뉴클레오티드 서열일 수 있다(본 발명은 구체적으로 그 사이의 모든 정수를 포함한다). 코돈의 그룹핑을 선택하는 데 있어서의 고려 사항으로는 축퇴성 돌연변이 카세트가 암호화하는 아미노산의 유형이 포함된다.
돌연변이성 카세트로 도입할 수 있는 돌연변이의 그룹핑의 일례에서, 본 발명은 각 위치에서 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 및 20 아미노산에 대해 암호화하는 (축퇴성 올리고뉴클레오티드를 사용한) 축퇴성 코돈 치환 및 이에 의해 암호화되는 폴리펩티드의 라이브러리를 제공한다.
합성 연결 재조립(SLR)
본 발명은 신규하거나 변형된 성질을 갖는 폴리펩티드, 예컨대 크실라나제 또는 본 발명의 항체를 형성하는 "유도성 진화 과정"인 "합성 연결 재조립" 또는 간단히 "SLR"이라고 하는 비확률론적인 유전자 변형 시스템을 제공한다.
SLR은 비확률론적으로 올리고뉴클레오티드 단편을 함께 연결시키는 방법이다. 이 방법은 핵산 빌딩 블록이 셔플링, 농축 또는 무작위하게 키메라화되지 않는다는 점에서 확률론적인 올리고뉴클레오티드 셔플링과는 다르며, 오히려 비확률론적으로 조립된다. 예컨대 "Synthetic Ligation Reassembly in Directed Evolution"이라는 명칭으로 1999년 6월 14일에 출원된 미국 특허 출원(USSN) 09/332,835호 ("USSN 09/332,835호") 참조. 일 측면에서, SLR은 하기의 단계들을 포함한다: (a) 상동성 유전자를 암호화하는 서열을 포함하는 주형 폴리뉴클레오티드를 제공하는 단계; (b) 소정의 서열에서 주형 폴리뉴클레오티드와 교차 재조립하도록 고안되고, 주형 폴리뉴클레오티드의 측면에 있는 변종 서열에 상동성인 서열 및 상동성 유전자 변종인 서열을 포함하는 다수의 빌딩 블록 폴리뉴클레오티드를 제공하는 단계; (c) 빌딩 블록 폴리뉴클레오티드를 주형 폴리뉴클레오티드와 조합하여 빌딩 블록 폴리뉴클레오티드를 주형 폴리뉴클레오티드와 교차 재조립하여 상동성 유전자 서열 변이체를 포함하는 폴리뉴클레오티드를 형성하는 단계.
SLR은 재배열하고자 하는 폴리뉴클레오티드 사이의 높은 레벨의 상동성의 존재에 따라 좌우되지 않는다. 따라서, 이 방법을 사용하여 10100이상의 상이한 키메라를 포함하는 자손 분자의 라이브러리(또는 세트)를 비확률론적으로 형성할 수 있다. SLR을 이용하여 101000이상의 상이한 자손 키메라를 포함하는 라이브러리를 형성할 수 있다. 따라서, 본 발명의 측면들은 디자인에 의해 선택된 전체 조립 순서로 축소된 최종 키메라 핵산 분자 세트를 생성하는 비확률론적인 방법을 포함한다.이 방법은 사용가능한 상호 상용성 연결성 말단을 갖는 다수의 특이적 핵산 빌딩 블록을 디자인으로 형성하는 단계, 및 이들 핵산 빌딩 블록을 조립하는 단계를 포함하여 디자인된 전체 조립 순서를 실현한다.
조립하고자 하는 핵산 빌딩 블록의 상호 상용성 연결성 말단은, 소정 순서로 빌딩 블록을 커플링시킬 수 있는 경우 이러한 유형의 순서에 따른 조립에 대해 '사용가능한' 것으로 간주된다. 따라서, 핵산 빌딩 블록이 커플링될 수 있는 전체 조립 순서를 연결성 말단의 디자인으로 특정한다. 하나 이상의 조립 단계를 사용하는 경우, 핵산 빌딩 블록이 커플링될 수 있는 전체 조립 순서는 조립 단계(들)의 순차적인 순서에 의해 특정된다. 일 측면에서, 어닐링된 빌딩 조각을 효소, 예컨대 리가제(예, T4 DNA 리가제)로 처리하여 빌딩 조각의 공유 결합을 형성한다.
일 측면에서, 올리고뉴클레오티드 빌딩 블록의 디자인은 최종 키메라 폴리뉴클레오티드의 자손 세트를 생성하는 베이스로서 작용하는 선조 핵산 서열 주형의 세트를 분석하여 얻는다. 따라서, 이들 어버이 올리고뉴클레오티드 주형은 돌연변이시키고자 하는, 예컨대 키메라화 또는 셔플링시키고자 하는 핵산 빌딩 블록의 디자인을 보조하는 서열 정보원으로서 작용한다. 본 발명의 일 측면에서, 다수의 어버이 핵산 주형의 서열을 정렬시켜 하나 이상의 분계점(demarcation point)을 선택한다. 분계점은 상동성 영역에 위치할 수 있으며, 하나 이상의 뉴클레오티드를 포함한다. 이들 분계점은 선조 주형 중 2개 이상과 공유되는 것이 바람직하다. 분계점을 사용하여 어버이 폴리뉴클레오티드를 재배열하기 위해 형성하고자 하는 올리고뉴클레오티드 빌딩 블록의 경계를 정할 수 있다. 선조 분자 내에서 확인 및 선택된 분계점은 최종 키메라 자손 분자의 조립시 유효 키메라점으로서 작용한다. 분계점은 2 이상의 어버이 폴리뉴클레오티드 서열에 의해 공유되는 상동성 영역(하나 이상의 상동성 뉴클레오티드 염기를 포함함)일 수 있다. 대안적으로, 분계점은 어버이 폴리뉴클레오티드 서열의 적어도 1/2에 의해 공유되는 상동성 영역이거나, 또는 어버이 폴리뉴클레오티드 서열의 적어도 2/3에 의해 공유되는 상동성 영역일 수 있다. 더욱 더 바람직하게는 작용가능한 분계점은 어버이 폴리뉴클레오티드 서열의 적어도 3/4에 의해 공유되는 상동성 영역이거나, 또는 거의 모든 어버이 폴리뉴클레오티드 서열에 의해 공유될 수 있다. 일 측면에서, 분계점은 모든 어버이 폴리뉴클레오티드 서열에 의해 공유되는 상동성 영역이다.
일 측면에서, 자손 키메라 폴리뉴클레오티드의 남김없는 라이브러리를 형성하기 위해서 연결 재조립 과정을 철저히 실시한다. 즉, 핵산 빌딩 블록의 모든 가능한 순서의 조합이 최종 키메라 핵산 분자 세트 내에 나타난다. 동시에, 또 다른 측면에서, 각 조합의 조립 순서(즉, 각 최종 키메라 핵산의 5' → 3' 서열에서 각 빌딩 블록의 조립 순서)는 전술한 바와 같이 디자인에 의한다(즉, 비확률론적임). 본 발명의 비확률론적 특성으로 인하여, 원하지 않는 부산물의 가능성이 크게 감소된다.
또 다른 측면에서, 연결 조립 방법은 체계적으로 실시한다. 예를 들어, 자손 분자의 체계적으로 구획화된 라이브러리를 형성하기 위해서 이 방법을 실시하는 데, 구획은 예컨대 하나씩 체계적으로 스크리닝될 수 있다. 다시 말하면, 본 발명에 따르면, 순차적 단계의 조립 반응의 선별적이고 적절한 사용과 함께, 특이적 핵산빌딩 블록의 선별적이고 적절한 사용을 통해 특정 자손 생성물 세트가 일부 반응 용기 각각에서 제조되는 디자인을 실현할 수 있다. 이로 인하여 체계적 조사 및 스크리닝 절차가 실시 가능해진다. 따라서, 이들 방법에서는 잠재적으로 매우 많은 수의 자손 분자를 더 적은 군에서 체계적으로 검사할 수 있게 된다. 매우 융통성이 있지만 철저하고 체계적인 방법으로 키메라화를 실시하는 능력으로 인하여, 특히 선조 분자들 사이의 상동성 레벨이 낮은 경우, 이들 방법은 다수의 자손 분자를 포함하는 라이브러리(또는 세트)를 형성한다. 본 연결 재조립 발명의 비확률론적인 특성으로 인하여, 생성된 자손 분자는 디자인에 의해 선택된 전체 조립 순서를 갖는 최종 키메라 핵산 분자의 라이브러리를 포함하는 것이 바람직하다. 또한, 포화 돌연변이유발 및 최적화된 유도성 진화 방법을 사용하여 상이한 자손 분자 종을 형성할 수 있다. 본 발명은 분계점의 선택, 핵산 빌딩 블록의 크기 및 수, 그리고 커플링의 크기 및 디자인에 관해 자유로히 선택하고 조절할 수 있을 것으로 기대된다. 또한, 본 발명의 작동능을 위한 분자간 상동성에 대한 요건은 매우 완화될 것으로 예상된다. 실제로, 분계점은 분자간 상동성이 거의 또는 전혀 없는 영역에서 선택할 수 있다. 예를 들어, 코돈 동요, 즉 코돈의 축퇴성으로 인하여, 상응하는 선조 주형에서 본래 암호화된 아미노산을 변경하지 않고 뉴클레오티드 치환을 핵산 빌딩 블록 내로 도입할 수 있다. 대안적으로, 본래의 아미노산에 대한 암호가 변경되도록 코돈을 변경할 수 있다. 본 발명은 그러한 치환을 핵산 빌딩 블록 내에 도입하여 분자간 상동성 분계점의 발생을 증가시키고, 따라서 빌딩 블록 중에서 증가된 수의 커플링을 실현할 수 있으며, 이는 더 많은 수의 자손 키메라 분자를 형성할 수 있게 한다.
합성 유전자 재조립
일 측면에서, 본 발명은 합성 유전자 재조립(예, GeneReassemblyTM, 예컨대 미국 특허 제6,537,776호 참조)라고 하는 비확률론적 방법을 제공하는 데, 이 방법은 핵산 빌딩 블록이 셔플링되거나 농축되거나 또는 무작위적으로 키메라화되지 않는다는 점에서 확률론적인 셔플링과는 다르며, 그 보다는 비확률론적으로 조립된다.
합성 유전자 재조립법은 셔플링하고자 하는 폴리뉴클레오티드 사이의 높은 레벨의 상동성의 존재에 따라 달라지지 않는다. 본 발명을 이용하여 10100이상의 상이한 키메라를 포함하는 자손 분자의 라이브러리(또는 세트)를 비확률론적으로 형성할 수 있다. 생각할 수 있는 바로는, 합성 유전자 재조립을 이용하여 101000이상의 상이한 자손 키메라를 포함하는 라이브러리를 형성할 수 있다.
따라서, 일 측면에서, 본 발명은 디자인에 의해 선택된 전체 조립 순서를 갖는 최종 키메라 핵산 분자 세트를 생성하는 비확률론적인 방법을 제공하는 데, 이 방법은 상호 상용성 연결성 말단을 갖는 다수의 특이적 핵산 빌딩 블록을 디자인에 의해 형성하는 단계, 및 이들 핵산 빌딩 블록을 조립하는 단계를 포함하여, 디자인된 전체 조립 순서를 실현한다.
일 측면에서, 합성 유전자 재조립은 1) 하나 이상의 조상 또는 어버이 세대 주형(들)으로부터, 돌연변이시켜 하나 이상의 점 돌연변이, 삽입, 결실 및/또는 키메라화를 실시한 (폴리뉴클레오티드 서열을 포함하는 분자, 예컨대 폴리펩티드 암호 서열을 포함하는 분자를 비롯한) 자손 세대의 분자(들)를 제조하는 단계, 2) 예컨대 고 처리량 방법을 이용하여 주목되는 하나 이상의 성질(예, 효소 활성의 개선)에 대해 자손 세대 분자(들)를 스크리닝하는 단계; 3) 경우에 따라서, 어버이 및/또는 자손 세대 분자에 관한 구조 및/또는 기능 정보를 얻고/또는 분류하는 단계; 4) 경우에 따라 1) 내지 3) 중 임의의 단계를 반복하는 단계의 방법을 포함한다. 일 측면에서, "코돈 부위 포화 돌연변이유발"시 (예컨대 어버이 폴리뉴클레오티드 주형으로부터) 자손 세대의 폴리뉴클레오티드가 형성되며, 각각은 3개 이하의 인접 점 돌연변이(즉 새로운 코돈을 포함하는 상이한 염기들)의 세트를 하나 이상 갖고 있어서, 모든 코돈(또는 동일한 아미노산을 암호화하는 축퇴성 코돈의 모든 패밀리)이 각 코돈 위치에 나타난다. 이러한 자손 세대 폴리뉴클레오티드에 상응하고 이에 의해 암호화된 자손 폴리펩티드 세트가 형성되며, 이들 각각은 하나 이상의 단일 아미노산 점 돌연변이를 갖는다. 일 측면에서, "아미노산 부위 포화 돌연변이유발"시 폴리펩티드를 따라 각각의 모든 아미노산 위치에서 19개의 자연적으로 암호화된 폴리펩티드 형성 알파 아미노산 치환 각각에 대해 그러한 돌연변이 폴리펩티드 1개가 형성된다. 이는, 어버이 폴리펩티드를 따라 각각의 모든 아미노산 위치에 대해, 본래의 아미노산을 비롯한 총 20개의 별개의 자손 폴리펩티드, 또는 20개의 자연적으로 암호화된 아미노산 대신에 또는 이와 함께 부가의 아미노산이 사용된 경우 가능하게는 21개 이상의 별개의 자손 폴리펩티드를 형성한다.
따라서, 일 측면에서, 20개의 자연적으로 암호화된 폴리펩티드 형성 알파 아미노산 외에 및/또는 이와 조합하여, 기타의 희소한 및/또는 자연적으로 암호화되지 않는 아미노산 및 아미노산 유도체를 포함하는 돌연변이를 형성하는 데 이 방법이 이용가능하다. 또 다른 측면에서, 적절한 숙주의 천연 또는 비변형된 코돈 인식 시스템 외에 및/또는 이와 조합하여, (하나 이상의 변형된 tRNA 분자를 갖는 숙주 세포 내에서와 같이) 변형된 코돈, 돌연변이된 코돈 및/또는 디자이너 코돈 인식 시스템을 사용하여 돌연변이를 형성하는 데 이 방법을 이용할 수 있다.
또 다른 측면에서, 본 발명은 재조합에 관한 것이며, 더욱 구체적으로, 부분 상동성 영역을 포함하는 폴리뉴클레오티드의 생체내 재분류 방법으로 폴리펩티드를 암호화하는 폴리뉴클레오티드를 준비하고, 폴리뉴클레오티드를 조립하여 하나 이상의 폴리뉴클레오티드를 형성하며, 유용한 성질을 갖는 폴리펩티드(들)를 생성하기 위한 폴리뉴클레오티드를 스크리닝하는 방법에 관한 것이다.
또 다른 일 측면에서, 본 발명은 임의의 분자 성질(예, 효소 활성) 또는 현행 방법에 의해 허용되는 성질들의 조합에 대하여 실현된 임의의 돌연변이 변화 효과(예, 특히 포화 돌연변이유발)를 분석 및 분류하는 데 본 발명을 이용할 수 있다. 따라서, 어버이 폴리펩티드 중 각 아미노산을 19개 이상의 가능한 치환 각각으로 변화시킨 효과를 측정하기 위해서 포괄적인 방법이 제공된다. 이 방법으로 어버이 폴리펩티드내의 각 아미노산을 폴리펩티드의 측정가능한 성질에 대한 가능한 효과 범위에 따라 특성화 및 분류할 수 있다.
일 측면에서, 인트론을 핵산 빌딩 블록에 의해 키메라 자손 분자로 도입할 수 있다. 종종 인트론은 작동하게 되기 위해서 양 말단에 공통 서열을 보유한다.인트론은 유전자 스플라이싱을 가능하게 하는 것 외에, 상동성 부위를 다른 핵산에 제공하여 상동성 재조합을 가능하게 하는 부가적인 목적에 사용될 수 있다. 이러한 목적 및 유효한 기타 목적을 위해서, 인트론을 도입하기 위한 거대한 핵산 빌딩 블록을 형성하는 것이 때로 바람직할 수 있다. 그 크기가 지나치게 커서 2개의 1본쇄 올리고뉴클레오티드의 직접적인 화학 합성에 의해 쉽게 형성할 수 있는 경우, 그러한 전문화된 핵산 빌딩 블록은, 2개 이상의 1본쇄 올리고뉴클레오티드의 직접적인 화학적 합성에 의해 또는 폴리머라제계 증폭 반응을 이용하여 형성할 수 있다.
조립하고자 하는 핵산 빌딩 블록의 상호 상용성 연결성 말단은, 소정 순서로 빌딩 블록을 커플링시킬 수 있는 경우 이러한 유형의 순서에 따른 조립에 대해 '사용가능한' 것으로 간주된다. 따라서, 일 측면에서 핵산 빌딩 블록이 커플링될 수 있는 전체 조립 순서를 연결성 말단의 디자인으로 특정하고, 하나 이상의 조립 단계를 사용하는 경우, 핵산 빌딩 블록이 커플링될 수 있는 전체 조립 순서는 조립 단계(들)의 순차적인 순서에 의해 특정된다. 일 측면에서, 어닐링된 빌딩 조각을 효소, 예컨대 리가제(예, T4 DNA 리가제)로 처리하여 빌딩 조각의 공유 결합을 실현한다.
관여하는 돌출부 중 모든 뉴클레오티드를 이용하지 않는 방식으로 커플링이 일어날 수 있다. 커플링이 리가제 효소 처리로 보강되어 "갭 연결" 또는 "갭형 연결"이라고 것을 형성하는 경우, 이 커플링은 특히 (예컨대 형질전환된 숙주에서) 강하게 잔존한다. 이러한 종류의 커플링은 원하지 않는 배경 생성물(들)의 형성에 기여할 수 있지만, 이를 이용하여 디자인된 연결 재조립에 의해 형성된 자손 라이브러리의 다양성을 유리하게 증가시킬 수 있다. 일부 돌출부는 회문식 커플링을 형성하기 위해 자가 커플링을 진행할 수 있다. 리가제 효소를 이용한 처리에 의해 커플링이 보강되는 경우, 이는 실질적으로 강화된 것이다. 돌출부에서의 5' 포스페이트 결핍을 이용하여 이러한 종류의 회문식 자가 연결을 유리하게 예방할 수 있다. 따라서, 본 발명에서는 5' 포스페이트기가 결핍된 핵산 빌딩 블록을 화학적으로 제조(또는 순서대로 제조)한다. 대안적으로, 예컨대 송아지 장 알칼리 포스파타제(CIAP)와 같은 포스파타제 효소를 이용한 처리에 의해 핵산 빌딩 블록을 제거하여, 연결 재조립 과정에서 회문식 자가 연결을 예방할 수 있다.
또 다른 측면에서, 최종 키메라 핵산 분자의 자손 세트를 생성하는 베이스로서 작용하는 선조 핵산 주형 세트의 서열을 분석하면 핵산 빌딩 블록의 디자인이 얻어진다. 따라서, 이들 선조 핵산 주형은 돌연변이시키고자 하는, 예컨대 키메라화 또는 셔플링시키고자 하는 핵산 빌딩 블록의 디자인을 보조하는 서열 정보원으로서 사용된다.
일례에서, 본 발명은 관련 유전자의 패밀리 및 관련된 생성물의 암호화된 패밀리의 키메라화를 위해 제공된다. 특정 예에서, 암호화된 생성물은 효소이다. 본 발명의 크실라나제를 본 명세서에 개시된 방법에 따라 돌연변이시킬 수 있다.
본 발명의 일 측면에 따라서, 다수의 선조 핵산 주형의 서열(예, 그룹 A 핵산 서열의 폴리뉴클레오티드)을 정렬하여 하나 이상의 분계점을 선택하며, 분계점은 상동성 영역에 배치될 수 있다. 분계점을 이용하여 생성하고자 하는 핵산 빌딩 블록의 경계를 정할 수 있다. 따라서, 선조 분자에서 확인 및 선택된 분계점은 자손 분자의 조립체 내의 유효 키메라 점으로서 기능한다.
통상적으로, 사용가능한 분계점은 2개 이상의 선조 주형에 의해 공유되는 (하나 이상의 상동성 뉴클레오티드 염기를 포함하는) 상동성 영역이지만, 분계점은 선조 주형의 적어도 1/2, 선조 주형의 적어도 2/3, 선조 주형의 적어도 3/4, 바람직하게는 거의 모든 선조 주형에 의해 공유되는 상동성 영역일 수 있다. 더욱 더 바람직하게는, 사용가능한 분계점은 모든 선조 주형에 의해 공유되는 상동성 영역이다.
일 측면에서, 유전자 재조립 과정을 철저히 실시하여 남김없이 라이브러리를 형성한다. 즉, 핵산 빌딩 블록의 모든 가능한 순서의 조합이 최종 키메라 핵산 분자 세트 내에 나타난다. 동시에, 각 조합의 조립 순서(즉, 각 최종 키메라 핵산의 5' → 3' 서열에서 각 빌딩 블록의 조립 순서)는 디자인에 의한다(즉, 비확률론적임). 본 발명의 비확률론적 특성으로 인하여, 원하지 않는 부산물의 가능성이 크게 감소된다.
또 다른 측면에서, 본 방법에 따라 유전자 재조립 방법을 체계적으로 실시하여, 예를 들어 체계적으로 구획화된 라이브러리를 형성하는 데, 구획은 예컨대 하나씩 체계적으로 스크리닝될 수 있다. 다시 말하면, 본 발명에 따르면, 순차적 단계의 조립 반응의 선별적이고 적절한 사용과 함께, 특이적 핵산 빌딩 블록의 선별적이고 적절한 사용을 통해 특정 자손 생성물 세트가 일부 반응 용기 각각에서 제조되는 실험 디자인을 실현할 수 있다. 이로 인하여 체계적 조사 및 스크리닝 절차가 실시 가능해진다. 따라서, 이들 방법은 잠재적으로 매우 많은 수의 자손 분자를더 적은 군에서 체계적으로 검사할 수 있게 한다.
매우 융통성이 있지만 철저하고 체계적인 방법으로 키메라화를 실시하는 능력으로 인하여, 특히 선조 분자들 사이의 상동성 레벨이 낮은 경우, 본 방법은 다수의 자손 분자를 포함하는 라이브러리(또는 세트)의 형성을 제공한다. 본 유전자 재조립 발명의 비확률론적인 특성으로 인하여, 생성된 자손 분자는 바람직하게는 디자인에 의해 선택된 전체 조립 순서를 갖는 최종 키메라 핵산 분자의 라이브러리를 포함하는 것이 바람직하다. 특정 측면에서, 형성된 그러한 라이브러리는 103이상 내지 101000이상의 상이한 자손 분자 종을 포함한다.
일 측면에서, 개시된 바와 같이 생성된 최종 키메라 핵산 분자의 세트는 폴리펩티드를 암호화하는 폴리뉴클레오티드를 포함한다. 일 측면에 따라서, 이 폴리펩티드는 유전자이며, 이 유전자는 인공 유전자일 수 있다. 또 다른 측면에 따르면, 이 폴리뉴클레오티드는 유전자 경로로서, 인공 유전자 경로일 수 있다. 본 발명에 따르면 본 발명에 의해 형성된 하나 이상의 인공 유전자를 인공 유전자 경로, 예컨대 진핵 유기체(예, 식물)에서 작동가능한 경로에 도입할 수 있다.
또 다른 적례에서, 빌딩 블록이 형성되는 단계의 합성 특성으로 인하여 이후에 시험관내 과정(예컨대 돌연변이유발) 또는 생체내 과정(예컨대, 숙주 유기체의 유전자 스플라이싱 능력 이용)으로 임의 제거될 수 있는 뉴클레오티드(예, 하나 이상의 뉴클레오티드, 이 뉴클레오티드는 예를 들면 코돈 또는 인트론 또는 조절 서열일 수 있음)의 디자인 및 도입이 가능해진다. 여러 예에서, 사용가능한 분계점을형성하는 잠재적인 잇점 외에도 여러 가지 다른 이유로 인하여 이들 뉴클레오티드의 도입이 바람직할 수 있을 것으로 기대된다.
따라서, 또 다른 측면에 따르면, 본 발명은 핵산 빌딩 블록을 사용하여 인트론을 도입할 수 있음을 규정한다. 따라서, 본 발명에 따르면 기능성 인트론을 본 발명의 인공 유전자에 도입할 수 있다. 또한, 본 발명에 따라 기능성 인트론을 본 발명의 인공 유전자 경로에 도입할 수 있다. 따라서, 본 발명은 인공적으로 도입된 하나(또는 그 이상)의 인트론(들)을 포함하는 인공 유전자인 키메라 폴리뉴클레오티드의 형성을 위해 제공된다.
따라서, 본 발명은 또한 인공적으로 도입된 하나(또는 그 이상)의 인트론(들)을 포함하는 인공 유전자 경로인 키메라 폴리뉴클레오티드의 형성을 위해 제공된다. 바람직하게는, 인공적으로 도입된 인트론(들)은, 자연 발생적 인트론이 유전자 스플라이싱에 있어서 기능적으로 작용하는 방식으로 유전자 스플라이싱을 위해 하나 이상의 숙주 세포에서 기능한다. 본 발명은 재조합 및/또는 스플라이싱을 위해 숙주 유기체 내로 도입하고자 하는 인공 인트론 함유 폴리뉴클레오티드의 제조 방법을 제공한다.
본 발명을 이용하여 생성된 인공 유전자는 또 다른 핵산과의 재조합을 위한 기질로서 작용할 수 있다. 유사하게, 본 발명을 이용하여 형성된 인공 유전자 경로는 또 다른 핵산과의 재조합을 위한 기질로서 작용할 수 있다. 일 측면에서, 인공의 인트론 함유 유전자와 재조합쌍으로서 기능하는 핵산 사이의 상동성 영역에 의해 재조합이 촉진되거나, 또는 그 영역에서 재조합이 일어난다. 일 측면에서, 재조합쌍은 또한 인공 유전자 또는 인공 유전자 경로를 비롯하여 본 발명에 의해 생성된 핵산일 수 있다. 인공 유전자 내에 인공적으로 도입된 하나(또는 그 이상)의 인트론(들)에 존재하는 상동성 영역에 의해 재조합이 촉진되거나, 또는 이 영역에서 재조합이 일어날 수 있다.
본 발명의 합성 유전자 재조립 방법에서는 다수의 핵산 빌딩 블록을 이용하며, 이들 각각은 2개의 연결성 말단을 갖는 것이 바람직하다. 각 핵산 빌딩 블록 상에서의 2개의 연결성 말단은 2개의 평활 말단(즉, 각각 0 뉴클레오티드의 돌출부를 가짐)이거나, 또는 바람직하게는 하나의 평활 말단 및 하나의 돌출 말단이거나, 또는 더욱 바람직하게는 2개의 돌출 말단일 수 있다.
이러한 목적으로 유용한 돌출부는 3' 돌출부 또는 5' 돌출부일 수 있다. 따라서, 핵산 빌딩 블록은 3' 돌출부 또는, 대안적으로 5' 돌출부 또는, 대안적으로 2개의 3' 돌출부 또는, 대안적으로 2개의 5' 돌출부를 가질 수 있다. 최종 키메라 핵산 분자를 형성하기 위해 핵산 빌딩 블록이 조립된 전체 순서는 의도한 실험 디자인에 의해 결정되는 것이며, 무작위한 것이 아니다.
일 측면에서, 2개의 1본쇄 핵산(1본쇄 올리고뉴클레오티드라고도 함)을 화학적으로 합성하고, 이들이 어닐링되도록 접촉시켜 2본쇄 핵산 빌딩 블록을 형성함으로써 핵산 빌딩 블록을 형성한다.
2본쇄 핵산 빌딩 블록은 가변 크기의 것일 수 있다. 빌딩 블록의 크기는 작거나 클 수 있다. 예시적인 빌딩 블록의 크기는 1 염기쌍(임의의 돌출부를 포함하지 않음) 내지 100,000 염기쌍(임의의 돌출부를 포함하지 않음) 범위이다. 다른 예시적인 크기 범위, 즉 1 bp 내지 10,000 bp(이 사이의 모든 정수값 포함)의 하한값과 2 bp 내지 100,000 bp(이 사이의 모든 정수값 포함)의 상한값을 갖는 범위도 제공된다.
본 발명에서 이용가능한 2본쇄 핵산 빌딩 블록이 형성될 수 있는 여러 가지 방법이 존재하며; 이들 방법은 당업계에 공지되어 있으며, 당업자가 용이하게 실시할 수 있다.
한 관점에 따라, 이본쇄 핵산 빌딩 블록은 먼저 일본쇄 핵산을 생성하고, 생성된 일본쇄 핵산을 어닐링하여 이본쇄 핵산 빌딩 블록을 형성함으로써 생성한다. 이본쇄 핵산 빌딩 블록의 두 스트랜드는 돌출부(overhang)를 형성하는 임의의 뉴클레오티드 이외의 모든 뉴클레오티드에서 상보적일 수 있으며; 따라서, 임의의 돌출부(들) 이외에 부정합을 함유하지 않는다. 다른 관점에서, 이본쇄 핵산 빌딩 블록의 두 스트랜드는 돌출부를 형성하는 임의의 뉴클레오티드 이외의 모든 뉴클레오티드 보다 더 적은 뉴클레오티드가 상보적이다. 따라서, 이 관점에서, 이본쇄 핵산 빌딩 블록을 이용하여 코돈 축퇴성을 도입할 수 있다. 코돈 축퇴성은 본원에 개시된 부위-포화 돌연변이유발법을 이용하여 도입하는 것이 바람직한데, 이때 하나 이상의 N,N,G/T 카세트 또는 대안으로 하나 이상의 N,N,N 카세트를 이용한다.
본 발명의 생체내 재조합법은 특이적인 폴리뉴클레오티드 또는 서열의 미지 하이브리드 또는 대립유전자 풀에 대해 맹검 방식으로 수행할 수 있다. 그러나, 특이적인 폴리뉴클레오티드의 실질적인 DNA 또는 RNA 서열을 알 필요는 없다.
유전자의 혼합 군집내 재조합을 이용하는 방법은 임의의 유용한 단백질, 예를 들어 인터류킨 I, 항체, tPA 및 성장 호르몬의 생성을 위해 유용할 수 있다. 이 방법은 변경된 특이성 또는 활성을 보유하는 단백질을 생성하는 데 사용할 수 있다. 또한, 이 방법은 하이브리드 핵산 서열, 예를 들어 프로모터 영역, 인트론, 엑손, 인핸서 서열, 유전자의 31 미번역된 영역 또는 51 미번역된 영역의 생성을 위해 유용할 수 있다. 따라서, 이 방법은 증가된 발현 속도를 보유하는 유전자를 생성하는 데 사용할 수 있다. 또한, 이 방법은 반복 DNA 서열의 연구에 유용할 수 있다. 최종적으로, 이 방법은 리보자임 또는 압타머(aptamer)를 돌연변이시키는 데 유용할 수 있다.
한 관점에서, 본 발명은 매우 복잡한 선형 서열, 예를 들어 DNA, RNA 또는 단백질의 유도된 분자 진화를 가능하게 하는 환원성 재분류, 재조합 및 선택의 반복 사이클의 이용에 관한 것이다.
최적화된 유도 진화 시스템
본 발명은 새로운 특성 또는 변경된 특성을 보유하는 폴리펩티드, 예를 들어 본 발명의 자일라나제 또는 항체를 생성하는 "최적화된 유도 진화 시스템"이라 칭하는 비확률적 유전자 변경 시스템을 제공한다. 최적화된 유도 진화는 재조합을 통한 핵산의 유도된 분자 진화를 가능하게 하는 환원성 재분류, 재조합 및 선택의 반복 사이클의 이용에 관한 것이다. 최적화된 유도 진화는 진화된 키메라 서열의 대형 군집의 생성을 가능하게 하는데, 이때 생성된 군집은 미리설정된 수의 교차 현상을 보유하는 서열이 상당히 풍부하다.
교차 현상은 서열 내의 이동이 하나의 모(母) 변이체로부터 다른 모 변이체로 일어나는 키메라 서열내의 점(point)이다. 이러한 점은 보통 두개의 모 변이체로부터 유래한 올리고뉴클레오티드가 함께 연결되어 단일 서열을 형성하는 접합부이다. 이 방법은 올리고뉴클레오티드 서열의 올바른 농도의 계산을 가능하게 하여 서열의 최종 키메라 군집에 선택된 수의 교차 현상이 풍부하도록 한다. 이는 미리설정된 수의 교차 현상을 보유하는 키메라 변이체를 선택하는 것에 대한 조절을 제공한다.
또한, 이 방법은 다른 시스템과 비교하여 상당량의 가능한 단백질 변이체 공간을 탐색하는 편리한 수단을 제공한다. 이전에는, 예를 들어 한 반응중에 1013개의 키메라 분자가 생성되는 경우, 특정 활성에 대해 그렇게 많은 수의 키메라 변이체를 테스트하는 것은 매우 어려웠다. 더구나, 후대 군집의 상당 부분은 특정 활성의 증가된 수준을 보유하는 것으로 덜 생각되는 단백질을 생성하는 매우 큰 수의 교차 현상을 보유한다. 이들 방법을 이용함으로써, 키메라 분자의 군집은 특정 수의 교차 현상을 보유하는 이들 변이체가 풍부할 수 있다. 따라서, 반응중 1013개의 키메라 분자가 생성될 수 있지만, 추가 분석을 위해 선택된 각각의 분자는 예를 들어 단지 3개의 교차 현상을 보유하는 것으로 생각된다. 생성된 후대 군집은 미리설정된 수의 교차 현상을 보유하는 것으로 왜곡될 수 있기 때문에, 키메라 분자들간의 기능적인 다양성에 대한 경계는 감소된다. 이는 원래의 모 폴리뉴클레오티드로부터 유래한 어떤 올리고뉴클레오티드가 특정 성질에 영향을 줄 수 있는가를 알아보는 경우 더 관리가능한 수의 변수를 제공한다.
키메라 후대 폴리뉴클레오티드 서열을 생성하는 한 방법은 각각의 모 서열의 단편 또는 부분에 상응하는 올리고뉴클레오티드를 생성하는 것이다. 각각의 올리고뉴클레오티드는 독특한 중첩 영역을 포함하여 올리고뉴클레오티드의 혼합이 올바른 순서로 어셈블링된 각각의 올리고뉴클레오티드 단편을 보유하는 새로운 변이체를 생성하도록 하는 것이 바람직하다. 또한, 이에 대한 추가 정보는 예를 들어 USSN 09/332,835; 미국 특허 6,361,974에서 확인할 수 있다.
각각의 모 변이체에 대해 생성된 올리고뉴클레오티드의 수는 궁극적으로 생성된 키메라 분자내의 생성된 교차의 총 수와 일정 관계를 갖는다. 예를 들어, 3개의 모 뉴클레오티드 서열 변이체는 연결 반응을 수행하기 위해 제공하여 예를 들어 고온에서 더 큰 활성을 보유하는 키메라 변이체를 확인하는 것이 가능하다. 한 예로서, 각각의 모 변이체의 각 부분에 상응하는 50개의 올리고뉴클레오티드 서열로 이루어진 세트를 생성할 수 있다. 따라서, 연결 재어셈블리 과정중, 각각의 키메라 서열내 50개 이하의 교차 현상이 존재할 수 있다. 생성된 각각의 키메라 폴리뉴클레오티드가 교대로 각각의 모 변이체로부터 유래한 올리고뉴클레오티드를 함유할 가능성은 매우 낮다. 각각의 올리고뉴클레오티드 단편이 동일한 몰량으로 연결 반응에 존재하는 경우, 몇몇 위치에서 동일한 모 폴리뉴클레오티드로부터 유래한 올리고뉴클레오티드는 서로 인접하여 연결될 것이고, 따라서 교차 현상은 일어나지 않는다. 각각의 모 폴리뉴클레오티드로부터 유래한 각각의 올리고뉴클레오티드의 농도가 본 실시예의 임의의 연결 반응중 일정하게 유지되는 경우, 동일한 모 변이체로부터 유래한 올리고뉴클레오티드가 키메라 서열 내에서 연결되어 교차되지 않을 1/3의 가능성(3개의 모 폴리뉴클레오티드를 추정함)이 존재한다.
따라서, 확률밀도함수(PDF)를 결정하여 주어진 세트 수의 모 변이체, 각각의 변이체에 상응하는 다수의 올리고뉴클레오티드 및 연결 반응에서 각각의 단계중 각 변이체의 농도에서 연결 반응중 각각의 단계에서 일어나는 것으로 생각되는 교차 현상의 집단을 예상할 수 있다. 이하, PDF 결정 이면의 통계학 및 수학을 기술한다. 이들 방법을 이용함으로써, 이러한 확률 밀도 함수를 계산할 수 있고, 따라서 특정 연결 반응에 기인하는 미리설정된 수의 교차 현상에 대해 키메라 후대 군집을 풍부하게 할 수 있다. 더구나, 교차 현상의 표적 수는 미리 설정할 수 있으며, 이어서 상기 시스템은 미리설정된 수의 교차 현상에 대해 중앙에 위치하는 확률 밀도 함수를 생성하는, 연결 반응에서 각각의 단계중 각각의 모 올리고뉴클레오티드의 출발 양을 계산한다. 이들 방법은 재조합을 통해 폴리펩티드를 암호화하는 핵산의 유도된 분자 진화를 가능하게 하는 환원성 재분류, 재조합 및 선택의 반복 사이클의 이용에 관한 것이다. 이 시스템은 진화된 키메라 서열의 대형 군집의 생성을 가능하게 하는데, 이때 생성된 군집은 미리설정된 수의 교차 현상을 보유하는 서열이 현저히 풍부하다. 교차 현상은 서열 내의 이동이 하나의 모(母) 변이체로부터 다른 모 변이체로 일어나는 키메라 서열내의 점이다. 이러한 점은 보통 두개의 모 변이체로부터 유래한 올리고뉴클레오티드가 함께 연결되어 단일 서열을 형성하는 접합부이다. 이 방법은 올리고뉴클레오티드 서열의 올바른 농도의 계산을 가능하게 하여 서열의 최종 키메라 군집이 선택된 수의 교차 현상이 풍부하도록 한다. 이는 미리설정된 수의 교차 현상을 보유하는 키메라 변이체를 선택하는 것에 대한 조절을제공한다.
또한, 이들 방법은 다른 시스템과 비교하여 상당량의 가능한 단백질 변이체 공간을 탐색하는 편리한 수단을 제공한다. 이들 방법을 이용함으로써, 키메라 분자의 군집은 특정 수의 교차 현상을 보유하는 이들 변이체가 풍부할 수 있다. 따라서, 반응중 1013개의 키메라 분자가 생성될 수 있지만, 추가 분석을 위해 선택된 각각의 분자는 예를 들어 단지 3개의 교차 현상을 보유하는 것으로 생각된다. 생성된 후대 군집은 미리설정된 수의 교차 현상을 보유하는 것으로 왜곡될 수 있기 때문에, 키메라 분자들간의 기능적인 다양성에 대한 경계는 감소된다. 이는 원래의 모 폴리뉴클레오티드로부터 유래한 어떤 올리고뉴클레오티드가 특정 성질에 영향을 줄 수 있는가를 알아보는 경우 더 관리가능한 수의 변수를 제공한다.
한 관점에서, 상기 방법은 각각의 모 서열의 단편 또는 부분에 상응하는 올리고뉴클레오티드를 생성함으로써 키메라 후대 폴리뉴클레오티드 서열을 생성한다. 각각의 올리고뉴클레오티드는 독특한 중첩 영역을 포함하여 올리고뉴클레오티드의 혼합이 올바른 순서로 어셈블링된 각각의 올리고뉴클레오티드 단편을 보유하는 새로운 변이체를 생성하도록 하는 것이 바람직하다. USSN 09/332,835를 참조할 수 있다.
교차 현상의 결정
본 발명의 관점들은 입력값으로서 소정 교차 확률 밀도 함수(PDF), 재어셈블링되는 모 유전자의 수 및 재어셈블리에서 단편의 수를 수용하는 시스템 및 소프트웨어를 포함한다. 이 프로그램의 출력값은 재어셈블링된 유전자 및 이들 유전자의 추산된 교차 PDF를 생성하기 위한 방법을 결정하는데 사용할 수 있는 "단편 PDF"이다. 본원에 기술한 프로세싱은 MATLAB(상표명)(The Mathworks, Natick, Massachusetts) 프로그래밍 언어 및 기술적 계산을 위해 개발된 환경에서 수행하는 것이 바람직하다.
반복 과정
본 발명을 실시하기 위해, 이들 과정은 되풀이하여 반복할 수 있다. 예를 들어, 변경된 또는 새로운 자일라나제 표현형의 원인인 핵산(또는 상기 핵산)은 동정하고, 재분리하고, 다시 변경하고, 활성에 대해 재테스트한다. 이 과정은 소정 표현형이 조작될 때까지 되풀이하여 반복할 수 있다. 예를 들어, 전체적인 생화학적 동화 경로 또는 이화 경로를 세포 내로 도입하도록 조작하여 예를 들어 자일라나제 활성을 부여할 수 있다.
유사하게, 특정 올리고뉴클레오티드가 소정 특성(예를 들어, 새로운 자일라나제 표현형)에 대해 전혀 영향을 미치지 못하는 것으로 결정된 경우, 제거한 서열을 포함하는 더 큰 모 올리고뉴클레오티드를 합성하므로써 변수로서 제거할 수 있다. 더 큰 서열 내로 서열을 혼입하는 것은 임의의 교차 현상을 예방하기 때문에, 후대 폴리뉴클레오티드내 이 서열의 변이는 더 이상 존재하지 않을 것이다. 어떤 올리고뉴클레오티드가 소정 특성에 가장 관련되어 있고, 어떤 올리고뉴클레오티드가 관련되어 있지 않은가를 결정하기 위한 상기 반복 실시는 특정 특성 또는 활성을 제공할 수 있는 가능한 단백질 변이체 모두의 더 효과적인 탐색을 가능하게 한다.
생체내 셔플링
분자의 생체내 셔플링은 본 발명의 폴리펩티드의 변이체, 예를 들어 항체, 자일라나제 등을 제공하는 본 발명의 방법에서의 용도이다. 생체내 셔플링은 재조합 다량체에 대한 세포의 자연적인 특성을 이용하여 수행할 수 있다. 생체내 재조합이 분자 다양성에 대한 중요한 자연적인 경로를 제공하지만, 유전자 재조합은 (1) 상동성의 인식; (2) 스트랜드 절단, 스트랜드 침입 및 재조합 키아즈마의 생성을 유도하는 대사 단계; 및 (3) 최종적으로, 키아즈마의 불연속 재조합 분자로의 분해를 포함하는 상대적으로 복잡한 과정이다. 키아즈마의 형성은 상동 서열의 인식을 필요로한다.
다른 관점에서, 본 발명은 적어도 제1 뉴클레오티드 및 제2 뉴클레오티드로부터 하이브리드 폴리뉴클레오티드를 생성하는 방법에 관한 것이다. 본 발명은 적합한 숙주 세포 내로 적어도 제1 폴리뉴클레오티드 및 부분적인 서열 상동성(예를 들어, 서열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157, 159, 161, 163, 165, 167, 169, 171, 173, 175, 177, 179, 181, 183, 185, 187, 189, 191, 193, 195, 197, 199, 201, 203, 205, 207, 209, 211, 213, 215, 217, 219, 221, 223, 225,227, 229, 231, 233, 235, 237, 239, 241, 243, 245, 247, 249, 251, 253, 255, 257 및 이의 조합)의 적어도 한 영역을 공유하는 제2 폴리뉴클레오티드를 도입함으로써 하이브리드 폴리뉴클레오티드를 생성하는 데 사용할 수 있다. 부분 서열 상동성 영역은 하이브리드 폴리뉴클레오티드를 생성하는 서열 인식을 초래하는 과정을 촉진시킨다. 본원에 사용한 용어 "하이브리드 폴리뉴클레오티드"는 본 발명의 방법에 기인한 임의의 뉴클레오티드 서열이며, 적어도 두개의 원래 폴리뉴클레오티드 서열을 함유한다. 이러한 하이브리드 폴리뉴클레오티드는 DNA 분자 사이의 서열 통합을 촉진하는 분자간 재조합 현상에 기인할 수 있다. 또한, 이러한 하이브리드 폴리뉴클레오티드는 DNA 분자내 뉴클레오티드 서열을 변경시키는 반복 서열을 이용하는 분자내 환원성 재분류 과정에 기인할 수 있다.
생체내 재분류는 총괄적으로 박테리아에서 "RecA-의존성" 현상으로서 고찰되는 "재조합"이라 칭하는 "분자간" 과정에 집중된다. 본 발명은 서열을 재조합 또는 재분류하는 숙주 세포의 재조합 과정 또는 결실에 의해 세포 내에서 준-반복 서열의 복잡성을 감소시키기 위한 환원성 과정을 매개할 수 있는 세포의 능력에 의존할 수 있다. 상기한 "환원성 재분류" 과정은 "분자내" RecA-의존성 과정에 의해 일어난다.
따라서, 본 발명의 다른 관점에서, 신규 폴리뉴클레오티드는 환원성 재분류 과정에 의해 생성될 수 있다. 상기 방법은 연속 서열(원래의 암호화 서열)을 함유하는 작제물의 생성, 적합한 벡터 내로 상기 작제물의 도입 및 적합한 숙주 세포 내로의 후속 도입을 포함한다. 개별적인 분자 실체의 재분류는 상동성 영역을 보유하는 작제물내 연속 서열 사이 또는 준-반복 단위 사이의 조합 과정에 의해 일어난다. 재분류 과정은 반복 서열의 복잡성과 정도를 재조합 및/또는 감소시키며 신규 분자 종의 생성을 초래한다. 여러가지 처리를 적용하여 재분류 비율을 높일 수 있다. 이들은 자외선, 또는 DNA 손상 화학물질 및/또는 "유전자 불안정성"의 증가된 수준을 나타내는 숙주 세포주를 이용하는 처리를 포함할 수 있다. 따라서, 재분류 과정은 자신의 진화를 유도하기 위한 준-반복 서열의 자연적인 특성 또는 상동성 재조합을 포함할 수 있다.
반복 서열 또는 "준-반복" 서열은 유전자 불안정성에서 일정 역할을 수행한다. 본 발명에서, "준-반복"은 그들의 원래 단위 구조에 제한되지 않는 반복부이다. 준-반복 단위는 작제물내 서열의 어레이, 즉 유사 서열의 연속 단위로서 존재할 수 있다. 일단 연결되면, 연속 서열 사이의 접합부는 본질적으로 보이지 않게 되고, 생성된 작제물의 준-반복 특성은 현재 분자 수준에서 연속성이다. 생성된 작제물의 복잡성을 감소시키기 위해 세포가 수행하는 결실 과정은 준-반복 서열 사이에서 진행된다. 준-반복 유닛은 미끄러짐 현상(slippage event)이 일어날 수 있는 주형의 실질적으로 무제한 레파토리를 제공한다. 따라서, 준-반복부를 함유하는 작제물은 결실(및 가능하게는 삽입) 현상이 실질적으로 준-반복 단위내 어디에서나 발생할 수 있는 충분한 분자 탄성을 효과적으로 제공한다.
준-반복 서열이 모두 동일한 배향, 예를 들어 머리-꼬리 또는 그 역으로 연결되는 경우, 세포는 개개의 단위를 구별할 수 없다. 결과적으로, 환원성 과정은 서열 전체에서 일어날 수 있다. 대조적으로, 예를 들어 상기 단위가 머리-꼬리 보다는 머리-머리로 존재하는 경우, 역전은 결실부 형성이 불연속 유닛의 상실을 옹호하도록 인접 단위의 종말점을 나타낸다. 따라서, 본 발명의 경우, 서열이 동일한 배향으로 존재하는 것이 바람직하다. 준반복 서열의 무작위 배향은 재분류 효율의 상실을 초래하는 반면, 서열의 일관된 배향은 높은 효율을 제공할 것이다. 그러나, 동일한 배향에서 더 적은 연속 서열을 보유하는 경우 상기 효율을 감소시키지만, 이는 신규 분자의 효과적인 회수를 위한 충분한 탄성을 여전히 제공할 수 있다. 작제물은 더 높은 효율을 가능하게 하는 동일한 배향으로 준-반복 서열을 이용하여 제조할 수 있다.
서열은 하기 방법을 포함하는 여러가지 방법중 임의의 방법을 이용하여 머리-꼬리 배향으로 어셈블링할 수 있다:
(a) 일본쇄로 제조되는 경우 배향을 제공하는 폴리-A 머리 및 폴리-T 꼬리를 포함하는 프라이머를 사용할 수 있다. 이는 RNA로 제조된 프라이머의 최초 몇몇 염기를 보유함으로써 달성되며, 따라서 RNAseH로 용이하게 제거된다.
(b) 독특한 제한 절단 부위를 포함하는 프라이머를 사용할 수 있다. 다중 부위, 독특한 서열 배터리 및 반복 합성 단계와 연결 단계가 필요하다.
(c) 상기 프라이머의 몇몇 내부 염기는 티올화될 수 있으며, 엑소뉴클레아제는 적절하게 꼬리잘린 분자를 생성하기 위해 사용한다.
재분류된 서열의 회수는 감소된 반복 지수(RI)를 갖는 클로닝 벡터의 동정에 의존한다. 이어서, 상기 재분류된 암호화 서열은 증폭에 의해 회수할 수 있다. 생성물은 재클로닝하고 발현시킨다. 감소된 RI를 보유하는 클로닝 벡터의 회수는 하기 사항에 의해 영향받을 수 있다:
(1) 벡터의 이용은 단지 작제물의 복잡성이 감소되는 경우에 안정하게 유지된다.
(2) 물리적인 과정에 의해 짧아진 벡터의 물리적인 회수. 이 경우, 클로닝 벡터는 표준 플라스미드 분리 절차 및 아가로즈 겔, 또는 표준 절차를 이용하는 저분자량 컷오프 컬럼 상에서의 크기 분별에 의해 회수한다.
(3) 삽입물 크기가 감소하는 경우 선택할 수 있는 삽입된 유전자를 함유하는 벡터의 회수.
(4) 발현 벡터 및 적합한 선택을 이용하는 직접 선택 기법의 이용.
관련된 유기체로부터 유래한 암호화 서열(예를 들어, 유전자)은 높은 정도의 상동성을 나타낼 수 있으며, 상당히 다양한 단백질 생성물을 암호화할 수 있다. 이들 서열 타입은 준-반복부로서 본 발명에서 특히 유용하다. 그러나, 후술하는 실시예들은 거의 동일한 원래의 암호화 서열(준-반복부)의 재분류를 나타내지만, 이 방법은 그러한 거의 동일한 반복부에 제한되는 것은 아니다.
하기 실시예는 본 발명을 예시한다. 세개(3)의 독특한 종으로부터 유래한 암호화 핵산 서열(준-반복부)을 기술한다. 각각의 서열은 구별되는 세트의 특성을 가진 단백질을 암호화한다. 각각의 서열은 서열내의 독특한 위치에서 단일 염기쌍 또는 몇몇 염기쌍에 차이가 있다. 준-반복 서열은 개별적으로 또는 총괄적으로 증폭되고, 무작위 어셈블리 내로 연결되어 모든 가능한 순열 및 조합이 연결된 분자 집단에서 가능하도록 한다. 준-반복 단위의 수는 어셈블리 조건에 의해 제어할 수 있다. 작제물내 준-반복 단위의 평균 수는 반복 지수(RI)로서 정의한다.
일단 형성되면, 작제물은 공지된 프로토콜에 따라 아가로즈 겔 상에서 크기 분별, 클로닝 벡터내로의 삽입 및 적합한 숙주 세포로의 형질감염을 수행할 수도 있고, 수행하지 않을 수도 있다. 이어서, 세포는 번식시키고, "환원성 재분류"를 수행한다. 환원성 재분류 과정의 속도는 필요에 따라 DNA 손상의 도입에 의해 촉진시킬 수 있다. RI의 감소가 반복 서열 사이에서 "분자내" 메카니즘에 의한 결실부 형성에 의해 매개되는지 또는 "분자간" 메카니즘을 통한 재조합 유사 현상에 의해 매개되는지 여부는 중요하지 않다. 최종 결과는 모든 가능한 조합으로의 분자의 재분류이다.
필요에 따라, 상기 방법은 셔플링된 풀의 라이브러리 구성원을 스크리닝하여 미리설정된 거대분자, 예를 들어 단백질성 수용체, 올리고사카라이드, 비리온 또는 다른 미리설정된 화합물 또는 구조와의 결합 또는 상호작용 또는 특정 반응(예를 들어, 환자의 촉매 도메인)을 가능하게 할 수 있는 능력을 보유하는 개개의 셔플링된 라이브러리 구성원을 동정하는 추가 단계를 포함한다.
이러한 라이브러리로부터 동정된 폴리펩티드는 치료 목적, 진단 목적, 연구 목적 및 관련 목적(예를 들어, 촉매, 수용액의 삽투압을 증가시키기 위한 용질 등)을 위해 사용할 수 있고/있거나, 셔플링 및/또는 선택의 하나 이상의 추가 사이클에 이용할 수 있다.
다른 관점에서, 재조합 또는 재분류 이전 또는 과정 중에, 본 발명의 방법에 의해 생성된 폴리뉴클레오티드는 원래의 폴리뉴클레오티드내로의 돌연변이의 도입을 촉진하는 제제 또는 과정에 이용할 수 있다. 이러한 돌연변이의 도입은 생성된 하이브리드 폴리뉴클레오티드 및 그로부터 암호화된 폴리펩티드의 다양성을 증가시킨다. 돌연변이유발을 촉진하는 제제 또는 과정의 예로는 (+)-CC-1065, 또는 합성 유사체, 예를 들어 (+)-CC-1065-(N3-아데닌(참조: Sun and Hurley, (1992)); DNA 합성을 억제할 수 있는 N-아세틸화 또는 탈아세틸화 4'-플루오로-4-아미노비페닐 부가반응생성물(참조: 예를 들어, van de Poll et al. (1992)); 또는 DNA 합성을 억제할 수 있는 N-아세틸화 또는 탈아세틸화 4-아미노비페닐 부가반응생성물(참조: van de Poll et al. (1992), pp. 751-758); DNA 복제를 억제할 수 있는 3가 크롬, 3가 크롬염, 다환 방향족 탄화수소(PAH) DNA 부가반응생성물, 예를 들어 7-브로모메틸벤즈[a]안트라센("BMA"), 트리스(2,3-디브로모프로필)포스페이트("Tris-BP"), 1,2-디브로모-3-클로로프로판("DBCP"), 2-브로모아크롤레인(2BA), 벤조[a]피렌-7,8-디히드로디올-9-10-에폭사이드("BPDE"), 백금(II) 할로겐 염, N-히드록시-2-아미노-3-메틸아미다조[4,5-t-퀴놀린("N-히드록시-IQ") 및 N-히드록시-2-아미노-1-메틸-6-페닐이미다조[4,5-fl-피리딘("N-히드록시-PhIP")를 들 수 있으나, 이로 제한되는 것은 아니다. PCR 증폭을 둔화시키거나 정지시키는 수단의 예로는 자외선 (+)-CC-1065 및 (+)-CC-1065-(N3-아데닌)을 들 수 있다. 특히 포함되는 수단은 DNA 부가반응생성물 또는 폴리뉴클레오티드 또는 폴리뉴클레오티드 풀로부터 DNA 부가반응생성물을 포함하는 폴리뉴클레오티드인데, 이는 추가 처리 이전에 폴리뉴클레오티드를 포함하는 용액을 가열하는 단계를 포함하는 방법에 의해 방출 또는 제거될 수 있다
다른 관점에서, 본 발명은 하이브리드 또는 재분류된 폴리뉴클레오티드의 생성을 제공하는 본 발명의 조건 하에서 야생형 단백질을 암호화하는 이본쇄 주형 폴리뉴클레오티드를 포함하는 샘플을 처리함으로써 생물학적 활성을 보유하는 재조합 단백질을 제조하는 방법에 관한 것이다.
서열 변이체의 제조
또한, 본 발명은 본 발명의 핵산(예를 들어, 자일라나제) 서열의 서열 변이체를 제조하는 추가 방법을 제공한다. 또한, 본 발명은 본 발명의 핵산 및 폴리펩티드를 이용하여 자일라나제를 분리하기 위한 추가의 방법을 제공한다. 한 관점에서, 본 발명은 본 발명의 자일라나제 암호 서열(예를 들어, 유전자, cDNA 또는 메세지)의 변이체를 제공하는데, 이는 상기한 바와 같은 무작위적 또는 확률적 방법, 또는 비확률적 또는 "직접 진화" 방법을 포함하는 임의의 수단에 의해 변경될 수 있다.
분리된 변이체는 자연발생할 수 있다. 또한, 변이체는 시험관 내에서 생성할 수도 있다. 변이체는 유전 공학 기법, 예를 들어 부위 지정 돌연변이유발법, 무작위 화학적 돌연변이유발법, 엑소뉴클레아제 III 결실 과정, 및 표준 클로닝 기법을 이용하여 생성할 수 있다. 대안으로, 이러한 변이체, 단편, 유사체 또는 유도체는 화학 합성 또는 변경 절차를 이용하여 생성할 수 있다. 또한, 변이체를 제조하는 다른 방법은 당업자에게 매우 친숙한 방법들이다. 이들은 천연 분리체로부터 얻은 핵산 서열을 변경하여 산업적으로 또는 실험실에서 사용하기에 적합한 가치를 증대시킨 특성을 보유하는 폴리펩티드를 암호화하는 핵산을 생성하는 방법을 포함한다.이러한 과정에서, 천연 분리체로부터 얻은 서열에 대해 하나 이상의 뉴클레오티드 차이를 보유하는 다수의 변이체 서열이 생성되고 그 특징을 규명한다. 이들 뉴클레오티드 차이는 천연 분리체에서 유래한 핵산에 의해 암호화된 폴리펩티드에 대해 아미노산 변화를 초래할 수 있다.
예를 들어, 변이체는 에러 프론 PCR을 이용하여 생성할 수 있다. 에러 프론 PCR에서, PCR은 DNA 폴리머라제의 복제 신뢰도가 낮은 조건하에서 수행하여 높은 비율의 점 돌연변이가 PCR 생성물의 전체 길이를 따라 얻어지도록 한다. 에러 프론 PCR은 예를 들어 문헌(참조: Leung, D. W., et al., Technique, 1: 11-15, 1989 및 Caldwell, R. C. & Joyce G. F. , PCR Methods Applic. , 2: 28-33, 1992)에 기재되어 있다. 개략적으로 이러한 절차에서, 돌연변이유발시키려는 핵산은 전체 길이의 PCR 생성물을 따라 높은 비율의 점 돌연변이를 획득하기 위해 PCR 프라이머, 반응 버퍼, MgCl2, MnCl2, Taq 폴리머라제 및 적합한 농도의 dNTPs와 혼합한다. 예를 들어, 상기 반응은 돌연변이유발시키려는 핵산 20 fmole, 각각의 PCR 프라이머 30 pmol, 반응 버퍼(50 mM KC1, lO mM Tris HCl(pH 8.3) 및 0.01% 겔라틴을 함유함), 7 mM MgCl2, 0.5 mM MnCl2, Taq 폴리머라제 5 유닛, 0.2 mM dGTP, 0.2 mM dATP, 1 mM dCTP 및 1 mM dTTP를 이용하여 수행한다. PCR은 94℃에서 1분, 45℃에서 1분 및 72℃에서 1분의 30 사이클로 수행한다. 그러나, 이들 매개변수는 적절히 변경시킬 수 있는 것으로 이해될 것이다. 돌연변이유발된 핵산은 적합한 벡터 내로 클로닝하고, 돌연변이유발된 핵산에 의해 암호화된 폴리펩티드의 활성을 평가한다.
또한, 변이체는 임의의 클로닝된 소정의 DNA에서 부위-특이성 돌연변이를 생성하는 올리고뉴클레오티드 지정된 돌연변이유발법을 이용하여 생성할 수 있다. 올리고뉴클레오티드 돌연변이유발법은 문헌(참조: 예를 들어, Reidhaar-Olson (1988) Science 241: 53-57)에 기재되어 있다. 개략적으로, 이러한 절차에서, 클로닝된 DNA내로 도입하려는 하나 이상의 돌연변이를 보유하는 다수의 이본쇄 올리고뉴클레오티드를 합성하고, 돌연변이유발시키려는 클로닝된 DNA 내로 삽입한다. 돌연변이유발된 DNA를 함유하는 클론은 회수하고, 이들이 암호화한 폴리펩티드의 활성을 평가한다.
변이체를 생성하는 다른 방법은 어셈블리 PCR이다. 어셈블리 PCR은 작은 DNA 단편의 혼합물로부터 PCR 생성물의 어셈블리를 포함한다. 다수의 상이한 PCR 반응이 동일한 바이알 내에서 병렬적으로 일어나는데, 한 반응의 생성물은 다른 반응의 생성물을 프라이밍한다. 어셈블리 PCR은 예를 들어 미국 특허 5,965,408에 기술되어 있다.
변이체를 생성하는 또 다른 방법은 성별 PCR 돌연변이유발법이다. 성별 PCR 돌연변이유발법에서, 시험관 내에서 상이하나 매우 관련된 DNA 서열의 DNA 분자들 사이에 집중 상동 재조합이 일어나며, 그 결과 서열 상동성에 기초한 DNA 분자의 무작위 단편화가 일어나며, 이어서 PCR 반응에서 프라이머 연장에 의해 교차의 고정이 일어난다. 성별 PCR 돌연변이유발법은 예를 들어 문헌(참조: Stemmer (1994) Proc. Natl. Acad. Sci. USA 91: 10747-10751)에 기재되어 있다. 개략적으로, 이러한 절차에서, 재조합하려는 다수의 핵산은 DNase로 분해하여 평균 크기가 50∼200개의 뉴클레오티드를 보유하는 단편을 생성한다. 소정 평균 크기의 단편은 정제하고 PCR 생성물 중에 재현탁시킨다. PCR은 핵산 단편들의 재조합을 용이하게 하는 조건 하에서 수행한다. 예를 들어, PCR은 0.2 mM 각 dNTP, 2.2 mM MgCl2, 50 mM KCl, lO mM Tris HCl, pH 9.0 및 0.1% 트리톤 X-100의 용액중 10∼30 ng/㎕ 농도로 정제된 단편을 재현탁시킴으로써 수행할 수 있다. 반응 혼합물 100 ㎕당 Taq 폴리머라제 2.5 유닛을 첨가하고, PCR은 다음과 같은 방법으로 수행한다: 94℃에서 60초, 94℃에서 30초, 50∼55℃에서 30초, 72℃에서 30초(30∼45회) 및 72℃에서 5분. 그러나, 이들 매개변수는 적절히 변경할 수 있는 것으로 이해될 것이다. 몇몇 관점에서, 올리고뉴클레오티드는 PCR 반응물에 포함될 수 있다. 다른 관점에서, DNA 폴리머라제 I의 클리나우 단편은 첫번째 세트의 PCR 반응에서 사용할 수 있고, Taq 폴리머라제는 후속 세트의 PCR 반응에서 사용할 수 있다. 재조합 서열은 분리하고, 이들이 암호화하는 폴리펩티드의 활성을 평가한다.
또한, 변이체는 생체내 돌연변이유발법에 의해 생성할 수 있다. 몇몇 관점에서, 소정 서열 내의 무작위 돌연변이는 박테리아 균주, 예를 들어 하나 이상의 DNA 수복 경로내에 돌연변이를 보유하는 이. 콜라이 균주 내에서 소정 서열을 전파시킴으로써 생성된다. 이러한 "돌연변이자(mutator)" 균주는 야생형 모 균주의 랜덤 돌연변이 비율 보다 더 큰 무작위 돌연변이 비율을 보유한다. 이들 균주중 하나 내에서 DNA의 전파는 상기 DNA 내에 무작위 돌연변이를 실질적으로 생성할 것이다. 생체내 돌연변이유발법에 사용하기에 적합한 돌연변이자 균주는 "Methods forPhenotype Creation from Multiple Gene Populations" 라는 명칭의 1991년 10월 31일 공개된 WO 91/16427호에 기재되어 있다.
또한, 변이체는 카세트 돌연변이유발법으로 생성할 수 있다. 카세트 돌연변이유발법에서, 이본쇄 DNA 분자의 작은 영역은 천연 서열과는 상이한 합성 올리고뉴클레오티드 "카세트"로 대체된다. 종종, 올리고뉴클레오티드는 완전히 및/또는 부분적으로 무작위화된 천연 서열을 함유한다.
또한, 반복 앙상블 돌연변이유발법을 사용하여 변이체를 생성할 수도 있다. 반복 앙상블 돌연변이유발법은 구성원들의 아미노산 서열이 상이한 표현형적으로 관련된 돌연변이체들의 다양한 군집을 생성하기 위해 개발된 단백질 조작(단백질 돌연변이유발)을 위한 알고리즘이다. 이 방법은 연속 라운드의 조합 카세트 돌연변이유발을 제어하기 위해 피드백 메카니즘을 이용한다. 반복 앙상블 돌연변이유발법은 문헌(참조: Arkin, A. P. and Youvan, D. C. , PNAS, USA, 89: 7811-7815, 1992)에 기재되어 있다.
몇몇 관점에서, 변이체는 지수 앙상블 돌연변이유발법을 이용하여 생성한다. 지수 앙상블 돌연변이유발법은 고비율의 독특하고 기능적인 돌연변이체를 갖는 조합 라이브러리를 생성하는 과정인데, 이때 잔기의 작은 기는 병렬적으로 무작위화되어 각각의 변경된 위치에서 기능적인 단백질을 유도하는 아미노산을 확인한다. 지수 앙상블 돌연변이유발법은 문헌(참조: Delegrave, S. and Youvan, D. C. , Biotechnology Research, 11 : 1548-1552,1993)에 기재되어 있다. 무작위 돌연변이유발법 및 부위-지정 돌연변이유발법은 문헌(참조: Arnold, F. H. , CurrentOpinion in Biotechnology, 4: 450-455, 1993)에 기재되어 있다.
몇몇 관점에서, 변이체는 셔플링 절차를 이용하여 생성하는데, 이때 뚜렷한 폴리펩티드를 암호화하는 다수의 핵산의 일부가 함께 융합되어 문헌(참조: "Method of DNA Reassembly by Interrupting Synthesis"라는 명칭의 1996년 7월 9일 출원된 미국 특허 5,965,408 및 "Production of Enzymes Having Desired Activities by Mutagenesis"라는 명칭의 1996년 5월 22일 출원된 미국 특허 5,939,250)에 기재된 키메라 폴리펩티드를 암호화하는 키메라 핵산 서열을 생성한다.
B 그룹 아미노산 서열로 이루어진 폴리펩티드의 변이체는 B 그룹 아미노산 서열로 이루어진 폴리펩티드의 아미노산 잔기중 하나 이상이 보존 및 비보존 아미노산 잔기(바람직하게는 보존된 아미노산 잔기)로 치환되고, 치환된 아미노산 잔기가 유전 코드에 의해 암호화되는 것이거나 암호화되지 않는 변이체일 수 있다.
보존성 치환은 폴리펩티드내 소정 아미노산을 유사 특성의 다른 아미노산으로 치환하는 것을 의미한다. 전형적으로, 보존성 치환의 예로는 하기 치환을 들 수 있다: 지방족 아미노산, 예를 들어 알라닌, 발린, 루신 및 이소루신의 다른 지방족 아미노산으로의 치환; 세린의 트레오닌으로의 치환 또는 이의 역; 산성 잔기, 예를 들어 아스파르트산 및 글루탐산의 다른 산성 잔기로의 치환; 아미드 잔기를 보유하는 잔기, 예를 들어 아스파라긴 및 글루타민의 아미드기를 보유하는 다른 잔기로의 치환; 염기성 잔기, 예를 들어 라이신과 아르기닌의 다른 염기성 잔기로의 치환; 및 방향족 잔기, 예를 들어 페닐알라닌, 티로신의 다른 방향족 잔기로의 치환을 들 수 있다.
다른 변이체는 B 그룹 아미노산 서열로 이루어진 폴리펩티드의 아미노산 잔기중 하나 이상이 치환기를 포함하는 것이다.
또 다른 변이체는 폴리펩티드가 다른 화합물, 예를 들어 상기 폴리펩티드의 반감기를 증가시키는 화합물(예를 들어, 폴리에티렌 글리콜)과 결합된 것이다.
다른 변이체는 추가의 아미노산 서열, 예를 들어 리더 서열, 분비 서열, 프로단백질 서열 또는 폴리펩티드의 정제, 농축 또는 안정화를 용이하게 하기 위한 서열이 융합된 것을 말한다.
몇몇 관점에서, 단편, 유도체 및 유사체는 B 그룹 아미노산 서열로 이루어진 폴리펩티드 및 이 폴리펩티드에 실질적으로 동일한 서열과 동일한 생물학적 기능 또는 활성을 보유한다. 다른 관점에서, 단편, 유도체 또는 유사체는 프로단백질을 포함하여, 상기 단편, 유도체 또는 유사체는 활성 폴리펩티드를 생성하기 위해 프로단백질 부분의 절단에 의해 활성화될 수 있다.
숙주 세포 내에서 높은 수준의 단백질 발현을 달성하기 위한 코돈 최적화
본 발명은 코돈 용법을 변경하기 위해 자일라나제-암호화 핵산을 변형시키는 방법을 제공한다. 한 관점에서, 본 발명은 숙주 세포 내에서 자일라나제 발현을 증가 또는 감소시키기 위해 자일라나제를 암호화하는 핵산내 코돈을 변경하는 방법을 제공한다. 또한, 본 발명은 숙주 세포 내에서 자일라나제의 발현을 증가시키기 위해 변경된 자일라나제를 암호화하는 핵산, 그렇게 변경된 자일라나제 및 변경된 자일라나제를 제조하는 방법을 제공한다. 상기 방법은 자일라나제-암호화 핵산내 "바람직하지 않은" 또는 "덜 바람직한" 코돈을 확인하는 단계; 이들 바람직하지 않은또는 덜 바람직한 코돈중 하나 이상을 대체된 코돈과 동일한 아미노산을 암호화하는 "바람직한 코돈"으로 대체하는 단계를 포함하며, 상기 핵산중 하나 이상의 바람직하지 않은 코돈 또는 덜 바람직한 코돈은 동일한 아미노산을 암호화하는 바람직한 코돈에 의해 대체된다. 바람직한 코돈은 숙주 세포내의 유전자내 암호 서열내에서 과도하게 나타나는 코돈이며, 바람직하지 않거나 덜 바람직한 코돈은 숙주 세포 내에서 유전자내 암호 서열에서 과소하게 나타나는 코돈이다.
본 발명의 핵산을 발현하는 숙주 세포, 발현 카세트 및 벡터는 박테리아, 효모, 균류, 식물 세포, 곤충 세포 및 포유류 세포이다. 따라서, 본 발명은 이들 모든 세포에서 코돈 용법을 최적화하는 방법, 코돈 변경된 핵산 및 상기 코돈 변경된 핵산에 의해 암호화된 폴리펩티드를 제공한다. 숙주 세포의 예로는 그람 음성 박테리아, 예를 들어 에스케리치아 콜라이(Escherichia coli) 및 슈도모나스 플루오레센스(Pseudomonas fluorescens); 그람 양성 박테리아, 예를 들어 스트렙토마이세스 다이버사(Streptomyces diversa), 락토바실러스 가세리(Lactobacillus gasseri), 락토바실러스 락티스(Lactococcus lactis), 락토바실러스 크레모리스(Lactococcus cremoris), 바실러스 섭틸러스(Bacillus subtilis)를 들 수 있다. 또한, 숙주 세포로는 진핵 유기체도 사용할 수 있는데, 이의 예로는 여러가지 효모, 예를 들어 사카로마이세스 세레비재(Saccharomyces cerevisiae), 스키조사크로마이세스 폼브(Schizosaccharomyces pombe), 피치아 파스토리스(Pichia pastoris) 및 클루이베로마이세스 락티스(Kluyveromyces lactis), 한세눌라 폴리모르파(Hansenula polymorpha), 아스퍼길러스 나이저(Aspergillus niger)를 포함하는 사카로마이세스종(Saccharomyces sp.) 및 포유동물 세포 및 세포주 및 곤충 세포 및 세포주를 들 수 있다. 따라서, 본 발명은 이들 유기체 및 종에서 발현을 위해 최적화된 핵산 및 폴리펩티드를 포함한다.
예를 들어, 박테리아 세포로부터 분리된 자일라나제를 암호화하는 핵산의 코돈은 상기 핵산이 상기 자일라나제가 유도된 박테리아와는 다른 박테리아 세포, 효모, 진균, 식물 세포, 곤충 세포 또는 포유류 세포에서 최적 발현되도록 변경할 수 있다. 코돈 최적화 방법은 업계에 공지되어 있으며, 예를 들어 미국 특허 5,795,737; Baca (2000) Int. J. Parasitol. 30: 113-118; Hale (1998) Protein Expr. Purif. 12: 185-188; Narum (2001) Infect. Immun. 69: 7250-7253를 참조할 수 있다. 또한, 문헌(참조: Narum (2001) Infect. Immun. 69: 7250-7253, describing optimizing codons in mouse systems; Outchkourov (2002) Protein Expr. Purif. 24: 18-24, describing optimizing codons in yeast; Feng (2000) Biochemistry 39: 15399-15409, describing optimizing codons in E. coli ; Humphreys (2000) Protein Expr. Purif. 20: 252-264, describing optimizing codon usage that affects secretion in E. coli)을 참고할 수도 있다..
트랜스게닉 비인간 동물
본 발명은 본 발명의 핵산, 폴리펩티드(예, 자일라나제), 발현 카셋트 또는 벡터 또는 형질감염 또는 형질전환된 세포를 포함하는 트랜스게닉 비인간 동물을 제공한다. 본 발명은 또한 트랜스게닉 비인간 동물의 제조 방법 및 사용 방법을 제공한다.
트랜스게닉 비인간 동물은 예컨대, 본 발명의 핵산을 포함하는 염소, 토끼, 양, 돼지, 소, 랫트 및 마우스일 수 있다. 이들 동물들은 예컨대, 자일라나제 활성을 연구하는 생체내 모델, 또는 생체내 자일라나제 활성을 변화시키는 작용제를 스크리닝하기 위한 모델로서 사용될 수 있다. 트랜스게닉 비인간 동물에서 발현되는 폴리펩티드에 대한 코딩 서열은 연속적이거나, 또는 조직-특이적, 발달-특이적 또는 유도성 전사 조절 인자의 조절하에 있도록 디자인될 수 있다. 트랜스게닉 비인간 동물은 본 기술 분야에 공지된 방법에 의해 디자인 및 생성할 수 있다; 예컨대, 형질전환된 세포 및 수정란, 및 트랜스게닉 마우스, 랫트, 토끼, 양, 돼지 및 소를 제조하고 사용하는 방법에 대하여 서술하고 있는 미국 특허 제6,211,428호; 제6,187,992호; 제6,156,952호; 제6,118,044호; 제6,111,166호; 제6,107,541호; 제5,959,171호; 제5,922,854호; 제5,892,070호; 제5,880,327호; 제5,891,698호; 제5,639,940호; 제5,573,933호; 제5,387,742호; 제5,087,571호를 참조하라. 또한, 예컨대, 트랜스게닉 낙농 동물의 우유에서 재조합 단백질의 생산에 대해 서술하는 [Pollock (1999) J. Immunol. Methods 231: 147-157]; 및 트랜스게닉 염소에 대해 서술하고 있는 [Baguisi (1999) Nat. Biotechnol. 17: 456-461]을 참고하라. 미국 특허 출원 제6,211,428호는 DNA 서열을 포함하는 뇌 핵산 작제물에서 발현되는 트랜스게닉 비인간 동물의 제조 및 사용에 대해 서술한다. 미국 특허 제6,211,428호는 클로닝된 재조합 또는 합성 DNA 서열을 수정된 마우스 수정란에 주입하고, 주입된 수정란을 가임신 수컷에게 착상시켜, 트랜스게닉 마우스 세포가 알츠하이머 병의 병리학과 연관된 단백질을 발현하도록 하는 것에 대해 서술한다. 미국 특허 제6,187,992호는 마우스의 게놈이 아밀로이드 전구체 단백질(APP)을 코딩하는 유전자의 파괴를 포함하는 트랜스게닉 마우스의 제조 및 사용에 대해 서술한다.
"넉아웃 동물"은 또한 본 발명의 방법을 수행하는 데 사용될 수 있다. 예컨대, 한 양태에서, 본 발명의 트랜스게닉 또는 개질된 동물은 "넉아웃 동물", 예컨대, 본 발명의 자일라나제 또는 본 발명의 자일라나제를 포함하는 융합 단백질을 발현하는 유전자로 대체되어진 내인성 유전자를 발현하지 않도록 조작된 "넉아웃 마우스"를 포함한다.
트랜스게닉 식물 및 종자
본 발명은 본 발명의 핵산, 폴리펩티드(예, 자일라나제), 발현 카셋트 또는 벡터 또는 형질감염된 또는 형질전환된 세포를 포함하는 트랜스게닉 식물 및 종자를 제공한다. 본 발명은 또한 본 발명의 핵산 및/또는 폴리펩티드(예, 자일라나제)를 포함하는 식물 산물들, 예컨대, 오일, 종자, 잎, 추출물 등을 제공한다. 트랜스게닉 식물은 쌍떡잎 식물(디콧)이거나 외떡잎 식물(모노콧)일 수 있다. 본 발명은 또한 이들 트랜스게닉 식물 및 종자의 제조 및 사용 방법을 제공한다. 본 발명의 폴리펩티드를 발현하는 트랜스게닉 식물 또는 식물 세포는 본 기술 분야에 공지된 어떠한 방법에 따라 작제될 수 있다. 예컨대, 미국 특허 제6,309,872호를 참조하라.
본 발명의 핵산 및 발현 작제물은 어떠한 수단에 의해 식물 세포로 도입될 수 있다. 예컨대, 핵산 및 발현 작제물은 소정의 식물 숙주의 게놈으로 도입될 수 있거나, 또는 핵산 또는 발현 작제물은 에피좀일 수도 있다. 소정의 식물의 게놈으로의 도입은 숙주의 자일라나제 생산이 내인성 전사 또는 번역 조절 요소에 의해 조절되도록 할 수 있다. 본 발명은 또한 예컨대, 상동적 재조합에 의해 일어난 유전자 서열의 삽입이 내인성 유전자의 발현을 파괴하는 "넉아웃 식물"을 제공한다. "넉아웃" 식물을 생성하는 수단은 본 기술 분야에 잘 알려져 있다. 예컨대, [Strepp (1998) Proc Natl. Acad. Sci. USA 95: 4368-4373; Miao (1995) Plant J 7: 359-365]를 참조하라. 이하, 트랜스게닉 식물에 대한 서술을 참조하라.
본 발명의 핵산은 어떠한 식물, 예컨대, 감자, 밀, 쌀, 보리 등과 같은 전분을 생산하는 식물에 본질적으로 소정의 특성을 부여하는 데 사용될 수 있다. 본 발명의 핵산은 숙주의 자일라나제 발현을 최적화하거나 변화시키기 위해, 식물의 대사 경로를 조작하는 데 사용될 수 있다. 이는 식물에서 자일라나제 활성을 변화시킬 수 있다. 선택적으로, 본 발명의 자일라나제는 그 식물에 의해 원래 생산되지 않는 화합물을 생산하기 위해, 트랜스게닉 식물을 제조하는 데 사용될 수 있다. 이는 생산 비용이 적거나, 신규한 산물을 생성하게 할 수 있다.
한 양태에서, 트랜스게닉 식물을 제조하는 첫 단계는 식물 세포에서 발현하는 발현 작제물을 제조하는 것을 포함한다. 이들 기술은 본 기술 분야에 잘 공지되어 있다. 여기에는 프로모터의 선별 및 클로닝, 리보좀이 mRNA에 효율적으로 결합하는 것을 용이하게 하는 코딩 서열의 선별 및 클로닝, 및 적절한 유전자 종결자 서열의 선별이 포함될 수 있다. 하나의 대표적인 연속적 프로모터는 식물에서 과량 발현을 일반적으로 초래하는 콜리플라워 모자이크 바이러스 유래의 CaMV35S이다. 다른 포로모터는 식물 내부 또는 외부 환경의 신호에 더욱 특이하게 반응한다. 대표적인 광유도성 프로모터는 주된 엽록소 a/b 결합 단백질을 코딩하는 cab 유전자의 단백질이다.
한 양태에서, 핵산은 식물 세포에서 더욱 과량의 발현을 얻기위해 개질된다. 예컨대, 본 발명의 서열은 식물에서 관찰되는 서열에 비교하여 높은 %의 A-T 뉴클레오티드 쌍을 가질 수 있으며, 일부의 경우는 G-C 뉴클레오티드 쌍의 %가 더 높다. 따라서, 코딩 서열내 A-T 뉴클레오티드는 식물 세포에서 유전자 산물의 생산을 강화시키기 위해 아미노산 서열의 두드러진 변화없이도 G-C 뉴클레오티드로 대체될 수 있다.
선별적 마커 유전자는 연속적으로 트랜스유전자에 삽입된 식물 세포 또는 조직을 확인하기 위해 유전자 작제물에 첨가될 수 있다. 이는 식물 세포내에 유전자의 삽입 및 발현이 드문 일이며, 표적화된 조직 또는 세포의 몇 %에서만 발생하므로 필수적일 수 있다. 선별적 마커 유전자는 식물에 일반적으로 독성인 약제에 내성을 제공하는 단백질, 예컨대, 항생제 또는 제초제를 코딩한다. 삽입된 선별적 마커 유전자를 갖는 식물 세포만이 적절한 항생제나 제초제를 함유하는 배지에서 배양시 생존할 것이다. 다른 삽입된 유전자를 위해, 마커 유전자는 또한 더 나은 기능을 갖는 프로모터 및 종결 서열을 요구한다.
한 양태에서, 트랜스게닉 식물 또는 종자를 제조하는 것은 본 발명의 서열, 및 임의적으로 마커 유전자를 표적 발현 작제물(예, 플라스미드)에 프로모터 및 종결자 서열의 위치에 따라 삽입하는 것을 포함한다. 이에는 개질된 유전자를 적절한 방법을 통해 식물에 전달시키는 것을 포함할 수 있다. 예컨대, 작제물은 전기충격및 식물 세포 프로토플라스트의 미세주입과 같은 기술들을 사용하여, 식물 세포의 게놈 DNA에 직접 도입되거나, 또는 작제물은 DNA 입자 포격과 같은 탄도 방법을 사용하여 식물 조직에 직접 도입될 수 있다. 예컨대, 입자 포격을 사용하여 밀에 트랜스유전자를 도입하는 것에 대해 서술하는 [Christou (1997) Plant Mol. Biol. 35: 197-203; Pawlowski (1996) Mol. Biotechnol. 6: 17-30; Klein (1987) Nature 327: 70-73; Takumi (1997) Genes Genet. Syst. 72: 63-69] 및 입자 포격을 사용하여 YAC을 식물 세포에 도입하는 것에 대해 서술하고 있는 [Adam (1997) supra]를 참조하라. 예컨대, [Rinehart (1997) supra]는 입자 포격을 사용하여 트랜스게닉 코튼 식물을 생성하였다. 입자를 가속화시키는 장치는 미국 특허 제5,015,580호에 서술되어 있으며, BioRad (Biolistics) PDS-2000 입자 가속화 기기가 시판중이며, 또한 겉씨 식물의 입자-매개 형질전환에 대해 서술하고 있는 John의 미국 특허 제 5,608,148호 및 Ellis의 미국 특허 제5,681,730호를 참조하라.
한 양태에서, 프로토플라스트는 고정되고, 핵산, 예컨대, 발현 작제물이 주입될 수 있다. 프로토플라스트 유래의 식물 재발생이 곡식에는 용이하지 않음에도, 식물 재발생은 프로토플라스트 유래된 캘러스의 체세포 배형성을 사용하여, 콩과 식물에서는 가능하다. 유기된 조직은 DNA를 텅스텐 미세발사물로 코팅하며, 이 때 발사체는 세포 크기의 1/100 크기이고, 이로 인해 DNA가 세포 및 조직으로 운반되는 유전자 총 기술을 사용하여, 네이키드 DNA로 형질전환될 수 있다. 그 후, 형질전환된 조직은 체세포 배형성에 의해 일반적으로 재발생될 수 있다. 이 기술은 옥수수 및 쌀을 비롯한 여러 곡식 종에서 성공되어 왔다.
핵산, 예컨대, 발현 작제물은 또한 재조합 바이러스를 사용하여 식물 세포에 도입될 수 있다. 식물 세포는 담배 모자이크 바이러스에서 유래된 벡터와 같은 바이러스 벡터를 사용하여 형질전환될 수 있다(Rouwendal (1997) Plant Mol. Biol. 33: 989-999), Porta (1996) "Use of viral replicons for the expression of genes in plants", Mol. Biotechnol. 5: 209-221 참조).
선택적으로, 핵산, 예컨대, 발현 작제물은 적절한 T-DNA 플랭킹 부위와 조합되어, 종래의 아그로박테리엄 투메파시엔스(Agrobacterium tumefaciens) 숙주 벡터로 도입될 수 있다. 아그로박테리엄 투메파시엔스 숙주의 병독성 기능은 세포가 박테리아로 감염시, 작제물 및 인접한 마커가 식물 세포 DNA로 삽입되는 것을 가능케 한다. 무력화되고 바이너리 벡터의 사용을 포함하는 아그로박테리엄 투메파시엔스-매개된 형질전환 기술은 과학 문헌에 잘 서술되어 있다. 예컨대, [Horsch (1984) Science 233: 496-498; Fraley (1983) Proc. Natl. Acad. Sci. USA 80: 4803 (1983); Gene Transfer to Plants, Potrykus, ed. (Springer-Verlag, Berlin 1995)]를 참조하라. 아그로박테리엄 투메파시엔스 세포의 DNA는 Ti(종양-유도) 플라스미드로 알려져 있는 기타 구조내에는 물론 박테리아 염색체 내에 함유된다. Ti 플라스미드는 감염 과정시 식물 세포로 전이되는 T-DNA(~20 kb 길이) 및 감염 과정을 초래하는 일련의 vir(병독성) 유전자로 일컬어 지는 DNA를 함유한다. 아그로박테리엄 투메파시엔스는 단지 상처를 통해서만 식물에 감염될 수 있다: 식물 뿌리 또는 줄기가 상처를 입으면, 여기서 어떠한 화학적 신호를 내게 되고, 이 신호에 반응하여, 아그로박테리엄 투메파시엔스의 vir 유전자는 활성화되어 Ti-플라스미드의 T-DNA를 식물의 염색체로 전이시키는 데 필요한 일련의 과정들을 초래하게 된다. 그 후, T-DNA는 상처 부위를 통해 식물 세포로 들어간다. T-DNA는 식물 DNA가 복제되거나 전사될 때까지 기다린 후, 노출된 식물 DNA에 그 자신을 삽입시킨다고 추정된다. 아그로박테리엄 투메파시엔스를 트랜스유전자 벡터로 사용하기 위해서, T-DNA의 종양-유도 부위는 제거되어야만 하며, 반면에 T-DNA 경계 부위 및 vir 유전자는 유지되어야만 한다. 트랜스유전자는 그 후 T-DNA 경계 부위들 사이에 삽입되어, 식물 세포로 전이되어 식물의 염색체에 삽입되게 될 것이다.
본 발명은 본 발명의 핵산을 사용한 중요한 곡식을 포함하는 외떡잎 식물의 형질전환을 제공한다. [Hiei (1997) Plant Mol. Biol. 35: 205-218]을 참조하라. 또한, 예컨대, 게놈 DNA에 T-DNA의 삽입에 대해 서술하고 있는 [Horsch, Science(1984) 233: 496; Fraley (1983) Proc. Natl. Acad. Sci USA 80: 4803; Thykjaer (1997) supra; Park (1996) Plant Mol. Biol. 32: 1135-1148]를 참조하라. 또한, 곡식 또는 기타 외떡잎 식물의 세포에서 작동하는 유전자를 포함하는 DNA의 안정적 삽입 방법에 대해 서술하고 있는 D'Halluin의 미국 특허 제5,712,135호를 참조하라.
한 양태에서, 세번째 단계는 통합된 표적 유전자를 다음 세대까지 전달할 수 있는 전체 식물의 선별 및 재발생을 포함할 수 있다. 이러한 재발생 기술은 조직 배양 성장 배지에서 어떠한 피토호르몬을 조작하는 것에 의존하며, 전형적으로 소정의 뉴클레오티드 서열과 함께 도입된 살생물제 및/또는 제초제 마커에 의존한다. 배양된 프로토플라스트로부터의 식물 재발생은 [Evans et al., ProtoplastsIsolation and Culture, Handbook of Plant Cell Culture, pp.124-176, MacMillilan Publishing Company, New York, 1983; 및 Binding, Regeneration of Plants, Plant Protoplasts, pp. 21-73, CRC Press, Boca Raton, 1985]에 서술되어 있다. 재발생은 또한 식물 캘러스, 외식편, 기관 또는 이들의 부분에서 얻을 수 있다. 이러한 재발생 기술은 일반적으로 [Klee (1987) Ann. Rev. of Plant Phys. 38: 467-486]에 서술되어 있다. 비성숙된 배아와 같은 트랜스게닉 조직에서 전체 식물을 얻기 위해서, 이들은 조직 배양으로 알려진 영양소 및 호르몬을 함유하는 일련의 배지에서 조절되는 환경 조건하에 성장될 수 있다. 일단 전체 식물이 생성되고 종자를 생산하면, 자손의 평가가 시작된다.
발현 카셋트가 트랜스게닉 식물에 안정적으로 통합된 후, 이는 교배에 의해 다른 식물로 도입될 수 있다. 여러 표준 육종 기술 중 어떠한 것들이 교배될 종에 따라 사용될 수 있다. 본 발명의 핵산의 트랜스게닉 발현이 표현형 변화를 초래하기 때문에, 본 발명의 재조합 핵산을 포함하는 식물은 제2 식물과 교배되어 최종 산물을 얻을 수 있다. 따라서, 본 발명의 종자는 본 발명의 2개의 트랜스게닉 식물의 교배를 통해 유래되거나, 본 발명의 식물과 다른 식물과의 교배에 의해 유래될 수 있다. 소정의 효과(예, 본 발명의 폴리펩티드의 발현이 개화 양식이 변화된 식물을 생산함)가 양쪽 부모 식물이 본 발명의 폴리펩티드(예, 자일라나제)를 발현하는 경우 강화될 수 있다. 소정의 효과는 표준 증식 수단에 의해 미래의 식물 세대로 전달될 수 있다.
본 발명의 핵산 및 폴리펩티드는 어떠한 식물 또는 종자에서 발현되거나 이에 삽입된다. 본 발명의 트랜스게닉 식물은 쌍떡잎 식물 또는 외떡잎 식물일 수 있다. 본 발명의 외떡입 트랜스게닉 식물의 예는 풀, 예컨대, 왕포아풀(파란 풀, 포아(Poa)), 마초 풀, 예컨대, 페스투카, 로리엄, 템퍼레이트(temperate) 풀, 예컨대, 아그로스티스(Agrostis) 및 곡식, 예컨대, 밀, 귀리, 호밀, 보리, 쌀, 사탕수수 및 옥수수(콘)이 있다. 본 발명의 쌍떡잎 트랜스게닉 식물의 예는 담배, 콩과 식물, 예컨대, 루핀, 감자, 사탕무, 완두, 콩 및 대두, 및 겨자과 식물(브라시카세아(Brassicaceae) 패밀리)), 예컨대, 콜리플라워, 평지 종자, 및 밀접하게 관련된 모델 유기체인 아라비돕시스 탈리아나(Arabidopsis thaliana)가 있다. 따라서, 본 발명의 트랜스게닉 식물 및 종자는 아나카리듐(Anacardium), 아라치스(Arachis), 아스파라거스(Asparagus), 아트로파(Atropa), 아베나(Avena), 브라시카(Brassica), 시트러스(Citrus), 시트럴러스(Citrullus), 캡시컴(Capsicum), 카르타머스(Carthamus), 코코스(Cocos), 코피아(Coffea), 쿠쿠미스(Cucumis), 쿠쿠르비타(Cucurbita), 다우커스(Daucus), 엘라에시스(Elaeis), 프라가리아(Fragaria), 글라이신(Glycine), 고시피엄(Gossypium), 헬리안터스(Helianthus), 헤테로칼리스(Heterocallis), 호르테우튼(Hordeutn), 하이오시아머스(Hyoscyamus), 락투카(Lactuca), 린넘(Linum), 로리엄(Lolium), 루피너스(Lupinus), 리코퍼시콘(Lycopersicon), 말러스(Malus), 만니호트(Manihot), 메이요라나(Majorana), 메디카고(Medicago), 니코티아나(Nicotiana), 올레아(Olea), 오리자(Oryza), 페니엄(Panieum), 파니세텀(Pannisetum), 페르지아(Persea), 파세올러스(Phaseolus), 피스타치아(Pistachia), 피섬(Pisum), 피러스(Pyrus), 프루너스(Prunus), 라파너스(Raphanus), 리치너스(Ricinus), 세케일(Secale), 세네시오(Senecio), 시나피스(Sinapis), 솔라넘(Solanum), 소르클라엄(Sorglaum), 를제오브로머스(Tlzeobromus), 트리고넬라(Trigonella), 트리티컴(Triticum), 비시아(Vicia), 비티스(Vitis), 비그나(Vigna) 및 지아(Zea) 속에서 유래된 종들을 포함하나, 이로 제한되지 않는 광범위한 식물을 포함한다.
선택적 구체예에서, 본 발명의 핵산은 섬유 세포를 함유하는 식물, 예컨대, 코튼, 실크 코튼 나무(Kapok, Ceiba pentandra), 사막 버드나무, 크레오소트 덤블, 윈터팻, 발사, 라미, 양마, 삼, 로젤, 황마, 사이잘 삼 및 아마에서 발현된다. 선택적 구체예에서, 본 발명의 트랜스게닉 식물은 어떠한 고시피엄 종, 예컨대, 고시피엄 아르보레엄(G. arboreum); 고시피엄 헤르바세엄(G. herbaceum), 고시피럼 바르바덴스(G. barbadense) 및 고시피엄 히르서텀(G. hirsutum)의 멤버를 포함하는 고시피엄(Gossypium) 속의 구성원일 수 있다.
본 발명은 또한 많은 양의 본 발명의 폴리펩티드(예, 자일라나제 또는 항체)를 생산하는 데 사용되는 트랜스게닉 식물을 제공한다. 예컨대, [Palmgren (1997) Trends Genet. 13:348; Chong (1997) Transgenic Res. 6: 289-296]를 참조하라(옥신-유도성, 양방향 만노파인 신테타제(mas 1', 2') 프로모터를 사용하여, 아그로박테리엄 투메파시엔스-매개된 잎 디스크 형질전환 방법으로, 트랜스게닉 감자에서 인간 우유 단백질인 베타-카제인을 생산함).
공지된 과정들을 사용하여, 당업자는 트랜스게닉 식물에서 트랜스유전자 mRNA나 단백질의 증가 또는 감소를 검출하여 본 발명의 식물을 스크린할 수 있다.mRNA나 단백질의 검출 및 정량화 수단은 본 기술 분야에 잘 알려져 있다.
폴리펩티드 및 펩티드
한 양태에서, 본 발명은 본 발명의 대표적 서열과 서열 동일성(예, 적어도 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%,73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%,81%, 82%, 83%, 84%, 85%, 86%, 87%,88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상, 또는 완전한(100%) 서열 동일성)을 갖는 완전히(100%) 분리되거나 재조합된 폴리펩티드를 제공한다. 예컨대, 서열 번호 2, 서열 번호 4, 서열 번호 6, 서열 번호 8, SEQ I : D NO : 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18, 서열 번호 20, 서열 번호 22, 서열 번호 24, 서열 번호 26, 서열 번호 28, 서열 번호 30, 서열 번호 32, 서열 번호 34, 서열 번호 36, 서열 번호 38, 서열 번호 40, 서열 번호 42, 서열 번호 44, 서열 번호 46, 서열 번호 48, 서열 번호 50, 서열 번호 52, 서열 번호 54, 서열 번호 56, 서열 번호 58, 서열 번호 60, 서열 번호 62, 서열 번호 64, 서열 번호 66, 서열 번호 68, 서열 번호 70, 서열 번호 72, 서열 번호 74, 서열 번호 76, 서열 번호 78, 서열 번호 80, 서열 번호 82, 서열 번호 84, 서열 번호 86, 서열 번호 88, 서열 번호 90, 서열 번호 92, 서열 번호 94, 서열 번호 96, 서열 번호 98, 서열 번호 100, 서열 번호 102, 서열 번호 104, 서열 번호 106, 서열 번호 108, 서열 번호 110, 서열 번호 112, 서열 번호 114, 서열 번호 116, 서열 번호 118, 서열 번호 120, 서열 번호 122, 서열 번호 124, 서열 번호 126, 서열 번호 128, 서열 번호 130, 서열 번호132; 서열 번호 134; 서열 번호 136; 서열 번호 138; 서열 번호 140; 서열 번호 142; 서열 번호 144; 서열 번호 146, 서열 번호 148, 서열 번호 150, 서열 번호 152, 서열 번호 154, 서열 번호 156, 서열 번호 158, 서열 번호 160, 서열 번호 162, 서열 번호 164, 서열 번호 166, 서열 번호 168, 서열 번호 170, 서열 번호 172, 서열 번호 174, 서열 번호 176, 서열 번호 178, 서열 번호 180, 서열 번호 182, 서열 번호 184, 서열 번호 186, 서열 번호 188, 서열 번호 190, 서열 번호 192, 서열 번호 194, 서열 번호 196, 서열 번호 198, 서열 번호 200, 서열 번호 202, 서열 번호 204, 서열 번호 206, 서열 번호 208, 서열 번호 210, 서열 번호 212, 서열 번호 214, 서열 번호 216, 서열 번호 218, 서열 번호 220, 서열 번호 222, 서열 번호 224, 서열 번호 226, 서열 번호 228, 서열 번호 230, 서열 번호 232, 서열 번호 234, 서열 번호 236, 서열 번호 238, 서열 번호 240, 서열 번호 242, 서열 번호 244, 서열 번호 246, 서열 번호 248, 서열 번호 250, 서열 번호 252, 서열 번호 254, 서열 번호 256, 서열 번호 258, 서열 번호 260, 서열 번호 262, 서열 번호 264, 서열 번호 266, 서열 번호 268, 서열 번호 270, 서열 번호 272, 서열 번호 274, 서열 번호 276, 서열 번호 278, 서열 번호 280, 서열 번호 282, 서열 번호 284, 서열 번호 286, 서열 번호 288, 서열 번호 290, 서열 번호 292, 서열 번호 294, 서열 번호 296, 서열 번호 298, 서열 번호 300, 서열 번호 302, 서열 번호 304, 서열 번호 306, 서열 번호 308, 서열 번호 310, 서열 번호 312, 서열 번호 314, 서열 번호 316, 서열 번호 318, 서열 번호 320, 서열 번호 322, 서열 번호 324, 서열 번호 326, 서열 번호 328, 서열 번호 330, 서열 번호332, 서열 번호 334, 서열 번호 336, 서열 번호 338, 서열 번호 340, 서열 번호 342, 서열 번호 344, 서열 번호 346, 서열 번호 348, 서열 번호 350, 서열 번호 352, 서열 번호 354, 서열 번호 356, 서열 번호 358, 서열 번호 360, 서열 번호 362, 서열 번호 364, 서열 번호 366, 서열 번호 368, 서열 번호 370, 서열 번호 372, 서열 번호 374, 서열 번호 376, 서열 번호 378 또는 서열 번호 380으로 나타낸 서열을 갖는 단백질이다. 한 양태에서, 폴리펩티드는 자일라나제 활성을 가지며, 예컨대, 다당류(예, 자일란)내 글리코시딕 결합을 가수분해할 수 있다. 한 양태에서, 폴리펩티드는 내부 β-1,4-자일로시딕 결합의 가수분해를 촉매화할 수 있는 자일라나제 활성을 가진다. 한 양태에서, 자일라나제 활성은 엔도-1,4-베타-자일라나제 활성을 포함한다. 한 양태에서, 자일라나제 활성은 자일란을 가수분해하여, 더 소분자량의 자일로즈 및 자일로-올리고머를 생산하는 것을 포함한다. 한 양태에서, 자일란은 아라비노자일란, 예컨대, 수용성 아라비노자일란을 포함한다.
본 발명의 폴리펩티드는 자일라나제를 활성 형태 또는 비활성 형태로 포함한다. 예컨대, 본 발명의 폴리펩티드는 프로단백질이 전환되어 "활성" 성숙한 단백질을 생성하는, 예컨대, 프로단백질-가공 효소에 의한 "성숙화" 또는 프리프로 서열의 가공 이전의 프로단백질을 포함한다. 본 발명의 폴리펩티드는 예컨대, 엔도- 또는 엑소-펩티다제 또는 프로테나제 작용, 인산화 반응, 아미드화, 당화 또는 황화, 다이머화 반응 등과 같은 후-번역 과정에 의해 "활성화"되기 이전인, 다른 이유로 비활성 형태인 자일라나제를 포함한다. 본 발명의 폴리펩티드는 자일라나제의 활성 서브서열, 예컨대, 촉매 도메인 또는 활성 부위를 포함하는, 모든 활성 형태를 포함한다.
"프리프로" 도메인 서열 및 신호 서열을 확인하는 방법은 본 기술 분야에 잘 공지되어 있다. 예컨대, [Van de Ven (1993) Crit. Rev. Oncog. 4 (2): 115-136]를 참조하라. 예컨대, 프리프로 서열을 확인하기 위해서는, 단백질을 세포외 공간에서 정제하고, N-말단 단백질 서열을 결정하고 비가공된 형태와 비교한다.
본 발명은 신호 서열 및/또는 프리프로 서열이 포함되거나 포함되지 않은 폴리펩티드를 포함한다. 본 발명은 이질적 신호 서열 및/또는 프리프로 서열이 포함된 폴리펩티드를 포함한다. 프리프로 서열(이질적 프리프로 도메인으로 사용된 본 발명의 서열 포함)은 단백질의 아미노 말단 또는 카르복시 말단에 위치할 수 있다. 본 발명은 또한 분리되거나 재조합된 신호 서열, 프리프로 서열 및 본 발명의 서열을 포함하는 촉매 도메인(예, "활성 부위")을 포함한다.
% 서열 동일성은 폴리펩티드 전체 길이에 걸쳐 존재하거나, 또는 동일성이 적어도 약 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 또는 그 이상의 잔기 부위에 걸쳐 존재할 수 있다. 본 발명의 폴리펩티드는 또한 대표적인 폴리펩티드의 전체 길이보다 더 짧을 수 있다. 선택적 양태에서, 본 발명은 약 5 내지 전체 폴리펩티드, 예컨대, 자일라나제와 같은 효소길이의 크기 범위를 갖는 폴리펩티드(펩티드, 단편)를 제공하며, 대표적인 크기는 약 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 또는 그 이상의 잔기, 예컨대, 본 발명의 대표적인 자일라나제의 연속 잔기의 범위이다.
본 발명의 펩티드(예, 본 발명의 대표적인 폴리펩티드의 서브서열)는 예컨대, 표지된 프로브, 항원, 톨러라젠, 모티프, 자일라나제 활성 부위(예, "촉매 도메인"), 신호 서열 및/또는 프리프로 도메인으로 유용할 수 있다.
본 발명의 폴리펩티드 및 펩티드는 천연원에서 분리되거나 합성되거나, 또는 재조합적으로 발생된 폴리펩티드일 수 있다. 펩티드 및 단백질은 시험관내 또는 생체내에서 재조합적으로 발현될 수 있다. 본 발명의 펩티드 및 폴리펩티드는 본 기술 분야에 공지된 방법을 사용하여 제조 및 분리될 수 있다. 본 발명의 폴리펩티드 및 펩티드는 또한 본 기술 분야에 잘 알려진 화학적 방법을 사용하여 전체적으로 또는 부분적으로 합성될 수 있다. 예컨대, [Caruthers(1980) Nucleic Acids Res. Symp. Ser. 215-223; Horn (1980) Nucleic Acids Res. Symp. Ser.225-232; Banga, A. K., Therapeutic Peptides and Proteins, Formulation, Processing and Delivery Systems (1995) Technomic Publishing Co., Lancaster, PA]을 참조하라. 예컨대, 펩티드 합성은 다양한 고체상 기술을 사용하여 수행될 수 있으며(예, Roberge (1995) Science 269: 202; Merrifield (1997) Methods Enzymol. 289: 3-13 참조), 자동화된 합성도 제조자에 의해 제공되는 지시에 따라, 예컨대, ABI 431A 펩티드 합성기(Perkin Elmer)를 사용하여 성취될 수 있다.
본 발명의 펩티드 및 폴리펩티드는 또한 당화될 수 있다. 당화는 후-번역적으로 화학적 또는 세포내 생합성 메카니즘에 의해 첨가될 수 있으며, 후자의 경우는 서열에 네이티브 하거나, 또는 펩티드로 첨가되거나 핵산 코딩 서열로 첨가될수 있는 공지된 당화 모티프의 사용을 포함한다. 당화는 0-결합되거나 N-결합될 수 있다.
전술된 바와 같이, 본 발명의 펩티드 및 폴리펩티드는 모든 "의태체" 및 "펩티도의태체" 형태를 포함한다. 용어 "의태체" 및 "펩티도의태체"는 본 발명의 폴리펩티드와 실질적으로 동일한 구조적 및/또는 기능적 특징을 가지는 합성 화학 화합물을 나타낸다. 의태체는 아미노산의 합성된 비천연 유사체로 구성되거나, 부분적으로 천연 펩티드 아미노산 및 부분적으로 아미노산의 비천연 유사체의 키메릭 분자일 수 있다. 의태체는 또한 치환이 의태체의 구조 및/또는 활성을 실질적으로 변화시키지 않는 한, 일정한 양의 천연 아미노산 보존적 대체를 포함할 수 있다. 구조적 변형체인 본 발명의 폴리펩티드 아미노산으로, 일상적 실험은 의태체가 본 발명의 범위 이내임을, 즉, 의태체의 구조 및/또는 기능이 실질적으로 변화되지 않았음을 확인할 것이다. 따라서, 한 양태에서, 의태체 조성은 만약 의태체 조성이 자일라나제 활성을 갖는다면 본 발명의 범위 이내이다.
본 발명의 폴리펩티드 의태체 조성은 비천연 구조적 성분들의 어떠한 조합을 포함할 것이다. 선택적 양태에서, 본 발명의 의태체 조성은 이하 세가지 구조적 군의 하나 또는 전부를 포함한다: a) 천연 아미드 결합("펩티드 결합")이 아닌 다른 잔기 결합 군; b) 천연적으로 발생하는 아미노산 잔기를 대신하는 비천연 잔기; 또는 c) 2차 구조적 의태체를 유도하는, 즉, 2차 구조, 예컨대, 베타 턴, 감마 턴, 베타 쉬트, 알파 헬릭스 구성 등을 유도하거나 안정화시키는 잔기. 예컨대, 본 발명의 폴리펩티드는 이 잔기들의 전부 또는 일부가 천연 펩티드 결합이 아닌 다른화학적 수단으로 연결되는 경우, 의태체로 특징화될 수 있다. 개별적인 펩티도의태체 잔기는 펩티드 결합, 기타 화학적 결합 또는 커플링 수단, 예컨대, 글루타알데히드, N-히드록시숙시니미드 에스터, 이중작용성 말레이미드, N,N'-디시클로헥실카르보디이미드(DCC) 또는 N,N'-디이소프로필카르보디이미드(DIC)에 의해 연결될 수 있다. 전통적인 아미드 결합("펩티드 결합")을 대체할 수 있는 결합 기에는 예컨대, 케토메틸렌(예, -C(=O)-NH-의 경우 -C(=O)-CH2-), 아미노메틸렌(CH2-NH), 에틸렌, 올레핀(CH=CH), 에테르(CH2-O), 티오에테르(CH2-S), 테트라졸(CN4-), 티아졸, 레트로아미드, 티오아미드, 또는 에스터가 포함된다(예, Spatola(1983) in Chemistry and Biochemistry of Amino Acids, Peptides and Proteins, Vol. 7, pp 267-357, "Peptide Backbone Modifications", Marcell Dekker, NY).
본 발명의 폴리펩티드는 또한 천연적으로 발생하는 아미노산 잔기를 대신하는 비천연 잔기의 전부 또는 일부를 함유하는 의태체로 특징화될 수 있다. 비천연 잔기는 과학 문헌 및 특허 문허에 잘 서술되어 있다; 천연 아미노산 잔기의 의태체로 유용한 대표적인 비천연 조성의 일부 및 이에 대한 가이드라인은 이하 서술된다. 방향족 아미노산의 의태체는 예컨대, D- 또는 L-나필알라닌; D- 또는 L-페닐글라이신; D- 또는 L-2 티에네일알라닌; D- 또는 L-1-, 2-, 3-, 또는 4-피레네일알라닌; D- 또는 L-3 티에네일알라닌; D- 또는 L- (2-피리디닐)-알라닌; D- 또는 L-(3-피리디닐)-알라닌; D- 또는 L-(2-피라지닐)-알라닌; D- 또는 L-(4-이소프로필)-페닐글라이신; D-(트리플루오로메틸)-페닐글라이신; D-(트리플루오로메틸)-페닐알라닌; D-p-플루오로-페닐알라닌; D- 또는 L-p-비페닐페닐알라닌; D- 또는 L-p-메톡시-비페닐페닐알라닌; D- 또는 L-2-인돌(알킬)알라닌; 및 D- 또는 L-알킬알라닌으로 대체 함으로써 발생될 수 있으며, 여기서, 알킬은 치환된 또는 비치환된 메틸, 에틸, 프로필, 헥실, 부틸, 펜틸, 이소프로필, 이소-부틸, sec-이소틸, 이소-펜틸, 또는 비산성 아미노산일 수 있다. 비천연 아미노산의 방향족 고리에는 예컨대, 티아졸릴, 티오페닐, 피라졸릴, 벤지미다졸릴, 나프틸, 푸라닐, 피롤릴 및 피리딜 방향족 고리를 포함한다.
산성 아미노산의 의태체는 예컨대, 음성 전하는 유지하면서 비-카르복실레이트 아미노산; (포스포노)알라닌; 황화 트레오닌을 대체함으로써 발생될 수 있다. 카르복실 측면 기(예, 아스파르틸 또는 글루타밀)는 또한 카르보디이미드(R'-N-C-N-R'), 예컨대, 1-시클로헥실-3(2-모르폴리닐-(4-에틸) 카르보디이미드 또는 1-에틸-3(4-아조니아-4,4-디메톨펜틸) 카르보디이미드와의 반응으로 선택적으로 개질될 수 있다. 아스파르틸 또는 글루타밀은 또한 암모늄 이온과의 반응으로 아스파라기닐 및 글루타미닐 잔기로 전환될 수 있다. 염기성 아미노산의 의태체는 예컨대, (라이신 및 아르기닐에 부가하여), 아미노산 오르니틴, 시트룰린, 또는 (구아니디노)-아세트산, 또는 (구아니디노)알킬-아세트산과의 치환으로 발생될 수 있으며, 여기서 알킬은 상기 정의된 바와 같다. 니트릴 유도체(예, COOH 대신 CN-부분을 함유)는 아스파라긴 또는 글루타민을 대체할 수 있다. 아스파라기닐 및 글루타미닐 잔기는 대응되는 아스파틸 또는 글루타밀 잔기로 탈아민화될 수 있다. 아르기닌 잔기 의태체는 아르기닐을 예컨대, 하나 이상의 종래의 시약들(예, 페닐글리옥살,2,3-부탄디온, 1,2-시클로-헥산디온, 또는 닌히드린)과 함께 바람직하게는 알칼리 조건하에 반응함으로써 발생될 수 있다. 티로신 잔기 의태체는 티로실을 예컨대, 방향족 디아조니엄 화합물 또는 테트라니트로메탄과 반응함으로써 발생될 수 있다. N-아세틸이미디졸 및 테트라니트로메탄은 0-아세틸 티로실 종 및 3-니트로 유도체를 형성하는 데 각각 사용될 수 있다. 시스테인 잔기 의태체는 시스테이닐 잔기를 예컨대, 알파-할로아세테이트, 예컨대, 2-클로로아세트산 또는 클로로아세타미드 및 대응되는 아민과 반응시킴으로써, 카르보시메틸 또는 카르복시아미도메틸 유도체를 형성함으로써, 발생될 수 있다. 시스테인 잔기 의태체는 또한 시스테이닐 잔기를 예컨대, 브로모-트리플루오로아세톤, 알파-브로모-베타-(5-이미도조일) 프로피온산; 클로로아세틸 포스페이트, N-알킬말레이미드, 3-니트로-2-피리딜 디설피드; 메틸 2-피리딜 디설피드; p-클로로머큐리벤조에이트; 2-클로로머큐리-4 니트로페놀; 또는, 클로로-7-니트로벤조-옥사-1,3-디아졸과 반응시킴으로써 발생될 수 있다. 라이신 의태체는 라이시닐을 예컨대, 카르복실산 무수화물과 반응시킴으로써, 발생되거나 (및 아미노 말단 잔기는 변화될) 수 있다. 라이신 및 기타 알파-아미노-함유 의태체는 또한 이미도에스터, 예컨대, 메틸 피콜린이미데이트, 피리독살 포스페이트, 피리독살, 클로로보로히드리드, 트리니트로-벤젠술폰산, O-메틸이소우레아, 2,4-펜탄디온과의 반응, 및 글리옥실레이트와의 트랜스아미다제-촉매화 반응에 의해 발생될 수 있다. 메티오닌 의태체는 예컨대, 메티오닌 설폭시드와의 반응으로 발생될 수 있다. 프롤린 의태체에는 예컨대, 피페콜산, 티아졸리딘 카르복실산, 3- 또는 4-히드록시 프롤린, 데히드로프롤린, 3- 또는 4-메틸프롤린, 또는 3,3-디메틸프롤린이 포함된다. 히스티딘 잔기 의태체는 히스티딜을 예컨대, 디에틸프로카보네이트 또는 파라-브로모펜아크릴 브로마이드와 반응시킴으로써 발생될 수 있다. 기타 의태체에는 예컨대, 프롤린 및 라이신의 히드록실화; 세릴 또는 트레오닐 잔기의 히드록실 기의 인산화; 라니신, 아르기닌 및 히스티딘의 알파-아미노기의 메틸화; N-말단 아민의 아세틸화; 주된 사슬 아미드 잔기의 메틸화 또는 N-메틸 아미노산으로의 치환; 또는 C-말단 카르복실기의 아미드화에 의해 발생된 것들이 포함된다.
본 발명의 폴리펩티드의 잔기, 예컨대, 아미노산은 또한 반대 키랄리티의 아미노산(또는 펩티도의태체 잔기)을 대체함으로써 대체될 수 있다. 따라서, L-배위로 천연적으로 발생하는 어떠한 아미노산(화학적 엔티티의 구조에 따라 R 또는 S로도 언급될 수 있음)은 D-아미노산으로 언급되는, 동일한 화학 구조의 유형 또는 펩티도의태체이나 반대 키랄리티를 갖는 아미노산으로 대체될 수 있으며, 이 또한 R- 또는 S-형태로 언급될 수 있다.
본 발명은 또한 후-번역 가공(예, 인산화, 아실화 등)과 같은 천연 과정, 또는 화학적 개질 기술에 의해 본 발명의 폴리펩티드를 개질하는 방법을 제공하며, 결과적으로 개질된 폴리펩티드를 제공한다. 개질은 펩티드 백본, 아미노산 측사슬 및 아미노 말단 및 카르복시 말단을 포함하는 폴리펩티드의 어떠한 부위에서도 일어날 수 있다. 동일한 유형의 개질이 주어진 폴리펩티드에서 여러 분위에 동일하거나 다양한 정도로 존재할 수 있음을 이해될 것이다. 또한, 주어진 폴리펩티드는 여러 유형의 개질을 포함할 수 있다. 개질에는 아세틸화, 아실화, ADP-리보실화, 아미드화, 플라빈의 공유 결합, 헴 부분의 공유 결합, 뉴클레오티드 또는 뉴클레오티드 유도체의 공유 결합, 지질 또는 지질 유도체의 공유 결합, 포스파티딜이노시톨의 공유 결합, 교차 결합 시클화, 디설피드 결합 형성, 탈메틸화, 공유 교차 결합의 형성, 시스테인의 형성, 피로글루타메이트의 형성, 포밀화, 감마-카르복실화, 당화, GPI 앵커 형성, 히드록실화, 요오드화, 메틸화, 미리스톨화, 산화, 페닐화, 프로테올리틱 가공, 인산화, 프레닐화, 라세미화, 셀레노일화, 황화, 및 단백질에 아미노산의 트랜스퍼 RNA 매개된 첨가, 예컨대, 아르기닐화가 포함된다. 예컨대, [ Creighton, T. E., Proteins-Structure and Molecular Properties 2nd Ed. , W. H. Freeman and Company, New York(1993); Posttranslational Covalent Modification of Proteins, B. C. Johnson, Ed., Academic Press, New York, pp. 1-12 (1983)]를 참조하라.
고체상 화학적 펩티드 합성 방법은 또한 본 발명의 폴리펩티드 또는 단편을 합성하는 데 사용될 수 있다. 이러한 방법은 1960년대 이래로 본 기술 분야에 공지되어 왔으며(Merrifield, R. B. , J. Am. Chem. Soc. , 85: 2149-2154, 1963. 또한, Stewart, J. M. and Young, J. D., Solid Phase Peptide Synthesis, 2nd Ed., Pierce Chemical Co., Rockford, Ill., pp. 11-12를 참조하라), 최근에는 시판되는 실험실 펩티드 디자인 및 합성 키트로 사용되고 있다(Cambridge Research Biochemicals). 이러한 시판중인 실험실 킷트는 [H. M. Geysen et al, Proc. Natl. Acad. Sci., USA, 81: 3998 (1984)]의 기술을 일반적으로 사용하며, 다수의 "로드" 또는 "핀"으로 펩티드를 합성하는 방법을 제공하며, 이들 모두는 단일 플레이트에연결된다. 이러한 시스템이 사용되는 경우, 로드 또는 핀의 플레이트는 인버팅되고, 핀 또는 로드의 팁에 적절한 아미노산을 부착 또는 앵커링시키는 용액을 함유하고 있는 대응되는 웰 또는 레저부아의 제2 플레이트로 전환된다. 이러한 과정들을 반복함으로써, 즉, 인버팅하고, 로드 및 핀의 팁을 적절한 용액으로 삽입함으로써, 아미노산은 소정의 펩티드가 된다. 덧붙여, 여러 이용 가능한 FMOC 펩티드 합성 시스템이 이용가능하다. 예컨대, 폴리펩티드 또는 단편의 어셈블리는 고체 지지체 상에서, Applied Biosystems, Inc. Model 431A™자동화된 펩티드 합성기를 사용하여 수행될 수 있다. 이러한 장비는 다른 공지된 기술을 사용하여 커플될 수 있는 일련의 단편들을 합성하거나 직접 합성함으로써, 본 발명의 펩티드에 대한 용이한 접근을 제공한다.
본 발명은 신호의 존재 또는 부존재하에 본 발명의 자일라나제를 포함한다. 본 발명의 신호 서열을 포함하는 폴리펩티드는 본 발명의 자일라나제 또는 다른 자일라나제 또는 다른 효소 또는 다른 폴리펩티드일 수 있다.
본 발명은 고정화된 자일라나제, 항-자일라나제 항체 및 이들의 단편을 포함한다. 본 발명은 예컨대, 본 발명의 우성 음성 돌연변이체 또는 항-자일라나제 항체를 사용하여, 자일라나제 활성을 저해하는 방법을 제공한다. 본 발명은 본 발명의 자일라나제를 포함하는 헤테로복합체, 예컨대, 융합 단백질, 헤테로다이머 등을 포함한다.
본 발명의 폴리펩티드는 다양한 조건하에, 예컨대, 극단적인 pH, 및/또는 온도, 산화제 등의 존재하에 자일라나제 활성을 가질 수 있다. 본 발명은 예컨대, 온도, 산화제 및 세척 조건의 변화에 대해 상이한 촉매적 효율 및 안정성을 갖는 변화된 자일라나제 제조를 초래하는 방법을 제공한다. 한 양태에서, 자일라나제 변이체는 사이트-다이렉티드 돌연변이 유발 및/또는 랜덤 돌연변이 유발의 기술을 사용하여, 유도될 수 있다. 한 양태에서, 직접적인 진화는 선택적인 특이성 및 안정성을 갖는 매우 다양한 자일라나제 변이체를 생성하는 데 사용될 수 있다.
본 발명의 단백질은 또한 자일라나제 조절자, 예컨대, 자일라나제 활성의 활성제 또는 저해제를 확인하는 데 탐구 시약으로서 유용할 수 있다. 간단하게, 시험 샘플(화합물, 배지, 추출물 등)을 자일라나제 분석에 첨가하여, 이들의 기질 절단을 저해하는 활성을 결정한다. 이와 같은 방식으로 확인된 저해제는 산업적으로 사용될 수 있으며, 바람직하지 않은 프로테올리스를 감소 또는 예방하는 데 연구되어 진다. 자일라나제와 같이, 저해제는 활성의 범위를 증가시키도록 조합될 수 있다.
본 발명의 효소는 또한 단백질을 분해하고 단백질 서열 분석에 이용되는 탐구 시약으로 유용할 수 있다. 예컨대, 자일라나제는 예컨대, 자동화된 서열 분석기를 사용한 서열 분석시, 서열 분석을 위한 더 작은 단편으로 폴리펩티드를 잘라주는 데 사용될 수 있다.
본 발명은 또한 본 발명의 핵산, 폴리펩티드 및 항체를 사용하여 새로운 자일라나제를 발견하는 방법을 제공한다. 한 양태에서, 파아지미드 라이브러리는 자일라나제의 발현에 기초한 발견을 위해 스크리닝된다. 다른 양태에서, 람다 파아지 라이브러리는 자일라나제의 발현에 기초한 발견을 위해 스크리닝된다. 파아지 또는 파아지미드 라이브러리의 스크리닝은 독성 유전자의 검출, 기질에 대한 개선된 접근성; 라이브러리의 매스 절단으로 초래되는 어떠한 바이어스의 잠재성을 통과시킴으로써, 필요한 숙주 조작의 감소; 및 낮은 클론 밀도에서 빠른 성장을 가능케 할 수 있다. 파아지 또는 파아지미드 라이브러리의 스크리닝은 액체 상태 또는 고체 상태에서 일어날 수 있다. 한 양태에서, 본 발명은 액체 상태에서의 스크리닝을 제공한다. 이는 고체 상태의 스크리닝 보다, 분석 조건; 추가적인 기질 유연성; 약한 클론에 대해 더 높은 선택성; 및 자동화의 용이함에서 더욱 유동적이다.
본 발명은 본 발명의 단백질 및 핵산을 사용하여, 높은 수치의 정확성 및 재현성은 물론, 짧은 시간에 걸쳐(예, 하루당) 수천개의 생촉매적 반응 및 스크리닝 분석을 평가할 수 있는 로보트화된 자동화된 스크리닝 방법을 제공한다(이하, 어레이에 대한 서술을 참고). 결과적으로, 유도체 화합물의 라이브러리는 몇 주일만에 생산될 수 있다. 소분자를 포함한 분자들의 개질에 대해 보다 자세히는 PCT/US94/09174를 참조하라.
본 발명의 다른 양태는 군 A 핵산 서열 및 이와 실질적으로 동일한 서열 중 하나의 서열을 포함하는 분리된거나 정제된 폴리펩티드, 또는 이들의 적어도 약 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속적 아미노산을 포함하는 분리된거나 정제된 단편이다. 전술된 바와 같이, 이러한 폴리펩티드는 벡터에 폴리펩티드를 코딩하는 핵산을 삽입함으로써 얻어지며, 이 때, 코딩 서열이 적절한 숙주 세포에서 코딩된 폴리펩티드의 발현을 유도할 수 있는 서열에 작동적으로 연결된다. 예컨대, 발현 벡터는 프로모터, 번역 개시를 위한 리보좀 결합 부위, 및 전사 종결자를 포함할 수 있다. 벡터는 또한 발현을 증폭시키는 적절한 서열을 포함할 수 있다.
본 발명의 다른 양태는 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 이들의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속적 아미노산을 포함하는 단편 중 적어도 하나에 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 또는 약 95% 이상의 상동성을 갖는 폴리펩티드 또는 단편이다. 상동성은 폴리펩티드 또는 단편을 정렬하여, 이들을 서로 비교하고 아미노산 동일성 또는 유사성의 정도를 결정하는 전술된 어떠한 프로그램을 사용하여 결정될 수 있다. 아미노산 "상동성"은 전술된 것들과 같은 보존적 아미노산 대체를 포함한다는 것은 이해될 것이다.
B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 이들의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속적 아미노산을 포함하는 단편 중 적어도 하나에 상동성을 갖는 폴리펩티드 또는 단편은 전술된 기술을 사용하여 이들을 코딩하는 핵산을 분리함으로써 얻어질 수 있다.
선택적으로, 상동적인 폴리펩티드 또는 단편은 생화학적 농축 또는 정제 과정을 통해 얻어질 수도 있다. 잠재적으로 상동적인 폴리펩티드 또는 단편의 서열은 자일란 히드롤라제 분해, 겔 전기영동 및/또는 마이크로 서열 분석에 의해 결정될 수 있다. 예기되는 상동적인 폴리펩티드 또는 단편의 서열은 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 이들의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속적 아미노산을 포함하는 단편중 하나와 비교될 수 있다.
본 발명의 다른 양태는 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 효소적 기능을 보유하고 있는, B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 단편 및 변형체를 확인하는 분석법이다. 예컨대, 상기 폴리펩티드의 단편 또는 변형체는 생화학적 반응을 촉매화하는 데 사용될 수 있으며, 이는 단편 및 변형체가 B 군 아미노산 서열의 폴리펩티드의 효소적 활성을 보유함을 의미한다.
변형체의 단편이 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드의 효소적 활성을 보유하는지 여부를 결정하는 분석법은 하기의 단계를 포함한다: 폴리펩티드 단편 또는 변형체가 기능할 수 있는 조건에서 폴리펩티드 단편 또는 변형체를 기질 분자와 접촉시키는 단계, 및 기질의 수치의 감소 또는 폴리펩티드와 서열간의 반응에 의한 특이적 반응 산물의 수치의 증가를 검출하는 단계.
B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 이들의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속적 아미노산을 포함하는 단편은 다양한 적용에 사용될 수 있다. 예컨대, 폴리펩티드 및 이들의 단편은 생화학적 반응을 촉매화하는 데 사용될 수 있다. 본 발명의 한 양태에 따라, B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 글리코시딕 결합을 가수분해하기 위해 이러한 폴리펩티드를 코딩하는 폴리뉴클레오티드를 사용하는 방법이 제공된다. 이러한 과정에서, 글리코시딕 결합을 함유하는 물질(예, 전분)은 글리코시딕 결합의 가수분해를 용이하게 하는 조건하에서, B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드 중 하나와접촉한다.
본 발명은 효소의 유일한 촉매적 성질을 사용한다. 화학적 변형시 생촉매의 사용(즉, 정제된 또는 원 효소, 죽어있는 또는 살아있는 세포)은 특정 개시 화합물과 반응하는 특정 생촉매의 확인을 요구하는 반면, 본 발명은 소분자와 같은 여러 개시 화합물에 존재하는 작용기에 특이적인 반응 촉매 및 선택적인 생촉매를 사용한다. 각각의 생촉매는 하나의 작용기 또는 여러 관련된 작용기에 특이적이며, 작용기를 함유하는 여러 개시 화합물들과 반응할 수 있다.
생촉매 반응는 단일 개시 화합물 유래의 유도체 집단을 생성한다. 이들 유도체들은 다른 라운드의 생촉매 반응을 겪어 유도체 화합물의 제2 집단을 생성한다. 오리지날 소분자 또는 화합물의 수천개의 변형체들은 생촉매성 유도체화의 각각의 반복에 의해 생성될 수 있다.
효소들은 나머지 분자들에 영향을 주지 않으면서 개시 화합물의 특정 부위에서 반응하며, 이 과정은 전통적인 화학적 방법을 사용하여 성취하기에는 매우 어렵다. 이러한 생촉매성 특이성의 높은 정도는 라이브러리 이내에서 단일 활성 화합물을 확인하는 수단을 제공한다. 라이브러리는 소위 "생합성 히스토리"로 불리우는 이를 생산하는 데 사용되는 일련의 생촉매성 반응에 의해 특징지워 진다. 생물학적 활성에 대해 라이브러리를 스크리닝하는 것 및 생합성 히스토리를 트레이싱하는 것은 활성 화합물을 생성하는 특이적 반응 서열을 확인하는 것이다. 반응 서열은 반복되며, 합성된 화합물의 구조는 결정된다. 이 확인 양식은 다른 합성 및 스크리닝 접근법과 달리, 고정화 기술을 요구하지 않으며, 화합물은 실질적으로 어떠한 유형의 스크리닝 분석법을 사용하여, 용액이 아닌 곳에서도 합성 및 시험될 수 있다. 작용기에 대한 효소 반응의 고도의 특이성은 생촉매적으로 생산된 라이브러리를 구성하는 특이적 효소 반응의 "트랙킹"을 가능케 함을 주의해야 한다.
여러 과정적 단계들은 높은 수치의 정확성 및 재현성은 물론, 하루당 수천개의 생촉매적 반응 및 스크리닝 분석을 평가할 수 있는 로보트화된 자동화에 의해 수행된다. 이 결과로서, 유도체 화합물의 라이브러리는 현재 화학적 방법 사용시 수년이 걸리던 것을 수 주일만에 생성할 수 있다.
특정 양태에서, 본 발명은 본 명세서에서 서술된 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드 또는 효소적으로 활성 있는 이들의 단편을 소분자와 접촉하여 개질된 소분자를 생성하는 단계를 포함하는 소분자의 개질 방법을 제공한다. 개질된 소분자의 라이브러리는 개질된 소분자가 소정의 활성을 나타내는 라이브러리 이내에 존재하는지 여부가 시험된다. 소정의 활성을 갖는 개질된 소분자를 생성하는 특이적 생촉매성 반응은 라이브러리의 일부분을 제조하는 데 사용되는 각각의 생촉매성 반응을 제거한 후, 소정의 활성을 갖는 개질된 소분자의 존재 또는 부재하에 라이브러리의 일부분을 제조하는 데 사용된 소분자를 시험함으로써 확인된다. 소정의 활성을 갖는 개질된 소분자를 생성하는 특이적 생촉매성 반응은 임의적으로 반복된다. 생촉매성 반응은 소분자의 구조 이내에서 발견되는 구별되는 구조적 부분과 반응하는 한 군의 생촉매와 수행되며, 각각의 생촉매는 하나의 구조적 부분 또는 한 군의 관련된 구조적 부분에 특이적이고, 각각의 생촉매는 별개의 구조적 부분을 함유하는 여러 상이한 소분자들과 반응한다.
자일라나제 신호 서열, 프리프로 및 촉매 도메인
본 발명은 자일라나제 신호 서열(예, 신호 펩티드(SP)), 프리프로 도메인 및 촉매 도메인(CD)을 제공한다. 본 발명의 SP, 프리프로 도메인 및/또는 CD는 분리되며, 재조합 펩티드는 예컨대, 키메릭 단백질의 이질적 도메인으로서 융합 단백질의 일부일 수 있다. 본 발명은 촉매 도메인(CD), 프리프로 도메인 및 신호 서열(SP, 예, 본 발명의 폴리펩티드의 아미노 말단 잔기를 포함하는/구성되는 서열을 갖는 펩티드)을 코딩하는 핵산을 제공한다. 한 양태에서, 본 발명은 잔기 1 내지 15, 1 내지 16, 1 내지 17, 1 내지 18, 1 내지 19,1 내지 20, 1 내지 21, 1 내지 22, 1 내지 23, 1 내지 24, 1 내지 25, 1 내지 26, 1 내지 27, 1 내지 28, 1 내지 28, 1 내지 30, 1 내지 31, 1 내지 32, 1 내지 33, 1 내지 34, 1 내지 35, 1 내지 36, 1 내지 37, 1 내지 38, 1 내지 39, 1 내지 40, 1 내지 41, 1 내지 42, 1 내지 43, 1 내지 44의 본 발명의 폴리펩티드로 서술되는 서열을 포함하는/구성되는 펩티드를 포함하는 신호 서열을 제공한다.
한 양태에서, 본 발명은 이하 표 4에 나타낸 서열을 포함하는/구성되는 펩티드를 포함하는 신호 서열을 제공한다. 예컨대, 표 4에서, 본 발명은 서열 번호 102(서열 번호 101에 의해 코딩됨)의 1 내지 23 잔기를 포함하는/구성되는 신호 서열, 서열 번호 104(서열 번호 103에 의해 코딩됨)의 1 내지 41 잔기를 포함하는/구성되는 신호 서열, 등을 제공한다.
표 4: 본 발명의 대표적인 신호 서열
신호 서열 번호; 신호 서열(아미노산 위치)
101, 102 1-23
103, 104 1-41
105, 106 1-22
109, 110 1-26
11, 12 1-28
113, 114 1-28
119, 120 1-33
121, 122 1-20
123, 124 1-20
131, 132 1-26
135, 136 1-25
139, 140 1-24
141, 142 1-25
143, 144 1-32
147, 148 1-28
149, 150 1-18
15, 16 1-20
151, 152 1-21
153, 154 1-16
155, 156 1-21
157, 158 1-29
159, 160 1-23
161, 162 1-32
163, 164 1-26
165, 166 1-23
167, 168 1-36
169, 170 1-24
17, 18 1-31
171, 172 1-29
173, 174 1-22
175, 176 1-27
177, 178 1-26
179, 180 1-19
181, 182 1-25
183, 184 1-32
185, 186 1-27
187, 188 1-28
19, 20 1-29
191, 192 1-27
193, 194 1-21
195, 196 1-23
197, 198 1-28
199, 200 1-30
203, 204 1-30
205, 206 1-29
207, 208 1-27
209, 210 1-25
21, 22 1-28
211, 212 1-29
215, 216 1-31
217, 218 1-29
219, 220 1-23
221, 222 1-24
223, 224 1-28
225, 226 1-25
227, 228 1-39
229, 230 1-28
23, 24 1-29
231, 232 1-41
233, 234 1-26
235, 236 1-28
237, 238 1-32
239, 240 1-30
241, 242 1-28
243, 244 1-33
245, 246 1-32
249, 250 1-33
253, 254 1-24
255, 256 1-51
259, 260 1-24
261, 262 1-26
263, 264 1-29
267, 268 1-30
27, 28 1-27
271, 272 1-22
273, 274 1-74
277, 278 1-19
279, 280 1-22
283, 284 1-28
287, 288 1-23
289, 290 1-22
295, 296 1-26
299, 300 1-24
301, 302 1-28
303, 304 1-74
305, 306 1-32
309, 310 1-20
311, 312 1-33
313, 314 1-22
315, 316 1-28
319, 320 1-27
325, 326 1-27
327, 328 1-29
329, 330 1-35
33, 34 1-23
331, 332 1-28
333, 334 1-30
335, 336 1-50
339, 340 1-23
341, 342 1-45
347, 348 1-20
349, 350 1-20
351, 352 1-73
353, 354 1-18
355, 356 1-21
357, 358 1-25
359, 360 1-31
361, 362 1-26
365, 366 1-65
367, 368 1-23
369, 370 1-27
39, 40 1-24
41, 42 1-37
45, 46 1-25
47, 48 1-26
5, 6 1-47
51, 52 1-30
53, 54 1-37
55, 56 1-24
57, 58 1-22
59, 60 1-21
63, 64 1-20
65, 66 1-22
67, 68 1-28
69, 70 1-25
7, 8 1-57
73, 74 1-21
75, 76 1-22
77, 78 1-27
79, 80 1-36
83, 84 1-30
87, 88 1-29
89, 90 1-40
9, 10 1-36
95, 96 1-24
99, 100 1-33
본 발명의 자일라나제 신호 서열(SP) 및/또는 프리프로 서열은 예컨대, 융합(키메릭) 단백질로서, 다른 자일라나제 또는 비자일라나제 폴리펩티드에 인접한 서열 또는 분리된 펩티드일 수 있다. 한 양태에서, 본 발명은 본 발명의 자일라나제 신호 서열을 포함하는 폴리펩티드를 제공한다. 한 양태에서, 본 발명의 자일라나제신호 서열 SP 및/또는 프리프로를 포함하는 폴리펩티드는 본 발명의 자일라나제에 이질적인 서열을 포함한다(예, 본 발명의 SP 및/또는 프리프로, 및 다른 자일라나제 또는 비자일라나제 단백질의 서열을 포함하는 융합 단백질). 한 양태에서, 본 발명은 이질적인 SP 및/또는 프리프로 서열, 예컨대, 효모 신호 서열과 함께 본 발명의 자일라나제를 제공한다. 본 발명의 자일라나제는 벡터에서, 예컨대, pPIC 시리즈 벡터(Invitrogen, Carlsbad, CA)에서 이질적 SP 및/또는 프리프로를 포함할 수 있다.
한 양태에서, 본 발명의 SP 및/또는 프리프로 서열은 이하 신규한 자일라나제 폴리펩티드를 확인하기 위해 사용된다. 단백질이 분류되고 이들의 적절한 위치로 이동되는 경로를 종종 단백질 표적화 경로로 언급된다. 이들 표적화 시스템의 모두에서 가장 중요한 요소들 중 하나는 신호 서열이라고 불리우는 새로 합성된 폴리펩티드의 아미노 말단의 짧은 아미노산 서열이다. 이 신호 서열은 단백질이 세포 내에서 적절한 위치로 이동되도록 하고, 이의 최종 목적지에 도달한 경우 또는는 전송 과정 중에 제거된다. 대부분의 라이소조말, 멤브레인 또는 분비 단백질은 소포체의 루멘으로 위치시켜주는 아미노 말단 신호 서열을 가진다. 이 군의 단백질의 100개 이상의 신호 서열이 결정되었다. 신호 서열은 13 내지 36개의 아미노산 잔기의 길이로 다양할 수 있다. 신호 서열의 다양한 인식 방법은 본 기술 분야의 당업자에게 공지되어 있다. 예컨대, 한 양태에서, 신규한 자일라나제 신호 펩티드는 SignalP라고 언급되는 방법에 의해 확인된다. SignalP는 신호 펩티드 및 이들의 절단 부위 모두를 인식하는 조합된 신경 네트워크를 사용한다(Nielsen, et al.,"Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites. "Protein Engineering, vol. 10, no. 1, p. 1-6 (1997)).
본 발명의 일부 양태의 자일라나제는 SP 및/또는 프리프로 서열, 또는 "도메인"을 갖지 않을 것이라는 것을 이해해야만 한다. 한 양태에서, 본 발명은 SP 및/또는 프리프로 도메인의 전부 또는 일부를 결여한 본 발명의 자일라나제를 제공한다. 한 양태에서, 본 발명은 상이한 자일라나제의 핵산 서열에 작동적으로 결합된 하나의 자일라나제 유래의 신호 서열(SP) 및/또는 프리프로, 또는, 임의적으로, 바람직할 수 있는 비자일라나제 단백질 유래의 신호 서열(SP) 및/또는 프리프로를 코딩하는 핵산 서열을 제공한다.
본 발명은 또한 본 발명의 신호 서열(SP), 프리프로 도메인 및/또는 촉매 도메인(CD) 및 이질적 서열을 포함하는 분리된 또는 재조합된 폴리펩티드를 제공한다. 이질적 서열은 SP, 프리프로 도메인 및/또는 CD와 천연적으로 연관되지 않는 서열이다(예, 자일라나제에 대해). SP, 프리프로 도메인 및/또는 CD가 천연적으로 연관되지 않는 서열은 SP, 프리프로 도메인 및/또는 CD의 아미노산 말단, 카르복시 말단 및/또는 SP 및/또는 CD의 양쪽 말단에 위치할 수 있다. 한 양태에서, 본 발명은 그것이 (예컨대, 자일라나제에 대해) 천연적으로 연관되지 않은 어떠한 서열과 연관되지 않는다는 가정하에, 본 발명의 신호 서열(SP), 프리프로 도메인 및/또는 촉매 도메인(CD)을 포함하는 폴리펩티드를 포함하는(또는 구성되는) 분리된 또는 재조합된 폴리펩티드를 제공한다. 유사하게, 한 양태에서, 본 발명은 이들 폴리펩티드를 코딩하는 분리된 또는 재조합된 핵산을 제공한다. 따라서, 한 양태에서, 본 발명의 분리된 또는 재조합된 핵산은 본 발명의 신호 서열(SP), 프리프로 도메인 및/또는 촉매 도메인(CD), 및 이질적 서열(즉, 본 발명의 신호 서열(SP), 프리프로 도메인 및/또는 촉매 도메인(CD)과 천연적으로 연관되지 않은 서열)에 대한 코딩 서열을 포함한다. 이질적 서열은 3' 말단, 5' 말단, 및/또는 SP, 프리프로 도메인 및/또는 CD 코딩 서열의 양쪽 말단에 위치한다.
하이브리드(키메릭) 자일라나제 및 펩티드 라이브러리
한 양태에서, 본 발명은 본 발명의 서열을 포함하는 펩티드 라이브러리를 포함한 하이브리드 자일라나제 및 융합 단백질을 제공한다. 본 발명의 펩티드 라이브러리는 자일라나제 기질, 수용체, 효소와 같은 표적의 펩티드 조절자(예, 활성제 또는 저해제)를 분리하기 위해 사용될 수 있다. 본 발명의 펩티드 라이브러리는 리간드, 예컨대, 사이토카인, 호르몬 등과 같은 표적의 정식적 결합 파트너를 확인하는 데 사용될 수 있다. 한 양태에서, 본 발명은 본 발명의 신호 서열(SP), 프리프로 도메인 및/또는 촉매 도메인(CD), 또는 이들의 조합, 및 또는 이질적인 서열(상기 참조)을 포함하는 키메릭 단백질을 제공한다.
한 양태에서, 본 발명의 융합 단백질(예, 펩티드 부분)은 표적에 대한 높은 결합 친화도를 제공하도록 구조적으로 안정하다(선형 펩티드에 비하여). 본 발명은 본 발명의 자일라나제 및 공지된 및 랜덤 펩티드를 포함하는 기타 펩티드의 융합을 제공한다. 이들은 자일라나제의 기질이 현저하게 교란되지 않아, 펩티드가 대사적으로 또는 구조적으로 안정화되는 방식으로 융합될 수 있다. 이는 세포내에서 이의존재 및 이의 정량 모두를 쉽게 모니터링하는 펩티드 라이브러리의 생성을 가능케 한다.
본 발명의 아미노산 서열 변형체는 변형체의 예측되는 성질(자일라나제 서열의 대립형질 또는 종간 변형체와 같은 천연적으로 발생하는 형태로 상이하게 서술되는 특징)에 의해 특징화될 수 있다. 한 양태에서, 본 발명의 변형체는 천연적으로 발생하는 유사체와 동일한 정량적인 생물학적 활성을 나타낸다. 선택적으로, 변형체는 개질된 특징을 갖도록 선별될 수 있다. 한 양태에서, 아미노산 변형체가 도입된 부위 또는 위치가 미리 예측되는 반면, 요구되는 돌연변이는 예측될 수 없다. 예컨대, 주어진 위치에서의 돌연변이 수행을 최적화하기 위해, 랜던 돌연변이 유발이 표적 코돈 또는 그 부위에서 수행될 수 있으며, 발현된 자일라나제 변형체는 소정의 활성의 최적 조합에 대해 스크리닝된다. 알려진 서열을 갖는 DNA에서 예측된 부위를 돌연변이로 대체시키는 기술은 본 명세서에 서술한 바와 같이, 잘 알려져 있다(예컨대, M13 프라이머 돌연변이 유발 및 PCR 돌연변이 유발). 돌연변이체의 스크리닝은 예컨대, 자일라나제 가수분해 분석법을 사용하여 수행될 수 있다. 선택적 양태에서, 아미노산 치환은 단일 잔기에 일어날 수 있다; 상당히 더 큰 삽입이 행해질 수 있음에도 불구하고, 삽입은 1 내지 20개의 아미노산에서 일어날 수 있다. 결실은 약 1 내지 약 20, 30, 40, 50, 60, 70 잔기 또는 그 이상일 수 있다. 최적의 성질을 갖는 최종 유도체를 얻기 위해서, 치환, 결실, 삽입 또는 이들의 어떠한 조합이 사용될 수 있다. 일반적으로, 이들 변화들은 분자의 변화를 최소화하기 위해 몇개의 아미노산에서만 행해진다.
본 발명은 폴리펩티드 백본의 구조, 2차 또는 3차 구조, 예컨대, 알파-헬리칼 또는 베타-쉬트 구조가 개질된 자일라나제를 제공한다. 한 양태에서, 전하 또는 소수성이 개질된다. 한 양태에서, 측면 사슬의 벌크가 개질되었다. 기능이나 면역학적 동일성의 실질적 변화가 더욱 두드러진 효과를 만들 수 있다: 변화부에서 폴리펩티드 백본의 구조, 예컨대, 알파-헬리칼 또는 베타-쉬트 구조; 활성 부위에 존재할 수 있는 분자의 전하 또는 소수성 부위; 또는 측면 사슬. 본 발명은 (a) 친수성 잔기, 예컨대, 세릴 또는 트레오닐이 소수성 잔기, 예컨대, 루실, 이소루실, 페닐알라닐, 발릴 또는 알라닐로(또는 이에 의해) 치환되거나; (b) 시스테인 또는 프롤린이 다른 어떠한 잔기들로(또는 이에 의해) 치환되거나; (c) 전기양성 측면 사슬을 갖는 잔기, 예컨대, 라이실, 아르기닐 또는 히스티딜이 전기음성 잔기, 예컨대, 글루타밀 또는 아스파틸로(또는 이에 의해) 치환되거나; 또는 (d) 벌키 측면 사슬을 갖는 잔기, 예컨대, 페닐알라닌이 측면 사슬을 갖지 않는 잔기, 예컨대, 글라이신으로(또는 이에 의해) 치환되는 본 발명의 폴리펩티드의 치환을 제공한다. 변형체가 사용된 자일라나제의 특징을 개질하도록 선택될 수 있음에도 불구하고, 변형체는 동일한 정량적 생물학적 활성(즉, 자일라나제 활성)을 나타낼 수 있다.
한 양태에서, 본 발명의 자일라나제는 에피토프, 또는 정제 태그, 신호 서열 또는 기타 융합 서열 등을 포함한다. 한 양태에서, 본 발명의 자일라나제는 랜덤 펩티드와 융합되어, 융합 폴리펩티드를 형성할 수 있다. 본 명세서에서 "융합된" 또는 "작동적으로 연결된"은 자일라나제 활성을 보유하도록 자일라나제 구조의 안정성의 파괴를 최소화하는 방식으로, 랜덤 펩티드 및 자일라나제가 서로 연결되어있음을 의미한다. 융합 단백질(또는 융합 폴리펩티드를 코딩하는 융합 폴리뉴클레오티드)은 다중 루프에서 다중 펩티드를 포함하여 추가적 성분들을 포함할 수 있다.
한 양태에서, 펩티드 및 이들을 코딩하는 핵산은 완전히 램덤화 또는 이들의 랜더화시 바이어스되어, 예컨대, 일반적으로 위치당 핵산/잔기 빈도로 램덤화될 수 있다. "랜덤화된"은 각각의 핵산 및 펩티드가 랜덤 뉴클레오티드 및 아미노산으로 각각 필수적으로 구성됨을 의미한다. 한 양태에서, 펩티드를 초래하는 핵산은 화학적으로 합성되며, 따라서 어떠한 뉴클레오티드로 어떠한 위치에 통합될 수 있다. 따라서, 핵산이 발현되어 펩티드를 형성하는 경우, 어떠한 아미노산 잔기는 어떠한 위치에 통합될 수 있다. 합성 과정은 핵산을 랜덤화하도록 디자인될 수 있으며, 이는 핵산의 전체 길이에 걸쳐 가능한 조합의 모두 또는 대부분을 형성하게 하며, 랜덤화된 핵산의 라이브러리를 형성한다. 라이브러리는 랜덤화된 발현 산물의 충분히 구조적으로 다양한 집단을 제공하여, 세포의 반응에 가능성있는 충분한 범위로 영향을 주며, 소정의 반응을 나타내는 하나 이상의 세포를 제공한다. 따라서, 본 발명은 이의 적어도 하나의 멤버가 일부 분자, 단백질 또는 기타 인자에 친화도를 부여하는 구조를 가지도록 충분히 큰 상호작용 라이브러리를 제공한다.
자일라나제는 임의적으로 신호 펩티드, 탄수화물 결합 모듈, 자일라나제 활성 도메인, 링커 및/또는 기타 촉매 도메인으로 구성되는 다중도메인 효소이다.
본 발명은 생물학적으로 활성 있는 하이브리드 폴리펩티드(예, 하이브리드 자일라나제)를 코딩할 수 있는 키메릭 폴리펩티드를 생성하는 수단을 제공한다. 한양태에서, 오리지날 폴리뉴클레오티드는 생물학적으로 활성 있는 폴리펩티드를 코딩한다. 본 발명의 방법은 오리지날 폴리펩티드의 서열에 삽입되는 세포 과정을 사용하여 새로운 하이브리드 폴리펩티드를 생산하며, 결과적인 하이브리드 폴리뉴클레오티드는 오리지날 생물학적으로 활성 있는 폴리펩티드로부터 유래된 활성을 나타내는 폴리펩티드를 코딩한다. 예컨대, 오리지날 폴리뉴클레오티드는 상이한 미생물에서 특정 효소를 코딩할 수 있다. 한 개체 또는 변이체 유래의 제1 폴리뉴클레오티드에 의해 코딩되는 효소는 예컨대, 특정 환경 조건하에서, 예컨대, 고 염도 조건하에서 효과적으로 작용할 수 있다. 상이한 개체 또는 변이체 유래의 제2 폴리뉴클레오티드에 의해 코딩되는 효소는 상이한 환경 조건 하에서, 예컨대, 극단적으로 높은 온도에서 효과적으로 작용할 수 있다. 제1 및 제2 오리지날 폴리뉴클레오티드 유래의 서열을 함유하는 하이브리드 폴리뉴클레오티드는 오리지날 폴리펩티드에 의해 코딩되는 양 효소의 특징을 나타내는 효소를 코딩할 수 있다. 따라서, 하이브리드 폴리뉴클레오티드에 의해 코딩되는 효소는 제1 및 제2 폴리뉴클레오티드에 의해 코딩되는 효소들 각각에 의해 공여되는 환경 조건 하에서, 예컨대, 고 염도 및 극단적인 온도에서 효과적으로 작용할 수 있다.
본 발명의 폴리뉴클레오티드에 의해 코딩되는 효소는 자일라나제와 같은 히드롤라제를 포함하나, 이로 제한되지 않는다. 글리코시다제 히드롤라제는 1991년에 처음으로 패밀리로 분류되었다. 예컨대, [Henrissat (1991) Biochem. J. 280: 309-316]를 참조하라. 이 이후로, 분류는 연속적으로 업데이트되어 왔다. 예컨대, [Henrissat (1993) Biochem. J. 293: 781-788; Henrissat (1996) Biochem. J. 316:695-696; Henrissat (2000) Plant Physiology 124: 1515-1519]를 참조하라. 글리코시다제 히드롤라제에는 87가지의 확인된 패밀리가 존재한다. 한 양태에서, 본 발명의 자일라나제는 패밀리 8, 10, 11, 26 및 30으로 분류될 수 있다. 한 양태에서, 본 발명은 또한 통상적인 패밀리, 예컨대, 표 5에 서술된 패밀리 5, 6, 8, 10, 11, 26 또는 30에서 유래된 통상의 신규성을 갖는 자일라나제-코딩 핵산을 제공한다.
표 5
서열 확인 번호 패밀리
9, 10 8
1, 2 8
5, 6 8
7, 8 8
99, 100 10
11, 12 10
127, 128 10
27, 28 10
97, 98 10
45, 46 10
141, 142 10
107, 108 10
129, 130 10
93, 94 10
63, 64 10
25, 26 10
49, 50 10
67, 68 10
85, 86 10
29, 30 10
51, 52 10
35, 36 10
147, 148 10
119, 120 10
123, 124 10
249, 250 10
149, 150 10
83, 84 10
43, 44 10
133, 134 10
113, 114 10
105, 106 10
75, 76 10
111, 112 10
117, 118 10
115, 116 10
125, 126 10
137, 138 10
135, 136 10
69, 70 10
89, 90 10
31, 32 10
13, 14 10
65, 66 10
57, 58 10
77, 78 10
73, 74 10
109, 110 10
59, 60 10
71, 72 10
139, 140 10
55, 56 10
15, 16 10
131,132 10
95, 96 10
101, 102 10
39, 40 10
143, 144 10
103, 104 10
17, 18 10
53, 54 10
21, 22 10
151, 152 10
23, 24 10
121, 122 10
41, 42 10
47, 48 10
247, 248 10
33, 34 10
19, 20 10
87, 88 10
81, 82 10
91, 92 10
61, 62 10
37, 38 10
79, 80 10
231, 232 11
157, 158 11
189, 190 11
167, 168 11
207, 208 11
251, 252 11
213, 214 11
177, 178 11
187, 188 11
205, 206 11
211, 212 11
197, 198 11
209, 210 11
185, 186 11
229, 230 11
223, 224 11
179, 180 11
193, 194 11
173, 174 11
217, 218 11
153, 154 11
219, 220 11
183, 184 11
253, 254 11
199, 200 11
255, 256 11
155, 156 11
169, 170 11
195,196 11
215, 216 11
191, 192 11
175, 176 11
161, 162 11
221, 222 11
225, 226 11
163, 164 11
159, 160 11
233, 234 11
171, 172 11
203, 204 11
181, 182 11
227, 228 11
165, 166 11
257, 258 26
237, 238 30
241, 242 30
239, 240 30
245, 246 30
235, 236 30
313, 314 30
345, 346 10
321, 322 10
323, 324 10
315, 316 10
201, 202 10
265, 266 10
145, 146 10
287, 288 10
293, 294 10
351, 352 10
311, 312 10
279, 280 10
289, 290 10
283, 284 10
373, 374 10
337, 338 10
371, 372 10
291, 292 10
3, 4 10
307, 308 10
343, 344 10
349, 350 10
329, 330 10
355, 356 10
339, 340 10
295, 296 10
333, 334 10
281, 282 10
361, 362 10
347, 348 10
319, 320 10
357, 358 10
365, 366 10
273, 274 10
277, 278 10
271, 272 10
285, 286 10
259, 260 10
325, 326 10
331, 332 10
359, 360 10
303, 304 10
363, 364 10
305, 306 10
341, 342 10
375, 376 11
377, 378 11
379, 380 11
301, 302 11
309, 310 11
263, 264 11
269, 270 11
353, 354 11
299, 300 11
367, 368 11
261, 262 11
369, 370 11
267, 268 11
317, 318 11
297, 298 11
327, 328 5
275, 276 6
본 발명의 방법에 의해 초래된 하이브리드 폴리펩티드는 오리지날 효소에서는 나타나지 않던 특정화된 효소 활성을 보일 수 있다. 예컨대, 히드롤라제 활성을 코딩하는 폴리펩티드의 이하 재조합 및/또는 감소된 재분류는 결과적인 하이브리드 폴리뉴클레오티드에 의해 코딩되는 하이브리드 폴리펩티드가 오리지날 효소의 각각에서 얻어진 특정화된 히드롤라제 활성, 즉, 히드롤라제가 작용하는 결합의 유형및 히드롤라제가 작용하는 온도에 대해 스크리닝될 수 있다. 따라서, 예컨대, 히드롤라제는 오리지날 히드롤라제에서 하이브리드 히드롤라제를 구별하는 화학적 작용성, 예컨대, (a) 아미드(펩티드 결합), 즉, 자일라나제; (b) 에스터 결합, 즉, 에스터라제 및 리파아제; (c) 아세탈, 즉, 글리코시다제, 및 예컨대, 하이브리드 폴리펩티드가 작용하는 온도, pH 또는 염 농도을 확인하기 위해 스크리닝될 수 있다.
오리지날 폴리뉴클레오티드원은 개별적인 개체("분리체", 정의된 배지에서 성장하는 개체들의 집합체("강화 배양") 또는 배양되지 않은 개체("환경적 샘플")에서 분리될 수 있다. 환경 샘플에서 신규한 생활성을 코딩하는 폴리뉴클레오티드를 유도하는 배양-비의존적 접근법의 사용은 생체다양성을 갖는 자원들의 확인이 가능하므로 가장 바람직하다.
"환경적 라이브러리"는 환경적 샘플에서 발생되며, 적절한 원핵세포 숙주에서 증식될 수 있는 클로닝 벡터에서 얻어지는 천연적으로 발생하는 개체의 집합적 게놈을 대표한다. 클로닝된 DNA가 환경 샘플로부터 직접 초기에 추출되므로, 라이브러리는 순수 배양시 성장할 수 있는 원핵 세포의 적은 분획으로 제한되지 않는다. 부가적으로, 이들 샘플들에 존재하는 환경적 DNA의 정규화는 오리지날 샘플에 존재하는 모든 종들의 DNA의 더욱 동일한 대표를 가능케 한다. 이는 우성 종에 비해 여러 등급만큼 큰 대표될 수 있는 샘플의 소수 구성 유래의 흥미있는 유전자를 발견하는 효율을 극적으로 증가시킬 수 있다.
예컨대, 하나 이상의 배양되지 않은 미생물에서 발생된 유전자 라이브러리는 흥미있는 활성에 대해 스크리닝된다. 흥미있는 생활성 분자를 코딩하는 잠재적인경로는 유전자 발현 라이브러리의 형태로 원핵 세포내에서 먼저 캡쳐된다. 흥미있는 활성을 코딩하는 폴리뉴클레오티드는 이러한 라이브러리에서 분리되어, 숙주 세포로 도입된다. 숙주 세포는 재조합 및/또는 감소된 재분류를 촉진하여 신규하거나 강화된 활성을 갖는 잠재적으로 활성 있는 생체분자를 생성하는 조건 하에서 배양된다.
부가적으로, 서브클로닝은 흥미있는 서열의 추가적 분리를 위해 수행될 수 있다. 서브클로닝시, 일부분의 DNA는 증폭, 일반적으로 제한 효소에 의해 분해되어 소정의 서열을 절단하며, 소정의 서열은 수용 벡터에 결찰되어 증폭된다. 서브클로닝시 각각의 단계에서, 일부분은 구조적 단백질을 코딩하는 DNA가 배제되지 않았는지를 확인하기 위해, 흥미있는 활성에 대해 조사된다. 결찰부는 서브클로닝의 각 단계마다, 예컨대, 겔 전기영동에 의해 벡터로 결찰되기 이전에 정제될 수 있으며, 수용 벡터를 함유하는 세포 및 수용 벡터를 함유하지 않은 세포는 예컨대, 수용 벡터를 함유하지 않는 세포를 죽이는 항생제를 함유하는 선택적 배지에 둔다. cDNA 결찰부를 벡터에 서브클로닝하는 방법은 본 기술 분야에 잘 알려져 있다(Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press (1989)). 다른 양태에서, 본 발명의 효소는 서브클론이다. 이러한 서브클론은 예컨대, 길이, 돌연변이, 태그 또는 표지에 있어 모 클론과 상이할 수 있다.
한 양태에서, 본 발명의 신호 서열은 이하 신규한 자일라나제 폴리펩티드를 확인하기 위해 사용된다. 단백질이 분류되고 이들의 적절한 위치로 이동되는 경로를 종종 단백질 표적화 경로로 언급된다. 이들 표적화 시스템의 모두에서 가장 중요한 요소들 중 하나는 신호 서열이라고 불리우는 새로 합성된 폴리펩티드의 아미노 말단의 짧은 아미노산 서열이다. 이 신호 서열은 단백질이 세포 내에서 적절한 위치로 이동되도록 하고, 이의 최종 목적지에 도달한 경우 또는는 전송 과정 중에 제거된다. 대부분의 라이소조말, 멤브레인 또는 분비 단백질은 소포체의 루멘으로 위치시켜주는 아미노 말단 신호 서열을 가진다. 이 군의 단백질의 100개 이상의 신호 서열이 결정되었다. 신호 서열은 13 내지 36개의 아미노산 잔기의 길이로 다양할 수 있다. 신호 서열의 다양한 인식 방법은 본 기술 분야의 당업자에게 공지되어 있다. 한 양태에서, 신규한 자일라나제 신호 펩티드는 SignalP라고 언급되는 방법에 의해 확인된다. SignalP는 신호 펩티드 및 이들의 절단 부위 모두를 인식하는 조합된 신경 네트워크를 사용한다. 예컨대, [Nielsen, et al.,"Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites. "Protein Engineering, vol. 10, no. 1, p. 1-6 (1997)]를 참조하라. 본 발명의 자일라나제의 일부는 신호 서열을 함유하거나 함유하지 않을 수 있다는 것을 이해해야만 한다. 상이한 자일라나제의 핵산 서열에 작동적으로 연결된 하나의 자일라나제 유래의 신호 서열을 코딩하는 핵산 서열, 또는 임의적으로 바람직할 수 있는 비자일라나제 단백질 유래의 신호 서열을 포함하는 것이 바람직할 수 있다.
폴리뉴클레오티드가 준비될 수 있는 미생물에는 원핵세포 미생물, 예컨대, 유박테리아(Eubacteria) 및 아케박테리아(Archaebacteria), 및 하등 진핵세포 미생물, 예컨대, 진균, 일부 조류 및 원생동물이 포함된다. 폴리뉴클레오티드는 핵산이하나 이상의 배양된 개체로부터 회수되거나 개체의 배양없이 회수될 수 있는 경우에는 환경 샘플에서 분리될 수 있다. 한 양태에서, 이러한 미생물은 익스트리모파일, 예컨대, 하이퍼써모파일, 사이크로파일, 사이크로트로프, 할로파일, 바로파일 및 아시도파일일 수 있다. 익스티리모파일 미생물에서 분리된 효소를 코딩하는 폴리뉴클레오티드가 사용될 수 있다. 이러한 효소는 지질 온천 및 심해 열공에서의 100℃ 이상의 온도 및 북극 물에서의 0℃ 이하, 사해의 포화된 염 환경, 석탄 매장 및 기하열 황 풍부 온천에서의 0에 까까운 pH 값, 또는 오수 슬러지의 11 이상의 pH 값에서도 작용할 수 있다. 예컨대, 익스트리모파일 개체에서 클로닝되고 발현된 여러 에스터라제 및 리파아제는 광범위한 온도 및 pH에 걸쳐 높은 활성을 나타낸다.
전술된 바와 같이 선별 및 분리된 폴리뉴클레오티드는 적절한 숙주 세포에 도입된다. 적절한 숙주 세포는 재조합 및/또는 감소된 재분류를 촉진할 수 있는 어떠한 세포이다. 선택된 폴리뉴클레오티드는 적절한 조절 서열을 포함하는 벡터에 이미 존재하는 것이 바람직하다. 숙주 세포는 고등 진핵 세포, 예컨대, 포유동물 세포, 또는 하등 진핵 세포, 예컨대, 효모 세포일 수 있으며, 또는 바람직하게는 원핵 세포, 예컨대, 박테리아 세포인 것이 바람직하다. 작제물의 숙주 세포로의 도입은 인산 칼슘 형질감염, DEAE-덱스트란 매개된 형질감염, 또는 전기충격이 효과적일 수 있다(Davis et al., 1986).
적절한 숙주의 대표적인 예로서, 이하가 언급될 수 있다: 박테리아 세포, 예컨대, 대장균(E.coli), 스트렙토마이세스(Streptomyces), 살모넬라 티피무리엄(Salmonella typhimurium); 진균 세포, 예컨대, 효모; 곤충 세포, 예컨대, 드로소필라(Drosophila)S2및 스포돕테라(Spodoptera)Sf9; 동물 세포, 예컨대, CHO, COS 또는 보웨스 멜라노마(Bowes melanoma); 아데노바이러스; 및 식물 세포. 적절한 숙주의 선별은 본 명세서에 나타낸 사항으로부터 본 기술 분야의 당업자의 범위 이내에서 예정된다.
재조합 단백질을 발현하는 데 사용될 수 있는 다양한 포유동물 세포 배양 시스템에 관해서는, 포유동물 발현 시스템의 예에는 "SV40-transformed simian cells support the replication of earlySV40 mutants"(Gluzman,1981)에 서술된 원숭이 신장 선유아세포에서 유래된 COS-7 세포주, 및 양립가능한 벡터를 발현할 수 있는 기타 세포주, 예컨대, C127, 3T3, CHO, HeLa 및 BHK 세포주가 포함된다. 포유동물 발현 벡터는 복제 오리진, 적절한 프로모터 및 인헨서, 또한 필요한 리보좀 결합 부위, 폴리아데닐화 부위, 스플라이스 도너 및 어셉터 부위, 전사 종결 서열 및 5' 플랭킹 비전사 서열을 포함할 것이다. SV40 스플라이싱 및 폴리아데닐화 부위로부터 유래된 DNA 서열은 요구되는 비전사된 유전 요소를 제공하는 데 사용될 수 있다.
다른 양태에서, 본 발명의 방법은 하나 이상의 오페론 또는 유전자 다발 또는 이들의 일부분 유래의 생화학적 경로를 코딩하는 신규한 폴리뉴클레오티드를 생성하는 데 사용될 수 있음이 증명된다. 예컨대, 박테리아 및 여러 원핵 세포는 유전자의 산물이 관련된 과정에 포함되는 유전자를 조절하는 통합된 메카니즘을 가지고 있다. 유전자는 단일 염색체 상에 "유전자 다발"이라고 불리우는 구조로 다발져있으며, 전체 다발의 전사를 개시하는 단일 프로모터를 포함하는 단일 조절 서열의 조절 하에 함께 전사된다. 따라서, 유전자 다발은 일반적으로 이들의 기능이 동일하거나 관련된, 인접한 유전자의 군으로 존재한다. 유전자 다발에 의해 코딩되는 생화학적 경로의 예는 폴리케티드이다.
유전자 다발 DNA는 상이한 개체에서 분리되어, 벡터에 결찰될 수 있으며, 특히, 결찰된 유전자 다발 유래의 검출가능한 단백질 또는 단백질-관련된 정렬 활성의 생산을 조절 및 통제할 수 있는 발현 조절 서열을 함유하는 벡터에 결찰되는 것이 바람직하다. 예외적으로 매우 큰 외인성 DNA 도입이 가능한 벡터의 사용은 특히 이러한 유전자 다발에 사용하기 적절하며, 본 명세서에 서술된 예시 수단에 의해 서술되며, 대장균의 f-인자(또는 수정 인자)를 포함한다. 대장균의 f-인자는 콘주게이션 동안 이 인자 자체의 고빈도의 전이에 영향을 주는 플라스미드이며, 혼합된 미생물 샘플에서 유전자 다발과 같은 큰 DNA 단편을 안정하게 증식시키며 이를 얻는 데 이상적이다. 본 발명의 한 양태는 "포스미드"로 언급되는 클로닝 벡터 및 박테리아 인공 염색체(BAC) 벡터를 사용한다. 이들은 게놈 DNA의 큰 단편이 안정적으로 삽입가능한 대장균 f-인자에서 유래된 것이다. 혼합된 배양되지 않은 환경 샘플 유래의 DNA가 삽입시, 이는 안정한 "환경적 DNA 라이브러리"의 형태로 큰 게놈 단편을 얻는 것을 가능하게 한다. 본 발명에 사용되는 다른 유형의 벡터는 코스미드 벡터이다. 코스미드 벡터는 게놈 DNA의 큰 단편을 증식 및 클로닝하도록 최초에 디자인되었다. 코스미드 벡터로의 클로닝은 [Sambrook et al., Molecular Cloning : A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press (1989)]에서술되어 있다. 적절한 벡터에 결찰된 후, 상이한 폴리케티드 신테타제 유전자 다발을 함유하고 있는 2개 이상의 벡터들은 적절한 숙주 세포에 도입될 수 있다. 유전자 다발에 의해 공여되는 부분적 서열 상동상 부위는 하이브리드 유전자 다발에서 초래되는 서열 재구성을 초래하는 과정을 촉진할 것이다. 그 후, 신규한 하이브리드 유전자 다발은 오리지날 유전자 다발에서 발견되지 않는 증강된 활성에 대해 스크리닝된다.
따라서, 한 양태에서, 본 발명은 하기 단계들에 의해, 생물학적으로 활성 있는 하이브리드 폴리펩티드를 제조하는 방법 및 강화된 활성을 갖는 폴리펩티드를 스크리닝 하는 방법에 관한 것이다:
1) 작동적으로 연결된 적어도 제1 폴리뉴클레오티드 및 작동적으로 연결된 제2 폴리뉴클레오티드를 적절한 숙주 세포에 도입하는 단계로서, 적어도 제1 폴리뉴클레오티드 및 제2 폴리뉴클레오티드는 적어도 한 부분의 부분적 서열 상동성을 공여하는 것인 단계;
2) 상기 숙주 세포를 서열 재구성을 촉진하는 조건 하에서 배양하여, 작동적으로 연결된 하이브리드 폴리뉴클레오티드를 초래하는 단계;
3) 상기 하이브리드 폴리뉴클레오티드에 의해 코딩되는 하이브리드 폴리펩티드를 발현하는 단계;
4) 강화된 생물학적 활성의 확인을 촉진하는 조건 하에서 상기 하이브리드 폴리펩티드를 스크리닝하는 단계; 및
5) 상기 하이브리드 폴리펩티드를 코딩하는 폴리뉴클레오티드를 분리하는 단계.
다양한 효소 활성을 스크리닝하는 방법은 본 기술 분야의 당업자에게 공지되어 있으며, 본 명세서를 통해 서술되어 있다. 이러한 방법은 본 발명의 폴리펩티드 및 폴리뉴클레오티드의 분리시 사용될 수 있다.
스크리닝 방법론 및 "온라인" 모니터링 장치
본 발명의 방법 수행시, 다양한 장치 및 방법론이 예컨대, 자일라나제 활성을 갖는 폴리펩티드를 스크리닝하기 위해(예, 자이모그람에서 카제인 가수분해, 젤라틴에서 형광물질의 방출, 또는 다양한 작은 펩티드 기질에서 p-니트로아날리드의 방출과 같은 분석법), 자일라나제 활성의 잠재적 조절자(예, 활성제 또는 저해제)인 화합물을 스크리닝하기 위해, 본 발명의 폴리펩티드에 결합하는 항체를 스크리닝하기 위해, 본 발명의 핵산에 하이브리드화되는 핵산을 스크리닝하기 위해, 본 발명의 폴리펩티드를 발현하는 세포를 스크리닝하기 위해, 본 발명의 폴리펩티드 및 핵산과 함께 사용될 수 있다. 이하 샘플링에 대해 상세히 서술된 어레이 포멧에 덧붙여, 선택적인 포멧 또한 본 발명의 방법을 실행하는 데 사용될 수 있다. 이러한 포멧에는 예컨대, 매스 스펙트로미터, 크로마토그패프, 예컨대, 고-트루풋 HPLC 및 기타 액체 크로마토그래피의 형태가 포함되며, 더 작은 포멧에는 예컨대, 1536-웰 플레이트, 384-웰 플레이드 등이 포함된다. 하이 트루풋 스크리닝 장치는 본 발명의 방법의 실행에 사용되며 적용될 수 있다. 예컨대, 미국 특허 출원 제20020001809호를 참조하라.
모세관 어레이
본 발명의 핵산 및 폴리펩티드는 어레이에 고정화 되거나 어레이에 적용될 수 있다. 어레이는 본 발명의 핵산 또는 폴리펩티드의 활성을 조절하기 위해 또는 이에 결합하여 이들의 활성을 갖는 조성물(예, 소분자, 항체, 핵산 등)의 라이브러리를 모니터링하거나 스크리닝하는 데 사용된다. 모세관 어레이, 예컨대, GIGAMATRIXTM( Diversa Corporation, San Diego, CA) 및 예컨대, 미국 특허 출원 제20020080350호 Al; WO 0231203 A; WO 0244336 A에 서술된 어레이는 샘플을 유지 및 스크리닝하는 선택적 장치를 제공한다. 한 양태에서, 모세관 어레이는 인접한 모세관의 어레이에 형성된 다수의 모세관을 포함하며, 이 때, 각각의 모세관은 샘플을 보유하는 루멘으로 정의되는 적어도 하나의 벽을 포함한다. 벽이 액체 또는 샘플의 보유를 위해 루멘을 형성하는 한, 루멘은 원통, 구형, 헥사고날형 또는 어떠한 기타 기하학적 형태일 수 있다. 모세관 어레이의 모세관은 매우 근접하게 함께 위치하여 평면 구조를 형성할 수 있다. 모세관은 면끼리 융합(예, 모세관이 유리로 제조됨), 글루, 결합 또는 클램프함으로써, 함께 결합될 수 있다. 부가적으로, 모세관 어레이는 어레이내 인접한 모세관 등 사이에 놓여진 간극 물질을 포함할 수 있으며, 이에 따라 다수의 트루-홀을 함유하는 고체 평면 장치를 형성한다.
모세관 어레이는 예컨대, 100 내지 4,000,000개의 모세관들의 범위인 어떠한 수의 개별적인 모세관들로 형성될 수 있다. 추가적으로, 약 100,000 또는 그 이상의 개별적인 모세관을 가진 모세관 어레이는 표준 실험실 장비에 피트되는 Microtiter?플레이트의 표준 크기 및 형태로 형성될 수 있다. 루멘은 얇은 바늘을사용한 미세주입 또는 모세관 작용을 사용하여 자동적으로 또는 수동적으로 충전된다. 흥미있는 샘플은 그 후 추가 분석 또는 특징화를 위해 개별적인 모세관에서 제거될 수 있다. 예컨대, 얇은, 바늘 유사 프로브는 선택된 모세관과 함께 유체 연통적으로 위치하여, 루멘으로부터 물질을 첨가하거나 철회시킨다.
단일-포트 스크리닝 분석법에서, 이 분석 성분은 모세관 어레이에 삽입되기 이전에 혼합되어 흥미있는 용액을 초래한다. 루멘은 적어도 일부분의 어레이가 흥미있는 용액에 함침되는 경우 모세관 작용으로 충전된다. 각각의 모세관에서의 화학적 또는 생물학적 반응 및/또는 활성은 검출가능한 경우 모니터링된다. 검출가능하다는 것은 종종 "힛트"로 언급되며, 이는 광학 검출에 의해 모세관을 생성하는 "비-힛트"와 일반적으로 구분될 수 있다. 따라서, 모세관 어레이는 "힛트"의 묵중하게 평행인 검출을 가능케 한다.
다중-포트 스크리닝 분석법에서, 폴리펩티드 또는 핵산, 예컨대, 리간드는 제1 성분에 도입될 수 있으며, 이는 모세관 어레이의 적어도 일부분의 모세관에 도입된다. 공기 버블은 그 후 제1 성분 뒤의 모세관으로 도입될 수 있다. 제2 성분은 그 후 모세관으로 도입될 수 있으며, 여기서 제2 성분이 제1 성분과 공기 버블에 의해 분리된다. 제1 및 제2 성분은 그 후 모세관 어레이의 버블과 충돌하도록 양 측면에 히드로스태틱 압력을 가함으로써 혼합될 수 있다. 모세관 어레이는 그 후 검출 가능한 것에 대해 모니터링되고, 두 성분들의 반응 또는 비반응의 결과를 낳는다.
결합 스크리닝 분석법에서, 흥미있는 샘플은 검출가능한 입자로 표지된 제1액체로서 모세관 어레이의 모세관에 도입될 수 있으며, 이 때, 모세관의 루멘은 검출 가능한 입자를 루멘에 결합시키는 결합 물질로 코팅된다. 그 후, 제1 액체는 모세관 튜브에서 제거될 수 있으며, 이 때, 결합된 검출 가능한 입자는 모세관 이내에 유지되고, 제2 액체는 모세관 튜브에 도입될 수 있다. 그 후, 모세관은 검출 가능한 것에 대해 모니터링되고, 입자의 제2 액체와의 반응 또는 비반응의 결과를 낳는다.
어레이 또는 "바이오칩"
본 발명의 핵산 또는 폴리펩티드는 어레이에 고정화되거나 또는 어레이에 적용된다. 어레이는 본 발명의 핵산 또는 폴리펩티드의 활성을 조절하기 위해 또는 이에 결합하여 이들의 활성을 갖는 조성물(예, 소분자, 항체, 핵산 등)의 라이브러리를 모니터링하거나 스크리닝하는 데 사용된다. 예컨대, 본 발명의 한 양태에서, 모니터링된 변수는 자일라나제 유전자의 전사 활성이다. 하나 이상의 또는 모든 세포의 전사체는 세포의 전사체, 또는 세포의 전사체를 대표하거나 이에 상보적인 핵산을 포함하는 샘플을 하이브리드화함으로써 측정될 수 있거나, 또는 어레이 또는 "바이오칩" 상에 고정화된 핵산을 하이브르드화 함으로써 측정될 수 있다. 마이크로칩 상의 핵산의 "어레이"를 사용함으로써, 일부 또는 모두의 세포의 전사체들은 동시에 분석된다. 선택적으로, 게놈 핵산을 포함하는 어레이는 또한 본 발명의 방법에 의해 제조된 새로 가공된 균주의 유전자형을 결정하는 데 사용될 수 있다. "폴리펩티드 어레이"는 또한 다수의 단백질을 동시에 분석하는 데 사용될 수 있다. 본 발명은 어떠한 공지된 "어레이"(또한 "마이크로어레이" 또는 "핵산 어레이" 또는 "폴리펩티드 어레이" 또는 "항체 어레이" 또는 "바이오칩"으로 알려짐) 또는 이들의 변형체로 수행될 수 있다. 어레이는 다수의 "스팟" 또는 "표적 성분"을 가지며, 각각의 표적 성분은 샘플 분자, 예컨대, mRNA 전사체에 특이적으로 결합하는 기질 표면의 정의된 면적 상에 고정된, 정의된 양의 하나 이상의 생물학적 분자, 예컨대, 올리고뉴클레오티드를 포함한다.
본 발명의 방법 시행시, 어떠한 공지된 어레이 및/또는 어레이를 사용 및 제조하는 방법 또는 이들의 변형체들이 전체적으로 또는 부분적으로 통합될 수 있으며, 이는 예컨대, 미국 특허 제6,277,628호; 제6,277,489호; 제6,261,776호; 제6,258,606호; 제6,054,270호; 제6,048,695호; 제6,045,996호; 제6,022,963호; 제6,013,440호; 제5,965,452호; 제5,959,098호; 제5,856,174호; 제5,830,645호; 제5,770,456호; 제5,632,957호; 제5,556,752호; 제5,143,854호; 제5,807,522호; 제5,800,992호; 제5,744,305호; 제5,700,637호; 제5,556,752호; 제5,434,049호에 서술되어 있다. 또한, 예컨대, WO 99/51773; WO 99/09217; WO 97/46313; WO 96/17958을 참조하라. 또한 예컨대, [Johnston (1998) Curr. Biol.8 :R171-R174; Schummer (1997) Biotechniques 23: 1087-1092; Kern (1997) Biotechniques 23: 120-124; Solinas-Toldo (1997) Genes, Chromosomes & Cancer 20: 399-407; Bowtell (1999) Nature Genetics Supp. 21: 25-32]를 참조하라. 또한, 공개된 미국 특허 출원 제20010018642호; 제20010019827호; 제20010016322호; 제20010014449호; 제20010014448호; 제20010012537호; 제20010008765호를 참조하라.
항체 및 항체에 기초한 스크리닝 방법
본 발명은 본 발명의 자일라나제에 특이적으로 결합하는 분리되거나 또는 재조합된 항체를 제공한다. 이들 항체들은 본 발명의 자일라나제 또는 관련된 폴리펩티드의 분리, 확인 또는 정량화에 사용된다. 이들 항체들은 본 발명의 범위 이내인 기타 폴리펩티드 또는 기타 관련된 자일라나제를 분리하는 데 사용될 수 있다. 항체는 자일라나제의 활성 부위에 결합하도록 디자인 될 수 있다. 따라서, 본 발명은 본 발명의 항체들을 사용하여, 자일라나제를 저해하는 방법을 제공한다(본 발명의 항-자일라나제 조성에 대한 상기 서술을 참조).
본 발명은 본 발명의 폴리펩티드의 면역적 단편을 포함하여 본 발명의 효소의 단편을 제공한다. 본 발명은 본 발명의 폴리펩티드 또는 펩티드 및 어주번트 또는 담체 등을 포함하는 조성물을 제공한다.
항체는 면역침전, 염색, 면역친화성 컬럼 등에 사용될 수 있다. 소정의 경우, 특정 항원을 코딩하는 핵산 서열은 폴리펩티드 또는 핵산을 분리하고, 증폭 또는 클로닝한 후, 폴리펩티드를 본 발명의 어레이 상에 고정함으로써 면역화되어 발생될 수 있다. 선택적으로, 본 발명의 방법은 개질될 세포에 의해 생산되는 항체의 구조를 변형시키는 데 사용될 수 있으며, 예컨대, 항체의 친화도는 증가 또는 감소될 수 있다. 더욱이, 항체를 개질 또는 제조하는 능력은 본 발명의 방법에 의해 세포로 가공된 표현형일 수 있다.
면역화, 항체의 생산 및 분리 방법(폴리클로날 및 모노클로날)은 본 기술 분야의 당업자에게 공지되어 있으며, 과학 및 특허 문헌에 서술되어 있다. 예컨대, [Coligan, CURRENT PROTOCOLS IN IMMUNOLOGY, Wiley/Greene, NY(1991); Stites(eds. ) BASIC AND CLINICAL IMMUNOLOGY (7th ed. ) Lange Medical Publications, Los Altos, CA ("Stites"); Goding, MONOCLONAL ANTIBODIES : PRINCIPLES AND PRACTICE (2d ed. ) Academic Press, New York, NY (1986); Kohler (1975) Nature 256: 495; Harlow(1988) ANTIBODIES, A LABORATORY MANUAL, Cold Spring Harbor Publications, New York]를 참조하라. 항체는 또한 동물을 사용한 전통적인 생체내 방법에 덧붙여, 예컨대, 파아지 디스플레이 라이브러리가 발현하는 재조합 항체 결합 부위를 사용하여, 시험관내에서 발생될 수 있다. 예컨대, [Hoogenboom (1997) Trends Biotechnol. 15: 62-70; Katz (1997) Annu. Rev. Biophys. Biomol. Struct. 26: 27-45]를 참조하라.
B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 이들의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속적 아미노산을 포함하는 단편은 또한 폴리펩티드 또는 단편에 특이적으로 결합하는 항체를 생성하는 데 사용될 수 있다. 결과적인 항체는 면역친화성 크로마토그래피 과정에서 사용되어, 폴리펩티드를 분리 또는 정제하거나, 또는 생물학적 샘플내에 폴리펩티드가 존재하는지의 여부를 결정할 수 있다. 이러한 과정에서, 단백질 제제, 예컨대, 추출물 또는 생물학적 샘플은 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 이들의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속적 아미노산을 포함하는 단편 중 하나에 특이적으로 결합할 수 있는 항체와 접촉한다.
면역친화성 과정에서, 항체는 고체 지지체, 예컨대, 비드 또는 기타 컬럼 매트릭스에 부착한다. 단백질 제제는 항체가 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 이들의 단편 중 하나에 특이적으로 결합하는 조건하에서 항체와 접촉된다. 세척하여 비 특이적으로 결합된 단백질을 제거한 후, 특이적으로 결합된 폴리펩티드를 용출한다.
항체에 결합하는 생물학적 샘플내 단백질의 능력은 본 기술 분야의 당업자에게 공지된 다양한 과정들 중 어떤 것을 사용하여 결정될 수 있다. 예컨대, 결합은 형광제, 효소적 표지 또는 방사성동위원소와 같은 검출 가능한 표지로 항체를 표지함으로써 결정될 수 있다. 선택적으로, 항체의 샘플로의 결합은 검출가능한 표지를 갖는 제2 항체를 사용하여 검출될 수 있다. 특정 분석법에는 ELISA 분석법, 샌드위치 분석법, 방사면역분석법 및 웨스턴 블롯이 포함된다.
B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 이들의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속적 아미노산을 포함하는 단편에 대해 발생된 폴리클로날 항체는 동물, 예컨대, 비인간에게 폴리펩티드를 투여함으로써, 또는 동물에게 폴리펩티드를 직접 주입함으로써 얻어질 수 있다. 이렇게 얻어진 항체는 그 후, 폴리펩티드 그 자체에 결합할 것이다. 이 방식으로, 폴리펩티드의 단편만을 코딩하는 서열 조차도 전체 천연 폴리펩티드에 결합할 수 있는 항체를 생성하는 데 사용될 수 있다. 이러한 항체들은 그 후 폴리펩티드를 발현하는 세포로부터 폴리펩티드를 분리하는 데 사용될 수 있다.
모노클로날 항체의 제조를 위해, 연속적 세포주 배양에 의해 생산되는 항체를 제공하는 어떠한 기술들이 사용될 수 있다. 예로는 하이브리도마 기술(Kohlerand Milstein, Nature, 256: 495-497,1975), 트리오마 기술, 인간 B-세포 하이브리도마 기술(Kozbor et al., Immunology Today 4: 72, 1983) 및 EBV-하이브리도마 기술(Cole, et al., 1985, in Monoclonal Antibodies and Cancer Therapy, Alan R. Liss, Inc., pp. 77-96)을 들 수 있다.
단일 사슬 항체의 제조에 대해 서술한 기술(미국 특허 제4,946,778호)은 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 이들의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속적 아미노산을 포함하는 단편에 대한 단일 사슬 항체를 제조하는 데 적용될 수 있다.
B 군 아미노산 서열 및 이와 실질적으로 동일한 서열의 폴리펩티드, 또는 이들의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속적 아미노산을 포함하는 단편에 대해 발생된 항체들은 기타 개체 및 샘플 유래의 유사한 폴리펩티드를 스크리닝하는 데 사용될 수 있다. 이러한 기술에서, 개체의 폴리펩티드는 항체와 접촉되며, 항체에 특이적으로 결합하는 폴리펩티드가 검출된다. 전술된 과정들 중 어떠한 것도 항체 결합을 검출하는 데 사용될 수 있다. 이러한 스크리닝 분석법 중 하나는 문헌[참조: "Methods for Measuring Cellulase Activities", Methods in Enzymology, Vol 160, pp. 87-116]에 서술되어 있다.
키트
본 발명은 이하의 성분, 예컨대, 핵산, 발현 카세트, 벡터, 세포, 유전자전이 종자 또는 식물 또는 식물의 부분, 폴리펩티드 (예컨대, 자일라나제) 및/또는 본 발명의 항체를 포함하는 키트를 제공한다. 키트는 또한 사용 방법 및 본원에 기재된 본 발명의 산업상 용도를 안내하는 설명서를 포함할 수 있다.
전체 세포 조작 및 대사 파라미터의 측정
본 발명의 방법은, 세포의 유전자 조성을 변형시킴으로써, 신규한 표현형, 예컨대, 신규하거나 또는 변형된 자일라나제 활성을 갖는 신규한 세포 스트레인으로의 세포의 전체 세포 진화, 또는 전체 세포 조작을 제공한다. 유전자 조성은 본 발명의 핵산, 예컨대, 본 발명의 효소에 대한 암호화 서열을 세포에 첨가함으로써 변형될 수 있다. 예컨대, W00229032; W00196551 참조.
신규한 표현형을 검출하기 위해, 변형된 세포의 1 이상의 파라미터가 세포에서 "실시간"으로 또는 "온라인" 시간 프레임으로 모니터링된다. 하나의 양태에서, 세포 배양물과 같은 복수의 세포가 "실시간"으로 또는 "온라인"으로 모니터링된다. 하나의 양태에서, 복수의 대사 파라미터가 "실시간"으로 또는 "온라인"으로 모니터링된다. 대사 파라미터는 본 발명의 자일라나제를 사용하여 모니터링될 수 있다.
대사 플럭스 분석 (MFA)은 공지의 생화학 프레임워크를 기초로 한다. 세포내 대사체에 대한 질량 보존의 법칙 및 유사-정상 상태 가설 (PSSH)를 기초로 선형 독립 대사 매트릭스가 구축되었다. 본 발명의 방법을 수행하는데 있어, 다음과 같은 대사 네트워트가 확립되었다:
모든 경로 기질, 생성물 및 중간 대사체의 확인
경로 대사체를 상호변환시키는 모든 화학 반응, 경로 반응의 화학양론의 확인,
반응을 촉매하는 모든 효소, 효소 반응 동력학의 확인,
경로 성분 사이의 조절성 상호작용, 예컨대 알로스테릭 상호작용, 효소-효소 상호작용 등,
효소 또는 다른 효소의 거대분자성 조직의 세포내 구획, 그리고,
대사체, 효소 또는 이펙터(effector) 분자 또는 그들의 운동에 대한 확산 장벽(diffusion barriers) 중에 임의의 농도 구배의 존재.
주어진 스트레인에 대해 일단 대사 네트워크가 구축되고, 만약 온라인 메타볼롬(metabolome) 데이타가 유용하다면, 매트릭스 개념으로 수학적 소개가 세포간 대사 플럭스를 추정하는데 도입될 수 있다. 대사 표현형은 세포 안에서 전체 대사 네트워크의 변화에 의존적이다. 대사 표현형은 환경적 조건, 유전자적 조절, 발달 상태 및 유전자형, 등에 관해서 경로 활용의 변화에 의존적이다. 본 발명의 방법의 하나의 양태에서, 온라인 MFA 계산 이후, 세포의 다이나믹 행동, 그들의 표현형 및 다른 성질이 경로 활용을 조사함으로써 분석된다. 예컨대, 만약 효모 발효 동안 글루코스 공급이 증가하고 그리고 산소가 감소한다면, 호흡 경로의 활용이 감소 및/또는 정지하게 될 것이며, 발효 경로의 활용이 우세하게 될 것이다. 세포 배양물의 생리적 조절은 경로 분석 이후 가능하게 될 것이다. 본 발명의 방법은, 바람직한 방향을 따라 이동하는 세포의 생리적 상태를 조절하기 위해, 기질 공급, 온도, 인듀서의 사용 등이 어떻게 변화하는지 측정함으로써 발효를 어떻게 조작하는지 측정하는 것을 도울 수 있다. 본 발명의 방법을 수행함에 있어, MFA 결과는, 대사성 조작 또는 유전자 셔플링(shuffling) 등에 대한 실험 및 프로토콜을 디자인하기 위해 트랜스크립톰(transcriptome) 및 프로테옴(proteome) 데이타와 또한 비교될 수 있다.
본 발명의 방법을 수행하는데 있어, 임의의 변형되거나 또는 신규한 표현형이 언급되고 검출될 수 있으며, 이는 세포의 신규하거나 또는 향상된 특성을 포함한다. 대사 또는 성장의 어떤 양태라도 모니터링될 수 있다.
mRNA 전사체의 발현 모니터링
본 발명의 하나의 양태에서, 조작된 표현형은 mRNA 전사체 (예컨대, 자일라나제 메세지)의 발현을 증가시키거나 또는 감소시키는 것 또는 세포에서 신규한 (예컨대, 자일라나제) 전사체를 발생시키는 것을 포함한다. 이 증가되거나 또는 감소된 발현은 본 발명의 자일라나제의 존재에 대해 테스트함으로써 또는 자일라나제 활성 분석으로 추적될 수 있다. mRNA 전사체, 또는 메세지는, 또한 예컨대, 노던 블랏(Northern blots), 정량적 증폭 반응, 배열에 대한 혼성, 등을 포함하는 본 기술 분야에서 공지된 임의의 방법으로 검출되고 정량화될 수 있다. 정량적 증폭 반응은, 예컨대, 정량적 역전사 폴리머라제 체인 반응, 또는 RT-PCR을 포함하는 정량적 PCR; 정량적 실시간 RT-PCR, 또는 "실시간 동력학적 RT-PCR"을 포함한다 (예컨대, Kreuzer (2001) Br. J. Haematol. 114: 313-318; Xia (2001) Transplantation 72: 907-914 참조).
본 발명의 하나의 양태에서, 조작된 표현형이 상동 유전자의 넉 아웃(knocking out) 발현에 의해 발생된다. 유전자의 암호화 서열 또는 1 또는 그 이상의 전사 제어 성분, 예컨대, 프로모터 또는 인핸서가 넉 아웃될 수 있다. 따라서, 전사체의 발현은 완전히 제거되거나 또는 단지 감소될 수 있다.
본 발명의 하나의 양태에서, 조작된 표현형은 상동 유전자의 발현의 증가를 포함한다. 이는, 시스- 또는 트랜스-로 작용하는 전사 조절 성분을 포함하거나, 또는, 파지티브 제어 성분을 돌연변이화시키는 네가티브 제어 성분을 넉 아웃시킴으로써 영향을 받을 수 있다. 1 또는 그 이상, 또는 세포의 모든 전사체가 세포의 전사체를 포함하는 시료, 또는, 대표적인 또는 세포의 전사체에 상보적인 핵산의 혼성에 의해, 배열 상에 부동화된 핵산에 대한 혼성으로 측정될 수 있다.
폴리펩티드, 펩티드 및 아미노산의 발현 모니터링
본 발명의 하니의 양태에서, 조작된 표현형은 세포에서 폴리켑티드 (예컨대, 자일라나제)의 발현을 증가시키거나 또는 감소시키는 것 또는 새로운 폴리펩티드를 발생시키는 것을 포함한다. 이 증가되거나 또는 감소된 발현은 본 발명의 자일라나제 함량을 측정함으로써 또는 자일라나제 활성 분석에 의해 추적될 수 있다. 폴리펩티드, 펩티드 및 아미노산은 또한, 예컨대, 핵 자기 공명 (NMR), 분광학, 방사선사진법 (단백질 방사선 라벨링), 전기영동, 모세관 전기영동, 고성능 액체 크로마토그래피 (HPLC), 박층 크로마토그래피 (TLC), 초과 확산 크로마토그래피, 다양한 면역학적 방법, 예컨대 면역 침전, 면역 확산, 면역-전기영동, 방사선 면역 분석 (RIAs), 효소-결합 면역 흡착 분석 (ELISAs), 면역-형광 분석, 젤 전기영동 (예컨대, SDS-PAGE), 항체에 의한 스테이닝, 형광 활성화 세포 분류기 (FACS), 열분해 질량 분광학, 푸리에-전이 적외선 분광학, 라만 분광학, GC-MS, 및 LC-전기분무 및 캡-LC-탠덤-전기분무 질량 분광학, 등을 포함하는 본 기술분야에서 공지된 임의의 방법으로 검출되고 정량화될 수 있다. 또한 새로운 생체활성이 미국 특허6,057,103에 기재된 방법, 또는 그것의 변형을 사용하여 스크리닝될 수 있다. 게다가, 이하에 상세히 기재된 바와 같이, 1 또는 그 이상, 또는, 세포의 모든 폴리펩티드가 단백질 배열을 사용하여 측정될 수 있다.
산업상 응용
본 발명의 자일라나제 효소는 촉매에 상당히 선택적일 수 있다. 그들은 종래의 합성 화학과 견줄데 없는 정교한 입체-선택성, 위치-선택성 및 화학-선택성으로 반응을 촉매화할 수 있다. 게다가, 효소는 현저하게 다재다능하다. 본 발명의 자일라나제 효소는, 유기 용매에서 작용하고, 극단적인 pH (예컨대, 높은 pH 및 낮은 pH) 극단적인 온도 (예컨대, 고온 및 저온), 극단적인 염도 레벨 (예컨대, 고염도 및 저염도)에서 작동하고 그리고 그들의 자연적, 생리학적 기질과 구조적으로 무관한 화합물들과의 반응을 촉매하도록 맞춤될 수 있다.
세정 조성물
본 발명은 1 또는 그 이상의 본 발명의 폴리펩티드 (예컨대, 자일라나제)를 포함하는 세정 조성물, 및 이들 조성물의 제조 및 사용 방법을 제공한다. 본 발명은 세정 조성물의 모든 제조 및 사용 방법을 포함한다, 예컨대, 미국 특허 6,413,928; 6,399,561; 6,365,561; 6,380,147 참조. 세정 조성물은 1 및 2 부 수성 조성물, 비수성 액체 조성물, 캐스트 고체, 과립형, 소립자형, 압축 정제, 젤 및/또는 페이스트 및 슬러리형일 수 있다. 본 발명의 자일라나제는 또한 고체 또는 액체 형 중에 세제 첨가제 생성물로서 사용될 수 있다. 그런 첨가제 생성물은 종래의 세정 조성물의 성능을 보충하거나 강화시킬 것으로 기대되며 세척 과정의 임의의스테이지에 첨가될 수 있다.
실질적인 활성 효소 함량은 세정 조성물의 제조 방법에 좌우되며, 세제 용액이 목적하는 효소 활성을 갖는다는 것을 가정하는데 있어 중요하지는 않다. 하나의 양태에서, 최종 용액 중 본 발명의 자일라나제 함량은 세정 조성물 그랭 당 약 0.001 mg 내지 0.5 mg 범위이다. 본 발명의 방법 및 생성물에 사용하기 위해 선택된 특정 효소는 생성물의 물리적 형태, 사용 pH, 사용 온도, 및 분해되거나 또는 변형되는 토양의 유형을 포함하여, 최종 사용 조건에 좌우된다. 효소는 임의의 소정 사용 조건의 세트에 대해 최적 활성 및 안정성을 제공하도록 선택될 수 있다. 하나의 양태에서, 본 발명의 자일라나제는 pH 범위 약 4 내지 약 12 그리고 온도 범위 약 20℃ 내지 약 95℃에서 활성이다. 본 발명의 세제는 양이온성, 반극성 비이온성 또는 양쪽성 이온성 계면활성제 또는 그들의 혼합물을 포함한다.
본 발명의 자일라나제는 pH 4.0과 12.0 사이에서 약 0.01 내지 약 5 중량% (바람직하게는 0.1% 내지 0.5%)의 레벨로 분말 및 액체 세제 내에서 제제화될 수 있다. 이들 세정 조성물은 자일라나제, 셀룰라제, 리파제 또는 엔도글리코시다제, 엔도-베타-1,4-글루카나제, 베타-글루카나제, 엔도-베타-1,3(4)-글루카나제, 쿠티나제, 퍼옥시다제, 락카제(laccases), 아밀라제, 글루코아밀라제, 펙티나제, 리덕타제, 옥시다제, 페놀옥시다제, 리그니나제, 풀루라나제, 아라비나나제, 헤미셀룰라제, 만나나제, 자일로글루카나제, 자일라나제, 펙틴 아세틸 에스테라제, 람노갈락투로난 아세틸 에스테라제, 폴리갈락투로나제, 람노갈락투로나제, 갈락타나제, 펙틴 라이아제, 펙틴 메틸에스테라제, 셀로비오히드롤라제 및/또는 트랜스들루타밀라제와 같은 다른 표소를 포함할 수 있다. 이들 세정 조성물은 또한 빌더(builder) 및 안정화제를 포함할 수 있다.
본 발명의 자일라나제를 종래의 세척 조성물에 첨가하는 것은 임의의 특별한 사용 제한을 만들어 내지 않는다. 다시 말하면, 효소가, 사용하고자 하는 그 pH 및/또는 온도에서 활성이거나 또는 문제점이 없는 한, 세제에 적절한 임의의 온도 및 pH는 또한 본 발명의 조성물에 대해서도 적절하다. 게다가, 본 발명의 자일라나제는 세제 없이, 다시 말하면 단독으로 또는 빌더 및 안정화제와 조합되어 세척 조성물 중에 사용될 수 있다.
본 발명은, 단단한 표면을 세척하기 위한 세정 조성물, 직물을 세척하기 위한 세정 조성물, 식기세척용 조성물, 경구용 세척 조성물, 치아 세척 조성물, 및 콘택트 렌즈 세척 용액을 포함하는 세척 조성물을 제공한다.
하나의 양태에서, 본 발명은 세척하기에 충분한 조건 하에서 본 발명의 폴리펩티드와 대상을 접촉시키는 것을 포함하는 대상의 세척 방법을 제공한다. 본 발명의 자일라나제는 세제 첨가제로서 포함될 수 있다. 본 발명의 세정 조성물은, 예컨대, 본 발명의 폴리펩티드를 포함하는, 손 또는 기계 세탁 세정 조성물로서 제제화될 수 있다. 얼룩진 직물의 사전 처리를 위해 적당한 세탁 첨가제는 본 발명의 폴리펩티드를 포함할 수 있다. 직물 유연제 조성물은 본 발명의 자일라나제를 포함할 수 있다. 대안적으로, 본 발명의 자일라나제는 일반적으로 가정용 단단한 표면 세척 작용으로 사용하기 위한 세정 조성물로서 제제화될 수 있다. 대안적 양태에서, 본 발명의 세제 첨가제 및 세정 조성물은, 자일라나제, 리파제, 쿠티나제, 다른 자일라나제, 카보하이드라제, 셀룰라제, 펙티나제, 만나나제, 아라비나제, 갈락타나제, 자일라나제, 옥시다제, 예컨대, 락타제, 및/또는 퍼옥시다제 (상기 참조)와 같은 1 또는 그 이상의 다른 효소를 포함할 수 있다. 본 발명의 효소(들)의 특성은 선택된 세제와 양립할 수 있도록 선택되며 (즉 pH-최적, 다른 효소 및 비효소 성분들 등과의 양립가능성) 그리고 효소(들)는 유효량으로 존재한다. 하나의 양태에서, 본 발명의 자일라나제 효소는 직물로부터 악취 물질을 제거하는데 사용된다. 본 발명을 수행하는데 있어 사용될 수 있는 다양한 세정 조성물 및 이들의 제조 방법은, 예컨대, 미국 특허 6,333,301; 6,329,333; 6,326,341; 6,297,038; 6,309,871; 6,204,232; 6,197,070; 5,856,164에 기재되어 있다.
세탁기 세척 방법에 사용되기에 적절한 조성물로서 제제화될 때, 본 발명의 자일라나제는 계면활성제 및 빌더 화합물을 둘 다 포함할 수 있다. 그들은 추가적으로 1 또는 그 이상의 세제 성분, 예컨대, 유기 중합체 화합물, 표백제, 추가 효소, 거품 억제제, 분산제, 라임-비누 분산제, 토양 현탁액 및 재석출 방지제 및 부식 억제제를 포함할 수 있다. 본 발명의 세탁 조성물은 부가적 세제 성분으로서 유연제를 또한 포함할 수 있다. 탄수화물을 함유하는 그런 조성물은 세탁 세정 조성물로서 제제화될 때 직물 세척, 얼룩 제거, 백색 유지, 연화, 착색 외관, 염료 전이 억제 및 위생을 제공할 수 있다.
본 발명의 세탁 세정 조성물의 밀도는 조성물의 약 200 내지 1500 g/리터, 또는, 약 400 내지 1200 g/리터, 또는, 약 500 내지 950 g/리터, 또는, 600 내지 800 g/리터 범위일 수 있으며; 이는 약 20℃에서 측정될 수 있다.
본 발명의 세탁 세정 조성물의 "압축"형은, 밀도로 그리고, 조성물의 측면에서, 무기 충진 염의 함량으로 최선 반영된다. 무기 충진 염은 분말형 세정 조성물의 통상적인 성분이다. 종래의 세정 조성물에서, 충진 염은 실질적인 양, 구체적으로 총 조성물의 17% 내지 35중량%로 존재한다. 압축 조성물의 하나의 양태에서, 충진 염은 총 조성물의 15%를 초과하지 않는 양, 또는, 10%를 초과하지 않는 양, 또는, 조성물의 5 중량%를 초과하지 않는 양으로 존재한다. 무기 충진 염은 설페이트 및 클로라이드의 알칼리 및 알칼리 토금속 염, 예컨대, 황산 나트륨으로부터 선택될 수 있다.
본 발명의 액체 세정 조성물은 또한 "농축형"일 수 있다. 하나의 양태에서, 액체 세정 조성물은 종래의 액체 세제에 비해 소량의 물을 함유할 수 있다. 대안적 양태에서, 농축 액체 세제의 물 함량은 세정 조성물의 40% 이하, 또는, 30% 이하, 또는, 20 중량% 이하이다. 본 발명의 세제 화합물은 WO 97/01629에 기재된 것과 같은 제제를 포함할 수 있다.
본 발명의 자일라나제는 다양한 세척 조성물을 제제화하는데 유용할 수 있다. 몇가지 공지된 화합물은, 예컨대, 미국 특허 4,404,128; 4,261,868; 5,204,015에 개시된 것으로서 사용될 수 있는, 비이온성, 음이온성, 양이온성, 또는 양쪽성이온성 세제를 포함하는 적절한 계면활성제이다. 게다가, 자일라나제는, 예컨대, 막대 또는 액체 비누 제품, 식기 보호 제제, 콘택트 렌즈 세척 용액 또는 생성물, 펩티드 가수분해, 폐기물 처리, 직물 제품, 단백질 합성에 있어서 융합-절단 효소, 등으로 사용될 수 있다. 자일라나제는 다른 세제 자일라나제에 비해 세정 조성물중에서 향상된 성능을 제공할 수 있다. 즉, 효소군은, 표준 세척 사이클 이후 일반적인 평가에 의해 측정되는 것으로서 풀 또는 혈액과 같은 특정 효소 민감성 얼룩의 세척을 증가시킬 수 있다. 자일라나제는 pH 6.5와 12.0 사이를 갖는 공지의 분말 및 액체 세제 내로 약 0.01 내지 약 5 중량% (예컨대, 약 0.1% 내지 0.5%)의 레벨로 제제화될 수 있다. 이들 세제 세척 조성물은 공지의 자일라나제, 자일라나제, 아밀라제, 셀룰라제, 리파제 또는 엔도글리코시다제, 뿐 아니라 빌더 및 안정화제화 같은 다른 효소를 포함할 수 있다.
하나의 양태에서, 본 발명은 과일, 야채 및/또는 진흙 및 점토 화합물과 사용하기 위한 자일라나제 활성 (본 발명의 자일라나제)을 갖는 세정 조성물을 제공한다 (예컨대, 미국 특허 5,786,316 참조).
섬유 및 직물 처리
본 발명은 1 또는 그 이상의 본 발명의 자일라나제를 사용하여 섬유 또는 직물의 처리 방법을 제공한다. 자일라나제는 본 기술 분야에서 공지된 임의의 섬유- 또는 직물-처리 방법에 사용될 수 있다. 예컨대, 미국 특허 6,261,828; 6,077,316; 6,024,766; 6,021,536; 6,017,751; 5,980,581; US 특허 공개 20020142438 A1 참조. 예컨대, 본 발명의 자일라나제는 섬유 및/또는 직물 크기감소(desizing)에 사용될 수 있다. 하나의 양태에서, 용액 중 본 발명의 자일라나제와 섬유를 접촉시키는 것을 포함하는 방법에 의해 섬유의 촉감 및 외관이 향상된다. 하나의 양태에서, 가압하에서 용액으로 직물이 처리된다. 예컨대, 본 발명의 자일라나제는 얼룩의 제거에 사용될 수 있다.
본 발명의 자일라나제는, 섬유 (예컨대, 면, 삼, 아마 또는 린넨으로부터의 섬유), 재봉된 및 재봉되지 않은 직물, 예컨대, 면으로부터 얻은 니트, 부직포, 데님, 실, 및 타올, 면 혼방 또는 천연 또는 합성 셀룰로스 물질 (예컨대 목재 펄프와 같은 것으로부터 얻은 자일란-함유 셀룰로스로부터 유래하는 것) 또는 그들의 혼방을 포함하는 임의의 셀룰로스계 물질을 처리하는데 사용될 수 있다. 혼방의 예는 면 또는 레이온/비스코스와 1 또는 그 이상의 모, 합성 직물 (예컨대 폴리아미드 섬유, 아크릴계 섬유, 폴리에스테르 섬유, 폴리비닐 알콜 섬유, 염화 폴리비닐 섬유, 염화 폴리비닐리덴 섬유, 폴리우레탄 섬유, 폴리우레아 섬유, 아라미드 섬유), 및 셀룰로스-함유 섬유 (예컨대 레이온/비스코스, 모시, 삼, 아마/린넨, 황마, 셀룰로스 아세테이트 섬유, 리오셀)와 같은 동반 물질과의 혼방이다 .
(본 발명의 자일라나제를 사용하는) 본 발명의 직물 처리 과정은 다른 직물 처리, 예컨대, 스커링(scouring) 및 표백과 관련하여 사용될 수 있다. 스커링은 면 섬유로부터 비-셀룰로스계 물질, 예컨대, (주로 왁스로 구성된) 큐티클(cuticle) 및 (주로 펙틴, 단백질 및 자일로글루칸으로 구성된) 1차 세포벽을 제거하는 것이다. 높은 습윤성을 얻기 위해 적절한 왁스 제거가 필요하다. 이것은 염색을 위해 필요하다. 본 발명의 방법에 의한 1차 세포벽의 제거는 왁스 제거를 향상시키고 그리고 더 확실한 염색을 보장한다. 본 발명의 방법에 의한 직물 처리는 표백 과정에서 백색 정도를 향상시킨다. 스커링에 사용되는 주된 화학물은 소농도 및 고온의 염화 나트륨이다. 표백은 직물을 산화시키는 것을 포함한다. 완전히 표백된 (백색) 직물 또는 염료의 깨끗한 채색을 얻기 위해, 표백은 특히 산화제로서 과산화수소의사용을 포함한다.
본 발명은 또한 알칼리성 자일라나제 (알칼리 조건 하에서 활성인 자일라나제)를 제공한다. 이들은 직물 공정, 식물 섬유의 검질 제거 (예컨대, 식물 인피 섬유), 펙틴질 폐수의 처리, 제지, 및 커피 및 차의 발효에서 광범위로 응용된다. 예컨대, Hoondal (2002) Applied Microbiology and Biotechnology 59: 409-418 참조.
식품 및 식품 가공의 처리
본 발명의 자일라나제는 식품 가공 산업에서 많이 응용된다. 예컨대, 하나의 양태에서, 본 발명의 자일라나제는 오일이 풍부한 식물성 물질, 예컨대, 오일이 풍부한 씨앗으로부터, 예컨대, 대두로부터 대두유, 올리브로부터 올리브유, 평지씨로부터 평지씨유 및/또는 해바라기씨로부터 해바라기 오일의 추출을 향상시키는데 사용된다.
본 발명의 자일라나제는 식물 세포 물질의 성분을 분리하기 위해 사용될 수 있다. 예컨대, 본 발명의 자일라나제는 자일란 풍부 물질 (예컨대, 식물 세포)을 성분으로 분리하는데 사용될 수 있다. 하나의 양태에서, 본 발명의 자일라나제는 자일란 풍부- 또는 오일-풍부 작물로부터 가치있는 단백질 및 오일 및 헐(hull) 분율로 분리하는데 사용될 수 있다. 분리 과정은 본 기술 분야에서 공지된 방법을 사용함으로써 수행될 수 있다.
본 발명의 자일라나제는 과일 또는 야채 주스, 시럽, 추출물 등의 제조에 있어 수득율을 증가시키는데 사용될 수 있다. 본 발명의 자일라나제는 다양한 식물 세포벽 유도 물질 또는 폐기물, 예컨대 씨리얼, 그레인, 와인 또는 주스 제조, 또는 식물피, 대두피, 사탕무 펄프, 올리브 펄프, 감자 펄프, 등과 같은 농업상 잔류물의 효소 처리에 사용될 수 있다 (예컨대, 자일란 함유 식물 물질의 가수분해). 본 발명의 자일라나제는 가공된 과일 또는 야채의 밀도(consistency) 및 외관을 변형하는데 사용될 수 있다. 본 발명의 자일라나제는, 음식을 포함하여 식물 물질의 가공을 촉진하기 위해, 식물 성분의 정제 또는 추출을 촉진하기 위해 식물 물질을 처리하는데 사용될 수 있다. 본 발명의 자일라나제는, 사료가(feed value)를 향상시키는데, 물 결합능을 감소시키는데, 폐수 식물에서 분해성을 감소시키는데 및/또는 식물 물질의 저장물로의 전환을 향상시키는데, 등등 사용될 수 있다.
하나의 양태에서, 본 발명의 자일라나제는 베이킹 응용, 예컨대, 쿠키 및 크래커에, 장치가 어렵지 않으면서 비스킷 크기를 감소시키지 않으면서, 아라비노자일란을 가수분해시키는데 그리고 끈끈하지 않은 반죽을 만들어내는데 사용될 수 있다. 본 발명의 자일라나제를 아라비노자일란을 가수분해하는데 사용하는 것은 구워낸 제품의 빠른 재수화로 인하여 바삭거림의 손실 및 감소된 유효 보존기간을 방지하는데 사용된다. 하나의 양태에서, 본 발명의 자일라나제는 반죽(dough) 과정에서 첨가제로 사용된다. 하나의 양태에서, 본 발명의 자일라나제는 반죽의 컨디셔닝에 사용되며, 여기서 하나의 양태로 자일라나제는 약 25-35℃ 온도 범위 및 거의 중성 pH (7.0-7.5)에 걸쳐 높은 활성을 가진다. 하나의 양태에서, 반죽 컨디셔닝 효소는 베이킹의 극단적인 온도에서 불활성될 수 있다 (> 500℉).
하나의 양태에서, 본 발명의 자일라나제는 반죽 pH 및 온도 조건을 최적으로 수행하기 위해 반죽 과정에서 첨가제로서 사용된다. 하나의 양태에서, 본 발명의효소는 반죽 컨디셔닝을 위해 사용된다. 하나의 양태에서, 본 발명의 자일라나제는 온도 범위 25-35℃ 및 거의 중성 pH (7.0-7.5)에 걸쳐 높은 활성을 가진다. 하나의 양태에서, 효소는 베이킹의 극단적인 온도, 예컨대, > 500℉에서 불활성화된다.
종이 또는 펄프 처리
본 발명의 자일라나제는 종이 또는 펄프 처리 또는 종이의 잉크 제거에 사용될 수 있다. 예컨대, 하나의 양태에서, 본 발명은 본 발명의 자일라나제를 사용하는 종이 처리 방법을 제공한다. 하나의 양태에서, 본 발명의 자일라나제는 이산화염소와 같은 화학적 표백제의 필요를 감소시키는데, 그리고 높은 알칼리성 및 고온 환경에서 적용할 수 있다. 하나의 양태에서, 본 발명의 자일라나제는, 0.5% 이하의 펄프 손실률로 크래프트 펄프의 이산화염소 요구에 있어서 25% 이상의 감소로 영향을 미칠 수 있는 내열성 알칼리성 엔도자일라나제이다. 하나의 양태에서, 한계 파라미터는 pH 10, 65-85℃ 및 효소 로딩 0.001 wt% 이하에서 60분 이하의 처리 시간이다. 자일라나제의 풀(pool)은 예컨대, pH 10 및 60℃에서 염료-라벨링된 자일란을 가수분해하는 능력에 대해 테스트될 수 있다. 이들 조건 하에서 파지티브로 테스트된 효소는 이후, 예컨대 pH 10 및 70℃에서 평가될 수 있다. 대안적으로, 효소는 pH 8 및 pH 10, 70℃에서 테스트될 수 있다. 펄프 및 종이 산업 연구실에서 목적하는 자일라나제의 발견은 고온 또는 높은 알칼리성 환경을 타겟으로 하였다. 특히, 이들 연구실은 알칼리성 pH 및 대략 45℃의 온도에서 작용하는 효소를 스크리닝하였다. 다른 양태에서, 본 발명의 자일라나제는, 리그닌을 방출하기 위해 리그닌 헤미셀룰로스 결합의 분해에 있어서 종이 및 펄프 산업에 유용하다.
동물 사육 및 식품 또는 사료 첨가제
본 발명은 본 발명의 자일라나제를 사용하여 동물 사료 및 식품 및 식품 또는 사료 첨가제를 처리하는 방법을 제공하며, 동물은 포유동물 (예컨대, 인간), 새, 물고기 등을 포함한다. 본 발명은 본 발명의 자일라나제를 함유하는 동물 사료, 식품, 및 첨가제를 제공한다. 하나의 양태에서, 본 발명의 자일라나제를 사용하여 동물 사료, 식품 및 첨가제를 처리하는 것은 동물 사료 첨가제 중에 영양분, 예컨대, 전분, 단백질, 등의 이용률에 도움이 될 수 있다. 소화되기 어려운 단백질 또는 직접 또는 간접으로 마스킹되지 않은 전분 (또는 다른 영양분)을 분해시킴으로써, 자일라나제가 영양분으로 하여금 다른 내인성 또는 외인성 효소에 더 잘 접근할 수 있게 한다. 자일라나제는 또한 용이하게 소화될 수 있고 그리고 용이하게 흡수되는 영양분 및 당의 방출을 간단히 유발시킬 수 있다.
동물 사료에 첨가될 때, 본 발명의 자일라나제는 장관의 점도를 감소시키는 것에 의해 식물 세포벽 물질의 부분적인 생체내 분해를 향상시키며 (예컨대, Bedford et al., Proceedings of the 1st Symposium on Enzyme in Animal Nutrition, 1993, pp. 73-77), 그럼으로써 동물에 의한 식물 영양분의 더 나은 활용을 얻게 한다. 따라서, 사료에 본 발명의 자일라나제를 사용함으로써 동물의 성장 속도 및/또는 사료 전환률 (즉 늘어난 체중에 상대적인 섭취된 사료의 중량)이 향상된다.
본 발명의 동물 사료 첨가제는 사료 성분과 용이하게 혼합될 수 있는 과립화된 효소 생성물일 수 있다. 대안적으로, 본 발명의 사료 첨가제는 프리믹스(pre-mix)의 성분을 형성할 수 있다. 본 발명의 과립화된 효소 생성물은 코팅되거나 또는 코팅되지 않을 수 있다. 효소 과립의 입자 크기는 사료 및 프리믹스 성분의 것과 양립가능할 수 있다. 이는 사료 내로 효소 도입의 안전하고 용이한 수단을 제공한다. 대안적으로, 본 발명의 동물 사료 첨가제는 안정화된 액체 조성물일 수 있다. 이는 수성 또는 오일계 슬러리일 수 있다. 예컨대, 미국 특허 6,245,546 참조.
본 발명의 자일라나제는, 동물 사료 또는 식품의 변형시, 시험관내 (사료 또는 식품의 성분을 가공함으로써) 또는 생체내에서 식품 또는 사료를 가공할 수 있다. 자일라나제는 고함량의 자일란을 함유하는 동물 사료 또는 식품 조성물에 첨가될 수 있으며, 예컨대 식물 물질 함유 사료 또는 식품은 씨리얼, 그레인 등으로부터 얻는다. 자일라나제를 식품 또는 사료에 첨가할 때 자일란 함유 물질, 예컨대, 식물 세포벽의 생체내 분해가 현저하게 향상되며, 그럼으로써 동물 (예컨대, 인간)에 의한 식물 영양분의 더 나은 활용이 얻어진다. 하나의 양태에서, 동물의 성장 속도 및/또는 사료 전환률 (즉, 늘어난 체중에 상대적인 섭취된 사료의 중량)이 향상된다. 예컨대 부분적으로 또는 소화될 수 없는 자일란-함유 단백질이, 예컨대 다른 효소, 예컨대, 베타-갈락토시다제와 조합된 본 발명의 자일라나제에 의해, 펩티드 및 갈락토스 및/또는 갈락토올리고머로 완전히 또는 부분적으로 분해된다. 이들 효소 소화 생성물은 동물에 의해 더 잘 소화될 수 있다. 따라서, 본 발명의 자일라나제는 사료 또는 식품의 가용 에너지에 기여할 수 있다. 또한, 자일란 함유 단백질의 분해에 기여함으로써, 본 발명의 자일라나제는 탄수화물 및 단백질, 지방 및 미네랄과 같은 비-탄수화물 사료 또는 식품 성분의 소화가능성 및 섭취를 향상시킬수 있다.
다른 양태에서, 본 발명의 자일라나제는 그레인, 씨리얼, 옥수수, 대두, 평지씨, 루핀 등과 같은 유전자 전이 작물에서 직접 (예컨대, 유전자 전이 식물, 종자 등으로서) 발현시킴으로써 공급될 수 있다. 전술한 바와 같이, 본 발명은 본 발명의 폴리펩티드를 암호화하는 핵산 서열을 포함하는 유전자 전이 식물, 식물의 부분 및 식물 세포를 제공한다. 하나의 양태에서, 본 발명의 자일라나제가 복구 가능한 양으로 생성되도록 핵산이 발현된다. 자일라나제는 임의의 식물 또는 식물의 부분으로부터 복구될 수 있다. 대안적으로, 재조합 폴리펩티드를 함유하는 식물 또는 식물의 부분은 식품 또는 사료의 질을 향상시키기 위해, 예컨대, 영양가, 맛, 및 유동학적 성질를 향상시키는데, 또는 영양분 파괴 팩터를 분해시키기 위해 사용될 수 있다.
하나의 양태에서, 본 발명은 본 발명의 자일라나제를 사용하여 동물 개체에 의해 소비되기에 앞서 시료로부터 올리고사카리드를 제거하는 방법을 제공한다. 이 과정에서 사료는 증가된 대사가능한 에너지 값을 갖도록 형성된다. 본 발명의 자일라나제 뿐 아니라, 갈락토시다제, 셀룰라제 및 그것들의 조합이 사용될 수 있다. 하나의 양태에서, 효소가 사료 물질의 약 0.1%와 1중량% 사이와 동등한 양으로 첨가된다. 하나의 양태에서, 사료는 씨리얼, 밀, 그리엔, 대두 (예컨대, 그라인딩된 대두) 물질이다. 예컨대, 미국 특허 6,399,123 참조.
다른 양태에서, 본 발명은 아미노산 서열 B군의 아미노산이 적어도 30개 인접하는 아미노산을 포함하는 재조합 자일라나제 효소를 함유하는 영양분을 제조함으로써, 그리고 동물에 의해 섭취되는 식품에 함유된 자일란의 활용을 증가시키기 위해 동물에 영양분을 투여함으로써 동물의 식이에 영양분으로써 자일라나제를 활용하기 위한 방법을 제공한다.
또 다른 양태에서, 본 발명은 동물에게 예컨대 영양분으로서, 자일라나제를 공급하기 위한 식용 펠릿화된 효소 공급 매트릭스 및 사용 방법을 제공한다. 효소 공급 매트릭스는, 예컨대, 동물의 소화액과 같은 수성 매질에서 아미노산 서열 B군의 아미노산 서열, 또는 그것들의 적어도 30개의 인접한 아미노산을 갖도록 용이하게 자일라나제 효소를 방출한다. 본 발명의 효소 공급 매트릭스는 그레인 배아와 같은 성분으로부터 선택된 입자화된 식용 담체로부터 제조되며, 그것은 수성 매질 내로 그것에 함유된 재조합 효소를 용이하게 분산시키는 오일, 건초, 알팔파(alfalfa), 티모시(timothy), 대두피, 해바라기 씨 분말, 밀 미드(wheat midd), 등을 소비한다. 사용시, 동물에게 자일라나제를 공급하기 위해 식용 펠릿화된 효소 공급 매트릭스가 동물에게 투여된다. 밀, 옥수수, 대두, 수수, 알팔파, 보리 등과 같은 적절한 그레인계 기질을 함유하거나 또는 임의의 적절한 식용 그레인으로부터 유도된다. 예시적 그레인계 기질은 옥수수계 기질이다. 기질은 그레인의 임의의 적절한 부분으로부터 유도될 수 있지만, 바람직하게는, 습식 또는 건식 밀링 과정으로 얻어진 옥수수 배아와 같이 동물 사료 용도로 승인된 그레인 배아이다. 바람직하게는 그레인 배아는 스펜트 배아(spent germ)를 함유하며, 여기서 그레인 배아는, 예컨대 압착시킴으로써 또는 헥산 또는 다른 용매 추출에 의해 오일을 제거한 것이다. 대안적으로, 그레인 배아는 축출기로 추출되며, 즉 압착시킴으로써 오일이제거되었다.
본 발명의 효소 공급 매트릭스는 별개로 된 복수의 입자, 펠릿 또는 과립의 형태이다. "과립"은 매트릭스로부터 물을 제거하기 위해 펠릿화, 압출에 의해, 또는 유사하게 압축시킴으로써 압착되거나 압축된 입자를 의미한다. 입자의 그런 압착 또는 압축은 또한 입자의 입자내 응집을 향상시킨다. 예컨대, 펠릿 밀에서 그레인계 기질을 펠릿화함으로써 과립이 제조될 수 있다. 그렇게 제조된 펠릿을 그라인딩하거나 또는 부수어서 동물 사료에서 애쥬반트(adjuvant)로서 사용하기에 적절한 과립 크기가 되게 한다. 매트릭스 그 자체가 동물 사료로 사용하도록 승인되기 때문에, 그것은 동물 사료 중에 효소의 공급을 위해 희석제로서 사용될 수 있다.
바람직하게는, 효소 공급 매트릭스는 과립 크기 약 4 내지 약 400 메시 (USS); 더 바람직하게는, 약 8 내지 약 80 메시; 및 가장 바람직하게는 약 14 내지 약 20 메시 범위를 갖는 과립의 형태이다. 만약 그레인 배아가 용매 추출을 경유하여 소비된다면, 옥수수 오일과 같은 광택제의 사용이 펠릿화 장비에 필수적일 수 있지만, 만약 배아가 축출기로 추출된다면 그런 광택제는 일반적으로 필요하지 않다. 본 발명의 다른 양태에서, 다른 압축 및 압착 과정에 의해, 예컨대, 압출물의 다이 및 그라인딩을 통해 그레인계 기질을 추출시킴으로써 적절한 과립 크기로 매트릭스가 제조된다.
효소 공급 매트릭스는 매트릭스 과립의 응집성을 향상시키기 위해 응집제로서 폴리사카리드 성분을 더 함유할 수 있다. 응집제는 매트릭스 과립 내의 그레인 단백질 사이의 결합을 향상시키는 추가의 하이드록실 기를 제공하는 것으로 여겨진다. 또한 전분 및 다른 단백질에 대한 단백질의 수소 결합을 강화시킴으로써 추가의 하이드록실 기가 작용하게 되는 것으로 여겨진다. 응집제는 효소 공급 매트릭스의 과립의 응집을 향상시키는데 적절한 임의의 양으로 존재할 수 있다. 적절한 응집제는 1 또는 그 이상의 덱스트린, 말토덱스트린, 전분, 예컨대 옥수수 전분, 분말(flours), 셀룰로스 물질, 헤미셀룰로스 물질, 등을 포함한다. 예컨대, 그레인 배아 및 응집제의 매트릭스 중 (효소를 함유하지 않는) 퍼센트는 78% 옥수수 배아 분말 및 20중량%의 옥수수 전분이다.
본 발명의 효소-방출 매트릭스는 생물 분해 가능 물질로부터 만들어지기 때문에, 매트릭스는, 예컨대 몰딩으로써 부패의 대상이 될 수 있다. 그런 몰딩을 막거나 또는 방지하기 위해, 매트릭스는 프로피오네이트 염과 같은 몰딩 억제제를 함유할 수 있으며, 이는 효소-방출 매트릭스의 몰딩을 억제하기에 충분한 임의의 양으로 존재할 수 있으며, 따라서 공급 매트릭스로 하여금 냉장을 요하지 않는 안정한 제제로 존재하게끔 제공된다.
본 발명의 효소 공급 매트릭스 및 방법에 포함된 자일라나제 효소는 바람직하게는, 전술한 것으로서, 제조 동안 자일라나제의 불활성을 방지하도록 내열성 자일라나제이며, 여기서 상승 온도 및/또는 기류가 펠릿화된 효소 공급 매트릭스를 제조하는데 사용될 수 있다. 본 발명의 효소 공급 매트릭스를 함유하는 사료의 소화 동안, 수성 소화액이 활성 효소의 방출을 초래할 수 있다. 다른 종류의 내열성 효소 및 내열성인 영양분이 또한 임의의 종류의 수성 조건 하에서 방출되기 위해 공급 매트릭스 중에 도입될 수 있다.
동물 사료에 맛 또는 영양분을 추가하기 위해, 위와 같은 조건에서 동물 사료의 영양분과 효소의 방출을 지연시키기 위한 것 등과 같이 다양한 상이한 목적으로 본 발명의 효소 매트릭스 입자에 코팅이 적용될 수 있다. 또는 예컨대, 매트릭스 입자로부터 효소를 느리게 방출하거나 또는 효소가 방출되게 되는 조건 하에서 조절되는 것이 바람직한 때에는 언제라도, 기능적 목적을 얻기 위해 코팅이 적용될 수 있다. 코팅재의 조성물은 그것이 민감한 것 (예컨대 열, 산 또는 염기, 효소 또는 다른 화학물질)으로서 시약에 의해 선택적으로 분해되는 그런 것일 수 있다. 대안적으로, 상이한 분해 시약에 민감한 2 또는 그 이상의 코팅이 매트릭스 입자에 연속하여 적용될 수 있다.
본 발명은 또한 효소-방출 매트릭스를 제조하는 방법에 관한 것이다. 본 발명에 따라, 그 방법은 효소-방출 매트릭스로서 사용되기에 적절한 입자 크기로 그레인계 기질의 별개의 복수의 입자를 제공하는 것을 포함하며, 여기서 그 입자는 아미노산 서열 B군의 아미노산 서열 또는 그것의 적어도 30개의 인접하는 아미노산에 의해 암호화된 자일라나제 효소를 함유한다. 바람직하게는, 그 방법은 효소-방출 매트릭스의 입자를 과립으로 압축 또는 압착하는 것을 포함하며, 가장 바람직하게는 펠릿화에 의해 수행된다. 몰딩 억제제 및 응집제는, 사용되는 경우, 임의의 적절한 시간에 첨가될 수 있으며, 그리고 바람직하게는 그레인계 기질의 펠릿화에 앞서 소정의 분율로 그레인계 기질과 혼합된다. 펠릿 밀(mill) 사료 중에 수분 함량은 바람직하게는 최종 생성물 중에 수분 함량에 맞춰 전술한 범위이며, 바람직하게는 약 14-15%이다. 바람직하게는, 이 수분 함량을 갖도록 효소의 수성 제제의 형태로 공급원료에 수분이 첨가된다. 펠릿 밀의 온도는 바람직하게는 증기로서 약 82℃로 공급된다. 펠릿 밀은 공급원료가 펠릿을 제공하도록 충분한 작업에 참여하는 임의의 조건 하에서 작동될 수 있다. 펠릿화 과정 그 자체는 효소-함유 조성물로부터 물을 제거하기 위한 비용-효율적 과정이다.
하나의 양태에서, 펠릿 밀은 1/8 in. × 2 in. 다이로 100 lb./min 압력에서 82℃에서 작동하여 펠릿을 제공하며 이후 펠릿 밀 크럼블러(crumbler)에서 부숴져서 8 메시 스크린을 통과할 수 있지만 20 메시 스크린에는 남게 되는 입자 크기를 갖는 분리된 복수의 입자를 제공한다.
내열성의 본 발명의 자일라나제는 본 발명의 펠릿에 사용될 수 있다. 그들은 효소 반응이 여기 언급되지 않은 온도에서 수행되는 것이 가능할 수 있도록 최적 온도 및 최고 열 내성을 가질 수 있다. 본 발명에 따른 자일라나제를 암호화하는 유전자 (예컨대 A군 핵산 서열 중에 임의의 서열로 기재된 것)는 B군 아미노산 서열의 자일라나제와는 상이한 특성 (최적 pH, 최적 온도, 열 내성, 용매에 대한 안정성, 특정 활성, 기질에 대한 친화도, 분비 능력, 번역 속도, 전사 제어 등)을 갖는 자일라나제의 제조에 사용될 수 있다 (예컨대 전술한 GSSMTM사용). 또한, A군 핵산 서열의 폴리뉴클레오티드는, 그들이 향상되거나 또는 변형된 내열성 또는 열안정성과 같은 목적하는 성질을 갖는지 측정하기 위해 본원에 기재된 방법으로 제조된 다양한 자일라나제의 스크리닝을 위해 사용될 수 있다. 예컨대, 미국 특허 5,830,732는 자일라나제의 내열성을 측정하기 위한 스크리닝 분석을 기재하고 있다.
폐기물 처리
본 발명의 자일라나제는 다양한 다른 산업 응용, 예컨대, 폐기물 처리에 사용될 수 있다. 예컨대, 하나의 양태에서, 본 발명은 본 발명의 자일라나제를 사용하는 고체 폐기물 분해 과정을 제공한다. 그 방법은 실질적으로 처리되지 않은 고체 폐기물의 질량과 부피를 감소시키는 것을 포함할 수 있다. 고체 폐기물은 (본 발명의 자일라나제를 함유하는) 효소 용액의 존재 하에서 조절된 온도로 효소적 분해 과정으로 처리될 수 있다. 이는 추가되는 미생물로부터 감지할 수 있는 박테리아 발효가 없는 반응을 초래한다. 고체 폐기물은 액화 폐기물 및 임의의 잔류 고체 폐기물로 전환된다. 만들어진 액화 폐기물은 상기 임의의 잔류 고체화된 폐기물로부터 분리될 수 있다. 예컨대, 미국 특허 5,709,796 참조.
구강 보호 제품
본 발명은 본 발명의 자일라나제를 함유하는 구강 보호 제품을 제공한다. 예시적 구강 보호 제품은 치약, 치과용 크림, 젤 또는 치분, 치아(odontics), 구강 세척제, 양치 전후 세정 제제, 츄잉 검, 로젠지, 또는 캔디를 포함한다. 예컨대, 미국 특허 6,264,925 참조.
양조 및 발효
본 발명은 본 발명의 자일라나제를 함유하는 맥주의 양조 (예컨대, 발효) 맥주 방법을 제공한다. 하나의 예시적 방법에서, 전분 함유 원재료가 분해되고 가공되어 몰트(malt)를 형성한다. 본 발명의 자일라나제는 발효 과정 중 임의의 시점에사용된다. 예컨대, 본 발명의 자일라나제는 보리 몰트의 가공 중에 사용될 수 있다. 맥주 양조의 주된 원재료는 보리 몰트이다. 이것은 3단계 과정일 수 있다. 먼저, 보리 그레인을, 예컨대, 약 40% 부근으로 수분 함량이 증가하도록 담글 수 있다. 두번째, 지베렐린의 조절 하에서 효소 합성이 자극될 때, 그레인을 15 내지 25℃에서 3 내지 6일 동안 인큐베이션함으로써 발아시킬 수 있다. 하나의 양태에서, 본 발명의 자일라나제가 과정 중 이 단계 (또는 임의의 다른 단계)에 첨가된다. 본 발명의 자일라나제는, 예컨대, 미국 특허 5,762,991; 5,536,650; 5,405,624; 5,021,246; 4,788,066에 기재된 방법으로 제조된 임의의 맥주 또는 알콜성 음료에 사용될 수 있다.
하나의 양태에서, 본 발명의 효소는 여과성 및 맥아즙 점도를 향상시키기 위해 그리고 배유 성분의 더 완전한 가수분해를 얻기 위해 사용된다. 본 발명의 효소의 사용은 또한 추출 수득률을 증가시킨다. 양조의 과정은 보리 그레인의 발아 (몰팅, malting) 이어서 저장된 탄수화물의 추출 및 분해로 효모에 의해 알콜 발효를 위해 사용되는 간단한 당을 얻는 것을 포함한다. 보리 배유 및 양조 부가물 중에 존재하는 예비적 탄수화물의 효율적인 분해는 몇가지 상이한 효소의 활성을 요한다.
하나의 양태에서, 본 발명의 효소는 약산성 pH (예컨대, 5.5-6.0), 예컨대, 40℃ 내지 70℃ 온도 범위에서 활성을 가지며; 그리고, 하나의 양태에서, 95℃에서 불활성이다. 그런 조건 하에서 활성은 최적이지만, 효율성에 필수적인 요구사항은 아니다. 하나의 양태에서, 본 발명의 효소는 40-75℃ 사이, 및 pH 5.5-6.0에서 활성을 가지며; 70℃에서 적어도 50분 동안 안정하며, 그리고, 하나의 양태에서, 96-100℃에서 불활성이다. 본 발명의 효소는 다른 효소, 예컨대, 베타-1,4-엔도글루카나제 및 아밀라제와 함께 사용될 수 있다.
의학 및 연구 응용
본 발명의 자일라나제는 그들의 박테리아 분해 성질에 의해 항미생물제로서 사용될 수 있다. 본 발명의 자일라나제는, 예컨대, PCT 출원 WO0049890 및 WO9903497에 기재된 바와 같이 살모넬라로부터 동물을 보호하거나 그것을 제거하는데 사용될 수 있다.
다른 산업상 응용
아미노산 서열 B군이 광범위한 식품, 동물 사료 및 음료 응용에 사용되는 것을 포함하여, 본 발명의 자일라나제가 사용될 수 있다. 다양하게 중온성 및 적당히 고온성 위치 뿐 아니라 소화성 식물군, 동물 폐기물 중의 미생물, 토양 박테리아 및 높은 알칼리성 거주물을 포함하는 목적하는 공급원으로 구축된 기존 라이브러리 및 DNA 라이브러리를 스크리닝함으로써 신규한 자일라나제가 발견되었다. 1차적 동물 사료 물질의 아라비노자일란 기질 및/또는 불용성 폴리사카리드 분율을 사용하는 생물학적 트랩 및 1차적 농축 전략이 또한 유용하다.
두개의 스크리닝 포맷 (활성 기초 및 서열 기초)이 신규한 자일라나제를 발견하는데 사용되었다. 활성 기초 접근은 아조-자일란(AZO-xylan, Megazyme)과 같은 기질을 사용하여 아가(agar) 플레이트에서 자일라나제 활성에 대한 직접 스크리닝하는것이다. 대안적으로 서열 기초 접근이 사용될 수 있으며, 이는 혼성 및 생물패닝(biopanning)에 대한 프로브(probe)를 디자인하기 위한 생물 정보학 및 분자 생물학에 좌우된다. 예컨대, 미국 특허 6,054,267, 6,030,779, 6,368,798, 6,344,328 참조. 기본적인 생화학적 성질을 위해, 스크리닝으로부터 히트(hit)가 정제되고, 서열화되고, 특성화되고 (예컨대, 퇴적 특이성, 온도 및 pH의 측정), 생물 정보학을 사용하여 분석되고, 서브클로닝되고 그리고 발현된다. 이들 방법은, 반죽 컨디셔닝 및 동물 사료 첨가제 효소를 포함하는 무수한 응용에 유용한 자일라나제에 대한 스크리닝에 사용될 수 있다.
스크리닝으로부터 얻은 효소를 특성화하는데 있어, 반죽 가공 및 베이킹 응용시 예시적 사용이 평가될 수 있다. 특성화는, 예컨대, 기질 특이성 (자일란, 아라비노자일란, CMC, BBG), 온도 및 pH 안정성 및 특정 활성의 측정을 포함할 수 있다. 상업상 구입할 수 있는 효소가 기준점으로서 사용될 수 있다. 하나의 양태에서, 본 발명의 효소는 pH > 7 및 25-35℃에서 명백한 활성을 가지며, 불용성 자일란 상에서 불활성이며, 50-67% 수크로스에서 안정하고 활성이다.
다른 양태에서, 후보 효소의 특성화로부터 사료 첨가제로서의 활용이 평가될 수 있다. 특성화는, 예컨대, 기질 특이성 (자일란, 아라비노자일란, CMC, BβG), 온도 및 pH 안정성, 특정 활성 및 위장관 활성의 측정을 포함할 수 있다. 하나의 양태에서 사료는 단일 위 동물에 대해 디자인되며 그리고 다른 양태에서 사료는 반추 동물에 대해 디자인되었다. 하나의 양태에서, 본 발명의 효소는 pH 2-4 및 35-40℃에서 맹백한 활성, 소화 유체에서 30분 이상의 반감기, 85℃에서 5분 이상의 제제 (완충액 또는 세포에서) 반감기를 가지며 단일 위 동물 사료 첨가제로서 사용된다. 다른 양태에서, 본 발명의 효소는 1 또는 그 이상의 다음의 성질을 가진다: pH 6.5-7.0 및 35-40℃에서 명백한 활성, 반추(rumen) 유체에서 30분 이상의 반감기, 건조 분말로서 안정하고 반추 동물 사료 첨가제로서 사용되는 제제 안정성.
효소는 광범위한 천연 및 합성(unnatural) 기질에 대해 반응성이며, 따라서 임의의 유기 납 화합물을 실질적으로 변형시키는 것이 가능하다. 게다가, 종래의 화학 촉매와 달리, 효소는 상당히 거울상 이성질체-특이적 및 위치-특이적이다. 효소에 의해 나타내어지는 높은 수준의 작용기 특이성은 신규한 화합물을 유도하는 합성 서열에서 각 반응의 트랙을 유지하는 것을 가능하게 한다. 효소는 또한 본래 그들의 생리적 작용과 무관한 많은 다양한 반응을 촉매할 수 있다. 예컨대, 퍼옥시다제는 과산화수소에 의한 페놀의 산화를 촉매한다. 퍼옥시다제는 또한 그 효소의 본래 작용과 관련이 없는 수소화 반응을 촉매할 수 있다. 다른 예는 폴리펩티드의 분해를 촉매하는 자일라나제이다. 유기 용액에서 어떤 자일라나제는 또한 이들 효소의 본래 작용과 무관한 기능으로서 설탕을 아실레이트화 할 수 있다.
본 발명은 효소의 유일한 촉매적 성질을 개발하였다. 화학적 변이에서 생물 촉매 (즉, 정제되거나 또는 조 효소, 무생물 또는 생물 세포)의 사용은 특정 출발 화합물과 반응하는 특정 생물촉매의 인식을 정상적으로 필요로 하는 반면, 본 발명은 다양한 출발 화합물에 존재하는 작용기에 특이적인 반응 조건 및 선택된 생물촉매를 사용한다. 각 생물촉매는 하나의 작용기 또는 여러개의 관련 작용기에 특이적이고 그리고 이 작용기를 함유하는 많은 출발 화합물과 반응할 수 있다. 생물촉매 반응은 하나의 출발 화합물로부터 다수의 유도체를 제조해낸다. 이들 유도체는 다음 라운드의 생물촉매 반응의 대상이 될 수 있으며 유도체 화합물의 2차 집단을 제조해낸다. 생물촉매 유도체화가 각각 반복되어 본래 화합물의 수천가지 유도체가 제조될 수 있다.
효소는 분자의 나머지에 영향을 미치지 않으면서 출발 화합물의 특정 부위에서 반응하며, 그 과정은 종래의 화학적 방법을 사용하여서는 얻기 상당히 어렵다. 이런 높은 수준의 생물촉매적 특이성은 라이브러리 내에서 단일 활성 화합물을 인식하는 수단을 제공한다. 라이브러리는, 소위 "생물 합성 히스토리"라고 불리는 것을 만들어내기 위해 사용되는 일련의 생물촉매 반응으로 특성화된다. 생물학적 활성에 대한 라이브러리의 스크리닝 및 생물 합성 히스토리의 추적은 활성 화합물을 제조해내는 특정 반응 서열을 확인한다. 그 반응 서열이 반복되고 그리고 합성된 화합물의 구조가 결정된다. 이런 인식 모드는, 다른 합성 및 스크리닝 접근과 달리, 고정화 기술을 필요로 하지 않으며 실질적으로 임의의 유형의 스크리닝 분석을 사용하여 용액에서 화합물들이 자유롭게 합성되고 테스트될 수 있다. 작용기에 대한 효소 반응의 높은 수준의 특이성이, 생물 촉매적으로 제조된 라이브러리를 메이크업하는 특정 효소 반응의 "트랙킹(tracking)"을 허용한다는 것이 중요하다.
하루 동안에 생물촉매 반응 및 스크리닝 분석을 수행하는 것을 가능하게 하며 게다가 높은 수준의 정밀도 및 재현성을 보장하는 로보트 자동화를 이용하여 많은 과정의 단계가 수행되었다. 결과적으로, 현재의 화학적 방법으로 수년이 걸리게 되는 유도체 화합물의 라이브러리가 몇 주 만에 이루어질 수 있다. (소형 분자를 포함하는 분자의 변형에 대한 추가의 교시는 PCT/US94/09174 참조).
본 발명은 이하의 실시예를 참조로 더 설명될 것이지만; 다만, 그런 실시예가 본 발명을 제한하지 않는 것으로 이해되어야 한다.
실시예 1: 플레이트를 기초로 한 엔도글리코시다제 효소 발견: 발현 스크리닝
람다 라이브러리(Lambda Library)의 역가(titer) 측정: 1.0 ㎕의 람다 Zap 발현 증폭 라이브러리 스탁을 600㎕ 대장균(E.coli) MRF' 세포 (OD600=1.0)에 첨가하였다. MRF' 스탁을 10mM MgS04로 희석하였다. 혼합물을 37℃에서 15분 동안 배양하고, 이후 현탁액을 5-6mL의 NZY 탑 아가(top agar)로 50℃에서 이동시키고 부드럽게 혼합하였다. 아가 용액을 즉시 대형 (150mm) NZY 배지 플레이트에 쏟아붓고 그리고 탑 아가를 완전히 고형화되도록 방치하였다 (대략 30분).
플레이트를 돌려놓았다. 플레이트를 39℃에서 8-12시간 동안 배양하였다(플라그의 갯수를 추정하였다. 50,000 pfu/플레이트가 되도록 파지 역가를 측정하였다. 필요하다면 라이브러리 파지의 분취량을 SM 완충액으로 희석하였다.).
기질 스크리닝: 증폭된 라이브러리로부터 얻은 람다 Zap Express (50,000pfu)를 600㎕의 대장균 MRF' 세포 (OD600=1.0)에 첨가하고 37℃에서 15분 동안 배양하였다. 파지/세포 현탁액을 배양하는 동안, 1.OmL의 목적하는 폴리사카리드 염료-라벨링된 기질 (일반적으로 1-2% w/v)을 50℃에서 5.0mL NZY 탑 아가에 첨가하고 완전히 혼합하였다. (필요할 대까지 용액을 50℃로 유지하였다.) 세포 현탁액을 기질/탑 아가 용액으로 옮기고 부드럽게 혼합하였다. 용액을 대형 (150mm) NZY 배지 플레이트에 즉시 쏟아부었다. 탑 아가를 완전히 고형화되도록 방치하고 (대략 30분), 이후 플레이트를 돌려놓았다. 플레이트를 39℃에서 8-12시간 동안 배양하였다. 플라그 주변의 청정 영역 (헤일로, halo)에 대해 플레이트를 관찰하였다. 코어 플라그와 헤일로를 아가로부터 걷어내고 무균 마이크로 튜브에 이동시켰다. (대형 입구의 200㎕ 피펫 팁으로 목적하는 플라그를 함유하는 아가 플러그 (코어)로부터 제거하는 것이 용이하다. 파지를 500㎕의 SM 완충액에 재현탁시켰다. 20㎕의 클로로포름을 첨가하여 임의의 추가의 세포 성장을 억제하였다.
순수 클론의 분리: 5㎕의 재현탁된 파지 현탁액을 500㎕의 대장균 MRF' 세포 (OD600=1.0)에 첨가하였다. 37℃에서 15분 동안 배양하였다. 파지/세포 현탁액이 배양되는 동안, 600㎕의 목적하는 폴리사카리드 염료-라벨링된 기질 (일반적으로 1-2% w/v)을 3.0mL NZY 탑 아가에 50℃에서 첨가하고 완전히 혼합하였다. (필요할 때까지 용액을 50℃로 유지하였다.) 세포 현탁액을 기질/탑 아가 용액으로 옮기고 부드럽게 혼합하였다. 용액을 소형 (90mm) NZY 배지 플레이트에 즉시 쏟아부었으며 탑 아가를 완전히 고형화되도록 방치하고 (대략 30분), 이후 플레이트를 돌려놓았다. 플레이트를 39℃에서 8-12시간 동안 배양하였다. 단일 플라그 (순수 클론) 주변의 청정 영역 (헤일로)에 대해 플레이트를 관찰하였다. (만약 단일 플라그가 분리될 수 없다면, 역가를 맞추고 파지 현탁액을 재플레이팅한다.) 파지를 500㎕의SM 완충액에 재현탁시켰으며 20㎕의 클로로포름을 첨가하여 임의의 추가의 세포 성장을 억제하였다.
순수 클론의 절단: 실온에서 2 내지 3시간 동안 또는 4℃에서 밤새 배양되도록 순수 파지 현탁액을 방치하였다. 100㎕의 순수 파지 현탁액을 200㎕의 대장균 MRF' 세포 (OD600=1.0)에 첨가하였다. 1.O㎕의 ExAssist 헬퍼 파지 (> 1 × 106pfu/mL; Stratagene)을 첨가하였다. 현탁액을 37℃에서 15분 동안 배양하였다. 3.0 mL의 2 × YT 배지를 세포 현탁액에 첨가하였다. 37℃에서 2-2.5시간 동안 진동시키면서 배양하였다. 튜브를 70℃로 20분 동안 이동시켰다. 50-100 ㎕의 파지미드(phagemid) 현탁액을 200㎕의 대장균 Exp 505 세포 (OD600=1.0)를 함유하는 마이크로 튜브로 이동시켰다. 현탁액을 37℃에서 45분 동안 배양하였다. 100㎕의 세포 현탁액을 LBkan 50배지 (카나마이신 50㎍/mL을 갖는 LB 배지) 상에 플레이팅하였다. 현탁액을 37℃에서 8-12시간 동안 배양하였다. 콜로니에 대해 플레이트를 관찰하였다. 성장하는 임의의 콜로니는 순수 파지미드를 함유한다. 콜로니를 들어올리고 소형 (3-lOmL) 액체 배양물로 8-12시간 동안 성장시켰다. 배양 배지는 LBkan 50이다.
활성 검증: 1.OmL의 액체 배양물을 무균의 마이크로 팁으로 옮겼다. 13200 rpm (16000 g)에서 1분 동안 원심분리하였다. 상청액을 버리고 200㎕의 인산 완충액 pH 6.2를 첨가하였다. 얼음 상에서 마이크로 팁을 사용하여 5 내지 10초 동안 초음파처리하였다. 200㎕의 적절한 기질을 첨가하고, 부드럽게 혼합하고 37℃에서1.5-2시간 동안 배양하였다. 단지 버퍼와 기질만을 함유하는 음성 대조군을 또한 작동시켰다. 1.OmL의 무수 에탄올 (200도)을 현탁액에 첨가하고 혼합하였다. 13200 rpm에서 10분 동안 원심분리하였다. 상청액의 색을 관찰하였다. 착색량은 다양할 수 있지만, 임의의 튜브에 대해서도 활성에 대해 양성으로 고려되는 대조군보다 더 착색되었다. 만약 목적하거나 또는 필요하다면 이 단계에서 분광분석기가 사용될 수 있다. (아조-자일란, Megazyme, 590nm에서 읽음).
몇가지 라이브러리로부터 얻은 순수 클론의 RFLP: 1.OmL의 액체 배양물을 무균의 마이크로 튜브로 옮겼다. 13200 rpm (16000 g)에서 1분 동안 원심분리하였다. 플라스미드 분리를 위한 QIAprep 스핀 미니 키트 (Qiagen) 프로토콜이 이어졌으며 용출 완충액으로 40㎕의 성수가 사용되었다. 10㎕의 플라스미드 DNA를 무균의 마이크로 튜브로 옮겼다. 1.5 ㎕의 완충액 3 (New England Biolabs), 1.5㎕ 100× BSA 용액 (New England Biolabs) 및 2.0㎕ 성수를 첨가하였다. 여기에 1.O㎕ Not 1 및 1.0㎕ Pst 1 제한 엔도뉴틀레아제 (New England Biolabs)를 첨가하였다. 1.5시간 동안 37℃에서 배양하였다. 3.0㎕의 6× 로딩 버퍼 (Invitrogen)를 첨가하였다. 15㎕의 분해된 시료를 1.0% 아가로스 젤 상에 1-1.5시간 동안 120 볼트에서 전개시켰다. 젤 이미지 출력기로 젤을 관찰하였다. 상이한 분해 패턴으로 모든 클론 상에서 서열 분석을 수행하였다.
표 6은 본 발명의 예시적 효소의 다양한 특성을 기재한 것이다.
* 기질로서 AZO-AZO-자일란을 사용하는 초기 속력에 의해 결정된 최적 pH 또는 온도
** 효소가 명백한 활성 (대략 > 50%)을 유지하는 열 안정성, 시간
*** 반죽 컨디셔닝
**** 동물 사료 응용에 대한 내열성 발달에 대한 GSSMTM페어런트
***** -공지의 지식을 기초로- 낮은 pH 활성의 증가하도록 이루어진 N35D 돌연변이 - 돌연변이 효소의 상대적 활성이 pH 4에서 현저하게 증가하였다
****** 반죽 컨디셔닝
실시예 2: 내열성 돌연변이체에 대한 GSSM
TM
스크린
이하의 실시예는 내열성 효소에 대한 예시적 스크리닝 방법을 기재한 것이다.
마스터 플레이트: 96 웰 플레이트를 라벨링함으로써 및 200 ㎕ LB Amp100을 각 웰로 분취함으로써 콜로니 수확기(picker)에 대한 플레이트를 제조하였다. (96 웰 플레이트 당 ~20ml 필요). 수확기로부터 플레이트를 되돌려보낸 이후, 플레이트 A로부터 6열로부터 배지를 제거하였다. 서열 번호 189의 배양물로 대치하였다. 37℃ 습윤 인큐베이터에서 밤새 방치하였다.
분석 플레이트: 신선한 96 웰 플레이트 내에서 배양물을 찍어내었다 (200㎕/웰 LB Amp 100). 플라스틱 커버를 제거하고 기체 투과성 밀봉으로 대치하였다. 습윤 인큐베이터에서 밤새 방치하였다. 밀봉을 제거하고 플라스틱 뚜껑으로 대치하였다. 배양물을 테이블 상에서 하향 회전시키고 3000 rpm에서 10분 동안 원심분리하였다. 종이 타올 상에서 전환시킴으로써 상청액을 제거하였다. 45㎕ Cit-Phos-KCl 버퍼 pH 6을 각 웰 내로 분취하였다. 플라스틱 뚜껑을 알루미늄 플레이트 밀봉으로 대치하였다. 롤러를 사용하여 우수한 밀봉을 얻었다. 세포를 플레이트 진동기에서 6-7 레벨로 ~30초 동안 재현탁시켰다.
96 웰 플레이트를 80℃ 인큐베이터에 20분 동안 위치시켰다. 겹치지 않게 한다. 이후, 즉시 플레이트를 제거하고 얼음물로 몇초 동안 냉각시켰다. 알루미늄 밀봉을 제거하고 플라스틱 뚜껑으로 대치하였다. 30㎕의 2% 아조-자일란을 첨가하였다. 플레이트 진동기 상에 올리기 이전에 혼합하였다. 37℃에서 습윤 인큐베이터에서 밤새 배양하였다.
200㎕ 에탄올을 각 웰에 첨가하고 수회 피펫을 들어올렸다 내렸다 하면서 혼합하였다. 대안으로서 각 회마다 팁을 교환하고, 에탄올 세척으로 세정하고 종이 타올로 닦아냄으로써 건조시켰다. 플레이트를 3000 rpm에서 10분 동안 회전시켰다. 신선한 96 웰 플레이트에서 100㎕의 상청액을 제거하였다. OD590을 읽었다.
실시예 3: 내열성 돌연변이체의 히트 검증을 위한 GSSM
TM
분석
이하의 실시예는 내열성 효소를 분석하는 예시적 방법을 기재하고 있다.
이중의 96 웰 플레이트 내에서 배양물을 찍어내거나 또는 들어올렸다 (200㎕/웰 LB Amp 100). 플라스틱 커버를 제거하고 기체 투과성 밀봉으로 대치하였다. 습윤 인큐베이터에서 밤새 방치하였다. 밀봉을 제거하고 플라스틱 뚜껑으로 대치하였다. 고형 아가로 클론을 찍어내었다. 배양물을 테이블 상에서 하향 회전시키고 3000 rpm에서 10분 동안 원심분리하였다. 종이 타올 상에서 전환시킴으로써 상청액을 제거하였다. 25㎕ BPER/리소자임/DNase 용액 (이하 참조)을 각 웰 내로 분취하였다. 세포를 플레이트 진동기에서 6-7 레벨로 ~30초 동안 재현탁시켰다.
얼음 상에서 15분 동안 배양하였다. 20㎕의 Cit-Phos-KCl 버퍼 pH 6을 각 웰내로 첨가하였다. 플라스틱 뚜껑을 알루미늄 플레이트 밀봉으로 대치하였다. 롤러를 사용하여 우수한 밀봉을 얻었다. 세포를 플레이트 진동기에서 6-7 레벨로 ~30초 동안 혼합하였다.
하나의 96 웰 플레이트를 80℃ 인큐베이터에 다른 것은 37℃에서 20분 동안 위치시켰다. 겹치지 않게 한다. 즉시 플레이트를 제거하고 얼음물로 몇초 동안 냉각시켰다 (필요하다면 대형 플라스틱 트레이를 사용한다). 알루미늄 밀봉을 제거하였다. 30㎕의 2% 아조-자일란을 첨가하였다. 플라스틱 기체 투과성 밀봉으로 밀봉하였다. 플레이트 진동기 상에 올리기 이전에 혼합하였다. 37℃ 및 80℃ 플레이트 세트를 습윤 인큐베이터에서 37℃에서 2시간 동안 나머지는 4시간 동안 배양하였다.
배양 이후, 플레이트를 ~5분 동안 실온에 방치시켰다. 200㎕ 에탄올을 각 웰에 첨가하고 수회 피펫을 들어올렸다 내렸다 하면서 혼합하였다. 각 회마다 팁을 교환하는 대신, 에탄올 세척으로 세정하고 종이 타올로 닦아냄으로써 건조시켰다. 플레이트를 3000 rpm에서 10분 동안 회전시켰다. 다만, 각 클론에 대해 새로운 세트의 팁을 사용하였다. 3000rpm에서 10분 동안 플레이트를 회전시켰다. OD590을 읽었다.
BPER/리소자임/DNase 용액 (총 4.74 mL):
4.5 mL BPR
200 ㎕ 10 mg/mL 리소자임 (pH 6 Cit-phos-버퍼로 신선하게 만들어짐)
40 ㎕ 5 mg/mL DNase I (pH 6 Cit-phos-버퍼로 신선하게 만들어짐)
실시예 4: 기질로서 밀 아라비노자일란을 사용한 자일라나제 분석
이하의 실시예는, 본 발명의 범위 내에서 예컨대, 효소를 측정하기 위해 사용될 수 있는 예시적 자일라나제 분석을 기재하고 있다.
SEQ ID NOS: 11, 12, 69, 70, 77, 78, 113, 114, 149, 150, 159, 160, 163, 164, 167, 168, 181, 182, 197, 및 198이 pH 8 (Na-인산 버퍼) 및 70℃에서 밀 아라비노자일란을 기질로서 사용하는 분석의 대상이 되었다. 효소는 표 7에 기재된 바와 같이 특성화되었다.
* 각 시료에 1 mL의 물을 첨가하는 것에 기초함.
단위는 환원당 분석을 기초로 분 당 방출된 μ몰 자일로스이다.
실시예 5: 본 발명의 예시적 자일라나제의 제조
이하의 실시예는 "9×" 변이체 또는 돌연변이체 (서열 번호 377로 기재된 핵산, 서열 번호 378로 기재된 폴리펩티드 서열)로서 표시되는 유전자 부위-포화 돌연변이 유도 (GSSMTM) 기술을 사용하여 본 발명의 예시적 자일라나제의 제조를 기재하고 있다.
(서열 번호 189에 의해 암호화된) 예시적 서열 번호 190, "야생형" 자일라나제에서 점 돌연변이의 포괄 라이브러리(comprehensive library)를 제조하는데 있어 GSSMTM이 사용되었다. 전술한 자일라나제 내열성 스크린은 야생형 효소에 비해 향상된 내열성을 갖는 9개의 단일 부위 아미노산 돌연변이를 확인시켜 주었다 (도 6A) (D8F, Q11H, N12L, G17I, G60H, P64V, S65V, G68A & S79P) (80℃에서 20분 동안 이하의 열 자극으로 측정됨). 야생형 효소 및 모든 9개의 단일 부위 아미노산 돌연변이체는 대장균에서 생성되었으며 N-말단 헥사히스티딘 택(tag)을 이용하여 정제되었다. 택에 의한 활성의 차이는 감지할 수 없었다.
도 6은 "변이체 9×", 또는, (서열 번호 189에 의해 암호화되는) 예시적 서열 번호 190 "야생형" 효소의 유전자 부위 포화 돌연변이 유도 (GSSMTM)에 의해 발생된 것으로서 (서열 번호 377에 의해 암호화되는) 서열 번호378로 기재된 것인 9개의 단일 부위 아미노산 돌연변이체를 도시하고 있다. 도 6A는 "야생형" 유전자 (서열 번호 189에 의해 암호화된 서열 번호 190)의 내열성 점 돌연변이에 대한 위치, 번호 및 아미노산 변화를 도시하는 개략도이다. 유전자에서 모든 아미노산 위치마다 전체 64 코돈의 라이브러리가 생성되었으며 (~13,000 돌연변이체) 내열성이 증가된 돌연변이체를 스크리닝하였다. 9개의 단일 부위 돌연변이체를 하나의 효소로 조합함으로써 "9×" 변이체가 생성되었다. 각 돌연변이체 효소에 대해 대응하는융점 온도 전이 중간지점 (Tm)은 DSC에 의해 측정되었으며 "9×" (서열 번호 378) 변이체를 오른쪽에 보였다. 도 6B는 폴딩되지 않은 "야생형" (서열 번호 190) "9×" (서열 번호 378)를 도시하였다. "변이체/돌연변이체" 효소가 DSC에 의해 주사 속도 1℃/min으로 모니터링되었다. 베이스라인을 감안한 DSC 데이타가 단백질 농도에 대해 표준화되었다.
자일라나제 활성 분석
550㎕의 CP (시트레이트-포스페이트) 버퍼, pH 6.0 지시된 온도에서 400㎕의 2% 아조-자일란을 기질로써 사용하여 효소 활성이 측정되었다. pH의 함수로서 활성의 측정은 50 mM Britton 및 Robinson 버퍼 용액 (pH 3.0, 5.0, 6.0, 7.0, 8.0 및 9.0)을 사용하여 측정되었으며 이는 0.1 M 인산 용액, 0.1M 붕산 및 0.1 M 아세트산을 혼합하으로써 이어서 1 M 수산화 나트륨으로 pH를 조정함으로써 제조되었다. 50㎕의 0.1 mg/ml 정제된 효소를 첨가함으로써 반응이 개시되었다. 0부터 15분까지시간 지점을 취하였으며 여기서 50 ㎕의 반응 혼합물을 200 ㎕의 침전 용액 (100% 에탄올)에 첨가하였다. 모든 시간 지점을 다 취한 후에, 시료를 혼합하고, 10분 동안 배양하고 4℃ 3000 g에서 10분 동안 원심분리하였다. 상청액 (150 ㎕)을 신선한 96 웰 플레이트로 분취하고 590 nm에서 흡광도를 측정하였다. A590값을 시간에 대해 플롯하고 직선의 기울기로부터 초기 속력을 측정하였다.
시차주사 열량법 (Differential Scanning Calorimetry, DSC).
데이타 수집을 위해 DSCRun 소프트웨어 패키지, 분석을 위해 CpCalc, 마이크로와트로부터 몰 열용량으로의 전환을 위해 CpConvert 그리고 계산을 위해 CpDeconvolute를 사용하는 Model 6100 Nano II DSC 장비 (Calorimetry Sciences Corporation, American Fork, UT)를 사용하여 열량법이 수행되었다. 20 mM 인산 칼륨 (pH 7.0) 및 100 mM KCl 중의 1mg/ml 재조합 단백질로 주사 속도 1℃/min으로 분석이 수행되었다. 가열에 의한 용액의 가능한 탈기체화를 막기 위해 전체 DSC 실험 동안 5 atm의 일정한 압력이 유지되었다. 버퍼로 충진된 두 세포로 실험 이전에 일반적으로 장비 베이스라인을 기록하였다. 최초 작동의 냉각 이후 즉시 열량계 세포에서 용액을 재가열함으로써 열 유도 전이의 가역성이 테스트되었다.
내열성 측정.
20 mM 인산 칼륨 (pH 7.0) 및 100 mM KCl 중에서 내열성에 대하여 전체 효소를 80℃에서 분석하였다. 효소를 80℃에서 0,5, 10 또는 30분 동안 얇은-벽 튜브에서 가열하였으며 얼음 상에서 냉각하였다. 아조-자일란을 기질로써 활성 측정에 대해 전술한 분석을 사용하여 잔류 활성이 측정되었다.
폴리사카리드 지문(Fingerprinting)
탄수화물 젤 전기영동(PACE)을 사용하는 폴리사카리드 분석에 의해 폴리사카리드 지문이 측정되었다. 비치우드(Beechwood) 자일란 (0.1 mg/mL, 100 ㎕, Sigma, Poole, Dorset, UK) 또는 자일로올리고사카리드 (1 mM, 20 ㎕, Megazyme, Wicklow, Ireland)를 총 부피 250 ㎕에서 16시간 동안 효소 (1-3 ㎍)로 처리하였다. 반응을 0.1 M 암모늄 아세테이트 pH 5.5로 완충시켰다. 효소, 폴리사카리드/올리고사카리드 또는 라벨링 시약 중에 임의의 불특정 화합물을 확인하기 위해, 기질 또는 효소가 없는 대조군으로 동일한 조건 하에서 수행하였다. 20분 동안 끓임으로써 반응을 정지시켰다. 각 조건에 대해 적어도 2회 개별적으로 분석을 수행하였다. ANTS (8-아미노나프탈렌-1,3,6-트리설폰산, Molecular Probes, Leiden, The Netherlands)를 이용하는 유도체화, 전기영동 및 이미지화를 기재된 바대로 수행하였다 (Goubet, F., Jackson, P., Deery, M. and Dupree, P. (2002) Anal. Biochem. 300, 53-68).
적합성 계산(Fitness Calculation).
변성 온도 전이 중간지점 (Tm)의 증가 및 모든 변이체를 가로지르는 각 파라미터에서 가장 큰 차이에 대하여 상대적인 효소 활성의 증가 (또는 감소)를 동등하게 비중을 둠으로써 주어진 효소 변이체에 대한 적합성 (Fn), n이 계산되었다: Fn= FTn+ FVn이고, 여기서 FTn= 변이체의 Tm적합성 팩터이고 그리고 FVn= 변이체의 활성 적합성 팩터이다. 각각 (Tm및 활성)의 적합성 팩터는 Tm또는 모든 변이체를 가로지르는 속도에서 가장 큰 차이에 상대적이다. FTn= (Tm- TmL) / (TmH- TmL)이고 여기서 Tmn은 주어진 변이체, n에 대한 Tm이고, 그리고 TmL은 모든 변이체를 가로지르는 가장 낮은 Tm이고 그리고 TmH는 모든 변이체를 가로지르는 가장 높은 Tm이고 FVn= (Vn- VL) / (VH- VL)이고 여기서 Vn은 주어진 변이체, n에 대한 상대 속도이고, 그리고 VL은 모든 변이체를 가로지르는 가장 낮은 속도이고 그리고 VH는 모든 변이체를 가로지르는 가장 높은 속도이다.
GSSM
TM
방법에 의한 진화.
예시적 본 발명의 자일라나제 서열 번호 378 (서열 번호 377에 의해 암호화되는)를 포함하는 예시적 본 발명의 자일라나제 서열 번호 190 (서열 번호 189에 의해 암호화되는) 중에서 점 돌연변이의 포괄 라이브러리를 제작하는데 있어 GSSMTM기술이 사용되었다. 전술한 자일라나제 내열성 스크린은, 80℃에서 20분 동안 열 자극에 이어 측정된 것으로써, 예시적 "야생형" 효소 서열 번호 190 (서열 번호 189에 의해 암호화되는)에 비해 향상된 내열성을 갖는 9개의 단일 부위 아미노산 돌연변이 (도 6A), D8F, Q11H, N12L, G17I, G60H, P64V, S65V, G68A & S79P를 확인시켜주었다. 야생형 효소 및 모든 9개의 단일 부위 아미노산 돌연변이체는 대장균에서 생성되었으며 N-말단 헥사히스티딘 택을 이용하여 정제되었다. 택에 의한 활성의 차이는 감지할 수 없었다.
효소 활성에 대한 단일 아미노산 돌연변이의 효과를 측정하기 위해, 9개의 모든 돌연변이체를 정제하였으며 그들의 자일라나제 활성 (야생형 최적 온도, 70℃에서 초기 속도)이 예시적 서열 번호 190 "야생형" 효소에 대해 비교되었다. 야생형 (초기 속도를 1.0으로 표준화됨)에 대해 D8F, N12L, G17I, G60H, P64V, S65V G68A 및 S79P 돌연변이체 (상대적 초기 속도 각각 0.65, 0.68, 0.76, 1.1, 1.0, 1.2, 0.98 및 0.84)의 효소 활성이 비교되었으며 이는 이들 돌연변이가 그들의 효소 활성을 현저하게 바꾸지 않는 것을 확인시켜 주었다. 초기 속도는 3 또는 그 이상의 시간에서 측정되었으며 그리고 편차는 전형적으로 10 % 이하였다. 이들 8개의돌연변이체와는 대조적으로, 최선 내열성의 단일 부위 돌연변이체, Q11H (상대적 초기 속도 0.35)에 대해 효소 활성에 있어 현저한 감소가 관찰되었다.
"야생형" 및 내열성 단일 부위 아미노산 돌연변이체 효소의 융점 온도(T m ).
정제된 서열 번호 190 "야생형" 자일라나제 및 9개의 내열성 단일 부위 아미노산 돌연변이체가 시차 주사 열량법 (DSC)을 사용하여 분석되었다. 그것의 열 변성에 대한 DSC 트레이스에서 어깨 부분에 의해 증명되는 것으로서 야생형 효소에 대해 응집이 명백하다, 도 6B 참조. 진화된 돌연변이체 효소는 응집의 증거를 보이지 않았다. 모든 효소에 대해, 열 유도 변성은 비가역적이며 시료의 두번째 주사에서 식별할 수 있는 전이가 관찰되지 않았다. 변성의 비가역성 때문에, 단지 겉보기 Tm(융점 온도)만이 계산될 수 있다 (예컨대, Sanchez-Ruiz (1992) Biophys. J. 61: 921-935; Beldarrain (2000) Biotechnol. Appl. Biochem. 31: 77-84에 기재된 바와 같이). 야생형 효소의 Tm은 61℃이며 모든 점 돌연변이체에서 증가하였으며 64℃ 내지 70℃ 범위이었다 (도 6A). 야생형에 대해 Q11H 돌연변이가 가장 큰 증가 (Tm= 70℃)를 도입하였으며 이어서 P64V (69℃), G17I (67℃) 및 D8F (67℃)이었다.
"9×" 조합 GSSMTM예시적 효소 서열 번호 378
부위-지향 돌연변이 유도 (도 6A)에 의한 9개의 내열성 상승 돌연변이체의 단일 부위 변화를 조합함으로써 "9×" 효소 (서열 번호 378)가 구축되었다. "9×" (서열 번호 378) 효소가 대장균에서 발현되었으며 균질하도록 정제되었다. 융점 온도를 측정하기 위해 DSC가 수행되었다. "9×" 효소의 Tm은 서열 번호 190, "야생형" 효소보다 34도 높았으며, 이는 그것의 열적 안정성의 엄청난 전이를 보여주는 것이다 (도 6B).
효소의 생화학적 성질에 대한 조합된 돌연변이 및 융점 온도의 상승의 효과를 평가하기 위해, pH 및 온도 프로파일이 구축되었으며 서열 번호 190, "야생형" 효소와 비교되었다. 도 7은 "야생형" 및 "진화된" 9× 돌연변이체 효소의 생화학적 특성을 도시하고 있다. 도 7A는 야생형 및 진화된 9× 돌연변이체 효소에 대한 활성의 pH-의존성을 도시하고 있다. 자일라나제 활성이 37℃ 각 pH에서 측정되었으며 초기 속력(rate)을 측정하기 위해 초기 속도(velocity)가 590 nm에서의 흡광도에 대해 플롯되었다. 도 7B는 야생형 및 진화된 9× 돌연변이체 효소에 대한 활성의 온도-의존성을 도시하고 있다. 야생형 및 진화된 9× 돌연변이체 효소의 최적 온도는 25-100℃ 온도 범위에서 pH 6.0에서 측정되었으며 5분에 걸친 초기 속도를 기초로 한다. 도 7C는 야생형 및 진화된 9× 돌연변이체 효소의 열 안정성을 도시하고 있다. 야생형 및 진화된 9× 돌연변이체 효소의 활성의 열 의존도는 먼저 효소를 각각의 지시된 온도에서 5분 동안 가열함으로써 이어서 실온으로 냉각함으로써 그리고 잔류 활성 (37℃, pH 6.0에서 초기 속도)을 측정함으로써 측정되었다. 모든 실험에서 초기 속도는 2 또는 그 이상 측정되었으며 편차는 10 % 이하이었다.
서열 번호 190 및 서열 번호 378 ("9×" 돌연변이체) 효소는 pH 5와 6 사이에서 가장 높은 활성으로 비교할만한 pH/활성 프로파일을 갖는다 (도 7A). 두 효소는 70℃에서 최적의 유사한 초기 속도/온도를 갖지만, 그렇지만, 서열 번호 190, "야생형" 효소가 더 낮은 온도 (25-50℃)에서 더 높은 활성을 가지며, 서열 번호 378 ("9×" 돌연변이체)은 기질의 존재하에서 100℃까지 그것의 활성의 60% 이상을 유지한다 (초기 속도에 의해 결정됨) (도 7B). 서열 번호 190, "야생형" 효소의 활성은 70℃ 이상의 온도에서 검출할 수 없엇다.
효소 내열성에 대한 9개의 조합된 돌연변이의 효과를 측정하기 위해, 잔류 활성이 측정되었으며 서열 번호 190, "야생형" 효소에 대해 비교되었다. 각 온도 (37, 50, 60, 70, 80 및 90℃)에서 5분 동안 열 자극에 의해 이어서 37℃에서 활성 측정으로 잔류 활성이 측정되었다. 서열 번호 190은 70℃ 이상에서 완전히 불활성화되었으며 진화된 9× 돌연변이체는 70, 80 및 심지어 90℃로 가열한 이후에도 현저한 활성을 나타내었다 (도 7C). 또한, 온도가 증가함에 따라 비록 야생형 효소의 활성이 감소하였지만, 9× 변이체는 온도를 60℃까지 가열함으로써 어느정도 활성화되었다.
유전자 재조립(GeneReassembly) TM 기술을 이용한 조합 GSSM TM 변이체 제조.
9개의 단일 부위 아미노산 돌연변이체의 조합 변이체를 확인하기 위해 추가적으로 구축된 서열 번호 378 ("9×" 변이체)에 대해 최대 내열성 및 활성이 비교되었으며, 모든 가능한 돌연변이체 조합 (29)의 유전자 재조합 라이브러리 (미국 특허 6,537,776)가 구축되었으며 스크리닝되었다. 확인된 9개 돌연변이의 33개의 독특한 조합의 스크리닝 기준으로써 내열성을 사용하는 것이 본래 9× 변이체인 것으로 확인되었다. 진화된 9×보다 더 높은 활성/발현을 갖는 변이체를 선택하기 위해 2차적 스크린이 수행되었다. 이런 스크린은, 본래 단일 돌연변이의 6과 8 사이에서 다양한 조합으로 가공되는 서열을 갖는 10 변이체를 제조해 내었으며, 도 8A에 도시되었다. 도 8은 유전자 재조립TM기술을 사용하여 확인된 조합 변이체를 도시하고 있다. 도 8A는 9개의 GSSMTM점 돌연변이의 모든 가능한 조합의 유전자 재조립TM라이브러리를 도시하고 있으며 이는 향상된 내열성 및 활성을 갖는 변이체에 대해 구축되고 스크리닝된 것이다. 9× 변이체를 포함하여 11개의 변이체가 얻어졌다. 도에 보여지는 바와 같이, 변이체는 점 돌연변이의 다양한 조합으로 6, 7, 8, 또는 9를 갖는다. 각 변이체의 DSC에 의해 측정된 대응하는 융점 온도 전이 중간지점 (Tm)을 오른쪽에 보였다. 도 8B는 최적 온도 (70℃) 및 pH 6.0에서 야생형에 비교된 6×-2 및 9× 변이체의 상대적 활성을 도시한 것이다 (5분 시간 지점에 걸쳐 초기 속도가 측정되었다). 에러 바는 3회 측정에 대한 초기 속도의 범위를 나타낸다.
각 조합 변이체의 융점 온도 (Tm)는 야생형보다 적어도 28℃ 이상이었으며 (도 8A) 그리고 모든 재조립 변이체는 9× 효소보다 상대적으로 더 높은 활성을 보였다. 하나의 변이체, 특히 6×-2의 활성은, 야생형 효소보다 컸으며 9× 효소보다 현저히 컸다 (1.7×) (도 8B). 재조립 변이체의 서열 비교는 적어도 6개의, 증가된 열 안정성 (> 20도)이 요구되었던 돌연변이를 확인시킨다. 초기 열 안정성 스크린에서 발견된 모든 33개의 독특한 변이체는 그들의 내열성에 중요한 두개의 Q11H 및G17I 돌연변이 표시를 포함하였다.
야생형 및 변이체 폴리사카리드 생성물 지문의 분석.
"야생형, "6×-2 및 9× 변이체에 의해 제조된 생성물이 탄수화물 젤 전기영동 (PACE)을 사용하는 폴리사카리드 분석에 의해 비교되었다. 자일라나제에 의한 가수분해에 대해 상이한 기질 (올리고사카리드 및 폴리사카리드)이 시험되었다. 테스트된 3 자일라나제의 소화 생성물은 도 9에 도시된 바와 같이 매우 유사하였다. 모든 3 효소가 (Xyl)6및 (Xyl)5를, 주로 (Xyl)3및 (Xyl)2로 가수분해하고, 그리고 (Xyl)4를 (Xyl)2로 가수분해하였다 (도 9A). (Xyl)3의 (Xyl)2및 Xyl로의 단지 소량의 가수분해가 관찰되었으며 이는 (Xyl)3이 효소에 대한 상대적으로 나쁜 기질임을 의미한다. (Xyl)2상에서는 활성이 검출되지 않았다. 글루쿠로노실 잔기를 함유하는 비치우드 자일란은 모든 세가지 효소에 의해 주로 (Xyl)2및 (Xyl)3으로 가수분해되지만, 올리고자일란 밴드 사이로 이동된 다른 밴드가 검출되었다 (도 9B). PACE 분석에서, 각 올리고사카리드는 당 조성물 및 중합화 정도에 좌우되는 특정 이동을 가지며 (Goubet, F., Jackson, P., Deery, M. and Dupree, P. (2002) Anal. Biochem. 300, 53-68), 따라서, 이들 밴드는 올리고글루쿠로노자일란에 유사하게 대응한다. 이후, 진화된 효소는 "야생형" 효소의 기질 특이성을 보유한다.
전술한 바와 같이, 도 9는 PACE에 의해 측정된 것으로서 (서열 번호 189에 의해 암호화되는) "야생형" 서열 번호190, 6×-2 (서열 번호 379에 의해 암호화되는 서열 번호380) 및 서열 번호 378 ("9×" 돌연변이체) 효소 변이체의 생성물 지문을 도시한 것이다. 도 9A는 "야생형" 및 변이체 효소에 의한 올리고자일란 (Xyl)3, (Xyl)4, (Xyl)5및 (Xyl)6의 가수분해 이후 얻어진 지문을 도시하고 있다. 대조 레인은 효소의 부재시 분석 조건 하에서 배양된 올리고사카리드를 함유한다. 도 9B는 야생형 및 변이체 효소에 의한 비치우드 자일란의 가수분해 이후 얻어진 지문을 도시하고 있다. 표준은 (Xyl)2, (Xyl)3, (Xyl)4를 함유한다. 모든 분석은 37℃ 및 pH 5.5에서 수행되었다.
다수의 산업상 시장 응용시 제조 양립가능성에 대해 최적인 높은 활성, 열적 안정한 자일라나제를 신속하게 제조해내기 위해 실험실 유전자 진화 전략의 조합이 사용되었다. 예시적 "야생형" 자일라나제 (서열 번호 189에의해 암호화되는) 서열 번호 190의 전체 서열을 스캔하는데 그리고 내열성을 향상시키는 9개의 점 돌연변이를 확인하는데 있어 GSSMTM방법론이 사용되었다. 비록 그것이 효소의 가수분해 생성물 프로파일에 대해서는 감지할 수 있는 효과가 없지만, 도 9에 도시된 바와 같이, 단백질 서열에 9개 돌연 변이의 첨가는 서열 번호 190 ("야생형")의 최적 온도 70℃에서의 효소 특이적 활성의 적당한 감소를 초래하였다, 도 9B 참조. 유전자 재조립TM방법을 사용하여 9개의 단일 부위 아미노산 돌연변이체의 조합 라이브러리를 생성시켰으며, 활성에 있어서 이런 감소가 극복되었다. "9×" 변이체 보다 더 나은 활성을 갖는 10개의 열 안정성 변이체 (Tm89℃와 94℃ 사이)가 유전자 재조립TM라이브러리 스크리닝으로부터 발견되었다. Tm90℃를 가지며, 야생형을 능가하는 효소 특이적 활성 및 생성물 지문이 바뀌지 않았으며 서열 번호 190 ("야생형")에 비해, (SEQID NO: 380, 서열 번호 379에 의해 암호화되는) 6×-2 변이체가 특히 눈에 띈다. 우리의 지식으로 이들 변이체에 대해 얻어진 Tm이동은 진화 기술에 대한 응용으로부터 가장 큰 증가로 보고된 것이다.
서열 번호 380 (6×-2 변이체)는, 서열 번호 190 ("야생형"): D8F에 비해 다음의 변화를 포함한다, Q11H, G17I, G60H, S65V 및 G68A. 서열 번호 379는, "야생형" 서열 번호 189에 비해 다음의 뉴클레오티드 변화를 포함한다: 뉴클레오티드 위치 22 내지 24가 TTC, 뉴클레오티드 위치 31 내지 33이 CAC, 뉴클레오티드 위치 49 내지 51이 ATA, 뉴클레오티드 위치 178 내지 180이 CAC, 뉴클레오티드 위치 193 내지 195가 GTG, 뉴클레오티드 위치 202 내지 204가 GCT.
목적하는 표현형에 대한 점 돌연변이체의 첨가에 대한 조합 혼합의 유효성을 평가하기 위해, 효소 활성 및 열안정성에서 변화로부터 기여를 조합한 적합성 파라미터가 각 돌연변이체에 대해 계산되었다. 본원에 기재된 용어 적합성은 다른 효소에 비교될 수 있는 객관적인 측정은 아니지만, 이 특정 자일라나제를 향한 진화에 대한 성공의 측정을 허용하는 용어이다. 효소 적합성, F는 이 세트의 변이체에 대해 Tm및 효소 활성에서 동등한 비중을 차지하는 변화에 의해 계산되기 때문에, 최대 허용 적합성 값은 2 이다 (FT≤ 1 및 FV≤ 1, 상기 참조). 달리 말하면, 만약최대 활성을 갖는 변이체가 또한 가장 높은 Tm을 갖는다면, 그것의 적합성 값은 2가 될 것이다. 적합성 값이 거의 2인 경우 (도 10B 참조), 6×-2 변이체 (서열 번호 380, 서열 번호 379에 의해 암호화되는)가 열 안정성 및 효소 활성의 가능한 가장 최선의 조합을 갖는 것에 가깝다. 가장 높은 적합성 값을 제공하는 단일 부위 돌연변이는 S65V이다. 비록 S65V 돌연변이체의 Tm이 Q11H 돌연변이체의 것보다 더 낮지만 (각각 66℃ 대 70℃), 그것의 특정 활성이 야생형에 비해 감소되지 않았기 때문에 그것은 더 높은 적합성 값을 갖는다.
도 10A는 GSSMTM진화에 의해 얻어진 "야생형"에 대한 열 안정성 (Tm으로 대표되는) 향상의 레벨을 도시하는 개략도이다. 가장 높은 열 안정성을 갖는 단일 부위 아미노산 돌연변이체 및 조합 변이체 (각각 Q11H 및 "9×" (서열 번호 378))를 야생형에 비교하여 보였다. 도 10B는 GSSMTM및 유전자 재조립TM기술을 조합함으로써 얻어진 효소의 "적합성 다이아그램" 향상을 도시한 것이다. 화학식 F = FT + FV를 사용하여 적합성이 정의되었으며 여기서 적합성 (F)은 전술한 내열성 적합성 (FT) 및 상대적 활성 적합성 (FV)을 동등하게 비중을 둠으로써 계산된다. 가장 큰 적합성 (S65V)을 제공하는 점 돌연변이가 보였다. 모든 9개의 점 돌연변이를 조합하는 것은 또한 적합성이 향상되었다 (서열 번호 378, "9×"변이체). 그렇지만, 적합성에 있어서 가장 큰 향상은 최선의 변이체, 6×-2를 얻기 위한 GSSMTM및 유전자 재조립TM방법을 조합함으로써 얻어졌다 (서열 번호380).
유전자 재조립TM방법은 또한 향상된 열 안정성에 대한 절대적 필요성을 드러내는 중요한 잔기의 확인을 허용한다. 2개의 중요한 잔기 Q11H 및 G17I가 내열성을 기초로 확인된 모든 유전자 재조립TM변이체에 존재한다 (도 6A 참조). 단백질의 열 안정성에 대한 구조적 결정 인자는 연구되었으며, 예컨대, Kinjo (2001) Eur. Biophys. J. 30: 378-384; Britton (1999) J. Mol. Biol. 293: 1121-1132; Ladenstein (1998) Adv. Biochem. Eng. Biotechnol. 61: 37-85; Britton (1995) Eur. J. Biochem. 229: 688-695; Tanner (1996) Biochemistry 35: 2597-2609; Vetriani (1998) Proc. Natl. Acad. Sci. USA 95: 2300-2305에 의해 몇가지 이론이 정립되었다. 비록 단백질 안정성에 대한 각각의 기여가 완전히 이해되지는 않았지만, 수소 결합 패턴, 이온성 상호작용, 소수성 패킹 및 표면 루프(loop)의 감소된 길이가 그 중 중요한 팩터이다. 모든 가능한 단일 아미노산 치환은 상대적으로 극성, 하전되거나 또는 작은 (글리신) 잔기를 더 큰 소수성 잔기로 대치하는 것에 관여하는 것을 테스트하는 것으로부터 대부분의 유익한 점 치환이 확인된다는 것으로부터, 소수성 상호작용이 이 단백질의 열 안정성을 강화시키는데 있어 가장 현저힌 역할을 담당한다는 것을 추측할 수 있다. 심지어 내열성을 향상시키기 위한 최적의 상호작용에 대해 잘 이해한다고 해도, 그런 상호작용을 소개하는 돌연변이가 어디서 만들어지는지에 대한 예상은 직선적이지 않다. 그렇지만, GSSMTM방법을 사용하는 합리적이지 않은 접근은, 단백질 구조 내에서 모든 위치의 사이드체인의 신속한 샘플링을 허용한다. 그런 접근은 지금까지 발견된 바 없는 작용기 상호작용을소개하는 아미노산 치환의 발견을 초래하였다.
실시예 6: 본 발명의 자일라나제를 이요한 종이 펄프의 전처리
하나의 양태에서, 본 발명의 자일라나제는 종이 펄프의 전처리에 사용될 수 있다. 본 실시예는 자일라나제가 종이 펄프의 전처리에 유용한지 여부; 예컨대, 크래프트 (Kraft) 종이 펄프에 사용될 때 표백 화학물질의 사용을 감소시키는지 (예컨대, 이산화염소, ClO2)를 결정하기 위해 일반적인 예시적 스크리닝 프로토콜을 기재한다.
스크리닝 프로토콜은 두개의 대안적인 테스트 파라미터를 갖는다: 산소 탈리그닌화 단계 (포스트(post)-O2펄프) 이후 장일라나제 처리 충격; 및, 산소 탈목질화를 포함하지 않는 과정 중에 자일라내제의 충격 (프리(pre)-O2브라운스탁).
산업상 환경, 예컨대, 공장에서 반응 조건을 자극하는 펄프 처리 조건: pH 8.0; 70℃; 60 분 기간.
도 11의 흐름도에서 그 과정을 개략적으로 도시하였다.
이들 조건 하에서 활성인 20개의 자일라나제가 생화학적 테스트에 의해 확인되었다. 20개의 자일라나제 중에서, 그것이 화학적으로 표백되기 전에 크래프트 펄프 전처리에 그들이 사용될 때, 6개가 명백하게 ClO2요구량을 현저하게 감소시킬 수 있었다. 6개는: 서열 번호 182 (서열 번호 181에 의해 암호화되는) ; 서열 번호 160 (서열 번호 159); 서열 번호 198 (서열 번호 197에 의해 암호화되는); 서열 번호 168 (서열 번호 167에 의해 암호화되는); 서열 번호 216 (서열 번호 215에 의해암호화되는); 서열 번호 260 (서열 번호 259에 의해 암호화되는)이다. 나머지는 약간의 활성을 보였지만 우수하지는 않았다. 자일라나제 서열 번호 182 (서열 번호181에 의해 암호화되는) 그리고 서열 번호 160 (서열 번호 159에 의해 암호화되는)는 모듈 방식이며 탄수화물 결합 모듈 뿐 아니라 자일라나제 촉매 도메인을 함유한다. 단지 촉매 도메인 만을 함유하는 이들 2 자일라나제의 끝이 잘린 유도체가 본 응용에 더 효과적인 것으로 설명되었다. 최고의 자일라나제, 서열 번호 160 (서열 번호 159에 의해 암호화되는)를 더 포괄적으로 연구하였다. 결과는 다음과 같이 요약될 수 있다:
- 2 단위/g의 서열 번호 160 (서열 번호 159에 의해 암호화되는)에 의한 포스트-O2스프루스(spruce)/소나무/전나무 (SPF) 펄프의 전처리는 이어지는 ClO2사용을 22%로 감소시켰으며 65% GE 광도를 얻었다;
- 0.5 단위/g 서열 번호 160 (서열 번호 159에 의해 암호화되는)에 의한 프리-O2브라운스탁 SPF의 전처리는 이어지는 ClO2사용을 13%로 감소시켰으며 65% GE 광도를 얻었다;
- 0.5 단위/g 서열 번호 160 (서열 번호 159에 의해 암호화되는)에 의한 프리-O2아스펜(Aspen) 펄프의 전처리는 ClO2사용을 적어도 22%로 감소시킨다;
- 0.5 단위/g 서열 번호 160 (서열 번호 159에 의해 암호화되는)에 의한 프리-O2Douglas Fir/Hemlock 펄프의 전처리는 ClO2사용을 적어도 22%로 감소시킨다;
- 처리 조건 하에서 수행될 때, 동일한 카파 팩터에서 표백되었지만 자일라나제로는 처리되지 않았을 때와 비교된 때, 자일라나제 처리로부터 수득률 감소는 펄프에 비해 0.5%를 초과하지 않았다;
- 포스트-O2SPF 펄프를 SEQ ID NOS: 159, 160로 처리하기 위한 최적 조건은, pH 6-7, 효소량 0.3 단위/g, 처리 시간 20-25분이다. 이들 조건 하에서, 28%의 ClO2사용의 감소사 가능하며 69% GE 광도에 도달하였다.
추가의 실험에서:
서열 번호 159에 의해 암호화되는 서열 번호 160 (XYLA) = 야생형 자일라나제의 전체 길이:
·XYLA (E.c) = 단지 대장균에서 발현된 자일라나제 촉매 도메인을 포함하는 SEQ ID NOS: 159, 160의 끝이 잘린 변이체
·XYLA (P.f) = 상기와 동일하지만 P. 플루오레센(P. fluorescens)에서 발현되었다.
서열 번호 182 (서열 번호181에 의해 암호화되는) = 야생형 자일라나제의 두번째 전체 길이:
·XYLB (E.c) = 끝이 잘린 변이체 etc, etc 대장균에서 발현되었다
·XYLB (P.f) = 상기와 동일하지만 P. 플루오레센에서 발현되었다
프리-O
2
브라운스탁에 대한 리드(lead) 자일라나제의 투약량 반응 데이타
자일라나제 스테이지 (X-스테이지)에 대한 조건은 다음과 같다:
pH 8
온도70℃
시간 60분
카파 팩터 0.24
비-효소 조절군에 대한, 카파 팩터는 0.30
결과는 이산화염소 (ClO2)의 낮은 하전에서 자일라나제-처리된 시료의 광도가 투약량에 의존적으로 증가한다는 것을 보여주었다 (Kf 0.24 vs Kf 0.30).
각 경우에서, 끝이 잘린 유도체가 완전-길이 자일라나제보다 더 효과적인 것으로 드러났다. 최적 자일라나제 투약량은 0.6 내지 0.7 U/g 펄프 부근으로 드러났다.
최선의 4 자일라나제에 의한 대륙간 프리-O
2
브라운스탁의 전처리
Do에서 ClO2투약량 반응의 측정
실험 개요
·프리-O2브라운스탁
o 초기 카파 31.5
·X 스테이지 조건
o 자일라나제 하전 0.7 U/gm
o 온도70℃
o pH 8
o 처리 시간 1시간
o 펄프 밀도 10%
·표백 배열 XDEp
o 카파 팩터 0.22, 0.26 및 0.30 (펄프 상에서 %D: 2.63, 3.12 및 3.60)
3-스테이지 표백 배열 이후 최종 광도 대 카파 팩터 (ClO
2
하전):
·XYLB - 61.5 최종 광도에서, X-스테이지는 ClO2사용을 3.89 kg/ton 펄프로 감소시킬 수 있다.
·XYLB (E.c) - 61.5 최종 광도에서, X-스테이지는 ClO2하전을 4.07 kg/ton 펄프로 감소시킬 수 있다.
·XYLA - 61.5 최종 광도에서, X-스테이지는 ClO2사용을 4.07 kg/ton 펄프로 감소시킬 수 있다.
· XYLA (E.c) - 61.5 최종 광도에서, X-스테이지는 ClO2사용을 4.90 kg/ton 펄프로 감소시킬 수 있다.
Do에서 ClO
2
투약량 반응의 측정:
효소 | Do에서 ClO2감소(kg/ton OD) | Do에서 Kf 감소 |
XYLB | 3.89 | 11.7% |
XYLB (E.c) | 5.08 | 15.8% |
XYLA | 4.07 | 12.2% |
XYLA (E.c) | 4.90 | 14.7% |
자일라나제 0.7 U/g, pH 8.0, 70℃, 1시간
펄프: 프리-O2브라운스탁, 초기 카파 31.5
ClO2의 퍼센트 감소는 산업상 거의 현저하지 않은 것이다. 그들의 1차적인 관심은 ton OD 펄프 당 필요한 ClO2의 lbs이다. 낮은 퍼센트 감소가 감소된 ClO2의 lbs 측면에서 타겟 광도에 도달하는데 있어 더 낮은 ClO2의 총 하전을 요구하게 되는 낮은 초기 카파 펄프에 대한 더 높은 퍼센트 감소보다 더 가치있을 수 있는 높은 초기 카파 브라운스탁을 갖는 것으로 보여졌다는 것을 고려할 때에는 이것도 일리가 있다.
표백된 대조 펄프에 대한 광도, 수득률 및 카파 팩터의 상호관계:
결과는 더 높은 타겟 광도를 얻기 위해 ClO2의 투약량을 증가시키면서 표백시키는 것은 펄프 수득률의 손실의 증가를 초래한다는 것을 보여주었다. 이는 본 과정의 이 스테이지에서 펄프가 톤 당 거의 $400의 가치 및 셀룰로스 손실 비용을 갖기 때문에 문제가 된다.
자일라나제 (예컨대, 본 발명의 자일라나제)의 장점은, 자일라나제 자체의 작용이 수득한 것을 취소시키지 않는 한, 낮은 ClO2투약량으로 수득률 손실을 감소시킬 수 있다는 것이다.
자일라나제 XYLB (P.f)로 프리-O
2
브라운스탁의 전처리에 대한 투약량 반응 데이타:
실험 개요
·노스우드(Northwood) 프리-O2브라운스탁
- 초기 카파 28.0
- 초기 밀도 32.46%
- 초기 광도 28.37
·X 스테이지 조건
- 자일라나제 하전 0 내지 2.70 U/gm
- 온도 58℃ 내지 61℃
- pH 8.2 내지 8. 5
- 처리 시간 1시간
·표백 배열 XDEp
- 카파 팩터 0.24
·ClO2감소는 0.24와 0.30 사이의 카파 팩터에 대해 계산되었다
본 실험의 목적은 세척되지 않은 SPF 브라운스탁 상에서 4 자일라나제 중 최선을 평가하기 위함이다. 결과는, 낮은 Kf 0.24에서 자일라나제의 존재시 얻어진 광도를 가지며, 더 높은 Kf 0.30에서 얻어진 광도에 점근적으로 접근하면서, XYLB (E.c)로 처리된 펄프에 대한 최종 광도의 투약량-의존적 증가를 보여주었다.
자일라나제 XYLB (E.c) 및 이산화염소 감소의 투약량 사이의 상호관계 (프리-O2브라운스탁) :
ClO2감소% OD 펄프 | ClO2감소kg/ton 펄프 | 자일라나제 투약량U/gm |
0.299% | 2.99 | 0.31 |
0.363% | 3.63 | 0.51 |
0.406% | 4.06 | 0.71 |
0.439% | 4.39 | 0.91 |
0.483% | 4.83 | 1.26 |
0.523% | 5.32 | 1.80 |
0.587% | 5.87 | 2.70 |
최적 자일라나제 투약량은 0.5 및 0.9 U/gm이다.
최적 투약량은 0.5 내지 0.9 U/g 범위에 놓여있다. 이 투약량 이상에서는 자일라나제의 단위 증가 당 회복이 감소하였다. 이 크기로 처리된 펄프의 톤 당 이산화염소 투약량의 감소는 상업상 현저한 것이다.
3-스테이지 생물 표백 과정
펄프 밀 표백 공장에서 실질적인 표백 작동에 유사하게 가장된 3-스테이지 생물 표백 과정이 개발되었다 (도 1). 이 표백 배열은 (X)DoEp로 표시되며, 여기서X는 자일라나제 처리 스테이지,D는 이산화염소 표백 스테이지, 그리고Ep는 알칼리성 과산화물 추출 스테이지를 나타낸다. 본 발명자들의 응용에 사용된 1차적 공급원료는 서던 소프트우드 크래프트(Southern Softwood Kraft) 브라운스탁 (산소 탈목질화 없는)이다. 생물 표백 분석에서 높은 화학적 표백 감소 전위를 보이는 대부분의 효과적인 자일라나제 후보가 하드우드 크래프트 펄프 (maple 및 aspen)의 두 종 상에서 또한 테스트되었다. 각 생물 표백 라운드의 완료에 따라, TAPPI (펄프 및 종이 산업의 기술 연합) - 표준 핸드시트를 만들어내는데 계속하여 펄프가 사용되었다. 각 시트의 GE% 광도가 측정되었으며, 각 효소가 효소적 전처리 스테이지 (X) 동안 펄프 상에서 얼마나 잘 수행되는 지에 대하여 광도 값이 지시로써 사용되었다.
결과:
(X)DoEp 생물 표백 서열을 사용하여 스크리닝되었던 대략 110 자일라나제 중, 4 효소, 즉, XYLA (P.f); XYLB (P.f); SEQ ID N0 216 (서열 번호 215에 의해 암호화되는); 서열 번호 176 (서열 번호 175에 의해 암호화되는) 만이 표백 화학물질의 사용을 감소시키기 위한 가장 큰 잠재력을 보여주었다. XYLA (P.f) 및 XYLB (P.f)는 동등한 높은 성능을 보였으며 (4개의 우수한 성능 중에서 최고), XYLA (P.f)는 XYLB (P.f)보다 더 나은 pH 내성을 보였다. 결과는 다음과 같이 요약될 수 있다:
·다음의 네가지 효소로 이하에 나열한 로딩 레벨에서 서던 소프트우드 크래프트 브라운스탁의 전처리를 포함하는 3-스테이지 표백 배열 [(X)DoEp]을 사용하여 60 (GE%)의 시트 광도를 얻는 것이 가능하였다 (pH=8, 65℃ & 1시간):
o XYLA (P.f) 0.55 U/g 펄프
o XYLB (P.f) 0.75 U/g 펄프
o SEQ ID NOS : 215, 216 1.80 U/g 펄프
o SEQ ID NOS : 175, 176 1.98 U/g 펄프
·2 U/g 펄프의 XYLA (P.f)를 이용한 서던 소프트우드 크래프트 브라운스탁의 전처리는 ClO2사용을 18.7%로 감소시키고 최종 GE% 광도 61을 얻었다.
·XYLA (P.f)는 더 높은 pH에서 우수한 내성을 나타내며 효소 전처리 스테이지가 pH = 10에서 작동할 때 14% 이상의 화학물질 감소를 제공한다.
·2 U/g 펄프의 XYLB (P.f)를 이용한 서던 소프트우드 크래프트 브라운스탁의 전처리는 ClO2사용을 16.3%로 감소시키고 최종 GE% 광도 60.5을 얻었다.
·2 U/g 펄프의 XYLA (P.f) 및 XYLB (P.f)를 이용한 아스펜 크래프트 펄프의 전처리는 ClO2사용을 35%로 감소시키고 최종 GE% 광도 77을 얻었다.
·2 U/g 펄프의 XYLA (P.f) 및 XYLB (P.f)를 이용한 메이클 크래프트 펄프의 전처리는 ClO2사용을 38%로 감소시키고 최종 GE% 광도 79를 얻었다.
·두개의 최고 성능 자일라나제, 즉 XYLA (P.f) 및 XYLB (P.f)는, 단지 촉매 도메인을 포함하는 끝이 잘린 효소이며 슈도모나스 플루오레센스(Pseudomonas fluorescens)에서 생성되었다.
본 발명이 그것의 바람직한 특정 양태를 참고로 상세히 기재되었으며, 변형 및 응용은 여기 기재되고 청구된 것들의 범위 및 사상 내에 포함된다는 것을 이해하여야 할 것이다.
SEQUENCE LISTING
<110> Steer, Brian
Callen, Walter
Healey, Shaun
Hazlewood, Geoff
Wu, Di
Blum, David
Esteghlalian, Alireza
<120> XYLANASES, NUCLEIC ACIDS ENCODING THEM AND METHODS FOR MAKING AND USING THEM
<130>56446-20079.40_290WO1_D1680-2WO
<140> not assigned
<141> 2003-03-16
<150> US 60/389,299
<151> 2002-06-14
<160> 380
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 1128
<212> DNA
<213> Bacteria
<400> 1
atgaccgacc acaacgcttc cgaaaccagc ctgttcgaac agtgcggcta cagccgcgag 60
gccatccagg cccgcctgga gcgcaactgg tatgagatgt tcgaaggccc ggacaagatt 120
tactgggaga acgacgaagg cctggggtac gtgatggaca ccggcaacca cgacgtgcgc 180
accgagggca tgagctacgc gatgatgatc gccgtgcagt acggccgcaa ggacgtgttc 240
gacaagctgt ggggttgggt catgaaatac atgttcatga ccgagggcct gcaccagggc 300
tacttcgcct ggtctgtgga ccccagcggc gtaccgaacg ccgacggtcc ggccccggac 360
ggcgaggaat acttcgcgat ggacctgttc ctggcctccg cgcgatgggg cgacggcgaa 420
ggcgtgtacg agtactcccg ccacgcccgc tcgatcctcc acacctgcgt gcaccagggc 480
gaggacggtg aaggctatcc gatgtggaac ccggagaacc atctgatcaa gttcatcccg 540
gaaaccgaat ggaccgaccc gtcctaccat ctgccgcact tctacgaggt gttcgccgag 600
cgcgccgacg aggccgaccg tccgttctgg gcgcaggccg ccaaggcgag ccgcgagtac 660
ctggtcaccg cctgccaccc gcagaccggc atgaaccccg aatactcaaa ctatgatggc 720
acgccgcacg tcgacgagcg cgaccactgg catttctact ccgacgccta ccgcaccgcc 780
ggcaacatcg ggctggactg cctgtggaac ggcgtcgtgc cggaactgtg cgatgcgaat 840
gcgcgtctgc agcgtttctt cctcgaacac gaccgcacct gcgtgtatgc gatcgacggc 900
acgccggtgg acgagaccgt gctgcacccg gtcggcttca tcgccgccac cgccgaaggc 960
tcgctcgccg cgatgcactc gcaggagccg gacgcgctcg acaacgcgat ccgctgggtg 1020
cgcctgctgt gggacacccc gatccgcacc ggcacgcgcc gctactacga caacttcctc 1080
tacgccttcg cgttcctggc gctggcgggg gagtaccgca cctggtga 1128
<210> 2
<211> 375
<212> PRT
<213> Bacteria
<400> 2
Met Thr Asp His Asn Ala Ser Glu Thr Ser Leu Phe Glu Gln Cys Gly
1 5 10 15
Tyr Ser Arg Glu Ala Ile Gln Ala Arg Leu Glu Arg Asn Trp Tyr Glu
20 25 30
Met Phe Glu Gly Pro Asp Lys Ile Tyr Trp Glu Asn Asp Glu Gly Leu
35 40 45
Gly Tyr Val Met Asp Thr Gly Asn His Asp Val Arg Thr Glu Gly Met
50 55 60
Ser Tyr Ala Met Met Ile Ala Val Gln Tyr Gly Arg Lys Asp Val Phe
65 70 75 80
Asp Lys Leu Trp Gly Trp Val Met Lys Tyr Met Phe Met Thr Glu Gly
85 90 95
Leu His Gln Gly Tyr Phe Ala Trp Ser Val Asp Pro Ser Gly Val Pro
100 105 110
Asn Ala Asp Gly Pro Ala Pro Asp Gly Glu Glu Tyr Phe Ala Met Asp
115 120 125
Leu Phe Leu Ala Ser Ala Arg Trp Gly Asp Gly Glu Gly Val Tyr Glu
130 135 140
Tyr Ser Arg His Ala Arg Ser Ile Leu His Thr Cys Val His Gln Gly
145 150 155 160
Glu Asp Gly Glu Gly Tyr Pro Met Trp Asn Pro Glu Asn His Leu Ile
165 170 175
Lys Phe Ile Pro Glu Thr Glu Trp Thr Asp Pro Ser Tyr His Leu Pro
180 185 190
His Phe Tyr Glu Val Phe Ala Glu Arg Ala Asp Glu Ala Asp Arg Pro
195 200 205
Phe Trp Ala Gln Ala Ala Lys Ala Ser Arg Glu Tyr Leu Val Thr Ala
210 215 220
Cys His Pro Gln Thr Gly Met Asn Pro Glu Tyr Ser Asn Tyr Asp Gly
225 230 235 240
Thr Pro His Val Asp Glu Arg Asp His Trp His Phe Tyr Ser Asp Ala
245 250 255
Tyr Arg Thr Ala Gly Asn Ile Gly Leu Asp Cys Leu Trp Asn Gly Val
260 265 270
Val Pro Glu Leu Cys Asp Ala Asn Ala Arg Leu Gln Arg Phe Phe Leu
275 280 285
Glu His Asp Arg Thr Cys Val Tyr Ala Ile Asp Gly Thr Pro Val Asp
290 295 300
Glu Thr Val Leu His Pro Val Gly Phe Ile Ala Ala Thr Ala Glu Gly
305 310 315 320
Ser Leu Ala Ala Met His Ser Gln Glu Pro Asp Ala Leu Asp Asn Ala
325 330 335
Ile Arg Trp Val Arg Leu Leu Trp Asp Thr Pro Ile Arg Thr Gly Thr
340 345 350
Arg Arg Tyr Tyr Asp Asn Phe Leu Tyr Ala Phe Ala Phe Leu Ala Leu
355 360 365
Ala Gly Glu Tyr Arg Thr Trp
370 375
<210> 3
<211> 2196
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 3
atgttcaaag aatggggaaa gaccgactcg gaaattacca caaaagtaaa caccgcgtgg 60
aacaaactgt ttgttaacgg ggtggaatcc ggagataatg ccgaaagaat ctatgtagag 120
actggaagcg acatggcgta catccatacc tttgacagca acgacgtgcg ctccgaagga 180
atgtcctacg gcatgatgat gtgcgtacag atgaacgatc agacaagatt taacaaactc 240
tggaaatggg caagaaccta tatgtacaat gaaacagacg ccggcagtaa ttccaggggc 300
tatttctcat ggcagtgcag tacaagcggc tcaaaaatgg ataagggccc cgctcctgac 360
ggcgaggaat actttattac ggcgctgttg ttcgcgcacg cccgctgggg gagcgcgtcc 420
ggtactacaa acataaacaa ttacgcgcag caagcaaggc agattatcta tgacttaacg 480
cgccgcaaac cggggaacgg agatccttac ggcgagcctt caatgtttaa tgtagacaac 540
tatatggtta gattcgccac acttggaaat tccgccacct ttacagaccc ctcataccat 600
ttaccggcat tctatgatgt ttgggcgctg gaattacagg cggactatga taatagtaaa 660
ctctacggta tctgggctga taaggctgac ttgaaaaaag acattgatta ctttaaacaa 720
gcggcgacca caagccgttc attctttgca aaaacgacaa acggtacaac cggacttgga 780
ccggattatg ccggctttga cggaacgcct aaaaatgaag gggatcacaa gtatttcgag 840
tatgacgcgt ggcgtatcgc gatgaacata ggtatggact acgcgtggtt cgcgaaagat 900
tcctggcaga agacatttgc cgacagaatt caggcgttct ttgtcagcaa gggagtcact 960
tcttacggaa accgctggac attggacggg actcaaaggg gagcggatca ctcgccgggt 1020
cttgtcggct gtaacgcggt cgcctctctc gcggcgacaa acgcgaacgc gtggaaattt 1080
atcgaagact tctggaacat cagcatgacg aaaggcaaat accgttacta tgacggatgt 1140
ctgtatatga tgagcatgct gcacttaagc ggcaacttta aggcgtatct ttctacaaat 1200
accacgcccg ccaacagttc cagcattacc ccgacaaccg cgtctttcga caagaagaca 1260
agcgcacaag ccgacattgc cgtaacagtg acgcttaacg ggaatacatt ctcaagtatc 1320
acaaacaacg gtacagccct tacaagcggc acagactact cagtgagtgg aacaaagtat 1380
acgataaaga aagaatacct tgcaaaacag cctgtaggaa caacgaagct cgcattcaac 1440
ttcagtgccg gaggaactcc ggaacttaca gttactataa cggacacggg cagctccagc 1500
atcagcccga caaccgcgac attcgacaaa aagaccggag cgcaagccga catcgccgta 1560
accatgacgc ttaatgggaa tactttgtcg aacatcaaaa acggttctgc acaacttaca 1620
agcggaactg actactcaac gagcggcagt acggtaacga ttaaaaaaga atacctggca 1680
aagcaggcta acggcacagt aacgcttacc ttcacattca gcgcaggcgc ggcccaaact 1740
attgacatca cggtaaaaga tacaaccggc ggagcggcgg gaataaaata caacttcgca 1800
actgacaacc tgcccaacgg gtacccgaag tacagttcaa gtgatatatc cgcgacaata 1860
accggaggag ctttggtaat aaccaaaacc ggaaataatt cgtccccgaa gattacattg 1920
ccctttagtg taacaggtaa cctttccggt tatacaggca taaagataaa tgtaaaggga 1980
gtatccggag atttcactta taaagtattg aatgccgcaa taggttctac aaatctcggc 2040
agcgtaaata acgccccaat accaaacggc tcatttggag acgtaacaat accaataacc 2100
ggcggtacaa acaccggaga tttagatata tcgttctggc tcaataacac aaatgcttac 2160
gttattgaga ttaagagcat agagctggta aaatga 2196
<210> 4
<211> 711
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 4
Met Phe Lys Glu Trp Gly Lys Thr Asp Ser Glu Ile Thr Thr Lys Val
1 5 10 15
Asn Thr Ala Trp Asn Lys Leu Phe Val Asn Gly Val Glu Ser Gly Asp
20 25 30
Asn Ala Glu Arg Ile Tyr Val Glu Thr Gly Ser Asp Met Ala Tyr Ile
35 40 45
His Thr Phe Asp Ser Asn Asp Val Arg Ser Glu Gly Met Ser Tyr Gly
50 55 60
Met Met Met Cys Val Gln Met Asn Asp Gln Thr Arg Phe Asn Lys Leu
65 70 75 80
Trp Lys Trp Ala Arg Thr Tyr Met Tyr Asn Glu Thr Asp Ala Gly Ser
85 90 95
Asn Ser Arg Gly Tyr Phe Ser Trp Gln Cys Ser Thr Ser Gly Ser Lys
100 105 110
Met Asp Lys Gly Pro Ala Pro Asp Gly Glu Glu Tyr Phe Ile Thr Ala
115 120 125
Leu Leu Phe Ala His Ala Arg Trp Gly Ser Ala Ser Gly Thr Thr Asn
130 135 140
Ile Asn Asn Tyr Ala Gln Gln Ala Arg Gln Ile Ile Tyr Asp Leu Thr
145 150 155 160
Arg Arg Lys Pro Gly Asn Gly Asp Pro Tyr Gly Glu Pro Ser Met Phe
165 170 175
Asn Val Asp Asn Tyr Met Val Arg Phe Ala Thr Leu Gly Asn Ser Ala
180 185 190
Thr Phe Thr Asp Pro Ser Tyr His Leu Pro Ala Phe Tyr Asp Val Trp
195 200 205
Ala Leu Glu Leu Gln Ala Asp Tyr Asp Asn Ser Lys Leu Tyr Gly Ile
210 215 220
Trp Ala Asp Lys Ala Asp Leu Lys Lys Asp Ile Asp Tyr Phe Lys Gln
225 230 235 240
Ala Ala Thr Thr Ser Arg Ser Phe Phe Ala Lys Thr Thr Asn Gly Thr
245 250 255
Thr Gly Leu Gly Pro Asp Tyr Ala Gly Phe Asp Gly Thr Pro Lys Asn
260 265 270
Glu Gly Asp His Lys Tyr Phe Glu Tyr Asp Ala Trp Arg Ile Ala Met
275 280 285
Asn Ile Gly Met Asp Tyr Ala Trp Phe Ala Lys Asp Ser Trp Gln Lys
290 295 300
Thr Phe Ala Asp Arg Ile Gln Ala Phe Phe Val Ser Lys Gly Val Thr
305 310 315 320
Ser Tyr Gly Asn Arg Trp Thr Leu Asp Gly Thr Gln Arg Gly Ala Asp
325 330 335
His Ser Pro Gly Leu Val Gly Cys Asn Ala Val Ala Ser Leu Ala Ala
340 345 350
Thr Asn Ala Asn Ala Trp Lys Phe Ile Glu Asp Phe Trp Asn Ile Ser
355 360 365
Met Thr Lys Gly Lys Tyr Arg Tyr Tyr Asp Gly Cys Leu Tyr Met Met
370 375 380
Ser Met Leu His Leu Ser Gly Asn Phe Lys Ala Tyr Leu Ser Thr Asn
385 390 395 400
Thr Thr Pro Ala Asn Ser Ser Ser Ile Thr Pro Thr Thr Ala Ser Phe
405 410 415
Asp Lys Lys Thr Ser Ala Gln Ala Asp Ile Ala Val Thr Val Thr Leu
420 425 430
Asn Gly Asn Thr Phe Ser Ser Ile Thr Asn Asn Gly Thr Ala Leu Thr
435 440 445
Ser Gly Thr Asp Tyr Ser Val Ser Gly Thr Lys Tyr Thr Ile Lys Lys
450 455 460
Glu Tyr Leu Ala Lys Gln Pro Val Gly Thr Thr Lys Leu Ala Phe Asn
465 470 475 480
Phe Ser Ala Gly Gly Thr Pro Glu Leu Thr Val Thr Ile Thr Asp Thr
485 490 495
Gly Ser Ser Ser Ile Ser Pro Thr Thr Ala Thr Phe Asp Lys Lys Thr
500 505 510
Gly Ala Gln Ala Asp Ile Ala Val Thr Met Thr Leu Asn Gly Asn Thr
515 520 525
Leu Ser Asn Ile Lys Asn Gly Ser Ala Gln Leu Thr Ser Gly Thr Asp
530 535 540
Tyr Ser Thr Ser Gly Ser Thr Val Thr Ile Lys Lys Glu Tyr Leu Ala
545 550 555 560
Lys Gln Ala Asn Gly Thr Val Thr Leu Thr Phe Thr Phe Ser Ala Gly
565 570 575
Ala Ala Gln Thr Ile Asp Ile Thr Val Lys Asp Thr Thr Gly Gly Ala
580 585 590
Ala Gly Ile Lys Tyr Asn Phe Ala Thr Asp Asn Leu Pro Asn Gly Tyr
595 600 605
Pro Lys Tyr Ser Ser Ser Asp Ile Ser Ala Thr Ile Thr Gly Gly Ala
610 615 620
Leu Val Ile Thr Lys Thr Gly Asn Asn Ser Ser Pro Lys Ile Thr Leu
625 630 635 640
Pro Phe Ser Val Thr Gly Asn Leu Ser Gly Tyr Thr Gly Ile Lys Ile
645 650 655
Asn Val Lys Gly Val Ser Gly Asp Phe Thr Tyr Lys Val Leu Asn Ala
660 665 670
Ala Ile Gly Ser Thr Asn Leu Gly Ser Val Asn Asn Ala Pro Ile Pro
675 680 685
Asn Gly Ser Phe Gly Asp Val Thr Ile Pro Ile Thr Gly Gly Thr Asn
690 695 700
Thr Gly Asp Leu Asp Ile Ser
705 710
<210> 5
<211> 2106
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 5
atgcaaaacc tatttaagcg tgtgtttttc catcttctct tgcttgcctt gctggcaggc 60
tgtgctggcc cttctcccgt aacaccggag ccgaccgaaa tgccgaccca ggtccctaca 120
ccaacgccta gtcttggcgc ctacgagagc ggcgagtatc gcaacctgtt cgccgaggcg 180
cttggcaaat cggatgccga aattcaggcc aaaatcgatg ccgctttcca acaacttttc 240
tacggcgacg atgtttctga gcgcgtctat tacccggttg gcagcgacat gggctatatg 300
ctcgacaccg gcaacgacga tgtgcgctcc gagggcatgt cctacggcat gatgattgcc 360
gtccagatga acaagaagga agaattcgac cgcatctgga agtggaccaa aacctacatg 420
taccagaccg aaggtggtta caaaggttat tttgcctggc acgctaaaac ggacggcacc 480
caactggccg ccaacccggc ctctgacggt gaagtctggt ttgtgatggc gctcttcttt 540
gccgatgcgc gttggggcag cggcgaagga atttataact accgcgccca agcccaggaa 600
attctcgatg tggccttgaa cgccaaagaa ttgggcggca acctggcgac caacctgttc 660
gacccggaga ccaaacaggt cgtttttgtg ccgcagttgg gcaataactc gaaatttacc 720
gacgcttcgt accacatgcc ccatttctac gagttgtggg cgcgttgggc cgataaaaat 780
aacgactttt gggccgaagc cgctaccgtt agccgcgagt tcctgcctac tgccgttcac 840
cccgaaaccg gcctggcccc taactattcc tacttcgatg gccgccctta caatgacgag 900
tatcacggcc agttccgcta cgacgctttc cgcgtgggcg cgaacatcgg catggattat 960
gtctggtttc acccctctga atggtatcgg gaacaagcca accgccaatt atctttcttc 1020
gcatcccagg gcatcgatga ttatgttgcc gaatattccc tggatggaaa accgctggcc 1080
gggcatcgcg ctacggggtt gattgccacc aatgctgtcc tggcctacgc cgcagacccc 1140
gaaattggtc aacccttcgt ccaggccctg tgggatgcag agcctccgac tggcaggtat 1200
cgctactatg acggcctgct ctacatgatg ggcctgctgc aagccagcgg caacttccgt 1260
atttacgagc cgggtattac gcctcgcgct gagttgccgc ccccgccgcc tcgcgccatc 1320
gagggccgct tcgcgcccat taccgggcgg gccttgcttc tgattggccc gaatgcggat 1380
ggcgtcaacg cttacttcga caaactggtg acagcgccgg gcggcgtgaa tgtcgaacta 1440
tcgctcaaat cgcctgattt ggaagcgctc gacgccctgg cgaggaaata tcccaacagc 1500
acgctttcgg tcgggttgtc gctggatggc ccggtaacag aggcggatgc gcgggtggga 1560
gaattgctcg acgcgttggc tgtttatccg cgcccggtct tcctgcgcat cgggccggaa 1620
tttgatttgg cggcgagcgg ccaggggccg gaggaatatg tcgcggcctg gaaaacgctc 1680
cataacgaga ttcaggcgcg gggtagttcg aatatcgccc tggtgtggca tagcgccgca 1740
gcctgcgagt cgccctttgg cggtcatccg ctcgaagcgt ggtatcccgg tgatgagttt 1800
gtggattggg tggccgtttc gcgcactgcg cagtctgccg attgcgaggg gcagtccgtt 1860
gaggccgtct tgcagtttgc gcgtgagcga tacaaaccgg ttgtgttggt tgcatcgcca 1920
gcagaggaca tcttcgagtt cgtttacgcc aacaacgacg tgattcgcgc cctgctgtat 1980
ctgaacaccg agccgggcct gttcgacacc cccgaatttt tgagcggctg gaaggccgaa 2040
atcggtcagc agttctggct gcgcggcggc ccggcgcttt tttcgacact cggattggat 2100
gagtaa 2106
<210> 6
<211> 701
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(47)
<400> 6
Met Gln Asn Leu Phe Lys Arg Val Phe Phe His Leu Leu Leu Leu Ala
1 5 10 15
Leu Leu Ala Gly Cys Ala Gly Pro Ser Pro Val Thr Pro Glu Pro Thr
20 25 30
Glu Met Pro Thr Gln Val Pro Thr Pro Thr Pro Ser Leu Gly Ala Tyr
35 40 45
Glu Ser Gly Glu Tyr Arg Asn Leu Phe Ala Glu Ala Leu Gly Lys Ser
50 55 60
Asp Ala Glu Ile Gln Ala Lys Ile Asp Ala Ala Phe Gln Gln Leu Phe
65 70 75 80
Tyr Gly Asp Asp Val Ser Glu Arg Val Tyr Tyr Pro Val Gly Ser Asp
85 90 95
Met Gly Tyr Met Leu Asp Thr Gly Asn Asp Asp Val Arg Ser Glu Gly
100 105 110
Met Ser Tyr Gly Met Met Ile Ala Val Gln Met Asn Lys Lys Glu Glu
115 120 125
Phe Asp Arg Ile Trp Lys Trp Thr Lys Thr Tyr Met Tyr Gln Thr Glu
130 135 140
Gly Gly Tyr Lys Gly Tyr Phe Ala Trp His Ala Lys Thr Asp Gly Thr
145 150 155 160
Gln Leu Ala Ala Asn Pro Ala Ser Asp Gly Glu Val Trp Phe Val Met
165 170 175
Ala Leu Phe Phe Ala Asp Ala Arg Trp Gly Ser Gly Glu Gly Ile Tyr
180 185 190
Asn Tyr Arg Ala Gln Ala Gln Glu Ile Leu Asp Val Ala Leu Asn Ala
195 200 205
Lys Glu Leu Gly Gly Asn Leu Ala Thr Asn Leu Phe Asp Pro Glu Thr
210 215 220
Lys Gln Val Val Phe Val Pro Gln Leu Gly Asn Asn Ser Lys Phe Thr
225 230 235 240
Asp Ala Ser Tyr His Met Pro His Phe Tyr Glu Leu Trp Ala Arg Trp
245 250 255
Ala Asp Lys Asn Asn Asp Phe Trp Ala Glu Ala Ala Thr Val Ser Arg
260 265 270
Glu Phe Leu Pro Thr Ala Val His Pro Glu Thr Gly Leu Ala Pro Asn
275 280 285
Tyr Ser Tyr Phe Asp Gly Arg Pro Tyr Asn Asp Glu Tyr His Gly Gln
290 295 300
Phe Arg Tyr Asp Ala Phe Arg Val Gly Ala Asn Ile Gly Met Asp Tyr
305 310 315 320
Val Trp Phe His Pro Ser Glu Trp Tyr Arg Glu Gln Ala Asn Arg Gln
325 330 335
Leu Ser Phe Phe Ala Ser Gln Gly Ile Asp Asp Tyr Val Ala Glu Tyr
340 345 350
Ser Leu Asp Gly Lys Pro Leu Ala Gly His Arg Ala Thr Gly Leu Ile
355 360 365
Ala Thr Asn Ala Val Leu Ala Tyr Ala Ala Asp Pro Glu Ile Gly Gln
370 375 380
Pro Phe Val Gln Ala Leu Trp Asp Ala Glu Pro Pro Thr Gly Arg Tyr
385 390 395 400
Arg Tyr Tyr Asp Gly Leu Leu Tyr Met Met Gly Leu Leu Gln Ala Ser
405 410 415
Gly Asn Phe Arg Ile Tyr Glu Pro Gly Ile Thr Pro Arg Ala Glu Leu
420 425 430
Pro Pro Pro Pro Pro Arg Ala Ile Glu Gly Arg Phe Ala Pro Ile Thr
435 440 445
Gly Arg Ala Leu Leu Leu Ile Gly Pro Asn Ala Asp Gly Val Asn Ala
450 455 460
Tyr Phe Asp Lys Leu Val Thr Ala Pro Gly Gly Val Asn Val Glu Leu
465 470 475 480
Ser Leu Lys Ser Pro Asp Leu Glu Ala Leu Asp Ala Leu Ala Arg Lys
485 490 495
Tyr Pro Asn Ser Thr Leu Ser Val Gly Leu Ser Leu Asp Gly Pro Val
500 505 510
Thr Glu Ala Asp Ala Arg Val Gly Glu Leu Leu Asp Ala Leu Ala Val
515 520 525
Tyr Pro Arg Pro Val Phe Leu Arg Ile Gly Pro Glu Phe Asp Leu Ala
530 535 540
Ala Ser Gly Gln Gly Pro Glu Glu Tyr Val Ala Ala Trp Lys Thr Leu
545 550 555 560
His Asn Glu Ile Gln Ala Arg Gly Ser Ser Asn Ile Ala Leu Val Trp
565 570 575
His Ser Ala Ala Ala Cys Glu Ser Pro Phe Gly Gly His Pro Leu Glu
580 585 590
Ala Trp Tyr Pro Gly Asp Glu Phe Val Asp Trp Val Ala Val Ser Arg
595 600 605
Thr Ala Gln Ser Ala Asp Cys Glu Gly Gln Ser Val Glu Ala Val Leu
610 615 620
Gln Phe Ala Arg Glu Arg Tyr Lys Pro Val Val Leu Val Ala Ser Pro
625 630 635 640
Ala Glu Asp Ile Phe Glu Phe Val Tyr Ala Asn Asn Asp Val Ile Arg
645 650 655
Ala Leu Leu Tyr Leu Asn Thr Glu Pro Gly Leu Phe Asp Thr Pro Glu
660 665 670
Phe Leu Ser Gly Trp Lys Ala Glu Ile Gly Gln Gln Phe Trp Leu Arg
675 680 685
Gly Gly Pro Ala Leu Phe Ser Thr Leu Gly Leu Asp Glu
690 695 700
<210> 7
<211> 1539
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 7
atggcacgtt taatcaccta ttgcttgatc ggcgtcttac tcgtgatgcc agtccttgcc 60
gcttgcagca cagcacctac gccaacgctg atgagccagc caacttccac gccgcaaccg 120
gccctgcaac cgacgccacc accgacgagc gtcccccggt cgatcggggc gtttgagtcc 180
ggtcagtatc gtaatctctt cacggaatta ctgggcaaga gcgaggccga gattcagcag 240
aagatcgatc aggcgtgggc gcagttgttc tacggcgaca acgacacgca gcgcgtttac 300
tatcccgtgg gtcgcgacag ggcctacatc aaagacatcg gcaacaatga tgtgcgcagt 360
gagggtatgt cgtacggtat gatgctggcg gtgcagctgg acaagcagga agagttcaac 420
aaattgtgga agtgggcgca cacctatatg ctgcaaaagg atggcccgta caaaggctat 480
tttgcgtggc atgccaatga gaacggtgaa cagctggatg cgggtcccgc ctccgatggc 540
gaagagtggt ttgtcatggc actgctcttc gcggcaaatc gctggggcaa cggtgaaggc 600
atctttaatt atcaggccga ggcgcagaag atcctggatg tgatgctgca taagagcgaa 660
gaggacaacg gtctcgccac cagcatgttc gatccggaca cgaagcaggt ggtgtttgtg 720
ccggccgggc gccaggccac attcaccgat ccgtcttatc acttgcccgc gttctatgaa 780
ctgtgggcgc gctgggctga caaggataac gatttttgga aagaagcggc gcaggccagc 840
cgcgaatttt ggaagaaggc ggcgcatccg gaaacgggcc tgatgtctga ctacgccgag 900
tttgacggca gaccccaggc cgattctgaa cacaaggatt ttcgctatga cgcgttccgt 960
gtggcgtcca atgtggcgct cgattgggcc tggttcgccg ccgatccgtg ggaggtggaa 1020
cagagcaatc ggttgttgga tttcttccgt tcacaaggca tggataagta tccgagtcta 1080
tacaacatcg atggcacgcc gttatccact aatcgctcgc cgggtttgat cgccatgaac 1140
gccacagctg gactcgcggc tgatccggaa aagagcaagg actttgtgca ggcgctatgg 1200
gatctggaaa ttcccagcgg acaatggcgc tattacgatg gggtgctgta tttcctggcg 1260
ctgttgcaag ccagcggcaa ctatcgcatc tacacgcccg atatgcccaa ggtggtgcgg 1320
cccacaccta cgcccgatcc gatcacgcaa gcgaaatttg cacccggcga tgacgcggtg 1380
ctgttcagtg tggaaacaga tgcactcgac gaatatgtga cggcgacggg ctttgagccg 1440
ggcggcgtga tgttgaacac tactttggac agcgcctctt ttgacgcacc actgcctgac 1500
agcgctctgc tgatcggatt ggacgtcagc gatcaataa 1539
<210> 8
<211> 512
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(57)
<400> 8
Met Ala Arg Leu Ile Thr Tyr Cys Leu Ile Gly Val Leu Leu Val Met
1 5 10 15
Pro Val Leu Ala Ala Cys Ser Thr Ala Pro Thr Pro Thr Leu Met Ser
20 25 30
Gln Pro Thr Ser Thr Pro Gln Pro Ala Leu Gln Pro Thr Pro Pro Pro
35 40 45
Thr Ser Val Pro Arg Ser Ile Gly Ala Phe Glu Ser Gly Gln Tyr Arg
50 55 60
Asn Leu Phe Thr Glu Leu Leu Gly Lys Ser Glu Ala Glu Ile Gln Gln
65 70 75 80
Lys Ile Asp Gln Ala Trp Ala Gln Leu Phe Tyr Gly Asp Asn Asp Thr
85 90 95
Gln Arg Val Tyr Tyr Pro Val Gly Arg Asp Arg Ala Tyr Ile Lys Asp
100 105 110
Ile Gly Asn Asn Asp Val Arg Ser Glu Gly Met Ser Tyr Gly Met Met
115 120 125
Leu Ala Val Gln Leu Asp Lys Gln Glu Glu Phe Asn Lys Leu Trp Lys
130 135 140
Trp Ala His Thr Tyr Met Leu Gln Lys Asp Gly Pro Tyr Lys Gly Tyr
145 150 155 160
Phe Ala Trp His Ala Asn Glu Asn Gly Glu Gln Leu Asp Ala Gly Pro
165 170 175
Ala Ser Asp Gly Glu Glu Trp Phe Val Met Ala Leu Leu Phe Ala Ala
180 185 190
Asn Arg Trp Gly Asn Gly Glu Gly Ile Phe Asn Tyr Gln Ala Glu Ala
195 200 205
Gln Lys Ile Leu Asp Val Met Leu His Lys Ser Glu Glu Asp Asn Gly
210 215 220
Leu Ala Thr Ser Met Phe Asp Pro Asp Thr Lys Gln Val Val Phe Val
225 230 235 240
Pro Ala Gly Arg Gln Ala Thr Phe Thr Asp Pro Ser Tyr His Leu Pro
245 250 255
Ala Phe Tyr Glu Leu Trp Ala Arg Trp Ala Asp Lys Asp Asn Asp Phe
260 265 270
Trp Lys Glu Ala Ala Gln Ala Ser Arg Glu Phe Trp Lys Lys Ala Ala
275 280 285
His Pro Glu Thr Gly Leu Met Ser Asp Tyr Ala Glu Phe Asp Gly Arg
290 295 300
Pro Gln Ala Asp Ser Glu His Lys Asp Phe Arg Tyr Asp Ala Phe Arg
305 310 315 320
Val Ala Ser Asn Val Ala Leu Asp Trp Ala Trp Phe Ala Ala Asp Pro
325 330 335
Trp Glu Val Glu Gln Ser Asn Arg Leu Leu Asp Phe Phe Arg Ser Gln
340 345 350
Gly Met Asp Lys Tyr Pro Ser Leu Tyr Asn Ile Asp Gly Thr Pro Leu
355 360 365
Ser Thr Asn Arg Ser Pro Gly Leu Ile Ala Met Asn Ala Thr Ala Gly
370 375 380
Leu Ala Ala Asp Pro Glu Lys Ser Lys Asp Phe Val Gln Ala Leu Trp
385 390 395 400
Asp Leu Glu Ile Pro Ser Gly Gln Trp Arg Tyr Tyr Asp Gly Val Leu
405 410 415
Tyr Phe Leu Ala Leu Leu Gln Ala Ser Gly Asn Tyr Arg Ile Tyr Thr
420 425 430
Pro Asp Met Pro Lys Val Val Arg Pro Thr Pro Thr Pro Asp Pro Ile
435 440 445
Thr Gln Ala Lys Phe Ala Pro Gly Asp Asp Ala Val Leu Phe Ser Val
450 455 460
Glu Thr Asp Ala Leu Asp Glu Tyr Val Thr Ala Thr Gly Phe Glu Pro
465 470 475 480
Gly Gly Val Met Leu Asn Thr Thr Leu Asp Ser Ala Ser Phe Asp Ala
485 490 495
Pro Leu Pro Asp Ser Ala Leu Leu Ile Gly Leu Asp Val Ser Asp Gln
500 505 510
<210> 9
<211> 1311
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 9
atgtttccac gtctttcacc aagccgcttc aggcaagtta ccttaacctt gctcacgctc 60
ggccttgtgt cactgaccgg ttgtgcaggt aacagcaagc cggatgcaga caccagtact 120
gctggtgccg ttgctaccgg cgagtaccgc aatctgtttg ccgaaatcgg aaaaagcgaa 180
atagacatcc agcgcaaaat tgacgaggcg tttcagcact tgttttatgg cgacgcgaaa 240
gatgcagctg tctactatca agcgggtgga aacgagaatg gtccactcgc atatgtttac 300
gatgtgaaca gcaatgacgt gcgctcagaa ggcatgagct acggcatgat gattactgtt 360
caaatggaca aaaaagccga gttcgatgca atctggaact gggcgaaaac ctatatgtat 420
caagactccc ccacgcatcc agcgtttggt tactttgcct ggtccatgcg ccgcgatggt 480
gtcgccaatg acgatatgcc agcgccagat ggcgaggaat atttcgtgac cgctctctat 540
ttcgccgccg cccgctgggg taatggcgaa ggtattttca actaccaaca ggaagcggac 600
accattttga gccgcatgcg ccaccgccag gtgatcaccg gcccaaccaa tcgcggagta 660
atgactgcga ccaatctgtt ccacccggaa gaggcgcaag tgcgcttcac gcccgacatc 720
aataatgctg atcatacaga cgcgtcttac catctgccct cgttctatga aatttgggca 780
cgtgtcgcgc cgcaagaaga tcgcgcgttt tgggccaaag cggccgatgt gagccgcgac 840
tattttgcca aagccgccca ccctgtcact gcgttaacac cggactacgg taattttgat 900
ggcaccccgt gggcggcatc ctggcggccg gagtcggtag attttcgata cgatgcctgg 960
cgttccgtca tgaactggtc catggactat gcctggtggg gcaaagattc aggcgcacct 1020
gcgcgcagtg ataaattact cgcgttcttc gaaacccagg aaggcaaaat gaaccacctc 1080
tatagcctgg atggcaaacc gctgggtggt ggaccgaccc tcggcctaat ttccatgaat 1140
gcaacggcag ctatggcagc tactgatccc cgctggcaca attttgtgga aaagctctgg 1200
caacaacaac cccccacagg gcaataccgg tactacgacg gtgttctata cctgatggcg 1260
ctgctacatt gcgctgggga gtacaaagcg tggatccccg acggggaata a 1311
<210> 10
<211> 436
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(36)
<400> 10
Met Phe Pro Arg Leu Ser Pro Ser Arg Phe Arg Gln Val Thr Leu Thr
1 5 10 15
Leu Leu Thr Leu Gly Leu Val Ser Leu Thr Gly Cys Ala Gly Asn Ser
20 25 30
Lys Pro Asp Ala Asp Thr Ser Thr Ala Gly Ala Val Ala Thr Gly Glu
35 40 45
Tyr Arg Asn Leu Phe Ala Glu Ile Gly Lys Ser Glu Ile Asp Ile Gln
50 55 60
Arg Lys Ile Asp Glu Ala Phe Gln His Leu Phe Tyr Gly Asp Ala Lys
65 70 75 80
Asp Ala Ala Val Tyr Tyr Gln Ala Gly Gly Asn Glu Asn Gly Pro Leu
85 90 95
Ala Tyr Val Tyr Asp Val Asn Ser Asn Asp Val Arg Ser Glu Gly Met
100 105 110
Ser Tyr Gly Met Met Ile Thr Val Gln Met Asp Lys Lys Ala Glu Phe
115 120 125
Asp Ala Ile Trp Asn Trp Ala Lys Thr Tyr Met Tyr Gln Asp Ser Pro
130 135 140
Thr His Pro Ala Phe Gly Tyr Phe Ala Trp Ser Met Arg Arg Asp Gly
145 150 155 160
Val Ala Asn Asp Asp Met Pro Ala Pro Asp Gly Glu Glu Tyr Phe Val
165 170 175
Thr Ala Leu Tyr Phe Ala Ala Ala Arg Trp Gly Asn Gly Glu Gly Ile
180 185 190
Phe Asn Tyr Gln Gln Glu Ala Asp Thr Ile Leu Ser Arg Met Arg His
195 200 205
Arg Gln Val Ile Thr Gly Pro Thr Asn Arg Gly Val Met Thr Ala Thr
210 215 220
Asn Leu Phe His Pro Glu Glu Ala Gln Val Arg Phe Thr Pro Asp Ile
225 230 235 240
Asn Asn Ala Asp His Thr Asp Ala Ser Tyr His Leu Pro Ser Phe Tyr
245 250 255
Glu Ile Trp Ala Arg Val Ala Pro Gln Glu Asp Arg Ala Phe Trp Ala
260 265 270
Lys Ala Ala Asp Val Ser Arg Asp Tyr Phe Ala Lys Ala Ala His Pro
275 280 285
Val Thr Ala Leu Thr Pro Asp Tyr Gly Asn Phe Asp Gly Thr Pro Trp
290 295 300
Ala Ala Ser Trp Arg Pro Glu Ser Val Asp Phe Arg Tyr Asp Ala Trp
305 310 315 320
Arg Ser Val Met Asn Trp Ser Met Asp Tyr Ala Trp Trp Gly Lys Asp
325 330 335
Ser Gly Ala Pro Ala Arg Ser Asp Lys Leu Leu Ala Phe Phe Glu Thr
340 345 350
Gln Glu Gly Lys Met Asn His Leu Tyr Ser Leu Asp Gly Lys Pro Leu
355 360 365
Gly Gly Gly Pro Thr Leu Gly Leu Ile Ser Met Asn Ala Thr Ala Ala
370 375 380
Met Ala Ala Thr Asp Pro Arg Trp His Asn Phe Val Glu Lys Leu Trp
385 390 395 400
Gln Gln Gln Pro Pro Thr Gly Gln Tyr Arg Tyr Tyr Asp Gly Val Leu
405 410 415
Tyr Leu Met Ala Leu Leu His Cys Ala Gly Glu Tyr Lys Ala Trp Ile
420 425 430
Pro Asp Gly Glu
435
<210> 11
<211> 1224
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 11
atgcggaacg tcgtgcgtaa accattgaca atcggactcg ctttaacact attattgccc 60
atgggaatga cggcaacatc agcgaagaat gcagattcct atgcgaaaaa acctcacatc 120
agcgcattga atgccccaca attggatcaa cgctacaaaa acgagttcac gattggtgcg 180
gcagtagaac cttatcaact acaaaatgaa aaagacgtac aaatgctaaa gcgccacttc 240
aacagcattg ttgccgagaa cgtaatgaaa ccgatcagca ttcaacctga ggaaggaaaa 300
ttcaattttg aacaagcgga tcgaattgtg aagttcgcta aggcaaatgg catggatatt 360
cgcttccata cactcgtttg gcacagccaa gtacctcaac ggttctttct tgacaaggaa 420
ggtaagccaa tggtcaatga aacagatcca gtgaaacgtg aacaaaataa acaactgctg 480
ttaaaacgac ttgaaactca tattaaaacg atcgtcgagc ggtacaaaga tgacattaag 540
tactgggacg ttgtaaatga ggttgtgggg gacgacggaa aactgcgcaa ctctccatgg 600
tatcaaatcg ccggcatcga ttatattaaa gtggcattcc aagcagctag aaaatatggc 660
ggagacaaca ttaagcttta catgaatgat tacaatacag aagtcgaacc gaagcgaacc 720
gctctttaca atttagtcaa acaactgaaa gaagagggtg ttccgatcga cggcatcggc 780
catcaatccc acatccaaat cggctggcct tctgaagcag aaatcgagaa aacgattaac 840
atgttcgccg ctttcggttt agacaaccaa atcactgagc ttgatgtgag catgtacggt 900
tggccgccgc gcgcttaccc gacgtatgac gccattccaa aacaaaagtt tttggatcag 960
gcagcgcgct atgatcgttt gttcaaactg tatgagaagt tgagcgataa aattagcaac 1020
gtcaccttct ggggcatcgc cgacaatcat acgtggctcg acagccgtgc ggatgtgtac 1080
tatgacgcca acgggaatgt tgtggttgac ccgaacgctc cgtacgcaaa agtggaaaaa 1140
gggaaaggaa aagatgcgcc gttcgttttt ggaccggatt acaaagtcaa acccgcatat 1200
tgggctatta ttgaccacaa atag 1224
<210> 12
<211> 407
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(28)
<400> 12
Met Arg Asn Val Val Arg Lys Pro Leu Thr Ile Gly Leu Ala Leu Thr
1 5 10 15
Leu Leu Leu Pro Met Gly Met Thr Ala Thr Ser Ala Lys Asn Ala Asp
20 25 30
Ser Tyr Ala Lys Lys Pro His Ile Ser Ala Leu Asn Ala Pro Gln Leu
35 40 45
Asp Gln Arg Tyr Lys Asn Glu Phe Thr Ile Gly Ala Ala Val Glu Pro
50 55 60
Tyr Gln Leu Gln Asn Glu Lys Asp Val Gln Met Leu Lys Arg His Phe
65 70 75 80
Asn Ser Ile Val Ala Glu Asn Val Met Lys Pro Ile Ser Ile Gln Pro
85 90 95
Glu Glu Gly Lys Phe Asn Phe Glu Gln Ala Asp Arg Ile Val Lys Phe
100 105 110
Ala Lys Ala Asn Gly Met Asp Ile Arg Phe His Thr Leu Val Trp His
115 120 125
Ser Gln Val Pro Gln Arg Phe Phe Leu Asp Lys Glu Gly Lys Pro Met
130 135 140
Val Asn Glu Thr Asp Pro Val Lys Arg Glu Gln Asn Lys Gln Leu Leu
145 150 155 160
Leu Lys Arg Leu Glu Thr His Ile Lys Thr Ile Val Glu Arg Tyr Lys
165 170 175
Asp Asp Ile Lys Tyr Trp Asp Val Val Asn Glu Val Val Gly Asp Asp
180 185 190
Gly Lys Leu Arg Asn Ser Pro Trp Tyr Gln Ile Ala Gly Ile Asp Tyr
195 200 205
Ile Lys Val Ala Phe Gln Ala Ala Arg Lys Tyr Gly Gly Asp Asn Ile
210 215 220
Lys Leu Tyr Met Asn Asp Tyr Asn Thr Glu Val Glu Pro Lys Arg Thr
225 230 235 240
Ala Leu Tyr Asn Leu Val Lys Gln Leu Lys Glu Glu Gly Val Pro Ile
245 250 255
Asp Gly Ile Gly His Gln Ser His Ile Gln Ile Gly Trp Pro Ser Glu
260 265 270
Ala Glu Ile Glu Lys Thr Ile Asn Met Phe Ala Ala Phe Gly Leu Asp
275 280 285
Asn Gln Ile Thr Glu Leu Asp Val Ser Met Tyr Gly Trp Pro Pro Arg
290 295 300
Ala Tyr Pro Thr Tyr Asp Ala Ile Pro Lys Gln Lys Phe Leu Asp Gln
305 310 315 320
Ala Ala Arg Tyr Asp Arg Leu Phe Lys Leu Tyr Glu Lys Leu Ser Asp
325 330 335
Lys Ile Ser Asn Val Thr Phe Trp Gly Ile Ala Asp Asn His Thr Trp
340 345 350
Leu Asp Ser Arg Ala Asp Val Tyr Tyr Asp Ala Asn Gly Asn Val Val
355 360 365
Val Asp Pro Asn Ala Pro Tyr Ala Lys Val Glu Lys Gly Lys Gly Lys
370 375 380
Asp Ala Pro Phe Val Phe Gly Pro Asp Tyr Lys Val Lys Pro Ala Tyr
385 390 395 400
Trp Ala Ile Ile Asp His Lys
405
<210> 13
<211> 1053
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 13
atgaaagacg cgctccagtg ctctcccctt ttcaaagcct atgaaaaata cttccgcatc 60
ggcgcggcgg ttagcagctt catgaccttt gatcccgctt accgcgccct gatccgccgc 120
cattacaatt ccctgacggc ggacaaccag atgaagccgg aaagcgtgtt ggatcgcacc 180
gcgaccctgg cgaagggcga cctgctccac gctgcggtgg atttcacccg tgtggacgcg 240
ctgatgtact ttgcacggga caacgggatc cccatgcggt atcacaccct ggcctggcac 300
aaccagacgc cccgctggtt cttcgcgaag gactggagcg acgcggaaag cgccgaaccc 360
gcctcaaagg aaaccatgct tgcccgtctg gaaaactata tcctggatgt catgaaccat 420
gtgaatacca agtttcccgg tctggtttac acctgggacg tggtaaacga agccattgag 480
ccagagctga aagccccggg attgtaccgg acctggagcc cctggttcaa aacctgcgga 540
gaagatttcc tctttaccgc tttccgggcc gcccgcaagg gacaggcgcc cggtcagacc 600
ctttgctata acgactataa cgccttcgag cccgtcaagc gggacgcgat tatcgatctg 660
ctgaagaagc tgcaggcgga aaacctggtg gataccatgg gtatgcaggg gcattatgtc 720
atggactgga tgaacatctc gctctgcgaa gaggccgccc gcgcctatgc cgccctgggc 780
ctgaaggtcc aggtcaccga gctggatatc cactgcaaca gcgacgatga agcccacagc 840
caaaagctgg cgcagcttta cggcgattat ttcgccatgc tgaagaagct gaaggaggaa 900
ggcgtcgaca tcgaagccgt caccttctgg ggcgtcaccg accaggacag ctggctcacc 960
ggtttccgta aagagacaag ctatcccctc ctcttcgacc gcgccaagca ggccaaggat 1020
gcctatgacg ccgtcatgaa agccgcggaa taa 1053
<210> 14
<211> 350
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 14
Met Lys Asp Ala Leu Gln Cys Ser Pro Leu Phe Lys Ala Tyr Glu Lys
1 5 10 15
Tyr Phe Arg Ile Gly Ala Ala Val Ser Ser Phe Met Thr Phe Asp Pro
20 25 30
Ala Tyr Arg Ala Leu Ile Arg Arg His Tyr Asn Ser Leu Thr Ala Asp
35 40 45
Asn Gln Met Lys Pro Glu Ser Val Leu Asp Arg Thr Ala Thr Leu Ala
50 55 60
Lys Gly Asp Leu Leu His Ala Ala Val Asp Phe Thr Arg Val Asp Ala
65 70 75 80
Leu Met Tyr Phe Ala Arg Asp Asn Gly Ile Pro Met Arg Tyr His Thr
85 90 95
Leu Ala Trp His Asn Gln Thr Pro Arg Trp Phe Phe Ala Lys Asp Trp
100 105 110
Ser Asp Ala Glu Ser Ala Glu Pro Ala Ser Lys Glu Thr Met Leu Ala
115 120 125
Arg Leu Glu Asn Tyr Ile Leu Asp Val Met Asn His Val Asn Thr Lys
130 135 140
Phe Pro Gly Leu Val Tyr Thr Trp Asp Val Val Asn Glu Ala Ile Glu
145 150 155 160
Pro Glu Leu Lys Ala Pro Gly Leu Tyr Arg Thr Trp Ser Pro Trp Phe
165 170 175
Lys Thr Cys Gly Glu Asp Phe Leu Phe Thr Ala Phe Arg Ala Ala Arg
180 185 190
Lys Gly Gln Ala Pro Gly Gln Thr Leu Cys Tyr Asn Asp Tyr Asn Ala
195 200 205
Phe Glu Pro Val Lys Arg Asp Ala Ile Ile Asp Leu Leu Lys Lys Leu
210 215 220
Gln Ala Glu Asn Leu Val Asp Thr Met Gly Met Gln Gly His Tyr Val
225 230 235 240
Met Asp Trp Met Asn Ile Ser Leu Cys Glu Glu Ala Ala Arg Ala Tyr
245 250 255
Ala Ala Leu Gly Leu Lys Val Gln Val Thr Glu Leu Asp Ile His Cys
260 265 270
Asn Ser Asp Asp Glu Ala His Ser Gln Lys Leu Ala Gln Leu Tyr Gly
275 280 285
Asp Tyr Phe Ala Met Leu Lys Lys Leu Lys Glu Glu Gly Val Asp Ile
290 295 300
Glu Ala Val Thr Phe Trp Gly Val Thr Asp Gln Asp Ser Trp Leu Thr
305 310 315 320
Gly Phe Arg Lys Glu Thr Ser Tyr Pro Leu Leu Phe Asp Arg Ala Lys
325 330 335
Gln Ala Lys Asp Ala Tyr Asp Ala Val Met Lys Ala Ala Glu
340 345 350
<210> 15
<211> 1110
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 15
atgaaacgtc ctctagtcaa tctcctgaca accgcctgcc tcctcgttgc cgcaaatgct 60
gcagaaccca ccctccgcga agcctacgaa aagcactttg ccgtgggtgt cgcactcaat 120
accgctcaag tgactggtcg aaacaaagcc gcaggcgaac tcgccgcgaa gcagttcaat 180
tccatcaccg ctgagaatga catgaagtgg caatcgcttc atccagagct cgatacctac 240
cgctttgaat cggccgatgc ctatatcgac tttgccaaaa agaatgagat ggaagtcata 300
ggccacactc tcgtctggca cagccagacc cctcagtggg tgttccaagg cgacgatggc 360
aaacccgcga cacgggaaga acttctcaag cggatgcgcg atcacattca caaggtcgcc 420
ggccgataca agggtaaggt caagggctgg gacgtcgtca atgaggcgct ctccgacgga 480
ggtcaggaca ttctacgcga atctccgtgg cggcgaatca tcggagacga tttcatcgat 540
cacgctttcc gctacgcccg cgaagccgac ccaaaggcag aactttacta caacgactac 600
aacctcgaaa tccctcgcaa acgcgagaac tgcatcaagc tcgtcaaggg catgcttgag 660
cgcggcgtcc ccatcgacgg cattggaacg caatcccatt ttcagcttgg cttcccatcg 720
ctggaagatg tcgagaccac gattgaagag tttggaaaac tcggccttaa ggtcatgatt 780
accgaactcg atgtggatgt cctccctcgc aataacccag gcgtcgccga catcagtcag 840
cgcgagcaag gtagcaatcc ctacactgag ggcctgcccg aggatgttca aaagcagctt 900
acgaaacgct acgaagacat cttcaagatc tacctaaagc accagaaaac ggtcacccgc 960
gtgaccttct ggggcctcga tgatggtcaa tcatggttga atggctttcc tgttagaggc 1020
cgcaccaatc acccgctact tttcgatcgt gaactcaaac cgaagcccgt tcttccagtc 1080
ttgatagagc tcggcaagaa gaagcgataa 1110
<210> 16
<211> 369
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(20)
<400> 16
Met Lys Arg Pro Leu Val Asn Leu Leu Thr Thr Ala Cys Leu Leu Val
1 5 10 15
Ala Ala Asn Ala Ala Glu Pro Thr Leu Arg Glu Ala Tyr Glu Lys His
20 25 30
Phe Ala Val Gly Val Ala Leu Asn Thr Ala Gln Val Thr Gly Arg Asn
35 40 45
Lys Ala Ala Gly Glu Leu Ala Ala Lys Gln Phe Asn Ser Ile Thr Ala
50 55 60
Glu Asn Asp Met Lys Trp Gln Ser Leu His Pro Glu Leu Asp Thr Tyr
65 70 75 80
Arg Phe Glu Ser Ala Asp Ala Tyr Ile Asp Phe Ala Lys Lys Asn Glu
85 90 95
Met Glu Val Ile Gly His Thr Leu Val Trp His Ser Gln Thr Pro Gln
100 105 110
Trp Val Phe Gln Gly Asp Asp Gly Lys Pro Ala Thr Arg Glu Glu Leu
115 120 125
Leu Lys Arg Met Arg Asp His Ile His Lys Val Ala Gly Arg Tyr Lys
130 135 140
Gly Lys Val Lys Gly Trp Asp Val Val Asn Glu Ala Leu Ser Asp Gly
145 150 155 160
Gly Gln Asp Ile Leu Arg Glu Ser Pro Trp Arg Arg Ile Ile Gly Asp
165 170 175
Asp Phe Ile Asp His Ala Phe Arg Tyr Ala Arg Glu Ala Asp Pro Lys
180 185 190
Ala Glu Leu Tyr Tyr Asn Asp Tyr Asn Leu Glu Ile Pro Arg Lys Arg
195 200 205
Glu Asn Cys Ile Lys Leu Val Lys Gly Met Leu Glu Arg Gly Val Pro
210 215 220
Ile Asp Gly Ile Gly Thr Gln Ser His Phe Gln Leu Gly Phe Pro Ser
225 230 235 240
Leu Glu Asp Val Glu Thr Thr Ile Glu Glu Phe Gly Lys Leu Gly Leu
245 250 255
Lys Val Met Ile Thr Glu Leu Asp Val Asp Val Leu Pro Arg Asn Asn
260 265 270
Pro Gly Val Ala Asp Ile Ser Gln Arg Glu Gln Gly Ser Asn Pro Tyr
275 280 285
Thr Glu Gly Leu Pro Glu Asp Val Gln Lys Gln Leu Thr Lys Arg Tyr
290 295 300
Glu Asp Ile Phe Lys Ile Tyr Leu Lys His Gln Lys Thr Val Thr Arg
305 310 315 320
Val Thr Phe Trp Gly Leu Asp Asp Gly Gln Ser Trp Leu Asn Gly Phe
325 330 335
Pro Val Arg Gly Arg Thr Asn His Pro Leu Leu Phe Asp Arg Glu Leu
340 345 350
Lys Pro Lys Pro Val Leu Pro Val Leu Ile Glu Leu Gly Lys Lys Lys
355 360 365
Arg
<210> 17
<211> 1035
<212> DNA
<213> Bacteria
<400> 17
atgtcccggc acgtcatcgc cctgtccgcc gccgtctgcc tcgcggccgg cctcgccgcc 60
gcgcccgcga gcgccgagcc gcgtccccgg acgctcggcg aactggccaa gaagcaccac 120
aagtacttcg gctcggccac cgacaacccc gagttcaccg acgccgccta tctgaagctc 180
ctcggcagcg agttcgggca gaccaccccc ggcaacgcca tgaagtggta cgccaccgaa 240
cccgcgcccg gcgtcttcga cttcaccgcg ggcgacgagg tcgtggcctt cgccaaggcc 300
catcaccaga aggtccgcgg ccacaccctc gtctggcaca gccagctccc cgcctggctc 360
accgagcgca gctggaccgc cgcggaactg cgccccgtcc tcaagaatca catccagaag 420
gtggcccggc actacaaggg caaggtcatc cactgggacg tcgtcaacga ggccttcaac 480
gaggacggca cctaccgcga gtcggtcttc tacaagacgc tcggccccgg ctacatcgcc 540
gacgccctgc gctgggccca cgaggccgac ccgcacgcca agctgtacct caacgactac 600
aacgtcgacg ggatcggccc caagagcgac gcctactacc gcctgatcaa gcagctgaag 660
gccgacggcg tcccggtgga gggcttcggc atccaggggc acctggcgct ccagtacggc 720
ttccccgccg acgtcaagca gaacatgcag cgcttcgccg acctcggcgt cgaggtcgcg 780
gtcaccgagc tcgacatccg gatgaacctc ccggcgaccc cttcgatgct cgccacccag 840
gccacctggt acgccgacta cgtcaaggcc tgcctggagg tcaggaagtg cgtcggcgtc 900
accatctggg actacaccga caagtactcg tggatcccct ccgtcttccc cggtgagggc 960
gccgcgctgc cctacgacga gaacctggcg cccaagcccg cctaccacgc gatcaggaag 1020
gtgctgggcg gatga 1035
<210> 18
<211> 344
<212> PRT
<213> Bacteria
<220>
<221> SIGNAL
<222> (1)...(31)
<400> 18
Met Ser Arg His Val Ile Ala Leu Ser Ala Ala Val Cys Leu Ala Ala
1 5 10 15
Gly Leu Ala Ala Ala Pro Ala Ser Ala Glu Pro Arg Pro Arg Thr Leu
20 25 30
Gly Glu Leu Ala Lys Lys His His Lys Tyr Phe Gly Ser Ala Thr Asp
35 40 45
Asn Pro Glu Phe Thr Asp Ala Ala Tyr Leu Lys Leu Leu Gly Ser Glu
50 55 60
Phe Gly Gln Thr Thr Pro Gly Asn Ala Met Lys Trp Tyr Ala Thr Glu
65 70 75 80
Pro Ala Pro Gly Val Phe Asp Phe Thr Ala Gly Asp Glu Val Val Ala
85 90 95
Phe Ala Lys Ala His His Gln Lys Val Arg Gly His Thr Leu Val Trp
100 105 110
His Ser Gln Leu Pro Ala Trp Leu Thr Glu Arg Ser Trp Thr Ala Ala
115 120 125
Glu Leu Arg Pro Val Leu Lys Asn His Ile Gln Lys Val Ala Arg His
130 135 140
Tyr Lys Gly Lys Val Ile His Trp Asp Val Val Asn Glu Ala Phe Asn
145 150 155 160
Glu Asp Gly Thr Tyr Arg Glu Ser Val Phe Tyr Lys Thr Leu Gly Pro
165 170 175
Gly Tyr Ile Ala Asp Ala Leu Arg Trp Ala His Glu Ala Asp Pro His
180 185 190
Ala Lys Leu Tyr Leu Asn Asp Tyr Asn Val Asp Gly Ile Gly Pro Lys
195 200 205
Ser Asp Ala Tyr Tyr Arg Leu Ile Lys Gln Leu Lys Ala Asp Gly Val
210 215 220
Pro Val Glu Gly Phe Gly Ile Gln Gly His Leu Ala Leu Gln Tyr Gly
225 230 235 240
Phe Pro Ala Asp Val Lys Gln Asn Met Gln Arg Phe Ala Asp Leu Gly
245 250 255
Val Glu Val Ala Val Thr Glu Leu Asp Ile Arg Met Asn Leu Pro Ala
260 265 270
Thr Pro Ser Met Leu Ala Thr Gln Ala Thr Trp Tyr Ala Asp Tyr Val
275 280 285
Lys Ala Cys Leu Glu Val Arg Lys Cys Val Gly Val Thr Ile Trp Asp
290 295 300
Tyr Thr Asp Lys Tyr Ser Trp Ile Pro Ser Val Phe Pro Gly Glu Gly
305 310 315 320
Ala Ala Leu Pro Tyr Asp Glu Asn Leu Ala Pro Lys Pro Ala Tyr His
325 330 335
Ala Ile Arg Lys Val Leu Gly Gly
340
<210> 19
<211> 1152
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 19
atgaagatgt taaaaactat tgttgtggct gtagcagcct tactatccag tcctactgct 60
tcagccactt tacagaacct gaagcgggct cctgattcat tgaccttgaa agatgcattt 120
gagggtaagt tttatatagg aacagcatta aaccttgatc agatatggga gcgcgatcag 180
gctgcggtcg cggtggtcaa aacgcagttc aactccatag ttgctgagaa ttgtatgaaa 240
agtatgtttt tgcaaccaag ggaaggtgag tttgatttta gggatgcgga ccgttttgtc 300
gcgtttggag aaaaaaataa aatgcaaatt atcggtcata cgctgatttg gcattcgcag 360
acaccagctt ggttttttgt cgataaaaat gggaaagagg tcacccgaga ggtacttatc 420
gagcgcatgc ggaagcatat acaaaccgtt gtttcccgct ataagggaag ggtgtttggt 480
tgggatgtgg tgaacgaagc catattggat aatggagaat ggcgtaaaag caaattctac 540
cagattatcg ggccacaatt tattgaattg gccttcaaat ttgcgcatga cgcagatcca 600
aatgcagaat tatattataa cgattattca actgctatcc ccgaaaaaag aaaggggatt 660
atgcgcatgg tgcagcaggt aaaggctgcc ggtgggcagg tcactggaat tggtatgcag 720
gaacacaacg cattggacaa tccaccggtc gatgaagtcg aaaaaaccat actcggattt 780
gcaagccttg gtgcgaaggt aatggttacg gaaatggata tttcggtcct gccgcatgta 840
cgtcccaata tgggcgcaga aataggggag cgtcatgcct acagtaaagc gatgaatccg 900
tacgaaaaag gacttcctgt aacgaaaatg aacgagttgg gagcgagata tgtagcgttt 960
tttaatttat atctcaaaca tcgggataaa atatcgcgtg tgacattgtg gggtgttggc 1020
gatggagatt catggaagaa tggttggcct attcccggac gtacagacta tccattgtta 1080
ttcgatcgga attaccaacc caaacctttt gtaaaagata ttattgcgtt gactcaaaaa 1140
aaaaagaaat aa 1152
<210> 20
<211> 383
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(29)
<400> 20
Met Lys Met Leu Lys Thr Ile Val Val Ala Val Ala Ala Leu Leu Ser
1 5 10 15
Ser Pro Thr Ala Ser Ala Thr Leu Gln Asn Leu Lys Arg Ala Pro Asp
20 25 30
Ser Leu Thr Leu Lys Asp Ala Phe Glu Gly Lys Phe Tyr Ile Gly Thr
35 40 45
Ala Leu Asn Leu Asp Gln Ile Trp Glu Arg Asp Gln Ala Ala Val Ala
50 55 60
Val Val Lys Thr Gln Phe Asn Ser Ile Val Ala Glu Asn Cys Met Lys
65 70 75 80
Ser Met Phe Leu Gln Pro Arg Glu Gly Glu Phe Asp Phe Arg Asp Ala
85 90 95
Asp Arg Phe Val Ala Phe Gly Glu Lys Asn Lys Met Gln Ile Ile Gly
100 105 110
His Thr Leu Ile Trp His Ser Gln Thr Pro Ala Trp Phe Phe Val Asp
115 120 125
Lys Asn Gly Lys Glu Val Thr Arg Glu Val Leu Ile Glu Arg Met Arg
130 135 140
Lys His Ile Gln Thr Val Val Ser Arg Tyr Lys Gly Arg Val Phe Gly
145 150 155 160
Trp Asp Val Val Asn Glu Ala Ile Leu Asp Asn Gly Glu Trp Arg Lys
165 170 175
Ser Lys Phe Tyr Gln Ile Ile Gly Pro Gln Phe Ile Glu Leu Ala Phe
180 185 190
Lys Phe Ala His Asp Ala Asp Pro Asn Ala Glu Leu Tyr Tyr Asn Asp
195 200 205
Tyr Ser Thr Ala Ile Pro Glu Lys Arg Lys Gly Ile Met Arg Met Val
210 215 220
Gln Gln Val Lys Ala Ala Gly Gly Gln Val Thr Gly Ile Gly Met Gln
225 230 235 240
Glu His Asn Ala Leu Asp Asn Pro Pro Val Asp Glu Val Glu Lys Thr
245 250 255
Ile Leu Gly Phe Ala Ser Leu Gly Ala Lys Val Met Val Thr Glu Met
260 265 270
Asp Ile Ser Val Leu Pro His Val Arg Pro Asn Met Gly Ala Glu Ile
275 280 285
Gly Glu Arg His Ala Tyr Ser Lys Ala Met Asn Pro Tyr Glu Lys Gly
290 295 300
Leu Pro Val Thr Lys Met Asn Glu Leu Gly Ala Arg Tyr Val Ala Phe
305 310 315 320
Phe Asn Leu Tyr Leu Lys His Arg Asp Lys Ile Ser Arg Val Thr Leu
325 330 335
Trp Gly Val Gly Asp Gly Asp Ser Trp Lys Asn Gly Trp Pro Ile Pro
340 345 350
Gly Arg Thr Asp Tyr Pro Leu Leu Phe Asp Arg Asn Tyr Gln Pro Lys
355 360 365
Pro Phe Val Lys Asp Ile Ile Ala Leu Thr Gln Lys Lys Lys Lys
370 375 380
<210> 21
<211> 1119
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 21
atgcggattc actggctggg gctcagctca cgcgcaagcc tgatgacggc ggcgctcctg 60
gctgtcacag gcaccaccaa atccgaggac tcgcccgcaa ctttgaaaga cgccttcaag 120
gattgtttcc ggatcggggt cgcgctcaac cagcggcaat ttaccgagca agataccaac 180
ggcgcgacgt tggtgaaacg gcagttcaac gccatctcac ccgaaaacgt gatgaagtgg 240
gcgaacattc atccccgacc cgggcccgat gggtataact tcgaggcggc tgaccgttac 300
gtcgagtttg gcgagaagaa cggaatgttc atcgtcggcc atacgctcgt ttggcacttc 360
caaacgccgc gctgggtact ccagggcgat ggcactaacg cggcgacgcg cgagctgctg 420
ctgcagcgga tgcgcgatca catccacacg gtcgtaggcc ggtacaaagg gcggatcaag 480
gcttgggacg tggtcaacga agcgctgaac gaagatggca ctctgcggcg gtcgcagtgg 540
taccggatca tcggcgaaga ctacatcgtc aaggctttcg aatatgcgca tgaggccgat 600
ccgtccgcgg aattgcgata caacgattac gccatcgaga atgagcggaa gcgcgacggc 660
gtaatcgcgc tcgtgaagaa acttcaggcg cagaaggtcc cacttggggg gctgggctcg 720
cagacgcatg ccaacctgac ctggcctaac gccgaatcgc tggacaccgc cctcacggcc 780
ttcaccgaac tgggtatccc gatctcaatc acggaactgg atgtgaccgc ctcgcaacgc 840
ggtcagctca accagagcgc cgaggtgtcg cagaatggac aggcggggga gggaggcgtg 900
gtggacgggg cgaatcagaa gctcgccgag cagtacgcca acttcttccg cgtctttctg 960
aagcatcgca aaaacattga gctcgtgacg ttttggggcg tcacggatcg tgactcctgg 1020
cggcgcattg gcaaaccgct gctatttaac gcagaatggc aacccaagcc ggcctttcac 1080
gccgtcatcg ccgaggcgaa aaagatcagt gggcaatga 1119
<210> 22
<211> 372
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(28)
<400> 22
Met Arg Ile His Trp Leu Gly Leu Ser Ser Arg Ala Ser Leu Met Thr
1 5 10 15
Ala Ala Leu Leu Ala Val Thr Gly Thr Thr Lys Ser Glu Asp Ser Pro
20 25 30
Ala Thr Leu Lys Asp Ala Phe Lys Asp Cys Phe Arg Ile Gly Val Ala
35 40 45
Leu Asn Gln Arg Gln Phe Thr Glu Gln Asp Thr Asn Gly Ala Thr Leu
50 55 60
Val Lys Arg Gln Phe Asn Ala Ile Ser Pro Glu Asn Val Met Lys Trp
65 70 75 80
Ala Asn Ile His Pro Arg Pro Gly Pro Asp Gly Tyr Asn Phe Glu Ala
85 90 95
Ala Asp Arg Tyr Val Glu Phe Gly Glu Lys Asn Gly Met Phe Ile Val
100 105 110
Gly His Thr Leu Val Trp His Phe Gln Thr Pro Arg Trp Val Leu Gln
115 120 125
Gly Asp Gly Thr Asn Ala Ala Thr Arg Glu Leu Leu Leu Gln Arg Met
130 135 140
Arg Asp His Ile His Thr Val Val Gly Arg Tyr Lys Gly Arg Ile Lys
145 150 155 160
Ala Trp Asp Val Val Asn Glu Ala Leu Asn Glu Asp Gly Thr Leu Arg
165 170 175
Arg Ser Gln Trp Tyr Arg Ile Ile Gly Glu Asp Tyr Ile Val Lys Ala
180 185 190
Phe Glu Tyr Ala His Glu Ala Asp Pro Ser Ala Glu Leu Arg Tyr Asn
195 200 205
Asp Tyr Ala Ile Glu Asn Glu Arg Lys Arg Asp Gly Val Ile Ala Leu
210 215 220
Val Lys Lys Leu Gln Ala Gln Lys Val Pro Leu Gly Gly Leu Gly Ser
225 230 235 240
Gln Thr His Ala Asn Leu Thr Trp Pro Asn Ala Glu Ser Leu Asp Thr
245 250 255
Ala Leu Thr Ala Phe Thr Glu Leu Gly Ile Pro Ile Ser Ile Thr Glu
260 265 270
Leu Asp Val Thr Ala Ser Gln Arg Gly Gln Leu Asn Gln Ser Ala Glu
275 280 285
Val Ser Gln Asn Gly Gln Ala Gly Glu Gly Gly Val Val Asp Gly Ala
290 295 300
Asn Gln Lys Leu Ala Glu Gln Tyr Ala Asn Phe Phe Arg Val Phe Leu
305 310 315 320
Lys His Arg Lys Asn Ile Glu Leu Val Thr Phe Trp Gly Val Thr Asp
325 330 335
Arg Asp Ser Trp Arg Arg Ile Gly Lys Pro Leu Leu Phe Asn Ala Glu
340 345 350
Trp Gln Pro Lys Pro Ala Phe His Ala Val Ile Ala Glu Ala Lys Lys
355 360 365
Ile Ser Gly Gln
370
<210> 23
<211> 1137
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 23
atgaggacaa aacaagtttt taaattaacc acgctcgctt tattattaac agcagttgtt 60
agtagctgtt ctgccccaaa agcggcaaaa gaagatacgc ttaaagatgc cctccaggga 120
aaattcttta ttggtgctgc tgttaatgtt gaccaaatgg caggaaagga ttctcttgca 180
attgaagttg ttaaaaagaa ctttagctca attgtggccg agaattgcat gaaaatggaa 240
aacatccatc ctgtaaaagg tgaatttttc ttcgatgaag ccgatgcata tgttgaattt 300
ggcgaaaaaa acaacatgaa aatcattggt cacacattga tttggcattc acaagccgcc 360
aaatgggcat ttgttgatga tgaaggcaaa gatgtatcgc gcgaagaatt aattgaacgg 420
atgcgcaacc acatccatac cattgtaggc cgctataaag gtcgtgtaca tggctgggac 480
gttgttaatg aggctattct ggataacggc gaatggcgtc agagcaaatg gtataccatt 540
attggacccg aatttgttca gcttgctttt gagtttgccc acgaagccga ccccaacgct 600
gaattgtatt acaacgacta caacgagtgg attccggcta aaagagacgg catttacaac 660
atggttaagg atttaatcga caaaggcgtt aaagttgatg gaattggcct acagggtcac 720
attgctcttg actctcccag catcgaactt tacgaagaag ccattgtaaa atatgcaagt 780
ctgggtgtgc aaacaatggt taccgaactc gatatcactg ttttaccatg gccatcgcag 840
caagttacag ccgatatatc ttttagtgca gagctatcaa ccgaatacaa tccatttgtt 900
aatggtttac ccgattcggt tagcgttgaa cttaccaacc gttttgccag tttcttcgag 960
ttgtttttga aacatcagga taaaattgac cgcgttactc tatggggtgt acacgatggt 1020
caatcatgga aaaacaactg gcccatcagg ggacgtaaag attatccgtt gttattcgac 1080
aggcaatatc agtccaaacc tgccgttcag cgcataatcg aattggctaa acaataa 1137
<210> 24
<211> 378
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(29)
<400> 24
Met Arg Thr Lys Gln Val Phe Lys Leu Thr Thr Leu Ala Leu Leu Leu
1 5 10 15
Thr Ala Val Val Ser Ser Cys Ser Ala Pro Lys Ala Ala Lys Glu Asp
20 25 30
Thr Leu Lys Asp Ala Leu Gln Gly Lys Phe Phe Ile Gly Ala Ala Val
35 40 45
Asn Val Asp Gln Met Ala Gly Lys Asp Ser Leu Ala Ile Glu Val Val
50 55 60
Lys Lys Asn Phe Ser Ser Ile Val Ala Glu Asn Cys Met Lys Met Glu
65 70 75 80
Asn Ile His Pro Val Lys Gly Glu Phe Phe Phe Asp Glu Ala Asp Ala
85 90 95
Tyr Val Glu Phe Gly Glu Lys Asn Asn Met Lys Ile Ile Gly His Thr
100 105 110
Leu Ile Trp His Ser Gln Ala Ala Lys Trp Ala Phe Val Asp Asp Glu
115 120 125
Gly Lys Asp Val Ser Arg Glu Glu Leu Ile Glu Arg Met Arg Asn His
130 135 140
Ile His Thr Ile Val Gly Arg Tyr Lys Gly Arg Val His Gly Trp Asp
145 150 155 160
Val Val Asn Glu Ala Ile Leu Asp Asn Gly Glu Trp Arg Gln Ser Lys
165 170 175
Trp Tyr Thr Ile Ile Gly Pro Glu Phe Val Gln Leu Ala Phe Glu Phe
180 185 190
Ala His Glu Ala Asp Pro Asn Ala Glu Leu Tyr Tyr Asn Asp Tyr Asn
195 200 205
Glu Trp Ile Pro Ala Lys Arg Asp Gly Ile Tyr Asn Met Val Lys Asp
210 215 220
Leu Ile Asp Lys Gly Val Lys Val Asp Gly Ile Gly Leu Gln Gly His
225 230 235 240
Ile Ala Leu Asp Ser Pro Ser Ile Glu Leu Tyr Glu Glu Ala Ile Val
245 250 255
Lys Tyr Ala Ser Leu Gly Val Gln Thr Met Val Thr Glu Leu Asp Ile
260 265 270
Thr Val Leu Pro Trp Pro Ser Gln Gln Val Thr Ala Asp Ile Ser Phe
275 280 285
Ser Ala Glu Leu Ser Thr Glu Tyr Asn Pro Phe Val Asn Gly Leu Pro
290 295 300
Asp Ser Val Ser Val Glu Leu Thr Asn Arg Phe Ala Ser Phe Phe Glu
305 310 315 320
Leu Phe Leu Lys His Gln Asp Lys Ile Asp Arg Val Thr Leu Trp Gly
325 330 335
Val His Asp Gly Gln Ser Trp Lys Asn Asn Trp Pro Ile Arg Gly Arg
340 345 350
Lys Asp Tyr Pro Leu Leu Phe Asp Arg Gln Tyr Gln Ser Lys Pro Ala
355 360 365
Val Gln Arg Ile Ile Glu Leu Ala Lys Gln
370 375
<210> 25
<211> 978
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 25
gtggatccaa agaattcctt acgcgcctta gctcaaaagc gaggaattgg gtttgggacg 60
gcagtttggg ttgagcctct gtctaacgat tcgagatatc ggacggtgtt ggcgcaggag 120
ttcaatatgg tgacgccaga gaatgagatg aagtttgagc cgacgcatcc agaacgggag 180
cgctacgatt ttacagcagc cgataccctt gttgactttg ccaagaacca taacatgcag 240
gtgcgcggac ataccctggt ttggcatgaa agtctccccg attggctaac gactcaaacg 300
tggacgcgtg aggagttgat gtccatctta gaagaacaca tcaatacagt tgtcgatcgc 360
tatcgggggc aattagttgc ctgggatgtg gtgaatgaag cgatcgccaa cgataaaaac 420
gcactcagag atacgatttg gctgcgaaca atcgggccag agtatataga gaaggcattt 480
cgctgggcgc atgcagccga ccctcaagca cgtttatttt acaacgatta tggcggcgag 540
gaagtggggg gaaagtctga ggccatctat ggcatgctta aagatttgct gcaacagggt 600
gtcccgattc acggggttgg cttgcaaatg cacgttagta taaaaaaccc tcccaatccc 660
gaaaaagtgg cggcaaatat caagcgcctg aacgatctgg gattggaagt gcatataact 720
gagatggatg tgaaaacctg ggatggcatc ggtacgaagc agcaacgact tgcggctcag 780
gcacaagtgt atcggaacat gatgcaggtg tgtttggaag ctgagaactg taaggcgttt 840
tcgttgtggg gggtaagcga tcgctattct tggattcccc ggatttttaa gaagccggat 900
gcaccactga tttttgatga tttagggcgt ccgaaacccg cttacaatgc cctgaaagaa 960
gtcctcaagc ggcgttaa 978
<210> 26
<211> 325
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 26
Val Asp Pro Lys Asn Ser Leu Arg Ala Leu Ala Gln Lys Arg Gly Ile
1 5 10 15
Gly Phe Gly Thr Ala Val Trp Val Glu Pro Leu Ser Asn Asp Ser Arg
20 25 30
Tyr Arg Thr Val Leu Ala Gln Glu Phe Asn Met Val Thr Pro Glu Asn
35 40 45
Glu Met Lys Phe Glu Pro Thr His Pro Glu Arg Glu Arg Tyr Asp Phe
50 55 60
Thr Ala Ala Asp Thr Leu Val Asp Phe Ala Lys Asn His Asn Met Gln
65 70 75 80
Val Arg Gly His Thr Leu Val Trp His Glu Ser Leu Pro Asp Trp Leu
85 90 95
Thr Thr Gln Thr Trp Thr Arg Glu Glu Leu Met Ser Ile Leu Glu Glu
100 105 110
His Ile Asn Thr Val Val Asp Arg Tyr Arg Gly Gln Leu Val Ala Trp
115 120 125
Asp Val Val Asn Glu Ala Ile Ala Asn Asp Lys Asn Ala Leu Arg Asp
130 135 140
Thr Ile Trp Leu Arg Thr Ile Gly Pro Glu Tyr Ile Glu Lys Ala Phe
145 150 155 160
Arg Trp Ala His Ala Ala Asp Pro Gln Ala Arg Leu Phe Tyr Asn Asp
165 170 175
Tyr Gly Gly Glu Glu Val Gly Gly Lys Ser Glu Ala Ile Tyr Gly Met
180 185 190
Leu Lys Asp Leu Leu Gln Gln Gly Val Pro Ile His Gly Val Gly Leu
195 200 205
Gln Met His Val Ser Ile Lys Asn Pro Pro Asn Pro Glu Lys Val Ala
210 215 220
Ala Asn Ile Lys Arg Leu Asn Asp Leu Gly Leu Glu Val His Ile Thr
225 230 235 240
Glu Met Asp Val Lys Thr Trp Asp Gly Ile Gly Thr Lys Gln Gln Arg
245 250 255
Leu Ala Ala Gln Ala Gln Val Tyr Arg Asn Met Met Gln Val Cys Leu
260 265 270
Glu Ala Glu Asn Cys Lys Ala Phe Ser Leu Trp Gly Val Ser Asp Arg
275 280 285
Tyr Ser Trp Ile Pro Arg Ile Phe Lys Lys Pro Asp Ala Pro Leu Ile
290 295 300
Phe Asp Asp Leu Gly Arg Pro Lys Pro Ala Tyr Asn Ala Leu Lys Glu
305 310 315 320
Val Leu Lys Arg Arg
325
<210> 27
<211> 1173
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 27
atgaaatcct taacaaatca atccttcatg aaactcataa tctgtctggc attgccagtc 60
gcactactca gcatttcatg caaaaaaccc gccgaaccac tgaaaccggt tgaaggctta 120
aaagacagct tcaaagacaa gtttctcatg ggtgtggcgc tgaataaagc acagattctg 180
ggaagagata cattggtaca tgcttttaca gtacagcatt ttaattccat tactgcagaa 240
aacgaaatga agtgggaacg catccacccg cagcctgatg tatatgattt cacggttccg 300
gacagcctga ttgcttttgg cgaacgcaac ggcatgttta tagtcgggca tacactcgta 360
tggcactccc aggtgcccga ttgggttttc accgatgaga agggaaagcc tctgacccgc 420
gatgctctgc tccaacgcat gaaggatcat atttatgccg ttgtcggccg gtataagggc 480
aaggtggatg gctgggatgt ggtaaatgaa gcattggatg aagacggaca gctgcgcaaa 540
tccaggtggc atgaaatcat cggtgatgat tacattcaga aagcctttga gttcacccgg 600
gaggcagatc ccggtgcaga gctttattac aatgattaca acatagaact caaaaaaaag 660
cgggagggtg ctgtcaggct gctacaggaa ctgcagcaaa aaggcattaa aatcgacgga 720
gtgggcattc agggacattg gcacctgcac tcacctgatc tgcaagagat tgattcaagt 780
cttcaggcat acggacaact tggtctgaag gtcatgatca ccgaactgga tgttaacgtc 840
attcccgaac cttcaggtat tattggcgcc gatgttgcac agcgggcgga ttatcagagc 900
cagctgaatc catggcctga aagttttccc gattccatgc agcaggttct ggccagccgg 960
tatgccgaac tgttcggatt gttcctgaag cacagcgata aggtaagccg ggtgaccttc 1020
tggggaattc acgatggcta ttcctggaag aacaactggc caataccggg ccgaacaact 1080
tatcccctcc tttttgaccg gaattaccag cctaaacctg cgtatgatgc tgtcattgaa 1140
ttgaccaaaa tacagccgga agccagtaac tga 1173
<210> 28
<211> 390
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(27)
<400> 28
Met Lys Ser Leu Thr Asn Gln Ser Phe Met Lys Leu Ile Ile Cys Leu
1 5 10 15
Ala Leu Pro Val Ala Leu Leu Ser Ile Ser Cys Lys Lys Pro Ala Glu
20 25 30
Pro Leu Lys Pro Val Glu Gly Leu Lys Asp Ser Phe Lys Asp Lys Phe
35 40 45
Leu Met Gly Val Ala Leu Asn Lys Ala Gln Ile Leu Gly Arg Asp Thr
50 55 60
Leu Val His Ala Phe Thr Val Gln His Phe Asn Ser Ile Thr Ala Glu
65 70 75 80
Asn Glu Met Lys Trp Glu Arg Ile His Pro Gln Pro Asp Val Tyr Asp
85 90 95
Phe Thr Val Pro Asp Ser Leu Ile Ala Phe Gly Glu Arg Asn Gly Met
100 105 110
Phe Ile Val Gly His Thr Leu Val Trp His Ser Gln Val Pro Asp Trp
115 120 125
Val Phe Thr Asp Glu Lys Gly Lys Pro Leu Thr Arg Asp Ala Leu Leu
130 135 140
Gln Arg Met Lys Asp His Ile Tyr Ala Val Val Gly Arg Tyr Lys Gly
145 150 155 160
Lys Val Asp Gly Trp Asp Val Val Asn Glu Ala Leu Asp Glu Asp Gly
165 170 175
Gln Leu Arg Lys Ser Arg Trp His Glu Ile Ile Gly Asp Asp Tyr Ile
180 185 190
Gln Lys Ala Phe Glu Phe Thr Arg Glu Ala Asp Pro Gly Ala Glu Leu
195 200 205
Tyr Tyr Asn Asp Tyr Asn Ile Glu Leu Lys Lys Lys Arg Glu Gly Ala
210 215 220
Val Arg Leu Leu Gln Glu Leu Gln Gln Lys Gly Ile Lys Ile Asp Gly
225 230 235 240
Val Gly Ile Gln Gly His Trp His Leu His Ser Pro Asp Leu Gln Glu
245 250 255
Ile Asp Ser Ser Leu Gln Ala Tyr Gly Gln Leu Gly Leu Lys Val Met
260 265 270
Ile Thr Glu Leu Asp Val Asn Val Ile Pro Glu Pro Ser Gly Ile Ile
275 280 285
Gly Ala Asp Val Ala Gln Arg Ala Asp Tyr Gln Ser Gln Leu Asn Pro
290 295 300
Trp Pro Glu Ser Phe Pro Asp Ser Met Gln Gln Val Leu Ala Ser Arg
305 310 315 320
Tyr Ala Glu Leu Phe Gly Leu Phe Leu Lys His Ser Asp Lys Val Ser
325 330 335
Arg Val Thr Phe Trp Gly Ile His Asp Gly Tyr Ser Trp Lys Asn Asn
340 345 350
Trp Pro Ile Pro Gly Arg Thr Thr Tyr Pro Leu Leu Phe Asp Arg Asn
355 360 365
Tyr Gln Pro Lys Pro Ala Tyr Asp Ala Val Ile Glu Leu Thr Lys Ile
370 375 380
Gln Pro Glu Ala Ser Asn
385 390
<210> 29
<211> 2331
<212> DNA
<213> Archaea
<400> 29
atgacgatgc agagaaagta ctcatccgac gcgaacacac agtatgagtg gataaaatca 60
gctactgtac catctggtca gtgggtacag ctctctggaa cgtacacgat cccggccgga 120
gttaccgtgg aagatctcac gctttacttc gaatctcaaa atccaaccct tgagttctac 180
gtggatgacg tgaagatagt ggatacaact tccgcagaga taaagattga aatggaacct 240
gaaaaagaga tacctgctct gaaagaagta ctgaaagatt acttcaaagt cggagttgca 300
ctgccgtcca aggtcttcct caacccgaag gacatagaac tcatcacgaa acacttcaac 360
agcatcaccg cagaaaacga gatgaaaccg gatagtctgc tcgcgggcat cgaaaacggt 420
aagctgaagt tcaggtttga aacagcagac aaatacattc agttcgtcga ggaaaacggc 480
atggttataa gaggtcacac actggtgtgg cacaaccaga cacccgactg gttcttcaaa 540
gacgaaaacg gaaacctcct ctccaaagaa gcgatgacgg aaagactcaa agagtacatc 600
cacaccgttg tcggacactt caaaggaaaa gtctacgcat gggacgtggt gaacgaagcg 660
gtcgatccga accagccgga tggactgaga agatcaacct ggtaccagat catggggcct 720
gactacatag aactcgcctt caagttcgca agagaggcag atccagatgc aaaactcttc 780
tacaacgact acaacacatt cgatcccaga aagagagaca tcatctacaa cctcgtgaag 840
gatctcaaag agaagggact catcgatggc ataggaatgc agtgtcacat cagtcttgca 900
acagacatca aacagatcga agaggccatc aaaaagttca gcaccatacc cggtatagaa 960
attcacatca cagaactcga tatgagtgtc tacagagatt ccagttccaa ctacccagag 1020
gcaccgagga cggcactcat cgaacaggct cacaaaatga tgcagctctt tgagatcttc 1080
aagaagcaca gcaacgtgat cacgaacgtc acattctggg gtctcaagga cgattactcc 1140
tggagagcaa caagaagaaa cgactggccg ctcatcttcg acaaagatca ccaggcgaaa 1200
ctcgcttact gggcgatagt ggcacctgag gtccttccac cacttccaaa agaaagcagg 1260
atctccgaag gcgaagcagt ggtagtgggg atgatggacg actcgtacct gatgtcgaag 1320
ccgatagaga tccttgacga agaagggaac gtgaaggcaa cgatcagggc agtgtggaaa 1380
gacagcacga tctacatcta cggagaggta caggacaaga caaagaaacc agcagaagac 1440
ggagtggcca tattcatcaa cccgaacaac gaaagaacac cctatctgca gcctgatgac 1500
acctacgttg tgctgtggac gaactggaag acggaggtca acagagaaga cgtacaggtg 1560
aagaaattcg ttgggcctgg ctttagaaga tacagcttcg agatgtcgat cacgataccg 1620
ggtgtggagt tcaagaaaga cagctacata ggatttgacg ttgcggtgat agacgacggg 1680
aagtggtaca gctggagcga cacgacgaac agccagaaga cgaacacgat gaactacgga 1740
acgctgaagc tcgaaggaat aatggtagcg acagcaaaat acggaacacc ggtcatcgat 1800
ggagagatcg atgagatctg gaacacgaca gaggagatag agacgaaagc ggtggctatg 1860
ggatcgcttg acaagaatgc gacagcgaaa gtgagggtgc tgtgggacga gaactacctg 1920
tacgtacttg cgatcgtgaa agagcccgtt ctgaacaaag acaacagcaa cccgtgggag 1980
caggattccg tggagatctt cgtggatgag aacaaccaca agacaggata ctacgaagac 2040
gacgacgcgc agttcagggt gaactacatg aacgagcaga cctttggaac gggaggaagt 2100
ccagcgaggt tcaagacagc ggtgaagctg atcgaaggag gatacatagt tgaggcagcg 2160
atcaagtgga agacgatcaa gccaacaccg aacacagtga taggattcaa catccaggtg 2220
aacgatgcga acgagaaagg gcagagggtc ggtatcatct cctggagcga tcccacaaac 2280
aacagctggc aagatccttc aaagttcggt aacctcagac tcatcaagtg a 2331
<210> 30
<211> 776
<212> PRT
<213> Archaea
<400> 30
Met Thr Met Gln Arg Lys Tyr Ser Ser Asp Ala Asn Thr Gln Tyr Glu
1 5 10 15
Trp Ile Lys Ser Ala Thr Val Pro Ser Gly Gln Trp Val Gln Leu Ser
20 25 30
Gly Thr Tyr Thr Ile Pro Ala Gly Val Thr Val Glu Asp Leu Thr Leu
35 40 45
Tyr Phe Glu Ser Gln Asn Pro Thr Leu Glu Phe Tyr Val Asp Asp Val
50 55 60
Lys Ile Val Asp Thr Thr Ser Ala Glu Ile Lys Ile Glu Met Glu Pro
65 70 75 80
Glu Lys Glu Ile Pro Ala Leu Lys Glu Val Leu Lys Asp Tyr Phe Lys
85 90 95
Val Gly Val Ala Leu Pro Ser Lys Val Phe Leu Asn Pro Lys Asp Ile
100 105 110
Glu Leu Ile Thr Lys His Phe Asn Ser Ile Thr Ala Glu Asn Glu Met
115 120 125
Lys Pro Asp Ser Leu Leu Ala Gly Ile Glu Asn Gly Lys Leu Lys Phe
130 135 140
Arg Phe Glu Thr Ala Asp Lys Tyr Ile Gln Phe Val Glu Glu Asn Gly
145 150 155 160
Met Val Ile Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro Asp
165 170 175
Trp Phe Phe Lys Asp Glu Asn Gly Asn Leu Leu Ser Lys Glu Ala Met
180 185 190
Thr Glu Arg Leu Lys Glu Tyr Ile His Thr Val Val Gly His Phe Lys
195 200 205
Gly Lys Val Tyr Ala Trp Asp Val Val Asn Glu Ala Val Asp Pro Asn
210 215 220
Gln Pro Asp Gly Leu Arg Arg Ser Thr Trp Tyr Gln Ile Met Gly Pro
225 230 235 240
Asp Tyr Ile Glu Leu Ala Phe Lys Phe Ala Arg Glu Ala Asp Pro Asp
245 250 255
Ala Lys Leu Phe Tyr Asn Asp Tyr Asn Thr Phe Asp Pro Arg Lys Arg
260 265 270
Asp Ile Ile Tyr Asn Leu Val Lys Asp Leu Lys Glu Lys Gly Leu Ile
275 280 285
Asp Gly Ile Gly Met Gln Cys His Ile Ser Leu Ala Thr Asp Ile Lys
290 295 300
Gln Ile Glu Glu Ala Ile Lys Lys Phe Ser Thr Ile Pro Gly Ile Glu
305 310 315 320
Ile His Ile Thr Glu Leu Asp Met Ser Val Tyr Arg Asp Ser Ser Ser
325 330 335
Asn Tyr Pro Glu Ala Pro Arg Thr Ala Leu Ile Glu Gln Ala His Lys
340 345 350
Met Met Gln Leu Phe Glu Ile Phe Lys Lys His Ser Asn Val Ile Thr
355 360 365
Asn Val Thr Phe Trp Gly Leu Lys Asp Asp Tyr Ser Trp Arg Ala Thr
370 375 380
Arg Arg Asn Asp Trp Pro Leu Ile Phe Asp Lys Asp His Gln Ala Lys
385 390 395 400
Leu Ala Tyr Trp Ala Ile Val Ala Pro Glu Val Leu Pro Pro Leu Pro
405 410 415
Lys Glu Ser Arg Ile Ser Glu Gly Glu Ala Val Val Val Gly Met Met
420 425 430
Asp Asp Ser Tyr Leu Met Ser Lys Pro Ile Glu Ile Leu Asp Glu Glu
435 440 445
Gly Asn Val Lys Ala Thr Ile Arg Ala Val Trp Lys Asp Ser Thr Ile
450 455 460
Tyr Ile Tyr Gly Glu Val Gln Asp Lys Thr Lys Lys Pro Ala Glu Asp
465 470 475 480
Gly Val Ala Ile Phe Ile Asn Pro Asn Asn Glu Arg Thr Pro Tyr Leu
485 490 495
Gln Pro Asp Asp Thr Tyr Val Val Leu Trp Thr Asn Trp Lys Thr Glu
500 505 510
Val Asn Arg Glu Asp Val Gln Val Lys Lys Phe Val Gly Pro Gly Phe
515 520 525
Arg Arg Tyr Ser Phe Glu Met Ser Ile Thr Ile Pro Gly Val Glu Phe
530 535 540
Lys Lys Asp Ser Tyr Ile Gly Phe Asp Val Ala Val Ile Asp Asp Gly
545 550 555 560
Lys Trp Tyr Ser Trp Ser Asp Thr Thr Asn Ser Gln Lys Thr Asn Thr
565 570 575
Met Asn Tyr Gly Thr Leu Lys Leu Glu Gly Ile Met Val Ala Thr Ala
580 585 590
Lys Tyr Gly Thr Pro Val Ile Asp Gly Glu Ile Asp Glu Ile Trp Asn
595 600 605
Thr Thr Glu Glu Ile Glu Thr Lys Ala Val Ala Met Gly Ser Leu Asp
610 615 620
Lys Asn Ala Thr Ala Lys Val Arg Val Leu Trp Asp Glu Asn Tyr Leu
625 630 635 640
Tyr Val Leu Ala Ile Val Lys Glu Pro Val Leu Asn Lys Asp Asn Ser
645 650 655
Asn Pro Trp Glu Gln Asp Ser Val Glu Ile Phe Val Asp Glu Asn Asn
660 665 670
His Lys Thr Gly Tyr Tyr Glu Asp Asp Asp Ala Gln Phe Arg Val Asn
675 680 685
Tyr Met Asn Glu Gln Thr Phe Gly Thr Gly Gly Ser Pro Ala Arg Phe
690 695 700
Lys Thr Ala Val Lys Leu Ile Glu Gly Gly Tyr Ile Val Glu Ala Ala
705 710 715 720
Ile Lys Trp Lys Thr Ile Lys Pro Thr Pro Asn Thr Val Ile Gly Phe
725 730 735
Asn Ile Gln Val Asn Asp Ala Asn Glu Lys Gly Gln Arg Val Gly Ile
740 745 750
Ile Ser Trp Ser Asp Pro Thr Asn Asn Ser Trp Gln Asp Pro Ser Lys
755 760 765
Phe Gly Asn Leu Arg Leu Ile Lys
770 775
<210> 31
<211> 1134
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 31
gtggaaaccg tcggagcacc ggagctgagc tatgaaatcc ggaatttccg ggtggtggca 60
ccggacggag tgccggatat acagcccaca gccgcaccgg aagcgcaggc tgttccggaa 120
ggggagatgc cttccctgaa ggatgtatac gcgggcaaat tcgacttcgg tacggcgctg 180
ccccggaatg cattcaatga tatccagctg ctgagactgg tgaaggacca gttcaacatc 240
ctgacaccgg aaaatgagat gaaaccggat gcaatcctgg atgtgtacgg cagcaaaaaa 300
ctggcggaaa aggacgagac agcggtggct gtccggtttg aagcatgcaa gacgctgctt 360
cggttcgcac agtccaacgg cctgaaggtg cacggccata cgctgctgtg gcacaaccag 420
accccggaag cccttttcca cgaaggttat gacaccacca agccgatggc cggccgggaa 480
gtgatgttgg gccggatgga gaattacatc cgcgaagtgc tgacctggac cgaagaaaat 540
tatccgggcg tgatcgtttc ctgggacgtg gtgaatgaag caatcgacga cggaacgaac 600
cagctgcgca ccggtgccaa ctggtataag acggtcggac cggactacct ggcacgcgcg 660
tttgaatatg cccggaaata cgcggcggaa ggcgtgctgc tgtactacaa cgattacaat 720
accgcatacg gcggtaagct gtatgggatt gtggatctgc tggagagcct gattgccgag 780
ggcaatattg acggatacgg attccagatg caccacagcc tgggagaacc ttccatggat 840
atgattaccc gggcagtaga gaaaatagcc tcgctgggac tccggctgcg tgtgagcgaa 900
ctggacatca acgccggcaa ggcgacagag aaaaatttcg aagcccagaa gaacaagtac 960
aaacaggtga tgaagctgat gctccggttc aaggaccaga ctgaagcggt ccaggtgtgg 1020
ggcgtgacgg acatcatgag ctggcgcagg gacggatatc cgctgctgtt tgacaagaac 1080
atgaatccga aacccgcgtt cttcggtgtg atcgaagccg gaatggaaga ctga 1134
<210> 32
<211> 377
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 32
Val Glu Thr Val Gly Ala Pro Glu Leu Ser Tyr Glu Ile Arg Asn Phe
1 5 10 15
Arg Val Val Ala Pro Asp Gly Val Pro Asp Ile Gln Pro Thr Ala Ala
20 25 30
Pro Glu Ala Gln Ala Val Pro Glu Gly Glu Met Pro Ser Leu Lys Asp
35 40 45
Val Tyr Ala Gly Lys Phe Asp Phe Gly Thr Ala Leu Pro Arg Asn Ala
50 55 60
Phe Asn Asp Ile Gln Leu Leu Arg Leu Val Lys Asp Gln Phe Asn Ile
65 70 75 80
Leu Thr Pro Glu Asn Glu Met Lys Pro Asp Ala Ile Leu Asp Val Tyr
85 90 95
Gly Ser Lys Lys Leu Ala Glu Lys Asp Glu Thr Ala Val Ala Val Arg
100 105 110
Phe Glu Ala Cys Lys Thr Leu Leu Arg Phe Ala Gln Ser Asn Gly Leu
115 120 125
Lys Val His Gly His Thr Leu Leu Trp His Asn Gln Thr Pro Glu Ala
130 135 140
Leu Phe His Glu Gly Tyr Asp Thr Thr Lys Pro Met Ala Gly Arg Glu
145 150 155 160
Val Met Leu Gly Arg Met Glu Asn Tyr Ile Arg Glu Val Leu Thr Trp
165 170 175
Thr Glu Glu Asn Tyr Pro Gly Val Ile Val Ser Trp Asp Val Val Asn
180 185 190
Glu Ala Ile Asp Asp Gly Thr Asn Gln Leu Arg Thr Gly Ala Asn Trp
195 200 205
Tyr Lys Thr Val Gly Pro Asp Tyr Leu Ala Arg Ala Phe Glu Tyr Ala
210 215 220
Arg Lys Tyr Ala Ala Glu Gly Val Leu Leu Tyr Tyr Asn Asp Tyr Asn
225 230 235 240
Thr Ala Tyr Gly Gly Lys Leu Tyr Gly Ile Val Asp Leu Leu Glu Ser
245 250 255
Leu Ile Ala Glu Gly Asn Ile Asp Gly Tyr Gly Phe Gln Met His His
260 265 270
Ser Leu Gly Glu Pro Ser Met Asp Met Ile Thr Arg Ala Val Glu Lys
275 280 285
Ile Ala Ser Leu Gly Leu Arg Leu Arg Val Ser Glu Leu Asp Ile Asn
290 295 300
Ala Gly Lys Ala Thr Glu Lys Asn Phe Glu Ala Gln Lys Asn Lys Tyr
305 310 315 320
Lys Gln Val Met Lys Leu Met Leu Arg Phe Lys Asp Gln Thr Glu Ala
325 330 335
Val Gln Val Trp Gly Val Thr Asp Ile Met Ser Trp Arg Arg Asp Gly
340 345 350
Tyr Pro Leu Leu Phe Asp Lys Asn Met Asn Pro Lys Pro Ala Phe Phe
355 360 365
Gly Val Ile Glu Ala Gly Met Glu Asp
370 375
<210> 33
<211> 1815
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 33
atggttcgca aaaaactatt ttatatcgtc gcgttaatgc tgatgttcgg cgcaagtttt 60
acttccgctc aggacgcgga attttccctg cgcggtttag ccgagcgcaa taacttttat 120
gttggagcag ccgtttatac cactcatctg aatgatcctg tccatgttga aacactggca 180
cgagaattca atatgctcac gcctgaacag caggccaaac attgtgagtt ggaggcacag 240
caaggtcaat ttgactttcg gagtttcgat cgtttagtcg ccttcgccga agaacacaac 300
atggcgatac acggtcatgc gctggtctgg catagctgca caccgcaatg ggtggctaac 360
ggcgagtaca cccgtgacga agccattggt ctgctgcgcg actcgattat gaccattgtt 420
ggccgttaca aaggccgtat tccgatttgg gacgtcgtca atgaaggcat tgctgacagc 480
ggcggaacac tgcgcgatac gccatggcgg cagttaattg gcgatgatta catcgaactt 540
gccttccagt tcgctcatga agccgacccg gatgcgctgc tgttttacaa cgactataat 600
acggaaggca tgaaccctaa atcggacgcc atgtacgaga tggtgagcga ttttgtggcg 660
cgtggaattc cgattcacgg ggttgggctg caatcccatt tcatattagg cagttttgac 720
ccagaccaga ttgctcggaa cgtcgcgcgg cttggcgaac tcggtttaca agttcaattc 780
accgaggtcg atattcgata ttccggcgag gcgacagata atatcctcca gcggcaggcg 840
ggcgattacc atcgcctgat ggacgtttgc ctcggtaacg acgcctgtac tgcgtttatc 900
acctggggcg tgaccgataa atatacctgg ttgcggggcg cgaacctggg cttctacaac 960
aacctatcgg ttgaaccgct gctttttgac gatgactatg aacccaagcc cgcttatttt 1020
gcggtgctgg actcactagc gcgaagagcg ggcgaaaccc ccgttttgag cgatgacgag 1080
cttgcggcga tgatcggcgg cacagtccaa acggtcgaaa ttcccccgcc gacgaaaagc 1140
aatctcagtc aggaagcgcc ggacgccgtt cctggtgtga tctattacgc cgcctacccc 1200
ataagcatca cagttgacgg cgaagccaac gattgggaac gcattccgcg cggtatgatt 1260
gacagcggcc ccaccgtacc tcaggataac gacacgacaa tgacatttgc cgccgctgcc 1320
gacaaaacca atctatactt ccttgcagag gttacggaca gccaggtgtc ctacggaacg 1380
cacgacccgg ctactgcctg gtatcaggag gactcggttg agttttacct gaacacgaca 1440
ggcgatctaa ctaacaccgc ctaccaaccc ggcgtcgccc aaatcggtat catggcagcc 1500
aacatcgaca acgataatcc cggtgcaccg atcatcgggg gcggcaacag cgacatttcg 1560
caggtaaaag cgattgtcgt caaaaccgat accgggtatc tggtcgaggc gtctgttcca 1620
ctcatgaccg atgtctggac gattgaaccg aaacaagggg ctgtactcgg cttccaagtg 1680
catctcaatg gctcacgcac accggatgcc gaccgagaca ccaagttgat ctggtcgcta 1740
ctggatacgc tagatcagtc ctatagcaat cccagcctgt ttggccgact catcttctgg 1800
aacataaatc tctaa 1815
<210> 34
<211> 604
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(23)
<400> 34
Met Val Arg Lys Lys Leu Phe Tyr Ile Val Ala Leu Met Leu Met Phe
1 5 10 15
Gly Ala Ser Phe Thr Ser Ala Gln Asp Ala Glu Phe Ser Leu Arg Gly
20 25 30
Leu Ala Glu Arg Asn Asn Phe Tyr Val Gly Ala Ala Val Tyr Thr Thr
35 40 45
His Leu Asn Asp Pro Val His Val Glu Thr Leu Ala Arg Glu Phe Asn
50 55 60
Met Leu Thr Pro Glu Gln Gln Ala Lys His Cys Glu Leu Glu Ala Gln
65 70 75 80
Gln Gly Gln Phe Asp Phe Arg Ser Phe Asp Arg Leu Val Ala Phe Ala
85 90 95
Glu Glu His Asn Met Ala Ile His Gly His Ala Leu Val Trp His Ser
100 105 110
Cys Thr Pro Gln Trp Val Ala Asn Gly Glu Tyr Thr Arg Asp Glu Ala
115 120 125
Ile Gly Leu Leu Arg Asp Ser Ile Met Thr Ile Val Gly Arg Tyr Lys
130 135 140
Gly Arg Ile Pro Ile Trp Asp Val Val Asn Glu Gly Ile Ala Asp Ser
145 150 155 160
Gly Gly Thr Leu Arg Asp Thr Pro Trp Arg Gln Leu Ile Gly Asp Asp
165 170 175
Tyr Ile Glu Leu Ala Phe Gln Phe Ala His Glu Ala Asp Pro Asp Ala
180 185 190
Leu Leu Phe Tyr Asn Asp Tyr Asn Thr Glu Gly Met Asn Pro Lys Ser
195 200 205
Asp Ala Met Tyr Glu Met Val Ser Asp Phe Val Ala Arg Gly Ile Pro
210 215 220
Ile His Gly Val Gly Leu Gln Ser His Phe Ile Leu Gly Ser Phe Asp
225 230 235 240
Pro Asp Gln Ile Ala Arg Asn Val Ala Arg Leu Gly Glu Leu Gly Leu
245 250 255
Gln Val Gln Phe Thr Glu Val Asp Ile Arg Tyr Ser Gly Glu Ala Thr
260 265 270
Asp Asn Ile Leu Gln Arg Gln Ala Gly Asp Tyr His Arg Leu Met Asp
275 280 285
Val Cys Leu Gly Asn Asp Ala Cys Thr Ala Phe Ile Thr Trp Gly Val
290 295 300
Thr Asp Lys Tyr Thr Trp Leu Arg Gly Ala Asn Leu Gly Phe Tyr Asn
305 310 315 320
Asn Leu Ser Val Glu Pro Leu Leu Phe Asp Asp Asp Tyr Glu Pro Lys
325 330 335
Pro Ala Tyr Phe Ala Val Leu Asp Ser Leu Ala Arg Arg Ala Gly Glu
340 345 350
Thr Pro Val Leu Ser Asp Asp Glu Leu Ala Ala Met Ile Gly Gly Thr
355 360 365
Val Gln Thr Val Glu Ile Pro Pro Pro Thr Lys Ser Asn Leu Ser Gln
370 375 380
Glu Ala Pro Asp Ala Val Pro Gly Val Ile Tyr Tyr Ala Ala Tyr Pro
385 390 395 400
Ile Ser Ile Thr Val Asp Gly Glu Ala Asn Asp Trp Glu Arg Ile Pro
405 410 415
Arg Gly Met Ile Asp Ser Gly Pro Thr Val Pro Gln Asp Asn Asp Thr
420 425 430
Thr Met Thr Phe Ala Ala Ala Ala Asp Lys Thr Asn Leu Tyr Phe Leu
435 440 445
Ala Glu Val Thr Asp Ser Gln Val Ser Tyr Gly Thr His Asp Pro Ala
450 455 460
Thr Ala Trp Tyr Gln Glu Asp Ser Val Glu Phe Tyr Leu Asn Thr Thr
465 470 475 480
Gly Asp Leu Thr Asn Thr Ala Tyr Gln Pro Gly Val Ala Gln Ile Gly
485 490 495
Ile Met Ala Ala Asn Ile Asp Asn Asp Asn Pro Gly Ala Pro Ile Ile
500 505 510
Gly Gly Gly Asn Ser Asp Ile Ser Gln Val Lys Ala Ile Val Val Lys
515 520 525
Thr Asp Thr Gly Tyr Leu Val Glu Ala Ser Val Pro Leu Met Thr Asp
530 535 540
Val Trp Thr Ile Glu Pro Lys Gln Gly Ala Val Leu Gly Phe Gln Val
545 550 555 560
His Leu Asn Gly Ser Arg Thr Pro Asp Ala Asp Arg Asp Thr Lys Leu
565 570 575
Ile Trp Ser Leu Leu Asp Thr Leu Asp Gln Ser Tyr Ser Asn Pro Ser
580 585 590
Leu Phe Gly Arg Leu Ile Phe Trp Asn Ile Asn Leu
595 600
<210> 35
<211> 2286
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 35
atgaccttga ttacgccaag ctcgaaatta accctcacta aagggaacaa aagctggagc 60
tcgcgcgcct gcaggtcgac actagtggat ctcacgcttt acttcgaatc tcaaaatcca 120
acccttgagt tctacgtgga tgacgtgaag atagtggata caacttccgc agagataaag 180
attgaaatgg aacctgaaaa agagatacct gctctgaaag aagtactgaa agattacttc 240
aaagtcggag ttgcactgcc gtccaaggtc ttcctcaacc cgaaggacat agaactcatc 300
acgaaacact tcaacagcat caccgcagaa aacgagatga aaccggatag tctgctcgcg 360
ggcatcgaaa acggtaagct gaagttcagg tttgaaacag cagacaaata cattcagttc 420
gtcgaggaaa acggcatggt tataagaggt cacacactgg tgtggcacaa ccagacaccc 480
gactggttct tcaaagacga aaacggaaac ctcctctcca aagaagcgat gacggaaaga 540
ctcaaagagt acatccacac cgttgtcgga cacttcaaag gaaaagtcta cgcatgggac 600
gtggtgaacg aagcggtcga tccgaaccag ccggatggac tgagaagatc aacctggtac 660
cagatcatgg ggcctgacta catagaactc gccttcaagt tcgcaagaga ggcagatcca 720
gatgcaaaac tcttctacaa cgactacaac acattcgatc ccagaaagag agacatcatc 780
tacaacctcg tgaaggatct caaagagaag ggactcatcg atggcatagg aatgcagtgt 840
cacatcagtc ttgcaacaga catcaaacag atcgaagagg ccatcaaaaa gttcagcacc 900
atacccggta tagaaattca catcacagaa ctcgatatga gtgtctacag agattccagt 960
tccaactacc cagaggcacc gaggacggca ctcatcgaac aggctcacaa aatgatgcag 1020
ctctttgaga tcttcaagaa gcacagcaac gtgatcacga acgtcacatt ctggggtctc 1080
aaggacgatt actcctggag agcaacaaga agaaacgact ggccgctcat cttcgacaaa 1140
gatcaccagg cgaaactcgc ttactgggcg atagtggcac ctgaggtcct tccaccactt 1200
ccaaaagaaa gcaggatctc cgaaggcgaa gcagtggtag tggggatgat ggacgactcg 1260
tacctgatgt cgaagccgat agagatcctt gacgaagaag ggaacgtgaa ggcaacgatc 1320
agggcagtgt ggaaagacag cacgatctac atctacggag aggtacagga caagacaaag 1380
aaaccagcag aagacggagt ggccatattc atcaacccga acaacgaaag aacaccctat 1440
ctgcagcctg atgacaccta cgttgtgctg tggacgaact ggaagacgga ggtcaacaga 1500
gaagacgtac aggtgaagaa attcgttggg cctggcttta gaagatacag cttcgagatg 1560
tcgatcacga taccgggtgt ggagttcaag aaagacagct acataggatt tgacgttgcg 1620
gtgatagacg acgggaagtg gtacagctgg agcgacacga cgaacagcca gaagacgaac 1680
acgatgaact acggaacgct gaagctcgaa ggaataatgg tagcgacagc aaaatacgga 1740
acaccggtca tcgatggaga gatcgatgag atctggaaca cgacagagga gatagagacg 1800
aaagcggtgg ctatgggatc gcttgacaag aatgcgacag cgaaagtgag ggtgctgtgg 1860
gacgagaact acctgtacgt acttgcgatc gtgaaagatc ccgttctgaa caaagacaac 1920
agcaacccgt gggagcagga ttccgtggag atcttcgtgg atgagaacaa ccacaagaca 1980
ggatactacg aagacgacga cgcgcagttc agggtgaact acatgaacga gcagaccttt 2040
ggaacgggag gaagtccagc gaggttcaag acagcggtga agctgatcga aggaggatac 2100
atagttgagg cagcgatcaa gtggaagacg atcaagccaa caccgaacac agtgatagga 2160
ttcaacatcc aggtgaacga tgcgaacgag aaagggcaga gggtcggtat catctcctgg 2220
agcgatccca caaacaacag ctggcaagat ccttcaaagt tcggtaacct cagactcatc 2280
aagtga 2286
<210> 36
<211> 761
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 36
Met Thr Leu Ile Thr Pro Ser Ser Lys Leu Thr Leu Thr Lys Gly Asn
1 5 10 15
Lys Ser Trp Ser Ser Arg Ala Cys Arg Ser Thr Leu Val Asp Leu Thr
20 25 30
Leu Tyr Phe Glu Ser Gln Asn Pro Thr Leu Glu Phe Tyr Val Asp Asp
35 40 45
Val Lys Ile Val Asp Thr Thr Ser Ala Glu Ile Lys Ile Glu Met Glu
50 55 60
Pro Glu Lys Glu Ile Pro Ala Leu Lys Glu Val Leu Lys Asp Tyr Phe
65 70 75 80
Lys Val Gly Val Ala Leu Pro Ser Lys Val Phe Leu Asn Pro Lys Asp
85 90 95
Ile Glu Leu Ile Thr Lys His Phe Asn Ser Ile Thr Ala Glu Asn Glu
100 105 110
Met Lys Pro Asp Ser Leu Leu Ala Gly Ile Glu Asn Gly Lys Leu Lys
115 120 125
Phe Arg Phe Glu Thr Ala Asp Lys Tyr Ile Gln Phe Val Glu Glu Asn
130 135 140
Gly Met Val Ile Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro
145 150 155 160
Asp Trp Phe Phe Lys Asp Glu Asn Gly Asn Leu Leu Ser Lys Glu Ala
165 170 175
Met Thr Glu Arg Leu Lys Glu Tyr Ile His Thr Val Val Gly His Phe
180 185 190
Lys Gly Lys Val Tyr Ala Trp Asp Val Val Asn Glu Ala Val Asp Pro
195 200 205
Asn Gln Pro Asp Gly Leu Arg Arg Ser Thr Trp Tyr Gln Ile Met Gly
210 215 220
Pro Asp Tyr Ile Glu Leu Ala Phe Lys Phe Ala Arg Glu Ala Asp Pro
225 230 235 240
Asp Ala Lys Leu Phe Tyr Asn Asp Tyr Asn Thr Phe Asp Pro Arg Lys
245 250 255
Arg Asp Ile Ile Tyr Asn Leu Val Lys Asp Leu Lys Glu Lys Gly Leu
260 265 270
Ile Asp Gly Ile Gly Met Gln Cys His Ile Ser Leu Ala Thr Asp Ile
275 280 285
Lys Gln Ile Glu Glu Ala Ile Lys Lys Phe Ser Thr Ile Pro Gly Ile
290 295 300
Glu Ile His Ile Thr Glu Leu Asp Met Ser Val Tyr Arg Asp Ser Ser
305 310 315 320
Ser Asn Tyr Pro Glu Ala Pro Arg Thr Ala Leu Ile Glu Gln Ala His
325 330 335
Lys Met Met Gln Leu Phe Glu Ile Phe Lys Lys His Ser Asn Val Ile
340 345 350
Thr Asn Val Thr Phe Trp Gly Leu Lys Asp Asp Tyr Ser Trp Arg Ala
355 360 365
Thr Arg Arg Asn Asp Trp Pro Leu Ile Phe Asp Lys Asp His Gln Ala
370 375 380
Lys Leu Ala Tyr Trp Ala Ile Val Ala Pro Glu Val Leu Pro Pro Leu
385 390 395 400
Pro Lys Glu Ser Arg Ile Ser Glu Gly Glu Ala Val Val Val Gly Met
405 410 415
Met Asp Asp Ser Tyr Leu Met Ser Lys Pro Ile Glu Ile Leu Asp Glu
420 425 430
Glu Gly Asn Val Lys Ala Thr Ile Arg Ala Val Trp Lys Asp Ser Thr
435 440 445
Ile Tyr Ile Tyr Gly Glu Val Gln Asp Lys Thr Lys Lys Pro Ala Glu
450 455 460
Asp Gly Val Ala Ile Phe Ile Asn Pro Asn Asn Glu Arg Thr Pro Tyr
465 470 475 480
Leu Gln Pro Asp Asp Thr Tyr Val Val Leu Trp Thr Asn Trp Lys Thr
485 490 495
Glu Val Asn Arg Glu Asp Val Gln Val Lys Lys Phe Val Gly Pro Gly
500 505 510
Phe Arg Arg Tyr Ser Phe Glu Met Ser Ile Thr Ile Pro Gly Val Glu
515 520 525
Phe Lys Lys Asp Ser Tyr Ile Gly Phe Asp Val Ala Val Ile Asp Asp
530 535 540
Gly Lys Trp Tyr Ser Trp Ser Asp Thr Thr Asn Ser Gln Lys Thr Asn
545 550 555 560
Thr Met Asn Tyr Gly Thr Leu Lys Leu Glu Gly Ile Met Val Ala Thr
565 570 575
Ala Lys Tyr Gly Thr Pro Val Ile Asp Gly Glu Ile Asp Glu Ile Trp
580 585 590
Asn Thr Thr Glu Glu Ile Glu Thr Lys Ala Val Ala Met Gly Ser Leu
595 600 605
Asp Lys Asn Ala Thr Ala Lys Val Arg Val Leu Trp Asp Glu Asn Tyr
610 615 620
Leu Tyr Val Leu Ala Ile Val Lys Asp Pro Val Leu Asn Lys Asp Asn
625 630 635 640
Ser Asn Pro Trp Glu Gln Asp Ser Val Glu Ile Phe Val Asp Glu Asn
645 650 655
Asn His Lys Thr Gly Tyr Tyr Glu Asp Asp Asp Ala Gln Phe Arg Val
660 665 670
Asn Tyr Met Asn Glu Gln Thr Phe Gly Thr Gly Gly Ser Pro Ala Arg
675 680 685
Phe Lys Thr Ala Val Lys Leu Ile Glu Gly Gly Tyr Ile Val Glu Ala
690 695 700
Ala Ile Lys Trp Lys Thr Ile Lys Pro Thr Pro Asn Thr Val Ile Gly
705 710 715 720
Phe Asn Ile Gln Val Asn Asp Ala Asn Glu Lys Gly Gln Arg Val Gly
725 730 735
Ile Ile Ser Trp Ser Asp Pro Thr Asn Asn Ser Trp Gln Asp Pro Ser
740 745 750
Lys Phe Gly Asn Leu Arg Leu Ile Lys
755 760
<210> 37
<211> 2769
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 37
atgcacaaga agaacggcac ctattacctg agctactcta caaatccggc caacggcatg 60
cggattgact acatgaccag cacgagcccg accagtggct ttgtccatcg aggcacggtc 120
atggcgcagc cctggcagaa cagcaacaac aacaaccacg caaccagcac cgagtacaac 180
gggcagggct acatcttcta tcacaaccgt gcgttgtcga acgagcgtgc gggtggcaac 240
gtgctgcagc gctcggtgaa cgtggatcgc ctctacttca atgccgatgg cagcatccgt 300
caggtcactt ccagtgcaac cggcgtgccg gccctgaaaa ccctggatgc cttcctggtc 360
aagcctgccg agctgtatca caaggaaagc gggatcaaga ccgagcctgc cagtgaagga 420
acccaggcac tggttatgac ggctggtagc tgggtgcgcc tggccaatgt cgatttcggc 480
aatggcggcg ccactggttt ttccgcgcgt attgcggcaa ccggcagcgg cagcatccag 540
gtgatcctgg gcaatctgaa caacgccccg gtcggcacgc tggcagtgag cagcaccggc 600
aacctccaga cctggcaaga ccgcagcacc gccatcagca aggtgaccgg cgtgcatgac 660
gtgtatttgc gtgccaccgg caatgtgcat gtgcagcgtc actggttcgt ggcgtcggcg 720
ccggccgctg ccgcctcatc cagcagtcag gcaagcgtct ctgccagcag tcaggcaagt 780
gtttcttcca gtagccaggc aagcgttgcc tccagcagca gttccagccg cgcttcttcc 840
gccagcagtt cggtggcggc tggccaggtg gaggtcggtt atcgccttag cagcgaatgg 900
gccgccggct tctgcggcgt ggtcaccatc cgtaatccgg gtagttctcc ggtcaccagc 960
tggagtggca gtttcaacct gcctggcggc aagatcaccc agctgtggaa tgccaactgg 1020
acccagaacg gcagcaccgt gacggtatct tcccaggcct ggagcggtgc cattgctgca 1080
ggcgccacca tcaccacgcc gggcttctgc gccgagcgca cgagcagcaa tgcgtcctcc 1140
agtgtcgcca gcagcagtgt ctcctcatcg agcagcagtg ctgcggctgc cagctccagc 1200
gcggcttcca gcgtcccgtc cactggcagt ggcggggtgg gcagcagcgc atcctcggct 1260
agcagtgccg ctgcacccaa gggcgtgctt gaagtcggcc tgagcggcct ttccagccag 1320
gccatgttcg ccccgttgcg ggtcaggacg gacgctgcgg ccgccaacaa ggcctatgtt 1380
gaatggccca acaacggcgc caatcagtcg ctggcaacgc ctgccaacga tgccgcaggg 1440
caggtggagg tagccttcgt gctggcccag gcatccgcag tgcagtttga tatcgaagcg 1500
aatttcgcca acgcggaaga cgactccttc tacttccagc tcaacggtgg tgcctggcag 1560
accttcaaca acgccaccac ggtcggctgg cagaccctgc cggtcgcctc tctgggcaat 1620
ctggctgccg ggcgccatgt gctgaccctg ctgcgccgcg aggatggcgc gaagctgggc 1680
aaggtcgtcc tgagtgcggc acagagcagc atcagtcgtg ccacgccggt ggcctacgcg 1740
tcgccgaatg atgttgccaa cctgttcaag ctggccagct tcccgatcgg ggtggcggtc 1800
agtgccggca acgaaggtga cagcctgctg cgtagcggta cccgcgcagc agccgagcgt 1860
gcgctgaccg agaagcactt caacagtctg gtggccggca acatcatgaa gatgagctac 1920
ctgcatccgg ccgagaacac ctacaccttc acccaggcgg atgcgctggc cgactacgcc 1980
aagtccaagg gcatggtgtt gcatggccat gcgctggtct ggcatgcgga ctatcaggta 2040
cccaactgga tgaagaatta caccggagac tggtcgaaga tgctcgaagc ccacgtcacc 2100
accgtcgcca agcactatgc cggcaaggtg gtgagctggg atgtggtgaa tgaagccctg 2160
gccgatggca atgccaccgc caccaagggt ttccgtgcca ccgattcgat cttctatcag 2220
aagatgggct ccagtttcat cgagaaggcc tttattgctg cacgtgctgc cgacccgaat 2280
gccgacctgt attacaacga ctacggcatg gagggcggaa acagcaagtt caattactgc 2340
atggccatgg tcgatgattt ccagaagcgt ggcattccca tcgacggcat cggtttccag 2400
atgcacatca acatcgactg gccttcgtcg gcccagatcc gcgctgtatt cagtgaagtg 2460
gtcaagcgtg gtctgaaggt gcgtatctcc gagctggata ttccggtgaa taccactgcc 2520
ggtcgttttg ccagcctgaa tgccacggcc aacgagctgc agaagaagaa gtatcgtgag 2580
gttgtggctg cctacctgga tgtggtgccg cccgagctgc gcggtggcat caccgtgtgg 2640
ggcctgagcg acaacggcag ctggctggtg acccccacca agccggactg gccgctgctg 2700
ttcgatgccg acctcaaggc caaggacgcc ctgagcggct ttgccgacgc cctgcgcggc 2760
gtacgctga 2769
<210> 38
<211> 922
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 38
Met His Lys Lys Asn Gly Thr Tyr Tyr Leu Ser Tyr Ser Thr Asn Pro
1 5 10 15
Ala Asn Gly Met Arg Ile Asp Tyr Met Thr Ser Thr Ser Pro Thr Ser
20 25 30
Gly Phe Val His Arg Gly Thr Val Met Ala Gln Pro Trp Gln Asn Ser
35 40 45
Asn Asn Asn Asn His Ala Thr Ser Thr Glu Tyr Asn Gly Gln Gly Tyr
50 55 60
Ile Phe Tyr His Asn Arg Ala Leu Ser Asn Glu Arg Ala Gly Gly Asn
65 70 75 80
Val Leu Gln Arg Ser Val Asn Val Asp Arg Leu Tyr Phe Asn Ala Asp
85 90 95
Gly Ser Ile Arg Gln Val Thr Ser Ser Ala Thr Gly Val Pro Ala Leu
100 105 110
Lys Thr Leu Asp Ala Phe Leu Val Lys Pro Ala Glu Leu Tyr His Lys
115 120 125
Glu Ser Gly Ile Lys Thr Glu Pro Ala Ser Glu Gly Thr Gln Ala Leu
130 135 140
Val Met Thr Ala Gly Ser Trp Val Arg Leu Ala Asn Val Asp Phe Gly
145 150 155 160
Asn Gly Gly Ala Thr Gly Phe Ser Ala Arg Ile Ala Ala Thr Gly Ser
165 170 175
Gly Ser Ile Gln Val Ile Leu Gly Asn Leu Asn Asn Ala Pro Val Gly
180 185 190
Thr Leu Ala Val Ser Ser Thr Gly Asn Leu Gln Thr Trp Gln Asp Arg
195 200 205
Ser Thr Ala Ile Ser Lys Val Thr Gly Val His Asp Val Tyr Leu Arg
210 215 220
Ala Thr Gly Asn Val His Val Gln Arg His Trp Phe Val Ala Ser Ala
225 230 235 240
Pro Ala Ala Ala Ala Ser Ser Ser Ser Gln Ala Ser Val Ser Ala Ser
245 250 255
Ser Gln Ala Ser Val Ser Ser Ser Ser Gln Ala Ser Val Ala Ser Ser
260 265 270
Ser Ser Ser Ser Arg Ala Ser Ser Ala Ser Ser Ser Val Ala Ala Gly
275 280 285
Gln Val Glu Val Gly Tyr Arg Leu Ser Ser Glu Trp Ala Ala Gly Phe
290 295 300
Cys Gly Val Val Thr Ile Arg Asn Pro Gly Ser Ser Pro Val Thr Ser
305 310 315 320
Trp Ser Gly Ser Phe Asn Leu Pro Gly Gly Lys Ile Thr Gln Leu Trp
325 330 335
Asn Ala Asn Trp Thr Gln Asn Gly Ser Thr Val Thr Val Ser Ser Gln
340 345 350
Ala Trp Ser Gly Ala Ile Ala Ala Gly Ala Thr Ile Thr Thr Pro Gly
355 360 365
Phe Cys Ala Glu Arg Thr Ser Ser Asn Ala Ser Ser Ser Val Ala Ser
370 375 380
Ser Ser Val Ser Ser Ser Ser Ser Ser Ala Ala Ala Ala Ser Ser Ser
385 390 395 400
Ala Ala Ser Ser Val Pro Ser Thr Gly Ser Gly Gly Val Gly Ser Ser
405 410 415
Ala Ser Ser Ala Ser Ser Ala Ala Ala Pro Lys Gly Val Leu Glu Val
420 425 430
Gly Leu Ser Gly Leu Ser Ser Gln Ala Met Phe Ala Pro Leu Arg Val
435 440 445
Arg Thr Asp Ala Ala Ala Ala Asn Lys Ala Tyr Val Glu Trp Pro Asn
450 455 460
Asn Gly Ala Asn Gln Ser Leu Ala Thr Pro Ala Asn Asp Ala Ala Gly
465 470 475 480
Gln Val Glu Val Ala Phe Val Leu Ala Gln Ala Ser Ala Val Gln Phe
485 490 495
Asp Ile Glu Ala Asn Phe Ala Asn Ala Glu Asp Asp Ser Phe Tyr Phe
500 505 510
Gln Leu Asn Gly Gly Ala Trp Gln Thr Phe Asn Asn Ala Thr Thr Val
515 520 525
Gly Trp Gln Thr Leu Pro Val Ala Ser Leu Gly Asn Leu Ala Ala Gly
530 535 540
Arg His Val Leu Thr Leu Leu Arg Arg Glu Asp Gly Ala Lys Leu Gly
545 550 555 560
Lys Val Val Leu Ser Ala Ala Gln Ser Ser Ile Ser Arg Ala Thr Pro
565 570 575
Val Ala Tyr Ala Ser Pro Asn Asp Val Ala Asn Leu Phe Lys Leu Ala
580 585 590
Ser Phe Pro Ile Gly Val Ala Val Ser Ala Gly Asn Glu Gly Asp Ser
595 600 605
Leu Leu Arg Ser Gly Thr Arg Ala Ala Ala Glu Arg Ala Leu Thr Glu
610 615 620
Lys His Phe Asn Ser Leu Val Ala Gly Asn Ile Met Lys Met Ser Tyr
625 630 635 640
Leu His Pro Ala Glu Asn Thr Tyr Thr Phe Thr Gln Ala Asp Ala Leu
645 650 655
Ala Asp Tyr Ala Lys Ser Lys Gly Met Val Leu His Gly His Ala Leu
660 665 670
Val Trp His Ala Asp Tyr Gln Val Pro Asn Trp Met Lys Asn Tyr Thr
675 680 685
Gly Asp Trp Ser Lys Met Leu Glu Ala His Val Thr Thr Val Ala Lys
690 695 700
His Tyr Ala Gly Lys Val Val Ser Trp Asp Val Val Asn Glu Ala Leu
705 710 715 720
Ala Asp Gly Asn Ala Thr Ala Thr Lys Gly Phe Arg Ala Thr Asp Ser
725 730 735
Ile Phe Tyr Gln Lys Met Gly Ser Ser Phe Ile Glu Lys Ala Phe Ile
740 745 750
Ala Ala Arg Ala Ala Asp Pro Asn Ala Asp Leu Tyr Tyr Asn Asp Tyr
755 760 765
Gly Met Glu Gly Gly Asn Ser Lys Phe Asn Tyr Cys Met Ala Met Val
770 775 780
Asp Asp Phe Gln Lys Arg Gly Ile Pro Ile Asp Gly Ile Gly Phe Gln
785 790 795 800
Met His Ile Asn Ile Asp Trp Pro Ser Ser Ala Gln Ile Arg Ala Val
805 810 815
Phe Ser Glu Val Val Lys Arg Gly Leu Lys Val Arg Ile Ser Glu Leu
820 825 830
Asp Ile Pro Val Asn Thr Thr Ala Gly Arg Phe Ala Ser Leu Asn Ala
835 840 845
Thr Ala Asn Glu Leu Gln Lys Lys Lys Tyr Arg Glu Val Val Ala Ala
850 855 860
Tyr Leu Asp Val Val Pro Pro Glu Leu Arg Gly Gly Ile Thr Val Trp
865 870 875 880
Gly Leu Ser Asp Asn Gly Ser Trp Leu Val Thr Pro Thr Lys Pro Asp
885 890 895
Trp Pro Leu Leu Phe Asp Ala Asp Leu Lys Ala Lys Asp Ala Leu Ser
900 905 910
Gly Phe Ala Asp Ala Leu Arg Gly Val Arg
915 920
<210> 39
<211> 1143
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 39
atgaaaaaaa cgattgcaca tttcacctta tggatagtgt tttttctctt cacttcctgt 60
gctgttacgg cgcagaagaa tgcaaagaat acaagagtaa aacccactac cctaaaagag 120
gcttaccaag gtaaattcta tatcggtact gcgatgaact tgagacagat tcacggagat 180
gatccccaat ctgaaaatat tatcaaaaaa cagttcaatt ccatagttgc cgaaaactgc 240
atgaagagta tgtatcttca gccggaggaa ggaaaatttt tcttcgatga tgcggacaag 300
tttgtggatt ttggtcttca gaacaatatg ttcatcattg ggcattgtct gatttggcat 360
tcgcaggcgc caaaatggtt tttcaccgat gagaatggaa acacggtttc tccagaagtt 420
cttaaacaaa ggatgaaagc ccatattacc gccgtcgttt cccgttacaa agggaaaatc 480
aaaggttggg atgtggtgaa cgaagccatt atggaagatg gttcttaccg taaaagcaaa 540
ttttacgaga ttttgggaga agaatttatt ccgttggcat ttcagtatgc gcatgaagca 600
gatcctgatg cagaacttta ttacaacgat tataacgaat ggtatcccgg aaaaagagct 660
acggtgacca agataatccg cgatttcaaa actagaggaa tccgcatcga tgccatcgga 720
atgcaggctc atttcgggat ggattcgccc actgtagaag agtatgaaca aactattcag 780
ggctatataa aagaaggcgt gaaagtcaat attacggaac tcgatttgag tccacttcct 840
tctccttggg gaacttccgc caatgttgcc gatacgcagc aatatcagga aaaaatgaat 900
ccatacacca aaggacttcc tgcagatgtt gaaaaagcat gggaaaaccg ttatgtggat 960
tttttcaaac tgttcctaaa atatcatcag catattgagc gtgttacgtt ttggggcgtt 1020
agcgatatcg attcctggaa gaacgatttt ccggtaagag gacgtaccga ttatccacta 1080
ccgtttaacc gtcaatatca agcaaaacct ttggttcaga aattaataga tttaacaaaa 1140
tag 1143
<210> 40
<211> 380
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(24)
<400> 40
Met Lys Lys Thr Ile Ala His Phe Thr Leu Trp Ile Val Phe Phe Leu
1 5 10 15
Phe Thr Ser Cys Ala Val Thr Ala Gln Lys Asn Ala Lys Asn Thr Arg
20 25 30
Val Lys Pro Thr Thr Leu Lys Glu Ala Tyr Gln Gly Lys Phe Tyr Ile
35 40 45
Gly Thr Ala Met Asn Leu Arg Gln Ile His Gly Asp Asp Pro Gln Ser
50 55 60
Glu Asn Ile Ile Lys Lys Gln Phe Asn Ser Ile Val Ala Glu Asn Cys
65 70 75 80
Met Lys Ser Met Tyr Leu Gln Pro Glu Glu Gly Lys Phe Phe Phe Asp
85 90 95
Asp Ala Asp Lys Phe Val Asp Phe Gly Leu Gln Asn Asn Met Phe Ile
100 105 110
Ile Gly His Cys Leu Ile Trp His Ser Gln Ala Pro Lys Trp Phe Phe
115 120 125
Thr Asp Glu Asn Gly Asn Thr Val Ser Pro Glu Val Leu Lys Gln Arg
130 135 140
Met Lys Ala His Ile Thr Ala Val Val Ser Arg Tyr Lys Gly Lys Ile
145 150 155 160
Lys Gly Trp Asp Val Val Asn Glu Ala Ile Met Glu Asp Gly Ser Tyr
165 170 175
Arg Lys Ser Lys Phe Tyr Glu Ile Leu Gly Glu Glu Phe Ile Pro Leu
180 185 190
Ala Phe Gln Tyr Ala His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr
195 200 205
Asn Asp Tyr Asn Glu Trp Tyr Pro Gly Lys Arg Ala Thr Val Thr Lys
210 215 220
Ile Ile Arg Asp Phe Lys Thr Arg Gly Ile Arg Ile Asp Ala Ile Gly
225 230 235 240
Met Gln Ala His Phe Gly Met Asp Ser Pro Thr Val Glu Glu Tyr Glu
245 250 255
Gln Thr Ile Gln Gly Tyr Ile Lys Glu Gly Val Lys Val Asn Ile Thr
260 265 270
Glu Leu Asp Leu Ser Pro Leu Pro Ser Pro Trp Gly Thr Ser Ala Asn
275 280 285
Val Ala Asp Thr Gln Gln Tyr Gln Glu Lys Met Asn Pro Tyr Thr Lys
290 295 300
Gly Leu Pro Ala Asp Val Glu Lys Ala Trp Glu Asn Arg Tyr Val Asp
305 310 315 320
Phe Phe Lys Leu Phe Leu Lys Tyr His Gln His Ile Glu Arg Val Thr
325 330 335
Phe Trp Gly Val Ser Asp Ile Asp Ser Trp Lys Asn Asp Phe Pro Val
340 345 350
Arg Gly Arg Thr Asp Tyr Pro Leu Pro Phe Asn Arg Gln Tyr Gln Ala
355 360 365
Lys Pro Leu Val Gln Lys Leu Ile Asp Leu Thr Lys
370 375 380
<210> 41
<211> 1893
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 41
atgatccatc aacaaaagcc caaccaagac atcggtaggc tattcaagcg cagctgcagc 60
tttgtcggta ttagcgcggc actggctgtt ttctcacaca ccgcaagtgc agcctgtact 120
tacaacattg ataaccaatg gggcagcggt tttgtcgcta gtattactgt aaagaatgac 180
actggtgcaa ccgtcaataa ctggagtgtg aattggcaat atgccaacaa tcgcatcacc 240
aatggttgga gtgcaaattt ctctggcagc aatccttaca ccgccaccaa tatgagctgg 300
aacggtagca ttgccgctgg ccagtcggtg acttttggtt tccagggcaa cactaacagc 360
aataccgttg agcgcccggt ggttaacggt tcactgtgcg gtactgcaac aacctcttca 420
gttcgctcca gcgtggctgc gacgtcttcc agtcgctcca gtgttgcgcc cagctcgatt 480
cctgcttcca gcactccgcg ttcaagcaca cctgccacct cttcttctgc ttccagcttc 540
tcagtaccgg ccaataattt tgcgcagaat ggcggcgtgg aatctggttt gaccaactgg 600
ggtacgactg cgggcaccgt gactcgctct actgccgata aacacagcgg tacagccagt 660
gccttaatta ccggccgcac tgctgcctgg aatggtttga cgtttaatgt gggcgcattg 720
accaacggca accagtacca agtcaacgtg tgggtgaaat tggctccagg tacgcccgac 780
agcgtactga ccttaaccgg taagcgtgta gacgatagcg atactactac ctacaacgaa 840
tacacacgcg tagcgactgt gactgcctct gccaatgagt ggcgtttgct ggaaggttac 900
tacacccaat ctggcagcac tgcattccag catttcatta tcgaagcaac ggatactact 960
gccagttatt acgcggatga tttcgccatc ggcggtcaag tcgtacaagt tccaagcagc 1020
agctcacgca gctcaagcag tgctccggcg gctagaaaat tcatcggcaa catcaccacc 1080
tcgggtgcag tgagatccga ctttactcgt tactggaacc aaattacacc agagaacgaa 1140
ggtaagtggg gttccgttga aggtactcgc aaccagtaca actgggcacc gctggatcgt 1200
atttatgctt acgctcgcca aaataatatt ccggtaaaag ctcacacgtt tgtgtggggt 1260
gcgcaatcac ccgcgtggct caataactta agcggaccgg aagtcgctgt tgaaattgaa 1320
caatggattc gcgattactg tactcgttac cctgacacgg cgatgattga cgtagtgaac 1380
gaagcggttc ctggccatca accggcaggt tatgcacaac gagcatttgg caataactgg 1440
atccaacgcg tgttccaatt ggctcgccaa tattgcccta actcgatcct gatcctgaat 1500
gattacaaca atatccgttg gcagcacaat gagtttattg cccttgcaaa agctcaaggc 1560
aattatattg atgcagtcgg cctgcaggcg catgaactga agggtatgac agcggcgcaa 1620
gtcaaaaccg caatcgacaa tatttggaac caagtgggca agcccatcta catttctgaa 1680
tacgacattg gcgataacaa tgaccaggtt caattgcaga atttccaggc gcatttccct 1740
gtattctggg accatccgca tgttaaaggc atcaccattt ggggttatgt caatggcaga 1800
acttggattg aaggctcggg cctgatttct gacaacggaa caccgcgccc cgcaatgact 1860
tggttgctga ataactatat caataagcag taa 1893
<210> 42
<211> 630
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(37)
<400> 42
Met Ile His Gln Gln Lys Pro Asn Gln Asp Ile Gly Arg Leu Phe Lys
1 5 10 15
Arg Ser Cys Ser Phe Val Gly Ile Ser Ala Ala Leu Ala Val Phe Ser
20 25 30
His Thr Ala Ser Ala Ala Cys Thr Tyr Asn Ile Asp Asn Gln Trp Gly
35 40 45
Ser Gly Phe Val Ala Ser Ile Thr Val Lys Asn Asp Thr Gly Ala Thr
50 55 60
Val Asn Asn Trp Ser Val Asn Trp Gln Tyr Ala Asn Asn Arg Ile Thr
65 70 75 80
Asn Gly Trp Ser Ala Asn Phe Ser Gly Ser Asn Pro Tyr Thr Ala Thr
85 90 95
Asn Met Ser Trp Asn Gly Ser Ile Ala Ala Gly Gln Ser Val Thr Phe
100 105 110
Gly Phe Gln Gly Asn Thr Asn Ser Asn Thr Val Glu Arg Pro Val Val
115 120 125
Asn Gly Ser Leu Cys Gly Thr Ala Thr Thr Ser Ser Val Arg Ser Ser
130 135 140
Val Ala Ala Thr Ser Ser Ser Arg Ser Ser Val Ala Pro Ser Ser Ile
145 150 155 160
Pro Ala Ser Ser Thr Pro Arg Ser Ser Thr Pro Ala Thr Ser Ser Ser
165 170 175
Ala Ser Ser Phe Ser Val Pro Ala Asn Asn Phe Ala Gln Asn Gly Gly
180 185 190
Val Glu Ser Gly Leu Thr Asn Trp Gly Thr Thr Ala Gly Thr Val Thr
195 200 205
Arg Ser Thr Ala Asp Lys His Ser Gly Thr Ala Ser Ala Leu Ile Thr
210 215 220
Gly Arg Thr Ala Ala Trp Asn Gly Leu Thr Phe Asn Val Gly Ala Leu
225 230 235 240
Thr Asn Gly Asn Gln Tyr Gln Val Asn Val Trp Val Lys Leu Ala Pro
245 250 255
Gly Thr Pro Asp Ser Val Leu Thr Leu Thr Gly Lys Arg Val Asp Asp
260 265 270
Ser Asp Thr Thr Thr Tyr Asn Glu Tyr Thr Arg Val Ala Thr Val Thr
275 280 285
Ala Ser Ala Asn Glu Trp Arg Leu Leu Glu Gly Tyr Tyr Thr Gln Ser
290 295 300
Gly Ser Thr Ala Phe Gln His Phe Ile Ile Glu Ala Thr Asp Thr Thr
305 310 315 320
Ala Ser Tyr Tyr Ala Asp Asp Phe Ala Ile Gly Gly Gln Val Val Gln
325 330 335
Val Pro Ser Ser Ser Ser Arg Ser Ser Ser Ser Ala Pro Ala Ala Arg
340 345 350
Lys Phe Ile Gly Asn Ile Thr Thr Ser Gly Ala Val Arg Ser Asp Phe
355 360 365
Thr Arg Tyr Trp Asn Gln Ile Thr Pro Glu Asn Glu Gly Lys Trp Gly
370 375 380
Ser Val Glu Gly Thr Arg Asn Gln Tyr Asn Trp Ala Pro Leu Asp Arg
385 390 395 400
Ile Tyr Ala Tyr Ala Arg Gln Asn Asn Ile Pro Val Lys Ala His Thr
405 410 415
Phe Val Trp Gly Ala Gln Ser Pro Ala Trp Leu Asn Asn Leu Ser Gly
420 425 430
Pro Glu Val Ala Val Glu Ile Glu Gln Trp Ile Arg Asp Tyr Cys Thr
435 440 445
Arg Tyr Pro Asp Thr Ala Met Ile Asp Val Val Asn Glu Ala Val Pro
450 455 460
Gly His Gln Pro Ala Gly Tyr Ala Gln Arg Ala Phe Gly Asn Asn Trp
465 470 475 480
Ile Gln Arg Val Phe Gln Leu Ala Arg Gln Tyr Cys Pro Asn Ser Ile
485 490 495
Leu Ile Leu Asn Asp Tyr Asn Asn Ile Arg Trp Gln His Asn Glu Phe
500 505 510
Ile Ala Leu Ala Lys Ala Gln Gly Asn Tyr Ile Asp Ala Val Gly Leu
515 520 525
Gln Ala His Glu Leu Lys Gly Met Thr Ala Ala Gln Val Lys Thr Ala
530 535 540
Ile Asp Asn Ile Trp Asn Gln Val Gly Lys Pro Ile Tyr Ile Ser Glu
545 550 555 560
Tyr Asp Ile Gly Asp Asn Asn Asp Gln Val Gln Leu Gln Asn Phe Gln
565 570 575
Ala His Phe Pro Val Phe Trp Asp His Pro His Val Lys Gly Ile Thr
580 585 590
Ile Trp Gly Tyr Val Asn Gly Arg Thr Trp Ile Glu Gly Ser Gly Leu
595 600 605
Ile Ser Asp Asn Gly Thr Pro Arg Pro Ala Met Thr Trp Leu Leu Asn
610 615 620
Asn Tyr Ile Asn Lys Gln
625 630
<210> 43
<211> 1011
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 43
atgcaaacaa atattaaagg aaataacatt ccatcattac acgaagttta tcaagatcac 60
tttttgatag gtgcagcagt taatccaaaa acattagact cacagcagga tttattgaga 120
aaacacttta acagtattac agctgaaaat gaaatgaaat ttgaagaatt gcaaccagaa 180
cctggccatt tcacgtttgg tgtagcagat gaaatcgttt catttgcaaa agaaaatgga 240
atgaaagtta gaggacatac attagtttgg cataatcaaa cgcctgattg gatgtttttg 300
aatgaagatg gatctgtcac agatcgagaa acgcttctag aaagaatgaa attacacatt 360
acaacagtta tgcagcatta caaaggtcaa gcttattgct gggatgttgt aaatgaggtg 420
attgctgacg agggtacaga gttattccgt aaatctaaat ggactgaaat tattggtgat 480
gattttgtag aaaaggcatt tgaatatgca catgaggctg atccagaagc tttactattc 540
tacaatgact ataatgaatc ccatcccaat aagcgtgaga aaattttcac acttgtaaaa 600
ggattagttg ataaggggat acctattcat ggaatcggtt tacaagcaca ttggaattta 660
acaggacctt cttatgaaga tattagagca gcactcgaga aatatgctac attgggattg 720
gaaatacacc ttaccgaatt ggatgtttct gtttttaatt atgaagatcg aagaacagat 780
ttaacagaac caactaaaga tatgcaagcg cttcaagcgg agcgttatac agaattattc 840
aagatattga gagaatatag tcatgtaatc agttcgatta ctttttgggg agctgcagat 900
gattatactt ggttagatga ttttcctgtc aaaggaagaa aaaactggcc atttgttttt 960
gatgaaaacc aagagccaaa agagtcattt tggaatatta ttgactttta a 1011
<210> 44
<211> 336
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 44
Met Gln Thr Asn Ile Lys Gly Asn Asn Ile Pro Ser Leu His Glu Val
1 5 10 15
Tyr Gln Asp His Phe Leu Ile Gly Ala Ala Val Asn Pro Lys Thr Leu
20 25 30
Asp Ser Gln Gln Asp Leu Leu Arg Lys His Phe Asn Ser Ile Thr Ala
35 40 45
Glu Asn Glu Met Lys Phe Glu Glu Leu Gln Pro Glu Pro Gly His Phe
50 55 60
Thr Phe Gly Val Ala Asp Glu Ile Val Ser Phe Ala Lys Glu Asn Gly
65 70 75 80
Met Lys Val Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro Asp
85 90 95
Trp Met Phe Leu Asn Glu Asp Gly Ser Val Thr Asp Arg Glu Thr Leu
100 105 110
Leu Glu Arg Met Lys Leu His Ile Thr Thr Val Met Gln His Tyr Lys
115 120 125
Gly Gln Ala Tyr Cys Trp Asp Val Val Asn Glu Val Ile Ala Asp Glu
130 135 140
Gly Thr Glu Leu Phe Arg Lys Ser Lys Trp Thr Glu Ile Ile Gly Asp
145 150 155 160
Asp Phe Val Glu Lys Ala Phe Glu Tyr Ala His Glu Ala Asp Pro Glu
165 170 175
Ala Leu Leu Phe Tyr Asn Asp Tyr Asn Glu Ser His Pro Asn Lys Arg
180 185 190
Glu Lys Ile Phe Thr Leu Val Lys Gly Leu Val Asp Lys Gly Ile Pro
195 200 205
Ile His Gly Ile Gly Leu Gln Ala His Trp Asn Leu Thr Gly Pro Ser
210 215 220
Tyr Glu Asp Ile Arg Ala Ala Leu Glu Lys Tyr Ala Thr Leu Gly Leu
225 230 235 240
Glu Ile His Leu Thr Glu Leu Asp Val Ser Val Phe Asn Tyr Glu Asp
245 250 255
Arg Arg Thr Asp Leu Thr Glu Pro Thr Lys Asp Met Gln Ala Leu Gln
260 265 270
Ala Glu Arg Tyr Thr Glu Leu Phe Lys Ile Leu Arg Glu Tyr Ser His
275 280 285
Val Ile Ser Ser Ile Thr Phe Trp Gly Ala Ala Asp Asp Tyr Thr Trp
290 295 300
Leu Asp Asp Phe Pro Val Lys Gly Arg Lys Asn Trp Pro Phe Val Phe
305 310 315 320
Asp Glu Asn Gln Glu Pro Lys Glu Ser Phe Trp Asn Ile Ile Asp Phe
325 330 335
<210> 45
<211> 1137
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 45
atgaagatat cacgccgaca attacttgct atgggtggtg ccgctgcaac cctggcctct 60
gccaaattat tcgctgccga aaaagctgct gccgccaccg gattgaaaga tgcctataaa 120
aacgatttcc tgatcggtgc tgcattaaat acccaaattg ttgatggcaa agaccccaaa 180
cttactgcac tgatcaccaa agaatttaat tcaattaccg cagagaattg ccagaagtgg 240
gaaaggttgc gcaatgaaaa agatggtagc tgggaatgga aagatagcga tgcctttgtg 300
aatttcgggg ttgcccataa catgcatatt gtcgggcata cgttgggctg gcatagccaa 360
attcccgaca gcgtctttaa aaacaaagat ggcagttata tttccaaaga ggcactggca 420
aaaaaacaac aagagcacat caccacctta gtggatcgtt acaaaggcaa aattgccgca 480
tgggatgtgg ttaacgaagc catgggcgat gacaacaaga tgcgcgcaag ccattggtac 540
aacattatgg gtgatgactt tctcgtcaac gcctttaagc tcgcgcatga gactgacccc 600
aaagcacatt tgatgtacaa cgattacaac aacgagcgcc cggaaaagcg cgcagcaacg 660
gttgatatgc tcaagcgcct gttaaaactc ggggcgccga tccacggttt gggaatgcag 720
gcacatattg gcctggatgc ggatatgaaa aactttgaag acagtattgt cgcctattca 780
gaattaggct tgcgtattca ccttaccgaa ctggatatag atgtgttgcc ctcggtgtgg 840
aatttgccag tcgctgaagt atctacccgt tttgaataca aaccggagcg agatccttac 900
atcaaaggcc tgccaaaaga gatcgacgaa aaactcgcga aggcttatga atcgctattt 960
aaaattttgc ttaagcataa agacaaagta gatcgtgtga ccttctgggg tgtgagtgat 1020
gatgccagct ggctaaatgg cttcccgatc ccgggccgca ccaattatcc actgttattt 1080
gaccgtaagc agcaacctaa agcagcgtac ttccgcttac tggatttaaa gcgttaa 1137
<210> 46
<211> 378
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(25)
<400> 46
Met Lys Ile Ser Arg Arg Gln Leu Leu Ala Met Gly Gly Ala Ala Ala
1 5 10 15
Thr Leu Ala Ser Ala Lys Leu Phe Ala Ala Glu Lys Ala Ala Ala Ala
20 25 30
Thr Gly Leu Lys Asp Ala Tyr Lys Asn Asp Phe Leu Ile Gly Ala Ala
35 40 45
Leu Asn Thr Gln Ile Val Asp Gly Lys Asp Pro Lys Leu Thr Ala Leu
50 55 60
Ile Thr Lys Glu Phe Asn Ser Ile Thr Ala Glu Asn Cys Gln Lys Trp
65 70 75 80
Glu Arg Leu Arg Asn Glu Lys Asp Gly Ser Trp Glu Trp Lys Asp Ser
85 90 95
Asp Ala Phe Val Asn Phe Gly Val Ala His Asn Met His Ile Val Gly
100 105 110
His Thr Leu Gly Trp His Ser Gln Ile Pro Asp Ser Val Phe Lys Asn
115 120 125
Lys Asp Gly Ser Tyr Ile Ser Lys Glu Ala Leu Ala Lys Lys Gln Gln
130 135 140
Glu His Ile Thr Thr Leu Val Asp Arg Tyr Lys Gly Lys Ile Ala Ala
145 150 155 160
Trp Asp Val Val Asn Glu Ala Met Gly Asp Asp Asn Lys Met Arg Ala
165 170 175
Ser His Trp Tyr Asn Ile Met Gly Asp Asp Phe Leu Val Asn Ala Phe
180 185 190
Lys Leu Ala His Glu Thr Asp Pro Lys Ala His Leu Met Tyr Asn Asp
195 200 205
Tyr Asn Asn Glu Arg Pro Glu Lys Arg Ala Ala Thr Val Asp Met Leu
210 215 220
Lys Arg Leu Leu Lys Leu Gly Ala Pro Ile His Gly Leu Gly Met Gln
225 230 235 240
Ala His Ile Gly Leu Asp Ala Asp Met Lys Asn Phe Glu Asp Ser Ile
245 250 255
Val Ala Tyr Ser Glu Leu Gly Leu Arg Ile His Leu Thr Glu Leu Asp
260 265 270
Ile Asp Val Leu Pro Ser Val Trp Asn Leu Pro Val Ala Glu Val Ser
275 280 285
Thr Arg Phe Glu Tyr Lys Pro Glu Arg Asp Pro Tyr Ile Lys Gly Leu
290 295 300
Pro Lys Glu Ile Asp Glu Lys Leu Ala Lys Ala Tyr Glu Ser Leu Phe
305 310 315 320
Lys Ile Leu Leu Lys His Lys Asp Lys Val Asp Arg Val Thr Phe Trp
325 330 335
Gly Val Ser Asp Asp Ala Ser Trp Leu Asn Gly Phe Pro Ile Pro Gly
340 345 350
Arg Thr Asn Tyr Pro Leu Leu Phe Asp Arg Lys Gln Gln Pro Lys Ala
355 360 365
Ala Tyr Phe Arg Leu Leu Asp Leu Lys Arg
370 375
<210> 47
<211> 1137
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 47
atgaaaagaa taaagattct gaattcgatt gtattagctt taatcctggc gatcatcctg 60
ccgggatgtt ccaatgcaca gaagagcgag ccggtgctga aagatgccct ttcgggaaaa 120
ttttacatcg gggctgctct caataccccc caaattacgg gccgggatac cttgtccatg 180
aaaatggtca ccagacattt taactccatc gtagctgaga actgcatgaa aagcggggag 240
atccagcgga ccgaagggga gtttgatttc agtcttgccg accagtttgt cgcgttcggc 300
gaaaaacaca acatgcacat tgtggggcat accctgatat ggcattcaca ggcgccgcgc 360
tggtttttca ccggtgcaga cggaaacgaa gtcagccggg aggtactgat tgagcgcatg 420
aagaaccata tttatacggt cgtggggcgt tacaaaggcc gtgtccacgg ctgggatgtg 480
gtcaacgaag ccattgaaga caacggctca tggcgcaaca gcaagtttta ccagatctta 540
ggtgacgagt ttgtggaact ggcctttaaa tttgccgcag aagccgaccc ggatgccgaa 600
ctttactata acgactactc catggcatta gaaggcagga gaaatggcgt tatcagaatg 660
gtgaagaacc ttcagtccaa gggactcaaa attgacggta tcggcatgca ggggcatctg 720
ctcatggact cgcccacgct ggaagcttat gaagaaagta tcctggccta ttccggactg 780
ggcgttaagg tgatgatcac ggaactcgat ttgtctgcgc tgccatggcc agcccgtcag 840
cagggagccg atattgccct gagggctgag tatgaggcac ggatgaatcc ttacaccgaa 900
ggtttaaccg attcagcttc cgtggcatgg aatcagcgga tgggcgattt cttctctctt 960
ttcctgaagc accaggacaa aatcagcagg gttacccttt ggggggtcac cgataaccaa 1020
tcctggaaaa ataactttcc gatgagagga aggacagact acccgttgct ttttgaccgg 1080
aattaccaac ccaaaccggt ggtggaaaga atcatcaaag aagcgaaagc aaaataa 1137
<210> 48
<211> 378
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(26)
<400> 48
Met Lys Arg Ile Lys Ile Leu Asn Ser Ile Val Leu Ala Leu Ile Leu
1 5 10 15
Ala Ile Ile Leu Pro Gly Cys Ser Asn Ala Gln Lys Ser Glu Pro Val
20 25 30
Leu Lys Asp Ala Leu Ser Gly Lys Phe Tyr Ile Gly Ala Ala Leu Asn
35 40 45
Thr Pro Gln Ile Thr Gly Arg Asp Thr Leu Ser Met Lys Met Val Thr
50 55 60
Arg His Phe Asn Ser Ile Val Ala Glu Asn Cys Met Lys Ser Gly Glu
65 70 75 80
Ile Gln Arg Thr Glu Gly Glu Phe Asp Phe Ser Leu Ala Asp Gln Phe
85 90 95
Val Ala Phe Gly Glu Lys His Asn Met His Ile Val Gly His Thr Leu
100 105 110
Ile Trp His Ser Gln Ala Pro Arg Trp Phe Phe Thr Gly Ala Asp Gly
115 120 125
Asn Glu Val Ser Arg Glu Val Leu Ile Glu Arg Met Lys Asn His Ile
130 135 140
Tyr Thr Val Val Gly Arg Tyr Lys Gly Arg Val His Gly Trp Asp Val
145 150 155 160
Val Asn Glu Ala Ile Glu Asp Asn Gly Ser Trp Arg Asn Ser Lys Phe
165 170 175
Tyr Gln Ile Leu Gly Asp Glu Phe Val Glu Leu Ala Phe Lys Phe Ala
180 185 190
Ala Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Met
195 200 205
Ala Leu Glu Gly Arg Arg Asn Gly Val Ile Arg Met Val Lys Asn Leu
210 215 220
Gln Ser Lys Gly Leu Lys Ile Asp Gly Ile Gly Met Gln Gly His Leu
225 230 235 240
Leu Met Asp Ser Pro Thr Leu Glu Ala Tyr Glu Glu Ser Ile Leu Ala
245 250 255
Tyr Ser Gly Leu Gly Val Lys Val Met Ile Thr Glu Leu Asp Leu Ser
260 265 270
Ala Leu Pro Trp Pro Ala Arg Gln Gln Gly Ala Asp Ile Ala Leu Arg
275 280 285
Ala Glu Tyr Glu Ala Arg Met Asn Pro Tyr Thr Glu Gly Leu Thr Asp
290 295 300
Ser Ala Ser Val Ala Trp Asn Gln Arg Met Gly Asp Phe Phe Ser Leu
305 310 315 320
Phe Leu Lys His Gln Asp Lys Ile Ser Arg Val Thr Leu Trp Gly Val
325 330 335
Thr Asp Asn Gln Ser Trp Lys Asn Asn Phe Pro Met Arg Gly Arg Thr
340 345 350
Asp Tyr Pro Leu Leu Phe Asp Arg Asn Tyr Gln Pro Lys Pro Val Val
355 360 365
Glu Arg Ile Ile Lys Glu Ala Lys Ala Lys
370 375
<210> 49
<211> 996
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 49
atgaacagct ccctcccctc cctccgcgat gtattcgcga atgatttccg catcggggcg 60
gcggtcaatc ctgtgacgat cgagatgcaa aaacagttgt tgatcgatca tgtcaacagt 120
attacggcag agaaccatat gaagtttgag catcttcagc cggaagaagg gaaatttacc 180
tttcaggaag cggatcggat tgtggatttt gcttgttcgc accgaatggc ggttcgaggg 240
cacacacttg tatggcacaa ccagactccg gattgggtgt ttcaagatgg tcaaggccat 300
ttcgtcagtc gggatgtgtt gcttgagcgg atgaaatgtc acatttcaac tgttgtacgg 360
cgatacaagg gaaaaatata ttgttgggat gtcatcaacg aagcggtagc cgacgaagga 420
gacgaattgt tgaggccgtc gaagtggcga caaatcatcg gggacgattt tatggaacaa 480
gcatttctct acgcttatga agctgaccca gatgcactgc ttttttacaa tgactataat 540
gaatgttttc cggaaaagag agaaaaaatt tttgcacttg tcaaatcgct gcgtgataaa 600
ggcattccga ttcatggcat cggcatgcag gcgcactgga gcctgacccg cccgtcgctt 660
gatgaaattc gtgcggcgat tgaacggtat gcgtcccttg gtgttgttct tcatattacg 720
gaactcgatg tatccatgtt tgaatttcac gatcgtcgaa ccgatttggc tgtcccgacg 780
aacgaaatga tcgaacagca agcagaacgg tatgggcaaa tttttgcttt gtttaaggag 840
tatcgcgatg ttattcaaag tgtcacattt tggggaattg ctgatgacca tacatggctc 900
gataactttc cagtgcacgg gagaaaaaac tggccgcttt tgttcgatga acagcataaa 960
ccgaaaccag ctttttggcg ggcagtgagt gtctga 996
<210> 50
<211> 331
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 50
Met Asn Ser Ser Leu Pro Ser Leu Arg Asp Val Phe Ala Asn Asp Phe
1 5 10 15
Arg Ile Gly Ala Ala Val Asn Pro Val Thr Ile Glu Met Gln Lys Gln
20 25 30
Leu Leu Ile Asp His Val Asn Ser Ile Thr Ala Glu Asn His Met Lys
35 40 45
Phe Glu His Leu Gln Pro Glu Glu Gly Lys Phe Thr Phe Gln Glu Ala
50 55 60
Asp Arg Ile Val Asp Phe Ala Cys Ser His Arg Met Ala Val Arg Gly
65 70 75 80
His Thr Leu Val Trp His Asn Gln Thr Pro Asp Trp Val Phe Gln Asp
85 90 95
Gly Gln Gly His Phe Val Ser Arg Asp Val Leu Leu Glu Arg Met Lys
100 105 110
Cys His Ile Ser Thr Val Val Arg Arg Tyr Lys Gly Lys Ile Tyr Cys
115 120 125
Trp Asp Val Ile Asn Glu Ala Val Ala Asp Glu Gly Asp Glu Leu Leu
130 135 140
Arg Pro Ser Lys Trp Arg Gln Ile Ile Gly Asp Asp Phe Met Glu Gln
145 150 155 160
Ala Phe Leu Tyr Ala Tyr Glu Ala Asp Pro Asp Ala Leu Leu Phe Tyr
165 170 175
Asn Asp Tyr Asn Glu Cys Phe Pro Glu Lys Arg Glu Lys Ile Phe Ala
180 185 190
Leu Val Lys Ser Leu Arg Asp Lys Gly Ile Pro Ile His Gly Ile Gly
195 200 205
Met Gln Ala His Trp Ser Leu Thr Arg Pro Ser Leu Asp Glu Ile Arg
210 215 220
Ala Ala Ile Glu Arg Tyr Ala Ser Leu Gly Val Val Leu His Ile Thr
225 230 235 240
Glu Leu Asp Val Ser Met Phe Glu Phe His Asp Arg Arg Thr Asp Leu
245 250 255
Ala Val Pro Thr Asn Glu Met Ile Glu Gln Gln Ala Glu Arg Tyr Gly
260 265 270
Gln Ile Phe Ala Leu Phe Lys Glu Tyr Arg Asp Val Ile Gln Ser Val
275 280 285
Thr Phe Trp Gly Ile Ala Asp Asp His Thr Trp Leu Asp Asn Phe Pro
290 295 300
Val His Gly Arg Lys Asn Trp Pro Leu Leu Phe Asp Glu Gln His Lys
305 310 315 320
Pro Lys Pro Ala Phe Trp Arg Ala Val Ser Val
325 330
<210> 51
<211> 3162
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 51
atgagaggga aaagcaaaaa gggatttctg aacatctcag aagctgtact tgttggaatt 60
ttagcaggct ttcttggagt tcttctcgca gctacggggg ttttgagttt tggtggaaca 120
gcgtcttcgt ctcttgaaac ggtgttcacc ttgagtttcg agggaacaac gcaaggtgtc 180
aatccctttg gaaaagaagt agttctcaca gcttctcaag atgtagcagc cgatggcgaa 240
tattcattga aagtagagaa tagaacttcc ggctgggatg gagttgagat cgatttaacg 300
gaaaaagtag aagcgaacaa agattatctg ttgtctttct acgtctatca aacatctgac 360
tcaccccaac tttttgaagt ccttgcaaga acagaagacg ggaaaggtga aaaatacgaa 420
acccttaccg acaaggtggt agtatcgaac tactggaaag aaattcttgt gcccttttcc 480
ccgagtttcg agagtacccc aacaaaatgt tctttgatcg ttgtttcacc aaagaaccca 540
tcattcactt tctatattga caaggttcaa attctcaaac cgaagaagca aggtccacaa 600
gtcatttacg aaacatcctt tgagagtggg acgggaagct ggcaagccag agggtctgat 660
gtgaaaatca aagtgacatc gaaagttgct cattctggaa aaaggtctct ctatgtctcc 720
aacagacaaa aaggctggca tggtgtacaa cttgacgtga agagactctt gagacccggg 780
aaaacgtatg cttttgaagg atgggtttat caagactctg gacaggatca aacaattatt 840
ctgacgatgc agagaagata ttcttctgat tctagcacac aatatgagtg gatcaaggcg 900
gtaactgttc catcaggaca atggacgcag atctctggaa cttacacaat ccaaccaaga 960
gtaagcgtgg aggaactcat tgtttacttt gaagccaagg atcccactct tgccttctat 1020
gtggacgatt tcaaaataac ggataccaca actactgaca tcaagctcga gctgaagcct 1080
gaagaagaaa ttccagctct taaagaagtg cttggagatt acttcaaagt aggtgttgcc 1140
ttacctttca aagtttttgc caaaccagag gatattgctc tcattactaa acatttcaac 1200
agcatcactg ccgaaaacga aatgaaacct gagagtctct tggctggcgt agaaaatgga 1260
aagttgaagt tcaggtttga gacagcagac aaatacgtag aatttgcaca gcaaaacggt 1320
atggttgtga gaggtcacac tctggtgtgg cacaatcaaa caccggactg gttcttcaag 1380
gacgagaacg gaaatctgct ctccaaagaa gcaatgactg aaaggcttag ggaatacatc 1440
cacacagtcg tcggacactt caaaggcaaa gtttacgcgt gggacgtcgt taatgaggca 1500
gtagatccat cccaaccaga tggacttaga agatctatat ggtacgaaat catgggacct 1560
gactatatag aacttgcatt caagtttgca agagaagcgg accccaatgc aaagctcttc 1620
tacaacgact acaacaccta ccaggagaag aagagagaca tcatttacaa cctcgtcaaa 1680
tccctcaaag agaagggact cattgacggt atcggtatgc agtgtcatat cggtgttggg 1740
accagtgtca aagagattga agaggcaatc aaaaaattca gcaccattcc aggtatcgaa 1800
attcatatca cggaactaga tataagtgtg tacgaggatg cgacttccaa ttatccaaca 1860
cctccaaggg aggctctcat taaacaagca cacgtaatga gagaactctt tgccatcttc 1920
aaaaagtaca gcaacgtcat aacaaacgtt actttctggg gattgaaaga tgattattcc 1980
tggaagaatg cccgcagaaa cgactggccg ctactttttg ataaagacta ccaagccaaa 2040
cttgcctact gggccatagt cagtcctgag gctctaccgg tgcttccaaa gaaatggtct 2100
atcgctacag gtagtgcttt ggtagttgga atgatggatg actcctattt ggcttcttca 2160
cctatcaaaa ttctcgtcga tggccaagaa aaactcacag ccagagtcat ctgggaagaa 2220
aacaaactct tcgtctacgc agaggtctat gacaggacaa gagacaaagg aaaggacggt 2280
atcaccatct ttgtggatcc taaaaacttc aaggcacctt acttgcatga agatgctttc 2340
tacgttacca taaaaaccga ctggagtgtt gagaagagtc gtgatgacat agaagtccag 2400
agattcgtag gtccaagtgg agtaaggtac aacgttgaat gtgaaataac acttcctgaa 2460
aaactccagg aaggacagca aatcggattt gatatcgccg tccaggatgg cgataaggtc 2520
tacagctggt ctgatacatc caatcagcag aagctcgcaa ccatgaacta cggaactctc 2580
actctgcagg gtgcggtaat ggccacagct aagtatggca cacctgtgat cgatggtgaa 2640
atagatgaca tctggtacac cactgaagaa atctcaaccg atgttgttgt catgggttca 2700
ctcaagaacg caagggcaaa agtgagagtg ctctgggatg aagagcacct ctatgtgctt 2760
gccatcgtaa ccgatcctgt gctcaataag gacaacacca atccatggga acaagactct 2820
gtagaaatct tcatagacga aaacaacgcc aaaacaccgt actatcagga cgatgatgct 2880
caatatcgtg tcaactacct caacgaacaa tccttcggta caggtgcaag cagcaagaac 2940
ttcaagacag ccgtgaaact catcgatggt ggttatcttg ttgaggcagc ggttaaatgg 3000
aagaccatca aaccttcacc aaacacagtg ataggctttg atttccaggt gaacgatgca 3060
aatgctcaag gtaagagagt tggaatactt aagtggtgcg atccaacgga caacagctgg 3120
cagaatacct ccaagtttgg taatctcagg ttgataaaat ag 3162
<210> 52
<211> 1053
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(30)
<400> 52
Met Arg Gly Lys Ser Lys Lys Gly Phe Leu Asn Ile Ser Glu Ala Val
1 5 10 15
Leu Val Gly Ile Leu Ala Gly Phe Leu Gly Val Leu Leu Ala Ala Thr
20 25 30
Gly Val Leu Ser Phe Gly Gly Thr Ala Ser Ser Ser Leu Glu Thr Val
35 40 45
Phe Thr Leu Ser Phe Glu Gly Thr Thr Gln Gly Val Asn Pro Phe Gly
50 55 60
Lys Glu Val Val Leu Thr Ala Ser Gln Asp Val Ala Ala Asp Gly Glu
65 70 75 80
Tyr Ser Leu Lys Val Glu Asn Arg Thr Ser Gly Trp Asp Gly Val Glu
85 90 95
Ile Asp Leu Thr Glu Lys Val Glu Ala Asn Lys Asp Tyr Leu Leu Ser
100 105 110
Phe Tyr Val Tyr Gln Thr Ser Asp Ser Pro Gln Leu Phe Glu Val Leu
115 120 125
Ala Arg Thr Glu Asp Gly Lys Gly Glu Lys Tyr Glu Thr Leu Thr Asp
130 135 140
Lys Val Val Val Ser Asn Tyr Trp Lys Glu Ile Leu Val Pro Phe Ser
145 150 155 160
Pro Ser Phe Glu Ser Thr Pro Thr Lys Cys Ser Leu Ile Val Val Ser
165 170 175
Pro Lys Asn Pro Ser Phe Thr Phe Tyr Ile Asp Lys Val Gln Ile Leu
180 185 190
Lys Pro Lys Lys Gln Gly Pro Gln Val Ile Tyr Glu Thr Ser Phe Glu
195 200 205
Ser Gly Thr Gly Ser Trp Gln Ala Arg Gly Ser Asp Val Lys Ile Lys
210 215 220
Val Thr Ser Lys Val Ala His Ser Gly Lys Arg Ser Leu Tyr Val Ser
225 230 235 240
Asn Arg Gln Lys Gly Trp His Gly Val Gln Leu Asp Val Lys Arg Leu
245 250 255
Leu Arg Pro Gly Lys Thr Tyr Ala Phe Glu Gly Trp Val Tyr Gln Asp
260 265 270
Ser Gly Gln Asp Gln Thr Ile Ile Leu Thr Met Gln Arg Arg Tyr Ser
275 280 285
Ser Asp Ser Ser Thr Gln Tyr Glu Trp Ile Lys Ala Val Thr Val Pro
290 295 300
Ser Gly Gln Trp Thr Gln Ile Ser Gly Thr Tyr Thr Ile Gln Pro Arg
305 310 315 320
Val Ser Val Glu Glu Leu Ile Val Tyr Phe Glu Ala Lys Asp Pro Thr
325 330 335
Leu Ala Phe Tyr Val Asp Asp Phe Lys Ile Thr Asp Thr Thr Thr Thr
340 345 350
Asp Ile Lys Leu Glu Leu Lys Pro Glu Glu Glu Ile Pro Ala Leu Lys
355 360 365
Glu Val Leu Gly Asp Tyr Phe Lys Val Gly Val Ala Leu Pro Phe Lys
370 375 380
Val Phe Ala Lys Pro Glu Asp Ile Ala Leu Ile Thr Lys His Phe Asn
385 390 395 400
Ser Ile Thr Ala Glu Asn Glu Met Lys Pro Glu Ser Leu Leu Ala Gly
405 410 415
Val Glu Asn Gly Lys Leu Lys Phe Arg Phe Glu Thr Ala Asp Lys Tyr
420 425 430
Val Glu Phe Ala Gln Gln Asn Gly Met Val Val Arg Gly His Thr Leu
435 440 445
Val Trp His Asn Gln Thr Pro Asp Trp Phe Phe Lys Asp Glu Asn Gly
450 455 460
Asn Leu Leu Ser Lys Glu Ala Met Thr Glu Arg Leu Arg Glu Tyr Ile
465 470 475 480
His Thr Val Val Gly His Phe Lys Gly Lys Val Tyr Ala Trp Asp Val
485 490 495
Val Asn Glu Ala Val Asp Pro Ser Gln Pro Asp Gly Leu Arg Arg Ser
500 505 510
Ile Trp Tyr Glu Ile Met Gly Pro Asp Tyr Ile Glu Leu Ala Phe Lys
515 520 525
Phe Ala Arg Glu Ala Asp Pro Asn Ala Lys Leu Phe Tyr Asn Asp Tyr
530 535 540
Asn Thr Tyr Gln Glu Lys Lys Arg Asp Ile Ile Tyr Asn Leu Val Lys
545 550 555 560
Ser Leu Lys Glu Lys Gly Leu Ile Asp Gly Ile Gly Met Gln Cys His
565 570 575
Ile Gly Val Gly Thr Ser Val Lys Glu Ile Glu Glu Ala Ile Lys Lys
580 585 590
Phe Ser Thr Ile Pro Gly Ile Glu Ile His Ile Thr Glu Leu Asp Ile
595 600 605
Ser Val Tyr Glu Asp Ala Thr Ser Asn Tyr Pro Thr Pro Pro Arg Glu
610 615 620
Ala Leu Ile Lys Gln Ala His Val Met Arg Glu Leu Phe Ala Ile Phe
625 630 635 640
Lys Lys Tyr Ser Asn Val Ile Thr Asn Val Thr Phe Trp Gly Leu Lys
645 650 655
Asp Asp Tyr Ser Trp Lys Asn Ala Arg Arg Asn Asp Trp Pro Leu Leu
660 665 670
Phe Asp Lys Asp Tyr Gln Ala Lys Leu Ala Tyr Trp Ala Ile Val Ser
675 680 685
Pro Glu Ala Leu Pro Val Leu Pro Lys Lys Trp Ser Ile Ala Thr Gly
690 695 700
Ser Ala Leu Val Val Gly Met Met Asp Asp Ser Tyr Leu Ala Ser Ser
705 710 715 720
Pro Ile Lys Ile Leu Val Asp Gly Gln Glu Lys Leu Thr Ala Arg Val
725 730 735
Ile Trp Glu Glu Asn Lys Leu Phe Val Tyr Ala Glu Val Tyr Asp Arg
740 745 750
Thr Arg Asp Lys Gly Lys Asp Gly Ile Thr Ile Phe Val Asp Pro Lys
755 760 765
Asn Phe Lys Ala Pro Tyr Leu His Glu Asp Ala Phe Tyr Val Thr Ile
770 775 780
Lys Thr Asp Trp Ser Val Glu Lys Ser Arg Asp Asp Ile Glu Val Gln
785 790 795 800
Arg Phe Val Gly Pro Ser Gly Val Arg Tyr Asn Val Glu Cys Glu Ile
805 810 815
Thr Leu Pro Glu Lys Leu Gln Glu Gly Gln Gln Ile Gly Phe Asp Ile
820 825 830
Ala Val Gln Asp Gly Asp Lys Val Tyr Ser Trp Ser Asp Thr Ser Asn
835 840 845
Gln Gln Lys Leu Ala Thr Met Asn Tyr Gly Thr Leu Thr Leu Gln Gly
850 855 860
Ala Val Met Ala Thr Ala Lys Tyr Gly Thr Pro Val Ile Asp Gly Glu
865 870 875 880
Ile Asp Asp Ile Trp Tyr Thr Thr Glu Glu Ile Ser Thr Asp Val Val
885 890 895
Val Met Gly Ser Leu Lys Asn Ala Arg Ala Lys Val Arg Val Leu Trp
900 905 910
Asp Glu Glu His Leu Tyr Val Leu Ala Ile Val Thr Asp Pro Val Leu
915 920 925
Asn Lys Asp Asn Thr Asn Pro Trp Glu Gln Asp Ser Val Glu Ile Phe
930 935 940
Ile Asp Glu Asn Asn Ala Lys Thr Pro Tyr Tyr Gln Asp Asp Asp Ala
945 950 955 960
Gln Tyr Arg Val Asn Tyr Leu Asn Glu Gln Ser Phe Gly Thr Gly Ala
965 970 975
Ser Ser Lys Asn Phe Lys Thr Ala Val Lys Leu Ile Asp Gly Gly Tyr
980 985 990
Leu Val Glu Ala Ala Val Lys Trp Lys Thr Ile Lys Pro Ser Pro Asn
995 1000 1005
Thr Val Ile Gly Phe Asp Phe Gln Val Asn Asp Ala Asn Ala Gln Gly
1010 1015 1020
Lys Arg Val Gly Ile Leu Lys Trp Cys Asp Pro Thr Asp Asn Ser Trp
1025 1030 1035 1040
Gln Asn Thr Ser Lys Phe Gly Asn Leu Arg Leu Ile Lys
1045 1050
<210> 53
<211> 2370
<212> DNA
<213> Bacteria
<400> 53
atgaagggcc tgcaccggct ccgccgccgt cgccggacct gggtggcagg actgtcggcc 60
gcggcggtgg tcgccggcgc cctgacgctc ctccccggct ccgccggcgc cgcgggcctg 120
ggtacgcacg cggccccctc gggccggtac ttcggcacgg ccgtggccgc gggccgcctc 180
ggcgactcgg cgtacaccgc gatcgccgac cgggagttca acatgatcac cccggagaac 240
gagatgaagt gggacgccgt cgagccgtcc cgcggccgtt tcgacttcgg tcccgcggac 300
cggatcgtcg agcgtgccct ggcacgcggc cagcgcgtcc gcggccacac cacggtctgg 360
cactcgcagc tcccctcctg ggtgggctcc atccgcgaca cgaagacgct gcgcggcgtg 420
atgaaccacc acatcaccac ccagatgacc cactacaagg gcaagatcta cgcctgggac 480
gtggtcaacg aggccttcgc cgatggcggc agcggccggc tccgcgactc ggtcttccag 540
aaggtgctgg gcgacggctt catcgaggag gcgttccgca ccgcccgcgc ggccgacccc 600
tcggccaagc tctgctacaa cgactacaac atcgagaact ggtcggacgc caagacccag 660
ggcgtctacc gcctggtgaa ggacttcacg tcccgaggcg ttcccatcga ctgcgtcggc 720
ttccagagcc acttcggcgc gggcggcccg ccggcgagct tcaagacgac cctggccaac 780
ttcgccgccc tgggcgtcga cgtccagatc accgagctgg acatcgccca ggcatcacct 840
gcccactacg cgagtgcggt cagcacctgt ctgtccgtgg cccggtgcac cggcatcacg 900
gtgtggggcg tccgtgacag cgactcctgg cggagcgccg aaagcccgct gctgttcgac 960
cggaacggca agcccaagcc cgcgtacgcc gccgtcatga acgccctcgg ctccggctcg 1020
ggtcccaccc cgagcaagcc ggccgacggt acggggagcg gtacggggga gatcaagggc 1080
gtggcctccg gccgctgtct ggacgtcccc gcctccacca ccgccaacgg cacccgggcg 1140
cagctgtggg actgtagcgg ccaggccaac cagcgctgga cccacaccgc cggcaagcag 1200
ctgaagatcc acggcgacaa gtgcctggac gccaagggca agggcaccgc caacggcacc 1260
gcggtggtcg tctgggactg caacggcggc accaaccagc agtggaacgt ccacaccgac 1320
ggcacgatca ccggcgtcca gtccggtctg tgcctcgatg ccgtcggcgc ggccaccgcc 1380
aacggcaccc cgatccagct gcacgcctgt gggggtgtcg gcaaccagaa gtggtccgcc 1440
ccgtccggat cgggcggcgg cacgtgcgtg cttccgtcga cgtacaagtg gagctcgacg 1500
ggtgccctgg cgcagcccaa ggccgggtgg gcctcgctga aggacttcac ccatgtggtg 1560
ctgggcggca agcacctggt ctacgggtcg aacttcaacg gatcgacgta cggctcgatg 1620
acgttcagcc ccttcaccac ctggtcggac atggcgtccg caggacagaa ggcgatgaag 1680
cagcccgcgg tcgcacccac cctgttctac ttcgcaccca agaagatctg ggtgctggcg 1740
taccagtggg gcaggaccgc gttctcctac cggacgtcga ccgaccccac caacccgaac 1800
ggctggtcgg cggagcagga gctcttctcc ggaagcatca ccggctcggg cacgggcccc 1860
atcgaccaga cgctcatcgg cgacgggacg aacatgtacc tgttcttcgc cggtgacaac 1920
ggcaagatct accgggccag catgccgatc gggaacttcc cgggcagctt cggctcctcg 1980
tacacgacgg tcatgagcga caccgcgaag aacctgttcg aggcgccgca ggtgtacaag 2040
gtcaaggacc agaaccagta cctcatgatc gtcgaggccc ggggcgcggg cgagcgccgc 2100
tacttccgct cgttcacggc ctccagcctg agcggtgcgt ggaccccgca ggccgcgacc 2160
gagagcaacc ccttcgcggg caaggccaac agcggcgcca cctggaccga cgacatcagc 2220
cacggtgatc tgatccgcac caaccccgat cagaccatga ccatcgaccc ctgcaacctt 2280
cagctgctct accagggcaa gtccccgcag gcgggcggac cctacgacca gctgccgtac 2340
cggccgggcg tcctcaccct gcagcgctga 2370
<210> 54
<211> 787
<212> PRT
<213> Bacteria
<220>
<221> SIGNAL
<222> (1)...(37)
<400> 54
Met Lys Gly Leu His Arg Leu Arg Arg Arg Arg Arg Thr Trp Val Ala
1 5 10 15
Gly Leu Ser Ala Ala Ala Val Val Ala Gly Ala Leu Thr Leu Leu Pro
20 25 30
Gly Ser Ala Gly Ala Ala Gly Leu Gly Thr His Ala Ala Pro Ser Gly
35 40 45
Arg Tyr Phe Gly Thr Ala Val Ala Ala Gly Arg Leu Gly Asp Ser Ala
50 55 60
Tyr Thr Ala Ile Ala Asp Arg Glu Phe Asn Met Ile Thr Pro Glu Asn
65 70 75 80
Glu Met Lys Trp Asp Ala Val Glu Pro Ser Arg Gly Arg Phe Asp Phe
85 90 95
Gly Pro Ala Asp Arg Ile Val Glu Arg Ala Leu Ala Arg Gly Gln Arg
100 105 110
Val Arg Gly His Thr Thr Val Trp His Ser Gln Leu Pro Ser Trp Val
115 120 125
Gly Ser Ile Arg Asp Thr Lys Thr Leu Arg Gly Val Met Asn His His
130 135 140
Ile Thr Thr Gln Met Thr His Tyr Lys Gly Lys Ile Tyr Ala Trp Asp
145 150 155 160
Val Val Asn Glu Ala Phe Ala Asp Gly Gly Ser Gly Arg Leu Arg Asp
165 170 175
Ser Val Phe Gln Lys Val Leu Gly Asp Gly Phe Ile Glu Glu Ala Phe
180 185 190
Arg Thr Ala Arg Ala Ala Asp Pro Ser Ala Lys Leu Cys Tyr Asn Asp
195 200 205
Tyr Asn Ile Glu Asn Trp Ser Asp Ala Lys Thr Gln Gly Val Tyr Arg
210 215 220
Leu Val Lys Asp Phe Thr Ser Arg Gly Val Pro Ile Asp Cys Val Gly
225 230 235 240
Phe Gln Ser His Phe Gly Ala Gly Gly Pro Pro Ala Ser Phe Lys Thr
245 250 255
Thr Leu Ala Asn Phe Ala Ala Leu Gly Val Asp Val Gln Ile Thr Glu
260 265 270
Leu Asp Ile Ala Gln Ala Ser Pro Ala His Tyr Ala Ser Ala Val Ser
275 280 285
Thr Cys Leu Ser Val Ala Arg Cys Thr Gly Ile Thr Val Trp Gly Val
290 295 300
Arg Asp Ser Asp Ser Trp Arg Ser Ala Glu Ser Pro Leu Leu Phe Asp
305 310 315 320
Arg Asn Gly Lys Pro Lys Pro Ala Tyr Ala Ala Val Met Asn Ala Leu
325 330 335
Gly Ser Gly Ser Gly Pro Thr Pro Ser Lys Pro Ala Asp Gly Thr Gly
340 345 350
Ser Gly Thr Gly Glu Ile Lys Gly Val Ala Ser Gly Arg Cys Leu Asp
355 360 365
Val Pro Ala Ser Thr Thr Ala Asn Gly Thr Arg Ala Gln Leu Trp Asp
370 375 380
Cys Ser Gly Gln Ala Asn Gln Arg Trp Thr His Thr Ala Gly Lys Gln
385 390 395 400
Leu Lys Ile His Gly Asp Lys Cys Leu Asp Ala Lys Gly Lys Gly Thr
405 410 415
Ala Asn Gly Thr Ala Val Val Val Trp Asp Cys Asn Gly Gly Thr Asn
420 425 430
Gln Gln Trp Asn Val His Thr Asp Gly Thr Ile Thr Gly Val Gln Ser
435 440 445
Gly Leu Cys Leu Asp Ala Val Gly Ala Ala Thr Ala Asn Gly Thr Pro
450 455 460
Ile Gln Leu His Ala Cys Gly Gly Val Gly Asn Gln Lys Trp Ser Ala
465 470 475 480
Pro Ser Gly Ser Gly Gly Gly Thr Cys Val Leu Pro Ser Thr Tyr Lys
485 490 495
Trp Ser Ser Thr Gly Ala Leu Ala Gln Pro Lys Ala Gly Trp Ala Ser
500 505 510
Leu Lys Asp Phe Thr His Val Val Leu Gly Gly Lys His Leu Val Tyr
515 520 525
Gly Ser Asn Phe Asn Gly Ser Thr Tyr Gly Ser Met Thr Phe Ser Pro
530 535 540
Phe Thr Thr Trp Ser Asp Met Ala Ser Ala Gly Gln Lys Ala Met Lys
545 550 555 560
Gln Pro Ala Val Ala Pro Thr Leu Phe Tyr Phe Ala Pro Lys Lys Ile
565 570 575
Trp Val Leu Ala Tyr Gln Trp Gly Arg Thr Ala Phe Ser Tyr Arg Thr
580 585 590
Ser Thr Asp Pro Thr Asn Pro Asn Gly Trp Ser Ala Glu Gln Glu Leu
595 600 605
Phe Ser Gly Ser Ile Thr Gly Ser Gly Thr Gly Pro Ile Asp Gln Thr
610 615 620
Leu Ile Gly Asp Gly Thr Asn Met Tyr Leu Phe Phe Ala Gly Asp Asn
625 630 635 640
Gly Lys Ile Tyr Arg Ala Ser Met Pro Ile Gly Asn Phe Pro Gly Ser
645 650 655
Phe Gly Ser Ser Tyr Thr Thr Val Met Ser Asp Thr Ala Lys Asn Leu
660 665 670
Phe Glu Ala Pro Gln Val Tyr Lys Val Lys Asp Gln Asn Gln Tyr Leu
675 680 685
Met Ile Val Glu Ala Arg Gly Ala Gly Glu Arg Arg Tyr Phe Arg Ser
690 695 700
Phe Thr Ala Ser Ser Leu Ser Gly Ala Trp Thr Pro Gln Ala Ala Thr
705 710 715 720
Glu Ser Asn Pro Phe Ala Gly Lys Ala Asn Ser Gly Ala Thr Trp Thr
725 730 735
Asp Asp Ile Ser His Gly Asp Leu Ile Arg Thr Asn Pro Asp Gln Thr
740 745 750
Met Thr Ile Asp Pro Cys Asn Leu Gln Leu Leu Tyr Gln Gly Lys Ser
755 760 765
Pro Gln Ala Gly Gly Pro Tyr Asp Gln Leu Pro Tyr Arg Pro Gly Val
770 775 780
Leu Thr Leu
785
<210> 55
<211> 1143
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 55
atgaaaaaaa cgattgcaca tttcacctta tggatagcgt tttttctctt cacttcctgt 60
gctgttacgg cgcagaagaa tactaagaat gcaagagtaa agcccactac tctaaaagag 120
gcttaccaag gtaaattcta tatcggtaca gcgatgaatc tgagacagat tcacggagat 180
gatccccagt ctgaaaatat tatcaaaaaa cagttcaatt ccattgttgc tgaaaactgc 240
atgaagagta tgtatcttca gccggaggaa ggaaaatttt tcttcgatga tgcggataag 300
tttgtggatt ttggtcttca gaacaatatg tttattatcg ggcattgtct gatttggcat 360
tcgcaggcgc caaaatggtt tttcaccgac gagaatggga aaacggtctc cccagaagtt 420
cttaaacaaa ggatgaaagc tcatatcacc gccgtcgttt ctcgctacaa agggaaaatc 480
aaaggatggg atgtggtgaa cgaagccatt atggaagatg gttcttaccg caaaagcaaa 540
ttttacgaga ttttgggaga agaatttatt ccgttggcat ttcagtatgc gcatgaagca 600
gatcctgatg cagaactcta ttacaacgat tataacgaat ggtatcccgg aaaaagagct 660
acggtgacca aaataatccg agatttcaaa tctagaggaa tccgcattga tgccattgga 720
atgcaggctc atttcgggat ggattcaccc actatagaag agtatgaaca aactattcag 780
ggctatataa aagaaggcgt gaaagtcaat attacggaac tcgatttgag tccacttcct 840
tccccttggg gaacttccgc caacgttgcc gatacgcagc agtatcagga aaaaatgaat 900
ccttacacca aaggacttcc cacagaggtg gaaaaagctt gggaaaaccg ttatctcgat 960
tttttcaaac tattcctaaa atatcatcag catatcgagc gtgttacgtt ttggggcgtt 1020
agcgatatcg attcctggaa gaacgatttt ccagtgagag gacgtaccga ttatccgtta 1080
ccctttgacc gacagtatca ggcaaaacct ttggttcaga aattaataga cttaacgaaa 1140
tag 1143
<210> 56
<211> 380
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(24)
<400> 56
Met Lys Lys Thr Ile Ala His Phe Thr Leu Trp Ile Ala Phe Phe Leu
1 5 10 15
Phe Thr Ser Cys Ala Val Thr Ala Gln Lys Asn Thr Lys Asn Ala Arg
20 25 30
Val Lys Pro Thr Thr Leu Lys Glu Ala Tyr Gln Gly Lys Phe Tyr Ile
35 40 45
Gly Thr Ala Met Asn Leu Arg Gln Ile His Gly Asp Asp Pro Gln Ser
50 55 60
Glu Asn Ile Ile Lys Lys Gln Phe Asn Ser Ile Val Ala Glu Asn Cys
65 70 75 80
Met Lys Ser Met Tyr Leu Gln Pro Glu Glu Gly Lys Phe Phe Phe Asp
85 90 95
Asp Ala Asp Lys Phe Val Asp Phe Gly Leu Gln Asn Asn Met Phe Ile
100 105 110
Ile Gly His Cys Leu Ile Trp His Ser Gln Ala Pro Lys Trp Phe Phe
115 120 125
Thr Asp Glu Asn Gly Lys Thr Val Ser Pro Glu Val Leu Lys Gln Arg
130 135 140
Met Lys Ala His Ile Thr Ala Val Val Ser Arg Tyr Lys Gly Lys Ile
145 150 155 160
Lys Gly Trp Asp Val Val Asn Glu Ala Ile Met Glu Asp Gly Ser Tyr
165 170 175
Arg Lys Ser Lys Phe Tyr Glu Ile Leu Gly Glu Glu Phe Ile Pro Leu
180 185 190
Ala Phe Gln Tyr Ala His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr
195 200 205
Asn Asp Tyr Asn Glu Trp Tyr Pro Gly Lys Arg Ala Thr Val Thr Lys
210 215 220
Ile Ile Arg Asp Phe Lys Ser Arg Gly Ile Arg Ile Asp Ala Ile Gly
225 230 235 240
Met Gln Ala His Phe Gly Met Asp Ser Pro Thr Ile Glu Glu Tyr Glu
245 250 255
Gln Thr Ile Gln Gly Tyr Ile Lys Glu Gly Val Lys Val Asn Ile Thr
260 265 270
Glu Leu Asp Leu Ser Pro Leu Pro Ser Pro Trp Gly Thr Ser Ala Asn
275 280 285
Val Ala Asp Thr Gln Gln Tyr Gln Glu Lys Met Asn Pro Tyr Thr Lys
290 295 300
Gly Leu Pro Thr Glu Val Glu Lys Ala Trp Glu Asn Arg Tyr Leu Asp
305 310 315 320
Phe Phe Lys Leu Phe Leu Lys Tyr His Gln His Ile Glu Arg Val Thr
325 330 335
Phe Trp Gly Val Ser Asp Ile Asp Ser Trp Lys Asn Asp Phe Pro Val
340 345 350
Arg Gly Arg Thr Asp Tyr Pro Leu Pro Phe Asp Arg Gln Tyr Gln Ala
355 360 365
Lys Pro Leu Val Gln Lys Leu Ile Asp Leu Thr Lys
370 375 380
<210> 57
<211> 1578
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 57
atgaaaagaa tgatcggttt gctgctggcc atttgcctgg tgatgacgct ggctggggcc 60
tgggctgcct cggatacgct ggtctatgca tccagtttcg cagcgggcga tgacgactgg 120
tttgcaaggg gcgcttcccg ggtttaccat accacggagg cgacgctgcg gacggaaggc 180
cggagcgaca actggaattc tccgggacgc tattttgaac tggtgccgga taatgaatat 240
acgctgagcg tggaggtcta ccaggacgga gcggacagcg cgaacttcat gatttccctg 300
gaaaaggttg cggatgggat caccggatgg gaaaacctgg tgcggggaac cgtgaaaaag 360
ggtgaatgga cgacgctgtc cggaacctat acttttgcag actatgaaag ctatgtgctg 420
tatgtggaga cctccgacgc gccgacgctg gactttgaga tccggaattt ccgggtggaa 480
agccccaatg ggatcccgga gccgaaggct accgaggcgc cggcagtggt ttcggaagcc 540
acggatattc cgagcctgaa ggacgcttac gcggattact tcgactttgg cgcggccgtg 600
ccgcagtctg ctttcaccag cagagataat attcagctga tggagctgat gaaaaaccag 660
ttcagcatcc tgacgcctga aaatgagctg aagccggaca gtgtattgga tgtaagcgcc 720
agcaagcagc tggccaaaga ggatgaaacc gcggtagtgg tgcggtttaa cggggcaaag 780
tcattgctgc ggtttgccca gcaaaacggc atcaaggtgc acgggcatgt gctggtctgg 840
cacagccaga cgccggaagc ctttttccat gaaggatatg atcccaagaa cccgctggtg 900
agccgggaag tgatgctggg acggctggaa aactatatcc gggaagtgct gacccagacg 960
gaagaactgt atccgggcgt gatcgtcagc tgggacgtgg tgaacgaagc gattgacgac 1020
ggaaccaact ggatccggaa gggatcgggc tggtaccgga ccatcgggga agactatgtg 1080
gagaaggctt ttgagtttgc ccggaagtat gccccggaag gcgtgctgct gtactacaac 1140
gattacaaca cggcatacgc cggaaaactg aatgggatta tcaaactgat caaacccatg 1200
atcgagcagg gaacgatcga cggatacggc ttccagatgc accatacgac cgggcagccc 1260
agcaaccaga tgatcaccac ggcggtggag aagatcgcgg ccctgggaat caagctgcgg 1320
gtcagcgaga tggacatcgg gattacaaag tatacagaga cgagcctgca ggcacaaaag 1380
gacaagtaca aggcgatgat ggaactgatg ctgcggttcg cggaccagac ggaagcagtg 1440
caggtctggg ggattacgga tacgatgagc tggcggagct ccagctatcc gctgctgttt 1500
gaccggagca ggaatccgaa gccggcgttc tatggcgtga ttgaagcggt tgaagactgg 1560
acagggaaaa gtgaatag 1578
<210> 58
<211> 525
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(22)
<400> 58
Met Lys Arg Met Ile Gly Leu Leu Leu Ala Ile Cys Leu Val Met Thr
1 5 10 15
Leu Ala Gly Ala Trp Ala Ala Ser Asp Thr Leu Val Tyr Ala Ser Ser
20 25 30
Phe Ala Ala Gly Asp Asp Asp Trp Phe Ala Arg Gly Ala Ser Arg Val
35 40 45
Tyr His Thr Thr Glu Ala Thr Leu Arg Thr Glu Gly Arg Ser Asp Asn
50 55 60
Trp Asn Ser Pro Gly Arg Tyr Phe Glu Leu Val Pro Asp Asn Glu Tyr
65 70 75 80
Thr Leu Ser Val Glu Val Tyr Gln Asp Gly Ala Asp Ser Ala Asn Phe
85 90 95
Met Ile Ser Leu Glu Lys Val Ala Asp Gly Ile Thr Gly Trp Glu Asn
100 105 110
Leu Val Arg Gly Thr Val Lys Lys Gly Glu Trp Thr Thr Leu Ser Gly
115 120 125
Thr Tyr Thr Phe Ala Asp Tyr Glu Ser Tyr Val Leu Tyr Val Glu Thr
130 135 140
Ser Asp Ala Pro Thr Leu Asp Phe Glu Ile Arg Asn Phe Arg Val Glu
145 150 155 160
Ser Pro Asn Gly Ile Pro Glu Pro Lys Ala Thr Glu Ala Pro Ala Val
165 170 175
Val Ser Glu Ala Thr Asp Ile Pro Ser Leu Lys Asp Ala Tyr Ala Asp
180 185 190
Tyr Phe Asp Phe Gly Ala Ala Val Pro Gln Ser Ala Phe Thr Ser Arg
195 200 205
Asp Asn Ile Gln Leu Met Glu Leu Met Lys Asn Gln Phe Ser Ile Leu
210 215 220
Thr Pro Glu Asn Glu Leu Lys Pro Asp Ser Val Leu Asp Val Ser Ala
225 230 235 240
Ser Lys Gln Leu Ala Lys Glu Asp Glu Thr Ala Val Val Val Arg Phe
245 250 255
Asn Gly Ala Lys Ser Leu Leu Arg Phe Ala Gln Gln Asn Gly Ile Lys
260 265 270
Val His Gly His Val Leu Val Trp His Ser Gln Thr Pro Glu Ala Phe
275 280 285
Phe His Glu Gly Tyr Asp Pro Lys Asn Pro Leu Val Ser Arg Glu Val
290 295 300
Met Leu Gly Arg Leu Glu Asn Tyr Ile Arg Glu Val Leu Thr Gln Thr
305 310 315 320
Glu Glu Leu Tyr Pro Gly Val Ile Val Ser Trp Asp Val Val Asn Glu
325 330 335
Ala Ile Asp Asp Gly Thr Asn Trp Ile Arg Lys Gly Ser Gly Trp Tyr
340 345 350
Arg Thr Ile Gly Glu Asp Tyr Val Glu Lys Ala Phe Glu Phe Ala Arg
355 360 365
Lys Tyr Ala Pro Glu Gly Val Leu Leu Tyr Tyr Asn Asp Tyr Asn Thr
370 375 380
Ala Tyr Ala Gly Lys Leu Asn Gly Ile Ile Lys Leu Ile Lys Pro Met
385 390 395 400
Ile Glu Gln Gly Thr Ile Asp Gly Tyr Gly Phe Gln Met His His Thr
405 410 415
Thr Gly Gln Pro Ser Asn Gln Met Ile Thr Thr Ala Val Glu Lys Ile
420 425 430
Ala Ala Leu Gly Ile Lys Leu Arg Val Ser Glu Met Asp Ile Gly Ile
435 440 445
Thr Lys Tyr Thr Glu Thr Ser Leu Gln Ala Gln Lys Asp Lys Tyr Lys
450 455 460
Ala Met Met Glu Leu Met Leu Arg Phe Ala Asp Gln Thr Glu Ala Val
465 470 475 480
Gln Val Trp Gly Ile Thr Asp Thr Met Ser Trp Arg Ser Ser Ser Tyr
485 490 495
Pro Leu Leu Phe Asp Arg Ser Arg Asn Pro Lys Pro Ala Phe Tyr Gly
500 505 510
Val Ile Glu Ala Val Glu Asp Trp Thr Gly Lys Ser Glu
515 520 525
<210> 59
<211> 1104
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 59
atgcttgcca gtagtgccgg tttggtagca tcccaactca agctgtccgc gttagctgca 60
gctaaaaatg ctggattaaa agatgtatat aaggatcgct ttctgattgg tgcagcaatt 120
aatacctcga ttgcgagcgg ccagcaacct gatattacag aaattatcaa gcgtgatttt 180
tcgtcgttaa cacctgaaaa tgcaatgaag tgggaatctg tcaggactgc tgatggcgga 240
tggaaatggg cagatgccga tcaattcgtt acgtttgcaa cagaacacaa aatacacgct 300
gttggccaca cccttgcctg gcatagccag attcccgatt ccgtattcaa aaatgaaaaa 360
ggcgaataca taaaatccac cgagctatca aaaaaaatgg aagaacatat cactacgatt 420
gtaggtagat ataaaggcaa actcgatgcc tgggatgtag ttaatgaggc tgttggtgat 480
gataatcaaa tgcgcaaaag ccattattac aatattctcg gcgaagattt tattgataag 540
gcatttcacc ttgcgcatga ggtcgatccc aaagcgcatt taatgtataa cgactacaac 600
attgaaaaag atggcaagcg tgaagctacc cttgaaatgt taaagcgttt acaaaaacgc 660
ggtgtaccga ttcatgggct cggcatccag ggacatattg ccgttgatgg ccccagcatt 720
gcggatattg aaaaaagtat tttggcttat gcggatttgg gtttgcgtgt acatttcacc 780
gagttggata ttgatgtatt gccgcaaatc tggaacttac cggttgcaga aatttctaca 840
cgcttcgaat acaaacctga gcgagatcct ttcaaaaatg gtttatcaaa agaaatgaac 900
gataaactca gtgcacgcta tgaagaatta ttcacattat ttattaaaca caaagataaa 960
attgatcgta ttactttgtg gggtgtcagc gatgatgcaa cctggctaaa tgatttcccc 1020
atcaaaggca gaaccagtta tccattattg tttgatcgca agcatcaacc aaaagatgct 1080
tattataaca ttctggcgtt gtga 1104
<210> 60
<211> 367
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(21)
<400> 60
Met Leu Ala Ser Ser Ala Gly Leu Val Ala Ser Gln Leu Lys Leu Ser
1 5 10 15
Ala Leu Ala Ala Ala Lys Asn Ala Gly Leu Lys Asp Val Tyr Lys Asp
20 25 30
Arg Phe Leu Ile Gly Ala Ala Ile Asn Thr Ser Ile Ala Ser Gly Gln
35 40 45
Gln Pro Asp Ile Thr Glu Ile Ile Lys Arg Asp Phe Ser Ser Leu Thr
50 55 60
Pro Glu Asn Ala Met Lys Trp Glu Ser Val Arg Thr Ala Asp Gly Gly
65 70 75 80
Trp Lys Trp Ala Asp Ala Asp Gln Phe Val Thr Phe Ala Thr Glu His
85 90 95
Lys Ile His Ala Val Gly His Thr Leu Ala Trp His Ser Gln Ile Pro
100 105 110
Asp Ser Val Phe Lys Asn Glu Lys Gly Glu Tyr Ile Lys Ser Thr Glu
115 120 125
Leu Ser Lys Lys Met Glu Glu His Ile Thr Thr Ile Val Gly Arg Tyr
130 135 140
Lys Gly Lys Leu Asp Ala Trp Asp Val Val Asn Glu Ala Val Gly Asp
145 150 155 160
Asp Asn Gln Met Arg Lys Ser His Tyr Tyr Asn Ile Leu Gly Glu Asp
165 170 175
Phe Ile Asp Lys Ala Phe His Leu Ala His Glu Val Asp Pro Lys Ala
180 185 190
His Leu Met Tyr Asn Asp Tyr Asn Ile Glu Lys Asp Gly Lys Arg Glu
195 200 205
Ala Thr Leu Glu Met Leu Lys Arg Leu Gln Lys Arg Gly Val Pro Ile
210 215 220
His Gly Leu Gly Ile Gln Gly His Ile Ala Val Asp Gly Pro Ser Ile
225 230 235 240
Ala Asp Ile Glu Lys Ser Ile Leu Ala Tyr Ala Asp Leu Gly Leu Arg
245 250 255
Val His Phe Thr Glu Leu Asp Ile Asp Val Leu Pro Gln Ile Trp Asn
260 265 270
Leu Pro Val Ala Glu Ile Ser Thr Arg Phe Glu Tyr Lys Pro Glu Arg
275 280 285
Asp Pro Phe Lys Asn Gly Leu Ser Lys Glu Met Asn Asp Lys Leu Ser
290 295 300
Ala Arg Tyr Glu Glu Leu Phe Thr Leu Phe Ile Lys His Lys Asp Lys
305 310 315 320
Ile Asp Arg Ile Thr Leu Trp Gly Val Ser Asp Asp Ala Thr Trp Leu
325 330 335
Asn Asp Phe Pro Ile Lys Gly Arg Thr Ser Tyr Pro Leu Leu Phe Asp
340 345 350
Arg Lys His Gln Pro Lys Asp Ala Tyr Tyr Asn Ile Leu Ala Leu
355 360 365
<210> 61
<211> 1041
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 61
atgagaagaa gcatggaaag gctgcccaag ctccatgaag cttacggcaa tagtttcaag 60
atcggcgctg ccgtgaatcc aattacgatg gtgacccaaa aggaattgtt gtcacaccac 120
ttcaacagcg ttacggcaga aaatgaaatg aaattcgagc gattgcaccc atcggaagag 180
gtgtatacat tcgagcaagc cgaccagatc gtatcgtttg ccaaatcgaa cggaatgtcg 240
gtgagaggac ataccctcgt atggcataat cagacgccgg aatgggtgtt tcaagacagt 300
tccggtggga cagccggccg cgagctgctg ctcgctcgga tgaaatcgca catcgatgag 360
gtcgttggcc gttatcgcgg agatatctat gcttgggatg tcgtaaacga agccattgcc 420
gacagtggaa gcgatctgct tcgttcctcc ccgtggcttg cgtcgatcgg ggaggatttt 480
atcgccaagg ctttcgaata tgcgcacgaa gcagacccgc aagcgctgct gttttataac 540
gattacaacg aatccgtgcc cgagaagcgg gagaagattt acacgctcct taaatcgtta 600
aaggagcagg atgtgccgat tcacggcgtc gggcttcagg cccattggaa tttggagttt 660
ccatcgcttg acgatatccg cagggcaatc gaaaggtatg caagccttgg catgatcttg 720
catatcacgg agcttgacgt atccgtattc gcgcatgagg ataagcggac cgatctggcg 780
gcgccgaccg aagaaatgct tgagcgccag gcggagcgtt acggtcaatt gttccgtctg 840
cttaaagagt acagcggcag cgtcacttcc gtgaccttct ggggagcggc ggacgattat 900
acctggctgg atcattttcc ggtaaggggc cgcaaaaatt ggccgttcgt cttcgacgag 960
aaccatcttc cgaaggaatc ctattggaac ctgttgaagg aagccaatcc cgaaagaaca 1020
ttccaagaga tacgttcgta a 1041
<210> 62
<211> 346
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 62
Met Arg Arg Ser Met Glu Arg Leu Pro Lys Leu His Glu Ala Tyr Gly
1 5 10 15
Asn Ser Phe Lys Ile Gly Ala Ala Val Asn Pro Ile Thr Met Val Thr
20 25 30
Gln Lys Glu Leu Leu Ser His His Phe Asn Ser Val Thr Ala Glu Asn
35 40 45
Glu Met Lys Phe Glu Arg Leu His Pro Ser Glu Glu Val Tyr Thr Phe
50 55 60
Glu Gln Ala Asp Gln Ile Val Ser Phe Ala Lys Ser Asn Gly Met Ser
65 70 75 80
Val Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro Glu Trp Val
85 90 95
Phe Gln Asp Ser Ser Gly Gly Thr Ala Gly Arg Glu Leu Leu Leu Ala
100 105 110
Arg Met Lys Ser His Ile Asp Glu Val Val Gly Arg Tyr Arg Gly Asp
115 120 125
Ile Tyr Ala Trp Asp Val Val Asn Glu Ala Ile Ala Asp Ser Gly Ser
130 135 140
Asp Leu Leu Arg Ser Ser Pro Trp Leu Ala Ser Ile Gly Glu Asp Phe
145 150 155 160
Ile Ala Lys Ala Phe Glu Tyr Ala His Glu Ala Asp Pro Gln Ala Leu
165 170 175
Leu Phe Tyr Asn Asp Tyr Asn Glu Ser Val Pro Glu Lys Arg Glu Lys
180 185 190
Ile Tyr Thr Leu Leu Lys Ser Leu Lys Glu Gln Asp Val Pro Ile His
195 200 205
Gly Val Gly Leu Gln Ala His Trp Asn Leu Glu Phe Pro Ser Leu Asp
210 215 220
Asp Ile Arg Arg Ala Ile Glu Arg Tyr Ala Ser Leu Gly Met Ile Leu
225 230 235 240
His Ile Thr Glu Leu Asp Val Ser Val Phe Ala His Glu Asp Lys Arg
245 250 255
Thr Asp Leu Ala Ala Pro Thr Glu Glu Met Leu Glu Arg Gln Ala Glu
260 265 270
Arg Tyr Gly Gln Leu Phe Arg Leu Leu Lys Glu Tyr Ser Gly Ser Val
275 280 285
Thr Ser Val Thr Phe Trp Gly Ala Ala Asp Asp Tyr Thr Trp Leu Asp
290 295 300
His Phe Pro Val Arg Gly Arg Lys Asn Trp Pro Phe Val Phe Asp Glu
305 310 315 320
Asn His Leu Pro Lys Glu Ser Tyr Trp Asn Leu Leu Lys Glu Ala Asn
325 330 335
Pro Glu Arg Thr Phe Gln Glu Ile Arg Ser
340 345
<210> 63
<211> 1110
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 63
atgaaacgaa ttttaattgg tttggcggct cttaccgctt ccgggctgtc ggcgcagaaa 60
tccgacggta ctttaaaaaa agcatttcag gataaattct atatcgggac tgcgatgagt 120
cttcctcaga ttgatgggac agataaaaga gcggtagcca ttatcagaaa tcagttcagt 180
tctattgttg ctgaaaactg tatgaaatcg atgtttctgc aacctcagga aggaaagttc 240
ttctttgatg acgctgataa atttgttgat ttcgggatga aaaacaatat gttcgtcatc 300
ggacatacgc taatctggca ttcccagctt ccaaaatggt tttttacaga taaaaatgga 360
aaagatgttt ctccggaagt attgaaacag cgcatgaaaa accacattac aaccgtagtt 420
tcccgttaca aaggaaaagt aaaaggatgg gatgtggtga atgaagccat tcttgaagac 480
ggaacctata gaaaaagtaa attttacgaa attctgggtg aagattttat tcctttggcg 540
tttcagtatg cacaggaagc cgatcccaat gcagaattat attacaacga ttataatgaa 600
tggtatccgg aaaaggtaaa agcagtcatt acaatggttg aaaagcttaa atcaagagga 660
atccgtattg atggagtagg aatgcaggcc catgtcggaa tggatatccc ttccatcaat 720
gaatatgaaa aagcaattct ggcgtattcc aatgccggag ttaaagttaa tattacggag 780
ctggaaatta gtgcgctgcc ttctccgtgg ggaagctctg ccaatgtttc agataccgtt 840
gcctatcaga aagaaatgaa tccttacacc aaagggcttc ccaatgaagt agaagcgaaa 900
tgggaaaaac gttaccttga tttctttagc ttgtttttaa aacataaaga taaaataaga 960
agggtgacct tatggggagt tactgataag cagtcctgga aaaacgattt tccggtaaaa 1020
ggaagaacag attacccgtt gctgtttgac aggaaagatc aggagaaacc tgtagtacaa 1080
aaaataataa aattggcaga gaaaaattaa 1110
<210> 64
<211> 369
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(20)
<400> 64
Met Lys Arg Ile Leu Ile Gly Leu Ala Ala Leu Thr Ala Ser Gly Leu
1 5 10 15
Ser Ala Gln Lys Ser Asp Gly Thr Leu Lys Lys Ala Phe Gln Asp Lys
20 25 30
Phe Tyr Ile Gly Thr Ala Met Ser Leu Pro Gln Ile Asp Gly Thr Asp
35 40 45
Lys Arg Ala Val Ala Ile Ile Arg Asn Gln Phe Ser Ser Ile Val Ala
50 55 60
Glu Asn Cys Met Lys Ser Met Phe Leu Gln Pro Gln Glu Gly Lys Phe
65 70 75 80
Phe Phe Asp Asp Ala Asp Lys Phe Val Asp Phe Gly Met Lys Asn Asn
85 90 95
Met Phe Val Ile Gly His Thr Leu Ile Trp His Ser Gln Leu Pro Lys
100 105 110
Trp Phe Phe Thr Asp Lys Asn Gly Lys Asp Val Ser Pro Glu Val Leu
115 120 125
Lys Gln Arg Met Lys Asn His Ile Thr Thr Val Val Ser Arg Tyr Lys
130 135 140
Gly Lys Val Lys Gly Trp Asp Val Val Asn Glu Ala Ile Leu Glu Asp
145 150 155 160
Gly Thr Tyr Arg Lys Ser Lys Phe Tyr Glu Ile Leu Gly Glu Asp Phe
165 170 175
Ile Pro Leu Ala Phe Gln Tyr Ala Gln Glu Ala Asp Pro Asn Ala Glu
180 185 190
Leu Tyr Tyr Asn Asp Tyr Asn Glu Trp Tyr Pro Glu Lys Val Lys Ala
195 200 205
Val Ile Thr Met Val Glu Lys Leu Lys Ser Arg Gly Ile Arg Ile Asp
210 215 220
Gly Val Gly Met Gln Ala His Val Gly Met Asp Ile Pro Ser Ile Asn
225 230 235 240
Glu Tyr Glu Lys Ala Ile Leu Ala Tyr Ser Asn Ala Gly Val Lys Val
245 250 255
Asn Ile Thr Glu Leu Glu Ile Ser Ala Leu Pro Ser Pro Trp Gly Ser
260 265 270
Ser Ala Asn Val Ser Asp Thr Val Ala Tyr Gln Lys Glu Met Asn Pro
275 280 285
Tyr Thr Lys Gly Leu Pro Asn Glu Val Glu Ala Lys Trp Glu Lys Arg
290 295 300
Tyr Leu Asp Phe Phe Ser Leu Phe Leu Lys His Lys Asp Lys Ile Arg
305 310 315 320
Arg Val Thr Leu Trp Gly Val Thr Asp Lys Gln Ser Trp Lys Asn Asp
325 330 335
Phe Pro Val Lys Gly Arg Thr Asp Tyr Pro Leu Leu Phe Asp Arg Lys
340 345 350
Asp Gln Glu Lys Pro Val Val Gln Lys Ile Ile Lys Leu Ala Glu Lys
355 360 365
Asn
<210> 65
<211> 1557
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 65
atgaaaagaa tcggactgtt gctgctggct gtgatcatgc ttgtgggctg tgtatattcc 60
gcggcggcgg aggatacgct ggtttatgct tccacttttg tggccggaac ggacggatgg 120
tacgcccgcg gagcgcagaa agtataccgc acaaccgagg agacactgcg gacggaaggc 180
cggaccagcg actggcattc cccgggccgt gattttgacc tggtggaagg cggcgtctat 240
gtcctgagcg tggaagtgtt ccaggacgaa gcggacaacg ccagcttcat gatttccatc 300
gcccacagca aggacggtac ggaaacctat gaaaacctgg ctcgcggaac cgccaaacgc 360
ggcgagtggg tcaccctgac cggaacatat accgccggca attttgaccg gaacgtcctg 420
tatgtggaaa cgaccggatc gccggaactg agctatgaaa tccggaattt ccgggttgaa 480
gcgccgaacg gagttccgga gccgaaggct acggagcccc cgatggtgat tgaggcggtg 540
gagaacctcc cgggcctgaa gaacgcgtat gcgggaaaat ttgatttcgg cgcggcggtt 600
ccgggatacg ctttcggcga tccgggcctg aaacagctga tgactgagca gttcagcatc 660
ctgacgcccg aaaacgaact gaaaccggac gctgtgctgg acgtggcggc gagcaagcgg 720
ctggcccagg aggatgaaac ggcggtggcg gttcattttg acggcgccat tccgctgctg 780
aactttgccc gggacaacgg catcagggtg cacggacatg tgctgatctg gcacagccag 840
acgccggaag cgttcttcca tgagggctat gacacctcca agcccctggt cagccgggaa 900
gtgatgctgg gccggatgga aaactatatc cgcgaggtgc tgacctggac gaacgagaat 960
tatccgggcg tgatcgtatc ctgggacgtg gtgaacgaag ccattgatga cggaacgaac 1020
tggctgcgga attccaactg gtacaagacg gtgggcggcg actttgtgaa ccgggctttt 1080
gaatttgccc gcatgtacgc ggcggacggc gtcctcctgt attacaatga ttacaatacc 1140
gcctatccgg ccaaacggaa gggaatcatc aagctgctgg gccagctgat tgaggaaggc 1200
aatattgacg gatacggctt ccagatgcat cacagcaccg gcgagccttc catggagatg 1260
atcaccgctt cggtggagga aatcgccgcg ctgggaataa aactgcgggt cagcgagctg 1320
gatgtgggca tgggcagcag catgacggaa gaagccctga tgaaacagaa ggacaaatac 1380
aaggcggtca tggaactgat gctgcggttt gccgaccaga cggaagcggt gcaggtatgg 1440
ggactgacgg acaatatgag ctggcggacc ggccagaatc cgctgctgtt tgaccggaac 1500
cggaacccga agccggcctt cttcggcgtc ctggaagcgg cggaagaaag caaataa 1557
<210> 66
<211> 518
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(22)
<400> 66
Met Lys Arg Ile Gly Leu Leu Leu Leu Ala Val Ile Met Leu Val Gly
1 5 10 15
Cys Val Tyr Ser Ala Ala Ala Glu Asp Thr Leu Val Tyr Ala Ser Thr
20 25 30
Phe Val Ala Gly Thr Asp Gly Trp Tyr Ala Arg Gly Ala Gln Lys Val
35 40 45
Tyr Arg Thr Thr Glu Glu Thr Leu Arg Thr Glu Gly Arg Thr Ser Asp
50 55 60
Trp His Ser Pro Gly Arg Asp Phe Asp Leu Val Glu Gly Gly Val Tyr
65 70 75 80
Val Leu Ser Val Glu Val Phe Gln Asp Glu Ala Asp Asn Ala Ser Phe
85 90 95
Met Ile Ser Ile Ala His Ser Lys Asp Gly Thr Glu Thr Tyr Glu Asn
100 105 110
Leu Ala Arg Gly Thr Ala Lys Arg Gly Glu Trp Val Thr Leu Thr Gly
115 120 125
Thr Tyr Thr Ala Gly Asn Phe Asp Arg Asn Val Leu Tyr Val Glu Thr
130 135 140
Thr Gly Ser Pro Glu Leu Ser Tyr Glu Ile Arg Asn Phe Arg Val Glu
145 150 155 160
Ala Pro Asn Gly Val Pro Glu Pro Lys Ala Thr Glu Pro Pro Met Val
165 170 175
Ile Glu Ala Val Glu Asn Leu Pro Gly Leu Lys Asn Ala Tyr Ala Gly
180 185 190
Lys Phe Asp Phe Gly Ala Ala Val Pro Gly Tyr Ala Phe Gly Asp Pro
195 200 205
Gly Leu Lys Gln Leu Met Thr Glu Gln Phe Ser Ile Leu Thr Pro Glu
210 215 220
Asn Glu Leu Lys Pro Asp Ala Val Leu Asp Val Ala Ala Ser Lys Arg
225 230 235 240
Leu Ala Gln Glu Asp Glu Thr Ala Val Ala Val His Phe Asp Gly Ala
245 250 255
Ile Pro Leu Leu Asn Phe Ala Arg Asp Asn Gly Ile Arg Val His Gly
260 265 270
His Val Leu Ile Trp His Ser Gln Thr Pro Glu Ala Phe Phe His Glu
275 280 285
Gly Tyr Asp Thr Ser Lys Pro Leu Val Ser Arg Glu Val Met Leu Gly
290 295 300
Arg Met Glu Asn Tyr Ile Arg Glu Val Leu Thr Trp Thr Asn Glu Asn
305 310 315 320
Tyr Pro Gly Val Ile Val Ser Trp Asp Val Val Asn Glu Ala Ile Asp
325 330 335
Asp Gly Thr Asn Trp Leu Arg Asn Ser Asn Trp Tyr Lys Thr Val Gly
340 345 350
Gly Asp Phe Val Asn Arg Ala Phe Glu Phe Ala Arg Met Tyr Ala Ala
355 360 365
Asp Gly Val Leu Leu Tyr Tyr Asn Asp Tyr Asn Thr Ala Tyr Pro Ala
370 375 380
Lys Arg Lys Gly Ile Ile Lys Leu Leu Gly Gln Leu Ile Glu Glu Gly
385 390 395 400
Asn Ile Asp Gly Tyr Gly Phe Gln Met His His Ser Thr Gly Glu Pro
405 410 415
Ser Met Glu Met Ile Thr Ala Ser Val Glu Glu Ile Ala Ala Leu Gly
420 425 430
Ile Lys Leu Arg Val Ser Glu Leu Asp Val Gly Met Gly Ser Ser Met
435 440 445
Thr Glu Glu Ala Leu Met Lys Gln Lys Asp Lys Tyr Lys Ala Val Met
450 455 460
Glu Leu Met Leu Arg Phe Ala Asp Gln Thr Glu Ala Val Gln Val Trp
465 470 475 480
Gly Leu Thr Asp Asn Met Ser Trp Arg Thr Gly Gln Asn Pro Leu Leu
485 490 495
Phe Asp Arg Asn Arg Asn Pro Lys Pro Ala Phe Phe Gly Val Leu Glu
500 505 510
Ala Ala Glu Glu Ser Lys
515
<210> 67
<211> 1224
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 67
atgcggaacg tcgtgcgtaa accattgaca atcggactcg ctttaacact attattgccc 60
atgggaatga cggcaacatc agcgaagaat gcagattcct atgcgaaaaa acctcacatc 120
agcgcattga atgccccaca attggatcaa cgctacaaaa acgagttcac gattggtgcg 180
gcagtagaac cttatcaact acaaaatgaa aaagacgtac aaatgctaaa gcgccacttc 240
aacagcattg ttgccgagaa cgtaatgaaa ccgatcagca ttcaacctga ggaaggaaaa 300
ttcaattttg aacaagcgga tcgaattgtg aagttcgcta aggcaaatgg catggatatt 360
cgcttccata cactcgtttg gcacagccaa gtacctcaat ggttctttct tgacaaggaa 420
ggcaagccaa tggttaatga aacagatcca gtgaaacgtg aacaaaataa acaactgctg 480
ttaaaacgac ttgaaactca tattaaaacg atcgtcgagc ggtacaaaga tgacattaag 540
tactgggacg ttgtaaatga ggttgtgggg gacgacggaa aactgcgcaa ctctccatgg 600
tatcaaatcg ccggcatcga ttatattaaa gtggcattcc aaacagcgag aaaatatggc 660
ggcaacaaga ttaaacttta tatcaatgat tacaataccg aagtggaacc aaagcgaagc 720
gctctttata acttggtgaa gcaattaaaa gaagagggcg ttcctattga cggcatcggc 780
catcaatccc acattcaaat cggctggcct tctgaagcag aaatcgagaa aacgattaac 840
atgttcgccg ctctcggctt agacaaccaa atcactgagc ttgatgtgag catgtacggt 900
tggccgccgc gcgcttaccc gacgtatgac gccattccaa aacaaaagtt tttggatcag 960
gcagcgcgct atgatcgttt gttcaaactg tatgaaaagt tgagcgataa aattagcaac 1020
gtcaccttct ggggcatcgc cgacaatcat acgtggctcg acagccgtgc ggatgtgtac 1080
tatgacgcca acgggaatgt tgtggttgac ccgaacgctc cgtacgcaaa agtggaaaaa 1140
gggaaaggaa aagatgcgcc gttcgttttt ggaccggatt acaaagtcaa acccgcatat 1200
tgggctatta tcgaccacaa atag 1224
<210> 68
<211> 407
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(28)
<400> 68
Met Arg Asn Val Val Arg Lys Pro Leu Thr Ile Gly Leu Ala Leu Thr
1 5 10 15
Leu Leu Leu Pro Met Gly Met Thr Ala Thr Ser Ala Lys Asn Ala Asp
20 25 30
Ser Tyr Ala Lys Lys Pro His Ile Ser Ala Leu Asn Ala Pro Gln Leu
35 40 45
Asp Gln Arg Tyr Lys Asn Glu Phe Thr Ile Gly Ala Ala Val Glu Pro
50 55 60
Tyr Gln Leu Gln Asn Glu Lys Asp Val Gln Met Leu Lys Arg His Phe
65 70 75 80
Asn Ser Ile Val Ala Glu Asn Val Met Lys Pro Ile Ser Ile Gln Pro
85 90 95
Glu Glu Gly Lys Phe Asn Phe Glu Gln Ala Asp Arg Ile Val Lys Phe
100 105 110
Ala Lys Ala Asn Gly Met Asp Ile Arg Phe His Thr Leu Val Trp His
115 120 125
Ser Gln Val Pro Gln Trp Phe Phe Leu Asp Lys Glu Gly Lys Pro Met
130 135 140
Val Asn Glu Thr Asp Pro Val Lys Arg Glu Gln Asn Lys Gln Leu Leu
145 150 155 160
Leu Lys Arg Leu Glu Thr His Ile Lys Thr Ile Val Glu Arg Tyr Lys
165 170 175
Asp Asp Ile Lys Tyr Trp Asp Val Val Asn Glu Val Val Gly Asp Asp
180 185 190
Gly Lys Leu Arg Asn Ser Pro Trp Tyr Gln Ile Ala Gly Ile Asp Tyr
195 200 205
Ile Lys Val Ala Phe Gln Thr Ala Arg Lys Tyr Gly Gly Asn Lys Ile
210 215 220
Lys Leu Tyr Ile Asn Asp Tyr Asn Thr Glu Val Glu Pro Lys Arg Ser
225 230 235 240
Ala Leu Tyr Asn Leu Val Lys Gln Leu Lys Glu Glu Gly Val Pro Ile
245 250 255
Asp Gly Ile Gly His Gln Ser His Ile Gln Ile Gly Trp Pro Ser Glu
260 265 270
Ala Glu Ile Glu Lys Thr Ile Asn Met Phe Ala Ala Leu Gly Leu Asp
275 280 285
Asn Gln Ile Thr Glu Leu Asp Val Ser Met Tyr Gly Trp Pro Pro Arg
290 295 300
Ala Tyr Pro Thr Tyr Asp Ala Ile Pro Lys Gln Lys Phe Leu Asp Gln
305 310 315 320
Ala Ala Arg Tyr Asp Arg Leu Phe Lys Leu Tyr Glu Lys Leu Ser Asp
325 330 335
Lys Ile Ser Asn Val Thr Phe Trp Gly Ile Ala Asp Asn His Thr Trp
340 345 350
Leu Asp Ser Arg Ala Asp Val Tyr Tyr Asp Ala Asn Gly Asn Val Val
355 360 365
Val Asp Pro Asn Ala Pro Tyr Ala Lys Val Glu Lys Gly Lys Gly Lys
370 375 380
Asp Ala Pro Phe Val Phe Gly Pro Asp Tyr Lys Val Lys Pro Ala Tyr
385 390 395 400
Trp Ala Ile Ile Asp His Lys
405
<210> 69
<211> 1596
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 69
atggcgatgc atagatttaa gcaattaggg gccatcctac ttgtcctatg gttttgtgca 60
ttgccagtgc aggcgcaggc ttggcgtgcg gccgcagagc agcgtattga acagtaccgt 120
aaggggccac tgcgggttca ggtgaaggat cctgaaggac ggcccgtacc gaatgcccaa 180
gtgcacgttc gcatgacgcg tcacgctttt ggatttggta cggctgtcag ctttggcctg 240
gtcgtggggt cgggatacaa ccccacctat cgggccaagc tagaagacct gacgggcgac 300
ggccgcacat tcaacatggc tacgccagag aatgaattga agtggcctgc gtgggagtcg 360
gaatggccca tttcgaatcg tcgaaagatc gacgtcatca actggctgcg cgcaaaaggc 420
tacagcattc gaggacacaa cctgctatgg cctgactggc aatggatgcc ccgtgatatt 480
gagcaaaacc gcaacaatcc acagtacatc tacgatcgcg ttcgcaatca cattgcggcg 540
ttggctgggc atcgggacat tcggggcaaa ctgcgggact gggatgttct taacgaacca 600
gcccacctga ccgcattgcg cgatgtgttt aacggttggg gctcatatga gcgtggggaa 660
gacttctatg tggatgtctt taggtgggcc aaggcagcag actcgaccgc ccgtctatac 720
atcaacgagt acaacattat caacaactac gccaacgagc agcctacgcg caactattac 780
aagtggatca ttgcacgcct aatctcaaaa ggagcgccta tcgaagggat cggcattcag 840
gggcatattt cggcaccact gccaagcatg agtgaggtca aggcagccct agacgaaatg 900
gcagtttttg gattgccttt ggccatcaca gaatacgacg ttaccggcgt ttcggaagaa 960
gtcgaagcca actttatgcg ggactttttg accatggtct ttagtcatcc cgctgtggag 1020
agcttcgtca tgtggggttt ctggagcgga gcacactggc gtgacaatgc gccgctgttt 1080
cgggccgact ggagtctcaa gccttcggga caggtgttcc ttgatctggt ctttcggcgc 1140
tggtggaccg atactacggg ggtaaccggt ccagatggca gctggtctgt acgcggattt 1200
ttaggggatt acgttgtgga agtgcaggtg ggggaggttt cagtgaccaa gtccctgcgc 1260
ctcgaaagcc cgcaggatac aaccacgcta gaggtggtgg tcagtagcgt taaggtgggt 1320
gaaaagccta cagaagacgt gttgcgcgtg caagggtttg gaccagaccc ctttgtcgaa 1380
ggaacggcgc tgcgctactg gttagggcgg ccggccgatg ttgaactggc agtgtatgat 1440
gtgctgggcc gacaggtcta cgccgtgcaa aagcatcgcg tagctggttg gcatactgaa 1500
tgggtcgagg cttcccactg gcctgcagga ctttatctgt accgactcca agcaggtgat 1560
ctgttgcaca cgggtagaat ggtcaagatc caataa 1596
<210> 70
<211> 531
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(25)
<400> 70
Met Ala Met His Arg Phe Lys Gln Leu Gly Ala Ile Leu Leu Val Leu
1 5 10 15
Trp Phe Cys Ala Leu Pro Val Gln Ala Gln Ala Trp Arg Ala Ala Ala
20 25 30
Glu Gln Arg Ile Glu Gln Tyr Arg Lys Gly Pro Leu Arg Val Gln Val
35 40 45
Lys Asp Pro Glu Gly Arg Pro Val Pro Asn Ala Gln Val His Val Arg
50 55 60
Met Thr Arg His Ala Phe Gly Phe Gly Thr Ala Val Ser Phe Gly Leu
65 70 75 80
Val Val Gly Ser Gly Tyr Asn Pro Thr Tyr Arg Ala Lys Leu Glu Asp
85 90 95
Leu Thr Gly Asp Gly Arg Thr Phe Asn Met Ala Thr Pro Glu Asn Glu
100 105 110
Leu Lys Trp Pro Ala Trp Glu Ser Glu Trp Pro Ile Ser Asn Arg Arg
115 120 125
Lys Ile Asp Val Ile Asn Trp Leu Arg Ala Lys Gly Tyr Ser Ile Arg
130 135 140
Gly His Asn Leu Leu Trp Pro Asp Trp Gln Trp Met Pro Arg Asp Ile
145 150 155 160
Glu Gln Asn Arg Asn Asn Pro Gln Tyr Ile Tyr Asp Arg Val Arg Asn
165 170 175
His Ile Ala Ala Leu Ala Gly His Arg Asp Ile Arg Gly Lys Leu Arg
180 185 190
Asp Trp Asp Val Leu Asn Glu Pro Ala His Leu Thr Ala Leu Arg Asp
195 200 205
Val Phe Asn Gly Trp Gly Ser Tyr Glu Arg Gly Glu Asp Phe Tyr Val
210 215 220
Asp Val Phe Arg Trp Ala Lys Ala Ala Asp Ser Thr Ala Arg Leu Tyr
225 230 235 240
Ile Asn Glu Tyr Asn Ile Ile Asn Asn Tyr Ala Asn Glu Gln Pro Thr
245 250 255
Arg Asn Tyr Tyr Lys Trp Ile Ile Ala Arg Leu Ile Ser Lys Gly Ala
260 265 270
Pro Ile Glu Gly Ile Gly Ile Gln Gly His Ile Ser Ala Pro Leu Pro
275 280 285
Ser Met Ser Glu Val Lys Ala Ala Leu Asp Glu Met Ala Val Phe Gly
290 295 300
Leu Pro Leu Ala Ile Thr Glu Tyr Asp Val Thr Gly Val Ser Glu Glu
305 310 315 320
Val Glu Ala Asn Phe Met Arg Asp Phe Leu Thr Met Val Phe Ser His
325 330 335
Pro Ala Val Glu Ser Phe Val Met Trp Gly Phe Trp Ser Gly Ala His
340 345 350
Trp Arg Asp Asn Ala Pro Leu Phe Arg Ala Asp Trp Ser Leu Lys Pro
355 360 365
Ser Gly Gln Val Phe Leu Asp Leu Val Phe Arg Arg Trp Trp Thr Asp
370 375 380
Thr Thr Gly Val Thr Gly Pro Asp Gly Ser Trp Ser Val Arg Gly Phe
385 390 395 400
Leu Gly Asp Tyr Val Val Glu Val Gln Val Gly Glu Val Ser Val Thr
405 410 415
Lys Ser Leu Arg Leu Glu Ser Pro Gln Asp Thr Thr Thr Leu Glu Val
420 425 430
Val Val Ser Ser Val Lys Val Gly Glu Lys Pro Thr Glu Asp Val Leu
435 440 445
Arg Val Gln Gly Phe Gly Pro Asp Pro Phe Val Glu Gly Thr Ala Leu
450 455 460
Arg Tyr Trp Leu Gly Arg Pro Ala Asp Val Glu Leu Ala Val Tyr Asp
465 470 475 480
Val Leu Gly Arg Gln Val Tyr Ala Val Gln Lys His Arg Val Ala Gly
485 490 495
Trp His Thr Glu Trp Val Glu Ala Ser His Trp Pro Ala Gly Leu Tyr
500 505 510
Leu Tyr Arg Leu Gln Ala Gly Asp Leu Leu His Thr Gly Arg Met Val
515 520 525
Lys Ile Gln
530
<210> 71
<211> 1269
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 71
atgatttcca tcgcccattc agtgaacggg gcggagacct atgagaacct ggcgcacgga 60
actgccaaaa aaggcgaatg gactacgctg aaggggacat acaccgccgg cgcctatcag 120
cgcaacgtgc tctatgtgga aacggtttct gaaggcaccc ttgactttga gatccgtaat 180
tttgtcctga cggctccgaa cggactaccg gagcccaagc cgaccgagcc tccgatggtc 240
atcgaggaag ccgagaacgt gcccagtctc aaagagattt atgcagacaa attcgatttc 300
ggctccgccg cgccccagat ggtattccgt gaccccaaat ggctcaacct gatgaaggaa 360
cagttcagca ttctgacgcc ggaaaacgaa atgaaaccgg attccgttct ggatgtgggc 420
gcgagcaaag cgctggtgaa ggaaaccggt gatgagaccg ccgtcgccgt tcatttcgac 480
gctgccaaag cgctgctgaa ttttgccaag agcaacggga tcaaggttca cggccatgtg 540
ctgatctggc acagccagac gccggaagct ttcttccatc agggatatga ttccaagaag 600
cctttcgtta cacgggaagt gatgctgggc cgaatggaaa attacattaa gggtgttttt 660
gaatacctgg atgaaaatta tcccggcgtc gttgtctcct gggacgtgct gaatgaggcg 720
attgacgacg gaagcaactg gctgcggaac agcaactgga gaaagattgt cggcgaagac 780
tatccgaacc gggcatatga atatgcgcgc aaatatgcgc cggaaggtac gctgctgtat 840
tacaacgatt acaatacgtc gattcccggg aaactgaacg gcattgtgaa actgctgaac 900
agtctgattc cggaaggaaa tatcgacggt tacggcttcc agatgcacca tggcgtcggc 960
ttcccgtcca ttgatatgat ccagactgca gtggaacgga ttgccgcgct gaatatccgc 1020
cttcgcgtca gcgaactgga tgtcacggtg gacaacaaca cggaagcgtc cttcaacaaa 1080
caggcaaagt attatgccga agtcatgaag attctgattg ctcacagcga ccagtttgag 1140
gctgtgcagg tctgggggct gacagacctg atgagctggc gcggcagtca gttcccgctg 1200
ctgtttgacg gggcaggcaa tccgaaaccg gcgttctggg ccgtcgcgga tccggattcc 1260
gtgaaataa 1269
<210> 72
<211> 422
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 72
Met Ile Ser Ile Ala His Ser Val Asn Gly Ala Glu Thr Tyr Glu Asn
1 5 10 15
Leu Ala His Gly Thr Ala Lys Lys Gly Glu Trp Thr Thr Leu Lys Gly
20 25 30
Thr Tyr Thr Ala Gly Ala Tyr Gln Arg Asn Val Leu Tyr Val Glu Thr
35 40 45
Val Ser Glu Gly Thr Leu Asp Phe Glu Ile Arg Asn Phe Val Leu Thr
50 55 60
Ala Pro Asn Gly Leu Pro Glu Pro Lys Pro Thr Glu Pro Pro Met Val
65 70 75 80
Ile Glu Glu Ala Glu Asn Val Pro Ser Leu Lys Glu Ile Tyr Ala Asp
85 90 95
Lys Phe Asp Phe Gly Ser Ala Ala Pro Gln Met Val Phe Arg Asp Pro
100 105 110
Lys Trp Leu Asn Leu Met Lys Glu Gln Phe Ser Ile Leu Thr Pro Glu
115 120 125
Asn Glu Met Lys Pro Asp Ser Val Leu Asp Val Gly Ala Ser Lys Ala
130 135 140
Leu Val Lys Glu Thr Gly Asp Glu Thr Ala Val Ala Val His Phe Asp
145 150 155 160
Ala Ala Lys Ala Leu Leu Asn Phe Ala Lys Ser Asn Gly Ile Lys Val
165 170 175
His Gly His Val Leu Ile Trp His Ser Gln Thr Pro Glu Ala Phe Phe
180 185 190
His Gln Gly Tyr Asp Ser Lys Lys Pro Phe Val Thr Arg Glu Val Met
195 200 205
Leu Gly Arg Met Glu Asn Tyr Ile Lys Gly Val Phe Glu Tyr Leu Asp
210 215 220
Glu Asn Tyr Pro Gly Val Val Val Ser Trp Asp Val Leu Asn Glu Ala
225 230 235 240
Ile Asp Asp Gly Ser Asn Trp Leu Arg Asn Ser Asn Trp Arg Lys Ile
245 250 255
Val Gly Glu Asp Tyr Pro Asn Arg Ala Tyr Glu Tyr Ala Arg Lys Tyr
260 265 270
Ala Pro Glu Gly Thr Leu Leu Tyr Tyr Asn Asp Tyr Asn Thr Ser Ile
275 280 285
Pro Gly Lys Leu Asn Gly Ile Val Lys Leu Leu Asn Ser Leu Ile Pro
290 295 300
Glu Gly Asn Ile Asp Gly Tyr Gly Phe Gln Met His His Gly Val Gly
305 310 315 320
Phe Pro Ser Ile Asp Met Ile Gln Thr Ala Val Glu Arg Ile Ala Ala
325 330 335
Leu Asn Ile Arg Leu Arg Val Ser Glu Leu Asp Val Thr Val Asp Asn
340 345 350
Asn Thr Glu Ala Ser Phe Asn Lys Gln Ala Lys Tyr Tyr Ala Glu Val
355 360 365
Met Lys Ile Leu Ile Ala His Ser Asp Gln Phe Glu Ala Val Gln Val
370 375 380
Trp Gly Leu Thr Asp Leu Met Ser Trp Arg Gly Ser Gln Phe Pro Leu
385 390 395 400
Leu Phe Asp Gly Ala Gly Asn Pro Lys Pro Ala Phe Trp Ala Val Ala
405 410 415
Asp Pro Asp Ser Val Lys
420
<210> 73
<211> 4455
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 73
atgcagaaaa tgagaagaaa attgaaaaga attatgttat tacttctggc agctatgttg 60
ataatcccgt caggctggat tacacaggct tcagcagcgg aaacaaacaa agatatacct 120
gttctactgt accatcgaat tgttgataat cctactaatc aatggacgga taccagcgtt 180
gaaacgttta aacagactat gcaatatcta aatgatagcg gttacaacac cttgtcagcc 240
gaacaatatg taaagatcat ggatggaacg gcaacggcgc ctgaaaaacc gattctatta 300
acgtttgacg atggtactcc agaatttatc accaatgctc ttccagtatt aaagcaatat 360
aacatgaaag ctgttctgtt tattgtcagt gactggatag gcggcggctt cagcatgtca 420
aaagaacagc tgcaaagttt ggctaatgaa ccatctttaa gcctcgaaaa tcatacgaaa 480
acccatgacg gtactatttg gggaacaaat ggcggtgtac gtagtacgat aacgaaagaa 540
caagctgagg accaaattat atcagcgaat acttatctta aaagtattac aggtaaagac 600
ccagtcctaa tggcataccc ttatggcagc tataatgata ttgcaaaact agtaaaccaa 660
gaaaatggta ttaagtacgc atttaaagtg ggatacccta atgaagataa ttatgctatg 720
ggccgtcact atgtaacaaa tcaaagtgtg gctcaaattg cccaaatgat tggcggccct 780
gtgccagaac caactccaga accaggaaac cagacagaaa ccgtctatca agaaaccttt 840
gccagtgata ttggtgtagc agttcaagcg ggtaacccac aagtaaccca cgtttctggt 900
atggtttttg caggcaatga cgatggaaaa gccatctctg ttagcggcag gacgaacaac 960
tgggacggcg tcgatatccc attcaacaat gtcggtatgg aaaacggcaa aacttatacg 1020
attacagtta ctggttatgt tgacgaaaat gcaactgttc cttctggcgc acaagcttta 1080
ctgcagaatg tagacagcta taacggtttg tatgttgccg cagattatgc agcgggacag 1140
gcttttactt taacgggtca gtataccgtg gatactagta aagatagagc cctacgtatc 1200
caatcaaatg atgctgggaa aactgttccg ttttacattg gaaacatctt gattacaacg 1260
aaaaaaacga ctgcgcctga aacagataga gtggtatttc acgaaacatt tggaaatggt 1320
gttggtgttg ctacacaagc gggaagtgcg aaattgactc ctgtttctga gcttgttttt 1380
gaaggcaata gcgatggaaa agcaatttct gttaatggca gatccaataa ctgggacgga 1440
gttgatatac cgttcagcag tgtcagcatg cagaacggca aagcctatac cattacagtc 1500
actggttttg tttatagcag tgtgagtgtt cctgaaggtg cacaagcttt gcttcagaat 1560
gtagacagct ataatggctt gtatgcagca gcagatgtta aggcaggtca aacatttact 1620
ctaacgggtc aatataccgt tgatacgagc aaagatagag cactacgaat tcaatcaaat 1680
gatgcaggga aaaccgttcc cttctatatc ggagatattc tcattaccga gaaggcagcc 1740
tctggtggtg gcggggacga tggaagacta cctgccgaac catttacagc aattaatttt 1800
gaagaccaaa atatgggtgg tttcgaggga agagctggta ccgaaacact aacagtaacc 1860
aatgaagcca atcatactga tggcggttcc tatgctttga aggttgaagg cagatcacaa 1920
gcttggcatg gaccagcatt acacgtagag aaatatgttg acaaggattc ggaatataaa 1980
atttctgcct gggtgaagct gatttcacca gcaacttcac agcttcagct ttctacacag 2040
gtcggcaatg gcggaactgc tagttacaat aatcttcaag gaaaaactat cagcactgaa 2100
gatggctggg ttaaacttga gggaacgtac cgttatagca gtgtaggcga tgagttttta 2160
accatttatg tagagagctc gaataatagc acagcctcct tttatatcga tgatattact 2220
tttgaatcga ctggttcggg tccgattgaa gttgaggatt tgacaccgat aaaagatgtt 2280
tatcaagacg atttcttaat tggaaacgct gtctcagctt ctgatcttga aggcaataga 2340
cttaagcttc tcaacatgca tcacaatgtt gtcacagcag agaatgcaat gaagccagat 2400
caagcgtata atgcggaaaa acaatttgac tttactgatg aaaatgcgct tgtcgacaag 2460
gttttggatc agggattgca gctgcatggt cacgtgcttg tatggcacca gcagacgcca 2520
gaatggttat ttacagctga aaacggtgcc cctttgagcc gtgaggcagc actagcaaat 2580
ttaaggaccc atgttaaaac agtcgtagaa aattacggta acaaggtaat ttcatgggac 2640
gtggtaaacg aagcaatcat cgataacccg ccgaacccaa cggattggaa ggcatcactt 2700
cgtaaatctg gctggtacaa atcgattgga ccagacttcg tagaacaatc cttccttgct 2760
gcaaaagagg tactgaatga aaaaggcttg aatatcaagc tatattacaa tgattacaat 2820
gatgataatc agagcaaagc cgaggccatt tatcagatgg tgaaagatat caatgaaaag 2880
tatgctaaag aacatgatgg ggatcttctc attgacggaa ttggaatgca agcgcactac 2940
aataaaaaca ctaatcctga aaatgttaaa ctctccctag agaagtttat tacattgggt 3000
gtagaagtca gtgtgactga acttgacatt accgctggaa ccaataatgt acttactgag 3060
aaggaagcaa ttgcacaggg ttatttatac gcacaattgt tcaagattta caaagaacac 3120
gcagagcata tctcacgggt aactttctgg ggactaaatg atgcaacgag ctggagagct 3180
gcacagagtc cattgttgtt tgataaagat ttgcaagcaa aaccagctta ctatgctgtt 3240
atcgatccag acacatttac tgtagaaaat caacctgagg taagagaggc taatcaagga 3300
agtgctgttt ccggcacacc agtgattgat ggaactgtag atggtgtttg gagcaatgca 3360
acggaactgc cgattaatcg cttccaaatg gcttggcagg gagcaaacgg ggtatccaag 3420
gtcctctggg ataatgaaaa cctgtatgtt ttaattcaag taagtgactc acagctcgac 3480
aaatcgagtc caaatccatg ggaacaggat tccattgaag tctttgtaga tgagaataat 3540
gcaaagacat cttccttcga agatggtgat ggacaatatc gagtaaactt tgacaatgaa 3600
acatccttta accctgtcag agttggagaa ggtttcgaat ctgcaaccaa agcatcaggt 3660
aatggctata ccgttgaagt aaagattccg ttcaaaacca ttacaccaga taacaatacg 3720
aaaatcggtt ttgatgttca gattaatgac ggtaaagatg gtgctcgtca aagtgctgca 3780
acatggaacg atttaactgg tctgggatat caggacactt ctgtgttcgg cgtcctgaca 3840
cttatgaaga ctgacaccac cgcgcctgtt acaaccgata acggaccaga agattgggtt 3900
aataaagatg taacgattgc tttcagtgca aatgataatg acactggtgt ggcggcaacc 3960
tattatagta ttgataatgg ggtcgtacaa aacggtaatt cagttactat ttcggaagag 4020
ggtgtccaca ttctaacata ttggagtgta gacaaagctg gtaatgtcga gcaggttcat 4080
acaaaaacaa ttaaactaga taagaccgga ccaatattag atattaaact cgacaaaaca 4140
acattatcac cagttaatca taagatggtc ccaatatcgg cggctattag tgcatctgat 4200
gccgattcag gaattcattc agtagtgtta acatcaatta ctagcaatga atctatccaa 4260
cctgatgata ttcagaatgc caactataat aaacctatta caggtactac ggattccttt 4320
aaacttcgtg cagaaagatt agcaaacggt aatggccgtg tttacaccat tacttatacg 4380
gccacagata aagctggtaa tgtgacaaca aaaagtgttg aagtttccgt tccacgcgac 4440
aattctaaaa aataa 4455
<210> 74
<211> 1484
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(21)
<400> 74
Met Gln Lys Met Arg Arg Lys Leu Lys Arg Ile Met Leu Leu Leu Leu
1 5 10 15
Ala Ala Met Leu Ile Ile Pro Ser Gly Trp Ile Thr Gln Ala Ser Ala
20 25 30
Ala Glu Thr Asn Lys Asp Ile Pro Val Leu Leu Tyr His Arg Ile Val
35 40 45
Asp Asn Pro Thr Asn Gln Trp Thr Asp Thr Ser Val Glu Thr Phe Lys
50 55 60
Gln Thr Met Gln Tyr Leu Asn Asp Ser Gly Tyr Asn Thr Leu Ser Ala
65 70 75 80
Glu Gln Tyr Val Lys Ile Met Asp Gly Thr Ala Thr Ala Pro Glu Lys
85 90 95
Pro Ile Leu Leu Thr Phe Asp Asp Gly Thr Pro Glu Phe Ile Thr Asn
100 105 110
Ala Leu Pro Val Leu Lys Gln Tyr Asn Met Lys Ala Val Leu Phe Ile
115 120 125
Val Ser Asp Trp Ile Gly Gly Gly Phe Ser Met Ser Lys Glu Gln Leu
130 135 140
Gln Ser Leu Ala Asn Glu Pro Ser Leu Ser Leu Glu Asn His Thr Lys
145 150 155 160
Thr His Asp Gly Thr Ile Trp Gly Thr Asn Gly Gly Val Arg Ser Thr
165 170 175
Ile Thr Lys Glu Gln Ala Glu Asp Gln Ile Ile Ser Ala Asn Thr Tyr
180 185 190
Leu Lys Ser Ile Thr Gly Lys Asp Pro Val Leu Met Ala Tyr Pro Tyr
195 200 205
Gly Ser Tyr Asn Asp Ile Ala Lys Leu Val Asn Gln Glu Asn Gly Ile
210 215 220
Lys Tyr Ala Phe Lys Val Gly Tyr Pro Asn Glu Asp Asn Tyr Ala Met
225 230 235 240
Gly Arg His Tyr Val Thr Asn Gln Ser Val Ala Gln Ile Ala Gln Met
245 250 255
Ile Gly Gly Pro Val Pro Glu Pro Thr Pro Glu Pro Gly Asn Gln Thr
260 265 270
Glu Thr Val Tyr Gln Glu Thr Phe Ala Ser Asp Ile Gly Val Ala Val
275 280 285
Gln Ala Gly Asn Pro Gln Val Thr His Val Ser Gly Met Val Phe Ala
290 295 300
Gly Asn Asp Asp Gly Lys Ala Ile Ser Val Ser Gly Arg Thr Asn Asn
305 310 315 320
Trp Asp Gly Val Asp Ile Pro Phe Asn Asn Val Gly Met Glu Asn Gly
325 330 335
Lys Thr Tyr Thr Ile Thr Val Thr Gly Tyr Val Asp Glu Asn Ala Thr
340 345 350
Val Pro Ser Gly Ala Gln Ala Leu Leu Gln Asn Val Asp Ser Tyr Asn
355 360 365
Gly Leu Tyr Val Ala Ala Asp Tyr Ala Ala Gly Gln Ala Phe Thr Leu
370 375 380
Thr Gly Gln Tyr Thr Val Asp Thr Ser Lys Asp Arg Ala Leu Arg Ile
385 390 395 400
Gln Ser Asn Asp Ala Gly Lys Thr Val Pro Phe Tyr Ile Gly Asn Ile
405 410 415
Leu Ile Thr Thr Lys Lys Thr Thr Ala Pro Glu Thr Asp Arg Val Val
420 425 430
Phe His Glu Thr Phe Gly Asn Gly Val Gly Val Ala Thr Gln Ala Gly
435 440 445
Ser Ala Lys Leu Thr Pro Val Ser Glu Leu Val Phe Glu Gly Asn Ser
450 455 460
Asp Gly Lys Ala Ile Ser Val Asn Gly Arg Ser Asn Asn Trp Asp Gly
465 470 475 480
Val Asp Ile Pro Phe Ser Ser Val Ser Met Gln Asn Gly Lys Ala Tyr
485 490 495
Thr Ile Thr Val Thr Gly Phe Val Tyr Ser Ser Val Ser Val Pro Glu
500 505 510
Gly Ala Gln Ala Leu Leu Gln Asn Val Asp Ser Tyr Asn Gly Leu Tyr
515 520 525
Ala Ala Ala Asp Val Lys Ala Gly Gln Thr Phe Thr Leu Thr Gly Gln
530 535 540
Tyr Thr Val Asp Thr Ser Lys Asp Arg Ala Leu Arg Ile Gln Ser Asn
545 550 555 560
Asp Ala Gly Lys Thr Val Pro Phe Tyr Ile Gly Asp Ile Leu Ile Thr
565 570 575
Glu Lys Ala Ala Ser Gly Gly Gly Gly Asp Asp Gly Arg Leu Pro Ala
580 585 590
Glu Pro Phe Thr Ala Ile Asn Phe Glu Asp Gln Asn Met Gly Gly Phe
595 600 605
Glu Gly Arg Ala Gly Thr Glu Thr Leu Thr Val Thr Asn Glu Ala Asn
610 615 620
His Thr Asp Gly Gly Ser Tyr Ala Leu Lys Val Glu Gly Arg Ser Gln
625 630 635 640
Ala Trp His Gly Pro Ala Leu His Val Glu Lys Tyr Val Asp Lys Asp
645 650 655
Ser Glu Tyr Lys Ile Ser Ala Trp Val Lys Leu Ile Ser Pro Ala Thr
660 665 670
Ser Gln Leu Gln Leu Ser Thr Gln Val Gly Asn Gly Gly Thr Ala Ser
675 680 685
Tyr Asn Asn Leu Gln Gly Lys Thr Ile Ser Thr Glu Asp Gly Trp Val
690 695 700
Lys Leu Glu Gly Thr Tyr Arg Tyr Ser Ser Val Gly Asp Glu Phe Leu
705 710 715 720
Thr Ile Tyr Val Glu Ser Ser Asn Asn Ser Thr Ala Ser Phe Tyr Ile
725 730 735
Asp Asp Ile Thr Phe Glu Ser Thr Gly Ser Gly Pro Ile Glu Val Glu
740 745 750
Asp Leu Thr Pro Ile Lys Asp Val Tyr Gln Asp Asp Phe Leu Ile Gly
755 760 765
Asn Ala Val Ser Ala Ser Asp Leu Glu Gly Asn Arg Leu Lys Leu Leu
770 775 780
Asn Met His His Asn Val Val Thr Ala Glu Asn Ala Met Lys Pro Asp
785 790 795 800
Gln Ala Tyr Asn Ala Glu Lys Gln Phe Asp Phe Thr Asp Glu Asn Ala
805 810 815
Leu Val Asp Lys Val Leu Asp Gln Gly Leu Gln Leu His Gly His Val
820 825 830
Leu Val Trp His Gln Gln Thr Pro Glu Trp Leu Phe Thr Ala Glu Asn
835 840 845
Gly Ala Pro Leu Ser Arg Glu Ala Ala Leu Ala Asn Leu Arg Thr His
850 855 860
Val Lys Thr Val Val Glu Asn Tyr Gly Asn Lys Val Ile Ser Trp Asp
865 870 875 880
Val Val Asn Glu Ala Ile Ile Asp Asn Pro Pro Asn Pro Thr Asp Trp
885 890 895
Lys Ala Ser Leu Arg Lys Ser Gly Trp Tyr Lys Ser Ile Gly Pro Asp
900 905 910
Phe Val Glu Gln Ser Phe Leu Ala Ala Lys Glu Val Leu Asn Glu Lys
915 920 925
Gly Leu Asn Ile Lys Leu Tyr Tyr Asn Asp Tyr Asn Asp Asp Asn Gln
930 935 940
Ser Lys Ala Glu Ala Ile Tyr Gln Met Val Lys Asp Ile Asn Glu Lys
945 950 955 960
Tyr Ala Lys Glu His Asp Gly Asp Leu Leu Ile Asp Gly Ile Gly Met
965 970 975
Gln Ala His Tyr Asn Lys Asn Thr Asn Pro Glu Asn Val Lys Leu Ser
980 985 990
Leu Glu Lys Phe Ile Thr Leu Gly Val Glu Val Ser Val Thr Glu Leu
995 1000 1005
Asp Ile Thr Ala Gly Thr Asn Asn Val Leu Thr Glu Lys Glu Ala Ile
1010 1015 1020
Ala Gln Gly Tyr Leu Tyr Ala Gln Leu Phe Lys Ile Tyr Lys Glu His
1025 1030 1035 1040
Ala Glu His Ile Ser Arg Val Thr Phe Trp Gly Leu Asn Asp Ala Thr
1045 1050 1055
Ser Trp Arg Ala Ala Gln Ser Pro Leu Leu Phe Asp Lys Asp Leu Gln
1060 1065 1070
Ala Lys Pro Ala Tyr Tyr Ala Val Ile Asp Pro Asp Thr Phe Thr Val
1075 1080 1085
Glu Asn Gln Pro Glu Val Arg Glu Ala Asn Gln Gly Ser Ala Val Ser
1090 1095 1100
Gly Thr Pro Val Ile Asp Gly Thr Val Asp Gly Val Trp Ser Asn Ala
1105 1110 1115 1120
Thr Glu Leu Pro Ile Asn Arg Phe Gln Met Ala Trp Gln Gly Ala Asn
1125 1130 1135
Gly Val Ser Lys Val Leu Trp Asp Asn Glu Asn Leu Tyr Val Leu Ile
1140 1145 1150
Gln Val Ser Asp Ser Gln Leu Asp Lys Ser Ser Pro Asn Pro Trp Glu
1155 1160 1165
Gln Asp Ser Ile Glu Val Phe Val Asp Glu Asn Asn Ala Lys Thr Ser
1170 1175 1180
Ser Phe Glu Asp Gly Asp Gly Gln Tyr Arg Val Asn Phe Asp Asn Glu
1185 1190 1195 1200
Thr Ser Phe Asn Pro Val Arg Val Gly Glu Gly Phe Glu Ser Ala Thr
1205 1210 1215
Lys Ala Ser Gly Asn Gly Tyr Thr Val Glu Val Lys Ile Pro Phe Lys
1220 1225 1230
Thr Ile Thr Pro Asp Asn Asn Thr Lys Ile Gly Phe Asp Val Gln Ile
1235 1240 1245
Asn Asp Gly Lys Asp Gly Ala Arg Gln Ser Ala Ala Thr Trp Asn Asp
1250 1255 1260
Leu Thr Gly Leu Gly Tyr Gln Asp Thr Ser Val Phe Gly Val Leu Thr
1265 1270 1275 1280
Leu Met Lys Thr Asp Thr Thr Ala Pro Val Thr Thr Asp Asn Gly Pro
1285 1290 1295
Glu Asp Trp Val Asn Lys Asp Val Thr Ile Ala Phe Ser Ala Asn Asp
1300 1305 1310
Asn Asp Thr Gly Val Ala Ala Thr Tyr Tyr Ser Ile Asp Asn Gly Val
1315 1320 1325
Val Gln Asn Gly Asn Ser Val Thr Ile Ser Glu Glu Gly Val His Ile
1330 1335 1340
Leu Thr Tyr Trp Ser Val Asp Lys Ala Gly Asn Val Glu Gln Val His
1345 1350 1355 1360
Thr Lys Thr Ile Lys Leu Asp Lys Thr Gly Pro Ile Leu Asp Ile Lys
1365 1370 1375
Leu Asp Lys Thr Thr Leu Ser Pro Val Asn His Lys Met Val Pro Ile
1380 1385 1390
Ser Ala Ala Ile Ser Ala Ser Asp Ala Asp Ser Gly Ile His Ser Val
1395 1400 1405
Val Leu Thr Ser Ile Thr Ser Asn Glu Ser Ile Gln Pro Asp Asp Ile
1410 1415 1420
Gln Asn Ala Asn Tyr Asn Lys Pro Ile Thr Gly Thr Thr Asp Ser Phe
1425 1430 1435 1440
Lys Leu Arg Ala Glu Arg Leu Ala Asn Gly Asn Gly Arg Val Tyr Thr
1445 1450 1455
Ile Thr Tyr Thr Ala Thr Asp Lys Ala Gly Asn Val Thr Thr Lys Ser
1460 1465 1470
Val Glu Val Ser Val Pro Arg Asp Asn Ser Lys Lys
1475 1480
<210> 75
<211> 1122
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 75
atgaaaaagc atattgtact cttcgcattt ctttccgtga ttttgctggc ggcccgatcg 60
tcggcgtcgg agcgatttct caaggacgtc ttttcggatt ccttcaaggt cggcgtagcc 120
ctcaatgccg atcagattac gggggcggac tcggccagcc tcgacttgtc cttggctcac 180
ttcgattctc ttgtcgctga aaatgcgatg aagtgggggt cgctcaatcc tgagccgggg 240
gtttacgatt tccgggtggc tgacgccctg gtcgatttgg cggagcggga aggtttgttt 300
ttggttggcc acacactgct ctggcatcag cagacgccgg actgggtttt tctggacgag 360
aagggcgaga ccgccacgcg ggagctggtg ctcgctcgac tggagacgca catccgcacc 420
gtggtcggcc gctaccaggg ccgggtgcag ggctgggatg tggtcaacga agccttgaac 480
gaagacggtt cgttgcggga gtcgaaatgg ttgcagatca tcggcccgga ctacatcgaa 540
ctggcgttcc gcatggcgaa ggaggccgat cccgacgccg agctttatta caatgactac 600
aatgtgtcca agcccggcaa gcgaggtgga gtggtgcgcc tgcttggaga gctgcaggcg 660
aaaggagtta aggtcgatgc ggtcggcatc cagggccact acagtctcgg gcaccctgag 720
ctcgaccagc tcgaggccag catttctgcg ataacggagg ctggggctcc gatcatgata 780
accgagctcg atgtgtcggt cttgcccttt cccgacgcgg agcaaatggg ggcggacgtg 840
tcgctcagct ttgagatgca ggaccacctc aatccctatg ccgatggctt gcccgaggcg 900
gtttcgcagc agctagctga acgttacgcg gccatttttg aagtgttttt gcgccaccag 960
agccacatcg accgcgtgac gttttgggga gtgcacgacg gggtcagctg gtggaactat 1020
tggccgatcg cgggcaggac cgactatccc ttgctgtttg atcgggagct caagcggaaa 1080
gcggccttcg aggcggtggt cgatttagcg gagggccgct ga 1122
<210> 76
<211> 373
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(22)
<400> 76
Met Lys Lys His Ile Val Leu Phe Ala Phe Leu Ser Val Ile Leu Leu
1 5 10 15
Ala Ala Arg Ser Ser Ala Ser Glu Arg Phe Leu Lys Asp Val Phe Ser
20 25 30
Asp Ser Phe Lys Val Gly Val Ala Leu Asn Ala Asp Gln Ile Thr Gly
35 40 45
Ala Asp Ser Ala Ser Leu Asp Leu Ser Leu Ala His Phe Asp Ser Leu
50 55 60
Val Ala Glu Asn Ala Met Lys Trp Gly Ser Leu Asn Pro Glu Pro Gly
65 70 75 80
Val Tyr Asp Phe Arg Val Ala Asp Ala Leu Val Asp Leu Ala Glu Arg
85 90 95
Glu Gly Leu Phe Leu Val Gly His Thr Leu Leu Trp His Gln Gln Thr
100 105 110
Pro Asp Trp Val Phe Leu Asp Glu Lys Gly Glu Thr Ala Thr Arg Glu
115 120 125
Leu Val Leu Ala Arg Leu Glu Thr His Ile Arg Thr Val Val Gly Arg
130 135 140
Tyr Gln Gly Arg Val Gln Gly Trp Asp Val Val Asn Glu Ala Leu Asn
145 150 155 160
Glu Asp Gly Ser Leu Arg Glu Ser Lys Trp Leu Gln Ile Ile Gly Pro
165 170 175
Asp Tyr Ile Glu Leu Ala Phe Arg Met Ala Lys Glu Ala Asp Pro Asp
180 185 190
Ala Glu Leu Tyr Tyr Asn Asp Tyr Asn Val Ser Lys Pro Gly Lys Arg
195 200 205
Gly Gly Val Val Arg Leu Leu Gly Glu Leu Gln Ala Lys Gly Val Lys
210 215 220
Val Asp Ala Val Gly Ile Gln Gly His Tyr Ser Leu Gly His Pro Glu
225 230 235 240
Leu Asp Gln Leu Glu Ala Ser Ile Ser Ala Ile Thr Glu Ala Gly Ala
245 250 255
Pro Ile Met Ile Thr Glu Leu Asp Val Ser Val Leu Pro Phe Pro Asp
260 265 270
Ala Glu Gln Met Gly Ala Asp Val Ser Leu Ser Phe Glu Met Gln Asp
275 280 285
His Leu Asn Pro Tyr Ala Asp Gly Leu Pro Glu Ala Val Ser Gln Gln
290 295 300
Leu Ala Glu Arg Tyr Ala Ala Ile Phe Glu Val Phe Leu Arg His Gln
305 310 315 320
Ser His Ile Asp Arg Val Thr Phe Trp Gly Val His Asp Gly Val Ser
325 330 335
Trp Trp Asn Tyr Trp Pro Ile Ala Gly Arg Thr Asp Tyr Pro Leu Leu
340 345 350
Phe Asp Arg Glu Leu Lys Arg Lys Ala Ala Phe Glu Ala Val Val Asp
355 360 365
Leu Ala Glu Gly Arg
370
<210> 77
<211> 1248
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 77
atgctaaaag ttttacgtaa acctatcgtt tctggattag ctctagcctt attattacct 60
ataggatcga cagttagtgc cgaaacaaat atttcaaata aaccaggtat tagcgggtta 120
acagcaccac aattggacca acgatataaa gattctttca ccataggtgc agcggttgag 180
ccaaatcaat tattagatgc aaaagactca caaatgttaa agcgccattt taatagcatt 240
gtagcagaaa atgtcatgaa gcctagcagt ttacagccag tagaagggca gtttaactgg 300
gaaccggcag ataaacttgt taagtttgcg aaagaaaatg gaatggacat gcgcggccat 360
acgcttgtct ggcatagcca agtaccagat tggttcttca aagatgcaaa tggaaattca 420
atggttgttt ggcagaatgg aaagcaagtg gttgcagatc cgtcaaatct tgaggctaac 480
aaaaagcttt tattaagccg tttagaaaca catgttaata cagtcgtttc tcgttataaa 540
aatgatatta aattttggga cgttgtcaat gaagtaatcg acgaatgggg cggacatcct 600
gaaggtttac gtcaatctcc atggttccta attaccggaa cggactatat taaagtcgct 660
tttgagacag caagacaata tgctgctcca gacgctaagc tttatatcaa tgattacaat 720
acagaagtaa caccaaaaag aacgtactta tacaacctag taaaaagttt aaaacagcaa 780
ggtgttccaa ttgatggtgt tgggcatcag tctcacattc aaatcggctg gccgtctgaa 840
aaagaaattg aagacacaat taacatgttt gctgaactgg ggttagacaa ccaaattact 900
gagcttgatg taagcatgta tggctggcca gtaagggcgt atcctaccta tgattctatt 960
ccagcacaga aatttataga tcaagcagac cgatatgatc gtttatttaa attatatgag 1020
aaattaggcg ataaaatcag caatgtgaca ttctggggaa ttgctgataa ccatacatgg 1080
ttaaatgacc gtgcagatgt ttactatgat gcagatggaa acgttgtaac attggcaaat 1140
gcaccatatg ctaaaatgga agctagatca ggtaaagatg caccatttgt atttgatcca 1200
gaatacaatg taaaaccagc ctattgggcg attatcgacc acaaataa 1248
<210> 78
<211> 415
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(27)
<400> 78
Met Leu Lys Val Leu Arg Lys Pro Ile Val Ser Gly Leu Ala Leu Ala
1 5 10 15
Leu Leu Leu Pro Ile Gly Ser Thr Val Ser Ala Glu Thr Asn Ile Ser
20 25 30
Asn Lys Pro Gly Ile Ser Gly Leu Thr Ala Pro Gln Leu Asp Gln Arg
35 40 45
Tyr Lys Asp Ser Phe Thr Ile Gly Ala Ala Val Glu Pro Asn Gln Leu
50 55 60
Leu Asp Ala Lys Asp Ser Gln Met Leu Lys Arg His Phe Asn Ser Ile
65 70 75 80
Val Ala Glu Asn Val Met Lys Pro Ser Ser Leu Gln Pro Val Glu Gly
85 90 95
Gln Phe Asn Trp Glu Pro Ala Asp Lys Leu Val Lys Phe Ala Lys Glu
100 105 110
Asn Gly Met Asp Met Arg Gly His Thr Leu Val Trp His Ser Gln Val
115 120 125
Pro Asp Trp Phe Phe Lys Asp Ala Asn Gly Asn Ser Met Val Val Trp
130 135 140
Gln Asn Gly Lys Gln Val Val Ala Asp Pro Ser Asn Leu Glu Ala Asn
145 150 155 160
Lys Lys Leu Leu Leu Ser Arg Leu Glu Thr His Val Asn Thr Val Val
165 170 175
Ser Arg Tyr Lys Asn Asp Ile Lys Phe Trp Asp Val Val Asn Glu Val
180 185 190
Ile Asp Glu Trp Gly Gly His Pro Glu Gly Leu Arg Gln Ser Pro Trp
195 200 205
Phe Leu Ile Thr Gly Thr Asp Tyr Ile Lys Val Ala Phe Glu Thr Ala
210 215 220
Arg Gln Tyr Ala Ala Pro Asp Ala Lys Leu Tyr Ile Asn Asp Tyr Asn
225 230 235 240
Thr Glu Val Thr Pro Lys Arg Thr Tyr Leu Tyr Asn Leu Val Lys Ser
245 250 255
Leu Lys Gln Gln Gly Val Pro Ile Asp Gly Val Gly His Gln Ser His
260 265 270
Ile Gln Ile Gly Trp Pro Ser Glu Lys Glu Ile Glu Asp Thr Ile Asn
275 280 285
Met Phe Ala Glu Leu Gly Leu Asp Asn Gln Ile Thr Glu Leu Asp Val
290 295 300
Ser Met Tyr Gly Trp Pro Val Arg Ala Tyr Pro Thr Tyr Asp Ser Ile
305 310 315 320
Pro Ala Gln Lys Phe Ile Asp Gln Ala Asp Arg Tyr Asp Arg Leu Phe
325 330 335
Lys Leu Tyr Glu Lys Leu Gly Asp Lys Ile Ser Asn Val Thr Phe Trp
340 345 350
Gly Ile Ala Asp Asn His Thr Trp Leu Asn Asp Arg Ala Asp Val Tyr
355 360 365
Tyr Asp Ala Asp Gly Asn Val Val Thr Leu Ala Asn Ala Pro Tyr Ala
370 375 380
Lys Met Glu Ala Arg Ser Gly Lys Asp Ala Pro Phe Val Phe Asp Pro
385 390 395 400
Glu Tyr Asn Val Lys Pro Ala Tyr Trp Ala Ile Ile Asp His Lys
405 410 415
<210> 79
<211> 1293
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 79
atgattggtc tggatttgat ttctggtggt cgtcgcaagg cctgtctggc tgcctgtctg 60
gcgcttgccg cgctgtcatt gccggtatcg gctcaaatgg ctgcggggaa ggaaaagttc 120
gtgggtaacg tgatcgctgg ttatgtgccc ggtgattacg gcaatctctg gaatcaggtg 180
acgccggaga attccaccaa gtggggagcg gttgagtcta cgcgtaatgt catgaactgg 240
acgcaggctg atctggccta caactacgcc aagtccaagg gcttcaagtt caagatgcac 300
acgctggtat ggggctcgca agagccggcc tgggtcaaga atctggatgc gacttcccag 360
cgtgtcgagg tcgaacagtg gatgcgtctg agctgcgaac gctaccccga ttcctgggct 420
atcgatgtgg tgaatgaacc cctgcatgcc gtgccctcgt acaagaacgc actgggtggc 480
gatggtgcca ccggctggga ttgggtcatc acctcgttcc gtctggcgcg tcagtactgt 540
ccgcgcgcca agctgctgct caatgagtac gccaccgagc tggatgccag caagcgcgcc 600
aagatcaaga ccattgcctc gctgctcaag agtcgcggtc tgattgatgg tgttggcctg 660
caggcccatt tcttcacgct ggattacatg aatgccagcc agatgaaggc ggcactggat 720
gattacgcca cgctgggtgt ggatatctac atttccgagc tggatctgaa gggcagtgcc 780
aataccgacg ccagccagaa ggcgaagtac gaagagctgt tcccggtgat gtggaatcac 840
gccagcgtga agggcatcac cctgtggggc tacaaggtgg gtgaaacctg gtcgagcggc 900
accggcctgc tgaatgcgaa cggtagcgag cgtccggccc tgacctggct gaaaagctat 960
atgagcagcc gtcctgcagc atcgagcagc agttcttcga gtgtttcatc cagcaaatcc 1020
agttcgtctt cttctagcca gtccagtgcc tccagcagtg caggcagtgc gccggtcttg 1080
tccggcacca gtgattaccc gagcggtttc agcaagtgtg ccgatctggg cggcacttgc 1140
agcgtgtctt ccggcaccgg ctgggcggcc ttcgggcgca agggtaagtg ggttgccaaa 1200
tacgtcggtg tgggcaagag cattccctgc acggtggcgg cgtttggtcg tgacccgggg 1260
ggcaatccca acaagtgttc cttccagagg taa 1293
<210> 80
<211> 430
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(36)
<400> 80
Met Ile Gly Leu Asp Leu Ile Ser Gly Gly Arg Arg Lys Ala Cys Leu
1 5 10 15
Ala Ala Cys Leu Ala Leu Ala Ala Leu Ser Leu Pro Val Ser Ala Gln
20 25 30
Met Ala Ala Gly Lys Glu Lys Phe Val Gly Asn Val Ile Ala Gly Tyr
35 40 45
Val Pro Gly Asp Tyr Gly Asn Leu Trp Asn Gln Val Thr Pro Glu Asn
50 55 60
Ser Thr Lys Trp Gly Ala Val Glu Ser Thr Arg Asn Val Met Asn Trp
65 70 75 80
Thr Gln Ala Asp Leu Ala Tyr Asn Tyr Ala Lys Ser Lys Gly Phe Lys
85 90 95
Phe Lys Met His Thr Leu Val Trp Gly Ser Gln Glu Pro Ala Trp Val
100 105 110
Lys Asn Leu Asp Ala Thr Ser Gln Arg Val Glu Val Glu Gln Trp Met
115 120 125
Arg Leu Ser Cys Glu Arg Tyr Pro Asp Ser Trp Ala Ile Asp Val Val
130 135 140
Asn Glu Pro Leu His Ala Val Pro Ser Tyr Lys Asn Ala Leu Gly Gly
145 150 155 160
Asp Gly Ala Thr Gly Trp Asp Trp Val Ile Thr Ser Phe Arg Leu Ala
165 170 175
Arg Gln Tyr Cys Pro Arg Ala Lys Leu Leu Leu Asn Glu Tyr Ala Thr
180 185 190
Glu Leu Asp Ala Ser Lys Arg Ala Lys Ile Lys Thr Ile Ala Ser Leu
195 200 205
Leu Lys Ser Arg Gly Leu Ile Asp Gly Val Gly Leu Gln Ala His Phe
210 215 220
Phe Thr Leu Asp Tyr Met Asn Ala Ser Gln Met Lys Ala Ala Leu Asp
225 230 235 240
Asp Tyr Ala Thr Leu Gly Val Asp Ile Tyr Ile Ser Glu Leu Asp Leu
245 250 255
Lys Gly Ser Ala Asn Thr Asp Ala Ser Gln Lys Ala Lys Tyr Glu Glu
260 265 270
Leu Phe Pro Val Met Trp Asn His Ala Ser Val Lys Gly Ile Thr Leu
275 280 285
Trp Gly Tyr Lys Val Gly Glu Thr Trp Ser Ser Gly Thr Gly Leu Leu
290 295 300
Asn Ala Asn Gly Ser Glu Arg Pro Ala Leu Thr Trp Leu Lys Ser Tyr
305 310 315 320
Met Ser Ser Arg Pro Ala Ala Ser Ser Ser Ser Ser Ser Ser Val Ser
325 330 335
Ser Ser Lys Ser Ser Ser Ser Ser Ser Ser Gln Ser Ser Ala Ser Ser
340 345 350
Ser Ala Gly Ser Ala Pro Val Leu Ser Gly Thr Ser Asp Tyr Pro Ser
355 360 365
Gly Phe Ser Lys Cys Ala Asp Leu Gly Gly Thr Cys Ser Val Ser Ser
370 375 380
Gly Thr Gly Trp Ala Ala Phe Gly Arg Lys Gly Lys Trp Val Ala Lys
385 390 395 400
Tyr Val Gly Val Gly Lys Ser Ile Pro Cys Thr Val Ala Ala Phe Gly
405 410 415
Arg Asp Pro Gly Gly Asn Pro Asn Lys Cys Ser Phe Gln Arg
420 425 430
<210> 81
<211> 1017
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 81
ttgaccacga gagctattcg cacggaggca gcgctgaagg agatgtttgc ggaggacttt 60
cagatcggag ccgctgttaa tccgatgact atacggacac aggaggagct gcttgcttat 120
cacttcaaca gtattacggc agagaatgaa atgaagtttg ccagtctgca gccggaggag 180
ggggcttatg cttttgacga ggcggatcga ttggcggcct tcgcccggaa gcatggcatg 240
gcgatgcggg gacacacttt agtgtggcat aaccagtcca caggctggct gttcgaagac 300
aagcagggaa atcctgtaga taaggcaact ctgctggaga ggctgaaatc gcacatccat 360
acggtagtag gacgttataa aaacgatatt tatgcttggg atgtggtaaa cgaggttata 420
gaggacgagg gagacggcct gctgcgccgg tcgaaatggc tggatattgc cggaccggaa 480
ttcattgccc gggcgttcga gtatgctcat gaggctgacc ctaatgcgct gctcttctat 540
aatgactaca acgagtccaa tccggcgaag cgagacaaga tccatgctct ggtgaagtcg 600
ctgctggagc aaggcgtgcc tattcatggc attggactgc aggcgcattg gaatttgtat 660
ggtccttctc tcggcgagat ccgagcggca ctggagaagt atgcttctct tggcctgcag 720
ctgcagctta cggagctgga tatgtcgctg tttcgttttg acgacaagcg tacggatata 780
accgagcctc cggcggaatt gcttgagctg caggctgagc ggtatgagga aattttcaag 840
ctgctgaggg aataccggga tgtaatcact tccgtgacct tctggggggc tgcggatgat 900
tatacgtggc tgaacgattt tcccgtccgg gggcggaaaa attggccttt cctgttcgat 960
gagcagcatc accccaaact ggcatttcat cgggtcgctg cactttcccg ccagtga 1017
<210> 82
<211> 338
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 82
Leu Thr Thr Arg Ala Ile Arg Thr Glu Ala Ala Leu Lys Glu Met Phe
1 5 10 15
Ala Glu Asp Phe Gln Ile Gly Ala Ala Val Asn Pro Met Thr Ile Arg
20 25 30
Thr Gln Glu Glu Leu Leu Ala Tyr His Phe Asn Ser Ile Thr Ala Glu
35 40 45
Asn Glu Met Lys Phe Ala Ser Leu Gln Pro Glu Glu Gly Ala Tyr Ala
50 55 60
Phe Asp Glu Ala Asp Arg Leu Ala Ala Phe Ala Arg Lys His Gly Met
65 70 75 80
Ala Met Arg Gly His Thr Leu Val Trp His Asn Gln Ser Thr Gly Trp
85 90 95
Leu Phe Glu Asp Lys Gln Gly Asn Pro Val Asp Lys Ala Thr Leu Leu
100 105 110
Glu Arg Leu Lys Ser His Ile His Thr Val Val Gly Arg Tyr Lys Asn
115 120 125
Asp Ile Tyr Ala Trp Asp Val Val Asn Glu Val Ile Glu Asp Glu Gly
130 135 140
Asp Gly Leu Leu Arg Arg Ser Lys Trp Leu Asp Ile Ala Gly Pro Glu
145 150 155 160
Phe Ile Ala Arg Ala Phe Glu Tyr Ala His Glu Ala Asp Pro Asn Ala
165 170 175
Leu Leu Phe Tyr Asn Asp Tyr Asn Glu Ser Asn Pro Ala Lys Arg Asp
180 185 190
Lys Ile His Ala Leu Val Lys Ser Leu Leu Glu Gln Gly Val Pro Ile
195 200 205
His Gly Ile Gly Leu Gln Ala His Trp Asn Leu Tyr Gly Pro Ser Leu
210 215 220
Gly Glu Ile Arg Ala Ala Leu Glu Lys Tyr Ala Ser Leu Gly Leu Gln
225 230 235 240
Leu Gln Leu Thr Glu Leu Asp Met Ser Leu Phe Arg Phe Asp Asp Lys
245 250 255
Arg Thr Asp Ile Thr Glu Pro Pro Ala Glu Leu Leu Glu Leu Gln Ala
260 265 270
Glu Arg Tyr Glu Glu Ile Phe Lys Leu Leu Arg Glu Tyr Arg Asp Val
275 280 285
Ile Thr Ser Val Thr Phe Trp Gly Ala Ala Asp Asp Tyr Thr Trp Leu
290 295 300
Asn Asp Phe Pro Val Arg Gly Arg Lys Asn Trp Pro Phe Leu Phe Asp
305 310 315 320
Glu Gln His His Pro Lys Leu Ala Phe His Arg Val Ala Ala Leu Ser
325 330 335
Arg Gln
<210> 83
<211> 3024
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 83
atgaaaacca aaaggtctat attcaggttg tctatcctgg ttgtcctggc tgtgctgctg 60
ttcagcgcaa tcaccttgac agccagcgcc gccgacacgc tcggcgcggc ggcggcccag 120
tcgggccggt acttcggcac ggcgatagct gccggcaagc tcggcgactc gacctacacg 180
accattgcca accgtgagtt caacatgatc acggctgaga atgagatgaa gatcgacgcc 240
accgagccga accagaacca attcaacttc accaacgccg accggatctt caactgggcg 300
gtgcagaatg ggaagcaggt gcgcgggcac acgctggcat ggcactcgca gcagccgggg 360
tggatgagca gcatgagcgg caccgcgctg cgcaatgcga tgatcaacca catcaatggg 420
gtgatggccc actacaaggg caggatctac gcctgggatg tggtgaacga ggctttcaac 480
gaggacggca gccgccgcaa ctcgaacctg cagcagaccg gcaacgactg gatcgaggtg 540
gccttccgga cagcccgcac cgccgacccg gccgccaagc tgtgctacaa cgactacaac 600
atcgaagcct ggagctatgc caagacgcag ggcgtttacc ggatggtcca ggacttcaag 660
tcccgcggcg tgccgatcga ctgtgtcggg ttccagagcc acttcaacag cggcacttcc 720
tacgtcaaca gcaacttccg gacgacgctg caaagcttcg ccgcgctggg cgtggacgtg 780
cagatcaccg agctggatgt cgagaatgcc gactcgcggc tcgattggtg gagaggcatc 840
gtcaatgact gcctggcggt cccgcgctgc aacggcatca cggtgtgggg cgtgcgcgac 900
agcgattcgt ggcgctcttc gcagaacccg ctgctgttca actccagcgg tggtaagaag 960
gcttcgtaca ccgccgtcct cgacgccctc aacgctgccc cgaccgtcac acctccggta 1020
acgacacctc cggtgacgac accgccagtg accacgcctc ctcccggcac tgtgtcgatt 1080
aacgcgggcg gctcggcgag cggcagcttc acggccgacc agtacttcag cggtggcagc 1140
acctacacca acaccgccac catcgacatg agtcagatca ccagcaaccc accgccggcg 1200
gcggtcttca acagcgagcg ttacggggcg atgacctaca ccatccccaa ccgctcgggt 1260
gctcagacgg tgacgctgta ctttgccgag acctacctca ccgcggcagg gcagcggtcg 1320
ttcaacgtgt cgattaatgg cgcagcggcg ctgtccaact tcgacatcta tgcctcggca 1380
ggtggcgcta accgggccat cgcccggacg ttcagcacca cggctaactc aagtggccag 1440
gtggtgatcc agttcacggc ggttaccgag aaccccaaga tcaacgctat cacggtaaca 1500
gcgggtggca cgcctccacc gacaacgcct ccgcccacca cgccgccacc gaccacccct 1560
ccggtgacga cacccccagt gacgacaccc ccagtgacga caccgccccc cggcagcgtg 1620
tcgatcaacg cgggcggctc ggccaccggc agcttcacgg gcgaccagta ctttagcggt 1680
ggcagcacct acaccaacac cgccaccatc gacatgagcc agatcaccag caacccacca 1740
ccggcggcgg tgttcaacag cgagcgctac ggggcgatga cctacaccat ccccggccgc 1800
tcgggggctc agacggtcac gctttacttt gccgaaacgt atgtcactgc ggcagggcag 1860
cgcgtcttta acgtgtctgt aaacggcgcg gcagcgctgt ccaacttcga catctatgcc 1920
agcgccggcg gccagaaccg ggccatcgct cgctccttca acaccacggc caactcaagc 1980
ggccaggtgg tgatccagtt cacggcggtc accgagaacc ccaagatcaa cgccatcact 2040
gtggcgggcg ggatcgggga cttccaaacc ctgaccgtca cgaagtccgg cacggggacg 2100
gtcacctcca acccggctgg tatcaactgc ggctcgacct gcaacgccag cttcgctacc 2160
ggcaccagcg tgaccctgac cgcctccggc gggaccttca ccggctggag cggagcctgc 2220
tccggcacct ccaccacctg caccgtctcc atgacccagg cccggtcggt caccgctact 2280
tttagcggcg gtggtgacac caggccgagc gcggggtgtg gtaagaaccg gacactgcag 2340
aatggcacaa tcaccatttc aagtggcggc gtcaaccgca cctacatcct acgcacgcct 2400
gacaactaca acaacacgca tgcataccgg ctgatcatgg cttatcactg gcttaacggc 2460
agcgcgcaga atgtggcgag cgagaactac taccggctgt tcccactctc caacaacagc 2520
accatcttcg tggcgcctca ggggctggat gccggatggg ctaacaccaa caaccgcgac 2580
ctgaacctca ccgatgccat actcacccag gtcgagaacg atctgtgcgt cgacttgaac 2640
cgggtctggg ccaccgggtt cagctacggc gcaggtatgt catacgccat cgcctgtgcc 2700
agggccaatg tgttccgggg cgtcgctctc tatgccggcg cgcagctcag cggttgcacc 2760
ggtggaacca cggccattgc gtacttcgca acgcacggca tcaacgacag tgtcctcaac 2820
atctcgcaag ggcggactct acgcgaccgc tttgtctcga acaacagctg cacggcgcag 2880
aaccctcccg agccttcctc gggcagcggg acgcacatct gcacgtccta ccagaactgc 2940
tcggcaggac atcctgtccg gtggtgcgcg ttcgacggcg accacacccc gaatcagacc 3000
gaccgcggcc agagcacaag ctaa 3024
<210> 84
<211> 1007
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(30)
<400> 84
Met Lys Thr Lys Arg Ser Ile Phe Arg Leu Ser Ile Leu Val Val Leu
1 5 10 15
Ala Val Leu Leu Phe Ser Ala Ile Thr Leu Thr Ala Ser Ala Ala Asp
20 25 30
Thr Leu Gly Ala Ala Ala Ala Gln Ser Gly Arg Tyr Phe Gly Thr Ala
35 40 45
Ile Ala Ala Gly Lys Leu Gly Asp Ser Thr Tyr Thr Thr Ile Ala Asn
50 55 60
Arg Glu Phe Asn Met Ile Thr Ala Glu Asn Glu Met Lys Ile Asp Ala
65 70 75 80
Thr Glu Pro Asn Gln Asn Gln Phe Asn Phe Thr Asn Ala Asp Arg Ile
85 90 95
Phe Asn Trp Ala Val Gln Asn Gly Lys Gln Val Arg Gly His Thr Leu
100 105 110
Ala Trp His Ser Gln Gln Pro Gly Trp Met Ser Ser Met Ser Gly Thr
115 120 125
Ala Leu Arg Asn Ala Met Ile Asn His Ile Asn Gly Val Met Ala His
130 135 140
Tyr Lys Gly Arg Ile Tyr Ala Trp Asp Val Val Asn Glu Ala Phe Asn
145 150 155 160
Glu Asp Gly Ser Arg Arg Asn Ser Asn Leu Gln Gln Thr Gly Asn Asp
165 170 175
Trp Ile Glu Val Ala Phe Arg Thr Ala Arg Thr Ala Asp Pro Ala Ala
180 185 190
Lys Leu Cys Tyr Asn Asp Tyr Asn Ile Glu Ala Trp Ser Tyr Ala Lys
195 200 205
Thr Gln Gly Val Tyr Arg Met Val Gln Asp Phe Lys Ser Arg Gly Val
210 215 220
Pro Ile Asp Cys Val Gly Phe Gln Ser His Phe Asn Ser Gly Thr Ser
225 230 235 240
Tyr Val Asn Ser Asn Phe Arg Thr Thr Leu Gln Ser Phe Ala Ala Leu
245 250 255
Gly Val Asp Val Gln Ile Thr Glu Leu Asp Val Glu Asn Ala Asp Ser
260 265 270
Arg Leu Asp Trp Trp Arg Gly Ile Val Asn Asp Cys Leu Ala Val Pro
275 280 285
Arg Cys Asn Gly Ile Thr Val Trp Gly Val Arg Asp Ser Asp Ser Trp
290 295 300
Arg Ser Ser Gln Asn Pro Leu Leu Phe Asn Ser Ser Gly Gly Lys Lys
305 310 315 320
Ala Ser Tyr Thr Ala Val Leu Asp Ala Leu Asn Ala Ala Pro Thr Val
325 330 335
Thr Pro Pro Val Thr Thr Pro Pro Val Thr Thr Pro Pro Val Thr Thr
340 345 350
Pro Pro Pro Gly Thr Val Ser Ile Asn Ala Gly Gly Ser Ala Ser Gly
355 360 365
Ser Phe Thr Ala Asp Gln Tyr Phe Ser Gly Gly Ser Thr Tyr Thr Asn
370 375 380
Thr Ala Thr Ile Asp Met Ser Gln Ile Thr Ser Asn Pro Pro Pro Ala
385 390 395 400
Ala Val Phe Asn Ser Glu Arg Tyr Gly Ala Met Thr Tyr Thr Ile Pro
405 410 415
Asn Arg Ser Gly Ala Gln Thr Val Thr Leu Tyr Phe Ala Glu Thr Tyr
420 425 430
Leu Thr Ala Ala Gly Gln Arg Ser Phe Asn Val Ser Ile Asn Gly Ala
435 440 445
Ala Ala Leu Ser Asn Phe Asp Ile Tyr Ala Ser Ala Gly Gly Ala Asn
450 455 460
Arg Ala Ile Ala Arg Thr Phe Ser Thr Thr Ala Asn Ser Ser Gly Gln
465 470 475 480
Val Val Ile Gln Phe Thr Ala Val Thr Glu Asn Pro Lys Ile Asn Ala
485 490 495
Ile Thr Val Thr Ala Gly Gly Thr Pro Pro Pro Thr Thr Pro Pro Pro
500 505 510
Thr Thr Pro Pro Pro Thr Thr Pro Pro Val Thr Thr Pro Pro Val Thr
515 520 525
Thr Pro Pro Val Thr Thr Pro Pro Pro Gly Ser Val Ser Ile Asn Ala
530 535 540
Gly Gly Ser Ala Thr Gly Ser Phe Thr Gly Asp Gln Tyr Phe Ser Gly
545 550 555 560
Gly Ser Thr Tyr Thr Asn Thr Ala Thr Ile Asp Met Ser Gln Ile Thr
565 570 575
Ser Asn Pro Pro Pro Ala Ala Val Phe Asn Ser Glu Arg Tyr Gly Ala
580 585 590
Met Thr Tyr Thr Ile Pro Gly Arg Ser Gly Ala Gln Thr Val Thr Leu
595 600 605
Tyr Phe Ala Glu Thr Tyr Val Thr Ala Ala Gly Gln Arg Val Phe Asn
610 615 620
Val Ser Val Asn Gly Ala Ala Ala Leu Ser Asn Phe Asp Ile Tyr Ala
625 630 635 640
Ser Ala Gly Gly Gln Asn Arg Ala Ile Ala Arg Ser Phe Asn Thr Thr
645 650 655
Ala Asn Ser Ser Gly Gln Val Val Ile Gln Phe Thr Ala Val Thr Glu
660 665 670
Asn Pro Lys Ile Asn Ala Ile Thr Val Ala Gly Gly Ile Gly Asp Phe
675 680 685
Gln Thr Leu Thr Val Thr Lys Ser Gly Thr Gly Thr Val Thr Ser Asn
690 695 700
Pro Ala Gly Ile Asn Cys Gly Ser Thr Cys Asn Ala Ser Phe Ala Thr
705 710 715 720
Gly Thr Ser Val Thr Leu Thr Ala Ser Gly Gly Thr Phe Thr Gly Trp
725 730 735
Ser Gly Ala Cys Ser Gly Thr Ser Thr Thr Cys Thr Val Ser Met Thr
740 745 750
Gln Ala Arg Ser Val Thr Ala Thr Phe Ser Gly Gly Gly Asp Thr Arg
755 760 765
Pro Ser Ala Gly Cys Gly Lys Asn Arg Thr Leu Gln Asn Gly Thr Ile
770 775 780
Thr Ile Ser Ser Gly Gly Val Asn Arg Thr Tyr Ile Leu Arg Thr Pro
785 790 795 800
Asp Asn Tyr Asn Asn Thr His Ala Tyr Arg Leu Ile Met Ala Tyr His
805 810 815
Trp Leu Asn Gly Ser Ala Gln Asn Val Ala Ser Glu Asn Tyr Tyr Arg
820 825 830
Leu Phe Pro Leu Ser Asn Asn Ser Thr Ile Phe Val Ala Pro Gln Gly
835 840 845
Leu Asp Ala Gly Trp Ala Asn Thr Asn Asn Arg Asp Leu Asn Leu Thr
850 855 860
Asp Ala Ile Leu Thr Gln Val Glu Asn Asp Leu Cys Val Asp Leu Asn
865 870 875 880
Arg Val Trp Ala Thr Gly Phe Ser Tyr Gly Ala Gly Met Ser Tyr Ala
885 890 895
Ile Ala Cys Ala Arg Ala Asn Val Phe Arg Gly Val Ala Leu Tyr Ala
900 905 910
Gly Ala Gln Leu Ser Gly Cys Thr Gly Gly Thr Thr Ala Ile Ala Tyr
915 920 925
Phe Ala Thr His Gly Ile Asn Asp Ser Val Leu Asn Ile Ser Gln Gly
930 935 940
Arg Thr Leu Arg Asp Arg Phe Val Ser Asn Asn Ser Cys Thr Ala Gln
945 950 955 960
Asn Pro Pro Glu Pro Ser Ser Gly Ser Gly Thr His Ile Cys Thr Ser
965 970 975
Tyr Gln Asn Cys Ser Ala Gly His Pro Val Arg Trp Cys Ala Phe Asp
980 985 990
Gly Asp His Thr Pro Asn Gln Thr Asp Arg Gly Gln Ser Thr Ser
995 1000 1005
<210> 85
<211> 1254
<212> DNA
<213> Bacteria
<400> 85
atgaccttga ttacgccaag ctcgaaatta accctcacta aagggaacaa aagctggagc 60
tcgcgcgcct gcaggtcgac actagtggat ctcacacttt acttcgagtc tcagaatccg 120
accctcgagt tctacgtgga cgatgtgaag gtagtggaca ccacctctgc tgagataaaa 180
ctcgagatga atccagaaga ggaaatacca gccctcaggg aagttctgaa agactacttc 240
agagtgggcg ttgctcttcc atccaaggta ttcatcaacc agaaggactt aacgctcatc 300
accaagcact tcaacagcat caccgcagaa aatgagatga aacctgatag tctgcttgca 360
ggcattgaga atggcaaact caagttcaga tttgaaacag cagacaaata catcgaattt 420
gcacagcaaa acggcatggt tgtgaggggc cacacactgg tatggcacaa tcagacgccc 480
gagtggttct tcaaagacga aaatggaaac ctcctctcca aagaagcgat gacagaaaga 540
ctcagagaat acatacacac cgtcgttgga cacttcaaag ggaaggtcta cgcatgggac 600
gttgtgaacg aagcggtcga tccgaaccag ccagatggac tgagaagatc cacctggtat 660
cagatcatgg ggcctgacta catagaactt gccttcaagt ttgcaaggga ggcagatccc 720
gatgcgaaac tcttctacaa cgactacaac accttcgaac ccaaaaagag agacatcatc 780
tacaaccttg tgaagagtct caaggaaaag ggtctcatcg atggaatcgg tatgcagtgt 840
cacatcagtc ttgcaacgga catcaggcag atcgaagagg ccatcaaaaa gttcagctcc 900
atccctggta tagaaatcca cataacagag ctcgatatga gcgtctacag agattctact 960
tccaactacc cagaggcacc gaggaacgca ctcattgaac aggctcacaa gatggctcaa 1020
ctctttgaaa tcttcaagaa atacagtaat gtgatcacaa acgtcacgtt ctggggtctc 1080
aaagacgact actcctggag agcaacaaga agaaatgact ggacattgat ctttgacaaa 1140
gattatcagg caaaactcgc ttactgggcg attgtcgctc ctgaagtgct accacctctt 1200
tcaaaagaaa gcaagatcca aagaattcaa aaagcttctc gagagtactt ctag 1254
<210> 86
<211> 417
<212> PRT
<213> Bacteria
<400> 86
Met Thr Leu Ile Thr Pro Ser Ser Lys Leu Thr Leu Thr Lys Gly Asn
1 5 10 15
Lys Ser Trp Ser Ser Arg Ala Cys Arg Ser Thr Leu Val Asp Leu Thr
20 25 30
Leu Tyr Phe Glu Ser Gln Asn Pro Thr Leu Glu Phe Tyr Val Asp Asp
35 40 45
Val Lys Val Val Asp Thr Thr Ser Ala Glu Ile Lys Leu Glu Met Asn
50 55 60
Pro Glu Glu Glu Ile Pro Ala Leu Arg Glu Val Leu Lys Asp Tyr Phe
65 70 75 80
Arg Val Gly Val Ala Leu Pro Ser Lys Val Phe Ile Asn Gln Lys Asp
85 90 95
Leu Thr Leu Ile Thr Lys His Phe Asn Ser Ile Thr Ala Glu Asn Glu
100 105 110
Met Lys Pro Asp Ser Leu Leu Ala Gly Ile Glu Asn Gly Lys Leu Lys
115 120 125
Phe Arg Phe Glu Thr Ala Asp Lys Tyr Ile Glu Phe Ala Gln Gln Asn
130 135 140
Gly Met Val Val Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro
145 150 155 160
Glu Trp Phe Phe Lys Asp Glu Asn Gly Asn Leu Leu Ser Lys Glu Ala
165 170 175
Met Thr Glu Arg Leu Arg Glu Tyr Ile His Thr Val Val Gly His Phe
180 185 190
Lys Gly Lys Val Tyr Ala Trp Asp Val Val Asn Glu Ala Val Asp Pro
195 200 205
Asn Gln Pro Asp Gly Leu Arg Arg Ser Thr Trp Tyr Gln Ile Met Gly
210 215 220
Pro Asp Tyr Ile Glu Leu Ala Phe Lys Phe Ala Arg Glu Ala Asp Pro
225 230 235 240
Asp Ala Lys Leu Phe Tyr Asn Asp Tyr Asn Thr Phe Glu Pro Lys Lys
245 250 255
Arg Asp Ile Ile Tyr Asn Leu Val Lys Ser Leu Lys Glu Lys Gly Leu
260 265 270
Ile Asp Gly Ile Gly Met Gln Cys His Ile Ser Leu Ala Thr Asp Ile
275 280 285
Arg Gln Ile Glu Glu Ala Ile Lys Lys Phe Ser Ser Ile Pro Gly Ile
290 295 300
Glu Ile His Ile Thr Glu Leu Asp Met Ser Val Tyr Arg Asp Ser Thr
305 310 315 320
Ser Asn Tyr Pro Glu Ala Pro Arg Asn Ala Leu Ile Glu Gln Ala His
325 330 335
Lys Met Ala Gln Leu Phe Glu Ile Phe Lys Lys Tyr Ser Asn Val Ile
340 345 350
Thr Asn Val Thr Phe Trp Gly Leu Lys Asp Asp Tyr Ser Trp Arg Ala
355 360 365
Thr Arg Arg Asn Asp Trp Thr Leu Ile Phe Asp Lys Asp Tyr Gln Ala
370 375 380
Lys Leu Ala Tyr Trp Ala Ile Val Ala Pro Glu Val Leu Pro Pro Leu
385 390 395 400
Ser Lys Glu Ser Lys Ile Gln Arg Ile Gln Lys Ala Ser Arg Glu Tyr
405 410 415
Phe
<210> 87
<211> 1089
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 87
ttgaagaaca gaattaaaaa ggttgtgggc gggctcgccc tggcgagtgt tctgctcacc 60
tcggtaatgg caggcaatgc cagcgcagca attaccaatg gatcgaagtt cctggggaat 120
atcattgccg gcagtgctcc aagtaacttc accacctact ggaatcaggt caccccggag 180
aacggcacca aatggggttc catcgaaggc aaccgcaacc agatgaactg gggaaacgcg 240
gacatgatct ataactacgc catcagcaaa aacatcccgt tcaaattcca tactctcgtc 300
tggggaagcc aggagcccaa ctgggtggcc ggcttgtcgg cagcggagca gaaggcggaa 360
atcagctcat tcattactca agcaggacag cgttattccg cgaagacagc ttttgtggat 420
gtagtcaatg aaccgctgca tgccaagcct tcgtaccgca atgccatcgg cggcgatggc 480
agcaccggct gggattgggt gatctggtct ttccagcaag cccgggccgc cttcccgaac 540
gccaagctgc acctcaatga ctacggcatt atcggtgacc ccagcgcggc cgataaatat 600
gtgaacatta tcaatatcct gaaatccaga ggactgatcg atggtattgg tattcagtgc 660
cactacttca atatggataa cgtaagtgtg agcaccatga atactgtact gggtaagctt 720
gctgcaacag gcctgccaat ctatgtctcc gagctggata ttaccggtga tgacaacacc 780
cagcttgcca gataccaaca gaaattccct gtgctctgga accatccttc cgtgaagggc 840
gtcaccctgt ggggctacat ccaaaatcag acctgggcat caggcaccca tctggtgaat 900
tccaacggca cagagcgccc tgccctgaag tggctgaagc aatacctggg cggctcgtca 960
gctctgatgg aaaccacaga cgcccaagac ctcactatca ctgacagtct gatccagccg 1020
gacagtgtgg ttgagccgga ccctcaactg gatctccagc cggtgcttga gcccgttccg 1080
gctgagtaa 1089
<210> 88
<211> 362
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(29)
<400> 88
Leu Lys Asn Arg Ile Lys Lys Val Val Gly Gly Leu Ala Leu Ala Ser
1 5 10 15
Val Leu Leu Thr Ser Val Met Ala Gly Asn Ala Ser Ala Ala Ile Thr
20 25 30
Asn Gly Ser Lys Phe Leu Gly Asn Ile Ile Ala Gly Ser Ala Pro Ser
35 40 45
Asn Phe Thr Thr Tyr Trp Asn Gln Val Thr Pro Glu Asn Gly Thr Lys
50 55 60
Trp Gly Ser Ile Glu Gly Asn Arg Asn Gln Met Asn Trp Gly Asn Ala
65 70 75 80
Asp Met Ile Tyr Asn Tyr Ala Ile Ser Lys Asn Ile Pro Phe Lys Phe
85 90 95
His Thr Leu Val Trp Gly Ser Gln Glu Pro Asn Trp Val Ala Gly Leu
100 105 110
Ser Ala Ala Glu Gln Lys Ala Glu Ile Ser Ser Phe Ile Thr Gln Ala
115 120 125
Gly Gln Arg Tyr Ser Ala Lys Thr Ala Phe Val Asp Val Val Asn Glu
130 135 140
Pro Leu His Ala Lys Pro Ser Tyr Arg Asn Ala Ile Gly Gly Asp Gly
145 150 155 160
Ser Thr Gly Trp Asp Trp Val Ile Trp Ser Phe Gln Gln Ala Arg Ala
165 170 175
Ala Phe Pro Asn Ala Lys Leu His Leu Asn Asp Tyr Gly Ile Ile Gly
180 185 190
Asp Pro Ser Ala Ala Asp Lys Tyr Val Asn Ile Ile Asn Ile Leu Lys
195 200 205
Ser Arg Gly Leu Ile Asp Gly Ile Gly Ile Gln Cys His Tyr Phe Asn
210 215 220
Met Asp Asn Val Ser Val Ser Thr Met Asn Thr Val Leu Gly Lys Leu
225 230 235 240
Ala Ala Thr Gly Leu Pro Ile Tyr Val Ser Glu Leu Asp Ile Thr Gly
245 250 255
Asp Asp Asn Thr Gln Leu Ala Arg Tyr Gln Gln Lys Phe Pro Val Leu
260 265 270
Trp Asn His Pro Ser Val Lys Gly Val Thr Leu Trp Gly Tyr Ile Gln
275 280 285
Asn Gln Thr Trp Ala Ser Gly Thr His Leu Val Asn Ser Asn Gly Thr
290 295 300
Glu Arg Pro Ala Leu Lys Trp Leu Lys Gln Tyr Leu Gly Gly Ser Ser
305 310 315 320
Ala Leu Met Glu Thr Thr Asp Ala Gln Asp Leu Thr Ile Thr Asp Ser
325 330 335
Leu Ile Gln Pro Asp Ser Val Val Glu Pro Asp Pro Gln Leu Asp Leu
340 345 350
Gln Pro Val Leu Glu Pro Val Pro Ala Glu
355 360
<210> 89
<211> 2541
<212> DNA
<213> Bacteria
<400> 89
atggatacat tgttcaatac aaccgatgag cgtggggcgt ccaagcgccg tggcatcgtc 60
gcggcgcttg cggccgcagc catgctggtg ccgctggcgt tcgccccgac ggccatggcg 120
gccgaccccg actatccggg cggcatcaag ggcgaataca atccgctggg aatcaacgct 180
ggtgtcgcca tcgagacata caccctcaac caggacaagg agaaggccct ggtcgagaac 240
ttcgaccaga tcaccccgga gaactcgctg aagccggaag gctggtacga cgaccagcat 300
aatttccgca tgtcggatga cgcgcggaac ctgctgacgt tcgccagcga gaacggcatc 360
aaggtctacg gccatgttct ggtctggcac tcgcagacgc ccgactggtt cttccaggcc 420
gacgaatggt gccatgacac caacgacaac cccggcgtca ccagctgccc gcttgccgac 480
aaggccacga tgcaggaacg ccagcgcagg cacatcgaga acgtggcgga ggccatctcc 540
gacgaattcg gaaaattcgg cagcccgacc aatcccgtcg tcgcgttcga cgtggtcaac 600
gagaccgtga acgacagcga cgaccccgcc accaacggca tgcgcaattc gctgtggtat 660
cagacctatg ggggcgagga ctacatctat gacgcgttcc ggaacgcgaa tacgtatctg 720
aacgacgtct acgccgccga cgacgcggag catccggtga cgttgttcat caacgattac 780
ggcaccgagc aggcgggcaa gcgttcccgc tacaaggcgc ttctggaacg catgatccag 840
cagggggttc cctttgacgg catcggtcac cagttccatg tgtcgttgac cacggcctcg 900
tcgaatctcg acgacgcgct gaccgatatg tcctcgctcg gcaagaagca ggccatcacc 960
gaactggacg tcgccaccgg aacgccggtt acggaggcga agctcatcga gcagggacgg 1020
tactactacg acgtcaacca gatcatccac aggcacgccg accagctgtt ctcggtttcg 1080
gtgtgggggc tgagcgacga ccagtcctgg cgcaacaagg agggcgcgcc gctgctgttc 1140
gacgacaacc tggagaagaa gccggcgtac atcggctaca tcggtgatag cgccaacctt 1200
cccgagccgt tgaagagcat gaacgcattc aaggatgacg ccgtgggcat cgactcggcg 1260
cttcccggta ccgtggccga gtccggcgcg tcctctccgt gggaacgtct ttcgctggtc 1320
gagatgaccc cgtctgcgta tgacgccgtt tccggctcgt tcaatgtcta ttggaaggac 1380
ggctctctgg tcgtctacgc ggatgtcgcc gatgccagcg cggcggatga cgacaccgtc 1440
accgtgcgtg tgggtgacgc cgagtatacg atcggccgca acggtgtgac cggcggcgag 1500
ggtgtgcagg ccaacgtcgt ttcgtctgat gccggatacg aagtcgtggc cgatatcccg 1560
tacaccggtg cagagaagga catcgtcgag atgaacgtca tcgcgacgga ttccgccacc 1620
acggagacca gcgcgtggag cacgaacgac actggcgccg tcacgctggc cgagccgctg 1680
agctacacgg aagccgtgaa ggttcccgcc gacgcccagg ctccggtcgt tgacgccgac 1740
ccgtcggatt ccgtctgggc ggaagccaac gaggttcccg tgggtaaggt gaccgccgcc 1800
acgccttccc ccgaggcgac cgctaccgcc aagaccctgt ggtcggacgg caagctgtat 1860
gtcctcatgg aagtgaccga cgcggacatc gatctgacca actcgaatcc gtgggagaag 1920
gactccgttg aggtgtacat cgaccgtggc aacaccaaga gcggccagta taccaacgac 1980
atccagcaga ttcgcgtgtc cgccgatggt gcggagctga gcttcggctc cggcgcgtcg 2040
gaggatgtcc agaagtccat ggtccagacc gccggcaagc tcgtcgatgg cggctatgtc 2100
gtcgagatgg ccatcgatct gggaacggct gaggccggca ccttcgaagg tgtcgacttc 2160
cagatcaacg acgcgaagaa cggtgctcga atcggcatcc gcaactgggc cgatccgacc 2220
ggtgccggct atcagacggc gtcccattgg ggcgtgctgc gtctgctggc cgatccctcc 2280
gaaaccgaga ccccgggtgg agaagatccc gagacccccg gtgacgagga gactcctggc 2340
gaggataccg agaagcctgg cgacgaggaa acccccggtg aggataccga gaagcctggc 2400
gacgagaagc cgcggccttc cgacgatgct gacaacgacg acaagatgcc gcagaccggt 2460
tccgcggtca tcggaatcgc cgtggtggcg ctgctgctgg ttgccgccgg atgcgggctg 2520
gtcatcgctc ggcgtcgatg a 2541
<210> 90
<211> 846
<212> PRT
<213> Bacteria
<220>
<221> SIGNAL
<222> (1)...(40)
<400> 90
Met Asp Thr Leu Phe Asn Thr Thr Asp Glu Arg Gly Ala Ser Lys Arg
1 5 10 15
Arg Gly Ile Val Ala Ala Leu Ala Ala Ala Ala Met Leu Val Pro Leu
20 25 30
Ala Phe Ala Pro Thr Ala Met Ala Ala Asp Pro Asp Tyr Pro Gly Gly
35 40 45
Ile Lys Gly Glu Tyr Asn Pro Leu Gly Ile Asn Ala Gly Val Ala Ile
50 55 60
Glu Thr Tyr Thr Leu Asn Gln Asp Lys Glu Lys Ala Leu Val Glu Asn
65 70 75 80
Phe Asp Gln Ile Thr Pro Glu Asn Ser Leu Lys Pro Glu Gly Trp Tyr
85 90 95
Asp Asp Gln His Asn Phe Arg Met Ser Asp Asp Ala Arg Asn Leu Leu
100 105 110
Thr Phe Ala Ser Glu Asn Gly Ile Lys Val Tyr Gly His Val Leu Val
115 120 125
Trp His Ser Gln Thr Pro Asp Trp Phe Phe Gln Ala Asp Glu Trp Cys
130 135 140
His Asp Thr Asn Asp Asn Pro Gly Val Thr Ser Cys Pro Leu Ala Asp
145 150 155 160
Lys Ala Thr Met Gln Glu Arg Gln Arg Arg His Ile Glu Asn Val Ala
165 170 175
Glu Ala Ile Ser Asp Glu Phe Gly Lys Phe Gly Ser Pro Thr Asn Pro
180 185 190
Val Val Ala Phe Asp Val Val Asn Glu Thr Val Asn Asp Ser Asp Asp
195 200 205
Pro Ala Thr Asn Gly Met Arg Asn Ser Leu Trp Tyr Gln Thr Tyr Gly
210 215 220
Gly Glu Asp Tyr Ile Tyr Asp Ala Phe Arg Asn Ala Asn Thr Tyr Leu
225 230 235 240
Asn Asp Val Tyr Ala Ala Asp Asp Ala Glu His Pro Val Thr Leu Phe
245 250 255
Ile Asn Asp Tyr Gly Thr Glu Gln Ala Gly Lys Arg Ser Arg Tyr Lys
260 265 270
Ala Leu Leu Glu Arg Met Ile Gln Gln Gly Val Pro Phe Asp Gly Ile
275 280 285
Gly His Gln Phe His Val Ser Leu Thr Thr Ala Ser Ser Asn Leu Asp
290 295 300
Asp Ala Leu Thr Asp Met Ser Ser Leu Gly Lys Lys Gln Ala Ile Thr
305 310 315 320
Glu Leu Asp Val Ala Thr Gly Thr Pro Val Thr Glu Ala Lys Leu Ile
325 330 335
Glu Gln Gly Arg Tyr Tyr Tyr Asp Val Asn Gln Ile Ile His Arg His
340 345 350
Ala Asp Gln Leu Phe Ser Val Ser Val Trp Gly Leu Ser Asp Asp Gln
355 360 365
Ser Trp Arg Asn Lys Glu Gly Ala Pro Leu Leu Phe Asp Asp Asn Leu
370 375 380
Glu Lys Lys Pro Ala Tyr Ile Gly Tyr Ile Gly Asp Ser Ala Asn Leu
385 390 395 400
Pro Glu Pro Leu Lys Ser Met Asn Ala Phe Lys Asp Asp Ala Val Gly
405 410 415
Ile Asp Ser Ala Leu Pro Gly Thr Val Ala Glu Ser Gly Ala Ser Ser
420 425 430
Pro Trp Glu Arg Leu Ser Leu Val Glu Met Thr Pro Ser Ala Tyr Asp
435 440 445
Ala Val Ser Gly Ser Phe Asn Val Tyr Trp Lys Asp Gly Ser Leu Val
450 455 460
Val Tyr Ala Asp Val Ala Asp Ala Ser Ala Ala Asp Asp Asp Thr Val
465 470 475 480
Thr Val Arg Val Gly Asp Ala Glu Tyr Thr Ile Gly Arg Asn Gly Val
485 490 495
Thr Gly Gly Glu Gly Val Gln Ala Asn Val Val Ser Ser Asp Ala Gly
500 505 510
Tyr Glu Val Val Ala Asp Ile Pro Tyr Thr Gly Ala Glu Lys Asp Ile
515 520 525
Val Glu Met Asn Val Ile Ala Thr Asp Ser Ala Thr Thr Glu Thr Ser
530 535 540
Ala Trp Ser Thr Asn Asp Thr Gly Ala Val Thr Leu Ala Glu Pro Leu
545 550 555 560
Ser Tyr Thr Glu Ala Val Lys Val Pro Ala Asp Ala Gln Ala Pro Val
565 570 575
Val Asp Ala Asp Pro Ser Asp Ser Val Trp Ala Glu Ala Asn Glu Val
580 585 590
Pro Val Gly Lys Val Thr Ala Ala Thr Pro Ser Pro Glu Ala Thr Ala
595 600 605
Thr Ala Lys Thr Leu Trp Ser Asp Gly Lys Leu Tyr Val Leu Met Glu
610 615 620
Val Thr Asp Ala Asp Ile Asp Leu Thr Asn Ser Asn Pro Trp Glu Lys
625 630 635 640
Asp Ser Val Glu Val Tyr Ile Asp Arg Gly Asn Thr Lys Ser Gly Gln
645 650 655
Tyr Thr Asn Asp Ile Gln Gln Ile Arg Val Ser Ala Asp Gly Ala Glu
660 665 670
Leu Ser Phe Gly Ser Gly Ala Ser Glu Asp Val Gln Lys Ser Met Val
675 680 685
Gln Thr Ala Gly Lys Leu Val Asp Gly Gly Tyr Val Val Glu Met Ala
690 695 700
Ile Asp Leu Gly Thr Ala Glu Ala Gly Thr Phe Glu Gly Val Asp Phe
705 710 715 720
Gln Ile Asn Asp Ala Lys Asn Gly Ala Arg Ile Gly Ile Arg Asn Trp
725 730 735
Ala Asp Pro Thr Gly Ala Gly Tyr Gln Thr Ala Ser His Trp Gly Val
740 745 750
Leu Arg Leu Leu Ala Asp Pro Ser Glu Thr Glu Thr Pro Gly Gly Glu
755 760 765
Asp Pro Glu Thr Pro Gly Asp Glu Glu Thr Pro Gly Glu Asp Thr Glu
770 775 780
Lys Pro Gly Asp Glu Glu Thr Pro Gly Glu Asp Thr Glu Lys Pro Gly
785 790 795 800
Asp Glu Lys Pro Arg Pro Ser Asp Asp Ala Asp Asn Asp Asp Lys Met
805 810 815
Pro Gln Thr Gly Ser Ala Val Ile Gly Ile Ala Val Val Ala Leu Leu
820 825 830
Leu Val Ala Ala Gly Cys Gly Leu Val Ile Ala Arg Arg Arg
835 840 845
<210> 91
<211> 1023
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 91
atgaatgtat cggtaccggc cgagtccgca cttaaagaca tcttcgcgga agacttccat 60
ataggtgcgg cggtcagtag taatacgatc aagtcgcagg agagtctgct tacgcatcac 120
tttaacagca ttacggcgga aaacgaaatg aagttcgcca gcgtccatcc agaggaagag 180
ctttacacct tcgaggaagc ggatcagatc gtggacttcg cgcgcaaaca cgggatggct 240
gtccgcggac atacgctggt atggcataac cagaccaccg attggttgtt ccgcgacaag 300
cagaatcagc tcgtgagcaa agccgtgctt tatgaaagaa tccgttcgca tatccaaacg 360
gtagtaggca gatataaggg cgatatttac gcttgggacg ttgtgaacga ggtcattgcc 420
gatgacggcg atcagttgct gcgtacctcc agctggacgg aaatcgccgg ggacgaattc 480
atcgccaaag cgtttgaata cgcgcatgct gccgacccga atgcgctgtt gttctacaac 540
gactacaatg agtcccatcc aagcaaacgg gataaaattt ataccttggt caagtctctt 600
ctggaccggg gagtacctat tcacggcatt ggcctgcagg cacactggaa tctgttcaac 660
ccgtccttgg atgacatccg ggcagccatc gaaaaatatg cttcgctagg attgcagctc 720
cagctcacgg aactggatgt gtcggtattc cgtttcgaag ataagcgggc cgatctgacc 780
gagcctgaac cgggaatgct ggaacagcag gctgaattct acgaagccgt gttcaagctg 840
cttaaggaat acagcgatgt aattagcgcg gtgacgttct ggggagctgc ggacgaccac 900
acctggctca gcgattttcc ggtacgtggg cgcaaaaact ggccgctgct gttcgatgag 960
cggcacaggc cgaagccggc atattatcgc ttagctgctc ttgccaatca tcttcggcgt 1020
tga 1023
<210> 92
<211> 340
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 92
Met Asn Val Ser Val Pro Ala Glu Ser Ala Leu Lys Asp Ile Phe Ala
1 5 10 15
Glu Asp Phe His Ile Gly Ala Ala Val Ser Ser Asn Thr Ile Lys Ser
20 25 30
Gln Glu Ser Leu Leu Thr His His Phe Asn Ser Ile Thr Ala Glu Asn
35 40 45
Glu Met Lys Phe Ala Ser Val His Pro Glu Glu Glu Leu Tyr Thr Phe
50 55 60
Glu Glu Ala Asp Gln Ile Val Asp Phe Ala Arg Lys His Gly Met Ala
65 70 75 80
Val Arg Gly His Thr Leu Val Trp His Asn Gln Thr Thr Asp Trp Leu
85 90 95
Phe Arg Asp Lys Gln Asn Gln Leu Val Ser Lys Ala Val Leu Tyr Glu
100 105 110
Arg Ile Arg Ser His Ile Gln Thr Val Val Gly Arg Tyr Lys Gly Asp
115 120 125
Ile Tyr Ala Trp Asp Val Val Asn Glu Val Ile Ala Asp Asp Gly Asp
130 135 140
Gln Leu Leu Arg Thr Ser Ser Trp Thr Glu Ile Ala Gly Asp Glu Phe
145 150 155 160
Ile Ala Lys Ala Phe Glu Tyr Ala His Ala Ala Asp Pro Asn Ala Leu
165 170 175
Leu Phe Tyr Asn Asp Tyr Asn Glu Ser His Pro Ser Lys Arg Asp Lys
180 185 190
Ile Tyr Thr Leu Val Lys Ser Leu Leu Asp Arg Gly Val Pro Ile His
195 200 205
Gly Ile Gly Leu Gln Ala His Trp Asn Leu Phe Asn Pro Ser Leu Asp
210 215 220
Asp Ile Arg Ala Ala Ile Glu Lys Tyr Ala Ser Leu Gly Leu Gln Leu
225 230 235 240
Gln Leu Thr Glu Leu Asp Val Ser Val Phe Arg Phe Glu Asp Lys Arg
245 250 255
Ala Asp Leu Thr Glu Pro Glu Pro Gly Met Leu Glu Gln Gln Ala Glu
260 265 270
Phe Tyr Glu Ala Val Phe Lys Leu Leu Lys Glu Tyr Ser Asp Val Ile
275 280 285
Ser Ala Val Thr Phe Trp Gly Ala Ala Asp Asp His Thr Trp Leu Ser
290 295 300
Asp Phe Pro Val Arg Gly Arg Lys Asn Trp Pro Leu Leu Phe Asp Glu
305 310 315 320
Arg His Arg Pro Lys Pro Ala Tyr Tyr Arg Leu Ala Ala Leu Ala Asn
325 330 335
His Leu Arg Arg
340
<210> 93
<211> 1011
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 93
atgaatcaat cagtaaatga agcacaggtt cctgcattat cggatgtata tgaagattat 60
ttttcaatag gtgccgctgt taatccactt actttaggta cgcaaaaaaa gctgttaacc 120
aaacatttta atagtataac ggctgagaat gaaatgaaat ttgaagcatt acagcctaaa 180
ccagatcaat ttacatttga tacggcggat aaaatggttg cctttgccca agcacatgat 240
atgaagatgc gtggccatac attaatctgg cacaatcaaa caccagattg gatgtttttg 300
caaaaagacg gtacgacaat tgatcgtgaa acactcttgg agagaatgaa aaaacatatt 360
aagacggtgg tggaaagata taaaggcaaa atatattgtt gggacgttgt aaatgaagcg 420
gtagctgatg aaggcgaagc tattttaaga ccatcaaaat ggacggacat tattggcgac 480
tcgtttattg agtatgcttt taaatacgcc cacgaggccg atcccgatgc actgttgttt 540
tacaatgact acaatgcttg ccaccctcat aaaagagata agatttatca acttgtaaag 600
gggttaatag acaagggtgt gcccatacac ggtattggcc tacaagcaca ttggaacatt 660
gttgacccgt cttacgatga tattaaacga gccatcgaaa cttatgcatc attaggatta 720
agcatacact ttactgaaat ggatgtgtct gtttttgaat atcatgatcg aagaacagac 780
ttattggaac ctacaaaaga tatggtttca cgtcaagctg agcgttatca ggcatttttt 840
gaaatattta ggtcgtatgc tgatgtgatt gattccgtta cgttttgggg catggccgat 900
gattatacat ggcttgatga ttttccggtg acaggtcgaa aaaattggcc ctttgtattt 960
gatgcgagac atcagcctaa aacagcattc tggaacatcg ttgattttta a 1011
<210> 94
<211> 336
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 94
Met Asn Gln Ser Val Asn Glu Ala Gln Val Pro Ala Leu Ser Asp Val
1 5 10 15
Tyr Glu Asp Tyr Phe Ser Ile Gly Ala Ala Val Asn Pro Leu Thr Leu
20 25 30
Gly Thr Gln Lys Lys Leu Leu Thr Lys His Phe Asn Ser Ile Thr Ala
35 40 45
Glu Asn Glu Met Lys Phe Glu Ala Leu Gln Pro Lys Pro Asp Gln Phe
50 55 60
Thr Phe Asp Thr Ala Asp Lys Met Val Ala Phe Ala Gln Ala His Asp
65 70 75 80
Met Lys Met Arg Gly His Thr Leu Ile Trp His Asn Gln Thr Pro Asp
85 90 95
Trp Met Phe Leu Gln Lys Asp Gly Thr Thr Ile Asp Arg Glu Thr Leu
100 105 110
Leu Glu Arg Met Lys Lys His Ile Lys Thr Val Val Glu Arg Tyr Lys
115 120 125
Gly Lys Ile Tyr Cys Trp Asp Val Val Asn Glu Ala Val Ala Asp Glu
130 135 140
Gly Glu Ala Ile Leu Arg Pro Ser Lys Trp Thr Asp Ile Ile Gly Asp
145 150 155 160
Ser Phe Ile Glu Tyr Ala Phe Lys Tyr Ala His Glu Ala Asp Pro Asp
165 170 175
Ala Leu Leu Phe Tyr Asn Asp Tyr Asn Ala Cys His Pro His Lys Arg
180 185 190
Asp Lys Ile Tyr Gln Leu Val Lys Gly Leu Ile Asp Lys Gly Val Pro
195 200 205
Ile His Gly Ile Gly Leu Gln Ala His Trp Asn Ile Val Asp Pro Ser
210 215 220
Tyr Asp Asp Ile Lys Arg Ala Ile Glu Thr Tyr Ala Ser Leu Gly Leu
225 230 235 240
Ser Ile His Phe Thr Glu Met Asp Val Ser Val Phe Glu Tyr His Asp
245 250 255
Arg Arg Thr Asp Leu Leu Glu Pro Thr Lys Asp Met Val Ser Arg Gln
260 265 270
Ala Glu Arg Tyr Gln Ala Phe Phe Glu Ile Phe Arg Ser Tyr Ala Asp
275 280 285
Val Ile Asp Ser Val Thr Phe Trp Gly Met Ala Asp Asp Tyr Thr Trp
290 295 300
Leu Asp Asp Phe Pro Val Thr Gly Arg Lys Asn Trp Pro Phe Val Phe
305 310 315 320
Asp Ala Arg His Gln Pro Lys Thr Ala Phe Trp Asn Ile Val Asp Phe
325 330 335
<210> 95
<211> 1143
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 95
atgaaaaaaa cgattgcaca tttcacctta tggatagtgt tttttctctt cacttcctgt 60
gctgttacgg cgcagaagaa tgctaagaat acaagagtaa aactcactac cctaaaagag 120
gcttaccaag gtaaattcta tatcggtact gcgatgaatc tgagacagat tcacggagat 180
gatccccagt ctgaaaatat tatcaaaaaa cagttcaatt ccatagttgc cgaaaactgc 240
atgaagagta tgtatcttca gccggaggaa ggaaaatttt tcttcgatga tgcggacaag 300
tttgtggatt ttggtcttca gaacaatatg ttcatcatcg ggcattgtct gatttggcat 360
tcgcaggcgc caaaatggtt tttcaccgat gagaatggaa aaacggtttc cccagaagtt 420
cttaaacaaa ggatgaaagc ccatatcacc gctgtcgttt cccgctacaa agggaaaatc 480
aaaggttggg atgtggtgaa cgaagccatt atggaagatg gttcttaccg caaaagcaaa 540
ttttatgaga ttttgggaga agaatttatt ccgttggcat ttcagtatgc gcatgaagca 600
gatcctgatg cagaacttta ttacaacgat tataacgaat ggtatcccgg aaaaagagct 660
acggtgacca agataatccg cgatttcaaa tctagaggaa tccgcattga tgccatcgga 720
atgcaggctc atttcgggat ggattcgccc actttagaag agtatgaaca aaccattcag 780
ggctatataa aagaaggcgt gaaagtcaat attacggaac tcgatttgag tccgcttcct 840
tctccttggg gaacttccgc caatgttgcc gatacgcagc agtatcagga aaaaatgaat 900
ccttacacca aaggacttcc cgccgatgtg gaaaaagcat gggaaaaccg ctatctcgat 960
tttttcaaac tgttcctgaa atatcatcag catatcgagc gtgttacgtt ttggggcgtt 1020
agcgatatcg attcctggaa gaacgatttt ccagtaagag gacgtaccga ttatccacta 1080
ccgtttaacc gacagtatca ggcaaaacct ttggtgcaga aattaataga cttaacgaaa 1140
tag 1143
<210> 96
<211> 380
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(24)
<400> 96
Met Lys Lys Thr Ile Ala His Phe Thr Leu Trp Ile Val Phe Phe Leu
1 5 10 15
Phe Thr Ser Cys Ala Val Thr Ala Gln Lys Asn Ala Lys Asn Thr Arg
20 25 30
Val Lys Leu Thr Thr Leu Lys Glu Ala Tyr Gln Gly Lys Phe Tyr Ile
35 40 45
Gly Thr Ala Met Asn Leu Arg Gln Ile His Gly Asp Asp Pro Gln Ser
50 55 60
Glu Asn Ile Ile Lys Lys Gln Phe Asn Ser Ile Val Ala Glu Asn Cys
65 70 75 80
Met Lys Ser Met Tyr Leu Gln Pro Glu Glu Gly Lys Phe Phe Phe Asp
85 90 95
Asp Ala Asp Lys Phe Val Asp Phe Gly Leu Gln Asn Asn Met Phe Ile
100 105 110
Ile Gly His Cys Leu Ile Trp His Ser Gln Ala Pro Lys Trp Phe Phe
115 120 125
Thr Asp Glu Asn Gly Lys Thr Val Ser Pro Glu Val Leu Lys Gln Arg
130 135 140
Met Lys Ala His Ile Thr Ala Val Val Ser Arg Tyr Lys Gly Lys Ile
145 150 155 160
Lys Gly Trp Asp Val Val Asn Glu Ala Ile Met Glu Asp Gly Ser Tyr
165 170 175
Arg Lys Ser Lys Phe Tyr Glu Ile Leu Gly Glu Glu Phe Ile Pro Leu
180 185 190
Ala Phe Gln Tyr Ala His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr
195 200 205
Asn Asp Tyr Asn Glu Trp Tyr Pro Gly Lys Arg Ala Thr Val Thr Lys
210 215 220
Ile Ile Arg Asp Phe Lys Ser Arg Gly Ile Arg Ile Asp Ala Ile Gly
225 230 235 240
Met Gln Ala His Phe Gly Met Asp Ser Pro Thr Leu Glu Glu Tyr Glu
245 250 255
Gln Thr Ile Gln Gly Tyr Ile Lys Glu Gly Val Lys Val Asn Ile Thr
260 265 270
Glu Leu Asp Leu Ser Pro Leu Pro Ser Pro Trp Gly Thr Ser Ala Asn
275 280 285
Val Ala Asp Thr Gln Gln Tyr Gln Glu Lys Met Asn Pro Tyr Thr Lys
290 295 300
Gly Leu Pro Ala Asp Val Glu Lys Ala Trp Glu Asn Arg Tyr Leu Asp
305 310 315 320
Phe Phe Lys Leu Phe Leu Lys Tyr His Gln His Ile Glu Arg Val Thr
325 330 335
Phe Trp Gly Val Ser Asp Ile Asp Ser Trp Lys Asn Asp Phe Pro Val
340 345 350
Arg Gly Arg Thr Asp Tyr Pro Leu Pro Phe Asn Arg Gln Tyr Gln Ala
355 360 365
Lys Pro Leu Val Gln Lys Leu Ile Asp Leu Thr Lys
370 375 380
<210> 97
<211> 1407
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 97
atgaatgaaa cctcgcggaa ttggttggag agaggattgc ctttcgaacg ccaacggcgt 60
tccaacattc agcccagggt tggcgcttgc gcctaccctg ggttggaagc aatcgctcca 120
tcaaccctga aagggttgca gcggaggttt gcacaagacc gatacaaccc tttcaggatt 180
ggctttctcc cttttccacc cagggtagcg cctgcggcgc aaccctgggc tgatggatca 240
gaacgccgtt ggcgttcccg gaaacctgcg aagaaacaac tcgccttcct ggccatcacc 300
agtctcctct cgggtctgct gtggggcgcc gaagtgcaac cggcactgaa agacgtattc 360
cgccaggact tcctgctggg ggcggcgttg aacgcggagc aggtgctgga caccaaccgg 420
gtcgagtcgg tattgatcga aaagcatttc aacacgatca cgcccgagaa tgtgctgaag 480
tgggaacgag tccatcctca gcccaaccag tattcttttg aggacgcgga tcgctacgtc 540
gagttcggcc gcaaacacgg aatggtcatc atcggccaca cgctggtctg gcacagccag 600
acgcccggct gggtcttccg ggatgccgac ggaaagacgc tgacgcgcga agccctgctg 660
gagcggatgc gcgaccacat ccacaccgtg gtcgggcgct acaagggcaa gatccgcggc 720
tgggatgtgg tgaacgaggc gctgcgcgac gacggcgcgt ggcggaattc ccaatggcgg 780
cggatcatcg gcgacgatta cattttgaaa gccttccagt atgcccatga ggccgatccg 840
gatgcggagc tctattacaa cgattattcg ctggagaagc cggccaagcg caatggcgcc 900
gtggacctgg tgaagcagct ccaggccggc ggggcgaagc tggccggcgt cggcttgcag 960
gggcactaca acctcgactg gccggagacc gccgagatcg aaaacaccat cgcggcgttc 1020
gcggagctgg ggctcaaggt gatgatcacg gagctggacg tcaacgcgct gccgacgccc 1080
ggccagtcgg gcgaagccga tgtagggatg acgttcggcg gcaatttcgg cggcgataaa 1140
tggaatcctt tcacgaacgg actgccggcc gcagtggagc aacgcctcgc ggaccgctac 1200
gctgaaatct tcaggatctt cacgaagcac agccgtcgga tttcgcgcgt caccttctgg 1260
ggcgtcaccg accggacctc ctggctcaac aattttccca tccgcggccg gaccaattac 1320
ccgttgctct ttgatcgggc tggggagccc aaacccgcgt tccgatccgt cgtggcggtc 1380
cgtcagccgc gccagcccgt cgaatga 1407
<210> 98
<211> 468
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 98
Met Asn Glu Thr Ser Arg Asn Trp Leu Glu Arg Gly Leu Pro Phe Glu
1 5 10 15
Arg Gln Arg Arg Ser Asn Ile Gln Pro Arg Val Gly Ala Cys Ala Tyr
20 25 30
Pro Gly Leu Glu Ala Ile Ala Pro Ser Thr Leu Lys Gly Leu Gln Arg
35 40 45
Arg Phe Ala Gln Asp Arg Tyr Asn Pro Phe Arg Ile Gly Phe Leu Pro
50 55 60
Phe Pro Pro Arg Val Ala Pro Ala Ala Gln Pro Trp Ala Asp Gly Ser
65 70 75 80
Glu Arg Arg Trp Arg Ser Arg Lys Pro Ala Lys Lys Gln Leu Ala Phe
85 90 95
Leu Ala Ile Thr Ser Leu Leu Ser Gly Leu Leu Trp Gly Ala Glu Val
100 105 110
Gln Pro Ala Leu Lys Asp Val Phe Arg Gln Asp Phe Leu Leu Gly Ala
115 120 125
Ala Leu Asn Ala Glu Gln Val Leu Asp Thr Asn Arg Val Glu Ser Val
130 135 140
Leu Ile Glu Lys His Phe Asn Thr Ile Thr Pro Glu Asn Val Leu Lys
145 150 155 160
Trp Glu Arg Val His Pro Gln Pro Asn Gln Tyr Ser Phe Glu Asp Ala
165 170 175
Asp Arg Tyr Val Glu Phe Gly Arg Lys His Gly Met Val Ile Ile Gly
180 185 190
His Thr Leu Val Trp His Ser Gln Thr Pro Gly Trp Val Phe Arg Asp
195 200 205
Ala Asp Gly Lys Thr Leu Thr Arg Glu Ala Leu Leu Glu Arg Met Arg
210 215 220
Asp His Ile His Thr Val Val Gly Arg Tyr Lys Gly Lys Ile Arg Gly
225 230 235 240
Trp Asp Val Val Asn Glu Ala Leu Arg Asp Asp Gly Ala Trp Arg Asn
245 250 255
Ser Gln Trp Arg Arg Ile Ile Gly Asp Asp Tyr Ile Leu Lys Ala Phe
260 265 270
Gln Tyr Ala His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr Asn Asp
275 280 285
Tyr Ser Leu Glu Lys Pro Ala Lys Arg Asn Gly Ala Val Asp Leu Val
290 295 300
Lys Gln Leu Gln Ala Gly Gly Ala Lys Leu Ala Gly Val Gly Leu Gln
305 310 315 320
Gly His Tyr Asn Leu Asp Trp Pro Glu Thr Ala Glu Ile Glu Asn Thr
325 330 335
Ile Ala Ala Phe Ala Glu Leu Gly Leu Lys Val Met Ile Thr Glu Leu
340 345 350
Asp Val Asn Ala Leu Pro Thr Pro Gly Gln Ser Gly Glu Ala Asp Val
355 360 365
Gly Met Thr Phe Gly Gly Asn Phe Gly Gly Asp Lys Trp Asn Pro Phe
370 375 380
Thr Asn Gly Leu Pro Ala Ala Val Glu Gln Arg Leu Ala Asp Arg Tyr
385 390 395 400
Ala Glu Ile Phe Arg Ile Phe Thr Lys His Ser Arg Arg Ile Ser Arg
405 410 415
Val Thr Phe Trp Gly Val Thr Asp Arg Thr Ser Trp Leu Asn Asn Phe
420 425 430
Pro Ile Arg Gly Arg Thr Asn Tyr Pro Leu Leu Phe Asp Arg Ala Gly
435 440 445
Glu Pro Lys Pro Ala Phe Arg Ser Val Val Ala Val Arg Gln Pro Arg
450 455 460
Gln Pro Val Glu
465
<210> 99
<211> 1074
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 99
gtgcgctcaa gagctagcgc gtactggttc ggcgtggggt tggtggtggc gctgagcctg 60
gctcagaccc cttcccccca gtccctgcgc gcgctggccg agcgccaggg gctgctggtg 120
ggagccgcgg tggacctagc ggccctgtac gaccccctcg agcccgagta cgcccaactc 180
ctcgcccgcg agttcaacct ggtggtggcc gagaacgcca tgaagtgggc ctccctgagc 240
aacgcgcggg ggcagtacag cttcaccggc gctgacgccc tggtgcgctt cgcccgccag 300
cacggccagc gcttgcgcgg ccacaccctc atctggcacg agcaactgcc cgcgtgggtg 360
cgcagcggca ccttctcccg cgaggccatg ctggcggtga tgcaggagca cattcaggcg 420
gtggccgggc acttccgcgg ccaggtggcc tactgggacg tggtcaacga ggcggtgagt 480
gaccggggcg gcctgcgcga gacccccttt ctgcgggcgg tgggccccga ctacctcgag 540
cacgccttcc gcttcgcccg cgccgccgac ccccaggcca agctcttcta caacgactac 600
ggcgccgacg gcatgggcgc taaatcggac gagatctacg ccctgctcaa agcgctcaag 660
gccaaggggg tacccgtcga cggggtgggc ttccaggccc acctcgacag caccttctcg 720
gtccagcagg cgcggatgcg ggagaaccta gagacgcttc gccgacctgg gcctcgaggt 780
gcacatcacc gagctggacg tgcagctaaa aggggcgggc tcgcgggagg aacggctgga 840
ggcgcaggcc cggatctacg ccgaggtgct ggcgacctgc cgcgcggtcc gcggctgcag 900
cgccgtgacg ctgtggggct tcaccgacgc ccactcctgg cgagccgccg ccgaacccct 960
gatcttcgac gcgctctacc ggcccaaacc ggcgtaccag gctctgctgc gggctctggg 1020
aggcaaccct tgagcctttt cagcccagtt ttgccaacga ggacagcact atga 1074
<210> 100
<211> 357
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(33)
<400> 100
Val Arg Ser Arg Ala Ser Ala Tyr Trp Phe Gly Val Gly Leu Val Val
1 5 10 15
Ala Leu Ser Leu Ala Gln Thr Pro Ser Pro Gln Ser Leu Arg Ala Leu
20 25 30
Ala Glu Arg Gln Gly Leu Leu Val Gly Ala Ala Val Asp Leu Ala Ala
35 40 45
Leu Tyr Asp Pro Leu Glu Pro Glu Tyr Ala Gln Leu Leu Ala Arg Glu
50 55 60
Phe Asn Leu Val Val Ala Glu Asn Ala Met Lys Trp Ala Ser Leu Ser
65 70 75 80
Asn Ala Arg Gly Gln Tyr Ser Phe Thr Gly Ala Asp Ala Leu Val Arg
85 90 95
Phe Ala Arg Gln His Gly Gln Arg Leu Arg Gly His Thr Leu Ile Trp
100 105 110
His Glu Gln Leu Pro Ala Trp Val Arg Ser Gly Thr Phe Ser Arg Glu
115 120 125
Ala Met Leu Ala Val Met Gln Glu His Ile Gln Ala Val Ala Gly His
130 135 140
Phe Arg Gly Gln Val Ala Tyr Trp Asp Val Val Asn Glu Ala Val Ser
145 150 155 160
Asp Arg Gly Gly Leu Arg Glu Thr Pro Phe Leu Arg Ala Val Gly Pro
165 170 175
Asp Tyr Leu Glu His Ala Phe Arg Phe Ala Arg Ala Ala Asp Pro Gln
180 185 190
Ala Lys Leu Phe Tyr Asn Asp Tyr Gly Ala Asp Gly Met Gly Ala Lys
195 200 205
Ser Asp Glu Ile Tyr Ala Leu Leu Lys Ala Leu Lys Ala Lys Gly Val
210 215 220
Pro Val Asp Gly Val Gly Phe Gln Ala His Leu Asp Ser Thr Phe Ser
225 230 235 240
Val Gln Gln Ala Arg Met Arg Glu Asn Leu Glu Thr Leu Arg Arg Pro
245 250 255
Gly Pro Arg Gly Ala His His Arg Ala Gly Arg Ala Ala Lys Arg Gly
260 265 270
Gly Leu Ala Gly Gly Thr Ala Gly Gly Ala Gly Pro Asp Leu Arg Arg
275 280 285
Gly Ala Gly Asp Leu Pro Arg Gly Pro Arg Leu Gln Arg Arg Asp Ala
290 295 300
Val Gly Leu His Arg Arg Pro Leu Leu Ala Ser Arg Arg Arg Thr Pro
305 310 315 320
Asp Leu Arg Arg Ala Leu Pro Ala Gln Thr Gly Val Pro Gly Ser Ala
325 330 335
Ala Gly Ser Gly Arg Gln Pro Leu Ser Leu Phe Ser Pro Val Leu Pro
340 345 350
Thr Arg Thr Ala Leu
355
<210> 101
<211> 1131
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 101
atgaagtatt ggcttacaac cctggtttta atgatagcgg gaataccctt ggcttttggt 60
tcttcagcaa agcaagataa atcaaagagt ttgaaagatg ctttcaaaaa caaattctat 120
atcggtgtgg ctttgaaccg gagtcaatat ctggaacaaa acgaacaggc ggataaagag 180
ataaaggcac agttcagctc tattgtagct gagaactgca tgaaaagcga aaatctggaa 240
cctaaagagg gaaaattctt ctttgacgat gccgatcgtt ttgtcgcttt tggagaaaaa 300
aatggaatgt acatcattgg acatacctta atttggcatt ctcaagtgcc aaaatggttt 360
ttcatagata atgaaggcaa agttgtttcc cgggaagttt tgattgaacg aatgaaaaac 420
tacatccata cagttgtcgg tcattataaa ggtcgagtta aaggttggga tgttgtcaat 480
gaggccattc tagatgatgg ctcatttaga caaagtaatt tctttaaaat actaggagcc 540
gattttatta aacttgcttt tcaatttgcc catgaagcag atcccaatgc tgagctttat 600
tacaacgatt attcgatgtc caatccgacc aaaagagacg gagtggttcg catggtgaag 660
tcattgcagc aacaaggtgt gagaatagac gctatcggaa tgcagggaca cgtagggatg 720
gattatccca agttggatga gtttgaaaat agtatcaaag ctttttcgtc tttaggaacc 780
aaagtgatga ttacggaact cgatttaagt gtcctaccaa ctcctaaagg aaaacaaggt 840
gctaatattt cggatgttgc cgcttatgag gaaaagataa atccttacaa aaatggtctg 900
ccggctgaag ttgaaaaggc ttgggaagac cggtatttgg attttttcaa attatttttg 960
aaatatcaac accaaatttc aagggttaca ttatgggggc ttagtgatca ggattcgtgg 1020
aaaaatgatt tcccagtcag agggagaacg gattatcctt tgcttttcga cagacaatac 1080
aaaccaaaac ctgtagttca gaaaattatt aaattagcat tgaaaaaata a 1131
<210> 102
<211> 376
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(23)
<400> 102
Met Lys Tyr Trp Leu Thr Thr Leu Val Leu Met Ile Ala Gly Ile Pro
1 5 10 15
Leu Ala Phe Gly Ser Ser Ala Lys Gln Asp Lys Ser Lys Ser Leu Lys
20 25 30
Asp Ala Phe Lys Asn Lys Phe Tyr Ile Gly Val Ala Leu Asn Arg Ser
35 40 45
Gln Tyr Leu Glu Gln Asn Glu Gln Ala Asp Lys Glu Ile Lys Ala Gln
50 55 60
Phe Ser Ser Ile Val Ala Glu Asn Cys Met Lys Ser Glu Asn Leu Glu
65 70 75 80
Pro Lys Glu Gly Lys Phe Phe Phe Asp Asp Ala Asp Arg Phe Val Ala
85 90 95
Phe Gly Glu Lys Asn Gly Met Tyr Ile Ile Gly His Thr Leu Ile Trp
100 105 110
His Ser Gln Val Pro Lys Trp Phe Phe Ile Asp Asn Glu Gly Lys Val
115 120 125
Val Ser Arg Glu Val Leu Ile Glu Arg Met Lys Asn Tyr Ile His Thr
130 135 140
Val Val Gly His Tyr Lys Gly Arg Val Lys Gly Trp Asp Val Val Asn
145 150 155 160
Glu Ala Ile Leu Asp Asp Gly Ser Phe Arg Gln Ser Asn Phe Phe Lys
165 170 175
Ile Leu Gly Ala Asp Phe Ile Lys Leu Ala Phe Gln Phe Ala His Glu
180 185 190
Ala Asp Pro Asn Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Met Ser Asn
195 200 205
Pro Thr Lys Arg Asp Gly Val Val Arg Met Val Lys Ser Leu Gln Gln
210 215 220
Gln Gly Val Arg Ile Asp Ala Ile Gly Met Gln Gly His Val Gly Met
225 230 235 240
Asp Tyr Pro Lys Leu Asp Glu Phe Glu Asn Ser Ile Lys Ala Phe Ser
245 250 255
Ser Leu Gly Thr Lys Val Met Ile Thr Glu Leu Asp Leu Ser Val Leu
260 265 270
Pro Thr Pro Lys Gly Lys Gln Gly Ala Asn Ile Ser Asp Val Ala Ala
275 280 285
Tyr Glu Glu Lys Ile Asn Pro Tyr Lys Asn Gly Leu Pro Ala Glu Val
290 295 300
Glu Lys Ala Trp Glu Asp Arg Tyr Leu Asp Phe Phe Lys Leu Phe Leu
305 310 315 320
Lys Tyr Gln His Gln Ile Ser Arg Val Thr Leu Trp Gly Leu Ser Asp
325 330 335
Gln Asp Ser Trp Lys Asn Asp Phe Pro Val Arg Gly Arg Thr Asp Tyr
340 345 350
Pro Leu Leu Phe Asp Arg Gln Tyr Lys Pro Lys Pro Val Val Gln Lys
355 360 365
Ile Ile Lys Leu Ala Leu Lys Lys
370 375
<210> 103
<211> 1449
<212> DNA
<213> Bacteria
<220>
<223> Obtained from an environmental sample
<400> 103
atgcgttcac attcccttcc cccgtccacc gtccgccgga aattgggcgg cctcggcgcg 60
gcgctgctcg tcggcgccgt cggcgccgcc accgtgctcg tggcgcccct cacctcgcac 120
gccgccgaga gcacgctcgg cgccgcggcg aagcagagcg gccggtactt cggcaccgcc 180
atcgcctcgg gcaggctcaa cgactcgacg tacacgacga tcgcgaaccg cgagttcaac 240
tcggtgaccg ccgagaacga gatgaagatc gacgccaccg aaccccagca gggccgcttc 300
gacttcaccg ccggcgaccg cgtctacaac tgggcggtgc agaacggcaa gcaggtacgg 360
ggccacaccc tggcctggca ctcccagcag cccgcctgga tgcagaacct cagcggcagc 420
gcgctgcgca cggcgatgac caaccacatc aacggcgtca tggcccacta caagggcaag 480
atcggccagt gggacgtcgt caacgaggcg ttcgcggacg gcagttcggg agcgcgccgg 540
gactccaacc tccagcggag cggcaacgac tggatcgagg tcgccttccg caccgcccgc 600
gccgccgacc cggccgccaa gctctgctac aacgactaca acgtcgagaa ctggacgtgg 660
gccaagaccc aggccatgta cgccatggtc aaggacttca agcagcgcgg cgtgcccatc 720
gactgcgtcg gcttccagtc gcacttcaac aacgacagcc cctacaacag caacttccgc 780
accaccctcc agagtttcgc cgccctcggc gtcgacgtgg ccatcaccga actcgacatc 840
cagggcgcct cgggcacgac ctacgccaac gtgaccaacg actgcctggc cgtcccgcgc 900
tgcctcggca tcaccgtctg gggtgtccgc gacaccgact cctggcgagc cgagcacact 960
ccgctgctct tcaacggcga cggcagcaag aagcccgcct actcctccgt cctcaacgcc 1020
ctcaactccg tctcccccaa ccccaacccc actccgaccc cctcccccgg cgccgggccg 1080
atcaagggag tcgcctcggg ccgctgcgtg gacgtacccg gagccggcac cgccgacggc 1140
acccaggtcc agctgtggga ctgcaacaac cgcaccaacc agcagtggac cctcaccgcc 1200
gccggtgagc tcagggtcta cggcgacaag tgcctggacg ccgccggcac cggcaacggc 1260
gccaaggtcc agatctacag ctgctggggc ggcgacaacc agaagtggcg cctcaactcc 1320
gacggttcca tcgtcggtgt ccagtccggc ctctgcctcg acgccgctgc cggcggcacc 1380
gccaacggca cgctgatcca gctctactcc tgctggaaca gcggcaacca gcgctggacc 1440
cgcacctga 1449
<210> 104
<211> 482
<212> PRT
<213> Bacteria
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(41)
<400> 104
Met Arg Ser His Ser Leu Pro Pro Ser Thr Val Arg Arg Lys Leu Gly
1 5 10 15
Gly Leu Gly Ala Ala Leu Leu Val Gly Ala Val Gly Ala Ala Thr Val
20 25 30
Leu Val Ala Pro Leu Thr Ser His Ala Ala Glu Ser Thr Leu Gly Ala
35 40 45
Ala Ala Lys Gln Ser Gly Arg Tyr Phe Gly Thr Ala Ile Ala Ser Gly
50 55 60
Arg Leu Asn Asp Ser Thr Tyr Thr Thr Ile Ala Asn Arg Glu Phe Asn
65 70 75 80
Ser Val Thr Ala Glu Asn Glu Met Lys Ile Asp Ala Thr Glu Pro Gln
85 90 95
Gln Gly Arg Phe Asp Phe Thr Ala Gly Asp Arg Val Tyr Asn Trp Ala
100 105 110
Val Gln Asn Gly Lys Gln Val Arg Gly His Thr Leu Ala Trp His Ser
115 120 125
Gln Gln Pro Ala Trp Met Gln Asn Leu Ser Gly Ser Ala Leu Arg Thr
130 135 140
Ala Met Thr Asn His Ile Asn Gly Val Met Ala His Tyr Lys Gly Lys
145 150 155 160
Ile Gly Gln Trp Asp Val Val Asn Glu Ala Phe Ala Asp Gly Ser Ser
165 170 175
Gly Ala Arg Arg Asp Ser Asn Leu Gln Arg Ser Gly Asn Asp Trp Ile
180 185 190
Glu Val Ala Phe Arg Thr Ala Arg Ala Ala Asp Pro Ala Ala Lys Leu
195 200 205
Cys Tyr Asn Asp Tyr Asn Val Glu Asn Trp Thr Trp Ala Lys Thr Gln
210 215 220
Ala Met Tyr Ala Met Val Lys Asp Phe Lys Gln Arg Gly Val Pro Ile
225 230 235 240
Asp Cys Val Gly Phe Gln Ser His Phe Asn Asn Asp Ser Pro Tyr Asn
245 250 255
Ser Asn Phe Arg Thr Thr Leu Gln Ser Phe Ala Ala Leu Gly Val Asp
260 265 270
Val Ala Ile Thr Glu Leu Asp Ile Gln Gly Ala Ser Gly Thr Thr Tyr
275 280 285
Ala Asn Val Thr Asn Asp Cys Leu Ala Val Pro Arg Cys Leu Gly Ile
290 295 300
Thr Val Trp Gly Val Arg Asp Thr Asp Ser Trp Arg Ala Glu His Thr
305 310 315 320
Pro Leu Leu Phe Asn Gly Asp Gly Ser Lys Lys Pro Ala Tyr Ser Ser
325 330 335
Val Leu Asn Ala Leu Asn Ser Val Ser Pro Asn Pro Asn Pro Thr Pro
340 345 350
Thr Pro Ser Pro Gly Ala Gly Pro Ile Lys Gly Val Ala Ser Gly Arg
355 360 365
Cys Val Asp Val Pro Gly Ala Gly Thr Ala Asp Gly Thr Gln Val Gln
370 375 380
Leu Trp Asp Cys Asn Asn Arg Thr Asn Gln Gln Trp Thr Leu Thr Ala
385 390 395 400
Ala Gly Glu Leu Arg Val Tyr Gly Asp Lys Cys Leu Asp Ala Ala Gly
405 410 415
Thr Gly Asn Gly Ala Lys Val Gln Ile Tyr Ser Cys Trp Gly Gly Asp
420 425 430
Asn Gln Lys Trp Arg Leu Asn Ser Asp Gly Ser Ile Val Gly Val Gln
435 440 445
Ser Gly Leu Cys Leu Asp Ala Ala Ala Gly Gly Thr Ala Asn Gly Thr
450 455 460
Leu Ile Gln Leu Tyr Ser Cys Trp Asn Ser Gly Asn Gln Arg Trp Thr
465 470 475 480
Arg Thr
<210> 105
<211> 2793
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 105
atgaagttca ctttgatgcc gctgctgtgc gggttcgcct tgctgttggg ttgcgcggtg 60
caggcaaccc cagccgcttc gttacagcag gcttatcagc cgtatttcca tatcggtact 120
gccgtcagct tggcgcaact gcaagcatcg aaaaaccatg aacgagattt aatcgcccag 180
cactttaaca gtctgaccgc tgaaaacctg atgaaatggg aaaaaatcca accgactgaa 240
ggcaactttg attttacagc ggccgacaag ctcgtcgctt ttgctgaaca acatcggatg 300
tggctggtcg gccatacgat cctgtggcat gaacaaaccc cggactgggt atttcagggg 360
ccagatggca aaccggccag caagcaagtg ttactcggca gattaaaaaa gcatatccaa 420
actgtggtcg gtcgttacca aggtcgggta catggctggg atgtagtgaa tgaagcgctg 480
aatgaagatg gcagtctgcg cgatacgccg tggcgaaaaa ttctgggtga tgattacatt 540
gccaccactt ttgcgctggt gcatcaggtc gaccccaaag ccaaactcta ttacaacgac 600
tacaacctgt ataaaccaaa aaaacgcact ggcgtgctac ggatcatcca gcaactgcag 660
caacaacaag tgcccattca tgccattggc gaacaagcgc attatggtct cgattcgccg 720
aaattgcagg aagttgaaga ctcgatcaac gcctttgcag ccaccggcct cgacgtgatg 780
ctgaccgagt tggaaatttc ggtgctaccg tttccgcctg gcatgacacc aggcgccgat 840
atcagtcagc atcaggaact gcaacaacag ctgaatcctt accgcgaagg cttaccaaaa 900
accgtcgaac aggcctggca acaacgttat ctggatctgt tttcgctgtt attgcgccag 960
catcaaaaat tacaccgggt gacgttttgg ggtttagatg atggccaaag ctggcgcaat 1020
aactttccaa tgcgcggtcg taccgattac ccgctactgt ttgaccgcaa gctgcaagcc 1080
aaaccgctat tgagcgcact gatcaaactg gcagaaactc aagcctcagc caagccgaaa 1140
gtaaatcagc tcggttttgc gccaaatgcg caaaaattgc tggtggtgcc ggggcggcag 1200
gcggtgtcgt ttcagatcat caatcaaagc aacggcaaaa cggtgttgca aggccaaagt 1260
tcggtggctc agttttggcc cgaatcgggc gagtgggtca gtatcgctga cttttcgacc 1320
ttaaccaccc aagggcgtta tcaggttgaa gcggctggat taactccgat caccgtcgag 1380
attactgctg aaccttatgc cgcgctgcat gatgcgtcca tcaaagccta ttattttaat 1440
cgcgcctcgc tggcgctgga gccaagtttt gccgggcctt gggcgcgcgc tgccggtcat 1500
ccggataaca aagtgttggt gcacacttcc gccgcttccg acaagcgacc agccggtttt 1560
gtgatcagcg ccgctaaagg ctggtatgac gccggtgact ataacaaata cgtggtcaat 1620
tccggtattt ccagttacac cctattgcaa gcctggcagg attttcctga gttttatcgc 1680
gacagaacat ggaatcttcc ggagtccagc aacaacctac cagacattct cgacgagacg 1740
ttatggaatt tacagtggct gagcaccatg caggacccaa gcgacggcgg cgtgtatcac 1800
aagctgactg aactgaattt ctctgctacc caaatgccgt cagaagtgac agcgccacgt 1860
tatgtggtgc aaaaaaccac ggcagcggca cttaatttcg cggcggtgct ggccaaagcc 1920
agtcgcattt ttacagaatt tgaaacgcaa ctgcccggcc tgtcacagca atatcgccag 1980
caagcattag cagcctggca atgggcgcaa aaaaatccac aacaaattta tcagcaacca 2040
gccgatgttc acaccggtgc ttatggcgac aaacagctgg ctgatgaatg ggcttgggct 2100
ggggcggagc tatatttatt aaccggtgag cagagttacc tgcagccgtt gttggcactt 2160
gagacgccaa tcaccgcagc ttcctgggcc aatgtggcgg cgttgggtta ttttgcgttg 2220
gcatccgctg aacagtttga gcctgcactt cgaaaaaaag tgcagcaaaa aatccaacaa 2280
gccgcggcgc aaattgtagc cgagcatcaa gcgtccgcct accaggtggc gatgactcaa 2340
aaagattttg tctggggcag taatgcggtg gcgatgaaca aaggcatgtt gttatatcaa 2400
gcgtggaaaa ttgacccaca accagagctg cgacaggcga tgcaagggct gctggattac 2460
gtcctcggtc gcaacccgct gcagctgtct tatgtcacag gttttggtgc gcaaagcccg 2520
caacatatcc atcaccgccc ctcggcggca gatcagatca aagcaccagt gccgggctgg 2580
ttagtgggtg gtgcacagcc gggtaagcaa gataaatgct cttattccgg tatttttgct 2640
accggcactt tacccgctgc cagcacttta cctgcaacga cttatctcga ccactggtgc 2700
agctacgcca ccaatgaagt ggcgattaac tggaatgcac ctttagtgta cgtgctggcc 2760
tggagccttt caccagactc catgaccaaa tga 2793
<210> 106
<211> 930
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(22)
<400> 106
Met Lys Phe Thr Leu Met Pro Leu Leu Cys Gly Phe Ala Leu Leu Leu
1 5 10 15
Gly Cys Ala Val Gln Ala Thr Pro Ala Ala Ser Leu Gln Gln Ala Tyr
20 25 30
Gln Pro Tyr Phe His Ile Gly Thr Ala Val Ser Leu Ala Gln Leu Gln
35 40 45
Ala Ser Lys Asn His Glu Arg Asp Leu Ile Ala Gln His Phe Asn Ser
50 55 60
Leu Thr Ala Glu Asn Leu Met Lys Trp Glu Lys Ile Gln Pro Thr Glu
65 70 75 80
Gly Asn Phe Asp Phe Thr Ala Ala Asp Lys Leu Val Ala Phe Ala Glu
85 90 95
Gln His Arg Met Trp Leu Val Gly His Thr Ile Leu Trp His Glu Gln
100 105 110
Thr Pro Asp Trp Val Phe Gln Gly Pro Asp Gly Lys Pro Ala Ser Lys
115 120 125
Gln Val Leu Leu Gly Arg Leu Lys Lys His Ile Gln Thr Val Val Gly
130 135 140
Arg Tyr Gln Gly Arg Val His Gly Trp Asp Val Val Asn Glu Ala Leu
145 150 155 160
Asn Glu Asp Gly Ser Leu Arg Asp Thr Pro Trp Arg Lys Ile Leu Gly
165 170 175
Asp Asp Tyr Ile Ala Thr Thr Phe Ala Leu Val His Gln Val Asp Pro
180 185 190
Lys Ala Lys Leu Tyr Tyr Asn Asp Tyr Asn Leu Tyr Lys Pro Lys Lys
195 200 205
Arg Thr Gly Val Leu Arg Ile Ile Gln Gln Leu Gln Gln Gln Gln Val
210 215 220
Pro Ile His Ala Ile Gly Glu Gln Ala His Tyr Gly Leu Asp Ser Pro
225 230 235 240
Lys Leu Gln Glu Val Glu Asp Ser Ile Asn Ala Phe Ala Ala Thr Gly
245 250 255
Leu Asp Val Met Leu Thr Glu Leu Glu Ile Ser Val Leu Pro Phe Pro
260 265 270
Pro Gly Met Thr Pro Gly Ala Asp Ile Ser Gln His Gln Glu Leu Gln
275 280 285
Gln Gln Leu Asn Pro Tyr Arg Glu Gly Leu Pro Lys Thr Val Glu Gln
290 295 300
Ala Trp Gln Gln Arg Tyr Leu Asp Leu Phe Ser Leu Leu Leu Arg Gln
305 310 315 320
His Gln Lys Leu His Arg Val Thr Phe Trp Gly Leu Asp Asp Gly Gln
325 330 335
Ser Trp Arg Asn Asn Phe Pro Met Arg Gly Arg Thr Asp Tyr Pro Leu
340 345 350
Leu Phe Asp Arg Lys Leu Gln Ala Lys Pro Leu Leu Ser Ala Leu Ile
355 360 365
Lys Leu Ala Glu Thr Gln Ala Ser Ala Lys Pro Lys Val Asn Gln Leu
370 375 380
Gly Phe Ala Pro Asn Ala Gln Lys Leu Leu Val Val Pro Gly Arg Gln
385 390 395 400
Ala Val Ser Phe Gln Ile Ile Asn Gln Ser Asn Gly Lys Thr Val Leu
405 410 415
Gln Gly Gln Ser Ser Val Ala Gln Phe Trp Pro Glu Ser Gly Glu Trp
420 425 430
Val Ser Ile Ala Asp Phe Ser Thr Leu Thr Thr Gln Gly Arg Tyr Gln
435 440 445
Val Glu Ala Ala Gly Leu Thr Pro Ile Thr Val Glu Ile Thr Ala Glu
450 455 460
Pro Tyr Ala Ala Leu His Asp Ala Ser Ile Lys Ala Tyr Tyr Phe Asn
465 470 475 480
Arg Ala Ser Leu Ala Leu Glu Pro Ser Phe Ala Gly Pro Trp Ala Arg
485 490 495
Ala Ala Gly His Pro Asp Asn Lys Val Leu Val His Thr Ser Ala Ala
500 505 510
Ser Asp Lys Arg Pro Ala Gly Phe Val Ile Ser Ala Ala Lys Gly Trp
515 520 525
Tyr Asp Ala Gly Asp Tyr Asn Lys Tyr Val Val Asn Ser Gly Ile Ser
530 535 540
Ser Tyr Thr Leu Leu Gln Ala Trp Gln Asp Phe Pro Glu Phe Tyr Arg
545 550 555 560
Asp Arg Thr Trp Asn Leu Pro Glu Ser Ser Asn Asn Leu Pro Asp Ile
565 570 575
Leu Asp Glu Thr Leu Trp Asn Leu Gln Trp Leu Ser Thr Met Gln Asp
580 585 590
Pro Ser Asp Gly Gly Val Tyr His Lys Leu Thr Glu Leu Asn Phe Ser
595 600 605
Ala Thr Gln Met Pro Ser Glu Val Thr Ala Pro Arg Tyr Val Val Gln
610 615 620
Lys Thr Thr Ala Ala Ala Leu Asn Phe Ala Ala Val Leu Ala Lys Ala
625 630 635 640
Ser Arg Ile Phe Thr Glu Phe Glu Thr Gln Leu Pro Gly Leu Ser Gln
645 650 655
Gln Tyr Arg Gln Gln Ala Leu Ala Ala Trp Gln Trp Ala Gln Lys Asn
660 665 670
Pro Gln Gln Ile Tyr Gln Gln Pro Ala Asp Val His Thr Gly Ala Tyr
675 680 685
Gly Asp Lys Gln Leu Ala Asp Glu Trp Ala Trp Ala Gly Ala Glu Leu
690 695 700
Tyr Leu Leu Thr Gly Glu Gln Ser Tyr Leu Gln Pro Leu Leu Ala Leu
705 710 715 720
Glu Thr Pro Ile Thr Ala Ala Ser Trp Ala Asn Val Ala Ala Leu Gly
725 730 735
Tyr Phe Ala Leu Ala Ser Ala Glu Gln Phe Glu Pro Ala Leu Arg Lys
740 745 750
Lys Val Gln Gln Lys Ile Gln Gln Ala Ala Ala Gln Ile Val Ala Glu
755 760 765
His Gln Ala Ser Ala Tyr Gln Val Ala Met Thr Gln Lys Asp Phe Val
770 775 780
Trp Gly Ser Asn Ala Val Ala Met Asn Lys Gly Met Leu Leu Tyr Gln
785 790 795 800
Ala Trp Lys Ile Asp Pro Gln Pro Glu Leu Arg Gln Ala Met Gln Gly
805 810 815
Leu Leu Asp Tyr Val Leu Gly Arg Asn Pro Leu Gln Leu Ser Tyr Val
820 825 830
Thr Gly Phe Gly Ala Gln Ser Pro Gln His Ile His His Arg Pro Ser
835 840 845
Ala Ala Asp Gln Ile Lys Ala Pro Val Pro Gly Trp Leu Val Gly Gly
850 855 860
Ala Gln Pro Gly Lys Gln Asp Lys Cys Ser Tyr Ser Gly Ile Phe Ala
865 870 875 880
Thr Gly Thr Leu Pro Ala Ala Ser Thr Leu Pro Ala Thr Thr Tyr Leu
885 890 895
Asp His Trp Cys Ser Tyr Ala Thr Asn Glu Val Ala Ile Asn Trp Asn
900 905 910
Ala Pro Leu Val Tyr Val Leu Ala Trp Ser Leu Ser Pro Asp Ser Met
915 920 925
Thr Lys
930
<210> 107
<211> 1725
<212> DNA
<213> Bacteria
<400> 107
gtgtggaagc ccggattgtg gaatttcctt caaatggcag atgaagccgg attgacgagg 60
gatggaaaca ctccggttcc gacacccagt ccaaagccgg ctaacacacg tattgaagcg 120
gaagattatg acggtattaa ttcttcaagt attgagataa taggtgttcc acctgaagga 180
ggcagaggaa taggttatat taccagtggt gattatctgg tatacaagag tatagacttt 240
ggaaacggag caacgtcgtt taaggccaag gttgcaaatg caaatacttc caatattgaa 300
cttagattaa acggtccgaa tggtactctc ataggcacac tctcggtaaa atccacagga 360
gattggaata catatgagga gcaaacttgc agcattagca aagtcaccgg aataaatgat 420
ttgtacttgg tattcaaagg ccctgtaaac atagactggt tcacttttgg cgttgaaagc 480
agttccacag gtctggggga tttaaatggt gacggaaata ttaactcgtc ggaccttcag 540
gcgttaaaga ggcatttgct cggtatatca ccgcttacgg gagaggctct tttaagagcg 600
gatgtaaata ggagcggcaa agtggattct actgactatt cagtgctgaa aagatatata 660
ctccgcatta ttacagagtt ccccggacaa ggtgatgtac agacacccaa tccgtctgtt 720
actccgacac aaactcctat ccccacgatt tcgggaaatg ctcttaggga ttatgcggag 780
gcaaggggaa taaaaatcgg aacatgtgtc aactatccgt tttacaacaa ttcagatcca 840
acctacaaca gcattttgca aagagaattt tcaatggttg tatgtgaaaa tgaaatgaag 900
tttgatgctt tgcagccgag acaaaacgtt tttgattttt cgaaaggaga ccagttgctt 960
gcttttgcag aaagaaacgg tatgcagatg aggggacata cgttgatttg gcacaatcaa 1020
aacccgtcat ggcttacaaa cggtaactgg aaccgggatt cgctgcttgc ggtaatgaaa 1080
aatcacatta ccactgttat gacccattac aaaggtaaaa ttgttgagtg ggatgtggca 1140
aacgaatgta tggatgattc cggcaacggc ttaagaagca gcatatggag aaatgtaatc 1200
ggtcaggact accttgacta tgctttcagg tatgcaagag aagcagatcc cgatgcactt 1260
cttttctaca atgattataa tattgaagac ttgggtccaa agtccaatgc ggtatttaac 1320
atgattaaaa gtatgaagga aagaggtgtg ccgattgacg gagtaggatt ccaatgccac 1380
tttatcaatg gaatgagccc cgagtacctt gccagcattg atcaaaatat taagagatat 1440
gcggaaatag gcgttatagt atcctttacc gaaatagata tacgcatacc tcagtcggaa 1500
aacccggcaa ctgcattcca ggtacaggca aacaactata aggaacttat gaaaatttgt 1560
ctggcaaacc ccaattgcaa tacctttgta atgtggggat tcacagataa atacacatgg 1620
attccgggaa ctttcccagg atatggcaat ccattgattt atgacagcaa ttacaatccg 1680
aaaccggcat acaatgcaat aaaggaagct cttatgggct attga 1725
<210> 108
<211> 574
<212> PRT
<213> Bacteria
<400> 108
Val Trp Lys Pro Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala
1 5 10 15
Gly Leu Thr Arg Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys
20 25 30
Pro Ala Asn Thr Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser
35 40 45
Ser Ser Ile Glu Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile
50 55 60
Gly Tyr Ile Thr Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe
65 70 75 80
Gly Asn Gly Ala Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr
85 90 95
Ser Asn Ile Glu Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly
100 105 110
Thr Leu Ser Val Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln
115 120 125
Thr Cys Ser Ile Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val
130 135 140
Phe Lys Gly Pro Val Asn Ile Asp Trp Phe Thr Phe Gly Val Glu Ser
145 150 155 160
Ser Ser Thr Gly Leu Gly Asp Leu Asn Gly Asp Gly Asn Ile Asn Ser
165 170 175
Ser Asp Leu Gln Ala Leu Lys Arg His Leu Leu Gly Ile Ser Pro Leu
180 185 190
Thr Gly Glu Ala Leu Leu Arg Ala Asp Val Asn Arg Ser Gly Lys Val
195 200 205
Asp Ser Thr Asp Tyr Ser Val Leu Lys Arg Tyr Ile Leu Arg Ile Ile
210 215 220
Thr Glu Phe Pro Gly Gln Gly Asp Val Gln Thr Pro Asn Pro Ser Val
225 230 235 240
Thr Pro Thr Gln Thr Pro Ile Pro Thr Ile Ser Gly Asn Ala Leu Arg
245 250 255
Asp Tyr Ala Glu Ala Arg Gly Ile Lys Ile Gly Thr Cys Val Asn Tyr
260 265 270
Pro Phe Tyr Asn Asn Ser Asp Pro Thr Tyr Asn Ser Ile Leu Gln Arg
275 280 285
Glu Phe Ser Met Val Val Cys Glu Asn Glu Met Lys Phe Asp Ala Leu
290 295 300
Gln Pro Arg Gln Asn Val Phe Asp Phe Ser Lys Gly Asp Gln Leu Leu
305 310 315 320
Ala Phe Ala Glu Arg Asn Gly Met Gln Met Arg Gly His Thr Leu Ile
325 330 335
Trp His Asn Gln Asn Pro Ser Trp Leu Thr Asn Gly Asn Trp Asn Arg
340 345 350
Asp Ser Leu Leu Ala Val Met Lys Asn His Ile Thr Thr Val Met Thr
355 360 365
His Tyr Lys Gly Lys Ile Val Glu Trp Asp Val Ala Asn Glu Cys Met
370 375 380
Asp Asp Ser Gly Asn Gly Leu Arg Ser Ser Ile Trp Arg Asn Val Ile
385 390 395 400
Gly Gln Asp Tyr Leu Asp Tyr Ala Phe Arg Tyr Ala Arg Glu Ala Asp
405 410 415
Pro Asp Ala Leu Leu Phe Tyr Asn Asp Tyr Asn Ile Glu Asp Leu Gly
420 425 430
Pro Lys Ser Asn Ala Val Phe Asn Met Ile Lys Ser Met Lys Glu Arg
435 440 445
Gly Val Pro Ile Asp Gly Val Gly Phe Gln Cys His Phe Ile Asn Gly
450 455 460
Met Ser Pro Glu Tyr Leu Ala Ser Ile Asp Gln Asn Ile Lys Arg Tyr
465 470 475 480
Ala Glu Ile Gly Val Ile Val Ser Phe Thr Glu Ile Asp Ile Arg Ile
485 490 495
Pro Gln Ser Glu Asn Pro Ala Thr Ala Phe Gln Val Gln Ala Asn Asn
500 505 510
Tyr Lys Glu Leu Met Lys Ile Cys Leu Ala Asn Pro Asn Cys Asn Thr
515 520 525
Phe Val Met Trp Gly Phe Thr Asp Lys Tyr Thr Trp Ile Pro Gly Thr
530 535 540
Phe Pro Gly Tyr Gly Asn Pro Leu Ile Tyr Asp Ser Asn Tyr Asn Pro
545 550 555 560
Lys Pro Ala Tyr Asn Ala Ile Lys Glu Ala Leu Met Gly Tyr
565 570
<210> 109
<211> 1242
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 109
atgctaaaag ttttacgtaa acctattatt tctggattag ctttagctct attattgccg 60
gcaggggcag ctggtgccga aactaatatt tcaaagaagc caaatataag tggattaacc 120
gcgccgcaat tagaccaaag atataaagat tctttcacca ttggtgctgc ggttgagccg 180
tatcaattat tagatgcaaa agattcacaa atgctaaagc ggcattttaa tagtatcgta 240
gcagagaatg tcatgaagcc tagtagttta cagccagtag aaggacaatt caattgggag 300
ccggccgata aacttgttca gtttgcgaag gaaaatggaa tggacatgcg cggacatacg 360
cttgtctggc atagccaggt accggattgg ttctttgaag atgcggcagg aaatccaatg 420
gttgtttggg aaaatggcag gcaagtggtt gccgatccag caaatcttca ggaaaacaaa 480
gagctcttac ttagccgatt acaaaatcat attcaggcag tcgtaacgcg ttataaagat 540
gatataaaat cttgggatgt tgttaatgaa gtaatcgatg aatggggcgg acattctgaa 600
gggctgcgtc aatctccatg gttcctcatc accggaacgg actatattaa agttgctttt 660
gaaactgcaa gagaatatgc agctccagac gctaagctgt atatcaatga ttacaataca 720
gaagtagaac caaaaaggac gcacctttat aacttagtaa aaagtttaaa agaagaacaa 780
aacgttccaa ttgatggtgt tgggcatcag tctcacattc aaattggctg gccttcagaa 840
aaagaaattg aagataccat taatatgttt gcagatcttg gtttagataa ccaaatcacc 900
gagcttgatg ttagtatgta tggctggcca gtaaggtcgt atccaactta tgatgcgatc 960
ccagaactta aattcatgga tcaagcagct cgttatgatc gtttatttaa gttatatgag 1020
aaattaggag ataaaatcag taatgtgaca ttctggggta ttgcggataa ccatacatgg 1080
ctgaatgacc gtgcagatgt ttactatgat gaaaatggaa atgttgtatt agatagagaa 1140
acaccaagag tagaaagagg agcaggaaaa gatgcgccat ttgtatttga tcctgaatac 1200
aatgtaaaac cagcttattg ggcaattatc gaccacaaat aa 1242
<210> 110
<211> 413
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(26)
<400> 110
Met Leu Lys Val Leu Arg Lys Pro Ile Ile Ser Gly Leu Ala Leu Ala
1 5 10 15
Leu Leu Leu Pro Ala Gly Ala Ala Gly Ala Glu Thr Asn Ile Ser Lys
20 25 30
Lys Pro Asn Ile Ser Gly Leu Thr Ala Pro Gln Leu Asp Gln Arg Tyr
35 40 45
Lys Asp Ser Phe Thr Ile Gly Ala Ala Val Glu Pro Tyr Gln Leu Leu
50 55 60
Asp Ala Lys Asp Ser Gln Met Leu Lys Arg His Phe Asn Ser Ile Val
65 70 75 80
Ala Glu Asn Val Met Lys Pro Ser Ser Leu Gln Pro Val Glu Gly Gln
85 90 95
Phe Asn Trp Glu Pro Ala Asp Lys Leu Val Gln Phe Ala Lys Glu Asn
100 105 110
Gly Met Asp Met Arg Gly His Thr Leu Val Trp His Ser Gln Val Pro
115 120 125
Asp Trp Phe Phe Glu Asp Ala Ala Gly Asn Pro Met Val Val Trp Glu
130 135 140
Asn Gly Arg Gln Val Val Ala Asp Pro Ala Asn Leu Gln Glu Asn Lys
145 150 155 160
Glu Leu Leu Leu Ser Arg Leu Gln Asn His Ile Gln Ala Val Val Thr
165 170 175
Arg Tyr Lys Asp Asp Ile Lys Ser Trp Asp Val Val Asn Glu Val Ile
180 185 190
Asp Glu Trp Gly Gly His Ser Glu Gly Leu Arg Gln Ser Pro Trp Phe
195 200 205
Leu Ile Thr Gly Thr Asp Tyr Ile Lys Val Ala Phe Glu Thr Ala Arg
210 215 220
Glu Tyr Ala Ala Pro Asp Ala Lys Leu Tyr Ile Asn Asp Tyr Asn Thr
225 230 235 240
Glu Val Glu Pro Lys Arg Thr His Leu Tyr Asn Leu Val Lys Ser Leu
245 250 255
Lys Glu Glu Gln Asn Val Pro Ile Asp Gly Val Gly His Gln Ser His
260 265 270
Ile Gln Ile Gly Trp Pro Ser Glu Lys Glu Ile Glu Asp Thr Ile Asn
275 280 285
Met Phe Ala Asp Leu Gly Leu Asp Asn Gln Ile Thr Glu Leu Asp Val
290 295 300
Ser Met Tyr Gly Trp Pro Val Arg Ser Tyr Pro Thr Tyr Asp Ala Ile
305 310 315 320
Pro Glu Leu Lys Phe Met Asp Gln Ala Ala Arg Tyr Asp Arg Leu Phe
325 330 335
Lys Leu Tyr Glu Lys Leu Gly Asp Lys Ile Ser Asn Val Thr Phe Trp
340 345 350
Gly Ile Ala Asp Asn His Thr Trp Leu Asn Asp Arg Ala Asp Val Tyr
355 360 365
Tyr Asp Glu Asn Gly Asn Val Val Leu Asp Arg Glu Thr Pro Arg Val
370 375 380
Glu Arg Gly Ala Gly Lys Asp Ala Pro Phe Val Phe Asp Pro Glu Tyr
385 390 395 400
Asn Val Lys Pro Ala Tyr Trp Ala Ile Ile Asp His Lys
405 410
<210> 111
<211> 1089
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 111
atgttgacga ccccgacaac tcaagatcat gtccccgtgc ttaaggacgc tttcaaaggc 60
aagttcctca ttggagccgt gctgggttat gacgcactcc agggaaagga tccggcgagt 120
gtggaaattg cgaccacgca cttcgatgct ctcactgcgg aaaacagcat gaagcccgct 180
ctggtgcaac ctaaagaggg cgaatttgac ttcgctgatg gagaccggct tcttgacatc 240
acacagcagt gcggtgcgac tgcgattggc cacactttgc tctggcacca acagacaccg 300
aaatggtttt tcgaggggcc agatgaccag cctactaacc gcgagttggc cctggcacgc 360
atgagaaagc acatcgccac tcttgttggc cgttacaaag gtcgcattaa gcaatgggat 420
gtggtgaatg aggcgattag cgatgcagag ggcgagtact tgagaccaaa tagtccatgg 480
ttcaaggctg ttggagaaga tcacattgcg caggctttcc gggcagcgca cgaagccgat 540
cctgacgcca tcctcatcta taacgattac aacatcgagc aggagtacaa gcgtcccaaa 600
gcgatacgac tgctgaggtc attacttgag caggacgttc cccttcatgc cgtgggcatc 660
cagggccact ggcgtatgga cactctgaat gttgccgaaa tcgaagaagc tatcaaagaa 720
tttgctgcgc tgggtctcaa ggtcatgatc accgagcttg acatcagcgt gctaccgaca 780
aagtatcagg gagccgatct ctctacccgc gaagaattga cgcctgaaat caatccctat 840
acggagggac tacccgagaa cgttgcccgg caacatgccg aatgttaccg ccaagtcttc 900
aaaatgttcc tgtgccacaa ggatgccatt ggccgtgtca cgctctgggg cgttcatgat 960
ggcagatcat ggttcaatga ctttcccgtc agagggcgca ccgattatcc tctgcttttc 1020
gaccggcagg gcaaacccaa gccagcattt tttgccgtct tgaaggctgc gcaagatcag 1080
ccacaatga 1089
<210> 112
<211> 362
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 112
Met Leu Thr Thr Pro Thr Thr Gln Asp His Val Pro Val Leu Lys Asp
1 5 10 15
Ala Phe Lys Gly Lys Phe Leu Ile Gly Ala Val Leu Gly Tyr Asp Ala
20 25 30
Leu Gln Gly Lys Asp Pro Ala Ser Val Glu Ile Ala Thr Thr His Phe
35 40 45
Asp Ala Leu Thr Ala Glu Asn Ser Met Lys Pro Ala Leu Val Gln Pro
50 55 60
Lys Glu Gly Glu Phe Asp Phe Ala Asp Gly Asp Arg Leu Leu Asp Ile
65 70 75 80
Thr Gln Gln Cys Gly Ala Thr Ala Ile Gly His Thr Leu Leu Trp His
85 90 95
Gln Gln Thr Pro Lys Trp Phe Phe Glu Gly Pro Asp Asp Gln Pro Thr
100 105 110
Asn Arg Glu Leu Ala Leu Ala Arg Met Arg Lys His Ile Ala Thr Leu
115 120 125
Val Gly Arg Tyr Lys Gly Arg Ile Lys Gln Trp Asp Val Val Asn Glu
130 135 140
Ala Ile Ser Asp Ala Glu Gly Glu Tyr Leu Arg Pro Asn Ser Pro Trp
145 150 155 160
Phe Lys Ala Val Gly Glu Asp His Ile Ala Gln Ala Phe Arg Ala Ala
165 170 175
His Glu Ala Asp Pro Asp Ala Ile Leu Ile Tyr Asn Asp Tyr Asn Ile
180 185 190
Glu Gln Glu Tyr Lys Arg Pro Lys Ala Ile Arg Leu Leu Arg Ser Leu
195 200 205
Leu Glu Gln Asp Val Pro Leu His Ala Val Gly Ile Gln Gly His Trp
210 215 220
Arg Met Asp Thr Leu Asn Val Ala Glu Ile Glu Glu Ala Ile Lys Glu
225 230 235 240
Phe Ala Ala Leu Gly Leu Lys Val Met Ile Thr Glu Leu Asp Ile Ser
245 250 255
Val Leu Pro Thr Lys Tyr Gln Gly Ala Asp Leu Ser Thr Arg Glu Glu
260 265 270
Leu Thr Pro Glu Ile Asn Pro Tyr Thr Glu Gly Leu Pro Glu Asn Val
275 280 285
Ala Arg Gln His Ala Glu Cys Tyr Arg Gln Val Phe Lys Met Phe Leu
290 295 300
Cys His Lys Asp Ala Ile Gly Arg Val Thr Leu Trp Gly Val His Asp
305 310 315 320
Gly Arg Ser Trp Phe Asn Asp Phe Pro Val Arg Gly Arg Thr Asp Tyr
325 330 335
Pro Leu Leu Phe Asp Arg Gln Gly Lys Pro Lys Pro Ala Phe Phe Ala
340 345 350
Val Leu Lys Ala Ala Gln Asp Gln Pro Gln
355 360
<210> 113
<211> 1155
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 113
atgttaaaag tattgcgtaa accacttttt tctggattag ctttagcgat agtattacct 60
accggattat ccagtgctta tgcagctgaa aatcaaccag ttagtgcatt agatgcagcg 120
gttgaacttg atgaaagata tgcagaatca ttcgatattg gtgcagccgt tgagccttct 180
atgcttcaag gaaaagatgc tgaagtatta aagcgtcatt ataacagcat tgtggccgaa 240
aatgtaatga aaccgattaa tatacagcct gaagaaggaa agttcacttt taaagaaatg 300
gataaaatcg ttaagtttgc gaaagaaaat aatatgaagc ttcgtggcca tacccttatt 360
tggcacagtc aagtaccgga gtggttcttc cttgataaag aaggaaataa gatggtggat 420
gaaacggatc caaagcagcg cgaaaaaaat aaaaggcttt tacttaagcg tttagaaacg 480
catattaaaa cgatcgtcaa gcgctataaa aatgatatta gctcctggga cgtggtcaac 540
gaggtagtgg atgataacgg gaaattacgt aattcaccct ggtatcaaat cacaggtact 600
gattatatca aggttgcttt tgaaacagcg gaccgttatg cagggaagaa cgctaagctt 660
tatatcaatg actacaacac ggaaatagac cctaaaagag aaaccctcta taatcttgtc 720
aaggaattag tgaaggaggg agtcccagtt gatggagtgg gacatcaagc tcatatccaa 780
atcggctggc caactatagc ggaaatcgag aaaaccatta atatgtttgc agaccttggc 840
ctagacaatc aaattacaga actagatgtt agcctttatg ggtggccgcc aaagcctgct 900
tacccaactt atgacgaaat cccggcaagt gaattcgaac gtcaagctgt tcgttacgat 960
caactatttg atttatacga gagattggga gataaaatta gcagtgtgac attctggggc 1020
gttgctgaca accatacatg gttaaatgac cgtgcagaac aatataatga cggggtaggc 1080
gtggacgcac catttgtttt cgataaggat tataatgtaa aaccagctta ttgggctatt 1140
atcgatcgcg attaa 1155
<210> 114
<211> 384
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(28)
<400> 114
Met Leu Lys Val Leu Arg Lys Pro Leu Phe Ser Gly Leu Ala Leu Ala
1 5 10 15
Ile Val Leu Pro Thr Gly Leu Ser Ser Ala Tyr Ala Ala Glu Asn Gln
20 25 30
Pro Val Ser Ala Leu Asp Ala Ala Val Glu Leu Asp Glu Arg Tyr Ala
35 40 45
Glu Ser Phe Asp Ile Gly Ala Ala Val Glu Pro Ser Met Leu Gln Gly
50 55 60
Lys Asp Ala Glu Val Leu Lys Arg His Tyr Asn Ser Ile Val Ala Glu
65 70 75 80
Asn Val Met Lys Pro Ile Asn Ile Gln Pro Glu Glu Gly Lys Phe Thr
85 90 95
Phe Lys Glu Met Asp Lys Ile Val Lys Phe Ala Lys Glu Asn Asn Met
100 105 110
Lys Leu Arg Gly His Thr Leu Ile Trp His Ser Gln Val Pro Glu Trp
115 120 125
Phe Phe Leu Asp Lys Glu Gly Asn Lys Met Val Asp Glu Thr Asp Pro
130 135 140
Lys Gln Arg Glu Lys Asn Lys Arg Leu Leu Leu Lys Arg Leu Glu Thr
145 150 155 160
His Ile Lys Thr Ile Val Lys Arg Tyr Lys Asn Asp Ile Ser Ser Trp
165 170 175
Asp Val Val Asn Glu Val Val Asp Asp Asn Gly Lys Leu Arg Asn Ser
180 185 190
Pro Trp Tyr Gln Ile Thr Gly Thr Asp Tyr Ile Lys Val Ala Phe Glu
195 200 205
Thr Ala Asp Arg Tyr Ala Gly Lys Asn Ala Lys Leu Tyr Ile Asn Asp
210 215 220
Tyr Asn Thr Glu Ile Asp Pro Lys Arg Glu Thr Leu Tyr Asn Leu Val
225 230 235 240
Lys Glu Leu Val Lys Glu Gly Val Pro Val Asp Gly Val Gly His Gln
245 250 255
Ala His Ile Gln Ile Gly Trp Pro Thr Ile Ala Glu Ile Glu Lys Thr
260 265 270
Ile Asn Met Phe Ala Asp Leu Gly Leu Asp Asn Gln Ile Thr Glu Leu
275 280 285
Asp Val Ser Leu Tyr Gly Trp Pro Pro Lys Pro Ala Tyr Pro Thr Tyr
290 295 300
Asp Glu Ile Pro Ala Ser Glu Phe Glu Arg Gln Ala Val Arg Tyr Asp
305 310 315 320
Gln Leu Phe Asp Leu Tyr Glu Arg Leu Gly Asp Lys Ile Ser Ser Val
325 330 335
Thr Phe Trp Gly Val Ala Asp Asn His Thr Trp Leu Asn Asp Arg Ala
340 345 350
Glu Gln Tyr Asn Asp Gly Val Gly Val Asp Ala Pro Phe Val Phe Asp
355 360 365
Lys Asp Tyr Asn Val Lys Pro Ala Tyr Trp Ala Ile Ile Asp Arg Asp
370 375 380
<210> 115
<211> 1362
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 115
atgacgaacc gtaaatcgaa cgtgcaccgt tcattgaccg atgatttgct cgatggtgtc 60
ttcgccgagg caaaagcggg caaagttgag aagtaccgtg ccaccgggat ccttggaacg 120
ctattcggat tcactgtggc gtcctccatc atgttggcgg cttgcagcaa cgcacaagag 180
aatgttccac cagttgcttc atccaccgca cagagcaata tcacccagga gaacgttccg 240
ccgctcaaag atgcgtttaa gggcaagttc ttgattggca ccgcggtgag caatcgcttg 300
ctggagggac aagatccggc cacggaagcc ttggtgcgca ggcacttcga tgctctcacg 360
gcggaaaacg ccatgaagcc ggatgcactg caaccgcgcg aaggccagtt caacttcgtc 420
gccgccgacc gtctggtgga aatcgcccag caaagcggcg cgacagtggt cggccacacg 480
ctggtctggc actcccaaac gccaggctgg ttcttccagg gtccgaatgg ccagccagcg 540
agtcgagaac tggccctggc gcggatgcga acacacatca agacggtggt gggacgctac 600
aaagggcgca tcaagcagtg ggatgtggtc aacgaagcga tcaacgacgg ccctggcgtg 660
ctgcggcaaa gtccgtggct gcgtgccatc ggcgaagact acatcgccga agcgttccgc 720
gccgcgcacg aagccgatcc tgacgccatt ctggtctaca acgactacaa catcgaactc 780
aactacaagc gtcccaaggc gctggaactg ctaaagaagc tcatcgacca gaaggttccg 840
attcatggtg tgggcattca ggctcactgg cgcatgaccc cgccgctggc cgagaccgaa 900
gaagccatca aacagttcgc cgcgctgggc ctgaaggtga tgttcaccga actggacatc 960
ggtgtgctgc ccactcagta tcagggggct gacatctcgg cgcgtgaaac catgacaccc 1020
gaacagcaag cggtgatgaa cccttacact cagggcttgc cggctgaagt ggcacagcaa 1080
catgccgagc gctaccgaca ggccttcgag ctgttcctgc gccacaagga tgtgattggt 1140
cgcgtcacgc tctggggcac gcatgatggc gaatcctggc tgaacggttt tccggtgcgg 1200
ggccgcaccg actatccctt gctcttcgac cgccggtatc agccaaaacc agccttcttc 1260
gccgtcaggc aggttgcaca ggcgcatact gtacaaacga ccggtgcgca aacccaagct 1320
acagcgaaga caattcaaaa agcttctcga gagtacttct ag 1362
<210> 116
<211> 453
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 116
Met Thr Asn Arg Lys Ser Asn Val His Arg Ser Leu Thr Asp Asp Leu
1 5 10 15
Leu Asp Gly Val Phe Ala Glu Ala Lys Ala Gly Lys Val Glu Lys Tyr
20 25 30
Arg Ala Thr Gly Ile Leu Gly Thr Leu Phe Gly Phe Thr Val Ala Ser
35 40 45
Ser Ile Met Leu Ala Ala Cys Ser Asn Ala Gln Glu Asn Val Pro Pro
50 55 60
Val Ala Ser Ser Thr Ala Gln Ser Asn Ile Thr Gln Glu Asn Val Pro
65 70 75 80
Pro Leu Lys Asp Ala Phe Lys Gly Lys Phe Leu Ile Gly Thr Ala Val
85 90 95
Ser Asn Arg Leu Leu Glu Gly Gln Asp Pro Ala Thr Glu Ala Leu Val
100 105 110
Arg Arg His Phe Asp Ala Leu Thr Ala Glu Asn Ala Met Lys Pro Asp
115 120 125
Ala Leu Gln Pro Arg Glu Gly Gln Phe Asn Phe Val Ala Ala Asp Arg
130 135 140
Leu Val Glu Ile Ala Gln Gln Ser Gly Ala Thr Val Val Gly His Thr
145 150 155 160
Leu Val Trp His Ser Gln Thr Pro Gly Trp Phe Phe Gln Gly Pro Asn
165 170 175
Gly Gln Pro Ala Ser Arg Glu Leu Ala Leu Ala Arg Met Arg Thr His
180 185 190
Ile Lys Thr Val Val Gly Arg Tyr Lys Gly Arg Ile Lys Gln Trp Asp
195 200 205
Val Val Asn Glu Ala Ile Asn Asp Gly Pro Gly Val Leu Arg Gln Ser
210 215 220
Pro Trp Leu Arg Ala Ile Gly Glu Asp Tyr Ile Ala Glu Ala Phe Arg
225 230 235 240
Ala Ala His Glu Ala Asp Pro Asp Ala Ile Leu Val Tyr Asn Asp Tyr
245 250 255
Asn Ile Glu Leu Asn Tyr Lys Arg Pro Lys Ala Leu Glu Leu Leu Lys
260 265 270
Lys Leu Ile Asp Gln Lys Val Pro Ile His Gly Val Gly Ile Gln Ala
275 280 285
His Trp Arg Met Thr Pro Pro Leu Ala Glu Thr Glu Glu Ala Ile Lys
290 295 300
Gln Phe Ala Ala Leu Gly Leu Lys Val Met Phe Thr Glu Leu Asp Ile
305 310 315 320
Gly Val Leu Pro Thr Gln Tyr Gln Gly Ala Asp Ile Ser Ala Arg Glu
325 330 335
Thr Met Thr Pro Glu Gln Gln Ala Val Met Asn Pro Tyr Thr Gln Gly
340 345 350
Leu Pro Ala Glu Val Ala Gln Gln His Ala Glu Arg Tyr Arg Gln Ala
355 360 365
Phe Glu Leu Phe Leu Arg His Lys Asp Val Ile Gly Arg Val Thr Leu
370 375 380
Trp Gly Thr His Asp Gly Glu Ser Trp Leu Asn Gly Phe Pro Val Arg
385 390 395 400
Gly Arg Thr Asp Tyr Pro Leu Leu Phe Asp Arg Arg Tyr Gln Pro Lys
405 410 415
Pro Ala Phe Phe Ala Val Arg Gln Val Ala Gln Ala His Thr Val Gln
420 425 430
Thr Thr Gly Ala Gln Thr Gln Ala Thr Ala Lys Thr Ile Gln Lys Ala
435 440 445
Ser Arg Glu Tyr Phe
450
<210> 117
<211> 1437
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 117
atgacgaacc gtaaattgaa cgtgcaccgt tcattgagcg atgatttgct cgatggcgcc 60
ttcgccgagt caaaagcggg caaagttgag aaataccgtg ccacggggat ccttggaacg 120
ctattcggat tcactgtggc gtcctccatc atgttggcgg cttgcagcaa cgcacaagag 180
aatgctccac cagttgcttc atccaccgca caaagcaata tcacccagga gaacgttccg 240
ccgctcaagg atgcgtttaa gggcaagttc ttgattggca ccatcgcgag caatcgcttg 300
ctgcagggac aagatccagc cacagaagcc ctggtgcgca ggcacttcga cgccctcacg 360
gcggaaaatg ccatgaagcc tgatgccatg caacccagag agggtgagtt caactttgcc 420
gccgctgacc gcctggtgga aatcgcccag caaagcggcg ccacggtggt cggccacacc 480
ttggtctggc atagccaaac gccaagctgg ttcttccagg gtccagatgg ccaaccggcg 540
agtcgggaac tggccttggc acggatgcga acgcacatca agactgtggt gggacgctac 600
aaaggacgca tcaagcaatg ggatgtggtc aacgaagcga tcaacgacgg ccctggagtg 660
ctgcggccat cgccgtggtt gcgcgccatc ggcgaagact tcatcgccga agcgttccgc 720
gccgcgcacg aagctgatcc cgacgcgatt ctcgtctaca acgactacaa catcgagctc 780
aactacaagc gtcccaaggc gctggaacta ctgaagagac tcatcgagca gaaggttccg 840
attcatggtg tgggcattca ggctcactgg cgcatgaccc cgccgctggc cgagatggaa 900
gagaccatca agcagttttc ggctttgggc ttgaaggtaa tgatcaccga gttggacatt 960
ggtgtattgc caacacaata ccagggtgcc gacatctcgg ctcgcgagac catgacaccc 1020
gaacagcaag cggtgatgaa cccttacacg cagggcttgc cggctgaagt ggcgcagcaa 1080
catgccgagc gttatcgtca ggcgtttgag ctgttcatgc gttacaagga tgtgattggt 1140
cgcgttaccc tgtggggcac gcatgatggc gaatcttggc tgaacggttt tcccgttcgt 1200
ggccgcacgg attatcctct actgttcgac cgccggtatc agcctaagcc cgccttcttc 1260
gcggtgcaaa aggtcgcgca ggcgcagaac gcacaggcag caaccgatca agcaccactt 1320
gcacaaaacc cagttgcgca gaagaaatct gcaccaaggc aggcggctca aaatcagacc 1380
actcaaaagc cagtggtaca aaagcaaagt gcggcaagtc gggccgcaga aaagtaa 1437
<210> 118
<211> 478
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 118
Met Thr Asn Arg Lys Leu Asn Val His Arg Ser Leu Ser Asp Asp Leu
1 5 10 15
Leu Asp Gly Ala Phe Ala Glu Ser Lys Ala Gly Lys Val Glu Lys Tyr
20 25 30
Arg Ala Thr Gly Ile Leu Gly Thr Leu Phe Gly Phe Thr Val Ala Ser
35 40 45
Ser Ile Met Leu Ala Ala Cys Ser Asn Ala Gln Glu Asn Ala Pro Pro
50 55 60
Val Ala Ser Ser Thr Ala Gln Ser Asn Ile Thr Gln Glu Asn Val Pro
65 70 75 80
Pro Leu Lys Asp Ala Phe Lys Gly Lys Phe Leu Ile Gly Thr Ile Ala
85 90 95
Ser Asn Arg Leu Leu Gln Gly Gln Asp Pro Ala Thr Glu Ala Leu Val
100 105 110
Arg Arg His Phe Asp Ala Leu Thr Ala Glu Asn Ala Met Lys Pro Asp
115 120 125
Ala Met Gln Pro Arg Glu Gly Glu Phe Asn Phe Ala Ala Ala Asp Arg
130 135 140
Leu Val Glu Ile Ala Gln Gln Ser Gly Ala Thr Val Val Gly His Thr
145 150 155 160
Leu Val Trp His Ser Gln Thr Pro Ser Trp Phe Phe Gln Gly Pro Asp
165 170 175
Gly Gln Pro Ala Ser Arg Glu Leu Ala Leu Ala Arg Met Arg Thr His
180 185 190
Ile Lys Thr Val Val Gly Arg Tyr Lys Gly Arg Ile Lys Gln Trp Asp
195 200 205
Val Val Asn Glu Ala Ile Asn Asp Gly Pro Gly Val Leu Arg Pro Ser
210 215 220
Pro Trp Leu Arg Ala Ile Gly Glu Asp Phe Ile Ala Glu Ala Phe Arg
225 230 235 240
Ala Ala His Glu Ala Asp Pro Asp Ala Ile Leu Val Tyr Asn Asp Tyr
245 250 255
Asn Ile Glu Leu Asn Tyr Lys Arg Pro Lys Ala Leu Glu Leu Leu Lys
260 265 270
Arg Leu Ile Glu Gln Lys Val Pro Ile His Gly Val Gly Ile Gln Ala
275 280 285
His Trp Arg Met Thr Pro Pro Leu Ala Glu Met Glu Glu Thr Ile Lys
290 295 300
Gln Phe Ser Ala Leu Gly Leu Lys Val Met Ile Thr Glu Leu Asp Ile
305 310 315 320
Gly Val Leu Pro Thr Gln Tyr Gln Gly Ala Asp Ile Ser Ala Arg Glu
325 330 335
Thr Met Thr Pro Glu Gln Gln Ala Val Met Asn Pro Tyr Thr Gln Gly
340 345 350
Leu Pro Ala Glu Val Ala Gln Gln His Ala Glu Arg Tyr Arg Gln Ala
355 360 365
Phe Glu Leu Phe Met Arg Tyr Lys Asp Val Ile Gly Arg Val Thr Leu
370 375 380
Trp Gly Thr His Asp Gly Glu Ser Trp Leu Asn Gly Phe Pro Val Arg
385 390 395 400
Gly Arg Thr Asp Tyr Pro Leu Leu Phe Asp Arg Arg Tyr Gln Pro Lys
405 410 415
Pro Ala Phe Phe Ala Val Gln Lys Val Ala Gln Ala Gln Asn Ala Gln
420 425 430
Ala Ala Thr Asp Gln Ala Pro Leu Ala Gln Asn Pro Val Ala Gln Lys
435 440 445
Lys Ser Ala Pro Arg Gln Ala Ala Gln Asn Gln Thr Thr Gln Lys Pro
450 455 460
Val Val Gln Lys Gln Ser Ala Ala Ser Arg Ala Ala Glu Lys
465 470 475
<210> 119
<211> 2559
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 119
atgaaaaaaa gattgttagc gttgatagtg acattagttt ttattatctc attgtttaat 60
cccatattca ccacaccttt aacaaatgta gcaaaggctc aaagtaacca aacaaattta 120
aaatttgact ttgaaaacgg tactcaaggt tggggagcaa gaggtgtttc aacaactatt 180
gcaaccgttt acgagcaagc ttatgaagga agttattctt taaaggtttc aggtagaagt 240
tcaacgtggg atggagcagt tgtggatatc acatcaagta tttcagcaaa tgtcacctat 300
acagtttctt tatttgttcg tcacagcgat gtaaaaccac aaagattttc tgtctatgta 360
tatgtcaaag ataacacagg cgaaaaatac atccaggttg cagacaaagt ggttatgcca 420
aacttttgga agcagctctt tgggaagttc acaatcacaa catcaaatcc aattcaaaaa 480
gtagaacttc ttgtatgtgt tccatctaac aaatctttag gattttatct tgacaatgta 540
gttattactt cagcacaacc agcttcctcg ggtgttgtta aatcttgcac atttgaaagc 600
ggtagcactg agggttttgt tcagagaggt tcagcttcat tgacagttgt cgacggtgta 660
tactatcatt ctccaacaaa agcattatat gtgacaggaa ggacagctac atggcagggt 720
gcacagatag atatgacaag tttgcttgag aagggcaagg attatcagtt tagcatatgg 780
gtatatcaaa atagtggaag tgatcagaag ataaccctta cgatgcaaag gaagaatgaa 840
gatggaacta cgagttatga ttctataaag tatcagcaaa cagttccatc tggtacatgg 900
acagaagtaa caggttcata cacagtgcct cagacagcaa cacagcttat attctatgtt 960
gaatcaccga atattaattt tgacttctac cttgatgact ttacagcggt tgacaaaaac 1020
ccacctgttg taaacccagg gcttgttaaa tcttgcacat ttgaaagcgg tagcactgag 1080
ggttttgttc agagaggttc agcttcattg acagttgtcg acggtgtata ctatcattct 1140
ccaacaaaag cattgtatgt gacaggaagg acagctacat ggcagggtgc acagatagat 1200
atgacaagtt tgcttgagaa gggcaaggat tatcagttta gcatatgggt atatcaaaat 1260
agtggaagtg atcagaagat aacccttacg atgcaaagga agaatgaaga tggaactacg 1320
agttatgatt ctataaagta tcagcaaaca gttccatctg gtacatggac agaagtaaca 1380
ggttcataca cagtgcctca gacagcaaca cagcttatat tctatgttga atcaccgaat 1440
attaattttg acttctacct tgatgacttt acagtaatag ataaaaatcc agtgacggta 1500
ccgattgcag caaaagaacc cgaatgggaa attccgtcac tttgtcagca atatagtcaa 1560
tatttctcaa taggtgttgc aataccgtat aaagtacttc aaaatcctgt tgaaagagca 1620
atggtgttaa aacacttcaa cagtataaca gctgaaaatg agatgaaacc tgacgctctg 1680
caaagaacag aagggaactt tacattcgat atagcagacc agtatgtaaa cttcgcacag 1740
caaaacggta ttggaattag agggcatact ctggtatggc acagccaagt acctaattgg 1800
ttcttccagc acagtgatgg aacttcactt gatccaagca atccagatga taagcaactt 1860
ttgagagata gattgaaaaa tcatattcaa actgttatgt caagatacaa agggaaagtc 1920
tatgcatggg atgttgtaaa cgaggcaata gatgaaagcc agcctgatgg atttagaaga 1980
agcgaatggt acagaatact tggtccaaca cctgagacaa atggtattcc agaatacatt 2040
gtgcttgctt tcaggtatgc aagagaggcg gatccggatg caaaactttt ctacaatgac 2100
tacaacacag agatatctaa aaaaagacag tttatatatg acatggtaaa aaagctacat 2160
gatatgggtt taattgatgg tgttggtttg caagggcata taaatgttga ttctccaaca 2220
gtaaaagata tagaagatac aatcaatctt ttctcaacaa ttcctggact tgagatacag 2280
gtaacagagc ttgacataag cgtttacaca agcagcagtc agcgttatga tacgcttcct 2340
caggatataa tgataaaaca agcaatgaag tttaaagaac tatttgaaat gttaaagaga 2400
catagtgata gagtcacaaa tgtgacactt tggggactta aggatgatta ttcatggctt 2460
tcaaaggata gaaataactg gccattgctt tttgacagca actaccaggc aaaatacagc 2520
tactgggcaa ttcaaaaagc ttctcgagag tacttctag 2559
<210> 120
<211> 852
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(33)
<400> 120
Met Lys Lys Arg Leu Leu Ala Leu Ile Val Thr Leu Val Phe Ile Ile
1 5 10 15
Ser Leu Phe Asn Pro Ile Phe Thr Thr Pro Leu Thr Asn Val Ala Lys
20 25 30
Ala Gln Ser Asn Gln Thr Asn Leu Lys Phe Asp Phe Glu Asn Gly Thr
35 40 45
Gln Gly Trp Gly Ala Arg Gly Val Ser Thr Thr Ile Ala Thr Val Tyr
50 55 60
Glu Gln Ala Tyr Glu Gly Ser Tyr Ser Leu Lys Val Ser Gly Arg Ser
65 70 75 80
Ser Thr Trp Asp Gly Ala Val Val Asp Ile Thr Ser Ser Ile Ser Ala
85 90 95
Asn Val Thr Tyr Thr Val Ser Leu Phe Val Arg His Ser Asp Val Lys
100 105 110
Pro Gln Arg Phe Ser Val Tyr Val Tyr Val Lys Asp Asn Thr Gly Glu
115 120 125
Lys Tyr Ile Gln Val Ala Asp Lys Val Val Met Pro Asn Phe Trp Lys
130 135 140
Gln Leu Phe Gly Lys Phe Thr Ile Thr Thr Ser Asn Pro Ile Gln Lys
145 150 155 160
Val Glu Leu Leu Val Cys Val Pro Ser Asn Lys Ser Leu Gly Phe Tyr
165 170 175
Leu Asp Asn Val Val Ile Thr Ser Ala Gln Pro Ala Ser Ser Gly Val
180 185 190
Val Lys Ser Cys Thr Phe Glu Ser Gly Ser Thr Glu Gly Phe Val Gln
195 200 205
Arg Gly Ser Ala Ser Leu Thr Val Val Asp Gly Val Tyr Tyr His Ser
210 215 220
Pro Thr Lys Ala Leu Tyr Val Thr Gly Arg Thr Ala Thr Trp Gln Gly
225 230 235 240
Ala Gln Ile Asp Met Thr Ser Leu Leu Glu Lys Gly Lys Asp Tyr Gln
245 250 255
Phe Ser Ile Trp Val Tyr Gln Asn Ser Gly Ser Asp Gln Lys Ile Thr
260 265 270
Leu Thr Met Gln Arg Lys Asn Glu Asp Gly Thr Thr Ser Tyr Asp Ser
275 280 285
Ile Lys Tyr Gln Gln Thr Val Pro Ser Gly Thr Trp Thr Glu Val Thr
290 295 300
Gly Ser Tyr Thr Val Pro Gln Thr Ala Thr Gln Leu Ile Phe Tyr Val
305 310 315 320
Glu Ser Pro Asn Ile Asn Phe Asp Phe Tyr Leu Asp Asp Phe Thr Ala
325 330 335
Val Asp Lys Asn Pro Pro Val Val Asn Pro Gly Leu Val Lys Ser Cys
340 345 350
Thr Phe Glu Ser Gly Ser Thr Glu Gly Phe Val Gln Arg Gly Ser Ala
355 360 365
Ser Leu Thr Val Val Asp Gly Val Tyr Tyr His Ser Pro Thr Lys Ala
370 375 380
Leu Tyr Val Thr Gly Arg Thr Ala Thr Trp Gln Gly Ala Gln Ile Asp
385 390 395 400
Met Thr Ser Leu Leu Glu Lys Gly Lys Asp Tyr Gln Phe Ser Ile Trp
405 410 415
Val Tyr Gln Asn Ser Gly Ser Asp Gln Lys Ile Thr Leu Thr Met Gln
420 425 430
Arg Lys Asn Glu Asp Gly Thr Thr Ser Tyr Asp Ser Ile Lys Tyr Gln
435 440 445
Gln Thr Val Pro Ser Gly Thr Trp Thr Glu Val Thr Gly Ser Tyr Thr
450 455 460
Val Pro Gln Thr Ala Thr Gln Leu Ile Phe Tyr Val Glu Ser Pro Asn
465 470 475 480
Ile Asn Phe Asp Phe Tyr Leu Asp Asp Phe Thr Val Ile Asp Lys Asn
485 490 495
Pro Val Thr Val Pro Ile Ala Ala Lys Glu Pro Glu Trp Glu Ile Pro
500 505 510
Ser Leu Cys Gln Gln Tyr Ser Gln Tyr Phe Ser Ile Gly Val Ala Ile
515 520 525
Pro Tyr Lys Val Leu Gln Asn Pro Val Glu Arg Ala Met Val Leu Lys
530 535 540
His Phe Asn Ser Ile Thr Ala Glu Asn Glu Met Lys Pro Asp Ala Leu
545 550 555 560
Gln Arg Thr Glu Gly Asn Phe Thr Phe Asp Ile Ala Asp Gln Tyr Val
565 570 575
Asn Phe Ala Gln Gln Asn Gly Ile Gly Ile Arg Gly His Thr Leu Val
580 585 590
Trp His Ser Gln Val Pro Asn Trp Phe Phe Gln His Ser Asp Gly Thr
595 600 605
Ser Leu Asp Pro Ser Asn Pro Asp Asp Lys Gln Leu Leu Arg Asp Arg
610 615 620
Leu Lys Asn His Ile Gln Thr Val Met Ser Arg Tyr Lys Gly Lys Val
625 630 635 640
Tyr Ala Trp Asp Val Val Asn Glu Ala Ile Asp Glu Ser Gln Pro Asp
645 650 655
Gly Phe Arg Arg Ser Glu Trp Tyr Arg Ile Leu Gly Pro Thr Pro Glu
660 665 670
Thr Asn Gly Ile Pro Glu Tyr Ile Val Leu Ala Phe Arg Tyr Ala Arg
675 680 685
Glu Ala Asp Pro Asp Ala Lys Leu Phe Tyr Asn Asp Tyr Asn Thr Glu
690 695 700
Ile Ser Lys Lys Arg Gln Phe Ile Tyr Asp Met Val Lys Lys Leu His
705 710 715 720
Asp Met Gly Leu Ile Asp Gly Val Gly Leu Gln Gly His Ile Asn Val
725 730 735
Asp Ser Pro Thr Val Lys Asp Ile Glu Asp Thr Ile Asn Leu Phe Ser
740 745 750
Thr Ile Pro Gly Leu Glu Ile Gln Val Thr Glu Leu Asp Ile Ser Val
755 760 765
Tyr Thr Ser Ser Ser Gln Arg Tyr Asp Thr Leu Pro Gln Asp Ile Met
770 775 780
Ile Lys Gln Ala Met Lys Phe Lys Glu Leu Phe Glu Met Leu Lys Arg
785 790 795 800
His Ser Asp Arg Val Thr Asn Val Thr Leu Trp Gly Leu Lys Asp Asp
805 810 815
Tyr Ser Trp Leu Ser Lys Asp Arg Asn Asn Trp Pro Leu Leu Phe Asp
820 825 830
Ser Asn Tyr Gln Ala Lys Tyr Ser Tyr Trp Ala Ile Gln Lys Ala Ser
835 840 845
Arg Glu Tyr Phe
850
<210> 121
<211> 1905
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 121
atgaagcata tttttattgt attaattgtt tccctgctgt ttagcttcgg gggatatgct 60
caacaaacca ttagcagagc tccgcagggg tttgaccagc aacgtgccgg cattgcatcc 120
ggtaaagttg aaatcgtaac ctataaatcg aaaaccgtag gagtgaatcg ctctgcacgt 180
gtttatacac cagccggatt ctcaaaaaag aagaaatatc ctgtgcttta tttattacat 240
ggcattggag gcgacgaaga tgagtggtac aaaaacggcg ttcctcatat tattttcgac 300
aacctgattg ccgacggcaa aatggaaccg atgattgtgg tactgcccaa tggtcgcgcc 360
atgaaaaacg accgtgccga aggaaatatt ttcgacaaag agaaagttga agcctttgca 420
acattcgaaa aagacctttt aaacgattta ataccgttta tcgaaaaaaa ataccctgta 480
ttaaaaaccc gtgagtttcg cgccattgca ggattatcaa tgggcggcgg acaatcgctc 540
aattttggac tgggaaatct cgacaaattt gcatgggtag gcggcttttc atcggccccc 600
aataccaaaa tgcccgctga gttggttcca aacactcaaa aggcaacaga aatgcttaag 660
ttgctttatg tgtcttgtgg cgataaagac aatttaatgc aggttagtca gcgcacccac 720
gattatctga aagccaataa agtacctcat attttcaggg ttattcctga tggttaccac 780
gattttaatg tttggaaaga cgatttgtat cattacgtac aaatgctgtt taagcctgtg 840
gtaatgcccg tagcagcagc tactttaaaa gatgcttata aagggaaatt cttcattgga 900
actgccctta atacccctca aattttgggt accgctgttg atgaagtgaa tattgttaaa 960
acccatttca actccattgt tgccgaaaac tgtatgaaga gtggcccgat gcaaccacaa 1020
gaagggaaat ttgagtttga cctggccgat aagtttgtag agtttggagt taaaaacaat 1080
atgcagatta ttggtcatac gcttatctgg cattcgcagg caccccgctg gttttttacc 1140
gacagcgaag gcaaggacgt atcgcccgag gtgcttaccg agcgcatgaa aaaccatatc 1200
tatactgttg ttggccgtta caaaggcaag gtgcacggat gggatgtggt gaatgaagcc 1260
atagttgacg atggcagcta ccgaaacagt aaattctacc aaatactggg cgaagatttt 1320
atcaaactgg cattccagtt tgctcatgaa gccgaccccg atgcagaatt gtactacaac 1380
gattattccg aatttgttcc tgccaaaaga gaaggcattg cccgcatggt gaagaaactc 1440
aaagaccagg gcattagaat cgacggcgtt ggatttcagt gccatattgg cctcgattat 1500
ccaggcctgg atgaatacga aaaaaccatt caattaattg ccaacgaggg ggtaaaagta 1560
atgataaccg aaatggaaat atcggtatta cccatgcccg actggcgcgt tggtgctgag 1620
atttcggcca gtttcgaata tcaacagaaa ttaaatccct acaccgaagg attgcccgat 1680
tcagtgaatg ctcaattaga acagcgttat gtcgactttt tcacgctctt ccttaaatat 1740
cacgaagtga ttccaagagt tacggtttgg ggggttaacg atggcaactc atggaaaaac 1800
ggattcccgg tgcgtggaag aaccgactac ccattgttat tcgaccggaa aaatcagcct 1860
aaatcagctg ttgccaaatt aattgaactg gctaatacaa agtag 1905
<210> 122
<211> 634
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(20)
<400> 122
Met Lys His Ile Phe Ile Val Leu Ile Val Ser Leu Leu Phe Ser Phe
1 5 10 15
Gly Gly Tyr Ala Gln Gln Thr Ile Ser Arg Ala Pro Gln Gly Phe Asp
20 25 30
Gln Gln Arg Ala Gly Ile Ala Ser Gly Lys Val Glu Ile Val Thr Tyr
35 40 45
Lys Ser Lys Thr Val Gly Val Asn Arg Ser Ala Arg Val Tyr Thr Pro
50 55 60
Ala Gly Phe Ser Lys Lys Lys Lys Tyr Pro Val Leu Tyr Leu Leu His
65 70 75 80
Gly Ile Gly Gly Asp Glu Asp Glu Trp Tyr Lys Asn Gly Val Pro His
85 90 95
Ile Ile Phe Asp Asn Leu Ile Ala Asp Gly Lys Met Glu Pro Met Ile
100 105 110
Val Val Leu Pro Asn Gly Arg Ala Met Lys Asn Asp Arg Ala Glu Gly
115 120 125
Asn Ile Phe Asp Lys Glu Lys Val Glu Ala Phe Ala Thr Phe Glu Lys
130 135 140
Asp Leu Leu Asn Asp Leu Ile Pro Phe Ile Glu Lys Lys Tyr Pro Val
145 150 155 160
Leu Lys Thr Arg Glu Phe Arg Ala Ile Ala Gly Leu Ser Met Gly Gly
165 170 175
Gly Gln Ser Leu Asn Phe Gly Leu Gly Asn Leu Asp Lys Phe Ala Trp
180 185 190
Val Gly Gly Phe Ser Ser Ala Pro Asn Thr Lys Met Pro Ala Glu Leu
195 200 205
Val Pro Asn Thr Gln Lys Ala Thr Glu Met Leu Lys Leu Leu Tyr Val
210 215 220
Ser Cys Gly Asp Lys Asp Asn Leu Met Gln Val Ser Gln Arg Thr His
225 230 235 240
Asp Tyr Leu Lys Ala Asn Lys Val Pro His Ile Phe Arg Val Ile Pro
245 250 255
Asp Gly Tyr His Asp Phe Asn Val Trp Lys Asp Asp Leu Tyr His Tyr
260 265 270
Val Gln Met Leu Phe Lys Pro Val Val Met Pro Val Ala Ala Ala Thr
275 280 285
Leu Lys Asp Ala Tyr Lys Gly Lys Phe Phe Ile Gly Thr Ala Leu Asn
290 295 300
Thr Pro Gln Ile Leu Gly Thr Ala Val Asp Glu Val Asn Ile Val Lys
305 310 315 320
Thr His Phe Asn Ser Ile Val Ala Glu Asn Cys Met Lys Ser Gly Pro
325 330 335
Met Gln Pro Gln Glu Gly Lys Phe Glu Phe Asp Leu Ala Asp Lys Phe
340 345 350
Val Glu Phe Gly Val Lys Asn Asn Met Gln Ile Ile Gly His Thr Leu
355 360 365
Ile Trp His Ser Gln Ala Pro Arg Trp Phe Phe Thr Asp Ser Glu Gly
370 375 380
Lys Asp Val Ser Pro Glu Val Leu Thr Glu Arg Met Lys Asn His Ile
385 390 395 400
Tyr Thr Val Val Gly Arg Tyr Lys Gly Lys Val His Gly Trp Asp Val
405 410 415
Val Asn Glu Ala Ile Val Asp Asp Gly Ser Tyr Arg Asn Ser Lys Phe
420 425 430
Tyr Gln Ile Leu Gly Glu Asp Phe Ile Lys Leu Ala Phe Gln Phe Ala
435 440 445
His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Glu
450 455 460
Phe Val Pro Ala Lys Arg Glu Gly Ile Ala Arg Met Val Lys Lys Leu
465 470 475 480
Lys Asp Gln Gly Ile Arg Ile Asp Gly Val Gly Phe Gln Cys His Ile
485 490 495
Gly Leu Asp Tyr Pro Gly Leu Asp Glu Tyr Glu Lys Thr Ile Gln Leu
500 505 510
Ile Ala Asn Glu Gly Val Lys Val Met Ile Thr Glu Met Glu Ile Ser
515 520 525
Val Leu Pro Met Pro Asp Trp Arg Val Gly Ala Glu Ile Ser Ala Ser
530 535 540
Phe Glu Tyr Gln Gln Lys Leu Asn Pro Tyr Thr Glu Gly Leu Pro Asp
545 550 555 560
Ser Val Asn Ala Gln Leu Glu Gln Arg Tyr Val Asp Phe Phe Thr Leu
565 570 575
Phe Leu Lys Tyr His Glu Val Ile Pro Arg Val Thr Val Trp Gly Val
580 585 590
Asn Asp Gly Asn Ser Trp Lys Asn Gly Phe Pro Val Arg Gly Arg Thr
595 600 605
Asp Tyr Pro Leu Leu Phe Asp Arg Lys Asn Gln Pro Lys Ser Ala Val
610 615 620
Ala Lys Leu Ile Glu Leu Ala Asn Thr Lys
625 630
<210> 123
<211> 1200
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 123
atgatcgttg gattctcgtt tatgctgctg cttcctttag ggatgacgaa tgcattggca 60
aaaacggaac cagcgtacgc taaaaagccg cgaatcagcg cattgcacgc ccctcaattg 120
gatcagcgct acaaagattc cttcactatt ggggcggccg ttgaacctta tcagttgcaa 180
aacgaaaaag acgtccaaat gctgaaacgc cattttaaca gcattgtcgc tgagaacgtt 240
atgaaaccga tcaacatcca acccgaagaa ggaaagttca attttgctga ggcggatcaa 300
atcgtccgat ttgctaaaaa acatcatatg gatattcgtt tccatacact cgtttggcac 360
agccaagtac ctcaatggtt ctttcttgac aaggaaggca agccgatggt caatgaaacg 420
gatccggcaa agcgcgaaca aaataaacag ctgttactga aacggctcga aatccatatt 480
aaaacgattg tcgaacggta taaagacgac atcaaatatt gggacgtcgt gaacgaggta 540
gtcggggatg atggaaaatt gcgcaattcc ccgtggtatc aaatcgccgg catcgattat 600
atcaaggtag cattccaaac ggcgagaaca tatggcggca acaagattaa actgtacatc 660
aacgattaca ataccgaagt ggaaccgaag cgaagcgctc tttataactt agtgaaacaa 720
ttaaaagaag aaggcgttcc cattgacggg attggccacc agtcccacat ccaaattggc 780
tggccttctg aagaagaaat cgaaaaaacg atcaacatgt ttgccgatct agggttagac 840
aatcaaatta cggagctgga tgtgagcatg tacggctggc cgccgcgcgc ctacccgtcg 900
tatgacgcca ttccggaaca aaagtttttg gaccaagcgg ctcgctatga ccgattgttt 960
aagctgtacg aaaaacttgg cgataaaatc agcaacgtca ccttctgggg catcgccgac 1020
aaccatacgt ggctcgacag ccgtgcggat gtgtactatg acgccaacgg gaatgttgtg 1080
gttgacccga acgctccgta cgcaaaagtg gaaaaaggga aaggaaaaga tgcgccgttt 1140
ctgttcgacc ccgaatacca cgtaaaacct gcgtattggg ccattatcga tcataagtga 1200
<210> 124
<211> 399
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(20)
<400> 124
Met Ile Val Gly Phe Ser Phe Met Leu Leu Leu Pro Leu Gly Met Thr
1 5 10 15
Asn Ala Leu Ala Lys Thr Glu Pro Ala Tyr Ala Lys Lys Pro Arg Ile
20 25 30
Ser Ala Leu His Ala Pro Gln Leu Asp Gln Arg Tyr Lys Asp Ser Phe
35 40 45
Thr Ile Gly Ala Ala Val Glu Pro Tyr Gln Leu Gln Asn Glu Lys Asp
50 55 60
Val Gln Met Leu Lys Arg His Phe Asn Ser Ile Val Ala Glu Asn Val
65 70 75 80
Met Lys Pro Ile Asn Ile Gln Pro Glu Glu Gly Lys Phe Asn Phe Ala
85 90 95
Glu Ala Asp Gln Ile Val Arg Phe Ala Lys Lys His His Met Asp Ile
100 105 110
Arg Phe His Thr Leu Val Trp His Ser Gln Val Pro Gln Trp Phe Phe
115 120 125
Leu Asp Lys Glu Gly Lys Pro Met Val Asn Glu Thr Asp Pro Ala Lys
130 135 140
Arg Glu Gln Asn Lys Gln Leu Leu Leu Lys Arg Leu Glu Ile His Ile
145 150 155 160
Lys Thr Ile Val Glu Arg Tyr Lys Asp Asp Ile Lys Tyr Trp Asp Val
165 170 175
Val Asn Glu Val Val Gly Asp Asp Gly Lys Leu Arg Asn Ser Pro Trp
180 185 190
Tyr Gln Ile Ala Gly Ile Asp Tyr Ile Lys Val Ala Phe Gln Thr Ala
195 200 205
Arg Thr Tyr Gly Gly Asn Lys Ile Lys Leu Tyr Ile Asn Asp Tyr Asn
210 215 220
Thr Glu Val Glu Pro Lys Arg Ser Ala Leu Tyr Asn Leu Val Lys Gln
225 230 235 240
Leu Lys Glu Glu Gly Val Pro Ile Asp Gly Ile Gly His Gln Ser His
245 250 255
Ile Gln Ile Gly Trp Pro Ser Glu Glu Glu Ile Glu Lys Thr Ile Asn
260 265 270
Met Phe Ala Asp Leu Gly Leu Asp Asn Gln Ile Thr Glu Leu Asp Val
275 280 285
Ser Met Tyr Gly Trp Pro Pro Arg Ala Tyr Pro Ser Tyr Asp Ala Ile
290 295 300
Pro Glu Gln Lys Phe Leu Asp Gln Ala Ala Arg Tyr Asp Arg Leu Phe
305 310 315 320
Lys Leu Tyr Glu Lys Leu Gly Asp Lys Ile Ser Asn Val Thr Phe Trp
325 330 335
Gly Ile Ala Asp Asn His Thr Trp Leu Asp Ser Arg Ala Asp Val Tyr
340 345 350
Tyr Asp Ala Asn Gly Asn Val Val Val Asp Pro Asn Ala Pro Tyr Ala
355 360 365
Lys Val Glu Lys Gly Lys Gly Lys Asp Ala Pro Phe Leu Phe Asp Pro
370 375 380
Glu Tyr His Val Lys Pro Ala Tyr Trp Ala Ile Ile Asp His Lys
385 390 395
<210> 125
<211> 1089
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 125
atgttgacga ccccgacaac tcaagatcat gtccccgtgc tcaaggacgc tttcaaaggc 60
aagctcctca ttggagccgt gctcggttac gatgctctcc aggggaagga cccgctgagt 120
gagaaaattg cgaccactca cttcgatgct ctcactgctg aaaacagcat gaagccggct 180
ctcgtgcaac ccaaagaggg cgagtttgat ttcgctgatg gagatcgtct ccttgaaatc 240
gcgcagcaat gcggcgctac tgcaatcggc catactctgc tctggcacca acaaacgcca 300
cgctggtttt ttgaagggcc agatggtcag cctgctgacc gtgagttggc cctggcacgc 360
atgaggaagc acatttccac tctcgttggt cgctataaag gtcgcattaa acaatgggat 420
gtggtgaatg aggcgattag cgatgcagag ggcgagtact taagaccaaa gagcccctgg 480
ttcaaagccg ttggagagga tcacatcgcg catgctttcc aggcagcaca tgaagctgat 540
cccgatgcca tccttatcta taacgactac aacatcgagc aggagtacaa gcgcccgaag 600
gcgatacgcc tactgaggtc attacttgag caggacgttc ccattcatgc cgtgggcatt 660
cagggccatt ggcgtatgga cactctgaat gttgccgaaa tcgaagaagc tatcgaagaa 720
tttgctgcgc tgggtctcaa ggtcatgatc accgagcttg atatcagcgt gctaccgaca 780
aagtatcagg gagccgatct cgctactcgg gaagaattga cgcctgaaat caatccctat 840
acggaggaac tacctgagga cgttgcccgg caacatgccg agtgttatcg gcaggtcttc 900
gaaatgttcc tgcgccacaa ggatgccatt agccgtgtca cgctctgggg cattcacgat 960
ggcagatcat ggttcaacaa ctttccggtc agggggcgca cagactatcc tctgctattc 1020
gaccgggaat gtaaccccaa gccagcgttt ttcgccgtct tgaaagctgc gcaagaccag 1080
ccacaatga 1089
<210> 126
<211> 362
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 126
Met Leu Thr Thr Pro Thr Thr Gln Asp His Val Pro Val Leu Lys Asp
1 5 10 15
Ala Phe Lys Gly Lys Leu Leu Ile Gly Ala Val Leu Gly Tyr Asp Ala
20 25 30
Leu Gln Gly Lys Asp Pro Leu Ser Glu Lys Ile Ala Thr Thr His Phe
35 40 45
Asp Ala Leu Thr Ala Glu Asn Ser Met Lys Pro Ala Leu Val Gln Pro
50 55 60
Lys Glu Gly Glu Phe Asp Phe Ala Asp Gly Asp Arg Leu Leu Glu Ile
65 70 75 80
Ala Gln Gln Cys Gly Ala Thr Ala Ile Gly His Thr Leu Leu Trp His
85 90 95
Gln Gln Thr Pro Arg Trp Phe Phe Glu Gly Pro Asp Gly Gln Pro Ala
100 105 110
Asp Arg Glu Leu Ala Leu Ala Arg Met Arg Lys His Ile Ser Thr Leu
115 120 125
Val Gly Arg Tyr Lys Gly Arg Ile Lys Gln Trp Asp Val Val Asn Glu
130 135 140
Ala Ile Ser Asp Ala Glu Gly Glu Tyr Leu Arg Pro Lys Ser Pro Trp
145 150 155 160
Phe Lys Ala Val Gly Glu Asp His Ile Ala His Ala Phe Gln Ala Ala
165 170 175
His Glu Ala Asp Pro Asp Ala Ile Leu Ile Tyr Asn Asp Tyr Asn Ile
180 185 190
Glu Gln Glu Tyr Lys Arg Pro Lys Ala Ile Arg Leu Leu Arg Ser Leu
195 200 205
Leu Glu Gln Asp Val Pro Ile His Ala Val Gly Ile Gln Gly His Trp
210 215 220
Arg Met Asp Thr Leu Asn Val Ala Glu Ile Glu Glu Ala Ile Glu Glu
225 230 235 240
Phe Ala Ala Leu Gly Leu Lys Val Met Ile Thr Glu Leu Asp Ile Ser
245 250 255
Val Leu Pro Thr Lys Tyr Gln Gly Ala Asp Leu Ala Thr Arg Glu Glu
260 265 270
Leu Thr Pro Glu Ile Asn Pro Tyr Thr Glu Glu Leu Pro Glu Asp Val
275 280 285
Ala Arg Gln His Ala Glu Cys Tyr Arg Gln Val Phe Glu Met Phe Leu
290 295 300
Arg His Lys Asp Ala Ile Ser Arg Val Thr Leu Trp Gly Ile His Asp
305 310 315 320
Gly Arg Ser Trp Phe Asn Asn Phe Pro Val Arg Gly Arg Thr Asp Tyr
325 330 335
Pro Leu Leu Phe Asp Arg Glu Cys Asn Pro Lys Pro Ala Phe Phe Ala
340 345 350
Val Leu Lys Ala Ala Gln Asp Gln Pro Gln
355 360
<210> 127
<211> 960
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 127
gtggatctcg ctgagaaatg cggcatatat attggtgcag cggttgaacc cggatattta 60
attatcaggg aatacgctga gattttatcc cgcgaattta acgtggtaac cgcggaaaat 120
gcattaaaat ttgaagctat tcatccgcag cgtggagtat attcatttga aggtgcagat 180
gcaatagttc gatttgcaga aactcatgga atgaaggttc gtggacatac acttgtttgg 240
caccagcagc ttcctgcatg gataacttct ggaagttacg cttgggagga gtggaagaat 300
attctccgtg agcatgtaat gagcgttgtt ggacgatata agggccaaat atatgcatgg 360
gatgtggtta acgaagcaat attagataac ggttcattaa gagataatgt ttggtttaga 420
aatgtaggtc cagaatatat tgagtcagcc tttagatggg ctcatgaagc tgacccaaac 480
gctcttctct tctataatga ttatgaagct gaggacttga atgataagtc gcatgctgtt 540
tataacctgg ttaagagttt acttgagaaa ggtgtaccga tacatggcgt aggattacag 600
atgcatatta acgtagaaaa tccgccgaaa ccggaagatg ttgcagcaaa cattaaacgt 660
ctaaatgatc tgggcttgat tgtccacata acggaaatgg atgtgcgcat tagaacccca 720
ccatcaaatg aagatctcat taaacaagca gaaatttacc gtgatatatt aagagtttgt 780
ctttcatcag aaaaatgcac agcattcatt atgtggggat ttactgaccg ctattcatgg 840
ataccaaatt acttcagcgg ctacggttca gctttaatat tcgatgagca atataagccc 900
aaactagcat attactatat acttcggaca ttcatcgaaa aactaggcat taaaggttaa 960
<210> 128
<211> 319
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 128
Val Asp Leu Ala Glu Lys Cys Gly Ile Tyr Ile Gly Ala Ala Val Glu
1 5 10 15
Pro Gly Tyr Leu Ile Ile Arg Glu Tyr Ala Glu Ile Leu Ser Arg Glu
20 25 30
Phe Asn Val Val Thr Ala Glu Asn Ala Leu Lys Phe Glu Ala Ile His
35 40 45
Pro Gln Arg Gly Val Tyr Ser Phe Glu Gly Ala Asp Ala Ile Val Arg
50 55 60
Phe Ala Glu Thr His Gly Met Lys Val Arg Gly His Thr Leu Val Trp
65 70 75 80
His Gln Gln Leu Pro Ala Trp Ile Thr Ser Gly Ser Tyr Ala Trp Glu
85 90 95
Glu Trp Lys Asn Ile Leu Arg Glu His Val Met Ser Val Val Gly Arg
100 105 110
Tyr Lys Gly Gln Ile Tyr Ala Trp Asp Val Val Asn Glu Ala Ile Leu
115 120 125
Asp Asn Gly Ser Leu Arg Asp Asn Val Trp Phe Arg Asn Val Gly Pro
130 135 140
Glu Tyr Ile Glu Ser Ala Phe Arg Trp Ala His Glu Ala Asp Pro Asn
145 150 155 160
Ala Leu Leu Phe Tyr Asn Asp Tyr Glu Ala Glu Asp Leu Asn Asp Lys
165 170 175
Ser His Ala Val Tyr Asn Leu Val Lys Ser Leu Leu Glu Lys Gly Val
180 185 190
Pro Ile His Gly Val Gly Leu Gln Met His Ile Asn Val Glu Asn Pro
195 200 205
Pro Lys Pro Glu Asp Val Ala Ala Asn Ile Lys Arg Leu Asn Asp Leu
210 215 220
Gly Leu Ile Val His Ile Thr Glu Met Asp Val Arg Ile Arg Thr Pro
225 230 235 240
Pro Ser Asn Glu Asp Leu Ile Lys Gln Ala Glu Ile Tyr Arg Asp Ile
245 250 255
Leu Arg Val Cys Leu Ser Ser Glu Lys Cys Thr Ala Phe Ile Met Trp
260 265 270
Gly Phe Thr Asp Arg Tyr Ser Trp Ile Pro Asn Tyr Phe Ser Gly Tyr
275 280 285
Gly Ser Ala Leu Ile Phe Asp Glu Gln Tyr Lys Pro Lys Leu Ala Tyr
290 295 300
Tyr Tyr Ile Leu Arg Thr Phe Ile Glu Lys Leu Gly Ile Lys Gly
305 310 315
<210> 129
<211> 3021
<212> DNA
<213> Bacteria
<400> 129
atggtaataa atcgctccag tgcgagtgac ggtgcgtatt cggaaaaagg tttctatctc 60
gacggtggtg tagaatacaa gtacagtgtt tttgtaaaac acaacgggac cggcaccgaa 120
actttcaaac tttctgtgtc ctatttggat tcggaaacag aagaagaaaa taaggaagta 180
attgcaacaa aggatgttgt ggccggagaa tggactgaga tttcggcaaa atacaaagca 240
cccaaaactg cagtgaatat tactttgtca attacaaccg acagcactgt agatttcatt 300
tttgacgatg taaccataac ccgtaaagga atggctgagg caaacacagt atatgcagca 360
aacgctgtgc tgaaagatat gtatgcaaac tatttcagag ttggttcggt acttaactcc 420
ggaacggtaa acaattcatc aataaaggcc ttgattttaa gagagtttaa cagtattacc 480
tgtgaaaatg aaatgaagcc tgatgccaca ctggttcaat caggatcaac caatacaaat 540
atcagggttt ctcttaatcg tgcagcaagt attttaaact tctgtgcaca aaataatata 600
gccgtcagag gtcatacact ggtttggcac agccagacac ctcaatggtt tttcaaagac 660
aatttccagg acaacggaaa ctgggtttcc caatcagtta tggaccagcg tttggaaagc 720
tacataaaaa atatgtttgc tgaaatccaa agacagtatc cgtctttgaa tctttatgcc 780
tatgacgttg taaatgaggc agtaagtgat gatgcaaaca ggaccagata ttatggcggg 840
gcgagggaac ctggatacgg aaatggtaga tctccatggg ttcagatcta cggagacaac 900
aaatttattg agaaagcatt tacatatgca agaaaatatg ctccggcaaa ttgtaagctt 960
tactacaacg attacaacga atattgggat cataagagag actgtattgc ctcaatttgt 1020
gcaaacttgt acaacaaggg cttgcttgac ggtgtgggaa tgcagtccca tattaatgcg 1080
gatatgaatg gattctcagg tatacaaaat tataaagcag ctttgcagaa atatataaat 1140
atcggttgtg atgtccaaat taccgagctt gatattagta cagaaaacgg caaatttagc 1200
ttacagcagc aggctgataa atataaagct gttttccagg cagctgttga tataaacaga 1260
acctccagca aaggaaaggt tacggctgtc tgtgtatggg gacctaatga cgccaatact 1320
tggctcggtt cacaaaatgc acctcttttg tttaacgcaa acaatcaacc gaaaccggca 1380
tacaatgcgg ttgcatccat tattcctcag tccgaatggg gcgacggtaa caatccggcc 1440
ggcggcggag gaggaggcaa accggaagag ccggatgcaa acggatatta ttatcatgac 1500
acttttgaag gaagcgtagg acagtggaca gccagaggac ctgcggaagt tctgcttagc 1560
ggaagaacgg cttacaaagg ttcagaatca ctcttggtaa ggaaccgtac ggcagcatgg 1620
aacggagcac aacgggcgct gaatcccaga acgtttgttc ccggaaacac atattgtttc 1680
agcgtagtgg catcgtttat tgaaggtgcg tcttccacaa cattctgcat gaagctgcaa 1740
tacgtagacg gaagcggcac tcaacggtat gataccatag atatgaaaac tgtgggtcca 1800
aatcagtggg ttcacctgta caatccgcaa tacagaattc cttccgatgc aacagatatg 1860
tatgtttatg tggaaacagc ggatgacacc attaacttct acatagatga ggcaatcgga 1920
gcggttgccg gaactgtaat cgaaggacct gctccacagc ctacacagcc tccggtactg 1980
cttggcgatg taaacggtga tggaaccatt aactcaactg acttgacaat gttaaagaga 2040
agcgtgttga gggcaatcac ccttaccgac gatgcaaagg ctagagcaga cgttgacaag 2100
aatggatcga taaacagcac tgatgtttta cttctttcac gctacctttt aagagtaatc 2160
gacaaatttc ctgtagcaga aaatccttct tcttctttta aatatgagtc ggccgtgcaa 2220
tatcggccgg ctcctgattc ttatttaaac ccttgtccgc aggcgggaag aattgtcaag 2280
gaaacatata caggaataaa cggaactaag agtcttaatg tatatcttcc atacggttat 2340
gatccgaaca aaaaatataa cattttctac cttatgcatg gcggcggtga aaatgagaat 2400
acgattttca gcaacgatgt taaattgcaa aatatccttg accacgcgat tatgaacggt 2460
gaacttgagc ctttgattgt agtaacaccc actttcaacg gcggaaactg cacggcccaa 2520
aacttttatc aggaattcag gcaaaatgtc attccttttg tggaaagcaa gtactctact 2580
tatgcagaat caacaacccc acagggaata gccgcttcaa gaatgcacag aggtttcggc 2640
ggattctcaa tgggaggatt gacaacatgg tatgtaatgg ttaactgcct tgattacgtt 2700
gcatatttta tgcctttaag cggtgactac tggtatggaa acagtccgca ggataaggct 2760
aattcaattg ctgaagcaat taacagatcc ggactttcaa agagggagta tttcgtattt 2820
gcggccaccg gttccgagga tattgcatat gctaatatga atcctcaaat tgaagctatg 2880
aaggctttgc cgcattttga ttatacttcg gatttttcca aaggtaattt ttactttctt 2940
gtagctccgg gcgccactca ctggtgggga tacgtaagac attatattta tgatgcactt 3000
ccatatttct tccatgaatg a 3021
<210> 130
<211> 1006
<212> PRT
<213> Bacteria
<400> 130
Met Val Ile Asn Arg Ser Ser Ala Ser Asp Gly Ala Tyr Ser Glu Lys
1 5 10 15
Gly Phe Tyr Leu Asp Gly Gly Val Glu Tyr Lys Tyr Ser Val Phe Val
20 25 30
Lys His Asn Gly Thr Gly Thr Glu Thr Phe Lys Leu Ser Val Ser Tyr
35 40 45
Leu Asp Ser Glu Thr Glu Glu Glu Asn Lys Glu Val Ile Ala Thr Lys
50 55 60
Asp Val Val Ala Gly Glu Trp Thr Glu Ile Ser Ala Lys Tyr Lys Ala
65 70 75 80
Pro Lys Thr Ala Val Asn Ile Thr Leu Ser Ile Thr Thr Asp Ser Thr
85 90 95
Val Asp Phe Ile Phe Asp Asp Val Thr Ile Thr Arg Lys Gly Met Ala
100 105 110
Glu Ala Asn Thr Val Tyr Ala Ala Asn Ala Val Leu Lys Asp Met Tyr
115 120 125
Ala Asn Tyr Phe Arg Val Gly Ser Val Leu Asn Ser Gly Thr Val Asn
130 135 140
Asn Ser Ser Ile Lys Ala Leu Ile Leu Arg Glu Phe Asn Ser Ile Thr
145 150 155 160
Cys Glu Asn Glu Met Lys Pro Asp Ala Thr Leu Val Gln Ser Gly Ser
165 170 175
Thr Asn Thr Asn Ile Arg Val Ser Leu Asn Arg Ala Ala Ser Ile Leu
180 185 190
Asn Phe Cys Ala Gln Asn Asn Ile Ala Val Arg Gly His Thr Leu Val
195 200 205
Trp His Ser Gln Thr Pro Gln Trp Phe Phe Lys Asp Asn Phe Gln Asp
210 215 220
Asn Gly Asn Trp Val Ser Gln Ser Val Met Asp Gln Arg Leu Glu Ser
225 230 235 240
Tyr Ile Lys Asn Met Phe Ala Glu Ile Gln Arg Gln Tyr Pro Ser Leu
245 250 255
Asn Leu Tyr Ala Tyr Asp Val Val Asn Glu Ala Val Ser Asp Asp Ala
260 265 270
Asn Arg Thr Arg Tyr Tyr Gly Gly Ala Arg Glu Pro Gly Tyr Gly Asn
275 280 285
Gly Arg Ser Pro Trp Val Gln Ile Tyr Gly Asp Asn Lys Phe Ile Glu
290 295 300
Lys Ala Phe Thr Tyr Ala Arg Lys Tyr Ala Pro Ala Asn Cys Lys Leu
305 310 315 320
Tyr Tyr Asn Asp Tyr Asn Glu Tyr Trp Asp His Lys Arg Asp Cys Ile
325 330 335
Ala Ser Ile Cys Ala Asn Leu Tyr Asn Lys Gly Leu Leu Asp Gly Val
340 345 350
Gly Met Gln Ser His Ile Asn Ala Asp Met Asn Gly Phe Ser Gly Ile
355 360 365
Gln Asn Tyr Lys Ala Ala Leu Gln Lys Tyr Ile Asn Ile Gly Cys Asp
370 375 380
Val Gln Ile Thr Glu Leu Asp Ile Ser Thr Glu Asn Gly Lys Phe Ser
385 390 395 400
Leu Gln Gln Gln Ala Asp Lys Tyr Lys Ala Val Phe Gln Ala Ala Val
405 410 415
Asp Ile Asn Arg Thr Ser Ser Lys Gly Lys Val Thr Ala Val Cys Val
420 425 430
Trp Gly Pro Asn Asp Ala Asn Thr Trp Leu Gly Ser Gln Asn Ala Pro
435 440 445
Leu Leu Phe Asn Ala Asn Asn Gln Pro Lys Pro Ala Tyr Asn Ala Val
450 455 460
Ala Ser Ile Ile Pro Gln Ser Glu Trp Gly Asp Gly Asn Asn Pro Ala
465 470 475 480
Gly Gly Gly Gly Gly Gly Lys Pro Glu Glu Pro Asp Ala Asn Gly Tyr
485 490 495
Tyr Tyr His Asp Thr Phe Glu Gly Ser Val Gly Gln Trp Thr Ala Arg
500 505 510
Gly Pro Ala Glu Val Leu Leu Ser Gly Arg Thr Ala Tyr Lys Gly Ser
515 520 525
Glu Ser Leu Leu Val Arg Asn Arg Thr Ala Ala Trp Asn Gly Ala Gln
530 535 540
Arg Ala Leu Asn Pro Arg Thr Phe Val Pro Gly Asn Thr Tyr Cys Phe
545 550 555 560
Ser Val Val Ala Ser Phe Ile Glu Gly Ala Ser Ser Thr Thr Phe Cys
565 570 575
Met Lys Leu Gln Tyr Val Asp Gly Ser Gly Thr Gln Arg Tyr Asp Thr
580 585 590
Ile Asp Met Lys Thr Val Gly Pro Asn Gln Trp Val His Leu Tyr Asn
595 600 605
Pro Gln Tyr Arg Ile Pro Ser Asp Ala Thr Asp Met Tyr Val Tyr Val
610 615 620
Glu Thr Ala Asp Asp Thr Ile Asn Phe Tyr Ile Asp Glu Ala Ile Gly
625 630 635 640
Ala Val Ala Gly Thr Val Ile Glu Gly Pro Ala Pro Gln Pro Thr Gln
645 650 655
Pro Pro Val Leu Leu Gly Asp Val Asn Gly Asp Gly Thr Ile Asn Ser
660 665 670
Thr Asp Leu Thr Met Leu Lys Arg Ser Val Leu Arg Ala Ile Thr Leu
675 680 685
Thr Asp Asp Ala Lys Ala Arg Ala Asp Val Asp Lys Asn Gly Ser Ile
690 695 700
Asn Ser Thr Asp Val Leu Leu Leu Ser Arg Tyr Leu Leu Arg Val Ile
705 710 715 720
Asp Lys Phe Pro Val Ala Glu Asn Pro Ser Ser Ser Phe Lys Tyr Glu
725 730 735
Ser Ala Val Gln Tyr Arg Pro Ala Pro Asp Ser Tyr Leu Asn Pro Cys
740 745 750
Pro Gln Ala Gly Arg Ile Val Lys Glu Thr Tyr Thr Gly Ile Asn Gly
755 760 765
Thr Lys Ser Leu Asn Val Tyr Leu Pro Tyr Gly Tyr Asp Pro Asn Lys
770 775 780
Lys Tyr Asn Ile Phe Tyr Leu Met His Gly Gly Gly Glu Asn Glu Asn
785 790 795 800
Thr Ile Phe Ser Asn Asp Val Lys Leu Gln Asn Ile Leu Asp His Ala
805 810 815
Ile Met Asn Gly Glu Leu Glu Pro Leu Ile Val Val Thr Pro Thr Phe
820 825 830
Asn Gly Gly Asn Cys Thr Ala Gln Asn Phe Tyr Gln Glu Phe Arg Gln
835 840 845
Asn Val Ile Pro Phe Val Glu Ser Lys Tyr Ser Thr Tyr Ala Glu Ser
850 855 860
Thr Thr Pro Gln Gly Ile Ala Ala Ser Arg Met His Arg Gly Phe Gly
865 870 875 880
Gly Phe Ser Met Gly Gly Leu Thr Thr Trp Tyr Val Met Val Asn Cys
885 890 895
Leu Asp Tyr Val Ala Tyr Phe Met Pro Leu Ser Gly Asp Tyr Trp Tyr
900 905 910
Gly Asn Ser Pro Gln Asp Lys Ala Asn Ser Ile Ala Glu Ala Ile Asn
915 920 925
Arg Ser Gly Leu Ser Lys Arg Glu Tyr Phe Val Phe Ala Ala Thr Gly
930 935 940
Ser Glu Asp Ile Ala Tyr Ala Asn Met Asn Pro Gln Ile Glu Ala Met
945 950 955 960
Lys Ala Leu Pro His Phe Asp Tyr Thr Ser Asp Phe Ser Lys Gly Asn
965 970 975
Phe Tyr Phe Leu Val Ala Pro Gly Ala Thr His Trp Trp Gly Tyr Val
980 985 990
Arg His Tyr Ile Tyr Asp Ala Leu Pro Tyr Phe Phe His Glu
995 1000 1005
<210> 131
<211> 1218
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 131
atgccgatca tccgaaccct atcgagttac atgcgaaatc atcaagcgat ctaccgtcag 60
ctcctcacgc tggccgccgc cgtcacgctg gcgggcgcgg ccaccgcgga ggaagaagcc 120
accctgcgcg gggtttacga aaaggacttc accatcggcg tggccatgaa cgggggccag 180
gcctccggcc gcaatgccgc cgccggcgag atcatcggca agcagttctc ctcgctcacc 240
gcggagaacg acatgaagtg gcagatgatc cacccccagg agggtcaata ccgcttcgaa 300
acgtccgacg cctacgtcgc gttcgcggaa aagcacaaga tggaagtcat cggccacacc 360
ctcgtgtggc acagccagac cccgcagtgg gtcttccagg gtgaaaacgg ccagcccgcc 420
accaaggaag agctgctcaa gcgcatgcgc gaccacatcc acgccgtggc cggccgttac 480
aagggcaaga tcaagggctg ggacgtcgtc aacgaagcgc tctccgacgg cggggacgac 540
attctccgcc agtccccctg gcgccgcatc atcggcgacg acttcatcga ctacgccttc 600
cgctacgcca aggaagccgc cccggatgcc gagctctact acaacgacta caacctcgag 660
atcccccgca agcgcgccaa ttgcatcacg ctggtcaagg gcatgctcga gcgcggcgtg 720
ccgatcgacg gcatcggcac ccagtcgcac ttccagctcg gctttccctc cttggacgac 780
gtggaagcca ccatcaagga attcgccgcc ctgggcatga aggtgatgat caccgagctc 840
gacgtggatg tcctgccccg caacaacccc ggggtcgccg acatcgccaa ccgcgaacag 900
ggagccaacc cctacaccga aggccttccg gacgacgtgc aggaaaagct cgcgaagcgc 960
tacgaggaca tcttccgcat ctacctgaag taccgcgacc acgtcacccg cgtcaccttc 1020
tggggcctgg atgacggcat gacctggctg aacggcttcc cggtccgcgg ccgcaccaac 1080
caccccctgc tctacgaccg gcagctcaat gccaagcccg ccttccacgc cctcgtcaag 1140
ctgggtcagg aagagcgtcc ggaagccgcc aaggtcgagg tccagaagat cgaagcgaag 1200
aaagaagagg cgaagtaa 1218
<210> 132
<211> 405
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(26)
<400> 132
Met Pro Ile Ile Arg Thr Leu Ser Ser Tyr Met Arg Asn His Gln Ala
1 5 10 15
Ile Tyr Arg Gln Leu Leu Thr Leu Ala Ala Ala Val Thr Leu Ala Gly
20 25 30
Ala Ala Thr Ala Glu Glu Glu Ala Thr Leu Arg Gly Val Tyr Glu Lys
35 40 45
Asp Phe Thr Ile Gly Val Ala Met Asn Gly Gly Gln Ala Ser Gly Arg
50 55 60
Asn Ala Ala Ala Gly Glu Ile Ile Gly Lys Gln Phe Ser Ser Leu Thr
65 70 75 80
Ala Glu Asn Asp Met Lys Trp Gln Met Ile His Pro Gln Glu Gly Gln
85 90 95
Tyr Arg Phe Glu Thr Ser Asp Ala Tyr Val Ala Phe Ala Glu Lys His
100 105 110
Lys Met Glu Val Ile Gly His Thr Leu Val Trp His Ser Gln Thr Pro
115 120 125
Gln Trp Val Phe Gln Gly Glu Asn Gly Gln Pro Ala Thr Lys Glu Glu
130 135 140
Leu Leu Lys Arg Met Arg Asp His Ile His Ala Val Ala Gly Arg Tyr
145 150 155 160
Lys Gly Lys Ile Lys Gly Trp Asp Val Val Asn Glu Ala Leu Ser Asp
165 170 175
Gly Gly Asp Asp Ile Leu Arg Gln Ser Pro Trp Arg Arg Ile Ile Gly
180 185 190
Asp Asp Phe Ile Asp Tyr Ala Phe Arg Tyr Ala Lys Glu Ala Ala Pro
195 200 205
Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Asn Leu Glu Ile Pro Arg Lys
210 215 220
Arg Ala Asn Cys Ile Thr Leu Val Lys Gly Met Leu Glu Arg Gly Val
225 230 235 240
Pro Ile Asp Gly Ile Gly Thr Gln Ser His Phe Gln Leu Gly Phe Pro
245 250 255
Ser Leu Asp Asp Val Glu Ala Thr Ile Lys Glu Phe Ala Ala Leu Gly
260 265 270
Met Lys Val Met Ile Thr Glu Leu Asp Val Asp Val Leu Pro Arg Asn
275 280 285
Asn Pro Gly Val Ala Asp Ile Ala Asn Arg Glu Gln Gly Ala Asn Pro
290 295 300
Tyr Thr Glu Gly Leu Pro Asp Asp Val Gln Glu Lys Leu Ala Lys Arg
305 310 315 320
Tyr Glu Asp Ile Phe Arg Ile Tyr Leu Lys Tyr Arg Asp His Val Thr
325 330 335
Arg Val Thr Phe Trp Gly Leu Asp Asp Gly Met Thr Trp Leu Asn Gly
340 345 350
Phe Pro Val Arg Gly Arg Thr Asn His Pro Leu Leu Tyr Asp Arg Gln
355 360 365
Leu Asn Ala Lys Pro Ala Phe His Ala Leu Val Lys Leu Gly Gln Glu
370 375 380
Glu Arg Pro Glu Ala Ala Lys Val Glu Val Gln Lys Ile Glu Ala Lys
385 390 395 400
Lys Glu Glu Ala Lys
405
<210> 133
<211> 1011
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 133
atgaaaaata atcaatttag gaaaatccct tccctacata aggtatataa gagtcatttt 60
ttaattgggg cagctgtaaa tccacttaca cttcaaacac aacaggaact aatcaaaaag 120
cactttaata gtattacggc agaaaatgaa atgaaatttg aagagttgca acctgagcct 180
ggacatttta catttgatgt aggagataaa atggtcgctt tcgcaaaaga aaatggtatg 240
aaagttagag gtcatacatt aatctggcac aatcaaacac ctgattggat gtttaagaat 300
gaagatggtt ctgtcacaga tcgagataca cttcttgaaa gaatgaaatt acatattaca 360
actgttatgg agcattataa ggggcaaatt tattgttggg atgttgtcaa tgaagcgatt 420
gctgatgaag gatcagagtt attacgtcac tctaaatgga ctgaaattat tggcgacgat 480
tttattgaaa aggcatttga gtatgcacat gaagcagacc cagaagcttt actattctat 540
aatgactata atgagtccca ccctcataag cgagataaaa tttacacact aataaaaaga 600
ttggtagaca aaggcatacc tattcacggg gttggcttgc aagcacattg gaatttaaca 660
gacccttctt atgaggagat tagggctgca attgaaaaat atgcctcatt aggcttggaa 720
atacatctta cagaaatgga tgtttcagtg ttcaattttg aagatcgaag aacagactta 780
acagagccga ctaatgaaat gaagactctt caagtagaac gttatacgga atttttcaaa 840
atacttagag aatatagcca tgtgattagc tctgtcactt tttggggagc tgcagatgat 900
tatacttggt tggatgggtt tccagttaga ggaaggaaaa actggccatt tgtttttgac 960
gaaaaccacc aaccgaaaga atctttctgg ggaattgtcg attttgaata a 1011
<210> 134
<211> 336
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 134
Met Lys Asn Asn Gln Phe Arg Lys Ile Pro Ser Leu His Lys Val Tyr
1 5 10 15
Lys Ser His Phe Leu Ile Gly Ala Ala Val Asn Pro Leu Thr Leu Gln
20 25 30
Thr Gln Gln Glu Leu Ile Lys Lys His Phe Asn Ser Ile Thr Ala Glu
35 40 45
Asn Glu Met Lys Phe Glu Glu Leu Gln Pro Glu Pro Gly His Phe Thr
50 55 60
Phe Asp Val Gly Asp Lys Met Val Ala Phe Ala Lys Glu Asn Gly Met
65 70 75 80
Lys Val Arg Gly His Thr Leu Ile Trp His Asn Gln Thr Pro Asp Trp
85 90 95
Met Phe Lys Asn Glu Asp Gly Ser Val Thr Asp Arg Asp Thr Leu Leu
100 105 110
Glu Arg Met Lys Leu His Ile Thr Thr Val Met Glu His Tyr Lys Gly
115 120 125
Gln Ile Tyr Cys Trp Asp Val Val Asn Glu Ala Ile Ala Asp Glu Gly
130 135 140
Ser Glu Leu Leu Arg His Ser Lys Trp Thr Glu Ile Ile Gly Asp Asp
145 150 155 160
Phe Ile Glu Lys Ala Phe Glu Tyr Ala His Glu Ala Asp Pro Glu Ala
165 170 175
Leu Leu Phe Tyr Asn Asp Tyr Asn Glu Ser His Pro His Lys Arg Asp
180 185 190
Lys Ile Tyr Thr Leu Ile Lys Arg Leu Val Asp Lys Gly Ile Pro Ile
195 200 205
His Gly Val Gly Leu Gln Ala His Trp Asn Leu Thr Asp Pro Ser Tyr
210 215 220
Glu Glu Ile Arg Ala Ala Ile Glu Lys Tyr Ala Ser Leu Gly Leu Glu
225 230 235 240
Ile His Leu Thr Glu Met Asp Val Ser Val Phe Asn Phe Glu Asp Arg
245 250 255
Arg Thr Asp Leu Thr Glu Pro Thr Asn Glu Met Lys Thr Leu Gln Val
260 265 270
Glu Arg Tyr Thr Glu Phe Phe Lys Ile Leu Arg Glu Tyr Ser His Val
275 280 285
Ile Ser Ser Val Thr Phe Trp Gly Ala Ala Asp Asp Tyr Thr Trp Leu
290 295 300
Asp Gly Phe Pro Val Arg Gly Arg Lys Asn Trp Pro Phe Val Phe Asp
305 310 315 320
Glu Asn His Gln Pro Lys Glu Ser Phe Trp Gly Ile Val Asp Phe Glu
325 330 335
<210> 135
<211> 1170
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 135
atgcgacgcc tcatcgccct tgtcctatat ataggaaccg ccgcgagcgg gacctccgtg 60
gagaccgttg cggccgaatc gaaacagccg aaagctagcc taaagaatgc gttcgcagac 120
gattttcgtg tcggcgctgc aattggcacc aatcaggtca tgggcgagga gccaaaatcg 180
ctcgaggttg tcgcccagca gttcaacaca atcacgcctg agaatctcct caaatgggct 240
gaggtccacc cagaagcaga ccgctacaac ttcgaaccgt ccgatcgctt cgtcgaattt 300
ggcgaaaaga acaacatgtt catcgtcggc cacacgctcg tgtggcataa ccaaacgccg 360
gactgggcct ttgagggcaa ggacggcaag ccgctcgatc gcgaaacagc gctcgcccga 420
atcaaggaac acattgaaac cgtggtcggc cgatatcgcg gccgcatcca tgcttgggac 480
gtcgtgaacg aggcaatcga cgacaacggc aaacttcgta gtgggccggt cggagtgccc 540
ggtcagcgcg gcgaaccgtg gcacgccgcc atcggagacg actacatcca gaaggcgttc 600
gaattcgcgc acaccgccga ccccgacgct gaactctatt acaacgacta caacgaatgg 660
cacccgaaaa agatcgaagc catctcgcag ctggtgcggt cgctcaaaga gaagggcgtt 720
cgtatcgatg gcctcggtct ccagggccat tgggggatgg attacccgaa agtcgaagag 780
atcgatcaca tgctaaccga gtatggcaag ctcggcgtga agctcatgat taccgaactc 840
gacatcaaca tgcttccgca gcccgacccg agtcaacgcg gcgccgatat cactcgcaac 900
tacgagctca gaaaggagct cgatccgtat tccgacggac tcccgcccga tatgcaaaag 960
gcactcgcgg cgcgttatgc tgaaatcttc gaagtcttcg ctaagcatcg cgataagctc 1020
gaccgcgtca cattttgggg cgttcacgac ggccattcat ggctcaacaa ctggcctgtt 1080
cccggtcgca ctgcctaccc gcttctcttc gacacgaagc ttcagcccaa gccggcattt 1140
gatgccgtca tcggagtcgc agagcaatga 1170
<210> 136
<211> 389
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(25)
<400> 136
Met Arg Arg Leu Ile Ala Leu Val Leu Tyr Ile Gly Thr Ala Ala Ser
1 5 10 15
Gly Thr Ser Val Glu Thr Val Ala Ala Glu Ser Lys Gln Pro Lys Ala
20 25 30
Ser Leu Lys Asn Ala Phe Ala Asp Asp Phe Arg Val Gly Ala Ala Ile
35 40 45
Gly Thr Asn Gln Val Met Gly Glu Glu Pro Lys Ser Leu Glu Val Val
50 55 60
Ala Gln Gln Phe Asn Thr Ile Thr Pro Glu Asn Leu Leu Lys Trp Ala
65 70 75 80
Glu Val His Pro Glu Ala Asp Arg Tyr Asn Phe Glu Pro Ser Asp Arg
85 90 95
Phe Val Glu Phe Gly Glu Lys Asn Asn Met Phe Ile Val Gly His Thr
100 105 110
Leu Val Trp His Asn Gln Thr Pro Asp Trp Ala Phe Glu Gly Lys Asp
115 120 125
Gly Lys Pro Leu Asp Arg Glu Thr Ala Leu Ala Arg Ile Lys Glu His
130 135 140
Ile Glu Thr Val Val Gly Arg Tyr Arg Gly Arg Ile His Ala Trp Asp
145 150 155 160
Val Val Asn Glu Ala Ile Asp Asp Asn Gly Lys Leu Arg Ser Gly Pro
165 170 175
Val Gly Val Pro Gly Gln Arg Gly Glu Pro Trp His Ala Ala Ile Gly
180 185 190
Asp Asp Tyr Ile Gln Lys Ala Phe Glu Phe Ala His Thr Ala Asp Pro
195 200 205
Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Asn Glu Trp His Pro Lys Lys
210 215 220
Ile Glu Ala Ile Ser Gln Leu Val Arg Ser Leu Lys Glu Lys Gly Val
225 230 235 240
Arg Ile Asp Gly Leu Gly Leu Gln Gly His Trp Gly Met Asp Tyr Pro
245 250 255
Lys Val Glu Glu Ile Asp His Met Leu Thr Glu Tyr Gly Lys Leu Gly
260 265 270
Val Lys Leu Met Ile Thr Glu Leu Asp Ile Asn Met Leu Pro Gln Pro
275 280 285
Asp Pro Ser Gln Arg Gly Ala Asp Ile Thr Arg Asn Tyr Glu Leu Arg
290 295 300
Lys Glu Leu Asp Pro Tyr Ser Asp Gly Leu Pro Pro Asp Met Gln Lys
305 310 315 320
Ala Leu Ala Ala Arg Tyr Ala Glu Ile Phe Glu Val Phe Ala Lys His
325 330 335
Arg Asp Lys Leu Asp Arg Val Thr Phe Trp Gly Val His Asp Gly His
340 345 350
Ser Trp Leu Asn Asn Trp Pro Val Pro Gly Arg Thr Ala Tyr Pro Leu
355 360 365
Leu Phe Asp Thr Lys Leu Gln Pro Lys Pro Ala Phe Asp Ala Val Ile
370 375 380
Gly Val Ala Glu Gln
385
<210> 137
<211> 1044
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 137
gtggatcctt cgctgaagga agcagcttcg ggcaagtttc tgatgggggt agcgttgaat 60
gtacgtcagg cagcaggtca ggatacttgc gcctcgaaag tggtaaaacg tcattttaat 120
tccattgtgg ccgagaattg catgaaatgc gaagtgattc atccggagga agaccatttt 180
gattttacgg aagcggaccg gttggttcgt tttggcgagg agaacgatat ggctgttatc 240
gggcattgcc ttatctggca ttcacagctg gcaccttggt tctgtgtgga caaacaagga 300
aaaacagtaa gtgccgacat cttgaaggag cgtataaaaa aacatatcca gactattgtg 360
acgcactata aagggcgtat aaagggctgg gatgtgttga atgaagccat tgaatcggac 420
ggctcctggc gtaaatctcc tttttacgag atattaggcg aagagtacat cccgcttatt 480
tttcagtatg ctcatgaggc agatccggaa gccgaacttt actataatga ttatggcatg 540
gacgggaagg ctaagcgtga caaagtagtc gaattggtaa agatgctgaa agatcgtgga 600
ctgcgcatcg acgcggtagg tatgcaggga cacatgggaa tggattatcc gtcagtgtcc 660
gaatttgaag ccagtatact ggcatttgca gctgccggag taaaggtgat ggtaaccgaa 720
tgggatatga gtgcattgcc cacgacacgg atgggagcca atatttcgga cacggtgtct 780
tataaacaat ccctgaatcc ctatcccgac ggtttgcccg actctgtgtc tgtggcatgg 840
aataaccgga tgaaggaatt tttcggtctt ttcctgaaac attcgaatat cattacccgt 900
gtgacggcgt ggggggtgac ggacggtgac tcatggaaga ataatttccc tgtgcccgga 960
cgtgtggatt atcctttatt gttcgaccgt gattgccggc cgaaaccttt tgtggaagaa 1020
ctgattggaa aacagaacat ttaa 1044
<210> 138
<211> 347
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 138
Val Asp Pro Ser Leu Lys Glu Ala Ala Ser Gly Lys Phe Leu Met Gly
1 5 10 15
Val Ala Leu Asn Val Arg Gln Ala Ala Gly Gln Asp Thr Cys Ala Ser
20 25 30
Lys Val Val Lys Arg His Phe Asn Ser Ile Val Ala Glu Asn Cys Met
35 40 45
Lys Cys Glu Val Ile His Pro Glu Glu Asp His Phe Asp Phe Thr Glu
50 55 60
Ala Asp Arg Leu Val Arg Phe Gly Glu Glu Asn Asp Met Ala Val Ile
65 70 75 80
Gly His Cys Leu Ile Trp His Ser Gln Leu Ala Pro Trp Phe Cys Val
85 90 95
Asp Lys Gln Gly Lys Thr Val Ser Ala Asp Ile Leu Lys Glu Arg Ile
100 105 110
Lys Lys His Ile Gln Thr Ile Val Thr His Tyr Lys Gly Arg Ile Lys
115 120 125
Gly Trp Asp Val Leu Asn Glu Ala Ile Glu Ser Asp Gly Ser Trp Arg
130 135 140
Lys Ser Pro Phe Tyr Glu Ile Leu Gly Glu Glu Tyr Ile Pro Leu Ile
145 150 155 160
Phe Gln Tyr Ala His Glu Ala Asp Pro Glu Ala Glu Leu Tyr Tyr Asn
165 170 175
Asp Tyr Gly Met Asp Gly Lys Ala Lys Arg Asp Lys Val Val Glu Leu
180 185 190
Val Lys Met Leu Lys Asp Arg Gly Leu Arg Ile Asp Ala Val Gly Met
195 200 205
Gln Gly His Met Gly Met Asp Tyr Pro Ser Val Ser Glu Phe Glu Ala
210 215 220
Ser Ile Leu Ala Phe Ala Ala Ala Gly Val Lys Val Met Val Thr Glu
225 230 235 240
Trp Asp Met Ser Ala Leu Pro Thr Thr Arg Met Gly Ala Asn Ile Ser
245 250 255
Asp Thr Val Ser Tyr Lys Gln Ser Leu Asn Pro Tyr Pro Asp Gly Leu
260 265 270
Pro Asp Ser Val Ser Val Ala Trp Asn Asn Arg Met Lys Glu Phe Phe
275 280 285
Gly Leu Phe Leu Lys His Ser Asn Ile Ile Thr Arg Val Thr Ala Trp
290 295 300
Gly Val Thr Asp Gly Asp Ser Trp Lys Asn Asn Phe Pro Val Pro Gly
305 310 315 320
Arg Val Asp Tyr Pro Leu Leu Phe Asp Arg Asp Cys Arg Pro Lys Pro
325 330 335
Phe Val Glu Glu Leu Ile Gly Lys Gln Asn Ile
340 345
<210> 139
<211> 1143
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 139
atgaaaaaaa cgattgcaca tttcacctta tggatagtgt tttttctctt cacttcctgt 60
actgttacgg cgcagaagaa tgctaagaat gcaagagtaa aacccactac cctaaaagag 120
gcttaccaag gtaaattcta tatcggtact gcgatgaact tgagacagat tcacggagat 180
gatccccaat ctgaaaatat tatcaaaaaa cagttcaatt ccatagttgc cgaaaactgc 240
atgaagagta tgtatcttca gccggaggaa ggaaaatttt tcttcgatga tgcggacaag 300
tttgtggatt ttggtcttca gaacaatatg ttcattatcg ggcattgtct gatttggcat 360
tcgcaggcgc caaaatggtt tttcaccgac gaaaatggaa acacggtttc tccagaagtt 420
cttaaacaaa ggatgaaagc ccatatcacc gctgtcgttt cccgctacaa agggaaaatc 480
aaaggttggg atgtggtgaa cgaagccatt atggaagatg gttcttaccg caaaagcaaa 540
ttttacgaga ttttgggaga agaatttatt ccgttggcat ttcagtatgc gcatgaagca 600
gatcctgatg cagaacttta ttacaacgat tataacgaat ggtatcccgg gaaaagagct 660
atggtgacca aaataatccg cgatttcaaa actagaggaa tccgcatcga tgccatcgga 720
atgcaggctc atttcgggat ggattcgccc actgtagaag agtatgaaca aactattcag 780
ggctatataa aagaaggcgt gaaagtcaat attacggaac tcgatttaag tccgcttcct 840
tctccttggg gaacttccgc caacgttgct gatacgcagc agtatcagga aaaaatgaat 900
ccttacacca aaggacttcc tgtcgatgta gaaaaagcat gggaaaaccg ttatctcgat 960
tttttcaaac ttttcctaaa atatcatcag catattgagc gtgtaacttt ttggggagtg 1020
agcgacatcg attcctggaa aaacgatttt ccgataagag gacgtaccga ttatccacta 1080
ccgtttaacc gtcaatatca ggcaaaacct ttggttcaga aattaataga cttaacgaaa 1140
tag 1143
<210> 140
<211> 380
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(24)
<400> 140
Met Lys Lys Thr Ile Ala His Phe Thr Leu Trp Ile Val Phe Phe Leu
1 5 10 15
Phe Thr Ser Cys Thr Val Thr Ala Gln Lys Asn Ala Lys Asn Ala Arg
20 25 30
Val Lys Pro Thr Thr Leu Lys Glu Ala Tyr Gln Gly Lys Phe Tyr Ile
35 40 45
Gly Thr Ala Met Asn Leu Arg Gln Ile His Gly Asp Asp Pro Gln Ser
50 55 60
Glu Asn Ile Ile Lys Lys Gln Phe Asn Ser Ile Val Ala Glu Asn Cys
65 70 75 80
Met Lys Ser Met Tyr Leu Gln Pro Glu Glu Gly Lys Phe Phe Phe Asp
85 90 95
Asp Ala Asp Lys Phe Val Asp Phe Gly Leu Gln Asn Asn Met Phe Ile
100 105 110
Ile Gly His Cys Leu Ile Trp His Ser Gln Ala Pro Lys Trp Phe Phe
115 120 125
Thr Asp Glu Asn Gly Asn Thr Val Ser Pro Glu Val Leu Lys Gln Arg
130 135 140
Met Lys Ala His Ile Thr Ala Val Val Ser Arg Tyr Lys Gly Lys Ile
145 150 155 160
Lys Gly Trp Asp Val Val Asn Glu Ala Ile Met Glu Asp Gly Ser Tyr
165 170 175
Arg Lys Ser Lys Phe Tyr Glu Ile Leu Gly Glu Glu Phe Ile Pro Leu
180 185 190
Ala Phe Gln Tyr Ala His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr
195 200 205
Asn Asp Tyr Asn Glu Trp Tyr Pro Gly Lys Arg Ala Met Val Thr Lys
210 215 220
Ile Ile Arg Asp Phe Lys Thr Arg Gly Ile Arg Ile Asp Ala Ile Gly
225 230 235 240
Met Gln Ala His Phe Gly Met Asp Ser Pro Thr Val Glu Glu Tyr Glu
245 250 255
Gln Thr Ile Gln Gly Tyr Ile Lys Glu Gly Val Lys Val Asn Ile Thr
260 265 270
Glu Leu Asp Leu Ser Pro Leu Pro Ser Pro Trp Gly Thr Ser Ala Asn
275 280 285
Val Ala Asp Thr Gln Gln Tyr Gln Glu Lys Met Asn Pro Tyr Thr Lys
290 295 300
Gly Leu Pro Val Asp Val Glu Lys Ala Trp Glu Asn Arg Tyr Leu Asp
305 310 315 320
Phe Phe Lys Leu Phe Leu Lys Tyr His Gln His Ile Glu Arg Val Thr
325 330 335
Phe Trp Gly Val Ser Asp Ile Asp Ser Trp Lys Asn Asp Phe Pro Ile
340 345 350
Arg Gly Arg Thr Asp Tyr Pro Leu Pro Phe Asn Arg Gln Tyr Gln Ala
355 360 365
Lys Pro Leu Val Gln Lys Leu Ile Asp Leu Thr Lys
370 375 380
<210> 141
<211> 1134
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 141
atgaatatct cacgcagaca actactggcg ctcacgggtg ctacggcggc gatcacagca 60
gccaaattac aggcggcaga aaaagccagc gccgcgaccg gcttgcgcga tgcctacaaa 120
aatgattttt tgattggcgc tgcgctgagt gcatcgatca ttcaacagca agatccacag 180
ctagttgcac tgattaataa agactttaat tccatcaccc cagaaaactg tatgaaatgg 240
ggcgagatgc gcaatgatga cggcagctgg aagtggcagg atgcagacgc atttgtcgag 300
tatggaagca aatacaaact acatatggtc ggccacacat tggggtggca cagccagatt 360
cccgatagcg tgtttaaaaa taaagacggt agctatattt ccaaaaccga actcgcgaaa 420
aaacaaaaag aacacatcac cactattgtt ggccgctaca aaggcaaact tgccgcgtgg 480
gatgtggtga atgaagctgt cggcgatgac aacaaaatgc gcgatagtca ctggtataaa 540
atcatgggcg atgattttct cgttaatgca tttaaccttg ctcatgaagt agatccgaag 600
gcgcatctga tgtacaacga ctacaacaac gagcgcccgg aaaaacgcca ggcgactatc 660
gatatgatca agcgtctgca acaacgcggt acaccaatcc atggtttggg catgcaagcg 720
catatcggat tggaaaccaa tatgcaggat tttgaagata gtattctcgc ctattcagca 780
ttgggtttaa aaatccatct caccgaacta gatatagatg tgctgccctc tgtatggaat 840
ttaccggtgg ccgaaatttc tacccgcttt gaatacaagc cggaacgcga tccttataca 900
aaaggtttgc cgaaagagat tgatgaaaaa cttgcaaaag cctatgaatc gctatttaaa 960
atattgctta aacatcgcga caaaatagat agagttacgt tttggggcgt aagcgatgat 1020
gccagctggc tcaatgattt cccaatcaat ggcagaacca actatccgtt attgtttaac 1080
cgtcaacgcc aacctaaagc tgcttatttc cgtttgctgg atttaaaacg ctag 1134
<210> 142
<211> 377
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(25)
<400> 142
Met Asn Ile Ser Arg Arg Gln Leu Leu Ala Leu Thr Gly Ala Thr Ala
1 5 10 15
Ala Ile Thr Ala Ala Lys Leu Gln Ala Ala Glu Lys Ala Ser Ala Ala
20 25 30
Thr Gly Leu Arg Asp Ala Tyr Lys Asn Asp Phe Leu Ile Gly Ala Ala
35 40 45
Leu Ser Ala Ser Ile Ile Gln Gln Gln Asp Pro Gln Leu Val Ala Leu
50 55 60
Ile Asn Lys Asp Phe Asn Ser Ile Thr Pro Glu Asn Cys Met Lys Trp
65 70 75 80
Gly Glu Met Arg Asn Asp Asp Gly Ser Trp Lys Trp Gln Asp Ala Asp
85 90 95
Ala Phe Val Glu Tyr Gly Ser Lys Tyr Lys Leu His Met Val Gly His
100 105 110
Thr Leu Gly Trp His Ser Gln Ile Pro Asp Ser Val Phe Lys Asn Lys
115 120 125
Asp Gly Ser Tyr Ile Ser Lys Thr Glu Leu Ala Lys Lys Gln Lys Glu
130 135 140
His Ile Thr Thr Ile Val Gly Arg Tyr Lys Gly Lys Leu Ala Ala Trp
145 150 155 160
Asp Val Val Asn Glu Ala Val Gly Asp Asp Asn Lys Met Arg Asp Ser
165 170 175
His Trp Tyr Lys Ile Met Gly Asp Asp Phe Leu Val Asn Ala Phe Asn
180 185 190
Leu Ala His Glu Val Asp Pro Lys Ala His Leu Met Tyr Asn Asp Tyr
195 200 205
Asn Asn Glu Arg Pro Glu Lys Arg Gln Ala Thr Ile Asp Met Ile Lys
210 215 220
Arg Leu Gln Gln Arg Gly Thr Pro Ile His Gly Leu Gly Met Gln Ala
225 230 235 240
His Ile Gly Leu Glu Thr Asn Met Gln Asp Phe Glu Asp Ser Ile Leu
245 250 255
Ala Tyr Ser Ala Leu Gly Leu Lys Ile His Leu Thr Glu Leu Asp Ile
260 265 270
Asp Val Leu Pro Ser Val Trp Asn Leu Pro Val Ala Glu Ile Ser Thr
275 280 285
Arg Phe Glu Tyr Lys Pro Glu Arg Asp Pro Tyr Thr Lys Gly Leu Pro
290 295 300
Lys Glu Ile Asp Glu Lys Leu Ala Lys Ala Tyr Glu Ser Leu Phe Lys
305 310 315 320
Ile Leu Leu Lys His Arg Asp Lys Ile Asp Arg Val Thr Phe Trp Gly
325 330 335
Val Ser Asp Asp Ala Ser Trp Leu Asn Asp Phe Pro Ile Asn Gly Arg
340 345 350
Thr Asn Tyr Pro Leu Leu Phe Asn Arg Gln Arg Gln Pro Lys Ala Ala
355 360 365
Tyr Phe Arg Leu Leu Asp Leu Lys Arg
370 375
<210> 143
<211> 3285
<212> DNA
<213> Bacteria
<400> 143
atgagtttaa aaataaataa aatcatatca tttatcatag ttttttcgat ggtttttggg 60
acgttaatgt atgtgccaca tctaaaagca tttgcggata ataccggtat taatttggtt 120
tctaatggtg attttgaatc aggcacaatt gatggctggt ttaaacaagg taatccgaca 180
ttaacagtaa caactgagca ggcaattggg caatacagta tgaaagttac aggtagaaca 240
cagacatatg aaggacccgc atatagcttt ttggggaaaa tgcagaaagg tgaatcatat 300
aacgtatcac ttaaagttag acttgtttct ggacaaaatt catctaatcc tttgatcact 360
gtaactatgt ttagagaaga tgacaatggc aatcattatg acacaatagt ttggcaaaaa 420
caagtttctg aagattcatg gactactgta agtgggactt atacattgga ttatactgga 480
acattaaaaa cattatatat gtatgtagaa tcacccgatc caacgcttga atattatatt 540
gatgatgttg tagtcacacc gcaaaatcca acgcaaatag gaaatgtagt tgccaatgga 600
acttttgaaa atgaaaatac ttctggatgg gttggaacag gttcatctgt tgttaaagca 660
gtatatggtg atgctcacag cggagattat agcttattga cgacaggaag gacagctaac 720
tggaatggtc ctagttatga tttgactggc aaaatagttc ccggacaaca atacaatgtg 780
gatttttggg taaaatttat tgatggcaat gatacagagc aaatcaaggc tactgttaaa 840
gcgacttctg acaaagacaa ttatatacaa gttaatgatt ttgcagatgt aagtaaaggt 900
gaatggacag aaataaaagg cagttttact ttacctgttg cagattacag cggcattagc 960
atctatgtgg aatctcaaaa tcctacttta gagttttaca ttgatgattt ttctgtaata 1020
ggtgaaattg caaataatca gattactatt caaaatgaca ttccagattt gtactctgta 1080
tttaaagatt attttcctat aggcgttgcg gttgatccaa gtagattaaa tgatactgat 1140
ccgcatgctc aattgacggc taaacatttt aatatgcttg ttgcagaaaa cgccatgaaa 1200
cctgaaagtt tacaacccac agaaggaaat tttacttttg ataatgctga taagattgtt 1260
gattatgcaa tatcacataa tatgaagatg agggggcata ctttactttg gcataatcaa 1320
gttccagatt ggtttttcca agatccgtct gacccatcca agcctgcttc gagagattta 1380
ctattacaaa gattaaaaac tcatattaca actgtgttag accattttaa aacaaagtat 1440
ggttctcaga atccaataat tggatgggat gtcgtaaatg aagttcttga tgataatggc 1500
agtttgagaa attcgaagtg gttgcaaatt attggacccg actatataga aaaagccttt 1560
gaatatgcac atgaagcgga tccatcgatg aagttgttta ttaatgatta caatatcgaa 1620
aataatggcg ttaaaactca agctatgtat gacttggtaa aaagattaaa gagtgaaggc 1680
gttcctatag atggaatagg gatgcaaatg cacataaata taaattccaa tatagataat 1740
ataaaagcat caatagaaaa actggcatcg ttaggcgttg aaatacaagt aactgaatta 1800
gatatgaaca tgaacggtaa tatatctaac gaagcattgc tcaagcaagc tagattgtat 1860
aaacaattat ttgacttatt taaagcagag aaacaatata taactgctgt agttttttgg 1920
ggagtttcag acgatgtaac ttggcttagc aagccaaatg ctccgctact ttttgataca 1980
aagttgcaag caaagccagc atactgggca atagtagatc cgaataaagc tacaccagac 2040
attcaatctg caaaggcttt ggaaggatca ccgacaatgg gtacaaatgt tgataactct 2100
tggaaacttg taaagccgtt atatgcaaat acttttgtag aagggtcggt cggagcaact 2160
gctgctgtta agtctatgtg ggatactaaa aacttgtatt tgttagtaca agtttcagac 2220
aataccccat ctagtaatga tggtattgag atttttgtag ataagaatga tgacaaatcc 2280
acttcttatg aaactgatga tgaacattat acaattaaga gggatggtac agggagttca 2340
gatattacca aatatgtgac ttctaatgct gacggatatg tagcacagct agctattcca 2400
attgaagata ttaatcctgc acttaatgat aaaattggat ttgacattag aataaatgat 2460
gataaaggta ttggtaatat agatgcaata acagtttgga acgattatac aaacagtcaa 2520
gatactaata catcgtattt tggcgattta gtattatcaa aacctgcaca aattgcaaca 2580
gctatatatg gcactcctgt tattgatggt aaagtagatg atatttggaa taatgttgaa 2640
gctatttcaa caaatacatg ggttttgggt tcaaatggtg ctactgcgac agcaaaaatg 2700
atgtgggacg ataagtacct ttatgttttg gcggatgtta cagattcaaa tctgaacaaa 2760
tctagtgtta atccatatga acaagattct gtagaagttt ttgtagatca aaataatgac 2820
aagacgacat attataaaaa tgatgatgga cagtttagag ttaactatga caatgaacaa 2880
agctttgggg gaagcactaa ttcaaatgga tttaaatcgg caactagtct tacacaaagt 2940
ggatatattg tagaagaagc tattccttgg acgagtatca ctccatcaaa tggcactatc 3000
ataggatttg acttgcaagt taatgatgca gatgaaaatg gtaagaggac aggtattgta 3060
acatggtgtg atccgagcgg aaattcatgg caagatactt ctgggtttgg gaatttattg 3120
cttacaggta aaccatccgg tgttggtaca aaaagaatgg cgtttaacga cataaaagac 3180
agttgggcaa aagatgcaat agaagtatta gcatcaaggc acatagtaga aggtatgaca 3240
gacactcagt atgaaccaaa caagacagta acgagagcgg aataa 3285
<210> 144
<211> 1094
<212> PRT
<213> Bacteria
<220>
<221> SIGNAL
<222> (1)...(32)
<400> 144
Met Ser Leu Lys Ile Asn Lys Ile Ile Ser Phe Ile Ile Val Phe Ser
1 5 10 15
Met Val Phe Gly Thr Leu Met Tyr Val Pro His Leu Lys Ala Phe Ala
20 25 30
Asp Asn Thr Gly Ile Asn Leu Val Ser Asn Gly Asp Phe Glu Ser Gly
35 40 45
Thr Ile Asp Gly Trp Phe Lys Gln Gly Asn Pro Thr Leu Thr Val Thr
50 55 60
Thr Glu Gln Ala Ile Gly Gln Tyr Ser Met Lys Val Thr Gly Arg Thr
65 70 75 80
Gln Thr Tyr Glu Gly Pro Ala Tyr Ser Phe Leu Gly Lys Met Gln Lys
85 90 95
Gly Glu Ser Tyr Asn Val Ser Leu Lys Val Arg Leu Val Ser Gly Gln
100 105 110
Asn Ser Ser Asn Pro Leu Ile Thr Val Thr Met Phe Arg Glu Asp Asp
115 120 125
Asn Gly Asn His Tyr Asp Thr Ile Val Trp Gln Lys Gln Val Ser Glu
130 135 140
Asp Ser Trp Thr Thr Val Ser Gly Thr Tyr Thr Leu Asp Tyr Thr Gly
145 150 155 160
Thr Leu Lys Thr Leu Tyr Met Tyr Val Glu Ser Pro Asp Pro Thr Leu
165 170 175
Glu Tyr Tyr Ile Asp Asp Val Val Val Thr Pro Gln Asn Pro Thr Gln
180 185 190
Ile Gly Asn Val Val Ala Asn Gly Thr Phe Glu Asn Glu Asn Thr Ser
195 200 205
Gly Trp Val Gly Thr Gly Ser Ser Val Val Lys Ala Val Tyr Gly Asp
210 215 220
Ala His Ser Gly Asp Tyr Ser Leu Leu Thr Thr Gly Arg Thr Ala Asn
225 230 235 240
Trp Asn Gly Pro Ser Tyr Asp Leu Thr Gly Lys Ile Val Pro Gly Gln
245 250 255
Gln Tyr Asn Val Asp Phe Trp Val Lys Phe Ile Asp Gly Asn Asp Thr
260 265 270
Glu Gln Ile Lys Ala Thr Val Lys Ala Thr Ser Asp Lys Asp Asn Tyr
275 280 285
Ile Gln Val Asn Asp Phe Ala Asp Val Ser Lys Gly Glu Trp Thr Glu
290 295 300
Ile Lys Gly Ser Phe Thr Leu Pro Val Ala Asp Tyr Ser Gly Ile Ser
305 310 315 320
Ile Tyr Val Glu Ser Gln Asn Pro Thr Leu Glu Phe Tyr Ile Asp Asp
325 330 335
Phe Ser Val Ile Gly Glu Ile Ala Asn Asn Gln Ile Thr Ile Gln Asn
340 345 350
Asp Ile Pro Asp Leu Tyr Ser Val Phe Lys Asp Tyr Phe Pro Ile Gly
355 360 365
Val Ala Val Asp Pro Ser Arg Leu Asn Asp Thr Asp Pro His Ala Gln
370 375 380
Leu Thr Ala Lys His Phe Asn Met Leu Val Ala Glu Asn Ala Met Lys
385 390 395 400
Pro Glu Ser Leu Gln Pro Thr Glu Gly Asn Phe Thr Phe Asp Asn Ala
405 410 415
Asp Lys Ile Val Asp Tyr Ala Ile Ser His Asn Met Lys Met Arg Gly
420 425 430
His Thr Leu Leu Trp His Asn Gln Val Pro Asp Trp Phe Phe Gln Asp
435 440 445
Pro Ser Asp Pro Ser Lys Pro Ala Ser Arg Asp Leu Leu Leu Gln Arg
450 455 460
Leu Lys Thr His Ile Thr Thr Val Leu Asp His Phe Lys Thr Lys Tyr
465 470 475 480
Gly Ser Gln Asn Pro Ile Ile Gly Trp Asp Val Val Asn Glu Val Leu
485 490 495
Asp Asp Asn Gly Ser Leu Arg Asn Ser Lys Trp Leu Gln Ile Ile Gly
500 505 510
Pro Asp Tyr Ile Glu Lys Ala Phe Glu Tyr Ala His Glu Ala Asp Pro
515 520 525
Ser Met Lys Leu Phe Ile Asn Asp Tyr Asn Ile Glu Asn Asn Gly Val
530 535 540
Lys Thr Gln Ala Met Tyr Asp Leu Val Lys Arg Leu Lys Ser Glu Gly
545 550 555 560
Val Pro Ile Asp Gly Ile Gly Met Gln Met His Ile Asn Ile Asn Ser
565 570 575
Asn Ile Asp Asn Ile Lys Ala Ser Ile Glu Lys Leu Ala Ser Leu Gly
580 585 590
Val Glu Ile Gln Val Thr Glu Leu Asp Met Asn Met Asn Gly Asn Ile
595 600 605
Ser Asn Glu Ala Leu Leu Lys Gln Ala Arg Leu Tyr Lys Gln Leu Phe
610 615 620
Asp Leu Phe Lys Ala Glu Lys Gln Tyr Ile Thr Ala Val Val Phe Trp
625 630 635 640
Gly Val Ser Asp Asp Val Thr Trp Leu Ser Lys Pro Asn Ala Pro Leu
645 650 655
Leu Phe Asp Thr Lys Leu Gln Ala Lys Pro Ala Tyr Trp Ala Ile Val
660 665 670
Asp Pro Asn Lys Ala Thr Pro Asp Ile Gln Ser Ala Lys Ala Leu Glu
675 680 685
Gly Ser Pro Thr Met Gly Thr Asn Val Asp Asn Ser Trp Lys Leu Val
690 695 700
Lys Pro Leu Tyr Ala Asn Thr Phe Val Glu Gly Ser Val Gly Ala Thr
705 710 715 720
Ala Ala Val Lys Ser Met Trp Asp Thr Lys Asn Leu Tyr Leu Leu Val
725 730 735
Gln Val Ser Asp Asn Thr Pro Ser Ser Asn Asp Gly Ile Glu Ile Phe
740 745 750
Val Asp Lys Asn Asp Asp Lys Ser Thr Ser Tyr Glu Thr Asp Asp Glu
755 760 765
His Tyr Thr Ile Lys Arg Asp Gly Thr Gly Ser Ser Asp Ile Thr Lys
770 775 780
Tyr Val Thr Ser Asn Ala Asp Gly Tyr Val Ala Gln Leu Ala Ile Pro
785 790 795 800
Ile Glu Asp Ile Asn Pro Ala Leu Asn Asp Lys Ile Gly Phe Asp Ile
805 810 815
Arg Ile Asn Asp Asp Lys Gly Ile Gly Asn Ile Asp Ala Ile Thr Val
820 825 830
Trp Asn Asp Tyr Thr Asn Ser Gln Asp Thr Asn Thr Ser Tyr Phe Gly
835 840 845
Asp Leu Val Leu Ser Lys Pro Ala Gln Ile Ala Thr Ala Ile Tyr Gly
850 855 860
Thr Pro Val Ile Asp Gly Lys Val Asp Asp Ile Trp Asn Asn Val Glu
865 870 875 880
Ala Ile Ser Thr Asn Thr Trp Val Leu Gly Ser Asn Gly Ala Thr Ala
885 890 895
Thr Ala Lys Met Met Trp Asp Asp Lys Tyr Leu Tyr Val Leu Ala Asp
900 905 910
Val Thr Asp Ser Asn Leu Asn Lys Ser Ser Val Asn Pro Tyr Glu Gln
915 920 925
Asp Ser Val Glu Val Phe Val Asp Gln Asn Asn Asp Lys Thr Thr Tyr
930 935 940
Tyr Lys Asn Asp Asp Gly Gln Phe Arg Val Asn Tyr Asp Asn Glu Gln
945 950 955 960
Ser Phe Gly Gly Ser Thr Asn Ser Asn Gly Phe Lys Ser Ala Thr Ser
965 970 975
Leu Thr Gln Ser Gly Tyr Ile Val Glu Glu Ala Ile Pro Trp Thr Ser
980 985 990
Ile Thr Pro Ser Asn Gly Thr Ile Ile Gly Phe Asp Leu Gln Val Asn
995 1000 1005
Asp Ala Asp Glu Asn Gly Lys Arg Thr Gly Ile Val Thr Trp Cys Asp
1010 1015 1020
Pro Ser Gly Asn Ser Trp Gln Asp Thr Ser Gly Phe Gly Asn Leu Leu
1025 1030 1035 1040
Leu Thr Gly Lys Pro Ser Gly Val Gly Thr Lys Arg Met Ala Phe Asn
1045 1050 1055
Asp Ile Lys Asp Ser Trp Ala Lys Asp Ala Ile Glu Val Leu Ala Ser
1060 1065 1070
Arg His Ile Val Glu Gly Met Thr Asp Thr Gln Tyr Glu Pro Asn Lys
1075 1080 1085
Thr Val Thr Arg Ala Glu
1090
<210> 145
<211> 1629
<212> DNA
<213> Eukaryote
<400> 145
atgaagattg tggatacaac ttccgcagag ataaagattg aaatggaacc tgaaaaagag 60
atacctgctc tgaaagaagt actaaaagac tacttcaaag tcggagttgc actgccgtcc 120
aaggtcttcc tcaacccgaa ggacatagaa ctcatcacga aacacttcaa cagcatcacc 180
gcagaaaacg agatgaaacc ggatagtctg ctcgcgggca tcgaaaacgg taagctgaag 240
ttcaggtttg aaacagcaga caaatacatt cagttcgtcg aggaaaacgg catggttata 300
agaggtcaca cactggtgtg gcacaaccag acacccgact ggttcttcaa agacgaaaac 360
ggaaacctcc tctccaaaga agcgatgacg gaaagactca aagagtacat ccacaccgtt 420
gtcggacact tcaaaggaaa agtctacgca tgggacgtgg tgaacgaagc ggtcgatccg 480
aaccagccgg atggactgag aagatccacc tggtaccaga tcatggggcc tgactacata 540
gaactcgcct tcaagttcgc aagagaagca gatccagatg caaaactctt ctacaacgac 600
tacaacacat tcgagcccag aaagagagat atcatctaca acctcgtgaa ggatctcaag 660
gagaagggac tcatcgatgg gataggcatg cagtgtcaca tcagtcttgc aacagacatc 720
aaacagatcg aagaggccat caaaaagttc agcaccatac ccggtataga aattcacatc 780
acagaactcg atatgagtgt ctacagagat tccagttcca actacccaga ggcaccgagg 840
acggcactca tcgaacaggc tcacaaaatg atgcagctct ttgagatttt caagaagtac 900
agcaacgtga tcacgaacgt cacattctgg ggtctcaagg acgattactc ctggagagca 960
acaagaagaa acgactggcc gctcatcttc gacaaagatc accaggcgaa actcgcttac 1020
tgggcgatag tggcacctga ggtccttcca ccacttccaa aagaaagcag gatctccgaa 1080
ggcgaggctg tggtagtggg gatgatggat gactcgtacc tgatgtcgaa gccgatagag 1140
atccttgacg aagaagggaa cgtgaaggca acgatcaggg cggtgtggaa agacagcacg 1200
atctacatct acggagaggt acaggacaag acgaaaaaac cagcagaaga cggagtggcc 1260
atattcatca acccgaacaa cgaaagaaca ccctatctgc agcctgatga cacctacgct 1320
gtgctgtgga caaactggaa gacggaggtc aacagagaag acgtacaggt gaagaaattc 1380
gttgggcctg gctttagaag atacagcttc gagatgtcga tcacgatacc gggtgtggag 1440
ttcaagaaag acagctacat aggattcgac gctgcggtga tagacgacgg gaagtggtac 1500
agctggagcg acacgacgaa cagccagaag acgaacacga tgaactacgg aacgctgaaa 1560
ctcgaaggaa taatggtagc gacagcaaaa tacggaacac cggtcatcga tggagagata 1620
gacgagtaa 1629
<210> 146
<211> 542
<212> PRT
<213> Eukaryote
<400> 146
Met Lys Ile Val Asp Thr Thr Ser Ala Glu Ile Lys Ile Glu Met Glu
1 5 10 15
Pro Glu Lys Glu Ile Pro Ala Leu Lys Glu Val Leu Lys Asp Tyr Phe
20 25 30
Lys Val Gly Val Ala Leu Pro Ser Lys Val Phe Leu Asn Pro Lys Asp
35 40 45
Ile Glu Leu Ile Thr Lys His Phe Asn Ser Ile Thr Ala Glu Asn Glu
50 55 60
Met Lys Pro Asp Ser Leu Leu Ala Gly Ile Glu Asn Gly Lys Leu Lys
65 70 75 80
Phe Arg Phe Glu Thr Ala Asp Lys Tyr Ile Gln Phe Val Glu Glu Asn
85 90 95
Gly Met Val Ile Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro
100 105 110
Asp Trp Phe Phe Lys Asp Glu Asn Gly Asn Leu Leu Ser Lys Glu Ala
115 120 125
Met Thr Glu Arg Leu Lys Glu Tyr Ile His Thr Val Val Gly His Phe
130 135 140
Lys Gly Lys Val Tyr Ala Trp Asp Val Val Asn Glu Ala Val Asp Pro
145 150 155 160
Asn Gln Pro Asp Gly Leu Arg Arg Ser Thr Trp Tyr Gln Ile Met Gly
165 170 175
Pro Asp Tyr Ile Glu Leu Ala Phe Lys Phe Ala Arg Glu Ala Asp Pro
180 185 190
Asp Ala Lys Leu Phe Tyr Asn Asp Tyr Asn Thr Phe Glu Pro Arg Lys
195 200 205
Arg Asp Ile Ile Tyr Asn Leu Val Lys Asp Leu Lys Glu Lys Gly Leu
210 215 220
Ile Asp Gly Ile Gly Met Gln Cys His Ile Ser Leu Ala Thr Asp Ile
225 230 235 240
Lys Gln Ile Glu Glu Ala Ile Lys Lys Phe Ser Thr Ile Pro Gly Ile
245 250 255
Glu Ile His Ile Thr Glu Leu Asp Met Ser Val Tyr Arg Asp Ser Ser
260 265 270
Ser Asn Tyr Pro Glu Ala Pro Arg Thr Ala Leu Ile Glu Gln Ala His
275 280 285
Lys Met Met Gln Leu Phe Glu Ile Phe Lys Lys Tyr Ser Asn Val Ile
290 295 300
Thr Asn Val Thr Phe Trp Gly Leu Lys Asp Asp Tyr Ser Trp Arg Ala
305 310 315 320
Thr Arg Arg Asn Asp Trp Pro Leu Ile Phe Asp Lys Asp His Gln Ala
325 330 335
Lys Leu Ala Tyr Trp Ala Ile Val Ala Pro Glu Val Leu Pro Pro Leu
340 345 350
Pro Lys Glu Ser Arg Ile Ser Glu Gly Glu Ala Val Val Val Gly Met
355 360 365
Met Asp Asp Ser Tyr Leu Met Ser Lys Pro Ile Glu Ile Leu Asp Glu
370 375 380
Glu Gly Asn Val Lys Ala Thr Ile Arg Ala Val Trp Lys Asp Ser Thr
385 390 395 400
Ile Tyr Ile Tyr Gly Glu Val Gln Asp Lys Thr Lys Lys Pro Ala Glu
405 410 415
Asp Gly Val Ala Ile Phe Ile Asn Pro Asn Asn Glu Arg Thr Pro Tyr
420 425 430
Leu Gln Pro Asp Asp Thr Tyr Ala Val Leu Trp Thr Asn Trp Lys Thr
435 440 445
Glu Val Asn Arg Glu Asp Val Gln Val Lys Lys Phe Val Gly Pro Gly
450 455 460
Phe Arg Arg Tyr Ser Phe Glu Met Ser Ile Thr Ile Pro Gly Val Glu
465 470 475 480
Phe Lys Lys Asp Ser Tyr Ile Gly Phe Asp Ala Ala Val Ile Asp Asp
485 490 495
Gly Lys Trp Tyr Ser Trp Ser Asp Thr Thr Asn Ser Gln Lys Thr Asn
500 505 510
Thr Met Asn Tyr Gly Thr Leu Lys Leu Glu Gly Ile Met Val Ala Thr
515 520 525
Ala Lys Tyr Gly Thr Pro Val Ile Asp Gly Glu Ile Asp Glu
530 535 540
<210> 147
<211> 1146
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 147
atgactttct ctcgacggca atttttgctg caaacctccg ccggcctggc acttttgagc 60
actgccaaaa tgcgcgcttt cgcccgcgca gtcgatgaag tgggccttaa agaccatttt 120
aaagaccatt ttcatattgg gactgccatc agcggtcgac tgatgacgga aatgccggcc 180
ttttaccgcg acctggttac ccgtgaattc agtgccatta ccatggaaaa cgacatgaaa 240
tgggagcgtc tgcatcccaa agaaggccaa tgggattggg agattgccga caaattcgtc 300
aattttggcg aagaaaacga catgtacatt gtcgggcatg ttctggtctg gcactcacag 360
accccggatt gggtgttcca ggattccaga ggcaagccca tttctcgcga cgctttgctg 420
aaacgcatgc gccaccagat tgaacagatg gcgggccgct ataagggccg ggtacacgcg 480
tgggatgtgg tcaatgaggc ggtggacgag gaccaaggct ggcgcaaaag cccgtggttt 540
aacattattg ggcccgagtt tatggagcac gccttcaatt acgcccacga agtggacccc 600
gacgctcacc tgttgtacaa cgactacaat atgcacggtc gggaaaaacg cgaattcgtc 660
ctggatttca tcaaaagata caagaaaaaa ggcattccga tccagggcat aggcatgcaa 720
ggccatgtgg gcctgagctt tcccgatatc agcgagtttg agaaaagcct gcaagcctac 780
gccaaacagg gcatgcggat gcacattacc gagctggata tggacgtgtt accagtggcc 840
tgggatcaca ttggcgccga gatttccacc gagtttgact acgctgatga actggacccc 900
tggcccaaag ggctgccgga agaagtcgaa caggaattta ccgatcgcta caccgctttc 960
tttaaactgt ttttgaaata ccgcgatgat attgaaaggg tcaccttctg gggaaccgga 1020
gatgcggaat cgtggaaaaa taatttccca gtaagggggc gcaccaacta cccgctgctg 1080
tttgatcgcc gataccgcag aaaaccggcc tatgattcga ttgtcgaact gaccaaaaac 1140
ctttaa 1146
<210> 148
<211> 381
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(28)
<400> 148
Met Thr Phe Ser Arg Arg Gln Phe Leu Leu Gln Thr Ser Ala Gly Leu
1 5 10 15
Ala Leu Leu Ser Thr Ala Lys Met Arg Ala Phe Ala Arg Ala Val Asp
20 25 30
Glu Val Gly Leu Lys Asp His Phe Lys Asp His Phe His Ile Gly Thr
35 40 45
Ala Ile Ser Gly Arg Leu Met Thr Glu Met Pro Ala Phe Tyr Arg Asp
50 55 60
Leu Val Thr Arg Glu Phe Ser Ala Ile Thr Met Glu Asn Asp Met Lys
65 70 75 80
Trp Glu Arg Leu His Pro Lys Glu Gly Gln Trp Asp Trp Glu Ile Ala
85 90 95
Asp Lys Phe Val Asn Phe Gly Glu Glu Asn Asp Met Tyr Ile Val Gly
100 105 110
His Val Leu Val Trp His Ser Gln Thr Pro Asp Trp Val Phe Gln Asp
115 120 125
Ser Arg Gly Lys Pro Ile Ser Arg Asp Ala Leu Leu Lys Arg Met Arg
130 135 140
His Gln Ile Glu Gln Met Ala Gly Arg Tyr Lys Gly Arg Val His Ala
145 150 155 160
Trp Asp Val Val Asn Glu Ala Val Asp Glu Asp Gln Gly Trp Arg Lys
165 170 175
Ser Pro Trp Phe Asn Ile Ile Gly Pro Glu Phe Met Glu His Ala Phe
180 185 190
Asn Tyr Ala His Glu Val Asp Pro Asp Ala His Leu Leu Tyr Asn Asp
195 200 205
Tyr Asn Met His Gly Arg Glu Lys Arg Glu Phe Val Leu Asp Phe Ile
210 215 220
Lys Arg Tyr Lys Lys Lys Gly Ile Pro Ile Gln Gly Ile Gly Met Gln
225 230 235 240
Gly His Val Gly Leu Ser Phe Pro Asp Ile Ser Glu Phe Glu Lys Ser
245 250 255
Leu Gln Ala Tyr Ala Lys Gln Gly Met Arg Met His Ile Thr Glu Leu
260 265 270
Asp Met Asp Val Leu Pro Val Ala Trp Asp His Ile Gly Ala Glu Ile
275 280 285
Ser Thr Glu Phe Asp Tyr Ala Asp Glu Leu Asp Pro Trp Pro Lys Gly
290 295 300
Leu Pro Glu Glu Val Glu Gln Glu Phe Thr Asp Arg Tyr Thr Ala Phe
305 310 315 320
Phe Lys Leu Phe Leu Lys Tyr Arg Asp Asp Ile Glu Arg Val Thr Phe
325 330 335
Trp Gly Thr Gly Asp Ala Glu Ser Trp Lys Asn Asn Phe Pro Val Arg
340 345 350
Gly Arg Thr Asn Tyr Pro Leu Leu Phe Asp Arg Arg Tyr Arg Arg Lys
355 360 365
Pro Ala Tyr Asp Ser Ile Val Glu Leu Thr Lys Asn Leu
370 375 380
<210> 149
<211> 1044
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 149
atgaagaagc tttttgtcgc ggtcgttttg ttgcccttag caactttttt cgcgtcggac 60
ggattggagg gagaaccttt gagatcgtta gccgagaaac ttggcatcta catcggttac 120
gcttcgatca accatttctg gactcttccg gattcaaaca agtacacaga agtggcaaag 180
agggagttca acatactcac gccagagaac caaatgaagt gggacagcct tcacccagag 240
cctgacaggt acaacttcac ttacgcagag cgtcatgtcg agttcgcttt ggaaaacaac 300
atgctcgttc acggccacac actcgtttgg cacaaccaac ttccgttctg gttgaacaga 360
cagtggacca aagaagaact cctgaaagtc cttgaggacc acatcaaaac agtcgtcggt 420
cacttcaaag gaagggtgaa gatttgggac gtggtgaacg aagcggtcag cgacatgggc 480
agttacagag agaccatttg gtacaagacc atcggacccg agtacatcga aaaggcattc 540
gtgtgggcaa gacaagccga tccggaagcg atcctcatat acaacgacta caatatagaa 600
acgatcaatc ccaaatcgaa tttcacctac cagctcatca aggagctgaa agaaaaaggt 660
gtgccgatag acggcatcgg ttttcaaatg cacatagaca tcaacggaat aaactatgac 720
agtttcagaa acaacctgaa gaggttcgct gatctcggtc tgaagctcta catcacggaa 780
atggatgtga gaatacccaa gaacgcaact gaaaaagact tggacagaca ggcagaaatc 840
tacgcgaaga tcttcgaaat ctgcttagag aatcctgcgg tccaagccat acagttctgg 900
ggtttcacgg acaagtattc ctgggtgcct ggctttttca gcgggtacga tcatgcgctg 960
atctttgaca gggactacag ccccaagccc gcgtattttg cgataaagag ggtgctcgaa 1020
gccaaggtga gcaagggacg ctga 1044
<210> 150
<211> 347
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(18)
<400> 150
Met Lys Lys Leu Phe Val Ala Val Val Leu Leu Pro Leu Ala Thr Phe
1 5 10 15
Phe Ala Ser Asp Gly Leu Glu Gly Glu Pro Leu Arg Ser Leu Ala Glu
20 25 30
Lys Leu Gly Ile Tyr Ile Gly Tyr Ala Ser Ile Asn His Phe Trp Thr
35 40 45
Leu Pro Asp Ser Asn Lys Tyr Thr Glu Val Ala Lys Arg Glu Phe Asn
50 55 60
Ile Leu Thr Pro Glu Asn Gln Met Lys Trp Asp Ser Leu His Pro Glu
65 70 75 80
Pro Asp Arg Tyr Asn Phe Thr Tyr Ala Glu Arg His Val Glu Phe Ala
85 90 95
Leu Glu Asn Asn Met Leu Val His Gly His Thr Leu Val Trp His Asn
100 105 110
Gln Leu Pro Phe Trp Leu Asn Arg Gln Trp Thr Lys Glu Glu Leu Leu
115 120 125
Lys Val Leu Glu Asp His Ile Lys Thr Val Val Gly His Phe Lys Gly
130 135 140
Arg Val Lys Ile Trp Asp Val Val Asn Glu Ala Val Ser Asp Met Gly
145 150 155 160
Ser Tyr Arg Glu Thr Ile Trp Tyr Lys Thr Ile Gly Pro Glu Tyr Ile
165 170 175
Glu Lys Ala Phe Val Trp Ala Arg Gln Ala Asp Pro Glu Ala Ile Leu
180 185 190
Ile Tyr Asn Asp Tyr Asn Ile Glu Thr Ile Asn Pro Lys Ser Asn Phe
195 200 205
Thr Tyr Gln Leu Ile Lys Glu Leu Lys Glu Lys Gly Val Pro Ile Asp
210 215 220
Gly Ile Gly Phe Gln Met His Ile Asp Ile Asn Gly Ile Asn Tyr Asp
225 230 235 240
Ser Phe Arg Asn Asn Leu Lys Arg Phe Ala Asp Leu Gly Leu Lys Leu
245 250 255
Tyr Ile Thr Glu Met Asp Val Arg Ile Pro Lys Asn Ala Thr Glu Lys
260 265 270
Asp Leu Asp Arg Gln Ala Glu Ile Tyr Ala Lys Ile Phe Glu Ile Cys
275 280 285
Leu Glu Asn Pro Ala Val Gln Ala Ile Gln Phe Trp Gly Phe Thr Asp
290 295 300
Lys Tyr Ser Trp Val Pro Gly Phe Phe Ser Gly Tyr Asp His Ala Leu
305 310 315 320
Ile Phe Asp Arg Asp Tyr Ser Pro Lys Pro Ala Tyr Phe Ala Ile Lys
325 330 335
Arg Val Leu Glu Ala Lys Val Ser Lys Gly Arg
340 345
<210> 151
<211> 1131
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 151
atgcgatcta tgccacttta tgtgttgtta tgcagcgccc ttctgaccgg cagcctatat 60
gcacaagacc aaaatgcttc tttaaaacag gcctttagca aaaactttag tattggcaca 120
gccttaagtg ctacacaaat tcagggcaaa gagccgggca cactggaatt ggtaacacag 180
caatttaacg cggtgacggc agaaaacgtg atgaagtggg aaatcattga acctgtggaa 240
ggccagttca actttgctgc cgccgacgcc atgattgaat tcgccgaagc caatcatatc 300
aaggtgatag gccatgtgct gttatggcac gaacaaacac cagcctgggt atttctggac 360
gccaaaggcc aggccgcctc aaaggaactg gtgttatcac ggctaaaaaa ccatatcaat 420
gccgtaatgg gccgctacaa aggccgtatt catggctggg atgcagtcaa cgaagcctta 480
aatgaagacg gcactctgcg ccaatccaac tggtataaag ctttaggcga cgactatata 540
gccacagtct ttgaactggc gcatcaggcc gacccgaaag ccgaactcta ttacaacgac 600
ttcaatttat ttaaaccgga aaaacgcgct ggtgtactca aactggtggc agctttaaaa 660
gcgaaaaatg tgcctatcca cggcataggc gagcaaggcc attacagcct ggattaccct 720
gagctgcagc aagtagaaga ctctattgtg gcttttaaaa acactggcct gaaagtggtg 780
attaccgaac tggatatctc agttttaccc ttccctgagc cagaaaagat tggtgctgat 840
atctcactca atatgcagtt aaaacaagaa cttaatccct acgccgatgg cttacccaaa 900
gaagtcagcg atcaactgac agaaaaatac ctgcaattat ttcagctatt tttacgccac 960
agcgacgcca tcgaacgcgt gaccttatgg ggcgtaaacg acaaccaaac ctggcgcaac 1020
aactggccaa tgaaaggcag aacagactac cccttactct tcgaccggaa aaaccagcca 1080
aaagaagtgg ttcctgcatt gattaaactg gcggaaaaag ctggtaaata a 1131
<210> 152
<211> 376
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(21)
<400> 152
Met Arg Ser Met Pro Leu Tyr Val Leu Leu Cys Ser Ala Leu Leu Thr
1 5 10 15
Gly Ser Leu Tyr Ala Gln Asp Gln Asn Ala Ser Leu Lys Gln Ala Phe
20 25 30
Ser Lys Asn Phe Ser Ile Gly Thr Ala Leu Ser Ala Thr Gln Ile Gln
35 40 45
Gly Lys Glu Pro Gly Thr Leu Glu Leu Val Thr Gln Gln Phe Asn Ala
50 55 60
Val Thr Ala Glu Asn Val Met Lys Trp Glu Ile Ile Glu Pro Val Glu
65 70 75 80
Gly Gln Phe Asn Phe Ala Ala Ala Asp Ala Met Ile Glu Phe Ala Glu
85 90 95
Ala Asn His Ile Lys Val Ile Gly His Val Leu Leu Trp His Glu Gln
100 105 110
Thr Pro Ala Trp Val Phe Leu Asp Ala Lys Gly Gln Ala Ala Ser Lys
115 120 125
Glu Leu Val Leu Ser Arg Leu Lys Asn His Ile Asn Ala Val Met Gly
130 135 140
Arg Tyr Lys Gly Arg Ile His Gly Trp Asp Ala Val Asn Glu Ala Leu
145 150 155 160
Asn Glu Asp Gly Thr Leu Arg Gln Ser Asn Trp Tyr Lys Ala Leu Gly
165 170 175
Asp Asp Tyr Ile Ala Thr Val Phe Glu Leu Ala His Gln Ala Asp Pro
180 185 190
Lys Ala Glu Leu Tyr Tyr Asn Asp Phe Asn Leu Phe Lys Pro Glu Lys
195 200 205
Arg Ala Gly Val Leu Lys Leu Val Ala Ala Leu Lys Ala Lys Asn Val
210 215 220
Pro Ile His Gly Ile Gly Glu Gln Gly His Tyr Ser Leu Asp Tyr Pro
225 230 235 240
Glu Leu Gln Gln Val Glu Asp Ser Ile Val Ala Phe Lys Asn Thr Gly
245 250 255
Leu Lys Val Val Ile Thr Glu Leu Asp Ile Ser Val Leu Pro Phe Pro
260 265 270
Glu Pro Glu Lys Ile Gly Ala Asp Ile Ser Leu Asn Met Gln Leu Lys
275 280 285
Gln Glu Leu Asn Pro Tyr Ala Asp Gly Leu Pro Lys Glu Val Ser Asp
290 295 300
Gln Leu Thr Glu Lys Tyr Leu Gln Leu Phe Gln Leu Phe Leu Arg His
305 310 315 320
Ser Asp Ala Ile Glu Arg Val Thr Leu Trp Gly Val Asn Asp Asn Gln
325 330 335
Thr Trp Arg Asn Asn Trp Pro Met Lys Gly Arg Thr Asp Tyr Pro Leu
340 345 350
Leu Phe Asp Arg Lys Asn Gln Pro Lys Glu Val Val Pro Ala Leu Ile
355 360 365
Lys Leu Ala Glu Lys Ala Gly Lys
370 375
<210> 153
<211> 1020
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 153
atgggtgcta tgggcctggc ggcgctgtat tcgctgccag ccaatgcaca gacctgcatt 60
acgcagagtc agacgggcac caacaacggc cactattttt cgttctggaa ggacaatccg 120
ggaacggtca atttctgtat gtatgccaac ggccgttaca cgtctaactg gaacggcatc 180
aacaattggg tcggcggcaa aggctggcaa accggctcgc gcagaaacgt cacctactct 240
ggctcgttca actctcccgg caatggctat ctggctgctc tactggctgg accaccaatc 300
ctgttggtcg agtactacat catcgagagc tggggaaatt ggcgcccgcc gggttcggat 360
ggaacattgt taggcaccgt cactagcgac ggcggtactt acgatatcta tcgctcgcgc 420
cgcaccaacg cgccttgtat cactggcaac tcctgtaact tcgatcagta ctggagcgta 480
cggcaatcca agcgcgtggg cggcacgatt accacgggca atcacttcga cgcttgggcg 540
gcacgcggct tgaacctcgg cacgcacaac taccaagtga tggcgaccga gggatatcag 600
agcaacggca gctccgacat caccattagc gacaacccgg gaccgacgcc aggacccact 660
ccgaacccga atcccacgcc gggcaccaag aatttcacgg tgcgcgcgcg cggaaccgcg 720
gggggtgagt ccatcacgct gcgtgtgaac aatcagaacg tgcagacctg gacgctgtcg 780
accagctacc agaacttcac ggcgtccacg acgttgagtg gtggcatcac ggtcgcgttc 840
accaatgatg gtggtagtcg agacgttcag gtggattaca tccaggtgaa cggcgcaact 900
cgacaatccg agagccagac gtacaacacc ggcctctatg ccaacggcag ttgcggcggc 960
ggctcgaaca gcgagtggat gcattgcaat ggagcgatcg gctacggcaa cacgccgtag 1020
<210> 154
<211> 339
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(16)
<400> 154
Met Gly Ala Met Gly Leu Ala Ala Leu Tyr Ser Leu Pro Ala Asn Ala
1 5 10 15
Gln Thr Cys Ile Thr Gln Ser Gln Thr Gly Thr Asn Asn Gly His Tyr
20 25 30
Phe Ser Phe Trp Lys Asp Asn Pro Gly Thr Val Asn Phe Cys Met Tyr
35 40 45
Ala Asn Gly Arg Tyr Thr Ser Asn Trp Asn Gly Ile Asn Asn Trp Val
50 55 60
Gly Gly Lys Gly Trp Gln Thr Gly Ser Arg Arg Asn Val Thr Tyr Ser
65 70 75 80
Gly Ser Phe Asn Ser Pro Gly Asn Gly Tyr Leu Ala Ala Leu Leu Ala
85 90 95
Gly Pro Pro Ile Leu Leu Val Glu Tyr Tyr Ile Ile Glu Ser Trp Gly
100 105 110
Asn Trp Arg Pro Pro Gly Ser Asp Gly Thr Leu Leu Gly Thr Val Thr
115 120 125
Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Arg Ser Arg Arg Thr Asn Ala
130 135 140
Pro Cys Ile Thr Gly Asn Ser Cys Asn Phe Asp Gln Tyr Trp Ser Val
145 150 155 160
Arg Gln Ser Lys Arg Val Gly Gly Thr Ile Thr Thr Gly Asn His Phe
165 170 175
Asp Ala Trp Ala Ala Arg Gly Leu Asn Leu Gly Thr His Asn Tyr Gln
180 185 190
Val Met Ala Thr Glu Gly Tyr Gln Ser Asn Gly Ser Ser Asp Ile Thr
195 200 205
Ile Ser Asp Asn Pro Gly Pro Thr Pro Gly Pro Thr Pro Asn Pro Asn
210 215 220
Pro Thr Pro Gly Thr Lys Asn Phe Thr Val Arg Ala Arg Gly Thr Ala
225 230 235 240
Gly Gly Glu Ser Ile Thr Leu Arg Val Asn Asn Gln Asn Val Gln Thr
245 250 255
Trp Thr Leu Ser Thr Ser Tyr Gln Asn Phe Thr Ala Ser Thr Thr Leu
260 265 270
Ser Gly Gly Ile Thr Val Ala Phe Thr Asn Asp Gly Gly Ser Arg Asp
275 280 285
Val Gln Val Asp Tyr Ile Gln Val Asn Gly Ala Thr Arg Gln Ser Glu
290 295 300
Ser Gln Thr Tyr Asn Thr Gly Leu Tyr Ala Asn Gly Ser Cys Gly Gly
305 310 315 320
Gly Ser Asn Ser Glu Trp Met His Cys Asn Gly Ala Ile Gly Tyr Gly
325 330 335
Asn Thr Pro
<210> 155
<211> 1836
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 155
atgaaaggat taattgcggc agcgcttgct ggcttggcat tcggggcctc cctatcctgg 60
ggacagtgca caacgtttac caccagtacc attcagaatt gtaatggcat tgattacgag 120
ctctggagtc agaataacaa gggcaccgta agcatgaaga ttacgggagg gagcacgaat 180
ccgaatggag gaactttcga tgctacctgg aatggcaccg agaatatcct ggctagagct 240
ggtaagaaat ggggctcgtc cagcactacc acccccacgt ccgcaggcaa tattactctt 300
gaattcgcgg cgacatggtc ctcaagcgat aacgtaaaaa tgcttggagt ctatggctgg 360
gcgtactatc caactggaag tatcccgact aaacaggaaa atggagcaag tacctcattc 420
acaaatcaaa ttgagtacta catcatccag gatcgtggta gctataatgc tgcatcgggt 480
ggaacgaact ccaaaaaata cggcgaaggg acgatcgatg gaattctgta tgaattctat 540
atcgcagaca gaatcaacca gcctgatctg tcaggaaaga gtggaaactt caagcaatac 600
ttcagcgtcc cgaaaagtac gagcagccat aggcaaagtg ggacgattac cgtttccaaa 660
catttccagg cctgggaaaa tgccggaatg aaaatgatgt cctgtcgctt gtatgaagtc 720
gcaatgaaag tcgagtccta taccggttct gcgaccggtg ttggctctgc gaaggttaca 780
aagaatatac tcaccattgg tggaatcttg agcagtagca gtactgcaag cagtagcagc 840
acagtaagta gcagtagcag caatgcatat acgcttgtca cgaatgtttc tcccgctgga 900
gccggaacag tgaccaggag ccccaatact gcgacctatg ccccgaatgc ttcagtacag 960
cttactgcaa cgccgagtac cggttggaaa tttgtcggtt gggctgggga tcttacgtca 1020
actacgagta ctgctaccgt caccatgacc aaagatatta ccgcaactgc aaaatttgaa 1080
ctggtatcgg gagatggcac gaccaacttg atcaaggatg gaaacttccc cagtagcagc 1140
gtcatctcca caggtgatgg cacctcctgg aagctcgggc aaggtacaaa ctggggtaat 1200
tccgcagcaa cgacgagtgt cagcaatgga atcgcgactg tcaatgtgac caccattgga 1260
tctcaaacct atcaacccca gctaattcag tataacgtgg ctctttacaa ggatatgagc 1320
tacaagctca ccttcaaggc aaaagctgct gctgcaagga aaattgaagt cgcattccaa 1380
cagtcggtgg acccatgggc tggatatgct tccaaggaat tcgatcttac aacgacagag 1440
cagacatatg agttcgtatt taaaatgact agcgctactg acacggcttc acagttcgcg 1500
ttcaatctcg gccaggcaac aggcgccgtc aatattagtg atgtaaagct agtatatacg 1560
acagctggta caacacccgt attccgtgga tataatgagg cggcaacaca ggagaggcct 1620
gtattcatat ccttggatgg taggacgttg aacattgttc cagtgtatgg agccaaactg 1680
caggtcaagt tagtggacat caatggtaag atgagagcct ccttcaatgt ggtcggaatt 1740
gcttccatcc cgctgtccaa tatccccgct gggcggtatt atattgacgt aagtggtgac 1800
ggcgttaagc aggcatcccc gatagttctg gaataa 1836
<210> 156
<211> 611
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(21)
<400> 156
Met Lys Gly Leu Ile Ala Ala Ala Leu Ala Gly Leu Ala Phe Gly Ala
1 5 10 15
Ser Leu Ser Trp Gly Gln Cys Thr Thr Phe Thr Thr Ser Thr Ile Gln
20 25 30
Asn Cys Asn Gly Ile Asp Tyr Glu Leu Trp Ser Gln Asn Asn Lys Gly
35 40 45
Thr Val Ser Met Lys Ile Thr Gly Gly Ser Thr Asn Pro Asn Gly Gly
50 55 60
Thr Phe Asp Ala Thr Trp Asn Gly Thr Glu Asn Ile Leu Ala Arg Ala
65 70 75 80
Gly Lys Lys Trp Gly Ser Ser Ser Thr Thr Thr Pro Thr Ser Ala Gly
85 90 95
Asn Ile Thr Leu Glu Phe Ala Ala Thr Trp Ser Ser Ser Asp Asn Val
100 105 110
Lys Met Leu Gly Val Tyr Gly Trp Ala Tyr Tyr Pro Thr Gly Ser Ile
115 120 125
Pro Thr Lys Gln Glu Asn Gly Ala Ser Thr Ser Phe Thr Asn Gln Ile
130 135 140
Glu Tyr Tyr Ile Ile Gln Asp Arg Gly Ser Tyr Asn Ala Ala Ser Gly
145 150 155 160
Gly Thr Asn Ser Lys Lys Tyr Gly Glu Gly Thr Ile Asp Gly Ile Leu
165 170 175
Tyr Glu Phe Tyr Ile Ala Asp Arg Ile Asn Gln Pro Asp Leu Ser Gly
180 185 190
Lys Ser Gly Asn Phe Lys Gln Tyr Phe Ser Val Pro Lys Ser Thr Ser
195 200 205
Ser His Arg Gln Ser Gly Thr Ile Thr Val Ser Lys His Phe Gln Ala
210 215 220
Trp Glu Asn Ala Gly Met Lys Met Met Ser Cys Arg Leu Tyr Glu Val
225 230 235 240
Ala Met Lys Val Glu Ser Tyr Thr Gly Ser Ala Thr Gly Val Gly Ser
245 250 255
Ala Lys Val Thr Lys Asn Ile Leu Thr Ile Gly Gly Ile Leu Ser Ser
260 265 270
Ser Ser Thr Ala Ser Ser Ser Ser Thr Val Ser Ser Ser Ser Ser Asn
275 280 285
Ala Tyr Thr Leu Val Thr Asn Val Ser Pro Ala Gly Ala Gly Thr Val
290 295 300
Thr Arg Ser Pro Asn Thr Ala Thr Tyr Ala Pro Asn Ala Ser Val Gln
305 310 315 320
Leu Thr Ala Thr Pro Ser Thr Gly Trp Lys Phe Val Gly Trp Ala Gly
325 330 335
Asp Leu Thr Ser Thr Thr Ser Thr Ala Thr Val Thr Met Thr Lys Asp
340 345 350
Ile Thr Ala Thr Ala Lys Phe Glu Leu Val Ser Gly Asp Gly Thr Thr
355 360 365
Asn Leu Ile Lys Asp Gly Asn Phe Pro Ser Ser Ser Val Ile Ser Thr
370 375 380
Gly Asp Gly Thr Ser Trp Lys Leu Gly Gln Gly Thr Asn Trp Gly Asn
385 390 395 400
Ser Ala Ala Thr Thr Ser Val Ser Asn Gly Ile Ala Thr Val Asn Val
405 410 415
Thr Thr Ile Gly Ser Gln Thr Tyr Gln Pro Gln Leu Ile Gln Tyr Asn
420 425 430
Val Ala Leu Tyr Lys Asp Met Ser Tyr Lys Leu Thr Phe Lys Ala Lys
435 440 445
Ala Ala Ala Ala Arg Lys Ile Glu Val Ala Phe Gln Gln Ser Val Asp
450 455 460
Pro Trp Ala Gly Tyr Ala Ser Lys Glu Phe Asp Leu Thr Thr Thr Glu
465 470 475 480
Gln Thr Tyr Glu Phe Val Phe Lys Met Thr Ser Ala Thr Asp Thr Ala
485 490 495
Ser Gln Phe Ala Phe Asn Leu Gly Gln Ala Thr Gly Ala Val Asn Ile
500 505 510
Ser Asp Val Lys Leu Val Tyr Thr Thr Ala Gly Thr Thr Pro Val Phe
515 520 525
Arg Gly Tyr Asn Glu Ala Ala Thr Gln Glu Arg Pro Val Phe Ile Ser
530 535 540
Leu Asp Gly Arg Thr Leu Asn Ile Val Pro Val Tyr Gly Ala Lys Leu
545 550 555 560
Gln Val Lys Leu Val Asp Ile Asn Gly Lys Met Arg Ala Ser Phe Asn
565 570 575
Val Val Gly Ile Ala Ser Ile Pro Leu Ser Asn Ile Pro Ala Gly Arg
580 585 590
Tyr Tyr Ile Asp Val Ser Gly Asp Gly Val Lys Gln Ala Ser Pro Ile
595 600 605
Val Leu Glu
610
<210> 157
<211> 645
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 157
atgtttaagt taagtaagaa aattttgatg gtgttattaa caatttcaat gagttttatt 60
agcttatttg cagtaaccgc gtatgcagct tcgacagact actggcaaaa ttggactgat 120
ggtggtggga cagtaaatgc taccaatgga tctgatggca attacagtgt ttcatggtca 180
aattgcggga attttgttgt tggtaaaggc tggactaccg gatcagcaac tagggtaata 240
aactataatg ccggagcctt ttcgccgtcc ggcaatggat atttagctct ttatgggtgg 300
acgagaaatt cactcataga atattacgtc gttgatagct gggggactta tagacctact 360
ggaacttata aaggcactgt gactagtgat ggagggacat atgacatata cacgactaca 420
cgaaccaacg caccttccat tgacggcaat aatacaaatt tcacccagtt ctggagtgtt 480
aggcagtcaa agagaccgat tggtaccaac aataccatca cttttagcaa ccacgttaac 540
gcctggaaga gtaaaggaat gaatctgggg agtagttggg cttatcaggt attagcgaca 600
gagggatatc aaagtagtgg gtactctaac gtaacggtct ggtaa 645
<210> 158
<211> 214
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(29)
<400> 158
Met Phe Lys Leu Ser Lys Lys Ile Leu Met Val Leu Leu Thr Ile Ser
1 5 10 15
Met Ser Phe Ile Ser Leu Phe Ala Val Thr Ala Tyr Ala Ala Ser Thr
20 25 30
Asp Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr Val Asn Ala Thr
35 40 45
Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser Asn Cys Gly Asn
50 55 60
Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala Thr Arg Val Ile
65 70 75 80
Asn Tyr Asn Ala Gly Ala Phe Ser Pro Ser Gly Asn Gly Tyr Leu Ala
85 90 95
Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr Tyr Val Val Asp
100 105 110
Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Thr Val Thr
115 120 125
Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr Arg Thr Asn Ala
130 135 140
Pro Ser Ile Asp Gly Asn Asn Thr Asn Phe Thr Gln Phe Trp Ser Val
145 150 155 160
Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr Ile Thr Phe Ser
165 170 175
Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn Leu Gly Ser Ser
180 185 190
Trp Ala Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln Ser Ser Gly Tyr
195 200 205
Ser Asn Val Thr Val Trp
210
<210> 159
<211> 1041
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 159
atgatcagtc tcaaacgagt ggcggcgctc ctgtgcgtcg caggtctggg catgtctgcg 60
gcaaacgcgc agacctgcct cacgtcgagt caaaccggca ctaacaatgg cttctattat 120
tccttctgga aggacagtcc gggcacggtg aatttttgcc tgcagtccgg cggccgttac 180
acatcgaact ggagcggcat caacaactgg gtgggcggca agggatggca gaccggttca 240
cgccggaaca tcacgtactc gggcagcttc aattcaccgg gcaacggcta cctggcgctt 300
tacggatgga ccaccaatcc actcgtcgag tactacgtcg tcgatagctg ggggagctgg 360
cgtccgccgg gttcggacgg aacgttcctg gggacggtca acagcgatgg cggaacgtat 420
gacatctatc gcgcgcagcg ggtcaacgcg ccgtccatca tcggcaacgc cacgttctat 480
caatactgga gcgttcggca gtcgaagcgg gtaggtggga cgatcaccac cggaaaccac 540
ttcgacgcgt gggccagcgt gggcctgaac ctgggcactc acaactacca gatcatggcg 600
accgagggct accaaagcag cggcagctcc gacatcacgg tgagtgaagg cggtagcagc 660
agtggtggcg gaagcagcac gagcagcagc agcggcggtg gtggcaccaa gagcttcacg 720
gttcgtgcgc gcggtaccgc gggcggtgag tccatcacgc tgcgcgtgaa caaccagaac 780
gtgcagacct ggacgctggg caccagcatg acgaactaca cggcgtcgac ttcactgagc 840
ggcggcatca ccgtggtgta cacgaacgac agcggtaacc gcgacgtgca ggtggactac 900
atcgtcgtga acggccagac gcgccagtcc gaagcccaga gctacaacac cggcctttat 960
gcgaacgggc gttgcggcgg tggctccaac agcgaatgga tgcattgcaa cggcgccatc 1020
ggctacggca atacaccgta a 1041
<210> 160
<211> 346
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(23)
<400> 160
Met Ile Ser Leu Lys Arg Val Ala Ala Leu Leu Cys Val Ala Gly Leu
1 5 10 15
Gly Met Ser Ala Ala Asn Ala Gln Thr Cys Leu Thr Ser Ser Gln Thr
20 25 30
Gly Thr Asn Asn Gly Phe Tyr Tyr Ser Phe Trp Lys Asp Ser Pro Gly
35 40 45
Thr Val Asn Phe Cys Leu Gln Ser Gly Gly Arg Tyr Thr Ser Asn Trp
50 55 60
Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly Ser
65 70 75 80
Arg Arg Asn Ile Thr Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn Gly
85 90 95
Tyr Leu Ala Leu Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr Tyr
100 105 110
Val Val Asp Ser Trp Gly Ser Trp Arg Pro Pro Gly Ser Asp Gly Thr
115 120 125
Phe Leu Gly Thr Val Asn Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Arg
130 135 140
Ala Gln Arg Val Asn Ala Pro Ser Ile Ile Gly Asn Ala Thr Phe Tyr
145 150 155 160
Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Val Gly Gly Thr Ile Thr
165 170 175
Thr Gly Asn His Phe Asp Ala Trp Ala Ser Val Gly Leu Asn Leu Gly
180 185 190
Thr His Asn Tyr Gln Ile Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly
195 200 205
Ser Ser Asp Ile Thr Val Ser Glu Gly Gly Ser Ser Ser Gly Gly Gly
210 215 220
Ser Ser Thr Ser Ser Ser Ser Gly Gly Gly Gly Thr Lys Ser Phe Thr
225 230 235 240
Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Ser Ile Thr Leu Arg Val
245 250 255
Asn Asn Gln Asn Val Gln Thr Trp Thr Leu Gly Thr Ser Met Thr Asn
260 265 270
Tyr Thr Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val Val Tyr Thr
275 280 285
Asn Asp Ser Gly Asn Arg Asp Val Gln Val Asp Tyr Ile Val Val Asn
290 295 300
Gly Gln Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly Leu Tyr
305 310 315 320
Ala Asn Gly Arg Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys
325 330 335
Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro
340 345
<210> 161
<211> 1047
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 161
atgttcaaag gtcttttgaa atcggtcctc accggcaagc gagccggtgc ggtgttcatc 60
tgtctggccg gactgtggat gacacaggcg caggcgcaga cgtgcatcgg ttcaccacaa 120
acgggcaaca acggcggctt cttcttttcg ttctggaaag acaatccggg gtcggtgaat 180
ttctgcatgt actccggcgg tcgctatacc tccagctgga gcggcatcaa caactgggta 240
ggtgggaagg gctggcaaac cggttcatcc cgcacggtga cgtattcggg cacgttcaac 300
tcgccgggaa acggctacct gactctgtac ggatggacca ccaatccgct ggtcgagtac 360
tacatcgtgg acagctgggg cagctaccgt ccgcctggag gccagggctt catgggcacg 420
gtcaccagcg acggcggaac gtatgacatc taccgggttc gccgcaccaa tgcgccgtgc 480
atcacaggca acaactgcaa cttcgaccag tactggagcg tgcgtcagtc gaggcgggtg 540
ggcggcacca tcaccaccgc caaccatttc aacgcgtggc gtacgctcgg catgaatctc 600
gggcagcaca actaccaggt gatggcgacc gaaggattcc agagcagtgg cagctcggac 660
atcaccgtga gcgaaggatc tggcggtggc ggcggaggtg gcggcggtgg caccaagagc 720
ttcacggtgc gcgcgcgcgg caccgcgggc ggcgagtcca tcacgctgcg cgtcaacaac 780
caggtcgtgc agagctggac cttgagcacc agcatgcaga actacacggc ctcgaccacg 840
atgagcggcg gcatcacggt gaacttcacc aacgacggca ccaaccgcga cgtgcaggtg 900
gactacatca tcgtgaatgg ccagacgcgt cagtccgaag cgcagacgta caacaccggg 960
ctgtacgcca acggccgttg cggtggcggg tcgaacagcg agtggatgca ttgcaatggc 1020
gcgatcgggt acggcgacac gccctga 1047
<210> 162
<211> 348
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(32)
<400> 162
Met Phe Lys Gly Leu Leu Lys Ser Val Leu Thr Gly Lys Arg Ala Gly
1 5 10 15
Ala Val Phe Ile Cys Leu Ala Gly Leu Trp Met Thr Gln Ala Gln Ala
20 25 30
Gln Thr Cys Ile Gly Ser Pro Gln Thr Gly Asn Asn Gly Gly Phe Phe
35 40 45
Phe Ser Phe Trp Lys Asp Asn Pro Gly Ser Val Asn Phe Cys Met Tyr
50 55 60
Ser Gly Gly Arg Tyr Thr Ser Ser Trp Ser Gly Ile Asn Asn Trp Val
65 70 75 80
Gly Gly Lys Gly Trp Gln Thr Gly Ser Ser Arg Thr Val Thr Tyr Ser
85 90 95
Gly Thr Phe Asn Ser Pro Gly Asn Gly Tyr Leu Thr Leu Tyr Gly Trp
100 105 110
Thr Thr Asn Pro Leu Val Glu Tyr Tyr Ile Val Asp Ser Trp Gly Ser
115 120 125
Tyr Arg Pro Pro Gly Gly Gln Gly Phe Met Gly Thr Val Thr Ser Asp
130 135 140
Gly Gly Thr Tyr Asp Ile Tyr Arg Val Arg Arg Thr Asn Ala Pro Cys
145 150 155 160
Ile Thr Gly Asn Asn Cys Asn Phe Asp Gln Tyr Trp Ser Val Arg Gln
165 170 175
Ser Arg Arg Val Gly Gly Thr Ile Thr Thr Ala Asn His Phe Asn Ala
180 185 190
Trp Arg Thr Leu Gly Met Asn Leu Gly Gln His Asn Tyr Gln Val Met
195 200 205
Ala Thr Glu Gly Phe Gln Ser Ser Gly Ser Ser Asp Ile Thr Val Ser
210 215 220
Glu Gly Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Thr Lys Ser
225 230 235 240
Phe Thr Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Ser Ile Thr Leu
245 250 255
Arg Val Asn Asn Gln Val Val Gln Ser Trp Thr Leu Ser Thr Ser Met
260 265 270
Gln Asn Tyr Thr Ala Ser Thr Thr Met Ser Gly Gly Ile Thr Val Asn
275 280 285
Phe Thr Asn Asp Gly Thr Asn Arg Asp Val Gln Val Asp Tyr Ile Ile
290 295 300
Val Asn Gly Gln Thr Arg Gln Ser Glu Ala Gln Thr Tyr Asn Thr Gly
305 310 315 320
Leu Tyr Ala Asn Gly Arg Cys Gly Gly Gly Ser Asn Ser Glu Trp Met
325 330 335
His Cys Asn Gly Ala Ile Gly Tyr Gly Asp Thr Pro
340 345
<210> 163
<211> 1068
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 163
atgaaagcaa agagaatgaa gttgtttgcc gcatttttac tctgttttac gcttgcactt 60
cctggggcag tgcatgcgca gacgatcacc agcaattcgg tcggtacgca tgacggttat 120
gactatgaat actggaagga cagcgggaat ggaactatgg ttctcggtag tggcggtacg 180
ttcagtgccg agtggagcaa tatcaataat attctgttcc gtaaaggcaa gaagttcaat 240
gagacgcaga cccatcagca aattggaaac atttccataa cctatggtgc cacctaccaa 300
ccgaatggca attcgtattt aacggtctat ggctggacgg ttgaccccct cgtcgaatat 360
tacattgtcg atagctgggg cagctggcgt ccgcctggag catcgccaaa ggggactgtt 420
aacgttgacg gaggaacgta tgacatttat gagacaactc gtgtcaacca gccttccatt 480
aaaggcacgg caaccttcaa gcagtattgg agtgtccgga cgtcaaaacg gacgagcgga 540
accatatctg taagcgagca ctttaaggcc tgggagaaat tggggatgac catgggcaag 600
atgtatgaag tcgcgcttac ggttgaaggc tatcaaagca gtggaagcgc taatgtgtat 660
agccatacac tgacgatcgg cgggggaaca acacctccac caaccacagg cacaaagatc 720
gaagccgaga gtatgaccaa aagcggacaa tacactggga atatcagctc gccgttcaac 780
ggagtcgctt tgtatgccaa caatgattcc gtgaaattca cgcataattt cacgaccggc 840
acccataact tctcactccg gggggcatca aacaactcca atatggcccg ggttgacctg 900
aaaatcggcg ggcagacgaa ggggaccttc tatttcggcg gaagcagccc tgcggtctat 960
actctgaata atgtcagcca tggaaccgga aatcaagagg ttgaactcgt tgtaaccgcc 1020
gataacggaa catgggatgc tttcattgat tatctcgaga tccattaa 1068
<210> 164
<211> 355
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(26)
<400> 164
Met Lys Ala Lys Arg Met Lys Leu Phe Ala Ala Phe Leu Leu Cys Phe
1 5 10 15
Thr Leu Ala Leu Pro Gly Ala Val His Ala Gln Thr Ile Thr Ser Asn
20 25 30
Ser Val Gly Thr His Asp Gly Tyr Asp Tyr Glu Tyr Trp Lys Asp Ser
35 40 45
Gly Asn Gly Thr Met Val Leu Gly Ser Gly Gly Thr Phe Ser Ala Glu
50 55 60
Trp Ser Asn Ile Asn Asn Ile Leu Phe Arg Lys Gly Lys Lys Phe Asn
65 70 75 80
Glu Thr Gln Thr His Gln Gln Ile Gly Asn Ile Ser Ile Thr Tyr Gly
85 90 95
Ala Thr Tyr Gln Pro Asn Gly Asn Ser Tyr Leu Thr Val Tyr Gly Trp
100 105 110
Thr Val Asp Pro Leu Val Glu Tyr Tyr Ile Val Asp Ser Trp Gly Ser
115 120 125
Trp Arg Pro Pro Gly Ala Ser Pro Lys Gly Thr Val Asn Val Asp Gly
130 135 140
Gly Thr Tyr Asp Ile Tyr Glu Thr Thr Arg Val Asn Gln Pro Ser Ile
145 150 155 160
Lys Gly Thr Ala Thr Phe Lys Gln Tyr Trp Ser Val Arg Thr Ser Lys
165 170 175
Arg Thr Ser Gly Thr Ile Ser Val Ser Glu His Phe Lys Ala Trp Glu
180 185 190
Lys Leu Gly Met Thr Met Gly Lys Met Tyr Glu Val Ala Leu Thr Val
195 200 205
Glu Gly Tyr Gln Ser Ser Gly Ser Ala Asn Val Tyr Ser His Thr Leu
210 215 220
Thr Ile Gly Gly Gly Thr Thr Pro Pro Pro Thr Thr Gly Thr Lys Ile
225 230 235 240
Glu Ala Glu Ser Met Thr Lys Ser Gly Gln Tyr Thr Gly Asn Ile Ser
245 250 255
Ser Pro Phe Asn Gly Val Ala Leu Tyr Ala Asn Asn Asp Ser Val Lys
260 265 270
Phe Thr His Asn Phe Thr Thr Gly Thr His Asn Phe Ser Leu Arg Gly
275 280 285
Ala Ser Asn Asn Ser Asn Met Ala Arg Val Asp Leu Lys Ile Gly Gly
290 295 300
Gln Thr Lys Gly Thr Phe Tyr Phe Gly Gly Ser Ser Pro Ala Val Tyr
305 310 315 320
Thr Leu Asn Asn Val Ser His Gly Thr Gly Asn Gln Glu Val Glu Leu
325 330 335
Val Val Thr Ala Asp Asn Gly Thr Trp Asp Ala Phe Ile Asp Tyr Leu
340 345 350
Glu Ile His
355
<210> 165
<211> 1047
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 165
gtggggcgca ggagcgccgc cacggcattc atcggcctgg cagcgctgtg tgcctcggcc 60
gccaacgcgc agacctgtct gagctcgagt cagaccggca ccaacaacgg cttctactat 120
tcgttctgga ccgacggcgg tggctccgtg cagttctgcc tgcaatccgc cgggcgctac 180
acctccagct ggagcaatgt cggaaactgg gtcggtggca agggctggca gaccggcgcg 240
cgccgcaaca tcaactattc cggcagcttc aatccctcgg gtaacgcgta cctggccgtc 300
tatggctgga ccacgaatcc cctggtggag tactacatcg tcgacaactg gggtacctat 360
cgtccaccgg gtgggcaggg attcatgggc acggttgtca gcgatggcgg cacctacgac 420
gtctaccgca cgcaacgggt caacgcgccc tccattcagg gcaacgcgac cttctaccag 480
tactggagcg ttcgccagtc gaagcgcacc ggtggaacca tctccaccgg caaccatttc 540
gacggctggg cgacgttcgg catgaacctg ggaaccttca attaccagat cgtggcgacc 600
gagggctacc agagcagcgg caattccgac atcacggtga gcgatggcgg cagcagctcc 660
tcgtcctcca gcagcagcag ttcgtcgtcc tccagcagcg gcggtggcgg caccaagagc 720
ttcacggtgc gcgcgcgcgg cacggccgga ggcgagtcga tcagcctgcg ggtcaacaac 780
accaacgtgc agacctggtc gctgaccacc agctaccaga atctcacggc ctcgaccacg 840
ctgaccggcg gcatcaccgt caactacacc aacgacagca gcggtcacga cgtacaggtg 900
gactacatca tcgtgaacgg ccagacccgc cagtccgagg cgcagagcta caacaccgga 960
ctctatgcca acgggcgctg cggtggtggt ggctacagcg agtggatgca ttgcaacggc 1020
gccatcggct acggcaatac gccgtaa 1047
<210> 166
<211> 348
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(23)
<400> 166
Val Gly Arg Arg Ser Ala Ala Thr Ala Phe Ile Gly Leu Ala Ala Leu
1 5 10 15
Cys Ala Ser Ala Ala Asn Ala Gln Thr Cys Leu Ser Ser Ser Gln Thr
20 25 30
Gly Thr Asn Asn Gly Phe Tyr Tyr Ser Phe Trp Thr Asp Gly Gly Gly
35 40 45
Ser Val Gln Phe Cys Leu Gln Ser Ala Gly Arg Tyr Thr Ser Ser Trp
50 55 60
Ser Asn Val Gly Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly Ala
65 70 75 80
Arg Arg Asn Ile Asn Tyr Ser Gly Ser Phe Asn Pro Ser Gly Asn Ala
85 90 95
Tyr Leu Ala Val Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr Tyr
100 105 110
Ile Val Asp Asn Trp Gly Thr Tyr Arg Pro Pro Gly Gly Gln Gly Phe
115 120 125
Met Gly Thr Val Val Ser Asp Gly Gly Thr Tyr Asp Val Tyr Arg Thr
130 135 140
Gln Arg Val Asn Ala Pro Ser Ile Gln Gly Asn Ala Thr Phe Tyr Gln
145 150 155 160
Tyr Trp Ser Val Arg Gln Ser Lys Arg Thr Gly Gly Thr Ile Ser Thr
165 170 175
Gly Asn His Phe Asp Gly Trp Ala Thr Phe Gly Met Asn Leu Gly Thr
180 185 190
Phe Asn Tyr Gln Ile Val Ala Thr Glu Gly Tyr Gln Ser Ser Gly Asn
195 200 205
Ser Asp Ile Thr Val Ser Asp Gly Gly Ser Ser Ser Ser Ser Ser Ser
210 215 220
Ser Ser Ser Ser Ser Ser Ser Ser Ser Gly Gly Gly Gly Thr Lys Ser
225 230 235 240
Phe Thr Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Ser Ile Ser Leu
245 250 255
Arg Val Asn Asn Thr Asn Val Gln Thr Trp Ser Leu Thr Thr Ser Tyr
260 265 270
Gln Asn Leu Thr Ala Ser Thr Thr Leu Thr Gly Gly Ile Thr Val Asn
275 280 285
Tyr Thr Asn Asp Ser Ser Gly His Asp Val Gln Val Asp Tyr Ile Ile
290 295 300
Val Asn Gly Gln Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly
305 310 315 320
Leu Tyr Ala Asn Gly Arg Cys Gly Gly Gly Gly Tyr Ser Glu Trp Met
325 330 335
His Cys Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro
340 345
<210> 167
<211> 669
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 167
gtgaagctga aaagactgtt caagatcgga ctgctgccgg ccgtattgtt gtttagtgca 60
acgcagcagt taaccgcgca aaccatctgc agcaaccaga ccggcaccaa caacggctac 120
ttctactcgt tctggaagga caccgggtcg gcgtgcatga cactgggttc cggcggcaac 180
tacagcgtca actggaacct gggttccggg aacatggtct gcggcaaagg ctggagtacc 240
ggatcttcaa gccgcagaat cggctacaac gccggcgtct gggcgccgaa cggcaatgcc 300
tacctgactc tgtatgggtg gaccaggaac ccgctcatcg agtactacgt ggtcgacagt 360
tggggaagct ggaggccgcc aggcggaacc tccgcgggca ccgtcaatag cgatggcggg 420
acctacaacc tctatcggac gcagcgggtc aacgcgcctt ccatcgacgg cacccggacg 480
ttctatcagt actggagtgt ccggacctcg aagaggccca ccgggagcaa ccagaccatc 540
accttcgcga accacgtgaa tgcgtggagg agcaaagggt ggaatctggg gagtcacgtc 600
taccagataa tggcaacaga gggatatcaa agcagcggga attccaacct gacggtgtgg 660
gcgcagtag 669
<210> 168
<211> 222
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(36)
<400> 168
Val Lys Leu Lys Arg Leu Phe Lys Ile Gly Leu Leu Pro Ala Val Leu
1 5 10 15
Leu Phe Ser Ala Thr Gln Gln Leu Thr Ala Gln Thr Ile Cys Ser Asn
20 25 30
Gln Thr Gly Thr Asn Asn Gly Tyr Phe Tyr Ser Phe Trp Lys Asp Thr
35 40 45
Gly Ser Ala Cys Met Thr Leu Gly Ser Gly Gly Asn Tyr Ser Val Asn
50 55 60
Trp Asn Leu Gly Ser Gly Asn Met Val Cys Gly Lys Gly Trp Ser Thr
65 70 75 80
Gly Ser Ser Ser Arg Arg Ile Gly Tyr Asn Ala Gly Val Trp Ala Pro
85 90 95
Asn Gly Asn Ala Tyr Leu Thr Leu Tyr Gly Trp Thr Arg Asn Pro Leu
100 105 110
Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Ser Trp Arg Pro Pro Gly
115 120 125
Gly Thr Ser Ala Gly Thr Val Asn Ser Asp Gly Gly Thr Tyr Asn Leu
130 135 140
Tyr Arg Thr Gln Arg Val Asn Ala Pro Ser Ile Asp Gly Thr Arg Thr
145 150 155 160
Phe Tyr Gln Tyr Trp Ser Val Arg Thr Ser Lys Arg Pro Thr Gly Ser
165 170 175
Asn Gln Thr Ile Thr Phe Ala Asn His Val Asn Ala Trp Arg Ser Lys
180 185 190
Gly Trp Asn Leu Gly Ser His Val Tyr Gln Ile Met Ala Thr Glu Gly
195 200 205
Tyr Gln Ser Ser Gly Asn Ser Asn Leu Thr Val Trp Ala Gln
210 215 220
<210> 169
<211> 1041
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 169
atgattgtta gtttcaagag cgtgaaggca ctcgcgtgcc tcgccgtgct cggcattacc 60
gccgcgcagg cgcaaacctg catcacttcc agccagaccg gtaccaacaa cggcaactac 120
ttttccttct ggaaggacag cccgggtacc gtcaacttct gcatgtatgc caatgggcgc 180
tacacctcca actggagcgg catcaacaac tgggtgggcg gcaagggctg gcagacgggc 240
tccaaccgca cggtgaccta ctccggttcg ttcaattcgc ccggcaatgg ctatctcacc 300
ttgtacggat ggaccacgaa tccattgatc gagtactaca tcgtcgacag ctggggcacc 360
tatcgaccgc cgggcggcca gggcttcatg ggcaccgtca acagcgatgg cggcacctat 420
gacatctacc gcacgcagcg cgtgaaccag ccttccatca tcggcaccgc cacgttctac 480
cagtactgga gcgtgcggca gtcgaagcgc gtcggcggca cgatcaccac ggccaaccac 540
ttcaacgcct gggccacgct gggcatgaac ctgggccagc acaactacca ggtcatggcc 600
accgagggtt accagagcag tggcagctcc gacatcaccg tgaccgaggg cggcggctcc 660
tcgtcgtcca gtggcggcgg cagcaccagc agtggcggtg gcggcagcaa gagcttcacc 720
gtgcgtgcgc gcggcacggt cggcggcgaa aacatccagc tgcaggtcaa caaccagacg 780
gtggcgagct ggaacctgac caccagcatg cagaactaca acgcctcgac cagcctgagt 840
ggcggcatca ccgtcgtgta caccaatgac agcggcagcc gcgacgtgca ggtggactac 900
atcgtcgtca acggccagac ccgccagtcc gaagcccaga gctacaacac cgggctctat 960
gccaacggac gttgtggtgg cggctcgaac agcgagtgga tgcattgcaa cggcgcgatt 1020
ggctacggca acacgcccta g 1041
<210> 170
<211> 346
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(24)
<400> 170
Met Ile Val Ser Phe Lys Ser Val Lys Ala Leu Ala Cys Leu Ala Val
1 5 10 15
Leu Gly Ile Thr Ala Ala Gln Ala Gln Thr Cys Ile Thr Ser Ser Gln
20 25 30
Thr Gly Thr Asn Asn Gly Asn Tyr Phe Ser Phe Trp Lys Asp Ser Pro
35 40 45
Gly Thr Val Asn Phe Cys Met Tyr Ala Asn Gly Arg Tyr Thr Ser Asn
50 55 60
Trp Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly
65 70 75 80
Ser Asn Arg Thr Val Thr Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn
85 90 95
Gly Tyr Leu Thr Leu Tyr Gly Trp Thr Thr Asn Pro Leu Ile Glu Tyr
100 105 110
Tyr Ile Val Asp Ser Trp Gly Thr Tyr Arg Pro Pro Gly Gly Gln Gly
115 120 125
Phe Met Gly Thr Val Asn Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Arg
130 135 140
Thr Gln Arg Val Asn Gln Pro Ser Ile Ile Gly Thr Ala Thr Phe Tyr
145 150 155 160
Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Val Gly Gly Thr Ile Thr
165 170 175
Thr Ala Asn His Phe Asn Ala Trp Ala Thr Leu Gly Met Asn Leu Gly
180 185 190
Gln His Asn Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly
195 200 205
Ser Ser Asp Ile Thr Val Thr Glu Gly Gly Gly Ser Ser Ser Ser Ser
210 215 220
Gly Gly Gly Ser Thr Ser Ser Gly Gly Gly Gly Ser Lys Ser Phe Thr
225 230 235 240
Val Arg Ala Arg Gly Thr Val Gly Gly Glu Asn Ile Gln Leu Gln Val
245 250 255
Asn Asn Gln Thr Val Ala Ser Trp Asn Leu Thr Thr Ser Met Gln Asn
260 265 270
Tyr Asn Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val Val Tyr Thr
275 280 285
Asn Asp Ser Gly Ser Arg Asp Val Gln Val Asp Tyr Ile Val Val Asn
290 295 300
Gly Gln Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly Leu Tyr
305 310 315 320
Ala Asn Gly Arg Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys
325 330 335
Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro
340 345
<210> 171
<211> 678
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 171
atggagttga aaaaaatatc cagaaaagga ctgccactag tattcttgtc cttgttgttg 60
ttcagtgtaa cgcagcagtc aaacgcccaa accatctgca gcaatcaaac tggcacaaac 120
aacggtttct tctattcgtt ttggaaggac accggatcag catgcatgac tttgggctct 180
ggcggcaatt acgacgtaag ttggaatctg ggttctggga atatggttgt cggcaaaggc 240
tggagtaccg gatcatcaac caggagagta ggctacaatg ccggcatctg gcagccgaac 300
ggcaatgcat atttggctct ctatgggtgg acgagaaacc cacttataga atattacgtc 360
gttgatagct ggggcacttt caggccgcct ggaggaacgt caataggctc cgtcaccact 420
gatggtggta cataccaaat atatcggacc cagcgagtca acgcgccttc cattgacggc 480
gccagaactt tttatcagta ctggagtgtc cggacctcga agagaccgac cgggagcaac 540
caaaccatca cctttgcgaa tcacgttaac gcgtggagga atctaggttt gaatctgggg 600
agtcatgttt accagataat ggccacagag ggatttcata gcagtgggag atctaaccta 660
acggtgtggt cacagtaa 678
<210> 172
<211> 225
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(29)
<400> 172
Met Glu Leu Lys Lys Ile Ser Arg Lys Gly Leu Pro Leu Val Phe Leu
1 5 10 15
Ser Leu Leu Leu Phe Ser Val Thr Gln Gln Ser Asn Ala Gln Thr Ile
20 25 30
Cys Ser Asn Gln Thr Gly Thr Asn Asn Gly Phe Phe Tyr Ser Phe Trp
35 40 45
Lys Asp Thr Gly Ser Ala Cys Met Thr Leu Gly Ser Gly Gly Asn Tyr
50 55 60
Asp Val Ser Trp Asn Leu Gly Ser Gly Asn Met Val Val Gly Lys Gly
65 70 75 80
Trp Ser Thr Gly Ser Ser Thr Arg Arg Val Gly Tyr Asn Ala Gly Ile
85 90 95
Trp Gln Pro Asn Gly Asn Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Arg
100 105 110
Asn Pro Leu Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Thr Phe Arg
115 120 125
Pro Pro Gly Gly Thr Ser Ile Gly Ser Val Thr Thr Asp Gly Gly Thr
130 135 140
Tyr Gln Ile Tyr Arg Thr Gln Arg Val Asn Ala Pro Ser Ile Asp Gly
145 150 155 160
Ala Arg Thr Phe Tyr Gln Tyr Trp Ser Val Arg Thr Ser Lys Arg Pro
165 170 175
Thr Gly Ser Asn Gln Thr Ile Thr Phe Ala Asn His Val Asn Ala Trp
180 185 190
Arg Asn Leu Gly Leu Asn Leu Gly Ser His Val Tyr Gln Ile Met Ala
195 200 205
Thr Glu Gly Phe His Ser Ser Gly Arg Ser Asn Leu Thr Val Trp Ser
210 215 220
Gln
225
<210> 173
<211> 1503
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 173
ttgaaaaaac tcgcagctgc cttatcactt gcaattacct ttgccgtacc gacaatagta 60
caagcacaag gtcccacatg gactaccagc acaatacaga aatacaacaa ctacgactat 120
gaactctgga atgaaaacaa tcagggtacc gtttccatga agctcacagg agataacggt 180
accgctgcca atgcggtagg cggaacgttt gagtctactt ggagtggtac aaagaatgtg 240
cttttccgtt ccggcagaaa gtttaccggt acttcagggc aaagcgttga tggtggcggt 300
gctggcaaaa ccgctagtgc ttacggcaat ataagcatta acttcgccgc tacgtggtct 360
tccggtgacg atgtgaagat gcttggcgta tatggttggg cgttttacgc actgccaagt 420
gtaccagaca aacaggaaaa cggcacttct actaattttt ccaatcaaat agaatactac 480
atcattcaag accgcggcag ctataactcg gctacaggtg gcaccaactc aaagaaatac 540
ggtgaggcta ccattgacgg cattgcttat gagttccgtg tatgtgatag aatagggcaa 600
cctatgttaa ctggcaacgg gaattttaag cagtatttca gtgttcctaa aagcactata 660
aaccaccgca ccagcggtac aatctctgtt tccaaacact ttgaagaatg ggaaaaagtc 720
ggcatgaaaa tggacggtcc cttatacgaa gtagcgatga aagttgaatc ctattctggc 780
aatgggaata gtaacggcaa tgctaaaatt acaaagaata ttttgaccat tggcggaaca 840
accacaactc aaagcagttc aagcggaggt tcaacggttc cagatgaatg tggcgaatat 900
aaaaagagtt tctgtggtgg cttgggatat ggaagcgtat attccaattt aaccgcaata 960
ccctcaacgg gcgactgctt atacatcgga gattttgaag taatccagcc agctttgaat 1020
tcaaccgttg ccataaacgg tgtggaaaat acctgcggaa gcgagtggtc agattgccct 1080
tacaatgata aacccgattc aaaaaaagat ggcggctatt atgtttatgt gaaaacaggc 1140
tcaattaaca attatgagaa taacggttgg caaaacattg tagctaaagc aaaaccggct 1200
tgcacaccac cttctagcag ttccggtgct gcaccaggtt cttcttcttc agacgaagaa 1260
gacccagagc caattttgaa aaatcgcatt cctataactc atttttccct tcaaacgctt 1320
agcgataaag ccttgcgcat agaagtaaat gctccaacta ttgtggacat ttttgacctg 1380
agagggaata aggttaaaag tttgaatgtt tacggttcgc aaagggttaa attatccctg 1440
ccgagcgggg tgtattttgc caaagtgcgc gggatgaaaa gcgttagatt tgtgttgagg 1500
taa 1503
<210> 174
<211> 500
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(22)
<400> 174
Leu Lys Lys Leu Ala Ala Ala Leu Ser Leu Ala Ile Thr Phe Ala Val
1 5 10 15
Pro Thr Ile Val Gln Ala Gln Gly Pro Thr Trp Thr Thr Ser Thr Ile
20 25 30
Gln Lys Tyr Asn Asn Tyr Asp Tyr Glu Leu Trp Asn Glu Asn Asn Gln
35 40 45
Gly Thr Val Ser Met Lys Leu Thr Gly Asp Asn Gly Thr Ala Ala Asn
50 55 60
Ala Val Gly Gly Thr Phe Glu Ser Thr Trp Ser Gly Thr Lys Asn Val
65 70 75 80
Leu Phe Arg Ser Gly Arg Lys Phe Thr Gly Thr Ser Gly Gln Ser Val
85 90 95
Asp Gly Gly Gly Ala Gly Lys Thr Ala Ser Ala Tyr Gly Asn Ile Ser
100 105 110
Ile Asn Phe Ala Ala Thr Trp Ser Ser Gly Asp Asp Val Lys Met Leu
115 120 125
Gly Val Tyr Gly Trp Ala Phe Tyr Ala Leu Pro Ser Val Pro Asp Lys
130 135 140
Gln Glu Asn Gly Thr Ser Thr Asn Phe Ser Asn Gln Ile Glu Tyr Tyr
145 150 155 160
Ile Ile Gln Asp Arg Gly Ser Tyr Asn Ser Ala Thr Gly Gly Thr Asn
165 170 175
Ser Lys Lys Tyr Gly Glu Ala Thr Ile Asp Gly Ile Ala Tyr Glu Phe
180 185 190
Arg Val Cys Asp Arg Ile Gly Gln Pro Met Leu Thr Gly Asn Gly Asn
195 200 205
Phe Lys Gln Tyr Phe Ser Val Pro Lys Ser Thr Ile Asn His Arg Thr
210 215 220
Ser Gly Thr Ile Ser Val Ser Lys His Phe Glu Glu Trp Glu Lys Val
225 230 235 240
Gly Met Lys Met Asp Gly Pro Leu Tyr Glu Val Ala Met Lys Val Glu
245 250 255
Ser Tyr Ser Gly Asn Gly Asn Ser Asn Gly Asn Ala Lys Ile Thr Lys
260 265 270
Asn Ile Leu Thr Ile Gly Gly Thr Thr Thr Thr Gln Ser Ser Ser Ser
275 280 285
Gly Gly Ser Thr Val Pro Asp Glu Cys Gly Glu Tyr Lys Lys Ser Phe
290 295 300
Cys Gly Gly Leu Gly Tyr Gly Ser Val Tyr Ser Asn Leu Thr Ala Ile
305 310 315 320
Pro Ser Thr Gly Asp Cys Leu Tyr Ile Gly Asp Phe Glu Val Ile Gln
325 330 335
Pro Ala Leu Asn Ser Thr Val Ala Ile Asn Gly Val Glu Asn Thr Cys
340 345 350
Gly Ser Glu Trp Ser Asp Cys Pro Tyr Asn Asp Lys Pro Asp Ser Lys
355 360 365
Lys Asp Gly Gly Tyr Tyr Val Tyr Val Lys Thr Gly Ser Ile Asn Asn
370 375 380
Tyr Glu Asn Asn Gly Trp Gln Asn Ile Val Ala Lys Ala Lys Pro Ala
385 390 395 400
Cys Thr Pro Pro Ser Ser Ser Ser Gly Ala Ala Pro Gly Ser Ser Ser
405 410 415
Ser Asp Glu Glu Asp Pro Glu Pro Ile Leu Lys Asn Arg Ile Pro Ile
420 425 430
Thr His Phe Ser Leu Gln Thr Leu Ser Asp Lys Ala Leu Arg Ile Glu
435 440 445
Val Asn Ala Pro Thr Ile Val Asp Ile Phe Asp Leu Arg Gly Asn Lys
450 455 460
Val Lys Ser Leu Asn Val Tyr Gly Ser Gln Arg Val Lys Leu Ser Leu
465 470 475 480
Pro Ser Gly Val Tyr Phe Ala Lys Val Arg Gly Met Lys Ser Val Arg
485 490 495
Phe Val Leu Arg
500
<210> 175
<211> 1053
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 175
atgaagtcca ttcgcagccg cagcctcgcc accgccgtcc tggctggcgc cctcggcgtc 60
gcagccgcag gcgcgcaggc gcagacgctc aacaacaatt ccaccggcac gcacgacggc 120
tactactaca cgttctggaa ggactcgggc agcgcctcga tgaccctcca tccgggcgga 180
cgctacagct cccagtggac cagcaacacc aacaactggg tcggcgggaa aggctggaat 240
cccggtggcc cgcgcgtggt caactactcg ggctactacg gggtcaacaa cagccagaac 300
tcctacctgg cgctgtacgg ctggacccgc aatccgctgg tcgagtacta cgtgatcgag 360
agctacggct cctacaaccc ggccagttgc gccggcgggg tggactacgg cagcttccag 420
agcgatggcg ccacctacaa cgtacgtcgc tgcctgcgcc agaacgcgcc gtcgatcgaa 480
ggcaacaaca gcaccttcta ccagtacttc agcgtgcgca atcccaagaa gggattcggc 540
aacatctccg gcacgatcac cgtcgccaac cacttcaact actgggccag ccgcggcctc 600
aacctcggca accacgacta catggtgttc gccaccgagg gctaccagag ccagggcagc 660
agcgacatca ccgtgagttc gggtaccggc ggcggcggtg gcggcggcaa cacgggcagc 720
aagaccatcg tggtgcgcgc gcgcggcacc gccggcggag agaacatctc gctcaaggtc 780
aacaacgcca ccatcgccag ctggacgctc accaccagca tggccaacta cacggccacc 840
acctcggcat cgggcggctc gctggtggag ttcaccaacg acggcggcaa ccgcgacgtg 900
caggtggact acctcagcgt caatggcgcc gtccgccagg ccgaggacca gacctacaac 960
accggcgtgt accagaacgg ccagtgcggc ggcggcaacg gccgcagcga atggctgcac 1020
tgcaacggtg ccatcggctt cggaaatctc tga 1053
<210> 176
<211> 350
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(27)
<400> 176
Met Lys Ser Ile Arg Ser Arg Ser Leu Ala Thr Ala Val Leu Ala Gly
1 5 10 15
Ala Leu Gly Val Ala Ala Ala Gly Ala Gln Ala Gln Thr Leu Asn Asn
20 25 30
Asn Ser Thr Gly Thr His Asp Gly Tyr Tyr Tyr Thr Phe Trp Lys Asp
35 40 45
Ser Gly Ser Ala Ser Met Thr Leu His Pro Gly Gly Arg Tyr Ser Ser
50 55 60
Gln Trp Thr Ser Asn Thr Asn Asn Trp Val Gly Gly Lys Gly Trp Asn
65 70 75 80
Pro Gly Gly Pro Arg Val Val Asn Tyr Ser Gly Tyr Tyr Gly Val Asn
85 90 95
Asn Ser Gln Asn Ser Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Pro
100 105 110
Leu Val Glu Tyr Tyr Val Ile Glu Ser Tyr Gly Ser Tyr Asn Pro Ala
115 120 125
Ser Cys Ala Gly Gly Val Asp Tyr Gly Ser Phe Gln Ser Asp Gly Ala
130 135 140
Thr Tyr Asn Val Arg Arg Cys Leu Arg Gln Asn Ala Pro Ser Ile Glu
145 150 155 160
Gly Asn Asn Ser Thr Phe Tyr Gln Tyr Phe Ser Val Arg Asn Pro Lys
165 170 175
Lys Gly Phe Gly Asn Ile Ser Gly Thr Ile Thr Val Ala Asn His Phe
180 185 190
Asn Tyr Trp Ala Ser Arg Gly Leu Asn Leu Gly Asn His Asp Tyr Met
195 200 205
Val Phe Ala Thr Glu Gly Tyr Gln Ser Gln Gly Ser Ser Asp Ile Thr
210 215 220
Val Ser Ser Gly Thr Gly Gly Gly Gly Gly Gly Gly Asn Thr Gly Ser
225 230 235 240
Lys Thr Ile Val Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Asn Ile
245 250 255
Ser Leu Lys Val Asn Asn Ala Thr Ile Ala Ser Trp Thr Leu Thr Thr
260 265 270
Ser Met Ala Asn Tyr Thr Ala Thr Thr Ser Ala Ser Gly Gly Ser Leu
275 280 285
Val Glu Phe Thr Asn Asp Gly Gly Asn Arg Asp Val Gln Val Asp Tyr
290 295 300
Leu Ser Val Asn Gly Ala Val Arg Gln Ala Glu Asp Gln Thr Tyr Asn
305 310 315 320
Thr Gly Val Tyr Gln Asn Gly Gln Cys Gly Gly Gly Asn Gly Arg Ser
325 330 335
Glu Trp Leu His Cys Asn Gly Ala Ile Gly Phe Gly Asn Leu
340 345 350
<210> 177
<211> 1299
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 177
atgaaattgt tgaaaacgca caggcgtgcg attgctgccg cagcactagc ggtggcgact 60
gttccaatcg ctcatgcgca aacgcttagc tcaaatgcca ctggaaccca gaatggttac 120
tactattcgt tttggaagga ttccggtaac gccaccatga cactcggtgc cggtggaaac 180
tattcttcat cctggaacag cagcactaac aactgggttg gcggtaaagg ctggatgccg 240
ggtactcggc gcacagtcac ctattcgggc agttatagcg cgagtggaac cagctacctc 300
gcactttacg gctggactcg aaacccgctg atcgaatatt acattgtcga aaactgggtc 360
aattacaatc ctgcgtccgg cgcaacgaat tatgggactg tcaatattga cggcagcacc 420
taccagctgg gccgcagcca acgggttaat cagccatcta ttgaaggcac ggccacgttc 480
taccaatact ggagtgtgcg ccaaaacaag cgcaccagcg gaacgattaa tattggagcg 540
catttcgatg catgggctgc tgtgggcttg aacctgggga ctcacgatta tcagattatg 600
gcgaccgagg gctaccagag cagcggccag tccaatatca cggtgagcga aggcagtagc 660
ggcagcacga cttcgagcac atccagctcc agctcaagta cgagttccag tagttcttcc 720
agcagttctt ccggcggcgg cacaggaagt tgtgccggag tgaatgtgta ccccaattgg 780
accgcacgcg actggtctgg cggcgcatac aatcacgcca atgccggtga ccaaatggtc 840
tatcaaaaca atttgtaccg ggcaaactgg tacaccaact ccacgcctgg aagcgatgcc 900
tcctggacca gtctcgggtc ctgtagcggc ggcggtagca ccagttcaac aacgagctcc 960
tccagttcct cttccacctc ggcgtcgagc agctccaact catccagcag cagttcaagc 1020
agctccagca gcggtggctg tcgggaaatg tgtaactggt acggacaggg tatgtatcct 1080
ctgtgtcaga acaccagcgg ttggggatgg gaaaataacc agaactgtat cggtcgccaa 1140
acctgtcaaa gtcagaacgg cggctccggg ggtgtggtga acagctgtgg taccagcagc 1200
tcttcgtcca gtagcacctc ctcatcgagc agttcaagtt cgtcgagtgg caccacgtca 1260
tcgtcctccg gaattcctgc agcccggggg atccactag 1299
<210> 178
<211> 432
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(26)
<400> 178
Met Lys Leu Leu Lys Thr His Arg Arg Ala Ile Ala Ala Ala Ala Leu
1 5 10 15
Ala Val Ala Thr Val Pro Ile Ala His Ala Gln Thr Leu Ser Ser Asn
20 25 30
Ala Thr Gly Thr Gln Asn Gly Tyr Tyr Tyr Ser Phe Trp Lys Asp Ser
35 40 45
Gly Asn Ala Thr Met Thr Leu Gly Ala Gly Gly Asn Tyr Ser Ser Ser
50 55 60
Trp Asn Ser Ser Thr Asn Asn Trp Val Gly Gly Lys Gly Trp Met Pro
65 70 75 80
Gly Thr Arg Arg Thr Val Thr Tyr Ser Gly Ser Tyr Ser Ala Ser Gly
85 90 95
Thr Ser Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Pro Leu Ile Glu
100 105 110
Tyr Tyr Ile Val Glu Asn Trp Val Asn Tyr Asn Pro Ala Ser Gly Ala
115 120 125
Thr Asn Tyr Gly Thr Val Asn Ile Asp Gly Ser Thr Tyr Gln Leu Gly
130 135 140
Arg Ser Gln Arg Val Asn Gln Pro Ser Ile Glu Gly Thr Ala Thr Phe
145 150 155 160
Tyr Gln Tyr Trp Ser Val Arg Gln Asn Lys Arg Thr Ser Gly Thr Ile
165 170 175
Asn Ile Gly Ala His Phe Asp Ala Trp Ala Ala Val Gly Leu Asn Leu
180 185 190
Gly Thr His Asp Tyr Gln Ile Met Ala Thr Glu Gly Tyr Gln Ser Ser
195 200 205
Gly Gln Ser Asn Ile Thr Val Ser Glu Gly Ser Ser Gly Ser Thr Thr
210 215 220
Ser Ser Thr Ser Ser Ser Ser Ser Ser Thr Ser Ser Ser Ser Ser Ser
225 230 235 240
Ser Ser Ser Ser Gly Gly Gly Thr Gly Ser Cys Ala Gly Val Asn Val
245 250 255
Tyr Pro Asn Trp Thr Ala Arg Asp Trp Ser Gly Gly Ala Tyr Asn His
260 265 270
Ala Asn Ala Gly Asp Gln Met Val Tyr Gln Asn Asn Leu Tyr Arg Ala
275 280 285
Asn Trp Tyr Thr Asn Ser Thr Pro Gly Ser Asp Ala Ser Trp Thr Ser
290 295 300
Leu Gly Ser Cys Ser Gly Gly Gly Ser Thr Ser Ser Thr Thr Ser Ser
305 310 315 320
Ser Ser Ser Ser Ser Thr Ser Ala Ser Ser Ser Ser Asn Ser Ser Ser
325 330 335
Ser Ser Ser Ser Ser Ser Ser Ser Gly Gly Cys Arg Glu Met Cys Asn
340 345 350
Trp Tyr Gly Gln Gly Met Tyr Pro Leu Cys Gln Asn Thr Ser Gly Trp
355 360 365
Gly Trp Glu Asn Asn Gln Asn Cys Ile Gly Arg Gln Thr Cys Gln Ser
370 375 380
Gln Asn Gly Gly Ser Gly Gly Val Val Asn Ser Cys Gly Thr Ser Ser
385 390 395 400
Ser Ser Ser Ser Ser Thr Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser
405 410 415
Gly Thr Thr Ser Ser Ser Ser Gly Ile Pro Ala Ala Arg Gly Ile His
420 425 430
<210> 179
<211> 852
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 179
atgaagaatt ggccgggaac gggtattata ttattattgg cgggcggcct tttggcggct 60
tgtttgacgg gcaaacggca agaggggcaa aaagtggatc cggatactca aaacgagaaa 120
ttgacaggcg ggaccgtgtt tacagctaac agcaggggga acaggcccct ggaaggttcg 180
ccttatggtt acgaaatgtg gacgcagggc gggaataata acaagcttgt ttggttcggg 240
ccggatcagg ggggaggggc ggctttcagg gcagaatgga acgagccgga tgattttttg 300
ggacgactgg gtttctggtg gggaaacggc gggcaattta aagaatataa aaatatgtac 360
gcggatttca attacacaag gtcggggcgc ggcaccggcg gcagttattc ttatataggc 420
atttacggct gggcgagaaa cccgaacgcc gcgaacgagg aagacaggtt aatagaatac 480
tatattgtgg acgactggtt cgggaatcaa tggcagtccg acgacacccc cattaccaca 540
agaacaacag gaggctccgt attgggtacc attatagcgg acggcgcgtt ttacaacgtc 600
gtcaggaatg tgagaaccca aaagccttcg atagacggca tcaaaacatt cgcccaatac 660
ttcagcatac gccaaacacc gcgccaaagc gggacaatct ccatcaccga acatttcaaa 720
caatgggaaa gcatgggcct gaagctcgga aatatgtacg aggcaaaatt cctggtagaa 780
gccggcggcg gcaccggctg gctggagttt acgtatctta aactgacgca ggaagaaaaa 840
aaaagaaatt ag 852
<210> 180
<211> 283
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(19)
<400> 180
Met Lys Asn Trp Pro Gly Thr Gly Ile Ile Leu Leu Leu Ala Gly Gly
1 5 10 15
Leu Leu Ala Ala Cys Leu Thr Gly Lys Arg Gln Glu Gly Gln Lys Val
20 25 30
Asp Pro Asp Thr Gln Asn Glu Lys Leu Thr Gly Gly Thr Val Phe Thr
35 40 45
Ala Asn Ser Arg Gly Asn Arg Pro Leu Glu Gly Ser Pro Tyr Gly Tyr
50 55 60
Glu Met Trp Thr Gln Gly Gly Asn Asn Asn Lys Leu Val Trp Phe Gly
65 70 75 80
Pro Asp Gln Gly Gly Gly Ala Ala Phe Arg Ala Glu Trp Asn Glu Pro
85 90 95
Asp Asp Phe Leu Gly Arg Leu Gly Phe Trp Trp Gly Asn Gly Gly Gln
100 105 110
Phe Lys Glu Tyr Lys Asn Met Tyr Ala Asp Phe Asn Tyr Thr Arg Ser
115 120 125
Gly Arg Gly Thr Gly Gly Ser Tyr Ser Tyr Ile Gly Ile Tyr Gly Trp
130 135 140
Ala Arg Asn Pro Asn Ala Ala Asn Glu Glu Asp Arg Leu Ile Glu Tyr
145 150 155 160
Tyr Ile Val Asp Asp Trp Phe Gly Asn Gln Trp Gln Ser Asp Asp Thr
165 170 175
Pro Ile Thr Thr Arg Thr Thr Gly Gly Ser Val Leu Gly Thr Ile Ile
180 185 190
Ala Asp Gly Ala Phe Tyr Asn Val Val Arg Asn Val Arg Thr Gln Lys
195 200 205
Pro Ser Ile Asp Gly Ile Lys Thr Phe Ala Gln Tyr Phe Ser Ile Arg
210 215 220
Gln Thr Pro Arg Gln Ser Gly Thr Ile Ser Ile Thr Glu His Phe Lys
225 230 235 240
Gln Trp Glu Ser Met Gly Leu Lys Leu Gly Asn Met Tyr Glu Ala Lys
245 250 255
Phe Leu Val Glu Ala Gly Gly Gly Thr Gly Trp Leu Glu Phe Thr Tyr
260 265 270
Leu Lys Leu Thr Gln Glu Glu Lys Lys Arg Asn
275 280
<210> 181
<211> 1077
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 181
atgaacttca gtctcaggaa ggctgcagcg gcgctggctt gcgtcgcggg cctgtatgca 60
tcatcggcgg gcgctcagac ctgcctgacc aacaaccaga ccggcaacaa cggcgggtac 120
tactactcgt tctggaagga cagcggcaac gtcaccttct gcctgcagtc cggcgggcga 180
tacacgtccc agtggagcaa cgtcaacaac tgggtgggcg gcaagggctg gaacccgggt 240
gggcgacgca ccgtcaccta ttccggcacc tacaacccca atggcaattc gtacctgacc 300
ctgtacggct ggaccacgaa tccactggtc gagtactaca tcgtcgacag ctggggttcc 360
tggcgcccac cgggctcggg atacatgggc acggtcacca gcgatggcgg cacctacgac 420
atctatcgca cgcagcgtgt gaaccagcct tccatcatcg gcaccgcgac gttctaccaa 480
tactggagcg tgcggcaatc gaagcgcgtg ggtggcacca tcacctcggg caatcacttc 540
gatgcctggg cctcgctggg catgaacctc ggcacgcaca actacatggt gatggccacc 600
gagggctacc agagcagcgg cagctcggac atcacggtgg gcagcggcag ttcgtcgtcg 660
agcagcagct cgtccagcag tagcagctcg tcgtccagta gcagcagcag ttcttcgtcc 720
agcagcagcg gtggcggcgg caccaagagc ttcaccgtgc gcgcacgcgg cacggcgggt 780
ggcgagtcca tcaccttgcg ggtgaacaac cagaacgtgc agacctggac gctgggcacc 840
agcatgcaga actacacggc gtccacctcg ctgagcggcg gcatcacggt ggccttcacc 900
aacgacggcg gcaaccgcga cgtccaggtg gattacatca tcgtgaatgg ccagacgcgc 960
cagtccgagg cgcagaccta caacaccggc ctgtatgcca atggccgctg cggtggtggc 1020
tctaacagcg agtggatgca ctgcaacggc gccatcggct acggcaacac gccctag 1077
<210> 182
<211> 358
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(25)
<400> 182
Met Asn Phe Ser Leu Arg Lys Ala Ala Ala Ala Leu Ala Cys Val Ala
1 5 10 15
Gly Leu Tyr Ala Ser Ser Ala Gly Ala Gln Thr Cys Leu Thr Asn Asn
20 25 30
Gln Thr Gly Asn Asn Gly Gly Tyr Tyr Tyr Ser Phe Trp Lys Asp Ser
35 40 45
Gly Asn Val Thr Phe Cys Leu Gln Ser Gly Gly Arg Tyr Thr Ser Gln
50 55 60
Trp Ser Asn Val Asn Asn Trp Val Gly Gly Lys Gly Trp Asn Pro Gly
65 70 75 80
Gly Arg Arg Thr Val Thr Tyr Ser Gly Thr Tyr Asn Pro Asn Gly Asn
85 90 95
Ser Tyr Leu Thr Leu Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr
100 105 110
Tyr Ile Val Asp Ser Trp Gly Ser Trp Arg Pro Pro Gly Ser Gly Tyr
115 120 125
Met Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Arg Thr
130 135 140
Gln Arg Val Asn Gln Pro Ser Ile Ile Gly Thr Ala Thr Phe Tyr Gln
145 150 155 160
Tyr Trp Ser Val Arg Gln Ser Lys Arg Val Gly Gly Thr Ile Thr Ser
165 170 175
Gly Asn His Phe Asp Ala Trp Ala Ser Leu Gly Met Asn Leu Gly Thr
180 185 190
His Asn Tyr Met Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser
195 200 205
Ser Asp Ile Thr Val Gly Ser Gly Ser Ser Ser Ser Ser Ser Ser Ser
210 215 220
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser
225 230 235 240
Ser Ser Ser Gly Gly Gly Gly Thr Lys Ser Phe Thr Val Arg Ala Arg
245 250 255
Gly Thr Ala Gly Gly Glu Ser Ile Thr Leu Arg Val Asn Asn Gln Asn
260 265 270
Val Gln Thr Trp Thr Leu Gly Thr Ser Met Gln Asn Tyr Thr Ala Ser
275 280 285
Thr Ser Leu Ser Gly Gly Ile Thr Val Ala Phe Thr Asn Asp Gly Gly
290 295 300
Asn Arg Asp Val Gln Val Asp Tyr Ile Ile Val Asn Gly Gln Thr Arg
305 310 315 320
Gln Ser Glu Ala Gln Thr Tyr Asn Thr Gly Leu Tyr Ala Asn Gly Arg
325 330 335
Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys Asn Gly Ala Ile
340 345 350
Gly Tyr Gly Asn Thr Pro
355
<210> 183
<211> 1083
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 183
atgatcgaag gtctcaggag acctgccttc agtggcagga gcatcgtcaa ggcattgctc 60
tgcgtcgcgg ccctgtatgc atcggcggcg caggcgcaga cctgtctcag ttcgagccag 120
accggcacca acaacggctt ctactattcg ttctggaagg acagcccggg cagcgtgcag 180
ttctgcatgt attccggcgg ccgctacaca tccaactgga gcggcatcaa caactgggtc 240
ggcggcaagg ggtggcagac cggcgcctcg cgcgtggtca gctactcggg cacgttcaat 300
tcaccgggca acggctacct ggcgctgtac ggctggacca ccaatccact ggtcgagtac 360
tacatcgtcg acaactgggg cacctatcgc ccgccgggcg gcacgggatt ccagggcacg 420
gtgaccagtg acggcggtac ctacgacatc taccggaccg agcgcaccaa cgcgccctgc 480
atcaccggca acaactgcaa cttctcgcag ttctggagcg tgcggcagtc gaagcgcacc 540
ggcggcacca tcaccaccgg caatcacttc agcgcctggg cgtcgcacgg catgaacatg 600
ggccagcaca actaccagat catggccacc gagggttacc agagcaacgg cagctcggac 660
atcacggtct cggaaggcag cagttcgtcg agcagcagca gttcgtcctc ttcgtcgagc 720
agcagctcgt cgagcggcgg cggcggcagc aagagcttca cggtgcgcgc ccgcggcacc 780
gcgggtggcg agcagatccg gctgcgcgtg aacaatacga ccgtgcagac ctggacgctg 840
aacaccacga tgacgaacta caccgcttcg accacgctga gcggcggcat cacggtggag 900
tacttcaacg acagcaccaa tcacgacgtg caggtggact acatcatcgt gaacggcgcg 960
acgcgccagt ccgaagcgca gagctacaac accggcctgt atgccaacgg ccgttgcggt 1020
ggcggttcca acagcgaatg gatgcattgc aatggcgcca tcggctacgg caacactcca 1080
taa 1083
<210> 184
<211> 360
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(32)
<400> 184
Met Ile Glu Gly Leu Arg Arg Pro Ala Phe Ser Gly Arg Ser Ile Val
1 5 10 15
Lys Ala Leu Leu Cys Val Ala Ala Leu Tyr Ala Ser Ala Ala Gln Ala
20 25 30
Gln Thr Cys Leu Ser Ser Ser Gln Thr Gly Thr Asn Asn Gly Phe Tyr
35 40 45
Tyr Ser Phe Trp Lys Asp Ser Pro Gly Ser Val Gln Phe Cys Met Tyr
50 55 60
Ser Gly Gly Arg Tyr Thr Ser Asn Trp Ser Gly Ile Asn Asn Trp Val
65 70 75 80
Gly Gly Lys Gly Trp Gln Thr Gly Ala Ser Arg Val Val Ser Tyr Ser
85 90 95
Gly Thr Phe Asn Ser Pro Gly Asn Gly Tyr Leu Ala Leu Tyr Gly Trp
100 105 110
Thr Thr Asn Pro Leu Val Glu Tyr Tyr Ile Val Asp Asn Trp Gly Thr
115 120 125
Tyr Arg Pro Pro Gly Gly Thr Gly Phe Gln Gly Thr Val Thr Ser Asp
130 135 140
Gly Gly Thr Tyr Asp Ile Tyr Arg Thr Glu Arg Thr Asn Ala Pro Cys
145 150 155 160
Ile Thr Gly Asn Asn Cys Asn Phe Ser Gln Phe Trp Ser Val Arg Gln
165 170 175
Ser Lys Arg Thr Gly Gly Thr Ile Thr Thr Gly Asn His Phe Ser Ala
180 185 190
Trp Ala Ser His Gly Met Asn Met Gly Gln His Asn Tyr Gln Ile Met
195 200 205
Ala Thr Glu Gly Tyr Gln Ser Asn Gly Ser Ser Asp Ile Thr Val Ser
210 215 220
Glu Gly Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser
225 230 235 240
Ser Ser Ser Ser Ser Gly Gly Gly Gly Ser Lys Ser Phe Thr Val Arg
245 250 255
Ala Arg Gly Thr Ala Gly Gly Glu Gln Ile Arg Leu Arg Val Asn Asn
260 265 270
Thr Thr Val Gln Thr Trp Thr Leu Asn Thr Thr Met Thr Asn Tyr Thr
275 280 285
Ala Ser Thr Thr Leu Ser Gly Gly Ile Thr Val Glu Tyr Phe Asn Asp
290 295 300
Ser Thr Asn His Asp Val Gln Val Asp Tyr Ile Ile Val Asn Gly Ala
305 310 315 320
Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly Leu Tyr Ala Asn
325 330 335
Gly Arg Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys Asn Gly
340 345 350
Ala Ile Gly Tyr Gly Asn Thr Pro
355 360
<210> 185
<211> 684
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 185
atgaatttga aaagattgag gctgttgttt gtgatgtgta ttggatttgt gctgacactg 60
acggctgtgc cagctcatgc ggaaacgatt tatgataata ggatagggac acacagcgga 120
tacgattttg aattatggaa ggattacgga aatacctcga tgacactcaa taacggcggg 180
gcatttagtg caagctggaa caatattgga aatgccttat ttcgaaaagg aaagaagttt 240
gattccacta aaactcatca tcaacttggc aacatctcca tcaactacaa cgcagccttt 300
aacccgggcg ggaattccta tttatgtgtc tatggctgga cacaatctcc attagctgaa 360
tactacattg ttgagtcatg gggcacatat cgtccaacag gaacgtataa aggatcattt 420
tatgccgatg gaggcacata tgacatatat gaaacgctcc gtgtcaatca gccttctatc 480
attggagacg ctaccttcaa acaatattgg agtgtacgtc aaacaaaacg cacaagcgga 540
actgtttccg tcagtgagca ttttaaaaaa tgggaaagct taggcatgcc aatgggaaaa 600
atgtatgaaa cagcattaac tgtagaaggc taccgaagca acggaagtgc gaatgtcatg 660
acgaatcagc tgatgattcg ataa 684
<210> 186
<211> 227
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(27)
<400> 186
Met Asn Leu Lys Arg Leu Arg Leu Leu Phe Val Met Cys Ile Gly Phe
1 5 10 15
Val Leu Thr Leu Thr Ala Val Pro Ala His Ala Glu Thr Ile Tyr Asp
20 25 30
Asn Arg Ile Gly Thr His Ser Gly Tyr Asp Phe Glu Leu Trp Lys Asp
35 40 45
Tyr Gly Asn Thr Ser Met Thr Leu Asn Asn Gly Gly Ala Phe Ser Ala
50 55 60
Ser Trp Asn Asn Ile Gly Asn Ala Leu Phe Arg Lys Gly Lys Lys Phe
65 70 75 80
Asp Ser Thr Lys Thr His His Gln Leu Gly Asn Ile Ser Ile Asn Tyr
85 90 95
Asn Ala Ala Phe Asn Pro Gly Gly Asn Ser Tyr Leu Cys Val Tyr Gly
100 105 110
Trp Thr Gln Ser Pro Leu Ala Glu Tyr Tyr Ile Val Glu Ser Trp Gly
115 120 125
Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Ser Phe Tyr Ala Asp Gly
130 135 140
Gly Thr Tyr Asp Ile Tyr Glu Thr Leu Arg Val Asn Gln Pro Ser Ile
145 150 155 160
Ile Gly Asp Ala Thr Phe Lys Gln Tyr Trp Ser Val Arg Gln Thr Lys
165 170 175
Arg Thr Ser Gly Thr Val Ser Val Ser Glu His Phe Lys Lys Trp Glu
180 185 190
Ser Leu Gly Met Pro Met Gly Lys Met Tyr Glu Thr Ala Leu Thr Val
195 200 205
Glu Gly Tyr Arg Ser Asn Gly Ser Ala Asn Val Met Thr Asn Gln Leu
210 215 220
Met Ile Arg
225
<210> 187
<211> 642
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 187
atgtttaagt ttaaaaagaa tttcttagtt ggattatcgg cagctttaat gagtattagc 60
ttgttttcgg caaccgcctc tgcagctagc acagactact ggcaaaattg gactgatggg 120
ggcggtatag taaacgctgt caatgggtct ggcgggaatt acagtgttaa ttggtctaat 180
accggaaatt ttgttgttgg taaaggttgg actacaggtt cgccatttag gacgataaac 240
tataatgccg gagtttgggc gccgaatggc aatggatatt taactttata tggttggacg 300
agatcacctc tcatagaata ttatgtagtg gattcatggg gtacttatag acctactgga 360
acgtataaag gtactgtaaa aagtgatggg ggtacatatg acatatatac aactacacgt 420
tataacgcac cttccattga tggcgatcgc actactttta cgcagtactg gagtgttcgc 480
cagtcgaaga gaccaaccgg aagcaacgct acaatcactt tcagcaatca tgtgaacgca 540
tggaagagcc atggaatgaa tctgggcagt aattgggctt accaagtcat ggcgacagaa 600
ggatatcaaa gtagtggaag ttctaacgta acagtgtggt aa 642
<210> 188
<211> 213
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(28)
<400> 188
Met Phe Lys Phe Lys Lys Asn Phe Leu Val Gly Leu Ser Ala Ala Leu
1 5 10 15
Met Ser Ile Ser Leu Phe Ser Ala Thr Ala Ser Ala Ala Ser Thr Asp
20 25 30
Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Ile Val Asn Ala Val Asn
35 40 45
Gly Ser Gly Gly Asn Tyr Ser Val Asn Trp Ser Asn Thr Gly Asn Phe
50 55 60
Val Val Gly Lys Gly Trp Thr Thr Gly Ser Pro Phe Arg Thr Ile Asn
65 70 75 80
Tyr Asn Ala Gly Val Trp Ala Pro Asn Gly Asn Gly Tyr Leu Thr Leu
85 90 95
Tyr Gly Trp Thr Arg Ser Pro Leu Ile Glu Tyr Tyr Val Val Asp Ser
100 105 110
Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Thr Val Lys Ser
115 120 125
Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr Arg Tyr Asn Ala Pro
130 135 140
Ser Ile Asp Gly Asp Arg Thr Thr Phe Thr Gln Tyr Trp Ser Val Arg
145 150 155 160
Gln Ser Lys Arg Pro Thr Gly Ser Asn Ala Thr Ile Thr Phe Ser Asn
165 170 175
His Val Asn Ala Trp Lys Ser His Gly Met Asn Leu Gly Ser Asn Trp
180 185 190
Ala Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser Ser
195 200 205
Asn Val Thr Val Trp
210
<210> 189
<211> 570
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 189
atggccctta tggcttcgac agactactgg caaaattgga ctgatggtgg tgggacagta 60
aatgctacca atggatctga tggcaattac agcgtttcat ggtcaaattg cgggaatttt 120
gttgttggta aaggctggac taccggatca gcaactaggg taataaacta taatgccgga 180
gccttttcgc cgtccggtaa tggatatttg gctctttatg ggtggacgag aaattcactc 240
atagaatatt acgtcgttga tagctggggg acttatagac ctactggaac ttataaaggc 300
actgtgacta gtgatggagg gacttatgac atatacacga ctacacgaac caacgcacct 360
tccattgacg gcaataatac aactttcacc cagttctgga gtgttaggca gtcgaagaga 420
ccgattggta ccaacaatac catcaccttt agcaaccatg ttaacgcctg gaagagtaaa 480
ggaatgaatt tggggagtag ttggtcttat caggtattag caacagaggg ctatcaaagt 540
agtgggtact ctaacgtaac ggtctggtaa 570
<210> 190
<211> 189
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 190
Met Ala Leu Met Ala Ser Thr Asp Tyr Trp Gln Asn Trp Thr Asp Gly
1 5 10 15
Gly Gly Thr Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val
20 25 30
Ser Trp Ser Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr
35 40 45
Gly Ser Ala Thr Arg Val Ile Asn Tyr Asn Ala Gly Ala Phe Ser Pro
50 55 60
Ser Gly Asn Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu
65 70 75 80
Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly
85 90 95
Thr Tyr Lys Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr
100 105 110
Thr Thr Thr Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr
115 120 125
Phe Thr Gln Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr
130 135 140
Asn Asn Thr Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys
145 150 155 160
Gly Met Asn Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu
165 170 175
Gly Tyr Gln Ser Ser Gly Tyr Ser Asn Val Thr Val Trp
180 185
<210> 191
<211> 1053
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 191
atgaagtcca ttcgcagccg cagcctcgcc accgccgtcc tggctggcgc cctcggcgtc 60
gcagccgccg gcgcgcaggc gcagacgctc aacaacaatt ccaccggcac gcacgacggc 120
ttctactaca cgttctggaa ggactcgggc agcgcctcga tgaccctcca tccgggcgga 180
cgctacagct cccagtggac cagcaacacc aacaactggg tcggcgggaa aggctggaat 240
cccggtggcc cgcgcgtggt caactactcg ggctactacg gggtcaacaa cagccagaac 300
tcctacctgg cgctgtacgg ctggacccgc aatccgctgg tcgagtacta cgtgatcgag 360
agctacggct cctacaaccc ggccagttgc gccggcgggg tggactacgg cagcttccag 420
agcgatggcg ccacctacaa cgtacgccgc tgcctgcgcc agaacgcgcc gtcgatcgaa 480
ggcaacaaca gcaccttcta ccagtacttc agcgtgcgca atcccaagaa gggattcggc 540
aacatctccg gcacgatcac cgtcgccaac cacttcaact actgggccag ccgcggcctc 600
aacctcggca accacgacta catggtgttc gccaccgagg gctaccagag ccagggcagc 660
agcgacatca ccgtgagttc gggtaccggc ggcggcggtg gcggcggcaa cacgggcagc 720
aagaccatcg tggtgcgcgc gcgcggcacc gccggcggag agaacatctc gctcaaggtc 780
aacaacgcca ccatcgccag ctggacgctc accaccagca tggccaacta cacggccacc 840
acctcggcat cgggcggctc gctggtggag ttcaccaacg acggcggcaa ccgcgacgtg 900
caggtggact acctcagcgt caatggcgcc gtccgccagg ccgaggacca gacctacaac 960
accggcgtgt accagaacgg ccagtgcggc ggcggcaacg gccgcagcga atggctgcac 1020
tgcaacggtg ccatcggctt cggaaatctc tga 1053
<210> 192
<211> 350
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(27)
<400> 192
Met Lys Ser Ile Arg Ser Arg Ser Leu Ala Thr Ala Val Leu Ala Gly
1 5 10 15
Ala Leu Gly Val Ala Ala Ala Gly Ala Gln Ala Gln Thr Leu Asn Asn
20 25 30
Asn Ser Thr Gly Thr His Asp Gly Phe Tyr Tyr Thr Phe Trp Lys Asp
35 40 45
Ser Gly Ser Ala Ser Met Thr Leu His Pro Gly Gly Arg Tyr Ser Ser
50 55 60
Gln Trp Thr Ser Asn Thr Asn Asn Trp Val Gly Gly Lys Gly Trp Asn
65 70 75 80
Pro Gly Gly Pro Arg Val Val Asn Tyr Ser Gly Tyr Tyr Gly Val Asn
85 90 95
Asn Ser Gln Asn Ser Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Pro
100 105 110
Leu Val Glu Tyr Tyr Val Ile Glu Ser Tyr Gly Ser Tyr Asn Pro Ala
115 120 125
Ser Cys Ala Gly Gly Val Asp Tyr Gly Ser Phe Gln Ser Asp Gly Ala
130 135 140
Thr Tyr Asn Val Arg Arg Cys Leu Arg Gln Asn Ala Pro Ser Ile Glu
145 150 155 160
Gly Asn Asn Ser Thr Phe Tyr Gln Tyr Phe Ser Val Arg Asn Pro Lys
165 170 175
Lys Gly Phe Gly Asn Ile Ser Gly Thr Ile Thr Val Ala Asn His Phe
180 185 190
Asn Tyr Trp Ala Ser Arg Gly Leu Asn Leu Gly Asn His Asp Tyr Met
195 200 205
Val Phe Ala Thr Glu Gly Tyr Gln Ser Gln Gly Ser Ser Asp Ile Thr
210 215 220
Val Ser Ser Gly Thr Gly Gly Gly Gly Gly Gly Gly Asn Thr Gly Ser
225 230 235 240
Lys Thr Ile Val Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Asn Ile
245 250 255
Ser Leu Lys Val Asn Asn Ala Thr Ile Ala Ser Trp Thr Leu Thr Thr
260 265 270
Ser Met Ala Asn Tyr Thr Ala Thr Thr Ser Ala Ser Gly Gly Ser Leu
275 280 285
Val Glu Phe Thr Asn Asp Gly Gly Asn Arg Asp Val Gln Val Asp Tyr
290 295 300
Leu Ser Val Asn Gly Ala Val Arg Gln Ala Glu Asp Gln Thr Tyr Asn
305 310 315 320
Thr Gly Val Tyr Gln Asn Gly Gln Cys Gly Gly Gly Asn Gly Arg Ser
325 330 335
Glu Trp Leu His Cys Asn Gly Ala Ile Gly Phe Gly Asn Leu
340 345 350
<210> 193
<211> 840
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 193
atgacgaagt atcggttagg aataggtatt ttcattttgt tggtttgttg cttttcggcg 60
gcatgtattg tgcctaaaca acaagaggaa caaaaagtgg ctcctacaga attgaccggc 120
gcgataacat tcacagccaa cagcaacgga aacaagcccc tgaacggctc gccctacggt 180
tacgaaatat ggacacaggg cgggaccaat aacaaactga tctggttcgg gccggatcag 240
ggcggcggcg cggctttcag agccgaatgg aacaacccta acgatttttt aggccgcgtg 300
ggtttttact ggggtaatgg cggaaaatat accgagtaca aaaatatgta tgcggatttt 360
agctacacta gatctggacg caacaccgcc ggtaattatt catatatagg gatttatggc 420
tgggctagaa atccaaatgc cgcaaaagaa gaagacaaat tgatagagta ttatattgtg 480
gaagattggt ttggcaatca atggcaagag gatagctcac ccattaccac taatacaaca 540
agtggaaccg tattgggaag ttttactata gatggcgcgg tttataatgt cgttagaaat 600
gtcagagtcc aacaaccttc gatagacgga accaaaacat tcacccaata cttcagcata 660
cgacaaacgc cccgacagag cgggacaatt tccattaccg ggcatttcag gcaatgggag 720
agcatgggtt tacagcttgg caatatgtac gaggcaaagt ttcttgttga agccggcggc 780
ggcacaggat ggctggaatt ttcatacctt aaattaacga tggaagacag cttaaggtaa 840
<210> 194
<211> 279
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(21)
<400> 194
Met Thr Lys Tyr Arg Leu Gly Ile Gly Ile Phe Ile Leu Leu Val Cys
1 5 10 15
Cys Phe Ser Ala Ala Cys Ile Val Pro Lys Gln Gln Glu Glu Gln Lys
20 25 30
Val Ala Pro Thr Glu Leu Thr Gly Ala Ile Thr Phe Thr Ala Asn Ser
35 40 45
Asn Gly Asn Lys Pro Leu Asn Gly Ser Pro Tyr Gly Tyr Glu Ile Trp
50 55 60
Thr Gln Gly Gly Thr Asn Asn Lys Leu Ile Trp Phe Gly Pro Asp Gln
65 70 75 80
Gly Gly Gly Ala Ala Phe Arg Ala Glu Trp Asn Asn Pro Asn Asp Phe
85 90 95
Leu Gly Arg Val Gly Phe Tyr Trp Gly Asn Gly Gly Lys Tyr Thr Glu
100 105 110
Tyr Lys Asn Met Tyr Ala Asp Phe Ser Tyr Thr Arg Ser Gly Arg Asn
115 120 125
Thr Ala Gly Asn Tyr Ser Tyr Ile Gly Ile Tyr Gly Trp Ala Arg Asn
130 135 140
Pro Asn Ala Ala Lys Glu Glu Asp Lys Leu Ile Glu Tyr Tyr Ile Val
145 150 155 160
Glu Asp Trp Phe Gly Asn Gln Trp Gln Glu Asp Ser Ser Pro Ile Thr
165 170 175
Thr Asn Thr Thr Ser Gly Thr Val Leu Gly Ser Phe Thr Ile Asp Gly
180 185 190
Ala Val Tyr Asn Val Val Arg Asn Val Arg Val Gln Gln Pro Ser Ile
195 200 205
Asp Gly Thr Lys Thr Phe Thr Gln Tyr Phe Ser Ile Arg Gln Thr Pro
210 215 220
Arg Gln Ser Gly Thr Ile Ser Ile Thr Gly His Phe Arg Gln Trp Glu
225 230 235 240
Ser Met Gly Leu Gln Leu Gly Asn Met Tyr Glu Ala Lys Phe Leu Val
245 250 255
Glu Ala Gly Gly Gly Thr Gly Trp Leu Glu Phe Ser Tyr Leu Lys Leu
260 265 270
Thr Met Glu Asp Ser Leu Arg
275
<210> 195
<211> 1044
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 195
atgttcaatc tgaagagagt ggcggcgctc ctgtgcgtcg cagggctggg ggtgtctgcg 60
gcaaatgcgc agacctgtct caattcgagt gggaccggca ccaacaacgg cttctattat 120
tccttctgga aagacagtcc gggttcagtg aatttctgca tgtactccgg cggtcgctac 180
acgtcgagct ggagcggcat caacaactgg gtcggcggca agggctggca aaccggatcg 240
cgccggacca tcaactactc cggcagcttc aactcgccgg gcaatggcta cctcgcgctc 300
tacggatgga ccaccaatcc actcgtcgag tactacatcg tcgacaactg gggcacgtat 360
cgtccgcccg gcggccaggg ctacatgggc acggtcacga gcgacggcgc cacgtacgac 420
gtctatcgaa cgcaacgagt cgatgcgccg tcgatcattg gtgatcacca gaccttctat 480
caatactgga gcgtgcgtca gtcgaagagg accggcggaa ccatcaccac cggcaaccac 540
ttcgatggct gggcgagcta cggcatgaac ctgggaactc acaactacca gatcctggcg 600
accgagggtt atcaaagcag cggcagctcg gacctcaccg tgagcgaagg cagcagcagt 660
agcagcagcg gtggcgggag cagttcgagc agcagcggcg gcggtggcac caagagcttc 720
acggtccgcg cgcgcggcac ggccggtgga gagtcgatca cgttgcgcgt gaataaccag 780
aacgtgcaga cctggacgct cggcacgagc atgacgaact acacggcgtc gacgtcgctg 840
agcggcggca tcaccgtggc gttcacgaac gacggtggca accgcgatgt tcaggtggac 900
tacatcatcg tgaacggcca gacacgccag tcggaagcgc agagctacaa caccgggctc 960
tacgcgaatg gacgttgcgg cggtggctcg aacagcgagt ggatgcactg caacggcgcg 1020
attggctacg gaaacacgcc gtaa 1044
<210> 196
<211> 347
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(23)
<400> 196
Met Phe Asn Leu Lys Arg Val Ala Ala Leu Leu Cys Val Ala Gly Leu
1 5 10 15
Gly Val Ser Ala Ala Asn Ala Gln Thr Cys Leu Asn Ser Ser Gly Thr
20 25 30
Gly Thr Asn Asn Gly Phe Tyr Tyr Ser Phe Trp Lys Asp Ser Pro Gly
35 40 45
Ser Val Asn Phe Cys Met Tyr Ser Gly Gly Arg Tyr Thr Ser Ser Trp
50 55 60
Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly Ser
65 70 75 80
Arg Arg Thr Ile Asn Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn Gly
85 90 95
Tyr Leu Ala Leu Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr Tyr
100 105 110
Ile Val Asp Asn Trp Gly Thr Tyr Arg Pro Pro Gly Gly Gln Gly Tyr
115 120 125
Met Gly Thr Val Thr Ser Asp Gly Ala Thr Tyr Asp Val Tyr Arg Thr
130 135 140
Gln Arg Val Asp Ala Pro Ser Ile Ile Gly Asp His Gln Thr Phe Tyr
145 150 155 160
Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Thr Gly Gly Thr Ile Thr
165 170 175
Thr Gly Asn His Phe Asp Gly Trp Ala Ser Tyr Gly Met Asn Leu Gly
180 185 190
Thr His Asn Tyr Gln Ile Leu Ala Thr Glu Gly Tyr Gln Ser Ser Gly
195 200 205
Ser Ser Asp Leu Thr Val Ser Glu Gly Ser Ser Ser Ser Ser Ser Gly
210 215 220
Gly Gly Ser Ser Ser Ser Ser Ser Gly Gly Gly Gly Thr Lys Ser Phe
225 230 235 240
Thr Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Ser Ile Thr Leu Arg
245 250 255
Val Asn Asn Gln Asn Val Gln Thr Trp Thr Leu Gly Thr Ser Met Thr
260 265 270
Asn Tyr Thr Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val Ala Phe
275 280 285
Thr Asn Asp Gly Gly Asn Arg Asp Val Gln Val Asp Tyr Ile Ile Val
290 295 300
Asn Gly Gln Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly Leu
305 310 315 320
Tyr Ala Asn Gly Arg Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His
325 330 335
Cys Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro
340 345
<210> 197
<211> 636
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 197
atgtttaagt tcagtaagaa aatgatgacg gttattcttg cagctaccat gagttttggt 60
ttatttgcaa caacctcaag tgcagcaacc gactattggc aaaattggac cgatggcggc 120
ggaacggtta atgctgtaaa cggctccggc ggtaattaca gcgtgacatg gcaaaatacc 180
ggaaattttg tcgtcggcaa aggctggaat accggatcgc ctaaccgaac cattaactac 240
aatgccggcg tctgggcgcc ttccggcaat gggtatttga ctctctacgg atggacgaga 300
aacgcactca ttgaatatta cgtcgtggat agctggggta cttatcggcc tacaggaaca 360
tataaaggga cggtgacaag tgatgggggc acatatgata tctatacgac catgcggcac 420
aacgcgcctt ccattgacgg aactcaaacg tttgcccagt actggagtgt tcgacaatcg 480
aaaagagcga ccggggtcaa ctcctccatt acgttcagca accacgtgaa cgcatgggct 540
agcaagggaa tgaatctggg aagcagctgg tcatatcagg tgttagctac agagggttat 600
caaagtagcg gaagctctaa cgtaacagtg tggtaa 636
<210> 198
<211> 211
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(28)
<400> 198
Met Phe Lys Phe Ser Lys Lys Met Met Thr Val Ile Leu Ala Ala Thr
1 5 10 15
Met Ser Phe Gly Leu Phe Ala Thr Thr Ser Ser Ala Ala Thr Asp Tyr
20 25 30
Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr Val Asn Ala Val Asn Gly
35 40 45
Ser Gly Gly Asn Tyr Ser Val Thr Trp Gln Asn Thr Gly Asn Phe Val
50 55 60
Val Gly Lys Gly Trp Asn Thr Gly Ser Pro Asn Arg Thr Ile Asn Tyr
65 70 75 80
Asn Ala Gly Val Trp Ala Pro Ser Gly Asn Gly Tyr Leu Thr Leu Tyr
85 90 95
Gly Trp Thr Arg Asn Ala Leu Ile Glu Tyr Tyr Val Val Asp Ser Trp
100 105 110
Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Thr Val Thr Ser Asp
115 120 125
Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Met Arg His Asn Ala Pro Ser
130 135 140
Ile Asp Gly Thr Gln Thr Phe Ala Gln Tyr Trp Ser Val Arg Gln Ser
145 150 155 160
Lys Arg Ala Thr Gly Val Asn Ser Ser Ile Thr Phe Ser Asn His Val
165 170 175
Asn Ala Trp Ala Ser Lys Gly Met Asn Leu Gly Ser Ser Trp Ser Tyr
180 185 190
Gln Val Leu Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser Ser Asn Val
195 200 205
Thr Val Trp
210
<210> 199
<211> 1074
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 199
atgattttcg gtctaaagtc gatcacgggc aggcgcgccg tcgcggcgct ggcctgcctt 60
gccggcctct acatggcgcc ggcgaatgcg caaacctgca tcacgtcgag ccagacgggc 120
accaacaacg gcaactactt ttcgttctgg aaagacagcc cgggcacggt gaacttctgc 180
atgtactccg gcggccgcta cacgtccaac tggagcggca tcaacaactg ggtgggcggc 240
aagggctggc agacgggctc gtcccgcacc gtctcctact ccggcagctt caattcgccg 300
ggtaacggct acctgacgct ctacggctgg accaccaatc cgctcatcga gtactacatc 360
gtcgacaact ggggcagcta tcgtccgccg ggtggccagg gcttcatggg cacggtgaac 420
accgacggcg gcacgtacga catctatcgc acgcaacggg tcaaccagcc gtcgatcatc 480
ggcaccgcga cgttctacca gtactggagc gtgcggcagt cgaagcgcac cggcggcacc 540
atcaccacgg ccaaccactt caatgcctgg gccagcctcg gcatgaacct gggacagcac 600
aactaccagg tgatggccac cgagggctac cagagcagcg gcagctccga catcacggtg 660
tgggaaggca cgagcagcgg cggaagcagc aatggcggca gcagcaacgg cggcagcagc 720
aatggtggca gcggcggcac gaagagcttc acggtgcgcg cgcgcggcac tgcgggcggc 780
gagtccatca cgctgcgggt caacaaccag aacgtgcaga cctggacgct gggtaccagc 840
atgcagaact acacggcctc gacctcgctg agcggcggca tcacggtggc gttcaccaac 900
gacggcggca gccgcgacgt gcaggtggac tacatcatcg tgaatggcca gacccgccag 960
tccgaacagc agagctacaa cactggcctc tacgccaatg gaagctgtgg tggcggttcg 1020
aacagcgagt ggatgcattg caacggcgcc atcggctacg gcaatacgcc ctga 1074
<210> 200
<211> 354
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(30)
<400> 200
Met Ile Phe Gly Leu Lys Ser Ile Thr Gly Arg Arg Ala Val Ala Ala
1 5 10 15
Leu Ala Cys Leu Ala Gly Leu Tyr Met Ala Pro Ala Asn Ala Gln Thr
20 25 30
Cys Ile Thr Ser Ser Gln Thr Gly Thr Asn Asn Gly Asn Tyr Phe Ser
35 40 45
Phe Trp Lys Asp Ser Pro Gly Thr Val Asn Phe Cys Met Tyr Ser Gly
50 55 60
Gly Arg Tyr Thr Ser Asn Trp Ser Gly Ile Asn Asn Trp Val Gly Gly
65 70 75 80
Lys Gly Trp Gln Thr Gly Ser Ser Arg Thr Val Ser Tyr Ser Gly Ser
85 90 95
Phe Asn Ser Pro Gly Asn Gly Tyr Leu Thr Leu Tyr Gly Trp Thr Thr
100 105 110
Asn Pro Leu Ile Glu Tyr Tyr Ile Val Asp Asn Trp Gly Ser Tyr Arg
115 120 125
Pro Pro Gly Gly Gln Gly Phe Met Gly Thr Val Asn Thr Asp Gly Gly
130 135 140
Thr Tyr Asp Ile Tyr Arg Thr Gln Arg Val Asn Gln Pro Ser Ile Ile
145 150 155 160
Gly Thr Ala Thr Phe Tyr Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg
165 170 175
Thr Gly Gly Thr Ile Thr Thr Ala Asn His Phe Asn Ala Trp Ala Ser
180 185 190
Leu Gly Met Asn Leu Gly Gln His Asn Tyr Gln Val Met Ala Thr Glu
195 200 205
Gly Tyr Gln Ser Ser Gly Ser Ser Asp Ile Thr Val Trp Glu Gly Thr
210 215 220
Ser Ser Gly Gly Ser Ser Asn Gly Gly Ser Ser Asn Gly Gly Ser Ser
225 230 235 240
Asn Gly Gly Ser Gly Gly Thr Lys Ser Phe Thr Val Arg Ala Arg Gly
245 250 255
Thr Ala Gly Gly Glu Ser Ile Thr Leu Arg Val Asn Asn Gln Asn Val
260 265 270
Gln Thr Trp Thr Leu Gly Thr Ser Met Gln Asn Tyr Thr Ala Ser Thr
275 280 285
Ser Leu Ser Gly Gly Ile Thr Val Ala Phe Thr Asn Asp Gly Gly Ser
290 295 300
Arg Asp Val Gln Val Asp Tyr Ile Ile Val Asn Gly Gln Thr Arg Gln
305 310 315 320
Ser Glu Gln Gln Ser Tyr Asn Thr Gly Leu Tyr Ala Asn Gly Ser Cys
325 330 335
Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys Asn Gly Ala Ile Gly
340 345 350
Tyr Gly
<210> 201
<211> 1002
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 201
atgaagatga acagctccct cccctccctc cgcgatgtat tcgcgaatga tttccgcatc 60
ggggcggcgg tcaatcctgt gacgatcgag atgcaaaaac agttgttgat cgatcatgtc 120
aacagtatta cggcagagaa ccatatgaag tttgagcatc ttcagccgga agaagggaaa 180
tttacctttc aggaagcgga tcggattgtg gattttgctt gttcgcaccg aatggcggtt 240
cgagggcaca cacttgtatg gcacaaccag actccggatt gggtgtttca agatggtcaa 300
ggccatttcg tcagtcggga tgtgttgctt gagcggatga aatgtcacat ttcaactgtt 360
gtacggcgat acaagggaaa aatatattgt tgggatgtca tcaacgaagc ggtagccgac 420
gaaggagacg aattgttgag gccgtcgaag tggcgacaaa tcatcgggga cgattttatg 480
gaacaagcat ttctctacgc ttatgaagct gacccagatg cactgctttt ttacaatgac 540
tataatgaat gttttccgga aaagagagaa aaaatttttg cacttgtcaa atcgctgcgt 600
gataaaggca ttccgattca tggcatcggc atgcaggcgc actggagcct gacccgcccg 660
tcgcttgatg aaattcgtgc ggcgattgaa cggtatgcgt cccttggtgt tgttcttcat 720
attacggaac tcgatgtatc catgtttgaa tttcacgatc gtcgaaccga tttggctgtc 780
ccgacgaacg aaatgatcga acagcaagca gaacggtatg ggcaaatttt tgctttgttt 840
aaggagtatc gcgatgttat tcaaagtgtc acattttggg gaattgctga tgaccataca 900
tggctcgata actttccagt gcacgggaga aaaaactggc cgcttttgtt cgatgaacag 960
cataaaccga aaccagcttt ttggcgggca gtgagtgtct ga 1002
<210> 202
<211> 333
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 202
Met Lys Met Asn Ser Ser Leu Pro Ser Leu Arg Asp Val Phe Ala Asn
1 5 10 15
Asp Phe Arg Ile Gly Ala Ala Val Asn Pro Val Thr Ile Glu Met Gln
20 25 30
Lys Gln Leu Leu Ile Asp His Val Asn Ser Ile Thr Ala Glu Asn His
35 40 45
Met Lys Phe Glu His Leu Gln Pro Glu Glu Gly Lys Phe Thr Phe Gln
50 55 60
Glu Ala Asp Arg Ile Val Asp Phe Ala Cys Ser His Arg Met Ala Val
65 70 75 80
Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro Asp Trp Val Phe
85 90 95
Gln Asp Gly Gln Gly His Phe Val Ser Arg Asp Val Leu Leu Glu Arg
100 105 110
Met Lys Cys His Ile Ser Thr Val Val Arg Arg Tyr Lys Gly Lys Ile
115 120 125
Tyr Cys Trp Asp Val Ile Asn Glu Ala Val Ala Asp Glu Gly Asp Glu
130 135 140
Leu Leu Arg Pro Ser Lys Trp Arg Gln Ile Ile Gly Asp Asp Phe Met
145 150 155 160
Glu Gln Ala Phe Leu Tyr Ala Tyr Glu Ala Asp Pro Asp Ala Leu Leu
165 170 175
Phe Tyr Asn Asp Tyr Asn Glu Cys Phe Pro Glu Lys Arg Glu Lys Ile
180 185 190
Phe Ala Leu Val Lys Ser Leu Arg Asp Lys Gly Ile Pro Ile His Gly
195 200 205
Ile Gly Met Gln Ala His Trp Ser Leu Thr Arg Pro Ser Leu Asp Glu
210 215 220
Ile Arg Ala Ala Ile Glu Arg Tyr Ala Ser Leu Gly Val Val Leu His
225 230 235 240
Ile Thr Glu Leu Asp Val Ser Met Phe Glu Phe His Asp Arg Arg Thr
245 250 255
Asp Leu Ala Val Pro Thr Asn Glu Met Ile Glu Gln Gln Ala Glu Arg
260 265 270
Tyr Gly Gln Ile Phe Ala Leu Phe Lys Glu Tyr Arg Asp Val Ile Gln
275 280 285
Ser Val Thr Phe Trp Gly Ile Ala Asp Asp His Thr Trp Leu Asp Asn
290 295 300
Phe Pro Val His Gly Arg Lys Asn Trp Pro Leu Leu Phe Asp Glu Gln
305 310 315 320
His Lys Pro Lys Pro Ala Phe Trp Arg Ala Val Ser Val
325 330
<210> 203
<211> 687
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 203
atgaaatctg cacgcgcact tttggtggcg ctatcacgca tacttccgat cgcacttgtg 60
ctgttgctcg cccccgtccc cgcgcaagcc caacaggtct gcaacaacgg aacgggcacg 120
cataacggct tcttctggac gttttggaag gacggcggca cggcctgcat gacgctcggc 180
tcgggcggca attatagcac gacgttcaat ctgtccggcg gccgcaacct tgttgcgggc 240
aagggctggc agactggctc caccaaccga gtcgtcggtt acaatgcggg cgtctggaac 300
ccaggcacca attcttatct gacgctctat ggctggtcga cgaatccgct cgtcgaatat 360
tatgtcgtgg accattgggg cagccaattc accccgccag gcaacggcgc gcagagcatg 420
gggaccgtga ccaccgacgg cggcacctac aacatctacc gcacccaacg cgtcaacgcg 480
ccttcgatca tcggcaacgc cacgttctac caatattgga gcgtgcgcac ttcgcgccgc 540
gggcaaggca cgaacaacac gatcaccttc gccaatcacg tcaacgcttg gcgcagccgc 600
ggcatgaacc ttgggaccat gaattatcaa gtcatggcca cggaaggttt cggctcgaac 660
ggaagctcca acctcacagt atggtag 687
<210> 204
<211> 228
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(30)
<400> 204
Met Lys Ser Ala Arg Ala Leu Leu Val Ala Leu Ser Arg Ile Leu Pro
1 5 10 15
Ile Ala Leu Val Leu Leu Leu Ala Pro Val Pro Ala Gln Ala Gln Gln
20 25 30
Val Cys Asn Asn Gly Thr Gly Thr His Asn Gly Phe Phe Trp Thr Phe
35 40 45
Trp Lys Asp Gly Gly Thr Ala Cys Met Thr Leu Gly Ser Gly Gly Asn
50 55 60
Tyr Ser Thr Thr Phe Asn Leu Ser Gly Gly Arg Asn Leu Val Ala Gly
65 70 75 80
Lys Gly Trp Gln Thr Gly Ser Thr Asn Arg Val Val Gly Tyr Asn Ala
85 90 95
Gly Val Trp Asn Pro Gly Thr Asn Ser Tyr Leu Thr Leu Tyr Gly Trp
100 105 110
Ser Thr Asn Pro Leu Val Glu Tyr Tyr Val Val Asp His Trp Gly Ser
115 120 125
Gln Phe Thr Pro Pro Gly Asn Gly Ala Gln Ser Met Gly Thr Val Thr
130 135 140
Thr Asp Gly Gly Thr Tyr Asn Ile Tyr Arg Thr Gln Arg Val Asn Ala
145 150 155 160
Pro Ser Ile Ile Gly Asn Ala Thr Phe Tyr Gln Tyr Trp Ser Val Arg
165 170 175
Thr Ser Arg Arg Gly Gln Gly Thr Asn Asn Thr Ile Thr Phe Ala Asn
180 185 190
His Val Asn Ala Trp Arg Ser Arg Gly Met Asn Leu Gly Thr Met Asn
195 200 205
Tyr Gln Val Met Ala Thr Glu Gly Phe Gly Ser Asn Gly Ser Ser Asn
210 215 220
Leu Thr Val Trp
225
<210> 205
<211> 1068
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 205
atgcaaattt tcaaatcacc actgtcatgg gccggatcac tattactgat cctgtccacc 60
gccctgtttt caacagcggc cactgcccag gaatactgct ccaaccagac cggtacacac 120
agcggttttt actttaccca ttggtctgac ggcggcggta ctgcctgcat tactctggga 180
gacgacggaa attacagtta cacctggtcc aacacaggca attttgtcgg tggcaagggc 240
tggagtaccg gcacctccaa tcgggtgatc ggttacaacg ccggagacta ctcgccctcc 300
ggcaactcct acctggcgct gtatggctgg agcaccaatc cactgattga gtactacgtg 360
gtggatagct ggggtagctg gcgtccgccg ggtggcacct cggtaggtac agtcaccagc 420
gatggcggga cttacgacct gtaccgcacc gagcgcgtgc agcagccctc catcgaaggc 480
acggccacct tctatcaata ttggagcgtg cgcacctcac agcgtcccca ggggcagaac 540
aacaccatca cctttcagaa ccacgtggat gcctgggcca atcagggctg gaacctcggc 600
acccacaact atcaggtaat ggcgaccgaa ggctacgaaa gcagcggcag ctccaacgtc 660
acggtttggg attccggcac cagtagcggt aacggtggca acgctggcgg cggtggtggc 720
gaggcaggta acggctccaa ctcactggtc gtgcgtgcgg tgggcacttc gggcaacgaa 780
cagttgcgcg tcaacgtcag cggcaacacg gttgaaaccc tgaacctgtc taccaactgg 840
caggactaca ccatcaacac caacgcttcc ggcgatgtga atgtggagtt gatcaacgat 900
cagggcgagg gctacgaagc ccgggtggaa tacgtcatcg tcaacggcga tacccgctac 960
ggcgctgatc agagctacaa caccagcgcc tgggacggcg agtgcggcgg cggttccttt 1020
accatgtgga tgcactgcga aggcatcctc ggttttggcg atatgtaa 1068
<210> 206
<211> 355
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(29)
<400> 206
Met Gln Ile Phe Lys Ser Pro Leu Ser Trp Ala Gly Ser Leu Leu Leu
1 5 10 15
Ile Leu Ser Thr Ala Leu Phe Ser Thr Ala Ala Thr Ala Gln Glu Tyr
20 25 30
Cys Ser Asn Gln Thr Gly Thr His Ser Gly Phe Tyr Phe Thr His Trp
35 40 45
Ser Asp Gly Gly Gly Thr Ala Cys Ile Thr Leu Gly Asp Asp Gly Asn
50 55 60
Tyr Ser Tyr Thr Trp Ser Asn Thr Gly Asn Phe Val Gly Gly Lys Gly
65 70 75 80
Trp Ser Thr Gly Thr Ser Asn Arg Val Ile Gly Tyr Asn Ala Gly Asp
85 90 95
Tyr Ser Pro Ser Gly Asn Ser Tyr Leu Ala Leu Tyr Gly Trp Ser Thr
100 105 110
Asn Pro Leu Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Ser Trp Arg
115 120 125
Pro Pro Gly Gly Thr Ser Val Gly Thr Val Thr Ser Asp Gly Gly Thr
130 135 140
Tyr Asp Leu Tyr Arg Thr Glu Arg Val Gln Gln Pro Ser Ile Glu Gly
145 150 155 160
Thr Ala Thr Phe Tyr Gln Tyr Trp Ser Val Arg Thr Ser Gln Arg Pro
165 170 175
Gln Gly Gln Asn Asn Thr Ile Thr Phe Gln Asn His Val Asp Ala Trp
180 185 190
Ala Asn Gln Gly Trp Asn Leu Gly Thr His Asn Tyr Gln Val Met Ala
195 200 205
Thr Glu Gly Tyr Glu Ser Ser Gly Ser Ser Asn Val Thr Val Trp Asp
210 215 220
Ser Gly Thr Ser Ser Gly Asn Gly Gly Asn Ala Gly Gly Gly Gly Gly
225 230 235 240
Glu Ala Gly Asn Gly Ser Asn Ser Leu Val Val Arg Ala Val Gly Thr
245 250 255
Ser Gly Asn Glu Gln Leu Arg Val Asn Val Ser Gly Asn Thr Val Glu
260 265 270
Thr Leu Asn Leu Ser Thr Asn Trp Gln Asp Tyr Thr Ile Asn Thr Asn
275 280 285
Ala Ser Gly Asp Val Asn Val Glu Leu Ile Asn Asp Gln Gly Glu Gly
290 295 300
Tyr Glu Ala Arg Val Glu Tyr Val Ile Val Asn Gly Asp Thr Arg Tyr
305 310 315 320
Gly Ala Asp Gln Ser Tyr Asn Thr Ser Ala Trp Asp Gly Glu Cys Gly
325 330 335
Gly Gly Ser Phe Thr Met Trp Met His Cys Glu Gly Ile Leu Gly Phe
340 345 350
Gly Asp Met
355
<210> 207
<211> 633
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 207
atgaaattaa aaaagaagat gctcacttta ctcctgacgg cttcgatgag tttcggttta 60
tttggggcaa cctcgagtgc agcaacggat tattggcaat attggacgga tggcggcgga 120
acggtgaatg cggttaacgg gtccgggggc aattacagcg taacttggca aaatagcggg 180
aacttcgtgg tcggcaaagg ctggagcgta gggtcgccaa atcggacgat caattacaat 240
gccggcatct gggaaccttc ggggaacggg tacttgaccc tttacggatg gactagaaac 300
tcgctgatcg agtattacgt tgtcgacagt tgggggacgt accggccaac aggtactcac 360
aaaggaacgg tgaacagcga cggaggcacc tacgatattt atacgaccat gcgctataat 420
gcgccttcca ttgatggcac gcagacgttc caacagttct ggagcgtgcg gcaatcgaaa 480
cgaccaaccg gcagcaacgt ctccatcacc ttcagcaatc acgtgaatgc ctggagaagc 540
aagggcatga acctgggcag cagctggtcg taccaggtct tggcgacgga aggctatcag 600
agcagcggaa gatccaacgt cacggtgtgg taa 633
<210> 208
<211> 210
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(27)
<400> 208
Met Lys Leu Lys Lys Lys Met Leu Thr Leu Leu Leu Thr Ala Ser Met
1 5 10 15
Ser Phe Gly Leu Phe Gly Ala Thr Ser Ser Ala Ala Thr Asp Tyr Trp
20 25 30
Gln Tyr Trp Thr Asp Gly Gly Gly Thr Val Asn Ala Val Asn Gly Ser
35 40 45
Gly Gly Asn Tyr Ser Val Thr Trp Gln Asn Ser Gly Asn Phe Val Val
50 55 60
Gly Lys Gly Trp Ser Val Gly Ser Pro Asn Arg Thr Ile Asn Tyr Asn
65 70 75 80
Ala Gly Ile Trp Glu Pro Ser Gly Asn Gly Tyr Leu Thr Leu Tyr Gly
85 90 95
Trp Thr Arg Asn Ser Leu Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly
100 105 110
Thr Tyr Arg Pro Thr Gly Thr His Lys Gly Thr Val Asn Ser Asp Gly
115 120 125
Gly Thr Tyr Asp Ile Tyr Thr Thr Met Arg Tyr Asn Ala Pro Ser Ile
130 135 140
Asp Gly Thr Gln Thr Phe Gln Gln Phe Trp Ser Val Arg Gln Ser Lys
145 150 155 160
Arg Pro Thr Gly Ser Asn Val Ser Ile Thr Phe Ser Asn His Val Asn
165 170 175
Ala Trp Arg Ser Lys Gly Met Asn Leu Gly Ser Ser Trp Ser Tyr Gln
180 185 190
Val Leu Ala Thr Glu Gly Tyr Gln Ser Ser Gly Arg Ser Asn Val Thr
195 200 205
Val Trp
210
<210> 209
<211> 1194
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 209
atgaaaacat ttagtgtgac caagtctagc gttgttttcg caatggcttt gggtatggct 60
tcgacagctt ttgctcagga tttctgcagc aatgcgcaac attccggcca aaaggtaacg 120
attacttcga accaaactgg taaaatcggc gatatcggtt acgaactctg ggacgaaaac 180
ggtcatggtg gtagtgctac cttctatagc gatggttcca tggactgcaa tatcactggt 240
gctaaggact atctctgccg tgcgggcctt tccctcggca gtaacaagac ctacaaggaa 300
cttggtggtg atatgattgc cgagttcaag cttgtgaaga gcggtgccca gaatgtgggt 360
tactcttata tcggtatcta tggctggatg gaaggtgttt ctggaacgcc tagccagttg 420
gtcgaatact acgtgattga taacaccctc gccaatgaca tgccgggtag ctggattggt 480
aacgaaagaa agggtaccat tacggttgac ggcggtacct atactgttta tcgcaatacc 540
cgtacaggtc cggctattaa gaacagcggt aacgtcacgt tctatcagta tttcagcgtt 600
cgtacctctc cgcgcgattg cggtaccatc aatatttccg aacacatgag acagtgggaa 660
aagatgggca tgaccatggg taagctctac gaagccaagg tgcttggcga agcgggtaac 720
gtgaatggcg aagtccgcgg tggtcacatg gacttcccgc atgctaaggt ttatgtgaaa 780
aacggctctg atccggcttc ttcctcttct gtgaagtcca gctcttctac agtaacgcca 840
aaatccagct cctcgaaggg taacggcaac gtttctggta aaattgacgc ctgcaaggac 900
gctatgggcc atgaaggcaa agaaacgaga actcagggtc agaacaactc tagcgtgacg 960
ggtaacgtcg gcagctctcc gtaccactat gaaatttggt atcagggtgg taacaactcc 1020
atgacgttct acgacaacgg tacttataag gcaagctgga atggtaccaa cgacttcctt 1080
gctcgtgtcg gtttcaagta tgatgaaaag cacacttacg aagaacttgg ccctatcgat 1140
gcctactaca agtggagcaa gcagggtagt gctggtggct acaactacat cggt 1194
<210> 210
<211> 398
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(25)
<400> 210
Met Lys Thr Phe Ser Val Thr Lys Ser Ser Val Val Phe Ala Met Ala
1 5 10 15
Leu Gly Met Ala Ser Thr Ala Phe Ala Gln Asp Phe Cys Ser Asn Ala
20 25 30
Gln His Ser Gly Gln Lys Val Thr Ile Thr Ser Asn Gln Thr Gly Lys
35 40 45
Ile Gly Asp Ile Gly Tyr Glu Leu Trp Asp Glu Asn Gly His Gly Gly
50 55 60
Ser Ala Thr Phe Tyr Ser Asp Gly Ser Met Asp Cys Asn Ile Thr Gly
65 70 75 80
Ala Lys Asp Tyr Leu Cys Arg Ala Gly Leu Ser Leu Gly Ser Asn Lys
85 90 95
Thr Tyr Lys Glu Leu Gly Gly Asp Met Ile Ala Glu Phe Lys Leu Val
100 105 110
Lys Ser Gly Ala Gln Asn Val Gly Tyr Ser Tyr Ile Gly Ile Tyr Gly
115 120 125
Trp Met Glu Gly Val Ser Gly Thr Pro Ser Gln Leu Val Glu Tyr Tyr
130 135 140
Val Ile Asp Asn Thr Leu Ala Asn Asp Met Pro Gly Ser Trp Ile Gly
145 150 155 160
Asn Glu Arg Lys Gly Thr Ile Thr Val Asp Gly Gly Thr Tyr Thr Val
165 170 175
Tyr Arg Asn Thr Arg Thr Gly Pro Ala Ile Lys Asn Ser Gly Asn Val
180 185 190
Thr Phe Tyr Gln Tyr Phe Ser Val Arg Thr Ser Pro Arg Asp Cys Gly
195 200 205
Thr Ile Asn Ile Ser Glu His Met Arg Gln Trp Glu Lys Met Gly Met
210 215 220
Thr Met Gly Lys Leu Tyr Glu Ala Lys Val Leu Gly Glu Ala Gly Asn
225 230 235 240
Val Asn Gly Glu Val Arg Gly Gly His Met Asp Phe Pro His Ala Lys
245 250 255
Val Tyr Val Lys Asn Gly Ser Asp Pro Ala Ser Ser Ser Ser Val Lys
260 265 270
Ser Ser Ser Ser Thr Val Thr Pro Lys Ser Ser Ser Ser Lys Gly Asn
275 280 285
Gly Asn Val Ser Gly Lys Ile Asp Ala Cys Lys Asp Ala Met Gly His
290 295 300
Glu Gly Lys Glu Thr Arg Thr Gln Gly Gln Asn Asn Ser Ser Val Thr
305 310 315 320
Gly Asn Val Gly Ser Ser Pro Tyr His Tyr Glu Ile Trp Tyr Gln Gly
325 330 335
Gly Asn Asn Ser Met Thr Phe Tyr Asp Asn Gly Thr Tyr Lys Ala Ser
340 345 350
Trp Asn Gly Thr Asn Asp Phe Leu Ala Arg Val Gly Phe Lys Tyr Asp
355 360 365
Glu Lys His Thr Tyr Glu Glu Leu Gly Pro Ile Asp Ala Tyr Tyr Lys
370 375 380
Trp Ser Lys Gln Gly Ser Ala Gly Gly Tyr Asn Tyr Ile Gly
385 390 395
<210> 211
<211> 1086
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 211
atgataagtt ctaaagcatc acagtcatgg ggctggtcac tattggtggc cctgtccgcc 60
gttctgcttt cggcgacagc ttccgcccag caacactgct ccaaccaaac cggtacgcac 120
aacggttttt actttaccca ttggtcagac ggtggcggta ccgcctgcat gactctgggg 180
gacgacggca actacagcta tacctggtcc aacactggca attttgtcgg tggtaagggc 240
tggagcacag gtacatccaa ccgggtgatt ggttacaacg ccggagacta ctcgccctcc 300
ggcaactcct acctggcact gtatggctgg agcaccaatc cgctgattga atattacgtg 360
gtcgacagtt ggggcagctg gcgtccgccg ggtggcacct ctgtgggcac ggtaaccagc 420
gacggtggca cttacgacct gtaccgaacc cagcgtgtgc agcagccctc cattgagggt 480
acggccacct tctatcaata ctggagcgtg cgcacctcac agcggcctca ggggcaaaac 540
aacaccatca cctttcagaa ccacgtgaat gcctgggcca atcagggctg gaatctgggc 600
acccacaact atcaggtgat ggcgaccgaa ggctacgaaa gcagcggcag ctccaacgtc 660
accgtttggg attccggcac cagtagcggt ggcggtggcg gtggcaacgc gggcggcggc 720
ggagcccccg gtggtggtga ggctggaggc ggctccaact cactggttgt gcgtgcggtg 780
ggcacttcgg gcaatgaaca gttgcgcgtc aacgtcagtg gcaacacggt ggaaaccctg 840
aacctgtcta ccaactggca ggactacacc atcaacacca acgcctccgg cgatgtcaat 900
gtggaattga tcaacgacca gggcgaaggc tacgaggccc gcgtcgagta cgtcatcatc 960
aacggcgata cccgctacgg cgccgaccag agctacaaca ccagcgcctg ggacggcgag 1020
tgcggtagcg gttcctttac catgtggatg cactgcgaag gcatcctcgg ttttggcgat 1080
atgtaa 1086
<210> 212
<211> 361
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(29)
<400> 212
Met Ile Ser Ser Lys Ala Ser Gln Ser Trp Gly Trp Ser Leu Leu Val
1 5 10 15
Ala Leu Ser Ala Val Leu Leu Ser Ala Thr Ala Ser Ala Gln Gln His
20 25 30
Cys Ser Asn Gln Thr Gly Thr His Asn Gly Phe Tyr Phe Thr His Trp
35 40 45
Ser Asp Gly Gly Gly Thr Ala Cys Met Thr Leu Gly Asp Asp Gly Asn
50 55 60
Tyr Ser Tyr Thr Trp Ser Asn Thr Gly Asn Phe Val Gly Gly Lys Gly
65 70 75 80
Trp Ser Thr Gly Thr Ser Asn Arg Val Ile Gly Tyr Asn Ala Gly Asp
85 90 95
Tyr Ser Pro Ser Gly Asn Ser Tyr Leu Ala Leu Tyr Gly Trp Ser Thr
100 105 110
Asn Pro Leu Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Ser Trp Arg
115 120 125
Pro Pro Gly Gly Thr Ser Val Gly Thr Val Thr Ser Asp Gly Gly Thr
130 135 140
Tyr Asp Leu Tyr Arg Thr Gln Arg Val Gln Gln Pro Ser Ile Glu Gly
145 150 155 160
Thr Ala Thr Phe Tyr Gln Tyr Trp Ser Val Arg Thr Ser Gln Arg Pro
165 170 175
Gln Gly Gln Asn Asn Thr Ile Thr Phe Gln Asn His Val Asn Ala Trp
180 185 190
Ala Asn Gln Gly Trp Asn Leu Gly Thr His Asn Tyr Gln Val Met Ala
195 200 205
Thr Glu Gly Tyr Glu Ser Ser Gly Ser Ser Asn Val Thr Val Trp Asp
210 215 220
Ser Gly Thr Ser Ser Gly Gly Gly Gly Gly Gly Asn Ala Gly Gly Gly
225 230 235 240
Gly Ala Pro Gly Gly Gly Glu Ala Gly Gly Gly Ser Asn Ser Leu Val
245 250 255
Val Arg Ala Val Gly Thr Ser Gly Asn Glu Gln Leu Arg Val Asn Val
260 265 270
Ser Gly Asn Thr Val Glu Thr Leu Asn Leu Ser Thr Asn Trp Gln Asp
275 280 285
Tyr Thr Ile Asn Thr Asn Ala Ser Gly Asp Val Asn Val Glu Leu Ile
290 295 300
Asn Asp Gln Gly Glu Gly Tyr Glu Ala Arg Val Glu Tyr Val Ile Ile
305 310 315 320
Asn Gly Asp Thr Arg Tyr Gly Ala Asp Gln Ser Tyr Asn Thr Ser Ala
325 330 335
Trp Asp Gly Glu Cys Gly Ser Gly Ser Phe Thr Met Trp Met His Cys
340 345 350
Glu Gly Ile Leu Gly Phe Gly Asp Met
355 360
<210> 213
<211> 912
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 213
gtgaacgcac aacaaaccct tacgtctaac tccaccggta ctcatggtgg tcactactat 60
tctttctgga aggactccgg caatgcgtcc ttcactctct acgatggcgg acgttacggc 120
tcgcaatgga atagcggcac caacaattgg gtgggcggta aaggctggaa cccgggcggc 180
gcaaaagtcg ttaactacga aggttattac ggcgttaaca attcccagaa ttcttacctg 240
gcactctacg ggtggacccg caatccgctg atcgagtact acataatcga aagttacggt 300
tcgtacaacc catcgagctg tagtggcggt actaactacg gtagcttcca aagcgatggt 360
gcgacctata acgtccgccg ttgccagcgc gtacagcagc catcgattga tggaacgcaa 420
acgttctatc agtatttcag cgttcgctca cccaaaaagg gcttcggcca aatcagcggc 480
actatcaatg taggcaacca ctttaattat tgggccagca aagggctgaa tttgggtagc 540
cacgattaca tggttctggc gactgaaggc tatcagagca gcggcaattc agatatttcc 600
gtgtccgaag gcagcagcgg cggctcttcc tcaggcggtt cgacctccag cggaagctcc 660
tccggtagta cgaccagttc ttcaggaggc ggtggcggcg gcatcacagt acgtgctcgc 720
ggcactaatg gtgatgagcg tatcagcctg cgtgtcggcg gttctgcggt agccagttgg 780
acactcagta ccagcgcaca aagctatagc tacacaggcg gcgcctctgg cgatatccag 840
gtggaattcg atatcaagct tatcgatacc gtcgacctcg agggggggcc cggtacccaa 900
ttcgccctat ag 912
<210> 214
<211> 303
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 214
Val Asn Ala Gln Gln Thr Leu Thr Ser Asn Ser Thr Gly Thr His Gly
1 5 10 15
Gly His Tyr Tyr Ser Phe Trp Lys Asp Ser Gly Asn Ala Ser Phe Thr
20 25 30
Leu Tyr Asp Gly Gly Arg Tyr Gly Ser Gln Trp Asn Ser Gly Thr Asn
35 40 45
Asn Trp Val Gly Gly Lys Gly Trp Asn Pro Gly Gly Ala Lys Val Val
50 55 60
Asn Tyr Glu Gly Tyr Tyr Gly Val Asn Asn Ser Gln Asn Ser Tyr Leu
65 70 75 80
Ala Leu Tyr Gly Trp Thr Arg Asn Pro Leu Ile Glu Tyr Tyr Ile Ile
85 90 95
Glu Ser Tyr Gly Ser Tyr Asn Pro Ser Ser Cys Ser Gly Gly Thr Asn
100 105 110
Tyr Gly Ser Phe Gln Ser Asp Gly Ala Thr Tyr Asn Val Arg Arg Cys
115 120 125
Gln Arg Val Gln Gln Pro Ser Ile Asp Gly Thr Gln Thr Phe Tyr Gln
130 135 140
Tyr Phe Ser Val Arg Ser Pro Lys Lys Gly Phe Gly Gln Ile Ser Gly
145 150 155 160
Thr Ile Asn Val Gly Asn His Phe Asn Tyr Trp Ala Ser Lys Gly Leu
165 170 175
Asn Leu Gly Ser His Asp Tyr Met Val Leu Ala Thr Glu Gly Tyr Gln
180 185 190
Ser Ser Gly Asn Ser Asp Ile Ser Val Ser Glu Gly Ser Ser Gly Gly
195 200 205
Ser Ser Ser Gly Gly Ser Thr Ser Ser Gly Ser Ser Ser Gly Ser Thr
210 215 220
Thr Ser Ser Ser Gly Gly Gly Gly Gly Gly Ile Thr Val Arg Ala Arg
225 230 235 240
Gly Thr Asn Gly Asp Glu Arg Ile Ser Leu Arg Val Gly Gly Ser Ala
245 250 255
Val Ala Ser Trp Thr Leu Ser Thr Ser Ala Gln Ser Tyr Ser Tyr Thr
260 265 270
Gly Gly Ala Ser Gly Asp Ile Gln Val Glu Phe Asp Ile Lys Leu Ile
275 280 285
Asp Thr Val Asp Leu Glu Gly Gly Pro Gly Thr Gln Phe Ala Leu
290 295 300
<210> 215
<211> 1065
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 215
atgtttgcaa gattcgagaa actggccgcg gcgggtaaag ccgtcgtggc cctggcaggg 60
ctcgcccttt tgggcacggc gcctgccaat gcacagacct gtctcacgaa caattccacc 120
ggcaccaaca acggctacta ctactcgttc tggaaggaca gcggcaacgt gaccttctgc 180
atgtacgggg gcggccgcta tacctcgcag tggagcaaca tcaacaactg ggtgggcggc 240
aagggctgga atccgggcgg tcgtcggacc gtcacctatt cggggacgtt caacccgaac 300
ggcaattcct atctcacgct gtacggctgg accaccaatc cactggtcga gtactacatc 360
gtcgacagct ggggcagctg gcgtccgccg ggttccggct acatgggttc cgtcacgagc 420
gacggcggca cctacgacat ctatcgcacg cagcgcgtca accagccctc gatcatcggc 480
accgcgacgt tctaccagta ctggagcgtg cggcagcaga agcgcgtggg tggcaccatc 540
accaccggca accacttcga tgcctgggct tcgctgggca tgaacctcgg ccagcacaac 600
tacatggtca tggccaccga gggctaccag agcagcggca gctccgacat cacggtgggc 660
ggcaccagca gctcctcgtc gtcgagcggg ggcagcagca gcagtagcag cagcagcggg 720
ggtggcggct cgaagagctt caccgtgcgc gcgcggggtt cgacgggcgg tgagcagatc 780
agtttgcgcg tgaacaacca gaccgtgcag aactggacgc tgggcaccag catgcagaac 840
tacaccgcgt ccaccaacct gagcggcggc atcaccgtgc acttcaccaa tgacagcggc 900
aaccgcgacg tgcaggtgga ctacatccag gtgaacggcc agacgcgtca atccgagcag 960
cagagctaca acaccgggct gtatgccaac ggcagctgtg gcggcggcgg ctacagcgag 1020
tggatgcatt gcaatggcgc gatcggttac ggcaacacgc cgtag 1065
<210> 216
<211> 354
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(31)
<400> 216
Met Phe Ala Arg Phe Glu Lys Leu Ala Ala Ala Gly Lys Ala Val Val
1 5 10 15
Ala Leu Ala Gly Leu Ala Leu Leu Gly Thr Ala Pro Ala Asn Ala Gln
20 25 30
Thr Cys Leu Thr Asn Asn Ser Thr Gly Thr Asn Asn Gly Tyr Tyr Tyr
35 40 45
Ser Phe Trp Lys Asp Ser Gly Asn Val Thr Phe Cys Met Tyr Gly Gly
50 55 60
Gly Arg Tyr Thr Ser Gln Trp Ser Asn Ile Asn Asn Trp Val Gly Gly
65 70 75 80
Lys Gly Trp Asn Pro Gly Gly Arg Arg Thr Val Thr Tyr Ser Gly Thr
85 90 95
Phe Asn Pro Asn Gly Asn Ser Tyr Leu Thr Leu Tyr Gly Trp Thr Thr
100 105 110
Asn Pro Leu Val Glu Tyr Tyr Ile Val Asp Ser Trp Gly Ser Trp Arg
115 120 125
Pro Pro Gly Ser Gly Tyr Met Gly Ser Val Thr Ser Asp Gly Gly Thr
130 135 140
Tyr Asp Ile Tyr Arg Thr Gln Arg Val Asn Gln Pro Ser Ile Ile Gly
145 150 155 160
Thr Ala Thr Phe Tyr Gln Tyr Trp Ser Val Arg Gln Gln Lys Arg Val
165 170 175
Gly Gly Thr Ile Thr Thr Gly Asn His Phe Asp Ala Trp Ala Ser Leu
180 185 190
Gly Met Asn Leu Gly Gln His Asn Tyr Met Val Met Ala Thr Glu Gly
195 200 205
Tyr Gln Ser Ser Gly Ser Ser Asp Ile Thr Val Gly Gly Thr Ser Ser
210 215 220
Ser Ser Ser Ser Ser Gly Gly Ser Ser Ser Ser Ser Ser Ser Ser Gly
225 230 235 240
Gly Gly Gly Ser Lys Ser Phe Thr Val Arg Ala Arg Gly Ser Thr Gly
245 250 255
Gly Glu Gln Ile Ser Leu Arg Val Asn Asn Gln Thr Val Gln Asn Trp
260 265 270
Thr Leu Gly Thr Ser Met Gln Asn Tyr Thr Ala Ser Thr Asn Leu Ser
275 280 285
Gly Gly Ile Thr Val His Phe Thr Asn Asp Ser Gly Asn Arg Asp Val
290 295 300
Gln Val Asp Tyr Ile Gln Val Asn Gly Gln Thr Arg Gln Ser Glu Gln
305 310 315 320
Gln Ser Tyr Asn Thr Gly Leu Tyr Ala Asn Gly Ser Cys Gly Gly Gly
325 330 335
Gly Tyr Ser Glu Trp Met His Cys Asn Gly Ala Ile Gly Tyr Gly Asn
340 345 350
Thr Pro
<210> 217
<211> 1083
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 217
atgactttcg tcaagacgat caccggcaga cgcgccatcg cggcgttcct ctgcctcgcc 60
ggcctctaca tggcgccggc aaacgcgcaa acctgcatca cgtccagcca gaccggcacc 120
aacaacggga actacttttc gttctggaaa gacagcccgg gcacggtgaa cttctgcatg 180
tacccgaatg gccgctacac ctcgaactgg agcggcatca acaactgggt cggcggcaag 240
ggctggtcga ccggctccag ccgcaccgtc agctattcgg gcagcttcaa ttcgcccggc 300
aacggctacc tgactctcta cgggtggacc accaacccgc tcatcgagta ctacatcgtc 360
gagaactggg gtaactaccg cccgccgggc ggccaggggt acatggggac cgtcaattcc 420
gacggggcga cctatgacat ctaccggacc ttccgggaca accagccctg catcacgggc 480
aactcctgcg acttctacca gtactggagc gtgcgccagt ccaagcgcag cagcggcacc 540
atcaccacgg ccaatcactt cgcggcgtgg aacagcctcg gcatgaacct gggccagcac 600
aactaccagg tcatggccac cgagggttac cagagcagcg gcagctccga catcacggtc 660
acggaaggcg gcggcggcag cagcaatggt ggcagcagca acggcggcag cagcaatggc 720
ggcagcagca atggcggcgg cggcggcacc aagagcttca cggtccgcgc ccgtggcacc 780
gcgggtggcg agtccatcac gctgcgtgtc aacaaccaga acgtgcagac ctggacgctg 840
ggcaccggca tgcagaacta cacggcctcg acctcgctga gcggtggcat cacggtgcac 900
ttcaccaacg acggcggaag ccgcgacgtg caggtggact acatccaggt gaacggcagc 960
acgcgccagt ccgaggcaca gagctacaac accggcgcct acctgaacgg ccgttgcggc 1020
ggtggcggca acagcgaatg gatgcattgc aacggcgcca tcggctacgg caatacgccc 1080
tga 1083
<210> 218
<211> 360
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(29)
<400> 218
Met Thr Phe Val Lys Thr Ile Thr Gly Arg Arg Ala Ile Ala Ala Phe
1 5 10 15
Leu Cys Leu Ala Gly Leu Tyr Met Ala Pro Ala Asn Ala Gln Thr Cys
20 25 30
Ile Thr Ser Ser Gln Thr Gly Thr Asn Asn Gly Asn Tyr Phe Ser Phe
35 40 45
Trp Lys Asp Ser Pro Gly Thr Val Asn Phe Cys Met Tyr Pro Asn Gly
50 55 60
Arg Tyr Thr Ser Asn Trp Ser Gly Ile Asn Asn Trp Val Gly Gly Lys
65 70 75 80
Gly Trp Ser Thr Gly Ser Ser Arg Thr Val Ser Tyr Ser Gly Ser Phe
85 90 95
Asn Ser Pro Gly Asn Gly Tyr Leu Thr Leu Tyr Gly Trp Thr Thr Asn
100 105 110
Pro Leu Ile Glu Tyr Tyr Ile Val Glu Asn Trp Gly Asn Tyr Arg Pro
115 120 125
Pro Gly Gly Gln Gly Tyr Met Gly Thr Val Asn Ser Asp Gly Ala Thr
130 135 140
Tyr Asp Ile Tyr Arg Thr Phe Arg Asp Asn Gln Pro Cys Ile Thr Gly
145 150 155 160
Asn Ser Cys Asp Phe Tyr Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg
165 170 175
Ser Ser Gly Thr Ile Thr Thr Ala Asn His Phe Ala Ala Trp Asn Ser
180 185 190
Leu Gly Met Asn Leu Gly Gln His Asn Tyr Gln Val Met Ala Thr Glu
195 200 205
Gly Tyr Gln Ser Ser Gly Ser Ser Asp Ile Thr Val Thr Glu Gly Gly
210 215 220
Gly Gly Ser Ser Asn Gly Gly Ser Ser Asn Gly Gly Ser Ser Asn Gly
225 230 235 240
Gly Ser Ser Asn Gly Gly Gly Gly Gly Thr Lys Ser Phe Thr Val Arg
245 250 255
Ala Arg Gly Thr Ala Gly Gly Glu Ser Ile Thr Leu Arg Val Asn Asn
260 265 270
Gln Asn Val Gln Thr Trp Thr Leu Gly Thr Gly Met Gln Asn Tyr Thr
275 280 285
Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val His Phe Thr Asn Asp
290 295 300
Gly Gly Ser Arg Asp Val Gln Val Asp Tyr Ile Gln Val Asn Gly Ser
305 310 315 320
Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly Ala Tyr Leu Asn
325 330 335
Gly Arg Cys Gly Gly Gly Gly Asn Ser Glu Trp Met His Cys Asn Gly
340 345 350
Ala Ile Gly Tyr Gly Asn Thr Pro
355 360
<210> 219
<211> 1029
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 219
atgacatcag gtctcaagaa agtgatggca ttcgtctgtc tcgccaccct tggcgtttcg 60
gcgcatgccc agacatgtat tcagtccagt cagaccggca ccaacaacgg attctatttc 120
tccttctgga aggacaaccc gggcacggtg cagttctgcc tgcagagcgg cggtcgttac 180
acctccaact ggaacggcat caacaactgg gtgggcggca aggggtggca gaccggcgca 240
cgccgcacgg tgaactactc gggctcgttc aactcgccgg gcaacggcta tctggcgctg 300
tacggctgga ccaccaatcc gctggtcgag tactacatcg tcgacagctg gggcagcttc 360
cgtccgccgg gcaacactgc aggcctgtgg gtactggtga acagcgatgg cggcacctac 420
gacatctatc gcgcgcatcg cagtaacgcg ccctgcatca ccggcagcag ctgcgacttc 480
gaccagtact ggagcgtgcg acagtcgaag cgcgtcggcg gcaccatcac caccggcaac 540
cacttcgatg cctgggcgaa ccaccagatg aatctgggcc agttcaacta ccagatcatg 600
gctaccgagg gtttccagag caacggcagc tccgacatca ccgtcagtga atgcaccagc 660
aattgcggcg gtggcggcgg cggcgggggt ggcagcaaca gcatcacggt gcgcgcgcgc 720
ggcacgggcg gcggcgagca gatccggctg cgggtgaaca acaccacggt gcaaacctgg 780
acgctgacca ccagctacca gaacttcacg gcttcgacct cgctgagcgg cggcaccatc 840
gtcgagtact tcaacgacag ttccggccat gacgtgcagg tcgactacat catcgtgaat 900
ggcgtgaccc gccagtccga atcgcagagc tacaacaccg ggctgtatgc caacgggcgt 960
tgcggcggcg gctccaacag cgagtggatg cattgcaacg gtgccattgg atacggaaat 1020
accccgtaa 1029
<210> 220
<211> 342
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(23)
<400> 220
Met Thr Ser Gly Leu Lys Lys Val Met Ala Phe Val Cys Leu Ala Thr
1 5 10 15
Leu Gly Val Ser Ala His Ala Gln Thr Cys Ile Gln Ser Ser Gln Thr
20 25 30
Gly Thr Asn Asn Gly Phe Tyr Phe Ser Phe Trp Lys Asp Asn Pro Gly
35 40 45
Thr Val Gln Phe Cys Leu Gln Ser Gly Gly Arg Tyr Thr Ser Asn Trp
50 55 60
Asn Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly Ala
65 70 75 80
Arg Arg Thr Val Asn Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn Gly
85 90 95
Tyr Leu Ala Leu Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr Tyr
100 105 110
Ile Val Asp Ser Trp Gly Ser Phe Arg Pro Pro Gly Asn Thr Ala Gly
115 120 125
Leu Trp Val Leu Val Asn Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Arg
130 135 140
Ala His Arg Ser Asn Ala Pro Cys Ile Thr Gly Ser Ser Cys Asp Phe
145 150 155 160
Asp Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Val Gly Gly Thr Ile
165 170 175
Thr Thr Gly Asn His Phe Asp Ala Trp Ala Asn His Gln Met Asn Leu
180 185 190
Gly Gln Phe Asn Tyr Gln Ile Met Ala Thr Glu Gly Phe Gln Ser Asn
195 200 205
Gly Ser Ser Asp Ile Thr Val Ser Glu Cys Thr Ser Asn Cys Gly Gly
210 215 220
Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser Ile Thr Val Arg Ala Arg
225 230 235 240
Gly Thr Gly Gly Gly Glu Gln Ile Arg Leu Arg Val Asn Asn Thr Thr
245 250 255
Val Gln Thr Trp Thr Leu Thr Thr Ser Tyr Gln Asn Phe Thr Ala Ser
260 265 270
Thr Ser Leu Ser Gly Gly Thr Ile Val Glu Tyr Phe Asn Asp Ser Ser
275 280 285
Gly His Asp Val Gln Val Asp Tyr Ile Ile Val Asn Gly Val Thr Arg
290 295 300
Gln Ser Glu Ser Gln Ser Tyr Asn Thr Gly Leu Tyr Ala Asn Gly Arg
305 310 315 320
Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys Asn Gly Ala Ile
325 330 335
Gly Tyr Gly Asn Thr Pro
340
<210> 221
<211> 1044
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 221
atgattgtta gtttcaagag cgtgaaggca ctcgcgtgcc tggccgtgct cggcgtgacc 60
gccgcgcagg cgcaaacctg catcaattcc agccagaccg gcaccaacaa cggcaattat 120
ttttcattct ggaaagacaa cccgggcacg gtgaccttct gcatgtatgc caacggccgc 180
tacacctcca actggagcgg catcaacaac tgggtgggtg gcaagggctg gcagaccggc 240
tcgaatcgca cggtgaccta ctccggttcg ttcaactcgc ccggcaacgg ctacctcacc 300
ctgtacgggt ggaccacgaa tccgctgatc gagtactaca tcgtcgacag ttggggcagt 360
tatcgaccgc ccggcggcca gggcttcatg ggcaccgtga cgaccgacgg cggcacctac 420
gacatctatc gcacgcagcg cgtgaaccag ccttccatca tcggcaccgc gacgttctac 480
cagtactgga gcgtgcggca gtcgaagcgc gtggggggca ccatcaccac cgccaaccac 540
ttcaatgcct gggcgacgct gggcatgaac ctgggccagc acaactacca ggtcatggcc 600
accgagggtt accagagcag cggcagctcc gacatcaccg tgaccgaagg cggcggcagc 660
tcgtcgtcgt cgagcggcgg cggcagcacc agcagcggcg gtggcggcag caagagcttc 720
acggtgcgcg cccgcggcac ggtcggcggc gaaaacatcc agctgcaggt caacaaccag 780
acggtggcga gctggaacct gaccaccagc atgcagaact acaacgcctc gaccagcctg 840
agtggcggca tcaccgtggt ctacaccaac gacggcggta accgcgacgt ccaggtcgac 900
tacatcaccg tgaacggcca gacccgccag tccgaagcgc agagtttcaa caccgggctg 960
tatgccaacg gacgttgtgg cggcggctcg aacagcgagt ggatgcattg caatggcgcg 1020
atcggctacg gcaacacgcc gtaa 1044
<210> 222
<211> 347
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(24)
<400> 222
Met Ile Val Ser Phe Lys Ser Val Lys Ala Leu Ala Cys Leu Ala Val
1 5 10 15
Leu Gly Val Thr Ala Ala Gln Ala Gln Thr Cys Ile Asn Ser Ser Gln
20 25 30
Thr Gly Thr Asn Asn Gly Asn Tyr Phe Ser Phe Trp Lys Asp Asn Pro
35 40 45
Gly Thr Val Thr Phe Cys Met Tyr Ala Asn Gly Arg Tyr Thr Ser Asn
50 55 60
Trp Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly
65 70 75 80
Ser Asn Arg Thr Val Thr Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn
85 90 95
Gly Tyr Leu Thr Leu Tyr Gly Trp Thr Thr Asn Pro Leu Ile Glu Tyr
100 105 110
Tyr Ile Val Asp Ser Trp Gly Ser Tyr Arg Pro Pro Gly Gly Gln Gly
115 120 125
Phe Met Gly Thr Val Thr Thr Asp Gly Gly Thr Tyr Asp Ile Tyr Arg
130 135 140
Thr Gln Arg Val Asn Gln Pro Ser Ile Ile Gly Thr Ala Thr Phe Tyr
145 150 155 160
Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Val Gly Gly Thr Ile Thr
165 170 175
Thr Ala Asn His Phe Asn Ala Trp Ala Thr Leu Gly Met Asn Leu Gly
180 185 190
Gln His Asn Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly
195 200 205
Ser Ser Asp Ile Thr Val Thr Glu Gly Gly Gly Ser Ser Ser Ser Ser
210 215 220
Ser Gly Gly Gly Ser Thr Ser Ser Gly Gly Gly Gly Ser Lys Ser Phe
225 230 235 240
Thr Val Arg Ala Arg Gly Thr Val Gly Gly Glu Asn Ile Gln Leu Gln
245 250 255
Val Asn Asn Gln Thr Val Ala Ser Trp Asn Leu Thr Thr Ser Met Gln
260 265 270
Asn Tyr Asn Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val Val Tyr
275 280 285
Thr Asn Asp Gly Gly Asn Arg Asp Val Gln Val Asp Tyr Ile Thr Val
290 295 300
Asn Gly Gln Thr Arg Gln Ser Glu Ala Gln Ser Phe Asn Thr Gly Leu
305 310 315 320
Tyr Ala Asn Gly Arg Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His
325 330 335
Cys Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro
340 345
<210> 223
<211> 642
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 223
atgtttaagt ttaaaaagaa tttcttagtt ggattatcgg cagctttaat gagtattagc 60
ttgttttcgg caaccgcctc tgcagctagc acagactact ggcaaaattg gactgatggg 120
ggcggtatag taaacgctgt caatgggtct ggcgggaatt acagtgttaa ttggtctaat 180
accggaaatt tcgttgttgg taaaggttgg actacaggtt cgccatttag gacgataaac 240
tataatgccg gagtttgggc accgaatgga aatggatatt taactttata tggttggacg 300
agatcacctc tcatagaata ttatgtagtg gattcatggg gtacttatag acctactgga 360
acgtataaag gtactgtaaa aagtgatggg ggtacatatg acatatatac aactacacgt 420
tataacgcac cttccattga tggcgatcgc actactttta cgcagtactg gagtgttcgc 480
caaacgaaga gaccaaccgg aagcaacgct acaatcactt tcagcaatca tgttaacgca 540
tggaagagcc atggaatgaa tctgggcagt aattgggctt accaagtcat ggcgacagaa 600
ggatatcaaa gtagtggaag ttctaacgta acagtgtggt aa 642
<210> 224
<211> 213
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(28)
<400> 224
Met Phe Lys Phe Lys Lys Asn Phe Leu Val Gly Leu Ser Ala Ala Leu
1 5 10 15
Met Ser Ile Ser Leu Phe Ser Ala Thr Ala Ser Ala Ala Ser Thr Asp
20 25 30
Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Ile Val Asn Ala Val Asn
35 40 45
Gly Ser Gly Gly Asn Tyr Ser Val Asn Trp Ser Asn Thr Gly Asn Phe
50 55 60
Val Val Gly Lys Gly Trp Thr Thr Gly Ser Pro Phe Arg Thr Ile Asn
65 70 75 80
Tyr Asn Ala Gly Val Trp Ala Pro Asn Gly Asn Gly Tyr Leu Thr Leu
85 90 95
Tyr Gly Trp Thr Arg Ser Pro Leu Ile Glu Tyr Tyr Val Val Asp Ser
100 105 110
Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Thr Val Lys Ser
115 120 125
Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr Arg Tyr Asn Ala Pro
130 135 140
Ser Ile Asp Gly Asp Arg Thr Thr Phe Thr Gln Tyr Trp Ser Val Arg
145 150 155 160
Gln Thr Lys Arg Pro Thr Gly Ser Asn Ala Thr Ile Thr Phe Ser Asn
165 170 175
His Val Asn Ala Trp Lys Ser His Gly Met Asn Leu Gly Ser Asn Trp
180 185 190
Ala Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser Ser
195 200 205
Asn Val Thr Val Trp
210
<210> 225
<211> 1059
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 225
atgtttgtta gtctcaggaa gacggcttgg gcgtgcctgt tgctcgccgg cctcggaatc 60
tcgacttcac aagcccagac ctgcatcacg tccagcggga cgggcaccaa caacggccac 120
tactattcct tctggaagga cagtggcggc accgtcaact tctgcatgta cgcgaacggc 180
cgctacacct ccaactggag cggcatcaac aactgggtgg gcggcaaggg ctggcagacc 240
ggctcacgcc ggacgatcag ctactcgggc tcgttcaact cacccggcaa tggttatctc 300
accctgtacg gttggaccac caatccattg atcgagtact acatcgtcga caactggggc 360
acgtaccggc cgccgggagg ctcgggctac atgggcacgg tgacgagcga cggcggcacc 420
tacgacgtct atcgcaccca gcgcgtaaac cagccttcca tcatcggcac cgcgacgttc 480
tatcaatact ggagcgtgcg ccagcagaag cggaccggcg ggaccatcac caccggcaat 540
cacttcgacg cctgggccgc atacggaatg aacctcggca cccacaacta ccagatcatg 600
gcgaccgagg gttaccagag cagcggcagt tcggacatca cggtgagcga gggcggtggc 660
agttcatcga gcagcagctc gtcgagcagc agcagttcgt cctcttcgag cggcggcggc 720
ggcacgaaga gcttcacggt ccgcgcgcgc ggcacggcgg gcggtgaatc catcacgctg 780
cgcgtgaaca accagaacgt gcagacctgg acgctgggca cgtcgatgca gaactacacc 840
gcatcgacca cgctctccgg tggcatcacc gtcgcgtaca ccaacgacag cggcaatcgc 900
gacgtgcagg tggactacat cgtcgtgaac ggcgccaccc gccagtccga ggcgcagagc 960
tacaacaccg gtctctatgc caacggtcgt tgcggcggcg gctccaacag cgagtggatg 1020
cactgcaacg ggcagatcgg ctacgggaat actccctag 1059
<210> 226
<211> 352
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(25)
<400> 226
Met Phe Val Ser Leu Arg Lys Thr Ala Trp Ala Cys Leu Leu Leu Ala
1 5 10 15
Gly Leu Gly Ile Ser Thr Ser Gln Ala Gln Thr Cys Ile Thr Ser Ser
20 25 30
Gly Thr Gly Thr Asn Asn Gly His Tyr Tyr Ser Phe Trp Lys Asp Ser
35 40 45
Gly Gly Thr Val Asn Phe Cys Met Tyr Ala Asn Gly Arg Tyr Thr Ser
50 55 60
Asn Trp Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr
65 70 75 80
Gly Ser Arg Arg Thr Ile Ser Tyr Ser Gly Ser Phe Asn Ser Pro Gly
85 90 95
Asn Gly Tyr Leu Thr Leu Tyr Gly Trp Thr Thr Asn Pro Leu Ile Glu
100 105 110
Tyr Tyr Ile Val Asp Asn Trp Gly Thr Tyr Arg Pro Pro Gly Gly Ser
115 120 125
Gly Tyr Met Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Val Tyr
130 135 140
Arg Thr Gln Arg Val Asn Gln Pro Ser Ile Ile Gly Thr Ala Thr Phe
145 150 155 160
Tyr Gln Tyr Trp Ser Val Arg Gln Gln Lys Arg Thr Gly Gly Thr Ile
165 170 175
Thr Thr Gly Asn His Phe Asp Ala Trp Ala Ala Tyr Gly Met Asn Leu
180 185 190
Gly Thr His Asn Tyr Gln Ile Met Ala Thr Glu Gly Tyr Gln Ser Ser
195 200 205
Gly Ser Ser Asp Ile Thr Val Ser Glu Gly Gly Gly Ser Ser Ser Ser
210 215 220
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Gly Gly Gly
225 230 235 240
Gly Thr Lys Ser Phe Thr Val Arg Ala Arg Gly Thr Ala Gly Gly Glu
245 250 255
Ser Ile Thr Leu Arg Val Asn Asn Gln Asn Val Gln Thr Trp Thr Leu
260 265 270
Gly Thr Ser Met Gln Asn Tyr Thr Ala Ser Thr Thr Leu Ser Gly Gly
275 280 285
Ile Thr Val Ala Tyr Thr Asn Asp Ser Gly Asn Arg Asp Val Gln Val
290 295 300
Asp Tyr Ile Val Val Asn Gly Ala Thr Arg Gln Ser Glu Ala Gln Ser
305 310 315 320
Tyr Asn Thr Gly Leu Tyr Ala Asn Gly Arg Cys Gly Gly Gly Ser Asn
325 330 335
Ser Glu Trp Met His Cys Asn Gly Gln Ile Gly Tyr Gly Asn Thr Pro
340 345 350
<210> 227
<211> 747
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 227
atgggcggca cgactggtag tggcggctca gccgccgccg gcgcaggcac gagtggaagc 60
gcgggcggta ccgccggagc gctcggcccc ggcggtaccc agggcagcgg tggcgcagcc 120
ggtggtacga gcggaacggg cggggccatc agcagcagct gcacggaagc tgacaagacg 180
gtctgcaaca acgaaaccgg tcgccactgc aattacacgt acgagtattg gaaggaccag 240
ggaagcggtt gcctcgtgaa caaagccgac ggcttcagcg tcaactggaa caacatcaac 300
aatctgctgg gtcgcaaggg tctgaggccc ggatcgtcga atcagacggt gacctaccag 360
gcaaactacc agccgaacgg caattcatac ctgtgcgtat atggatggac gcaaaacccc 420
ctcgtcgaat actacatcgt cgatagctgg ggcagctggc gcccgccggg gggaacgtcc 480
atgggcaccg tcaacgcgga cggcggcacc tacgacatct accgcaccca gcgcgtcaac 540
cagccttcca tcgaaggcac caagaccttc tatcaatact ggagcgttcg cactcagaag 600
cgcacgagcg gaacgatcac ggttgccgct cacttcgacg cctgggcgac gaaggggatg 660
aacatgggga gtctgtacga ggtgtcgatg accgtcgagg gctatcaaag cagcgggacc 720
gccgacgtga gcttctcgat gaagtga 747
<210> 228
<211> 248
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(39)
<400> 228
Met Gly Gly Thr Thr Gly Ser Gly Gly Ser Ala Ala Ala Gly Ala Gly
1 5 10 15
Thr Ser Gly Ser Ala Gly Gly Thr Ala Gly Ala Leu Gly Pro Gly Gly
20 25 30
Thr Gln Gly Ser Gly Gly Ala Ala Gly Gly Thr Ser Gly Thr Gly Gly
35 40 45
Ala Ile Ser Ser Ser Cys Thr Glu Ala Asp Lys Thr Val Cys Asn Asn
50 55 60
Glu Thr Gly Arg His Cys Asn Tyr Thr Tyr Glu Tyr Trp Lys Asp Gln
65 70 75 80
Gly Ser Gly Cys Leu Val Asn Lys Ala Asp Gly Phe Ser Val Asn Trp
85 90 95
Asn Asn Ile Asn Asn Leu Leu Gly Arg Lys Gly Leu Arg Pro Gly Ser
100 105 110
Ser Asn Gln Thr Val Thr Tyr Gln Ala Asn Tyr Gln Pro Asn Gly Asn
115 120 125
Ser Tyr Leu Cys Val Tyr Gly Trp Thr Gln Asn Pro Leu Val Glu Tyr
130 135 140
Tyr Ile Val Asp Ser Trp Gly Ser Trp Arg Pro Pro Gly Gly Thr Ser
145 150 155 160
Met Gly Thr Val Asn Ala Asp Gly Gly Thr Tyr Asp Ile Tyr Arg Thr
165 170 175
Gln Arg Val Asn Gln Pro Ser Ile Glu Gly Thr Lys Thr Phe Tyr Gln
180 185 190
Tyr Trp Ser Val Arg Thr Gln Lys Arg Thr Ser Gly Thr Ile Thr Val
195 200 205
Ala Ala His Phe Asp Ala Trp Ala Thr Lys Gly Met Asn Met Gly Ser
210 215 220
Leu Tyr Glu Val Ser Met Thr Val Glu Gly Tyr Gln Ser Ser Gly Thr
225 230 235 240
Ala Asp Val Ser Phe Ser Met Lys
245
<210> 229
<211> 642
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 229
atgtttaagt ttacaaagaa attcttagtt gggttaacgg cagctttgat gagtattagc 60
ttgttttcgg caaacgcctc tgcagctaac acagactact ggcaaaattg gactgatggg 120
ggcggaacag taaacgctgt caatgggtct ggcgggaatt acagtgtgaa ttggtctaat 180
accgggaatt tcgttgttgg taaaggttgg actacaggtt cgccatttag gacgataaac 240
tataatgccg gagtttgggc gccgaatggc aatgcatatt tgactttata tggttggacg 300
cgatcacccc tcatagaata ttatgtagtg gattcatggg gtacttatag acctactgga 360
acgtataaag gtacggttta cagtgatggg ggtacatatg acgtgtacac aactacacgt 420
tatgatgcac cttccattga tggcgataaa actactttta cgcagtactg gagtgttcgc 480
cagtcgaaga gaccaactgg aagcaacgct acaatcactt tcagcaatca cgttaacgca 540
tggaagagat atgggatgaa tctgggtagt aattggtctt accaagtctt agcgacagag 600
ggatatcaaa gtagtggaag ttctaacgta acagtgtggt aa 642
<210> 230
<211> 213
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(28)
<400> 230
Met Phe Lys Phe Thr Lys Lys Phe Leu Val Gly Leu Thr Ala Ala Leu
1 5 10 15
Met Ser Ile Ser Leu Phe Ser Ala Asn Ala Ser Ala Ala Asn Thr Asp
20 25 30
Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr Val Asn Ala Val Asn
35 40 45
Gly Ser Gly Gly Asn Tyr Ser Val Asn Trp Ser Asn Thr Gly Asn Phe
50 55 60
Val Val Gly Lys Gly Trp Thr Thr Gly Ser Pro Phe Arg Thr Ile Asn
65 70 75 80
Tyr Asn Ala Gly Val Trp Ala Pro Asn Gly Asn Ala Tyr Leu Thr Leu
85 90 95
Tyr Gly Trp Thr Arg Ser Pro Leu Ile Glu Tyr Tyr Val Val Asp Ser
100 105 110
Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Thr Val Tyr Ser
115 120 125
Asp Gly Gly Thr Tyr Asp Val Tyr Thr Thr Thr Arg Tyr Asp Ala Pro
130 135 140
Ser Ile Asp Gly Asp Lys Thr Thr Phe Thr Gln Tyr Trp Ser Val Arg
145 150 155 160
Gln Ser Lys Arg Pro Thr Gly Ser Asn Ala Thr Ile Thr Phe Ser Asn
165 170 175
His Val Asn Ala Trp Lys Arg Tyr Gly Met Asn Leu Gly Ser Asn Trp
180 185 190
Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser Ser
195 200 205
Asn Val Thr Val Trp
210
<210> 231
<211> 1008
<212> DNA
<213> Bacteria
<400> 231
atgaacctgc tcgtccagcc gaggcgtcgc agacgcggtc cggtcacctt gctcgtcagg 60
agcgcgtggg ccgtcgcgct ggcggcgctc gccgcgctga tgctgccggg caccgcccag 120
gccgacacgg tcgtcacgac caaccaggag ggcaccaaca acggctacta ctactcgttc 180
tggaccgaca gccagggcac cgtctccatg aacatgggct ccggcggtca gtacagcacc 240
tcgtggcgca acaccggcaa cttcgtcgcg ggcaagggct gggccaacgg cggccgccgg 300
accgtgcagt actcgggcag cttcaacccc tccggcaacg cgtacctggc gctctacgga 360
tggacgtcga acccgctcgt cgagtactac atcgtcgaca actggggcac ctaccggccc 420
acgggcgagt acaagggcac cgtcaccagc gacggcggca cctacgacat ctacaagacg 480
acccgcgtca acaagccctc cgtcgagggc acccgcacct tcgaccagta ctggagcgtc 540
cggcaggcga agcggaccgg cggcaccatc acgaccggca accacttcga cgcgtgggcc 600
cgggccggga tgccgctcgg caacttcagc tactacatga tcatggccac cgagggctac 660
cagagcagcg gcagctccag catcaacgtc ggcgggaccg gccgcggcga caacggcggc 720
ggcgacaacg ggggcggtgg cggcgggtgc accgccacgg tgtccgccgg gcagaagtgg 780
ggcgaccggt acaacctcga cgtctccgtc agcggcgcca gcgactggac ggtgacgatg 840
aacgtgccgt ccccggcgaa ggtcctgtcg acctggaacg tcaacgccag ctatcccagt 900
gcgcagacgc tgaccgccag gtcgaacggc agcggcaaca actggggcgc caccatccag 960
gccaacggca actggacctg gcccagcgtg tcctgcagcg cgggctga 1008
<210> 232
<211> 335
<212> PRT
<213> Bacteria
<220>
<221> SIGNAL
<222> (1)...(41)
<400> 232
Met Asn Leu Leu Val Gln Pro Arg Arg Arg Arg Arg Gly Pro Val Thr
1 5 10 15
Leu Leu Val Arg Ser Ala Trp Ala Val Ala Leu Ala Ala Leu Ala Ala
20 25 30
Leu Met Leu Pro Gly Thr Ala Gln Ala Asp Thr Val Val Thr Thr Asn
35 40 45
Gln Glu Gly Thr Asn Asn Gly Tyr Tyr Tyr Ser Phe Trp Thr Asp Ser
50 55 60
Gln Gly Thr Val Ser Met Asn Met Gly Ser Gly Gly Gln Tyr Ser Thr
65 70 75 80
Ser Trp Arg Asn Thr Gly Asn Phe Val Ala Gly Lys Gly Trp Ala Asn
85 90 95
Gly Gly Arg Arg Thr Val Gln Tyr Ser Gly Ser Phe Asn Pro Ser Gly
100 105 110
Asn Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Ser Asn Pro Leu Val Glu
115 120 125
Tyr Tyr Ile Val Asp Asn Trp Gly Thr Tyr Arg Pro Thr Gly Glu Tyr
130 135 140
Lys Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Lys Thr
145 150 155 160
Thr Arg Val Asn Lys Pro Ser Val Glu Gly Thr Arg Thr Phe Asp Gln
165 170 175
Tyr Trp Ser Val Arg Gln Ala Lys Arg Thr Gly Gly Thr Ile Thr Thr
180 185 190
Gly Asn His Phe Asp Ala Trp Ala Arg Ala Gly Met Pro Leu Gly Asn
195 200 205
Phe Ser Tyr Tyr Met Ile Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly
210 215 220
Ser Ser Ser Ile Asn Val Gly Gly Thr Gly Arg Gly Asp Asn Gly Gly
225 230 235 240
Gly Asp Asn Gly Gly Gly Gly Gly Gly Cys Thr Ala Thr Val Ser Ala
245 250 255
Gly Gln Lys Trp Gly Asp Arg Tyr Asn Leu Asp Val Ser Val Ser Gly
260 265 270
Ala Ser Asp Trp Thr Val Thr Met Asn Val Pro Ser Pro Ala Lys Val
275 280 285
Leu Ser Thr Trp Asn Val Asn Ala Ser Tyr Pro Ser Ala Gln Thr Leu
290 295 300
Thr Ala Arg Ser Asn Gly Ser Gly Asn Asn Trp Gly Ala Thr Ile Gln
305 310 315 320
Ala Asn Gly Asn Trp Thr Trp Pro Ser Val Ser Cys Ser Ala Gly
325 330 335
<210> 233
<211> 1071
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 233
atgtctatgt ttttgagtct caaaagagtg gcggcgctcg tctgcgtcgc agggtttggc 60
atttcggcgg cgaacgctca gtgcgtcact tcgagccaga caggaaccaa caacgggttc 120
tatttttcgt tctggaaaga tagtccggga accgtgaatt tctgcaacca gagcggtggc 180
cgctacacat ccaattggag cggtatcaac aactgggtcg gtggcaaggg ttggcagacc 240
ggctcgcgaa gggtcgtgag ctactccggt tcgttcaatt cgccgggcaa cgggtatctg 300
accctctatg ggtggaccac caatccgctc atcgagtact acatcgtcga caactggggc 360
tcgtatcgcc cgccgggcgg acaggggttc atgggcacgg tgaccagcga cggcggcacg 420
tacgatgtct accgcacaca gcgcgtcaat caaccctgca tcaccggcag cagttgcacc 480
ttctatcaat actggagcgt gcggcagtcg aagagaacgg gcggcacgat cacgacgggc 540
aatcactttg acgcgtgggc gagttacggc atgaacctgg gcgctcacaa ctaccagatc 600
atggcgaccg agggttatca aagcagcggg agctctgaca tcacggtcag tgaaggcagc 660
agcagtagca gcagtagcag cagttcgagc agtagctcga gcagcagctc cagcagcagc 720
agcggcggcg gtggcaccaa gagcttcacg gtccgcgcgc gcggcgtggc cggcggggaa 780
tccatcacgt tgcgcgtgaa caatcagaac gtgcagacct ggactctcgg caccggcatg 840
cagaactaca cggcgtcgac gtctttgagt ggcggcatca cggttgcgta taccaacgat 900
ggcggcagtc gcgacgtgca ggttgactac atcatcgtga acggccagac gcgtcagtcg 960
gaagcgcaga gctacaacac cgggctttat gccaacggcc gttgcggtgg cggcggcaac 1020
agcgaatgga tgcattgcaa tggcgccatt ggctacggga acacgccgta g 1071
<210> 234
<211> 356
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(26)
<400> 234
Met Ser Met Phe Leu Ser Leu Lys Arg Val Ala Ala Leu Val Cys Val
1 5 10 15
Ala Gly Phe Gly Ile Ser Ala Ala Asn Ala Gln Cys Val Thr Ser Ser
20 25 30
Gln Thr Gly Thr Asn Asn Gly Phe Tyr Phe Ser Phe Trp Lys Asp Ser
35 40 45
Pro Gly Thr Val Asn Phe Cys Asn Gln Ser Gly Gly Arg Tyr Thr Ser
50 55 60
Asn Trp Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr
65 70 75 80
Gly Ser Arg Arg Val Val Ser Tyr Ser Gly Ser Phe Asn Ser Pro Gly
85 90 95
Asn Gly Tyr Leu Thr Leu Tyr Gly Trp Thr Thr Asn Pro Leu Ile Glu
100 105 110
Tyr Tyr Ile Val Asp Asn Trp Gly Ser Tyr Arg Pro Pro Gly Gly Gln
115 120 125
Gly Phe Met Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Val Tyr
130 135 140
Arg Thr Gln Arg Val Asn Gln Pro Cys Ile Thr Gly Ser Ser Cys Thr
145 150 155 160
Phe Tyr Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Thr Gly Gly Thr
165 170 175
Ile Thr Thr Gly Asn His Phe Asp Ala Trp Ala Ser Tyr Gly Met Asn
180 185 190
Leu Gly Ala His Asn Tyr Gln Ile Met Ala Thr Glu Gly Tyr Gln Ser
195 200 205
Ser Gly Ser Ser Asp Ile Thr Val Ser Glu Gly Ser Ser Ser Ser Ser
210 215 220
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser
225 230 235 240
Ser Gly Gly Gly Gly Thr Lys Ser Phe Thr Val Arg Ala Arg Gly Val
245 250 255
Ala Gly Gly Glu Ser Ile Thr Leu Arg Val Asn Asn Gln Asn Val Gln
260 265 270
Thr Trp Thr Leu Gly Thr Gly Met Gln Asn Tyr Thr Ala Ser Thr Ser
275 280 285
Leu Ser Gly Gly Ile Thr Val Ala Tyr Thr Asn Asp Gly Gly Ser Arg
290 295 300
Asp Val Gln Val Asp Tyr Ile Ile Val Asn Gly Gln Thr Arg Gln Ser
305 310 315 320
Glu Ala Gln Ser Tyr Asn Thr Gly Leu Tyr Ala Asn Gly Arg Cys Gly
325 330 335
Gly Gly Gly Asn Ser Glu Trp Met His Cys Asn Gly Ala Ile Gly Tyr
340 345 350
Gly Asn Thr Pro
355
<210> 235
<211> 1539
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 235
atgtcgaata acagatttgt gctgaatcgt gttgctgcag gtttgctgct gggtttctcg 60
ctgctgtcat cagcagccat cgcccagaat gtggtggtaa atccttctac ggtccatcag 120
accgtgcgcg gctttggcgg catgaacgcg ccgggctgga ttgatgacct taccaccgcc 180
caggtcaata aggcctatgg cagtggcgat ggccaggtcg ggctctccat catgcgcatg 240
cgcattgatc cgaactcggc agcctggaat atccaggtgc cggctgccaa gcgggccaag 300
gagctgggtg cgatcctgtt tgccacgccc tggtcgccgc ccgcctacat gaaatccaac 360
aaaagcctga ataacggcgg caagctgctg cccgagtatt acagcgccta caccacccac 420
ctgctggatt ttgcgagttt catgtcgcgc aacggcgcac cgctgtatgc gatttcaatc 480
cagaacgaac cggactggct gccggattat gagtcgtgtg cctggactgg tactgatttc 540
gtcaattatc tgaataccca gggctcgcgt tttggtgatc tgaaagtgat tgcgccggaa 600
tccctgggtt tcacgacctc gtattccgac cccatcctca acagcgccac ggcagcgccg 660
catgtcgaca tcatcggcgg ccacctctac ggcgtgctgc ccaaggacta cccgctggcg 720
cgccagaagg gcaaggaaat ctggatgacc gagcattaca ccgagagcaa gaactcgggt 780
gatgcctggc cgctggcgct ggacgtaggc accgagctgc accagagcat ggtggccaac 840
tacaacgcct acgtgtggtg gtatgtgcgc cgcagctacg gcctgctgct ggagaacggc 900
aatgtgagca agcgcggcta catcatgtcg cagtacgcac gcttcgtccg ccccggctcc 960
aagcgcatcg gcgcgacgga aaagccgcac gccgacgtgg cggtgacggc ctacaagacg 1020
ccggataacc gcattgtgct ggtggcggtg aataccggtg cggcgcaccg tcagctgaac 1080
atcacggtgc cgagcggcag cgtgggttct ttcagcaagt tctccacttc cggcacgctg 1140
aatgtgggca gtggtggcag ctacaaggtc aacaacggcg cggtgagcct gtacatcgat 1200
ccgcagagcg tggccacgct ggtgggtgat ctgcccggca cggcctccag ctcttcggcg 1260
gcgtcctcgt cctcttccag tgcagccagc tctgcttcga gcagtgctag cggcgcaccg 1320
gccctgtctg gcagcagcga ttaccccacg ggcttcagca agtgcgctga tctgggtggt 1380
acttgtgccg tgccttcggg ctcgggctgg acggctttcg ggcgcaaggg caagtgggtt 1440
gccaagtacg tcggtgtggg caagagcatt gcctgcacgg tgacggcttt cggcagcgat 1500
cccggtggtg cacccaacaa gtgttcttac cagaagtaa 1539
<210> 236
<211> 512
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(28)
<400> 236
Met Ser Asn Asn Arg Phe Val Leu Asn Arg Val Ala Ala Gly Leu Leu
1 5 10 15
Leu Gly Phe Ser Leu Leu Ser Ser Ala Ala Ile Ala Gln Asn Val Val
20 25 30
Val Asn Pro Ser Thr Val His Gln Thr Val Arg Gly Phe Gly Gly Met
35 40 45
Asn Ala Pro Gly Trp Ile Asp Asp Leu Thr Thr Ala Gln Val Asn Lys
50 55 60
Ala Tyr Gly Ser Gly Asp Gly Gln Val Gly Leu Ser Ile Met Arg Met
65 70 75 80
Arg Ile Asp Pro Asn Ser Ala Ala Trp Asn Ile Gln Val Pro Ala Ala
85 90 95
Lys Arg Ala Lys Glu Leu Gly Ala Ile Leu Phe Ala Thr Pro Trp Ser
100 105 110
Pro Pro Ala Tyr Met Lys Ser Asn Lys Ser Leu Asn Asn Gly Gly Lys
115 120 125
Leu Leu Pro Glu Tyr Tyr Ser Ala Tyr Thr Thr His Leu Leu Asp Phe
130 135 140
Ala Ser Phe Met Ser Arg Asn Gly Ala Pro Leu Tyr Ala Ile Ser Ile
145 150 155 160
Gln Asn Glu Pro Asp Trp Leu Pro Asp Tyr Glu Ser Cys Ala Trp Thr
165 170 175
Gly Thr Asp Phe Val Asn Tyr Leu Asn Thr Gln Gly Ser Arg Phe Gly
180 185 190
Asp Leu Lys Val Ile Ala Pro Glu Ser Leu Gly Phe Thr Thr Ser Tyr
195 200 205
Ser Asp Pro Ile Leu Asn Ser Ala Thr Ala Ala Pro His Val Asp Ile
210 215 220
Ile Gly Gly His Leu Tyr Gly Val Leu Pro Lys Asp Tyr Pro Leu Ala
225 230 235 240
Arg Gln Lys Gly Lys Glu Ile Trp Met Thr Glu His Tyr Thr Glu Ser
245 250 255
Lys Asn Ser Gly Asp Ala Trp Pro Leu Ala Leu Asp Val Gly Thr Glu
260 265 270
Leu His Gln Ser Met Val Ala Asn Tyr Asn Ala Tyr Val Trp Trp Tyr
275 280 285
Val Arg Arg Ser Tyr Gly Leu Leu Leu Glu Asn Gly Asn Val Ser Lys
290 295 300
Arg Gly Tyr Ile Met Ser Gln Tyr Ala Arg Phe Val Arg Pro Gly Ser
305 310 315 320
Lys Arg Ile Gly Ala Thr Glu Lys Pro His Ala Asp Val Ala Val Thr
325 330 335
Ala Tyr Lys Thr Pro Asp Asn Arg Ile Val Leu Val Ala Val Asn Thr
340 345 350
Gly Ala Ala His Arg Gln Leu Asn Ile Thr Val Pro Ser Gly Ser Val
355 360 365
Gly Ser Phe Ser Lys Phe Ser Thr Ser Gly Thr Leu Asn Val Gly Ser
370 375 380
Gly Gly Ser Tyr Lys Val Asn Asn Gly Ala Val Ser Leu Tyr Ile Asp
385 390 395 400
Pro Gln Ser Val Ala Thr Leu Val Gly Asp Leu Pro Gly Thr Ala Ser
405 410 415
Ser Ser Ser Ala Ala Ser Ser Ser Ser Ser Ser Ala Ala Ser Ser Ala
420 425 430
Ser Ser Ser Ala Ser Gly Ala Pro Ala Leu Ser Gly Ser Ser Asp Tyr
435 440 445
Pro Thr Gly Phe Ser Lys Cys Ala Asp Leu Gly Gly Thr Cys Ala Val
450 455 460
Pro Ser Gly Ser Gly Trp Thr Ala Phe Gly Arg Lys Gly Lys Trp Val
465 470 475 480
Ala Lys Tyr Val Gly Val Gly Lys Ser Ile Ala Cys Thr Val Thr Ala
485 490 495
Phe Gly Ser Asp Pro Gly Gly Ala Pro Asn Lys Cys Ser Tyr Gln Lys
500 505 510
<210> 237
<211> 1269
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 237
atgattccac gcataaaaaa aacaatttgt gtactattag tatgtttcac tatgctgtca 60
gtcatgttag ggccaggcgc tactgaagtt ttggcagcaa gtgatgtaac agttaatgta 120
tctgcagaga aacaagtgat tcgcggtttt ggagggatga atcatccggc ttgggctggg 180
gatcttacag cagctcaaag agaaactgct tttggcaatg gacagaacca gttaggattt 240
tcaatcttaa gaattcatgt agatgaaaat cgaaataatt ggtataaaga ggtggagact 300
gcaaagagtg cggtcaaaca cggagcaatc gtttttgctt ctccttggaa tcctccaagt 360
gatatggttg agacctttaa tcggaatggt gacacatcgg ctaaacggct gaaatacaac 420
aagtacgcag catacgcgca gcatcttaac gattttgtta ccttcatgaa gaataatggt 480
gtgaatcttt acgcgatttc ggtccaaaac gagcctgatt acgctcacga gtggacgtgg 540
tggacgccgc aagaaatact tcgctttatg agagaaaacg ccggctcgat caatgcccgc 600
gtcattgcgc ctgagtcatt tcaatacttg aagaatttgt cggacccgat cttgaacgat 660
ccgcaggctc ttgccaatat ggatattctc ggaactcacc tgtacggcac ccaggtcagc 720
caattccctt atcctctttt caaacaaaaa ggagcgggga aggacctttg gatgacggaa 780
gtatactatc caaacagtga taccaactcg gcggatcgat ggcctgaggc attggatgtt 840
tcacagcata ttcacaatgc gatggtagag ggggactttc aagcttatgt atggtggtac 900
atccgaagat catatggacc tatgaaagaa gatggtacga tcagcaaacg cggctacaat 960
atggctcatt tctcaaagtt tgtgcgtccc ggctatgtaa ggattgatgc aacgaaaaac 1020
cctaatgcga acgtttacgt gtcagcctat aaaggtgaca acaaggtcgt tattgttgcc 1080
atcaataaaa gcaacacagg agtcaaccaa aactttgttt tgcagaatgg atctgcttca 1140
aacgtatcta gatggatcac gagcagcagc agcaatctac aacctggaac gaatctcact 1200
gtatcaggca atcatttttg ggctcatctt ccagctcaaa gcgtgacaac atttgttgta 1260
aatcgttaa 1269
<210> 238
<211> 422
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(32)
<400> 238
Met Ile Pro Arg Ile Lys Lys Thr Ile Cys Val Leu Leu Val Cys Phe
1 5 10 15
Thr Met Leu Ser Val Met Leu Gly Pro Gly Ala Thr Glu Val Leu Ala
20 25 30
Ala Ser Asp Val Thr Val Asn Val Ser Ala Glu Lys Gln Val Ile Arg
35 40 45
Gly Phe Gly Gly Met Asn His Pro Ala Trp Ala Gly Asp Leu Thr Ala
50 55 60
Ala Gln Arg Glu Thr Ala Phe Gly Asn Gly Gln Asn Gln Leu Gly Phe
65 70 75 80
Ser Ile Leu Arg Ile His Val Asp Glu Asn Arg Asn Asn Trp Tyr Lys
85 90 95
Glu Val Glu Thr Ala Lys Ser Ala Val Lys His Gly Ala Ile Val Phe
100 105 110
Ala Ser Pro Trp Asn Pro Pro Ser Asp Met Val Glu Thr Phe Asn Arg
115 120 125
Asn Gly Asp Thr Ser Ala Lys Arg Leu Lys Tyr Asn Lys Tyr Ala Ala
130 135 140
Tyr Ala Gln His Leu Asn Asp Phe Val Thr Phe Met Lys Asn Asn Gly
145 150 155 160
Val Asn Leu Tyr Ala Ile Ser Val Gln Asn Glu Pro Asp Tyr Ala His
165 170 175
Glu Trp Thr Trp Trp Thr Pro Gln Glu Ile Leu Arg Phe Met Arg Glu
180 185 190
Asn Ala Gly Ser Ile Asn Ala Arg Val Ile Ala Pro Glu Ser Phe Gln
195 200 205
Tyr Leu Lys Asn Leu Ser Asp Pro Ile Leu Asn Asp Pro Gln Ala Leu
210 215 220
Ala Asn Met Asp Ile Leu Gly Thr His Leu Tyr Gly Thr Gln Val Ser
225 230 235 240
Gln Phe Pro Tyr Pro Leu Phe Lys Gln Lys Gly Ala Gly Lys Asp Leu
245 250 255
Trp Met Thr Glu Val Tyr Tyr Pro Asn Ser Asp Thr Asn Ser Ala Asp
260 265 270
Arg Trp Pro Glu Ala Leu Asp Val Ser Gln His Ile His Asn Ala Met
275 280 285
Val Glu Gly Asp Phe Gln Ala Tyr Val Trp Trp Tyr Ile Arg Arg Ser
290 295 300
Tyr Gly Pro Met Lys Glu Asp Gly Thr Ile Ser Lys Arg Gly Tyr Asn
305 310 315 320
Met Ala His Phe Ser Lys Phe Val Arg Pro Gly Tyr Val Arg Ile Asp
325 330 335
Ala Thr Lys Asn Pro Asn Ala Asn Val Tyr Val Ser Ala Tyr Lys Gly
340 345 350
Asp Asn Lys Val Val Ile Val Ala Ile Asn Lys Ser Asn Thr Gly Val
355 360 365
Asn Gln Asn Phe Val Leu Gln Asn Gly Ser Ala Ser Asn Val Ser Arg
370 375 380
Trp Ile Thr Ser Ser Ser Ser Asn Leu Gln Pro Gly Thr Asn Leu Thr
385 390 395 400
Val Ser Gly Asn His Phe Trp Ala His Leu Pro Ala Gln Ser Val Thr
405 410 415
Thr Phe Val Val Asn Arg
420
<210> 239
<211> 1281
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 239
atgaatcgtt tcttgatttc acgttataag aaagccataa gtgcatgttt ggcccttgtc 60
cttgcgttgt ctctcatggc ggcacctggc gatgttgccg cagccagcga cgccgttata 120
aatgtatcgt cggagaaaca agtgatacgc ggtttcggag gcatcaacca cccggcatgg 180
atcggagatt tgacggcagc acagagagaa accgcatttg ggaacgggcc aaatcagtta 240
ggcttctcga tattaagaat ctacgtgcat gaagaccgaa atcagtggca ccgtgaactg 300
gatacggcca aacgagcgat tgcccttgga gctatcgtat tcgcttcgcc atggaatccg 360
cccgccgaca tggtcgagac cttcaaccgc aacggcgata cgtcggcaaa gcgacttcgt 420
tacgacaagt ataccgccta tgcccagcat cttaacgatt tcgtaaccta catgagaaac 480
aatggcgtga atctctacgc gatttccgtc cagaacgagc ccgattatgc gcatgactgg 540
acgtggtgga ctccgcagga aatgcttcgc tttatgaaag aaaatgccgg atcgatcaac 600
agcagagtga tcgcaccgga atcgttccaa tatctgaaaa atatgtcgga cccgattcta 660
aatgatcccc aggcgcttgc caatatggat attcttggcg ctcatctgta cggtacccaa 720
gttagcaatt tcgcgtatcc actattcaaa caaaaaggag cgggaaaaga cctctggatg 780
accgaggtgt attacccgaa cagcgacaac aactcggcgg atcgctggcc cgaagccctg 840
gatgtgtctt accatatcca caatgcgatg gtagagggag attttcaagc ttatgtatgg 900
tggtatatcc gcagatccta tggtccaatg aaagaggacg gcacgatcag caaacgcggc 960
tacaatatgg ctcatttctc caagtttgtc cgtcccggct atgtcagggt ggatgcttcg 1020
aaaaatccag aaacgaacgt ttacgtatcc gcatataaag gcgacaacaa aatcgttatc 1080
gttgccataa accggaacaa ctccggggtc aatcagaact ttgtccttca gaatggatcc 1140
gtttcgcagg tatcaaggtg gatcacgagc agcagcagca atctccagcc aggaacgtct 1200
ctcaatgtaa cagggagcaa tttctgggct catcttcccg cgcaaagcgt tacgactttt 1260
gtgggtgaac tcggaaggta a 1281
<210> 240
<211> 426
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(30)
<400> 240
Met Asn Arg Phe Leu Ile Ser Arg Tyr Lys Lys Ala Ile Ser Ala Cys
1 5 10 15
Leu Ala Leu Val Leu Ala Leu Ser Leu Met Ala Ala Pro Gly Asp Val
20 25 30
Ala Ala Ala Ser Asp Ala Val Ile Asn Val Ser Ser Glu Lys Gln Val
35 40 45
Ile Arg Gly Phe Gly Gly Ile Asn His Pro Ala Trp Ile Gly Asp Leu
50 55 60
Thr Ala Ala Gln Arg Glu Thr Ala Phe Gly Asn Gly Pro Asn Gln Leu
65 70 75 80
Gly Phe Ser Ile Leu Arg Ile Tyr Val His Glu Asp Arg Asn Gln Trp
85 90 95
His Arg Glu Leu Asp Thr Ala Lys Arg Ala Ile Ala Leu Gly Ala Ile
100 105 110
Val Phe Ala Ser Pro Trp Asn Pro Pro Ala Asp Met Val Glu Thr Phe
115 120 125
Asn Arg Asn Gly Asp Thr Ser Ala Lys Arg Leu Arg Tyr Asp Lys Tyr
130 135 140
Thr Ala Tyr Ala Gln His Leu Asn Asp Phe Val Thr Tyr Met Arg Asn
145 150 155 160
Asn Gly Val Asn Leu Tyr Ala Ile Ser Val Gln Asn Glu Pro Asp Tyr
165 170 175
Ala His Asp Trp Thr Trp Trp Thr Pro Gln Glu Met Leu Arg Phe Met
180 185 190
Lys Glu Asn Ala Gly Ser Ile Asn Ser Arg Val Ile Ala Pro Glu Ser
195 200 205
Phe Gln Tyr Leu Lys Asn Met Ser Asp Pro Ile Leu Asn Asp Pro Gln
210 215 220
Ala Leu Ala Asn Met Asp Ile Leu Gly Ala His Leu Tyr Gly Thr Gln
225 230 235 240
Val Ser Asn Phe Ala Tyr Pro Leu Phe Lys Gln Lys Gly Ala Gly Lys
245 250 255
Asp Leu Trp Met Thr Glu Val Tyr Tyr Pro Asn Ser Asp Asn Asn Ser
260 265 270
Ala Asp Arg Trp Pro Glu Ala Leu Asp Val Ser Tyr His Ile His Asn
275 280 285
Ala Met Val Glu Gly Asp Phe Gln Ala Tyr Val Trp Trp Tyr Ile Arg
290 295 300
Arg Ser Tyr Gly Pro Met Lys Glu Asp Gly Thr Ile Ser Lys Arg Gly
305 310 315 320
Tyr Asn Met Ala His Phe Ser Lys Phe Val Arg Pro Gly Tyr Val Arg
325 330 335
Val Asp Ala Ser Lys Asn Pro Glu Thr Asn Val Tyr Val Ser Ala Tyr
340 345 350
Lys Gly Asp Asn Lys Ile Val Ile Val Ala Ile Asn Arg Asn Asn Ser
355 360 365
Gly Val Asn Gln Asn Phe Val Leu Gln Asn Gly Ser Val Ser Gln Val
370 375 380
Ser Arg Trp Ile Thr Ser Ser Ser Ser Asn Leu Gln Pro Gly Thr Ser
385 390 395 400
Leu Asn Val Thr Gly Ser Asn Phe Trp Ala His Leu Pro Ala Gln Ser
405 410 415
Val Thr Thr Phe Val Gly Glu Leu Gly Arg
420 425
<210> 241
<211> 1695
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 241
gtgaagatat tgaaatttaa gatgaattta aaaaaatcgg ttcatgttct gttggcctgt 60
ttaacagccc tgcctctcat gttaacgccg acacacgtat cagcagcaag tgatgccaac 120
attaatttgt cctccgaaaa acagcttatc aaggggtttg gaggtattaa ccacccagcc 180
tggattggcg acttgacggc agctcagcgt gaaacagcct ttggcaacgg agcgaaccag 240
cttggttttt ccatactaag aatctatgtc gatgaaaatc caaacaactg gtacagggag 300
gtggctactg ccaaaagagc catagagcaa ggtgccatcg tattcgcttc tccctggaat 360
ccaccaagtg acatggtcga aaccttcaat cggaacgggg atacgaacgc caaacgattg 420
agatacgaca aatatgctgc gtacgcgcag catctgaacg actttgtcag ttatatgaaa 480
aataacggtg tggatctgta tgccatttcg gtacaaaatg agccggatta tgcccatgaa 540
tggacctggt ggactccgca ggagatcctt cgtttcatga aggagaatgc gggatccatt 600
cagaatacca aagtcatggc acctgaatcg ttccagtatt tgaaaaacat gtctgacccg 660
attctgaatg atcctcaggc actcgccaat atggacattc tgggagctca tacgtacggg 720
acacagttca aagatttcgc atacccgctc tttaagcaaa agggagccgg caaagaactg 780
tggatgacag aagtgtatta cccgaacagc gataacaact cgtcggaccg ttggcctgag 840
gcattggacg tatcttacca tatgcataat gccatggttg aaggagattt tcaggcttac 900
gtatggtggt atattcggag acagtacggt ccgatgaatg agaacgggac tattagcaaa 960
cgtggttaca atatggccca tttctccaaa tttgtgcgac caggctatta ccgtgtcgat 1020
gcaaccaaaa atccggatac caataccttc gtctcagcct ataaaggtga taataaggca 1080
gtcattgtgg cgattaatcg cggcacctcg gctgtaagcc aaaaattcgt tcttcagaat 1140
ggtaacgctt ctactgtatc ctcttgggtt acggatagca gccgaaacct ggcaagcgga 1200
gcgccgatta cgatgtcagg tggagccttt acagcacaac tgccagccca aagcgtaaca 1260
acgtttgtag ccaacattac tggtggtagt gtcactccag gcagcggaac cacgtacgag 1320
gcggaaacgg gcactacact taccgatgcc gtgatcgaga ctctctaccc gggatacact 1380
gggaccggat acgtgaactt taatgcgtat actggttcgg ccattcaatg gaatgccatc 1440
aataacacga taacaggtac caaaaatgtg aaatttcgtt acgcccagga aagcggaacg 1500
cgtaatctcg acattttcgt taacggaact aaagtcatca gcaacgaacc tttcccggca 1560
acaggcagct ggtcgacctg gagtgaaaaa actattcagg tccccatgaa cgcgggaacc 1620
aatacgatta aagtggtcac aaccggtaca gaagggccaa atattgataa catcaatgtc 1680
actgcagtcc aataa 1695
<210> 242
<211> 564
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(28)
<400> 242
Val Lys Ile Leu Lys Phe Lys Met Asn Leu Lys Lys Ser Val His Val
1 5 10 15
Leu Leu Ala Cys Leu Thr Ala Leu Pro Leu Met Leu Thr Pro Thr His
20 25 30
Val Ser Ala Ala Ser Asp Ala Asn Ile Asn Leu Ser Ser Glu Lys Gln
35 40 45
Leu Ile Lys Gly Phe Gly Gly Ile Asn His Pro Ala Trp Ile Gly Asp
50 55 60
Leu Thr Ala Ala Gln Arg Glu Thr Ala Phe Gly Asn Gly Ala Asn Gln
65 70 75 80
Leu Gly Phe Ser Ile Leu Arg Ile Tyr Val Asp Glu Asn Pro Asn Asn
85 90 95
Trp Tyr Arg Glu Val Ala Thr Ala Lys Arg Ala Ile Glu Gln Gly Ala
100 105 110
Ile Val Phe Ala Ser Pro Trp Asn Pro Pro Ser Asp Met Val Glu Thr
115 120 125
Phe Asn Arg Asn Gly Asp Thr Asn Ala Lys Arg Leu Arg Tyr Asp Lys
130 135 140
Tyr Ala Ala Tyr Ala Gln His Leu Asn Asp Phe Val Ser Tyr Met Lys
145 150 155 160
Asn Asn Gly Val Asp Leu Tyr Ala Ile Ser Val Gln Asn Glu Pro Asp
165 170 175
Tyr Ala His Glu Trp Thr Trp Trp Thr Pro Gln Glu Ile Leu Arg Phe
180 185 190
Met Lys Glu Asn Ala Gly Ser Ile Gln Asn Thr Lys Val Met Ala Pro
195 200 205
Glu Ser Phe Gln Tyr Leu Lys Asn Met Ser Asp Pro Ile Leu Asn Asp
210 215 220
Pro Gln Ala Leu Ala Asn Met Asp Ile Leu Gly Ala His Thr Tyr Gly
225 230 235 240
Thr Gln Phe Lys Asp Phe Ala Tyr Pro Leu Phe Lys Gln Lys Gly Ala
245 250 255
Gly Lys Glu Leu Trp Met Thr Glu Val Tyr Tyr Pro Asn Ser Asp Asn
260 265 270
Asn Ser Ser Asp Arg Trp Pro Glu Ala Leu Asp Val Ser Tyr His Met
275 280 285
His Asn Ala Met Val Glu Gly Asp Phe Gln Ala Tyr Val Trp Trp Tyr
290 295 300
Ile Arg Arg Gln Tyr Gly Pro Met Asn Glu Asn Gly Thr Ile Ser Lys
305 310 315 320
Arg Gly Tyr Asn Met Ala His Phe Ser Lys Phe Val Arg Pro Gly Tyr
325 330 335
Tyr Arg Val Asp Ala Thr Lys Asn Pro Asp Thr Asn Thr Phe Val Ser
340 345 350
Ala Tyr Lys Gly Asp Asn Lys Ala Val Ile Val Ala Ile Asn Arg Gly
355 360 365
Thr Ser Ala Val Ser Gln Lys Phe Val Leu Gln Asn Gly Asn Ala Ser
370 375 380
Thr Val Ser Ser Trp Val Thr Asp Ser Ser Arg Asn Leu Ala Ser Gly
385 390 395 400
Ala Pro Ile Thr Met Ser Gly Gly Ala Phe Thr Ala Gln Leu Pro Ala
405 410 415
Gln Ser Val Thr Thr Phe Val Ala Asn Ile Thr Gly Gly Ser Val Thr
420 425 430
Pro Gly Ser Gly Thr Thr Tyr Glu Ala Glu Thr Gly Thr Thr Leu Thr
435 440 445
Asp Ala Val Ile Glu Thr Leu Tyr Pro Gly Tyr Thr Gly Thr Gly Tyr
450 455 460
Val Asn Phe Asn Ala Tyr Thr Gly Ser Ala Ile Gln Trp Asn Ala Ile
465 470 475 480
Asn Asn Thr Ile Thr Gly Thr Lys Asn Val Lys Phe Arg Tyr Ala Gln
485 490 495
Glu Ser Gly Thr Arg Asn Leu Asp Ile Phe Val Asn Gly Thr Lys Val
500 505 510
Ile Ser Asn Glu Pro Phe Pro Ala Thr Gly Ser Trp Ser Thr Trp Ser
515 520 525
Glu Lys Thr Ile Gln Val Pro Met Asn Ala Gly Thr Asn Thr Ile Lys
530 535 540
Val Val Thr Thr Gly Thr Glu Gly Pro Asn Ile Asp Asn Ile Asn Val
545 550 555 560
Thr Ala Val Gln
<210> 243
<211> 1272
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 243
atgatttcaa gcgtaaaaaa accaatttgt gtattattgg tatgtttcac tatgctgtca 60
gtcatgttag ccgggccagg tgctactgaa gttttagcag caagtgatgt aacaattaat 120
ttatctgcag aaaaacaagt gatccgcggt tttggaggca tgaaccaccc ggcttggatt 180
ggagatttga cagcagctca aagagaaacc gcttttggca atggacagaa tcagttaggt 240
ttttcaatct taagaattca tgtggatgaa aatagaaata attggtacag agaagtggag 300
actgcaaaga gtgcgatcaa acatggagca atcgtttttg cttctccctg gaatcctcca 360
agcgatatgg ttgagacttt caatcgtaat ggtgacacat cagctaaacg gctaagatac 420
gataagtacg ccgcatacgc gcagcatctt aacgattttg ttacctacat gaagaataat 480
ggcgtgaatc tttatgcgat ttctgttcaa aacgagcctg attatgcgca cgaatggacg 540
tggtggactc cgcaagaaat acttcgtttc atgagagaaa atgccggttc cattaatgca 600
cgtgtcattg caccagaatc ttttcagtac tttaaaaata tatcggaccc cattttgaac 660
gatccacagg cgcttaggaa tatggatatt ctcggaactc acctgtacgg tactcaggtc 720
agtcagtttc cttatcctct attcaaacaa aaaggagcag ggaaagagct atggatgacg 780
gaagtatact atccaaacag tgacaacaat tcagcggatc gctggcccga ggcattaggc 840
gtttcagagc atattcacca ttcaatggtg gagggagatt ttcaatctta tgtttggtgg 900
tacatccgca gatcttacgg tcctatgaaa gaggacggta cgatcagcaa acgcggttac 960
aatatggctc atttctcgaa gtttgtgcgt cccggctatg taagggtaga tgcaacgaaa 1020
aatcctaatg cgaacgttta cgtgtcagcc tataaaggtg acaacaaggt cgttattgtt 1080
gccattaaca aaagcaatac aggggtcaac caaaactttg tgttgcagaa tggatctgct 1140
tctcaggtat ctaggtggat aacaagcgga agcagcaatc ttcaacctgg aacgaatctc 1200
aatgtaacgg gcaatcattt ttgggcccat cttccagctc aaagcgtgac aacatttgtc 1260
gcaaatcgtt aa 1272
<210> 244
<211> 423
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(33)
<400> 244
Met Ile Ser Ser Val Lys Lys Pro Ile Cys Val Leu Leu Val Cys Phe
1 5 10 15
Thr Met Leu Ser Val Met Leu Ala Gly Pro Gly Ala Thr Glu Val Leu
20 25 30
Ala Ala Ser Asp Val Thr Ile Asn Leu Ser Ala Glu Lys Gln Val Ile
35 40 45
Arg Gly Phe Gly Gly Met Asn His Pro Ala Trp Ile Gly Asp Leu Thr
50 55 60
Ala Ala Gln Arg Glu Thr Ala Phe Gly Asn Gly Gln Asn Gln Leu Gly
65 70 75 80
Phe Ser Ile Leu Arg Ile His Val Asp Glu Asn Arg Asn Asn Trp Tyr
85 90 95
Arg Glu Val Glu Thr Ala Lys Ser Ala Ile Lys His Gly Ala Ile Val
100 105 110
Phe Ala Ser Pro Trp Asn Pro Pro Ser Asp Met Val Glu Thr Phe Asn
115 120 125
Arg Asn Gly Asp Thr Ser Ala Lys Arg Leu Arg Tyr Asp Lys Tyr Ala
130 135 140
Ala Tyr Ala Gln His Leu Asn Asp Phe Val Thr Tyr Met Lys Asn Asn
145 150 155 160
Gly Val Asn Leu Tyr Ala Ile Ser Val Gln Asn Glu Pro Asp Tyr Ala
165 170 175
His Glu Trp Thr Trp Trp Thr Pro Gln Glu Ile Leu Arg Phe Met Arg
180 185 190
Glu Asn Ala Gly Ser Ile Asn Ala Arg Val Ile Ala Pro Glu Ser Phe
195 200 205
Gln Tyr Phe Lys Asn Ile Ser Asp Pro Ile Leu Asn Asp Pro Gln Ala
210 215 220
Leu Arg Asn Met Asp Ile Leu Gly Thr His Leu Tyr Gly Thr Gln Val
225 230 235 240
Ser Gln Phe Pro Tyr Pro Leu Phe Lys Gln Lys Gly Ala Gly Lys Glu
245 250 255
Leu Trp Met Thr Glu Val Tyr Tyr Pro Asn Ser Asp Asn Asn Ser Ala
260 265 270
Asp Arg Trp Pro Glu Ala Leu Gly Val Ser Glu His Ile His His Ser
275 280 285
Met Val Glu Gly Asp Phe Gln Ser Tyr Val Trp Trp Tyr Ile Arg Arg
290 295 300
Ser Tyr Gly Pro Met Lys Glu Asp Gly Thr Ile Ser Lys Arg Gly Tyr
305 310 315 320
Asn Met Ala His Phe Ser Lys Phe Val Arg Pro Gly Tyr Val Arg Val
325 330 335
Asp Ala Thr Lys Asn Pro Asn Ala Asn Val Tyr Val Ser Ala Tyr Lys
340 345 350
Gly Asp Asn Lys Val Val Ile Val Ala Ile Asn Lys Ser Asn Thr Gly
355 360 365
Val Asn Gln Asn Phe Val Leu Gln Asn Gly Ser Ala Ser Gln Val Ser
370 375 380
Arg Trp Ile Thr Ser Gly Ser Ser Asn Leu Gln Pro Gly Thr Asn Leu
385 390 395 400
Asn Val Thr Gly Asn His Phe Trp Ala His Leu Pro Ala Gln Ser Val
405 410 415
Thr Thr Phe Val Ala Asn Arg
420
<210> 245
<211> 1263
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 245
atgtcaatga tcaaaaaacc aatctgcact ttattgatct gcttcaccat gctgtctgtc 60
atgttcatcg gacctggcgt gactgaggtt tcagcagcag atgccaatat taatatcaat 120
gcggaaagac aagtgattcg cggctttggc ggaatgaacc atccggcttg gattggtgat 180
ttgaccgcac ctcaaaggga aaccgccttt ggcaatgggc agaatcaatt aggattttcc 240
attctaagaa tttttgtaga tgagaaccga aataattggc acagagaggt cgctactgcc 300
aaaagagcaa tagagcatgg agctttggtg atcgcttcac catggaatcc tccaagcaat 360
atggtagaga ccttcaaccg gaatggtaca tctgcaaagc ggctcagata caaccaatac 420
gccgcatatg ctcagcatct gaacgatttt gtgacgtata tgaaaaataa tggcgtcaat 480
ctctatgcta tatctgtaca aaatgagccc gattatgcac acgaatggac atggtggact 540
cctcaggaaa tcctgcgttt catgagagaa aatgctggct ccattaatgc ccgcgtgatc 600
gcaccagaat cctttcaata ccttaaaaat atatcagatc ctatcctaaa cgatccgcag 660
gcgcttggaa acatggacat tctcggagcc catttgtacg gaacccaaat cagccagctt 720
ccgtatcctc ttttcaaaca aaagggaggg ggaaaggagc tttggatgac agaggtctac 780
tacccgaata gcgataacaa ttcagcggac cgctggcctg aagcattagg ggtttcagag 840
catattcacc attcgatggt agaaggggac tttcaggcat atgtttggtg gtacattcgc 900
agatcctacg gccctatgaa agaagacggt ctaatcagca aacgtggtta caacatggcg 960
catttctcca agtttgtacg cccaggatac atcagaattg atgcaacgaa aagtcctgaa 1020
ccgaatgttt tcgtatcagc ctataaagga aacaatcaag tcgtcattgt cgcgattaac 1080
aaaaacaata caggagtcaa tcagcacttt gtgatgcaaa acggaactgc ttcacaagcg 1140
tcaagatgga tcacaagtag caacagcaac cttcagcctg gtacagactt aaatatatca 1200
ggtaatcaat tttgggctca tctcccggct caaagtgtga caacatttgt ggtcaaacgc 1260
tag 1263
<210> 246
<211> 401
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(32)
<400> 246
Met Ser Met Ile Lys Lys Pro Ile Cys Thr Leu Leu Ile Cys Phe Thr
1 5 10 15
Met Leu Ser Val Met Phe Ile Gly Pro Gly Val Thr Glu Val Ser Ala
20 25 30
Ala Asp Ala Asn Ile Asn Ile Asn Ala Glu Arg Gln Val Ile Arg Gly
35 40 45
Phe Gly Gly Met Asn His Pro Ala Trp Ile Gly Asp Leu Thr Ala Pro
50 55 60
Gln Arg Glu Thr Ala Phe Gly Asn Gly Gln Asn Gln Leu Gly Phe Ser
65 70 75 80
Ile Leu Arg Ile Phe Val Asp Glu Asn Arg Asn Asn Trp His Arg Glu
85 90 95
Val Ala Thr Ala Lys Arg Ala Ile Glu His Gly Ala Leu Val Ile Ala
100 105 110
Ser Pro Trp Asn Pro Pro Ser Asn Met Val Glu Thr Phe Asn Arg Asn
115 120 125
Gly Thr Ser Ala Lys Arg Leu Arg Tyr Asn Gln Tyr Ala Ala Tyr Ala
130 135 140
Gln His Leu Asn Asp Phe Val Thr Tyr Met Lys Asn Asn Gly Val Asn
145 150 155 160
Leu Tyr Ala Ile Ser Val Gln Asn Glu Pro Asp Tyr Ala His Glu Trp
165 170 175
Thr Trp Trp Thr Pro Gln Glu Ile Leu Arg Phe Met Arg Glu Asn Ala
180 185 190
Gly Ser Ile Asn Ala Arg Val Ile Ala Pro Glu Ser Phe Gln Tyr Leu
195 200 205
Lys Asn Ile Ser Asp Pro Ile Leu Asn Asp Pro Gln Ala Leu Gly Asn
210 215 220
Met Asp Ile Leu Gly Ala His Leu Tyr Gly Thr Gln Ile Ser Gln Leu
225 230 235 240
Pro Tyr Pro Leu Phe Lys Gln Lys Gly Gly Gly Lys Glu Leu Trp Met
245 250 255
Thr Glu Val Tyr Tyr Pro Asn Ser Asp Asn Asn Ser Ala Asp Arg Trp
260 265 270
Pro Glu Ala Leu Gly Val Ser Glu His Ile His His Ser Met Val Glu
275 280 285
Gly Asp Phe Gln Ala Tyr Val Trp Trp Tyr Ile Arg Arg Ser Tyr Gly
290 295 300
Pro Met Lys Glu Asp Gly Leu Ile Ser Lys Arg Gly Tyr Asn Met Ala
305 310 315 320
His Phe Ser Lys Phe Val Arg Pro Gly Tyr Ile Arg Ile Asp Ala Thr
325 330 335
Lys Ser Pro Glu Pro Asn Val Phe Val Ser Ala Tyr Lys Gly Asn Asn
340 345 350
Gln Val Val Ile Val Ala Ile Asn Lys Asn Asn Thr Gly Val Asn Gln
355 360 365
His Phe Val Met Gln Asn Gly Thr Ala Ser Gln Ala Ser Arg Trp Ile
370 375 380
Thr Ser Ser Asn Ser Asn Leu Gln Pro Gly Thr Asp Leu Asn Ile Ser
385 390 395 400
Gly
<210> 247
<211> 1044
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 247
gtgtttgcca acgatttcct gataggcgtg gcgctcaact cacggcaggt cgccggggaa 60
tccgaggccg gaaaactagc tggcgcgcaa ttttcgtcgg tgacggcgga gaatgagatg 120
aagtggcagt cgctccatcc ccagcccgac cgctatcagt tcggcgcggc ggactcctac 180
atcgattttg ccaaaaaaca caagatggcg gtgatcggcc acacgctcgt gtggcacagc 240
cagacacccg gctgggtgtt cgagggcaag gacggcaagc cggcgacccg cgaggatctg 300
ctcaagcgca tgcgcgatca catccacacc gtggccggac gctacaaggg caaggtgcgc 360
ggctgggacg tggtcaacga ggccttgtcc gacggcggtc ccgaaatcct gcgggattct 420
ccgtggcggc gcatcatcgg cgatgacttc atcgaccacg cgttccgttt cgcccgtgag 480
gccgatccga aagccgaact ctactacaac gactacggtc tcgagaacga aaggaagcgg 540
agcaactgca tcaagctcgt caagggcatg aaacaacgcg gcgtgccgat cgacggggtg 600
ggcacccagt cgcatttcca cttgaaacat ccctcgctcc aggaaatcga aaagaccatc 660
aaggactttt ccgaactcgg actcaaggtg atgatcaccg agctggatgt cgatgtgctg 720
ccgtcgcgtg gcaatttcgg caacgccgac atcagccgcc gcgagcaggg cggtgacgca 780
ctcaatcctt acaccggcgg cttgcccgat gaggtccaac aggaacttgc gaaacgctat 840
gcggacattt ttgatatcta tctgcgccac cggaaggcgg tcacccgcgt aaccttctgg 900
ggactcgatg acgggcatac ctggttgaac ggtttcccga tccgcggacg caccaactat 960
ccgctgttgt tcgaccgcgc cctcaagccg aagcccgcgt tcgaggcggt catcaaaaaa 1020
gggcttgaac ccaggaaacg ttga 1044
<210> 248
<211> 347
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 248
Val Phe Ala Asn Asp Phe Leu Ile Gly Val Ala Leu Asn Ser Arg Gln
1 5 10 15
Val Ala Gly Glu Ser Glu Ala Gly Lys Leu Ala Gly Ala Gln Phe Ser
20 25 30
Ser Val Thr Ala Glu Asn Glu Met Lys Trp Gln Ser Leu His Pro Gln
35 40 45
Pro Asp Arg Tyr Gln Phe Gly Ala Ala Asp Ser Tyr Ile Asp Phe Ala
50 55 60
Lys Lys His Lys Met Ala Val Ile Gly His Thr Leu Val Trp His Ser
65 70 75 80
Gln Thr Pro Gly Trp Val Phe Glu Gly Lys Asp Gly Lys Pro Ala Thr
85 90 95
Arg Glu Asp Leu Leu Lys Arg Met Arg Asp His Ile His Thr Val Ala
100 105 110
Gly Arg Tyr Lys Gly Lys Val Arg Gly Trp Asp Val Val Asn Glu Ala
115 120 125
Leu Ser Asp Gly Gly Pro Glu Ile Leu Arg Asp Ser Pro Trp Arg Arg
130 135 140
Ile Ile Gly Asp Asp Phe Ile Asp His Ala Phe Arg Phe Ala Arg Glu
145 150 155 160
Ala Asp Pro Lys Ala Glu Leu Tyr Tyr Asn Asp Tyr Gly Leu Glu Asn
165 170 175
Glu Arg Lys Arg Ser Asn Cys Ile Lys Leu Val Lys Gly Met Lys Gln
180 185 190
Arg Gly Val Pro Ile Asp Gly Val Gly Thr Gln Ser His Phe His Leu
195 200 205
Lys His Pro Ser Leu Gln Glu Ile Glu Lys Thr Ile Lys Asp Phe Ser
210 215 220
Glu Leu Gly Leu Lys Val Met Ile Thr Glu Leu Asp Val Asp Val Leu
225 230 235 240
Pro Ser Arg Gly Asn Phe Gly Asn Ala Asp Ile Ser Arg Arg Glu Gln
245 250 255
Gly Gly Asp Ala Leu Asn Pro Tyr Thr Gly Gly Leu Pro Asp Glu Val
260 265 270
Gln Gln Glu Leu Ala Lys Arg Tyr Ala Asp Ile Phe Asp Ile Tyr Leu
275 280 285
Arg His Arg Lys Ala Val Thr Arg Val Thr Phe Trp Gly Leu Asp Asp
290 295 300
Gly His Thr Trp Leu Asn Gly Phe Pro Ile Arg Gly Arg Thr Asn Tyr
305 310 315 320
Pro Leu Leu Phe Asp Arg Ala Leu Lys Pro Lys Pro Ala Phe Glu Ala
325 330 335
Val Ile Lys Lys Gly Leu Glu Pro Arg Lys Arg
340 345
<210> 249
<211> 1439
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 249
tgatcaatcc agtgaaggat cttcgtgaag atttcatctt tggaatggac gtttcaatgc 60
tctacgagat agagcggctc ggtggtaagt tcttcgatgg tggtgtggag aaagatcttt 120
tccagatact gaaggatcat gagataaact ggatcagatt gagagtgtgg aacgatccaa 180
gggatgaaaa cggaaatccg ctcggtgggg gaaactgtga ttatctgaaa atgacagaga 240
tcgcaaaaag ggccaaaaag tacggaatga aggttcttct tgactttcac tacagcgact 300
ggtgggcaga tcccggcaag cagtacaaac caaaagagtg ggatcacctt catggagaac 360
ttctggaaag ggcggtgtat tcctacacga aactcgtgct gaatcatatg agaagaaacg 420
gtgcactgcc ggacatggtc caggtgggaa acgaggtgaa caacggcttt ctctggccgg 480
atggaatgat tgccggaaag gatgcaggag gattcgacgg attcacaaaa cttttgaagg 540
cggccatcaa agccgtcagg gaagttgatc ccgatatcaa gatagtcatt catttggcag 600
aaggtggaaa caactcactt ttcaggtggt tcttcgacga gatcacaaga agagacgtgg 660
attttgatgt gatcggtgta tcgtactatc cgtactggca tggtaccctg gatgacctga 720
agaacaacct gtacgacata gcgaaaagat acaacaaaga cgtgctcatc gttgaaacgg 780
cgtatgcctg gacactcgag gacggggacg gttaccccaa catcttcagt ggtgaagaga 840
tggagctcac gggtggttac aaagcaacgg ttcagggaca ggcaacgttc ttgagggatc 900
tcatagaagt ggtgaacagt gttcctgacg gtcacggtct tgggatcttc tattgggaag 960
gagactggat tcctgtgaaa ggagccggct ggaaaaccgg cgaaggaaat ccatgggaga 1020
atcaggccat gtttgatttc aatggaaatg ctctcccatc cctggatgtt ttcaagctcg 1080
tgaggacagt cactcctatg gaaataaaaa tcgaagagat tctgcctgtg gagatctcga 1140
cgaatttggg agagattccg aagtttccgg atgctgtgaa agtgctgttc agcgatgatt 1200
ccatcagatc cctgaaagtt acatggaatt ttgatccttc tcttgttgaa acacccggtg 1260
tctacagagt ggaaggatac gtggaaagta tagaccagaa gatcttcgca accttgactg 1320
tgaagggaag tagaaactac ctgaagaacc ctgggtttga aacgggtgag ttttctccct 1380
ggaaggtgtt cggtaacgga aaacgcagtg aaggtggtaa aggccgatcc tccgagtaa 1439
<210> 250
<211> 479
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(33)
<400> 250
Met Ile Asn Pro Val Lys Asp Leu Arg Glu Asp Phe Ile Phe Gly Met
1 5 10 15
Asp Val Ser Met Leu Tyr Glu Ile Glu Arg Leu Gly Gly Lys Phe Phe
20 25 30
Asp Gly Gly Val Glu Lys Asp Leu Phe Gln Ile Leu Lys Asp His Glu
35 40 45
Ile Asn Trp Ile Arg Leu Arg Val Trp Asn Asp Pro Arg Asp Glu Asn
50 55 60
Gly Asn Pro Leu Gly Gly Gly Asn Cys Asp Tyr Leu Lys Met Thr Glu
65 70 75 80
Ile Ala Lys Arg Ala Lys Lys Tyr Gly Met Lys Val Leu Leu Asp Phe
85 90 95
His Tyr Ser Asp Trp Trp Ala Asp Pro Gly Lys Gln Tyr Lys Pro Lys
100 105 110
Glu Trp Asp His Leu His Gly Glu Leu Leu Glu Arg Ala Val Tyr Ser
115 120 125
Tyr Thr Lys Leu Val Leu Asn His Met Arg Arg Asn Gly Ala Leu Pro
130 135 140
Asp Met Val Gln Val Gly Asn Glu Val Asn Asn Gly Phe Leu Trp Pro
145 150 155 160
Asp Gly Met Ile Ala Gly Lys Asp Ala Gly Gly Phe Asp Gly Phe Thr
165 170 175
Lys Leu Leu Lys Ala Ala Ile Lys Ala Val Arg Glu Val Asp Pro Asp
180 185 190
Ile Lys Ile Val Ile His Leu Ala Glu Gly Gly Asn Asn Ser Leu Phe
195 200 205
Arg Trp Phe Phe Asp Glu Ile Thr Arg Arg Asp Val Asp Phe Asp Val
210 215 220
Ile Gly Val Ser Tyr Tyr Pro Tyr Trp His Gly Thr Leu Asp Asp Leu
225 230 235 240
Lys Asn Asn Leu Tyr Asp Ile Ala Lys Arg Tyr Asn Lys Asp Val Leu
245 250 255
Ile Val Glu Thr Ala Tyr Ala Trp Thr Leu Glu Asp Gly Asp Gly Tyr
260 265 270
Pro Asn Ile Phe Ser Gly Glu Glu Met Glu Leu Thr Gly Gly Tyr Lys
275 280 285
Ala Thr Val Gln Gly Gln Ala Thr Phe Leu Arg Asp Leu Ile Glu Val
290 295 300
Val Asn Ser Val Pro Asp Gly His Gly Leu Gly Ile Phe Tyr Trp Glu
305 310 315 320
Gly Asp Trp Ile Pro Val Lys Gly Ala Gly Trp Lys Thr Gly Glu Gly
325 330 335
Asn Pro Trp Glu Asn Gln Ala Met Phe Asp Phe Asn Gly Asn Ala Leu
340 345 350
Pro Ser Leu Asp Val Phe Lys Leu Val Arg Thr Val Thr Pro Met Glu
355 360 365
Ile Lys Ile Glu Glu Ile Leu Pro Val Glu Ile Ser Thr Asn Leu Gly
370 375 380
Glu Ile Pro Lys Phe Pro Asp Ala Val Lys Val Leu Phe Ser Asp Asp
385 390 395 400
Ser Ile Arg Ser Leu Lys Val Thr Trp Asn Phe Asp Pro Ser Leu Val
405 410 415
Glu Thr Pro Gly Val Tyr Arg Val Glu Gly Tyr Val Glu Ser Ile Asp
420 425 430
Gln Lys Ile Phe Ala Thr Leu Thr Val Lys Gly Ser Arg Asn Tyr Leu
435 440 445
Lys Asn Pro Gly Phe Glu Thr Gly Glu Phe Ser Pro Trp Lys Val Phe
450 455 460
Gly Asn Gly Lys Arg Ser Glu Gly Gly Lys Gly Arg Ser Ser Glu
465 470 475
<210> 251
<211> 555
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 251
atggctacgg attattggca atattggacg gatggcggcg gaacggtgaa tgcggttaac 60
gggtccgggg gcaattacag cgtaacttgg caaaatagcg gggacttcgt ggtcggcaaa 120
ggctggagcg tagggtcgcc aaatcggacg atcaattaca atgccggcat ctgggaacct 180
tcggggaacg ggtacttgac cctttacgga tggactagaa actcgctgat cgagtattac 240
gttgtcgaca gttgggggac gtaccggcca acaggtactc acaaaggaac ggtgaacagc 300
gacggaggca cctacgatat ttatacgacc atgcgctata atgcgccttc cattgatggc 360
acgcagacgt tccaacagtt ctggagcgtg cggcaatcga aacgaccaac cggcagcaac 420
gtctccatca ccttcagcaa tcacgtgaat gcctggagaa gcaagggcat gaacctgggc 480
agcagctggt cgtaccaggt cttggcgacg gaaggctatc agagcagcgg aagatccaac 540
gtcacggtgt ggtaa 555
<210> 252
<211> 184
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 252
Met Ala Thr Asp Tyr Trp Gln Tyr Trp Thr Asp Gly Gly Gly Thr Val
1 5 10 15
Asn Ala Val Asn Gly Ser Gly Gly Asn Tyr Ser Val Thr Trp Gln Asn
20 25 30
Ser Gly Asp Phe Val Val Gly Lys Gly Trp Ser Val Gly Ser Pro Asn
35 40 45
Arg Thr Ile Asn Tyr Asn Ala Gly Ile Trp Glu Pro Ser Gly Asn Gly
50 55 60
Tyr Leu Thr Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr Tyr
65 70 75 80
Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr His Lys Gly
85 90 95
Thr Val Asn Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Met Arg
100 105 110
Tyr Asn Ala Pro Ser Ile Asp Gly Thr Gln Thr Phe Gln Gln Phe Trp
115 120 125
Ser Val Arg Gln Ser Lys Arg Pro Thr Gly Ser Asn Val Ser Ile Thr
130 135 140
Phe Ser Asn His Val Asn Ala Trp Arg Ser Lys Gly Met Asn Leu Gly
145 150 155 160
Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln Ser Ser
165 170 175
Gly Arg Ser Asn Val Thr Val Trp
180
<210> 253
<211> 1047
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 253
atgattgtta gcttcaagag cctgaaggca ctcgcgtgcc tcggcgtgct cggcatcacc 60
gccgcgcacg cgcaaacctg catcacgtcg agccagacgg gcaccaacaa cggcaattac 120
ttttcgttct ggaaagacag tccgggcacg gtgaacttct gcatgtatgc gaatggccgc 180
tatacctcca actggagcgg catcaacaac tgggtgggcg gcaagggctg ggctaccggc 240
tccagccaca cgatcagcta ctccggcacg ttcaattcgc cgggcaacgg ttacctggcc 300
ctgtatggct ggaccaccaa tccattggtc gagtactaca tcgtcgacag ctggggtacc 360
taccgtccgc cgggcggcca gggtttcatg ggcacggtag ttagcgacgg gggcacgtac 420
gacgtgtacc ggacgcaacg cgtgaaccag ccatccatca tcggcaacgc cacgttctac 480
cagtactgga gcgtgcggca gtcgaagcgc gtgggcggca ccatcaccat cgccaaccat 540
ttcaacgcct gggccacgct gggcatgaac ctgggccagc acaactacca ggtcatggcc 600
accgagggtt accagagcag cggcagctcc gacatcaccg tgaccgaagg tggcggcagy 660
tcctcgtcgt cctcgggcgg cggcagcacc agcagcagtg gtggcggcgg caacaagagc 720
ttcacggtgc gtgcgcgcgg cacggccgga ggcgagaaca tccagctgca ggtgaacaac 780
cagacggtcg cgagctggaa cctcaccacc agcatgcaga actacaccgc ctcgaccagc 840
ctgagcggcg gcatcaccgt gctctacacc aacgacggcg gcagccgcga cgtgcaggtg 900
gactacatca tcgtgaacgg ccagacccgc cagtccgaag cgcagagcta caacaccggg 960
ttgtatgcga atggacgctg cggcggtggc tcgaacagcg agtggatgca ttgcaacggc 1020
gcgatcggct acggcaatac gccctga 1047
<210> 254
<211> 347
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(24)
<400> 254
Met Ile Val Ser Phe Lys Ser Leu Lys Ala Leu Ala Cys Leu Gly Val
1 5 10 15
Leu Gly Ile Thr Ala Ala His Ala Gln Thr Cys Ile Thr Ser Ser Gln
20 25 30
Thr Gly Thr Asn Asn Gly Asn Tyr Phe Ser Phe Trp Lys Asp Ser Pro
35 40 45
Gly Thr Val Asn Phe Cys Met Tyr Ala Asn Gly Arg Tyr Thr Ser Asn
50 55 60
Trp Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Ala Thr Gly
65 70 75 80
Ser Ser His Thr Ile Ser Tyr Ser Gly Thr Phe Asn Ser Pro Gly Asn
85 90 95
Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr
100 105 110
Tyr Ile Val Asp Ser Trp Gly Thr Tyr Arg Pro Pro Gly Gly Gln Gly
115 120 125
Phe Met Gly Thr Val Val Ser Asp Gly Gly Thr Tyr Asp Val Tyr Arg
130 135 140
Thr Gln Arg Val Asn Gln Pro Ser Ile Ile Gly Asn Ala Thr Phe Tyr
145 150 155 160
Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Val Gly Gly Thr Ile Thr
165 170 175
Ile Ala Asn His Phe Asn Ala Trp Ala Thr Leu Gly Met Asn Leu Gly
180 185 190
Gln His Asn Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly
195 200 205
Ser Ser Asp Ile Thr Val Thr Glu Gly Gly Gly Ser Ser Ser Ser Ser
210 215 220
Gly Gly Gly Ser Thr Ser Ser Ser Gly Gly Gly Gly Asn Lys Ser Phe
225 230 235 240
Thr Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Asn Ile Gln Leu Gln
245 250 255
Val Asn Asn Gln Thr Val Ala Ser Trp Asn Leu Thr Thr Ser Met Gln
260 265 270
Asn Tyr Thr Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val Leu Tyr
275 280 285
Thr Asn Asp Gly Gly Ser Arg Asp Val Gln Val Asp Tyr Ile Ile Val
290 295 300
Asn Gly Gln Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly Leu
305 310 315 320
Tyr Ala Asn Gly Arg Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His
325 330 335
Cys Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro
340 345
<210> 255
<211> 1137
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 255
ttgatctttt ccgtcagtgg ttccgcgtct cggcggcgcc ctggcatcca caagggggat 60
tccatgattt tcggtctaaa gtcgatcacg ggcaggcgcg ccgtcgcggc gctggcctgc 120
cttgccggcc tctacatggc gccggcgaat gcgcaaacct gcatcacgtc gagccagacg 180
ggcaccaaca acggcaacta cttttcgttc tggaaagaca gcccgggcac ggtgaacttc 240
tgcatgtact ccggcggccg ctacacgtcc aactggagcg gcatcaacaa ctgggtgggc 300
ggcaagggct ggcagacggg ctcgtcccgc accgtctcct actccggcag cttcaattcg 360
ccgggtaacg gctacctgac gctctacggc tggaccacca atccgctcat cgagtactac 420
atcgtcgaca actggggcag ctatcgtccg ccgggtggcc agggcttcat gggcacggtg 480
aacaccgacg gcggcacgta cgacatctat cgcacgcaac gggtcaacca gccgtcgatc 540
atcggcaccg cgacgttcta ccagtactgg agcgtgcggc agtcgaagcg caccggcggc 600
accatcacca cggccaacca cttcaatgcc tgggccagcc tcggcatgaa cctgggacag 660
cacaactacc aggtgatggc caccgagggc taccagagca gcggcagctc cgacatcacg 720
gtgtgggaag gcacgagcag cggcggaagc agcaatggcg gcagcagcaa cggcggcagc 780
agcaatggtg gcagcggcgg cacgaagagc ttcacggtgc gcgcgcgcgg cactgcgggc 840
ggcgagtcca tcacgctgcg ggtcaacaac cagaacgtgc agacctggac gctgggtacc 900
agcatgcaga actacacggc ctcgacctcg ctgagcggcg gcatcacggt ggcgttcacc 960
aacgacggcg gcagccgcga cgtgcaggtg gactacatca tcgtgaatgg ccagacccgc 1020
cagtccgaac agcagagcta caacactggc ctctacgcca atggaagctg tggtggcggt 1080
tcgaacagcg agtggatgca ttgcaacggc gccatcggct acggcaatac gccctga 1137
<210> 256
<211> 378
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<221> SIGNAL
<222> (1)...(51)
<400> 256
Leu Ile Phe Ser Val Ser Gly Ser Ala Ser Arg Arg Arg Pro Gly Ile
1 5 10 15
His Lys Gly Asp Ser Met Ile Phe Gly Leu Lys Ser Ile Thr Gly Arg
20 25 30
Arg Ala Val Ala Ala Leu Ala Cys Leu Ala Gly Leu Tyr Met Ala Pro
35 40 45
Ala Asn Ala Gln Thr Cys Ile Thr Ser Ser Gln Thr Gly Thr Asn Asn
50 55 60
Gly Asn Tyr Phe Ser Phe Trp Lys Asp Ser Pro Gly Thr Val Asn Phe
65 70 75 80
Cys Met Tyr Ser Gly Gly Arg Tyr Thr Ser Asn Trp Ser Gly Ile Asn
85 90 95
Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly Ser Ser Arg Thr Val
100 105 110
Ser Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn Gly Tyr Leu Thr Leu
115 120 125
Tyr Gly Trp Thr Thr Asn Pro Leu Ile Glu Tyr Tyr Ile Val Asp Asn
130 135 140
Trp Gly Ser Tyr Arg Pro Pro Gly Gly Gln Gly Phe Met Gly Thr Val
145 150 155 160
Asn Thr Asp Gly Gly Thr Tyr Asp Ile Tyr Arg Thr Gln Arg Val Asn
165 170 175
Gln Pro Ser Ile Ile Gly Thr Ala Thr Phe Tyr Gln Tyr Trp Ser Val
180 185 190
Arg Gln Ser Lys Arg Thr Gly Gly Thr Ile Thr Thr Ala Asn His Phe
195 200 205
Asn Ala Trp Ala Ser Leu Gly Met Asn Leu Gly Gln His Asn Tyr Gln
210 215 220
Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser Ser Asp Ile Thr
225 230 235 240
Val Trp Glu Gly Thr Ser Ser Gly Gly Ser Ser Asn Gly Gly Ser Ser
245 250 255
Asn Gly Gly Ser Ser Asn Gly Gly Ser Gly Gly Thr Lys Ser Phe Thr
260 265 270
Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Ser Ile Thr Leu Arg Val
275 280 285
Asn Asn Gln Asn Val Gln Thr Trp Thr Leu Gly Thr Ser Met Gln Asn
290 295 300
Tyr Thr Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val Ala Phe Thr
305 310 315 320
Asn Asp Gly Gly Ser Arg Asp Val Gln Val Asp Tyr Ile Ile Val Asn
325 330 335
Gly Gln Thr Arg Gln Ser Glu Gln Gln Ser Tyr Asn Thr Gly Leu Tyr
340 345 350
Ala Asn Gly Ser Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys
355 360 365
Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro
370 375
<210> 257
<211> 2694
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 257
atggctgata tatctaccac accagtcaca gcctcgacag atgctgccaa gaacctgtat 60
gcctatttcc tggaccagta tggcaagaag acgatttcca gcgtcatggc caatgtcaac 120
tggaacaaca cttgtgccga gaaagtctat aaactcacgg gcaagtatcc tgccatgaac 180
tgctacgact tcatccacat ctgtttctcg ccagccaact ggattgacta caccgacatc 240
actcctgcca aggaatggca cgatgcgggc ggtatcgtac agttgatgtg gcatttcaat 300
gtgcctaaga gccagggggc aacagatgtt acctgcacgc ccagcgagac cacctttaag 360
gcttccaatg ctctggttag cggcacgtgg gagaacaaat ggttctacga gcagatggac 420
aaggtcattg ccaccatcct caagttacag gacgctggca ttgccgctac ctggcgacct 480
ttccatgagg cagcaggcaa tgcttgcgcc aagcagcagg ccgactggac caaagcatgg 540
ttctggtggg gctacgacgg tgccgacacc tacaagaaac tgtggattgc catgtacgac 600
tatttcaagc tgaaaggcgt gaacaacctc atctggatgt ggaccaccca gaattataat 660
ggtgacagca gcaaatacaa ccaggacacc gactggtacc ctggcgacga gtatgttgac 720
atcgtggccc gcgacctcta tggctacaat gccgaccaga acctgcagga gttcagcgag 780
attcaggctg cctatcccaa caagatggtg gttctgggtg aatgcggaaa aggtgatagc 840
ggcgaccccg gcaagatgtc cgatgtatgg gcgaaaggtg ccaagtgggg ccacttcatg 900
gtatggtatc aaggcgaaca aggctctacc gacacgatgt gcagcgacga ctggtggaag 960
gatgccatga gcagcgccaa cgtcatcacc cgcgacaagg tggttatccc cgatgtcact 1020
tcaaccatcg agaatgccac ggatgccgtg aagaacatgg gactggggtg gaacctgggg 1080
aacgccctcg acgccaatgc ccagcaatac catgatgcca cccaggacaa ctactgggga 1140
cagcaggaca ttacctctga gagctgctgg ggtcagctac ccaccaaggc agagctgatg 1200
gccatgatga aagaagccgg tttcggagcc atccgcgttc ccgtgacatg gtataaccac 1260
atggacaagg acggcaatgt ggatgcagca tggatgaatc gtgtgcatga ggtggttgac 1320
tatgtcatca gccagggaat gtactgcatc ctcaacgtac accacgacac gggtgccgac 1380
agctacgaca gccagaagaa cctcaccggc taccattgga tcaaggccga cgaaaccaac 1440
tacgccacca acaaggcccg ctatgagaag ctgtggcagc agatagccca ggagttccgc 1500
aactacggcc agctgctgct gttcgagggc tataacgaga tgctcgatgc caacaactcc 1560
tggaattttg cacagagcag ttcagcctac gatgccatca acaaatacgc ccagagcttt 1620
gtcgatgtcg tacgcgccac cggtggcaac aatgcccagc gcaacctcat tgtcagcaca 1680
tacggcgcct gctcaggcaa cggcacgtgg gatgcaagag tgcaagaccc cttgaagaaa 1740
ctgcagattc ccacgggtga aagcaaccat atcatcttcg aggttcacaa ctatccctcc 1800
atcgtcaaca aggacaacgc gggcaactac gtcagcgatc gcaccatcag cgaaatcaag 1860
gcagagattg atgcatggct taagaactta aagacccacc tcgtcagcaa gggcgctccc 1920
gtcatcatcg gcgaatgggg caccaacaac gtcgatgccg gcggtggcaa gacagactac 1980
gacctccata aggacctgat gttcgaattt gtcagctaca tgataaagac catgaagcag 2040
aacgacattg ccaccttcta ctggatggga cttaccgacg gcgctccacg cacctacccc 2100
gccttcacac agcccgacct ggcgctgaag atgctgcagg cctatcacgg cgactcttgg 2160
aatccctacc tgcctgacgc caaggacttt cccgaaggca aaatcacctc ggccacggtg 2220
aatttcaaca gccaatgggg cgaactgacc atccacgatg gagctattga caagaccgtc 2280
tatagaggta tcaaggtgga gctggaagaa aagcctgcca ctggagccct gtctttcaag 2340
gtatatgcca acagtgagaa ggcaacagcc atcaattcca aaaccccaca gttggctttc 2400
ttcagttaca caggcatcca gaaaatcaac ctacagtgga acatagccac caaggggagt 2460
atcaaaatca agagcgtcaa ccttatcaag cacgacgact ccacagaacc ctgtagtctg 2520
aaagtggctt ggggttgtac tctcagcgac cagaactacg ccacgggcat cgaagacatt 2580
actatcactc ctgttcgtca tgacgatgga atcatctaca atctgagcgg acagcctgta 2640
acctctcctc agcgcggcat ctacatcctc aacggaaaga aaatcatcaa atag 2694
<210> 258
<211> 897
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample
<400> 258
Met Ala Asp Ile Ser Thr Thr Pro Val Thr Ala Ser Thr Asp Ala Ala
1 5 10 15
Lys Asn Leu Tyr Ala Tyr Phe Leu Asp Gln Tyr Gly Lys Lys Thr Ile
20 25 30
Ser Ser Val Met Ala Asn Val Asn Trp Asn Asn Thr Cys Ala Glu Lys
35 40 45
Val Tyr Lys Leu Thr Gly Lys Tyr Pro Ala Met Asn Cys Tyr Asp Phe
50 55 60
Ile His Ile Cys Phe Ser Pro Ala Asn Trp Ile Asp Tyr Thr Asp Ile
65 70 75 80
Thr Pro Ala Lys Glu Trp His Asp Ala Gly Gly Ile Val Gln Leu Met
85 90 95
Trp His Phe Asn Val Pro Lys Ser Gln Gly Ala Thr Asp Val Thr Cys
100 105 110
Thr Pro Ser Glu Thr Thr Phe Lys Ala Ser Asn Ala Leu Val Ser Gly
115 120 125
Thr Trp Glu Asn Lys Trp Phe Tyr Glu Gln Met Asp Lys Val Ile Ala
130 135 140
Thr Ile Leu Lys Leu Gln Asp Ala Gly Ile Ala Ala Thr Trp Arg Pro
145 150 155 160
Phe His Glu Ala Ala Gly Asn Ala Cys Ala Lys Gln Gln Ala Asp Trp
165 170 175
Thr Lys Ala Trp Phe Trp Trp Gly Tyr Asp Gly Ala Asp Thr Tyr Lys
180 185 190
Lys Leu Trp Ile Ala Met Tyr Asp Tyr Phe Lys Leu Lys Gly Val Asn
195 200 205
Asn Leu Ile Trp Met Trp Thr Thr Gln Asn Tyr Asn Gly Asp Ser Ser
210 215 220
Lys Tyr Asn Gln Asp Thr Asp Trp Tyr Pro Gly Asp Glu Tyr Val Asp
225 230 235 240
Ile Val Ala Arg Asp Leu Tyr Gly Tyr Asn Ala Asp Gln Asn Leu Gln
245 250 255
Glu Phe Ser Glu Ile Gln Ala Ala Tyr Pro Asn Lys Met Val Val Leu
260 265 270
Gly Glu Cys Gly Lys Gly Asp Ser Gly Asp Pro Gly Lys Met Ser Asp
275 280 285
Val Trp Ala Lys Gly Ala Lys Trp Gly His Phe Met Val Trp Tyr Gln
290 295 300
Gly Glu Gln Gly Ser Thr Asp Thr Met Cys Ser Asp Asp Trp Trp Lys
305 310 315 320
Asp Ala Met Ser Ser Ala Asn Val Ile Thr Arg Asp Lys Val Val Ile
325 330 335
Pro Asp Val Thr Ser Thr Ile Glu Asn Ala Thr Asp Ala Val Lys Asn
340 345 350
Met Gly Leu Gly Trp Asn Leu Gly Asn Ala Leu Asp Ala Asn Ala Gln
355 360 365
Gln Tyr His Asp Ala Thr Gln Asp Asn Tyr Trp Gly Gln Gln Asp Ile
370 375 380
Thr Ser Glu Ser Cys Trp Gly Gln Leu Pro Thr Lys Ala Glu Leu Met
385 390 395 400
Ala Met Met Lys Glu Ala Gly Phe Gly Ala Ile Arg Val Pro Val Thr
405 410 415
Trp Tyr Asn His Met Asp Lys Asp Gly Asn Val Asp Ala Ala Trp Met
420 425 430
Asn Arg Val His Glu Val Val Asp Tyr Val Ile Ser Gln Gly Met Tyr
435 440 445
Cys Ile Leu Asn Val His His Asp Thr Gly Ala Asp Ser Tyr Asp Ser
450 455 460
Gln Lys Asn Leu Thr Gly Tyr His Trp Ile Lys Ala Asp Glu Thr Asn
465 470 475 480
Tyr Ala Thr Asn Lys Ala Arg Tyr Glu Lys Leu Trp Gln Gln Ile Ala
485 490 495
Gln Glu Phe Arg Asn Tyr Gly Gln Leu Leu Leu Phe Glu Gly Tyr Asn
500 505 510
Glu Met Leu Asp Ala Asn Asn Ser Trp Asn Phe Ala Gln Ser Ser Ser
515 520 525
Ala Tyr Asp Ala Ile Asn Lys Tyr Ala Gln Ser Phe Val Asp Val Val
530 535 540
Arg Ala Thr Gly Gly Asn Asn Ala Gln Arg Asn Leu Ile Val Ser Thr
545 550 555 560
Tyr Gly Ala Cys Ser Gly Asn Gly Thr Trp Asp Ala Arg Val Gln Asp
565 570 575
Pro Leu Lys Lys Leu Gln Ile Pro Thr Gly Glu Ser Asn His Ile Ile
580 585 590
Phe Glu Val His Asn Tyr Pro Ser Ile Val Asn Lys Asp Asn Ala Gly
595 600 605
Asn Tyr Val Ser Asp Arg Thr Ile Ser Glu Ile Lys Ala Glu Ile Asp
610 615 620
Ala Trp Leu Lys Asn Leu Lys Thr His Leu Val Ser Lys Gly Ala Pro
625 630 635 640
Val Ile Ile Gly Glu Trp Gly Thr Asn Asn Val Asp Ala Gly Gly Gly
645 650 655
Lys Thr Asp Tyr Asp Leu His Lys Asp Leu Met Phe Glu Phe Val Ser
660 665 670
Tyr Met Ile Lys Thr Met Lys Gln Asn Asp Ile Ala Thr Phe Tyr Trp
675 680 685
Met Gly Leu Thr Asp Gly Ala Pro Arg Thr Tyr Pro Ala Phe Thr Gln
690 695 700
Pro Asp Leu Ala Leu Lys Met Leu Gln Ala Tyr His Gly Asp Ser Trp
705 710 715 720
Asn Pro Tyr Leu Pro Asp Ala Lys Asp Phe Pro Glu Gly Lys Ile Thr
725 730 735
Ser Ala Thr Val Asn Phe Asn Ser Gln Trp Gly Glu Leu Thr Ile His
740 745 750
Asp Gly Ala Ile Asp Lys Thr Val Tyr Arg Gly Ile Lys Val Glu Leu
755 760 765
Glu Glu Lys Pro Ala Thr Gly Ala Leu Ser Phe Lys Val Tyr Ala Asn
770 775 780
Ser Glu Lys Ala Thr Ala Ile Asn Ser Lys Thr Pro Gln Leu Ala Phe
785 790 795 800
Phe Ser Tyr Thr Gly Ile Gln Lys Ile Asn Leu Gln Trp Asn Ile Ala
805 810 815
Thr Lys Gly Ser Ile Lys Ile Lys Ser Val Asn Leu Ile Lys His Asp
820 825 830
Asp Ser Thr Glu Pro Cys Ser Leu Lys Val Ala Trp Gly Cys Thr Leu
835 840 845
Ser Asp Gln Asn Tyr Ala Thr Gly Ile Glu Asp Ile Thr Ile Thr Pro
850 855 860
Val Arg His Asp Asp Gly Ile Ile Tyr Asn Leu Ser Gly Gln Pro Val
865 870 875 880
Thr Ser Pro Gln Arg Gly Ile Tyr Ile Leu Asn Gly Lys Lys Ile Ile
885 890 895
Lys
<210> 259
<211> 1143
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 259
atgaagaaaa ttcgcttact ccagggtgtt tcgttggcca tgtcaataat gtttcttttg 60
tcatgtcagg cacaaaaacc agttgactct cttaaggaag catttgatgg tttgtttctt 120
ataggtactg ccatgaacac ccctcagatc accggccagg atacacaaac acttgagttg 180
ataaaaaaac acatgaactc catagtggcc gaaaatgtaa tgaaaagtga ggtgcttcaa 240
cccagggaag gagagtttga ttttactctt gccgatcagt ttgttcaatt tggtatcgat 300
aacaatatgc atatagttgg ccataccctt atatggcatt cccaggcgcc acgatggttt 360
tttgtggatg agaacggaaa cgatgtgagc cccgaaattc tgaaacaaag aatgaaagac 420
catatttata ccgtagtagg ccgttataaa ggcaaaattc atggatggga tgtggtgaat 480
gagtgtataa atgacgatgg ttcgtggcgc aatagtaagt tttaccaaat tcttggtgaa 540
gattttgtta aatatgcatt ccagtttgca gctgaagccg atcccgatgc agagctttat 600
tacaatgatt attcgatgtt ccttccagga cgtagggaag gcgtaattaa gatggtgaga 660
aatctgcagg aacagggaat taaaattgat ggtattggga tgcagggcca cctgatgatt 720
gattatccac ccctcgaaga ttttgaaacg agtatactgg cttttgccga tctgggggtg 780
aatgtcatga taaccgaact cgatatatcc gttttgccat ttcctacccg caacgtgggc 840
gccgatgttt ctctgaacat tgcatacaat actgaattaa atccctaccc gaatggctta 900
cccgaagatg tagcgcagaa attacataat cggtgggtgg atctttttcg cctgttcatt 960
aaacaccacg ataaaattac ccgtgtaacc acttggggta cagccgatgc catgtcatgg 1020
aagaataact ggcccattcg tggacgtaca gattatccct tacttttcga tcgcgatttt 1080
cagcccaaac cctttgtcgc tgatataatt aaggaggcat tggcagccaa aagaaaatta 1140
taa 1143
<210> 260
<211> 380
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(24)
<400> 260
Met Lys Lys Ile Arg Leu Leu Gln Gly Val Ser Leu Ala Met Ser Ile
1 5 10 15
Met Phe Leu Leu Ser Cys Gln Ala Gln Lys Pro Val Asp Ser Leu Lys
20 25 30
Glu Ala Phe Asp Gly Leu Phe Leu Ile Gly Thr Ala Met Asn Thr Pro
35 40 45
Gln Ile Thr Gly Gln Asp Thr Gln Thr Leu Glu Leu Ile Lys Lys His
50 55 60
Met Asn Ser Ile Val Ala Glu Asn Val Met Lys Ser Glu Val Leu Gln
65 70 75 80
Pro Arg Glu Gly Glu Phe Asp Phe Thr Leu Ala Asp Gln Phe Val Gln
85 90 95
Phe Gly Ile Asp Asn Asn Met His Ile Val Gly His Thr Leu Ile Trp
100 105 110
His Ser Gln Ala Pro Arg Trp Phe Phe Val Asp Glu Asn Gly Asn Asp
115 120 125
Val Ser Pro Glu Ile Leu Lys Gln Arg Met Lys Asp His Ile Tyr Thr
130 135 140
Val Val Gly Arg Tyr Lys Gly Lys Ile His Gly Trp Asp Val Val Asn
145 150 155 160
Glu Cys Ile Asn Asp Asp Gly Ser Trp Arg Asn Ser Lys Phe Tyr Gln
165 170 175
Ile Leu Gly Glu Asp Phe Val Lys Tyr Ala Phe Gln Phe Ala Ala Glu
180 185 190
Ala Asp Pro Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Met Phe Leu
195 200 205
Pro Gly Arg Arg Glu Gly Val Ile Lys Met Val Arg Asn Leu Gln Glu
210 215 220
Gln Gly Ile Lys Ile Asp Gly Ile Gly Met Gln Gly His Leu Met Ile
225 230 235 240
Asp Tyr Pro Pro Leu Glu Asp Phe Glu Thr Ser Ile Leu Ala Phe Ala
245 250 255
Asp Leu Gly Val Asn Val Met Ile Thr Glu Leu Asp Ile Ser Val Leu
260 265 270
Pro Phe Pro Thr Arg Asn Val Gly Ala Asp Val Ser Leu Asn Ile Ala
275 280 285
Tyr Asn Thr Glu Leu Asn Pro Tyr Pro Asn Gly Leu Pro Glu Asp Val
290 295 300
Ala Gln Lys Leu His Asn Arg Trp Val Asp Leu Phe Arg Leu Phe Ile
305 310 315 320
Lys His His Asp Lys Ile Thr Arg Val Thr Thr Trp Gly Thr Ala Asp
325 330 335
Ala Met Ser Trp Lys Asn Asn Trp Pro Ile Arg Gly Arg Thr Asp Tyr
340 345 350
Pro Leu Leu Phe Asp Arg Asp Phe Gln Pro Lys Pro Phe Val Ala Asp
355 360 365
Ile Ile Lys Glu Ala Leu Ala Ala Lys Arg Lys Leu
370 375 380
<210> 261
<211> 1629
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 261
atgataaaca aaattggcaa aggttttttt tctgcgttca tttgtgctgc tgcgttgagt 60
gtctccacag ttaatgctca gcaaactgtc accaccaaca cgcaaggcac gcacgatggt 120
tttttctatt cgttttggaa agacagtggt gatgcatcat ttggtttgcg tgagggaggg 180
cgttacacct cgcaatggaa tacttctacc aataactggg tgggtggaaa agggtggaat 240
cccggtggta gaagggttgt tcactatcaa ggccaatata atgttgataa ttcacaaaac 300
tcttatttgg cattgtatgg ctggacacgc tcaccactga ttgaatatta cgtgattgaa 360
agttacggct cgtataaccc gtcgaattgc acccaaggtc ggcagaccta tggcaccttt 420
cagagtgatg gtgcaaccta tgaaattgtt cgctgtcagc gagttcagca gccctctatc 480
gatggcacac aaactttcta tcaatacttc agtgtgcgtc agccgaagaa aggctttggt 540
agtatcagtg gtacgatcac tgtgggcaac cattttgatg catgggccgc cgccggtttg 600
aacctggggg aacatgatta tatggtgatg gctaccgagg gttatcagag caccggtagt 660
tcggatatta cggtcagtga aattaccggt ggttcaggtg gtggctcttc ctcgggtgct 720
aataccctgg tgattcgtgc tgtgggcacc tctggtaatg aattgctgcg tgtcaatgtg 780
ggtggtagcc ctgtgcagac attgagcctt tcgaccagtt ggcaggattt tactgtcaat 840
acggatgcaa cgggtgacat taacgtagag ttgtttaatg atcagggtca gggttatgag 900
gcgcgtatcg attatgtgct ggttaatggt gagacccgct acgcggccga tcagagttat 960
aacaccagtg cctgggacgg cgaatgtggg ggtggctctt ttacccagtg gatgcattgt 1020
gatggcatga ttggctttgg tgatatgacc ggcggcaatg ccggtggtgg cggttcttcg 1080
ggtggttctg gcgccaatac tctggtggtg cgtgctgtcg gcacttcagg taacgagcag 1140
ttgcgcgtga atgtgggcgg caacacgatt caaacactga acctgtcaag cagttggcaa 1200
gattttactg tcaataccga tgcctcgggc gatattaacg tagagctgtt taatgaccag 1260
ggtcagggct atgaggcgcg tattgattat gtgctggtta atggcgagac ccgctacgcg 1320
gctgaccaga gttataacac cagcgcctgg gatggcgaat gcgggggtgg ctcttttacc 1380
caatggatgc attgtgatgg catgattggt tttggtgata tgtcgggtgg tggttctgct 1440
gtgggtacaa gcagtagcgg taatgccggc agcaatacca gcagtgcctg ttactgtaat 1500
tggtatggca gtgtgatggc ttcttgtgaa aatcaggtga acggctgggg ttgggaaaat 1560
aatcaaagct gtattggtaa taatacctgt aataatcagg gcggtagcgg aggcgtggtg 1620
tgcaattaa 1629
<210> 262
<211> 542
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(26)
<400> 262
Met Ile Asn Lys Ile Gly Lys Gly Phe Phe Ser Ala Phe Ile Cys Ala
1 5 10 15
Ala Ala Leu Ser Val Ser Thr Val Asn Ala Gln Gln Thr Val Thr Thr
20 25 30
Asn Thr Gln Gly Thr His Asp Gly Phe Phe Tyr Ser Phe Trp Lys Asp
35 40 45
Ser Gly Asp Ala Ser Phe Gly Leu Arg Glu Gly Gly Arg Tyr Thr Ser
50 55 60
Gln Trp Asn Thr Ser Thr Asn Asn Trp Val Gly Gly Lys Gly Trp Asn
65 70 75 80
Pro Gly Gly Arg Arg Val Val His Tyr Gln Gly Gln Tyr Asn Val Asp
85 90 95
Asn Ser Gln Asn Ser Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Ser Pro
100 105 110
Leu Ile Glu Tyr Tyr Val Ile Glu Ser Tyr Gly Ser Tyr Asn Pro Ser
115 120 125
Asn Cys Thr Gln Gly Arg Gln Thr Tyr Gly Thr Phe Gln Ser Asp Gly
130 135 140
Ala Thr Tyr Glu Ile Val Arg Cys Gln Arg Val Gln Gln Pro Ser Ile
145 150 155 160
Asp Gly Thr Gln Thr Phe Tyr Gln Tyr Phe Ser Val Arg Gln Pro Lys
165 170 175
Lys Gly Phe Gly Ser Ile Ser Gly Thr Ile Thr Val Gly Asn His Phe
180 185 190
Asp Ala Trp Ala Ala Ala Gly Leu Asn Leu Gly Glu His Asp Tyr Met
195 200 205
Val Met Ala Thr Glu Gly Tyr Gln Ser Thr Gly Ser Ser Asp Ile Thr
210 215 220
Val Ser Glu Ile Thr Gly Gly Ser Gly Gly Gly Ser Ser Ser Gly Ala
225 230 235 240
Asn Thr Leu Val Ile Arg Ala Val Gly Thr Ser Gly Asn Glu Leu Leu
245 250 255
Arg Val Asn Val Gly Gly Ser Pro Val Gln Thr Leu Ser Leu Ser Thr
260 265 270
Ser Trp Gln Asp Phe Thr Val Asn Thr Asp Ala Thr Gly Asp Ile Asn
275 280 285
Val Glu Leu Phe Asn Asp Gln Gly Gln Gly Tyr Glu Ala Arg Ile Asp
290 295 300
Tyr Val Leu Val Asn Gly Glu Thr Arg Tyr Ala Ala Asp Gln Ser Tyr
305 310 315 320
Asn Thr Ser Ala Trp Asp Gly Glu Cys Gly Gly Gly Ser Phe Thr Gln
325 330 335
Trp Met His Cys Asp Gly Met Ile Gly Phe Gly Asp Met Thr Gly Gly
340 345 350
Asn Ala Gly Gly Gly Gly Ser Ser Gly Gly Ser Gly Ala Asn Thr Leu
355 360 365
Val Val Arg Ala Val Gly Thr Ser Gly Asn Glu Gln Leu Arg Val Asn
370 375 380
Val Gly Gly Asn Thr Ile Gln Thr Leu Asn Leu Ser Ser Ser Trp Gln
385 390 395 400
Asp Phe Thr Val Asn Thr Asp Ala Ser Gly Asp Ile Asn Val Glu Leu
405 410 415
Phe Asn Asp Gln Gly Gln Gly Tyr Glu Ala Arg Ile Asp Tyr Val Leu
420 425 430
Val Asn Gly Glu Thr Arg Tyr Ala Ala Asp Gln Ser Tyr Asn Thr Ser
435 440 445
Ala Trp Asp Gly Glu Cys Gly Gly Gly Ser Phe Thr Gln Trp Met His
450 455 460
Cys Asp Gly Met Ile Gly Phe Gly Asp Met Ser Gly Gly Gly Ser Ala
465 470 475 480
Val Gly Thr Ser Ser Ser Gly Asn Ala Gly Ser Asn Thr Ser Ser Ala
485 490 495
Cys Tyr Cys Asn Trp Tyr Gly Ser Val Met Ala Ser Cys Glu Asn Gln
500 505 510
Val Asn Gly Trp Gly Trp Glu Asn Asn Gln Ser Cys Ile Gly Asn Asn
515 520 525
Thr Cys Asn Asn Gln Gly Gly Ser Gly Gly Val Val Cys Asn
530 535 540
<210> 263
<211> 1092
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 263
atgaaaacta atcacccatt taaattcggg aaaaaaatat gtatggcatt ggctttgctg 60
gtgcttggca tacaggcttc aatcgcacag gaaatttgta ttaccagcgg cactgaccag 120
atcagagaaa ccacatccaa cggctatacc cacgaactat ggaatcagga cacccggggg 180
acggcctgta tgactattaa tgcaggcacc acttacagtg cgcggtggaa cggtgcattt 240
aactatttgg cccgccgtgg attggcctac gatggttcgt ccctcaccca tgctgaccgg 300
gggaaattca ccataaatta tgcctctaac tacaactgca acaatatgaa tgggctctct 360
tatttaagcg tgtacggatg gacgcgggat tttgccaagg aaaatgccaa tccggcagga 420
tcacaggctc atcaggaagc gctggtggaa tattacattg ttgaaaactg gtgcgactgg 480
aatgtttcac aagaccctaa cgcccagagt ctgggcaccc tgaatgttga tgggtcgatc 540
tatgatatgt atcgcacaga acggatcaac caaccttcta tcaggtgcgg tggtacctgc 600
gataattttt accaatactt cagcattcgc cgcaacacac gtaacagtgg caccattgat 660
gtcagcgctc atttcaacca gtgggaagca ttaaccggcg tccctatggg tggcctgcac 720
gaagtgatga tgaaggtcga aggctacaac tcaaacaatc aatccagtgg caatgtaagc 780
tttactcaat tgctcatgcg tgcccgcttc gaggatggcg ccattgtcga gaaccagaat 840
gcggtcggcc atgcgcacgg tggagaagcg gtgggagatg atcaccgccg tcttgccctg 900
ggccaggccc ttgaagcggg cgaacacctc ggcctcggcc ttggcgtcga gggcggcggt 960
gggttcgtcg agaatgatca actcggcgtc gcgcatatag gcgcgggcga tggctacctt 1020
ctgccactcg ccgcccgaga ggtcgcggcc ctgcttgaaa aggcgcccca attgctccag 1080
agaaacgggt ga 1092
<210> 264
<211> 363
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(29)
<400> 264
Met Lys Thr Asn His Pro Phe Lys Phe Gly Lys Lys Ile Cys Met Ala
1 5 10 15
Leu Ala Leu Leu Val Leu Gly Ile Gln Ala Ser Ile Ala Gln Glu Ile
20 25 30
Cys Ile Thr Ser Gly Thr Asp Gln Ile Arg Glu Thr Thr Ser Asn Gly
35 40 45
Tyr Thr His Glu Leu Trp Asn Gln Asp Thr Arg Gly Thr Ala Cys Met
50 55 60
Thr Ile Asn Ala Gly Thr Thr Tyr Ser Ala Arg Trp Asn Gly Ala Phe
65 70 75 80
Asn Tyr Leu Ala Arg Arg Gly Leu Ala Tyr Asp Gly Ser Ser Leu Thr
85 90 95
His Ala Asp Arg Gly Lys Phe Thr Ile Asn Tyr Ala Ser Asn Tyr Asn
100 105 110
Cys Asn Asn Met Asn Gly Leu Ser Tyr Leu Ser Val Tyr Gly Trp Thr
115 120 125
Arg Asp Phe Ala Lys Glu Asn Ala Asn Pro Ala Gly Ser Gln Ala His
130 135 140
Gln Glu Ala Leu Val Glu Tyr Tyr Ile Val Glu Asn Trp Cys Asp Trp
145 150 155 160
Asn Val Ser Gln Asp Pro Asn Ala Gln Ser Leu Gly Thr Leu Asn Val
165 170 175
Asp Gly Ser Ile Tyr Asp Met Tyr Arg Thr Glu Arg Ile Asn Gln Pro
180 185 190
Ser Ile Arg Cys Gly Gly Thr Cys Asp Asn Phe Tyr Gln Tyr Phe Ser
195 200 205
Ile Arg Arg Asn Thr Arg Asn Ser Gly Thr Ile Asp Val Ser Ala His
210 215 220
Phe Asn Gln Trp Glu Ala Leu Thr Gly Val Pro Met Gly Gly Leu His
225 230 235 240
Glu Val Met Met Lys Val Glu Gly Tyr Asn Ser Asn Asn Gln Ser Ser
245 250 255
Gly Asn Val Ser Phe Thr Gln Leu Leu Met Arg Ala Arg Phe Glu Asp
260 265 270
Gly Ala Ile Val Glu Asn Gln Asn Ala Val Gly His Ala His Gly Gly
275 280 285
Glu Ala Val Gly Asp Asp His Arg Arg Leu Ala Leu Gly Gln Ala Leu
290 295 300
Glu Ala Gly Glu His Leu Gly Leu Gly Leu Gly Val Glu Gly Gly Gly
305 310 315 320
Gly Phe Val Glu Asn Asp Gln Leu Gly Val Ala His Ile Gly Ala Gly
325 330 335
Asp Gly Tyr Leu Leu Pro Leu Ala Ala Arg Glu Val Ala Ala Leu Leu
340 345 350
Glu Lys Ala Pro Gln Leu Leu Gln Arg Asn Gly
355 360
<210> 265
<211> 996
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 265
atgaacagct ccctcccctc cctccgcgat gtattcgcga atgatttccg catcggggcg 60
gcggtcaatc ctgtgacgat cgagatgcaa aaacagttgt tgatcgatca tgtcaacagt 120
attacggcag agaaccatat gaagtttgag catcttcagc cggaagaagg gaaatttacc 180
tttcaggaag cggatcggat tgtggatttt gcttgttcgc accgaatggc ggttcgaggg 240
cacacacttg tatggcacaa ccagactccg gattgggtgt ttcaagatgg tcaaggccat 300
ttcgtcagtc gggatgtgtt gcttgagcgg atgaaatgtc acatttcaac tgttgtacgg 360
cgatacaagg gaaaaatata ttgttgggat gtcatcaacg aagcggtagc cgacgaagga 420
gacgaattgt tgaggccgtc gaagtggcga caaatcatcg gggacgattt tatggaacaa 480
gcatttctct acgcttatga agctgaccca gatgcactgc ttttttacaa tgactataat 540
gaatgttttc cggaaaagag agaaaaaatt tttgcacttg tcaaatcgct gcgtgataaa 600
ggcattccga ttcatggcat cggcatgcag gcgcactgga gcctgacccg cccgtcgctt 660
gatgaaattc gtgcggcgat tgaacggtat gcgtcccttg gtgttgttct tcatattacg 720
gaactcgatg tatccatgtt tgaatttcac gatcgtcgaa ccgatttggc tgtcccgacg 780
aacgaaatga tcgaacagca agcagaacgg tatgggcaaa tttttgcttt gtttaaggag 840
tatcgcgatg ttattcaaag tgtcacattt tggggaattg ctgatgacca tacatggctc 900
gataactttc cagtgcacgg gagaaaaaac tggccgcttt tgttcgatga acagcataaa 960
ccgaaaccag ctttttggcg ggcagtgagt gtctga 996
<210> 266
<211> 331
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 266
Met Asn Ser Ser Leu Pro Ser Leu Arg Asp Val Phe Ala Asn Asp Phe
1 5 10 15
Arg Ile Gly Ala Ala Val Asn Pro Val Thr Ile Glu Met Gln Lys Gln
20 25 30
Leu Leu Ile Asp His Val Asn Ser Ile Thr Ala Glu Asn His Met Lys
35 40 45
Phe Glu His Leu Gln Pro Glu Glu Gly Lys Phe Thr Phe Gln Glu Ala
50 55 60
Asp Arg Ile Val Asp Phe Ala Cys Ser His Arg Met Ala Val Arg Gly
65 70 75 80
His Thr Leu Val Trp His Asn Gln Thr Pro Asp Trp Val Phe Gln Asp
85 90 95
Gly Gln Gly His Phe Val Ser Arg Asp Val Leu Leu Glu Arg Met Lys
100 105 110
Cys His Ile Ser Thr Val Val Arg Arg Tyr Lys Gly Lys Ile Tyr Cys
115 120 125
Trp Asp Val Ile Asn Glu Ala Val Ala Asp Glu Gly Asp Glu Leu Leu
130 135 140
Arg Pro Ser Lys Trp Arg Gln Ile Ile Gly Asp Asp Phe Met Glu Gln
145 150 155 160
Ala Phe Leu Tyr Ala Tyr Glu Ala Asp Pro Asp Ala Leu Leu Phe Tyr
165 170 175
Asn Asp Tyr Asn Glu Cys Phe Pro Glu Lys Arg Glu Lys Ile Phe Ala
180 185 190
Leu Val Lys Ser Leu Arg Asp Lys Gly Ile Pro Ile His Gly Ile Gly
195 200 205
Met Gln Ala His Trp Ser Leu Thr Arg Pro Ser Leu Asp Glu Ile Arg
210 215 220
Ala Ala Ile Glu Arg Tyr Ala Ser Leu Gly Val Val Leu His Ile Thr
225 230 235 240
Glu Leu Asp Val Ser Met Phe Glu Phe His Asp Arg Arg Thr Asp Leu
245 250 255
Ala Val Pro Thr Asn Glu Met Ile Glu Gln Gln Ala Glu Arg Tyr Gly
260 265 270
Gln Ile Phe Ala Leu Phe Lys Glu Tyr Arg Asp Val Ile Gln Ser Val
275 280 285
Thr Phe Trp Gly Ile Ala Asp Asp His Thr Trp Leu Asp Asn Phe Pro
290 295 300
Val His Gly Arg Lys Asn Trp Pro Leu Leu Phe Asp Glu Gln His Lys
305 310 315 320
Pro Lys Pro Ala Phe Trp Arg Ala Val Ser Val
325 330
<210> 267
<211> 1956
<212> DNA
<213> Bacteria
<400> 267
atgaagcgta aggttaagaa gatggcagct atggcaacga gtataattat ggctatcatg 60
atcatcctac atagtatacc agtactcgcc gggcgaataa tttacgacaa tgagacaggc 120
acacatggag gctacgacta tgagctctgg aaagactacg gaaatacgat tatggaactt 180
aacgacggtg gtacttttag ttgtcaatgg agtaatatcg gtaatgcact atttagaaaa 240
gggagaaaat ttaattccga caaaacctat caagaattag gagatatagt agttgaatat 300
ggctgtgatt acaatccaaa cggaaattcc tatttgtgtg tttacggttg gacaagaaat 360
ccactggttg aatattacat tgtagaaagc tggggcagct ggcgtccacc tggagcaaca 420
cccaaaggaa ccatcacagt ggatggcggt acttatgaaa tatatgaaac tacccgggta 480
aatcagcctt ccatcgatgg aactgcgaca ttccaacaat attggagtgt tcgtacatcc 540
aagagaacaa gcggaacaat atctgtcact gaacatttta aacagtggga aagaatgggc 600
atgcgaatgg gtaagatgta tgaagttgct cttaccgttg aaggttatca gagcagtggg 660
tacgctaatg tatataagaa tgaaatcaga ataggtgcaa atccaactcc tgccccatct 720
caaagcccaa ttagaagaga tgcattttca ataatcgaag cggaagaata taacagcaca 780
aattcctcca ctttacaagt gattggaacg ccaaataatg gcagaggaat tggttatatt 840
gaaaatggta ataccgtaac ttacagcaat atagattttg gtagtggtgc aacagggttc 900
tctgcaactg ttgcaacgga ggttaatacc tcaattcaaa tccgttctga cagtcctatc 960
ggaactctac ttggtacctt atatgtaagt tctaccggca gctggaatac atatcaaacc 1020
gtatctacaa acatcagcaa aattaccggc gttcatgata ttgtattggt attctcaggt 1080
ccagtcaatg tggacaactt catatttagc agaagttcac cagtgcctgc acctggtgat 1140
aacacaagag acgcatattc tatcattcag gccgaggatt atgacagcag ttatggcccc 1200
aaccttcaaa tctttagctt accaggcggt ggcagcgcca ttggctatat tgaaaatggt 1260
tattccacta cctataataa cgttaatttc gccaacggct taagttctat aacagcaaga 1320
gttgccactc agatctcaac ttccattcag gtgagagcag gaggagcaac cggtacttta 1380
cttggtacaa tatatgttcc ttcgacaaat agttgggatt cttatcagaa tgtaactgcc 1440
aaccttagca atattacagg tgtgcatgat attacccttg tcttttcagg accagtgaat 1500
gtggactact tcgtatttac accagcaaat gtaaattcag ggcctacctc ccctgtcgga 1560
ggtacaagaa gtgcattttc caatattcaa gccgaagatt atgacagcag ttatggtccc 1620
aaccttcaaa tctttagctt accaggtggt ggcagcgcca ttggctatat tgaaaatggt 1680
tattccacta cctataaaaa tattgatttt ggtgacggcg caacgtccgt aacagcaaga 1740
gtagctaccc agaatgctac taccattcag gtaagattgg gaagtccatc gggtacatta 1800
cttggaacaa tttacgtggg gtccacagga agctttgata cttataggga tgtatccgct 1860
accattagta atactgcggg tgtaaaagat attgttcttg tattttcagg tcctgttaat 1920
gttgactggt ttgtattctc aaaatcagga acttaa 1956
<210> 268
<211> 651
<212> PRT
<213> Bacteria
<220>
<221> SIGNAL
<222> (1)...(30)
<400> 268
Met Lys Arg Lys Val Lys Lys Met Ala Ala Met Ala Thr Ser Ile Ile
1 5 10 15
Met Ala Ile Met Ile Ile Leu His Ser Ile Pro Val Leu Ala Gly Arg
20 25 30
Ile Ile Tyr Asp Asn Glu Thr Gly Thr His Gly Gly Tyr Asp Tyr Glu
35 40 45
Leu Trp Lys Asp Tyr Gly Asn Thr Ile Met Glu Leu Asn Asp Gly Gly
50 55 60
Thr Phe Ser Cys Gln Trp Ser Asn Ile Gly Asn Ala Leu Phe Arg Lys
65 70 75 80
Gly Arg Lys Phe Asn Ser Asp Lys Thr Tyr Gln Glu Leu Gly Asp Ile
85 90 95
Val Val Glu Tyr Gly Cys Asp Tyr Asn Pro Asn Gly Asn Ser Tyr Leu
100 105 110
Cys Val Tyr Gly Trp Thr Arg Asn Pro Leu Val Glu Tyr Tyr Ile Val
115 120 125
Glu Ser Trp Gly Ser Trp Arg Pro Pro Gly Ala Thr Pro Lys Gly Thr
130 135 140
Ile Thr Val Asp Gly Gly Thr Tyr Glu Ile Tyr Glu Thr Thr Arg Val
145 150 155 160
Asn Gln Pro Ser Ile Asp Gly Thr Ala Thr Phe Gln Gln Tyr Trp Ser
165 170 175
Val Arg Thr Ser Lys Arg Thr Ser Gly Thr Ile Ser Val Thr Glu His
180 185 190
Phe Lys Gln Trp Glu Arg Met Gly Met Arg Met Gly Lys Met Tyr Glu
195 200 205
Val Ala Leu Thr Val Glu Gly Tyr Gln Ser Ser Gly Tyr Ala Asn Val
210 215 220
Tyr Lys Asn Glu Ile Arg Ile Gly Ala Asn Pro Thr Pro Ala Pro Ser
225 230 235 240
Gln Ser Pro Ile Arg Arg Asp Ala Phe Ser Ile Ile Glu Ala Glu Glu
245 250 255
Tyr Asn Ser Thr Asn Ser Ser Thr Leu Gln Val Ile Gly Thr Pro Asn
260 265 270
Asn Gly Arg Gly Ile Gly Tyr Ile Glu Asn Gly Asn Thr Val Thr Tyr
275 280 285
Ser Asn Ile Asp Phe Gly Ser Gly Ala Thr Gly Phe Ser Ala Thr Val
290 295 300
Ala Thr Glu Val Asn Thr Ser Ile Gln Ile Arg Ser Asp Ser Pro Ile
305 310 315 320
Gly Thr Leu Leu Gly Thr Leu Tyr Val Ser Ser Thr Gly Ser Trp Asn
325 330 335
Thr Tyr Gln Thr Val Ser Thr Asn Ile Ser Lys Ile Thr Gly Val His
340 345 350
Asp Ile Val Leu Val Phe Ser Gly Pro Val Asn Val Asp Asn Phe Ile
355 360 365
Phe Ser Arg Ser Ser Pro Val Pro Ala Pro Gly Asp Asn Thr Arg Asp
370 375 380
Ala Tyr Ser Ile Ile Gln Ala Glu Asp Tyr Asp Ser Ser Tyr Gly Pro
385 390 395 400
Asn Leu Gln Ile Phe Ser Leu Pro Gly Gly Gly Ser Ala Ile Gly Tyr
405 410 415
Ile Glu Asn Gly Tyr Ser Thr Thr Tyr Asn Asn Val Asn Phe Ala Asn
420 425 430
Gly Leu Ser Ser Ile Thr Ala Arg Val Ala Thr Gln Ile Ser Thr Ser
435 440 445
Ile Gln Val Arg Ala Gly Gly Ala Thr Gly Thr Leu Leu Gly Thr Ile
450 455 460
Tyr Val Pro Ser Thr Asn Ser Trp Asp Ser Tyr Gln Asn Val Thr Ala
465 470 475 480
Asn Leu Ser Asn Ile Thr Gly Val His Asp Ile Thr Leu Val Phe Ser
485 490 495
Gly Pro Val Asn Val Asp Tyr Phe Val Phe Thr Pro Ala Asn Val Asn
500 505 510
Ser Gly Pro Thr Ser Pro Val Gly Gly Thr Arg Ser Ala Phe Ser Asn
515 520 525
Ile Gln Ala Glu Asp Tyr Asp Ser Ser Tyr Gly Pro Asn Leu Gln Ile
530 535 540
Phe Ser Leu Pro Gly Gly Gly Ser Ala Ile Gly Tyr Ile Glu Asn Gly
545 550 555 560
Tyr Ser Thr Thr Tyr Lys Asn Ile Asp Phe Gly Asp Gly Ala Thr Ser
565 570 575
Val Thr Ala Arg Val Ala Thr Gln Asn Ala Thr Thr Ile Gln Val Arg
580 585 590
Leu Gly Ser Pro Ser Gly Thr Leu Leu Gly Thr Ile Tyr Val Gly Ser
595 600 605
Thr Gly Ser Phe Asp Thr Tyr Arg Asp Val Ser Ala Thr Ile Ser Asn
610 615 620
Thr Ala Gly Val Lys Asp Ile Val Leu Val Phe Ser Gly Pro Val Asn
625 630 635 640
Val Asp Trp Phe Val Phe Ser Lys Ser Gly Thr
645 650
<210> 269
<211> 1110
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 269
atggggtaca ataggatcat acaagcgatc cgcgtaagca agggagatgt tttgggcgtt 60
cataaagttt tttacgctgc acttgcgtgt gtggcgatgg ggtattcgga aacgtgggca 120
cagtgcgcga cctggacccg aagcaccatt cgcaattgcg agggcatcga ctacgagttg 180
tggaaccaga acaaccgcgg cacggtcaac atggaaatca cgggaaacgg aacgttcgcg 240
gcgacgtgga gcggaacgga aaacatcctg tttcgcgccg gcaagaaatg ggggttcaac 300
agcaccacga cggcgcggtc ggtcggcgcc atcacgctcg atttcgctgc gacctggacc 360
tccagcgaca acgtgaaaat gctcggcatc tacggctggg cgtattaccc gtcgggaagc 420
gagccgacga aaacggaaag cggtcaaaac acgagctttt ccgatcagat cgagtattac 480
atcatccagg accgcggagg cttcaacccg ggttccggcg gcgtcaacgc caaaaagtac 540
ggcgaggccg tgatcgacgg aatcgcctat gacttttggg tggccgaccg gatcaaccag 600
cccatgctga caggaagagg caacttcaag caatacttca gcgttccacg gaacacgagc 660
agccaccggc aaagcggcat cgtcagcatt tcgaagcact ttgaggagtg ggacaaggcc 720
ggcatgaaga tgctggactg tccgctatac gaagtcgcga tgaaggtgga atcgtatacg 780
ggctcggcga atggcggcgg gtcggcgaac gtgacccgga atattctcac gctcggcggt 840
tcttccgcac cgacccctat cgcgcgcggc cccggccggt ccgccgaaag catgcgggtc 900
gccttcgttc aggaaagagt gctcaaggtc gcgcccgtcg acggaacccg cctgcaagtc 960
aaggtgcggg acgtgaaggg cgtgaaccgg gccgagttca atgccgcggg cgcggcaacg 1020
ttctcgttgt cccatgtccc cgcgggcccg tatttcctgg atgtgacggg gccggatgta 1080
agacagatca cgccgttcgt tttgcgataa 1110
<210> 270
<211> 369
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 270
Met Gly Tyr Asn Arg Ile Ile Gln Ala Ile Arg Val Ser Lys Gly Asp
1 5 10 15
Val Leu Gly Val His Lys Val Phe Tyr Ala Ala Leu Ala Cys Val Ala
20 25 30
Met Gly Tyr Ser Glu Thr Trp Ala Gln Cys Ala Thr Trp Thr Arg Ser
35 40 45
Thr Ile Arg Asn Cys Glu Gly Ile Asp Tyr Glu Leu Trp Asn Gln Asn
50 55 60
Asn Arg Gly Thr Val Asn Met Glu Ile Thr Gly Asn Gly Thr Phe Ala
65 70 75 80
Ala Thr Trp Ser Gly Thr Glu Asn Ile Leu Phe Arg Ala Gly Lys Lys
85 90 95
Trp Gly Phe Asn Ser Thr Thr Thr Ala Arg Ser Val Gly Ala Ile Thr
100 105 110
Leu Asp Phe Ala Ala Thr Trp Thr Ser Ser Asp Asn Val Lys Met Leu
115 120 125
Gly Ile Tyr Gly Trp Ala Tyr Tyr Pro Ser Gly Ser Glu Pro Thr Lys
130 135 140
Thr Glu Ser Gly Gln Asn Thr Ser Phe Ser Asp Gln Ile Glu Tyr Tyr
145 150 155 160
Ile Ile Gln Asp Arg Gly Gly Phe Asn Pro Gly Ser Gly Gly Val Asn
165 170 175
Ala Lys Lys Tyr Gly Glu Ala Val Ile Asp Gly Ile Ala Tyr Asp Phe
180 185 190
Trp Val Ala Asp Arg Ile Asn Gln Pro Met Leu Thr Gly Arg Gly Asn
195 200 205
Phe Lys Gln Tyr Phe Ser Val Pro Arg Asn Thr Ser Ser His Arg Gln
210 215 220
Ser Gly Ile Val Ser Ile Ser Lys His Phe Glu Glu Trp Asp Lys Ala
225 230 235 240
Gly Met Lys Met Leu Asp Cys Pro Leu Tyr Glu Val Ala Met Lys Val
245 250 255
Glu Ser Tyr Thr Gly Ser Ala Asn Gly Gly Gly Ser Ala Asn Val Thr
260 265 270
Arg Asn Ile Leu Thr Leu Gly Gly Ser Ser Ala Pro Thr Pro Ile Ala
275 280 285
Arg Gly Pro Gly Arg Ser Ala Glu Ser Met Arg Val Ala Phe Val Gln
290 295 300
Glu Arg Val Leu Lys Val Ala Pro Val Asp Gly Thr Arg Leu Gln Val
305 310 315 320
Lys Val Arg Asp Val Lys Gly Val Asn Arg Ala Glu Phe Asn Ala Ala
325 330 335
Gly Ala Ala Thr Phe Ser Leu Ser His Val Pro Ala Gly Pro Tyr Phe
340 345 350
Leu Asp Val Thr Gly Pro Asp Val Arg Gln Ile Thr Pro Phe Val Leu
355 360 365
Arg
<210> 271
<211> 1128
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 271
atgttcattc acaacagcat atgcagcgca ctctgcacaa tctttttggc aactgcaaca 60
atgggagaaa acatgacact acaagaagcc tttgccgatc acttttatgt gggagccgcc 120
atcagccaac gcctttttca accagatcgc gccgaaacgc tgcaactggc cgcgcaccaa 180
ttcaacagca tcacagccga aaatgagatg aagtggcagt cgttaaatcc cactcctggc 240
gaataccgtt tcgaaaacgc cgataaattc gtccgctttg gtgtcgaaaa cgatatgtac 300
atcgttgggc acgttctctt ctggcacagc cagacacccg actggctctt caaggatgac 360
gacggtaact tcgtctcccg cgaagtctta ctcgaccgca tgcgcgccca cgtgcgcaat 420
cttgtccagc gctacggcaa ccatgtgcac gcctgggatg ttatcaatga aaccttcaat 480
gataatggtt ccttgcgcga cagcccatgg acgcaaatcc tcggcgagga attcatcgag 540
cacgccttcc ggattgccgg cgaggaactc cccccccatg tcgagctgct ctacaatgat 600
tattcgatga ccattcctgc caagcgcgat gctgttgctg aaatggttcg cgacctcata 660
gccaaaggca tccgcattga cggcgttggc atgcagggac attgggcacg gacccacccg 720
accatagcgg acatagaaaa aagcattctt gccttcgcag gaaccggcgt acaggtacac 780
atcactgagc tcgacatcga catgctgcca cgccatcccc agatgtttac tggtggtgca 840
gacaccatgt tgcgcctaca acaagatccc aaactcgacc cctacactga gggacttcca 900
gcggaagatc agcaggcatt ggcagaacgc tacgcaagca tcttccgttt attcttgaag 960
cacagcgatg ttattcgccg tgtcaccttc tggggggtca ccgatgccca cacctggctc 1020
aacaattggc ccatccgtgg ccgcaccagc catcccctgc tcttcgaccg ccagaacaac 1080
cccaaacccg ccttccacgc cgtcgtcaga ctgaagaccg aagactga 1128
<210> 272
<211> 375
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(22)
<400> 272
Met Phe Ile His Asn Ser Ile Cys Ser Ala Leu Cys Thr Ile Phe Leu
1 5 10 15
Ala Thr Ala Thr Met Gly Glu Asn Met Thr Leu Gln Glu Ala Phe Ala
20 25 30
Asp His Phe Tyr Val Gly Ala Ala Ile Ser Gln Arg Leu Phe Gln Pro
35 40 45
Asp Arg Ala Glu Thr Leu Gln Leu Ala Ala His Gln Phe Asn Ser Ile
50 55 60
Thr Ala Glu Asn Glu Met Lys Trp Gln Ser Leu Asn Pro Thr Pro Gly
65 70 75 80
Glu Tyr Arg Phe Glu Asn Ala Asp Lys Phe Val Arg Phe Gly Val Glu
85 90 95
Asn Asp Met Tyr Ile Val Gly His Val Leu Phe Trp His Ser Gln Thr
100 105 110
Pro Asp Trp Leu Phe Lys Asp Asp Asp Gly Asn Phe Val Ser Arg Glu
115 120 125
Val Leu Leu Asp Arg Met Arg Ala His Val Arg Asn Leu Val Gln Arg
130 135 140
Tyr Gly Asn His Val His Ala Trp Asp Val Ile Asn Glu Thr Phe Asn
145 150 155 160
Asp Asn Gly Ser Leu Arg Asp Ser Pro Trp Thr Gln Ile Leu Gly Glu
165 170 175
Glu Phe Ile Glu His Ala Phe Arg Ile Ala Gly Glu Glu Leu Pro Pro
180 185 190
His Val Glu Leu Leu Tyr Asn Asp Tyr Ser Met Thr Ile Pro Ala Lys
195 200 205
Arg Asp Ala Val Ala Glu Met Val Arg Asp Leu Ile Ala Lys Gly Ile
210 215 220
Arg Ile Asp Gly Val Gly Met Gln Gly His Trp Ala Arg Thr His Pro
225 230 235 240
Thr Ile Ala Asp Ile Glu Lys Ser Ile Leu Ala Phe Ala Gly Thr Gly
245 250 255
Val Gln Val His Ile Thr Glu Leu Asp Ile Asp Met Leu Pro Arg His
260 265 270
Pro Gln Met Phe Thr Gly Gly Ala Asp Thr Met Leu Arg Leu Gln Gln
275 280 285
Asp Pro Lys Leu Asp Pro Tyr Thr Glu Gly Leu Pro Ala Glu Asp Gln
290 295 300
Gln Ala Leu Ala Glu Arg Tyr Ala Ser Ile Phe Arg Leu Phe Leu Lys
305 310 315 320
His Ser Asp Val Ile Arg Arg Val Thr Phe Trp Gly Val Thr Asp Ala
325 330 335
His Thr Trp Leu Asn Asn Trp Pro Ile Arg Gly Arg Thr Ser His Pro
340 345 350
Leu Leu Phe Asp Arg Gln Asn Asn Pro Lys Pro Ala Phe His Ala Val
355 360 365
Val Arg Leu Lys Thr Glu Asp
370 375
<210> 273
<211> 1134
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 273
atggtttcat cgctaatcaa ttcttcatac attcggctca agcactattc gtgctcaagt 60
ttattgctcc tgacattggc agcctgtggc ggccagcagc ctcccccgga tacgggatcc 120
agcacttcaa gttcaagcag ttcttcgagc tccagttcaa gcagctcttc aagttccagc 180
tcaagcagtt cttccagctc cagctcgagc agctcttcga gttcgagctc ttcatcatcc 240
agctcttcag gggcaaaccc gccaccgacc gggggcaagt tcgtcggcaa catcacgacc 300
cgaggcgccg tccaagcgga cttcattcag tactgggatc aaattacgcc ggagaacgag 360
ggcaaatggg gttctgtgga aggaactcgc gaccagtaca actgggcgcc tcttgatcgc 420
atctatgact atgcacgtca gcacaatatc ccagtcaaag cgcatacgct ggtttggggt 480
gcacaggctc caggctggat caacaatctg agtgcggccg agcagcgtga ggaaatcgag 540
gaatggattc gtgattactg cacgcgttac ccagacaccc aaatgatcga cgtagttaac 600
gaggcgcacc caaatcacgc ccccgctcgc tatgcgcaga atgccttcgg caatgactgg 660
attaccgaag cgttcaaact ggcgcgccgg cactgcccca acgccatttt gatctacaac 720
gactataatt tcatcacttg ggataccgat gaaatcatgg cgctgattcg cccggctatc 780
gcagcagggg tagtggatgc ggtagggctg caggcgcata gcttgtatcc tgacgaatac 840
gctaacaaga tgtggagtgc cgctgaaata cagcagaagc tcgatctgat ctctaccctt 900
ggcgtgccga tgtatatttc ggaatatgat gtcgccaagt ccaatgacca agagcagttg 960
gcgattttca gcgagcagtt cccggtcctt tacgaacacc ccaatgtcgt aggtgtaacc 1020
ctctggggct atattgatgg agcgacgtgg cgcgccggct cgggcttgat tcgaaacggt 1080
cagcaccggc ccgccatgca atggctgctc gagtacttgg agaacaatcg atag 1134
<210> 274
<211> 377
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(74)
<400> 274
Met Val Ser Ser Leu Ile Asn Ser Ser Tyr Ile Arg Leu Lys His Tyr
1 5 10 15
Ser Cys Ser Ser Leu Leu Leu Leu Thr Leu Ala Ala Cys Gly Gly Gln
20 25 30
Gln Pro Pro Pro Asp Thr Gly Ser Ser Thr Ser Ser Ser Ser Ser Ser
35 40 45
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser
50 55 60
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser
65 70 75 80
Ser Ser Ser Gly Ala Asn Pro Pro Pro Thr Gly Gly Lys Phe Val Gly
85 90 95
Asn Ile Thr Thr Arg Gly Ala Val Gln Ala Asp Phe Ile Gln Tyr Trp
100 105 110
Asp Gln Ile Thr Pro Glu Asn Glu Gly Lys Trp Gly Ser Val Glu Gly
115 120 125
Thr Arg Asp Gln Tyr Asn Trp Ala Pro Leu Asp Arg Ile Tyr Asp Tyr
130 135 140
Ala Arg Gln His Asn Ile Pro Val Lys Ala His Thr Leu Val Trp Gly
145 150 155 160
Ala Gln Ala Pro Gly Trp Ile Asn Asn Leu Ser Ala Ala Glu Gln Arg
165 170 175
Glu Glu Ile Glu Glu Trp Ile Arg Asp Tyr Cys Thr Arg Tyr Pro Asp
180 185 190
Thr Gln Met Ile Asp Val Val Asn Glu Ala His Pro Asn His Ala Pro
195 200 205
Ala Arg Tyr Ala Gln Asn Ala Phe Gly Asn Asp Trp Ile Thr Glu Ala
210 215 220
Phe Lys Leu Ala Arg Arg His Cys Pro Asn Ala Ile Leu Ile Tyr Asn
225 230 235 240
Asp Tyr Asn Phe Ile Thr Trp Asp Thr Asp Glu Ile Met Ala Leu Ile
245 250 255
Arg Pro Ala Ile Ala Ala Gly Val Val Asp Ala Val Gly Leu Gln Ala
260 265 270
His Ser Leu Tyr Pro Asp Glu Tyr Ala Asn Lys Met Trp Ser Ala Ala
275 280 285
Glu Ile Gln Gln Lys Leu Asp Leu Ile Ser Thr Leu Gly Val Pro Met
290 295 300
Tyr Ile Ser Glu Tyr Asp Val Ala Lys Ser Asn Asp Gln Glu Gln Leu
305 310 315 320
Ala Ile Phe Ser Glu Gln Phe Pro Val Leu Tyr Glu His Pro Asn Val
325 330 335
Val Gly Val Thr Leu Trp Gly Tyr Ile Asp Gly Ala Thr Trp Arg Ala
340 345 350
Gly Ser Gly Leu Ile Arg Asn Gly Gln His Arg Pro Ala Met Gln Trp
355 360 365
Leu Leu Glu Tyr Leu Glu Asn Asn Arg
370 375
<210> 275
<211> 1401
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 275
ttgggcgctg atccatttgc gctcacctat aacggaagag tgtacattta tatgtcgagt 60
gatgactatg aatatcacag caatggaacg attaaggata attcttttgc caatttgaat 120
agggtctttg tcatctcttc agcagatatg gtgaactgga cagatcatgg cgcgattcca 180
gtagctgggg caaatggcgc aaatggcggc aaaggaattg ccaaatgggc aggtgcttcc 240
tgggctccat cagcagcggt gaaaaaaatc aatgggaagg ataaattttt cctttatttc 300
gcgaacagcg gcggagggat tggcgttctg acagcagact cccccatcgg tccatggaca 360
gatcctatcg gaaaagcact cgtcacgcca aatacaccag ggatggctgg agttgtatgg 420
ctttttgatc ctgccgtttt tgtagatgat gacggcactg gttatctata tgccggcgga 480
ggtgttccag gcggttctaa tccaacgcag ggacaatggg cgaatcctaa aacagcaaga 540
gttctaaaac taggacctga tatgacaagt gtggtaggca gcgcatcaac cattgatgct 600
ccttttatgt ttgaagattc ggggatgcat aagtataacg gaacctatta ctattcctat 660
tgcatcaact ttggcggctc ccacccagca gataaaccac ctggtgagat cggttatatg 720
acgagctcaa gtccgatggg tccctttacg tatagagggc acttcctgaa aaatccgggt 780
gcatttttcg ggggaggcgg taataaccat catgctgtgt tcaattttaa aaacgagtgg 840
tatgtcgtgt atcataccca aacggtcagc tctgctttat acggatcagg aaaaggctac 900
agatctccgc atattaataa acttgtgcat aatgctgacg gctcccttcg agaagtcgca 960
gccaattttg aaggggttaa acagctttcc aacctgaatc cttatcagcg tgtagaagct 1020
gaaacattcg catggaatgg acgcattttg acagaggcat cttcagctcc aggcggaccg 1080
gtcaataacc agcatgtcac aaacattcaa aacggagatt gggtggctgc cagtaacgtc 1140
gatttcggat caaacggcgc gaggacattt aaagcgaatg tagcatcaaa tacaggcggg 1200
aaaatagaag tacgcctcgg aagtccagac ggcagactcg tcggaacact gaatgtccct 1260
tccacagggg gaacaaataa ctggcgagaa gtagaaacgg cagtaaatgg agcagcaggc 1320
gtgcacaacg tattttttgt ttttactgga acaggtgcaa atctatttca atttgattcc 1380
tggcagttta ctcaaaggta a 1401
<210> 276
<211> 466
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 276
Met Gly Ala Asp Pro Phe Ala Leu Thr Tyr Asn Gly Arg Val Tyr Ile
1 5 10 15
Tyr Met Ser Ser Asp Asp Tyr Glu Tyr His Ser Asn Gly Thr Ile Lys
20 25 30
Asp Asn Ser Phe Ala Asn Leu Asn Arg Val Phe Val Ile Ser Ser Ala
35 40 45
Asp Met Val Asn Trp Thr Asp His Gly Ala Ile Pro Val Ala Gly Ala
50 55 60
Asn Gly Ala Asn Gly Gly Lys Gly Ile Ala Lys Trp Ala Gly Ala Ser
65 70 75 80
Trp Ala Pro Ser Ala Ala Val Lys Lys Ile Asn Gly Lys Asp Lys Phe
85 90 95
Phe Leu Tyr Phe Ala Asn Ser Gly Gly Gly Ile Gly Val Leu Thr Ala
100 105 110
Asp Ser Pro Ile Gly Pro Trp Thr Asp Pro Ile Gly Lys Ala Leu Val
115 120 125
Thr Pro Asn Thr Pro Gly Met Ala Gly Val Val Trp Leu Phe Asp Pro
130 135 140
Ala Val Phe Val Asp Asp Asp Gly Thr Gly Tyr Leu Tyr Ala Gly Gly
145 150 155 160
Gly Val Pro Gly Gly Ser Asn Pro Thr Gln Gly Gln Trp Ala Asn Pro
165 170 175
Lys Thr Ala Arg Val Leu Lys Leu Gly Pro Asp Met Thr Ser Val Val
180 185 190
Gly Ser Ala Ser Thr Ile Asp Ala Pro Phe Met Phe Glu Asp Ser Gly
195 200 205
Met His Lys Tyr Asn Gly Thr Tyr Tyr Tyr Ser Tyr Cys Ile Asn Phe
210 215 220
Gly Gly Ser His Pro Ala Asp Lys Pro Pro Gly Glu Ile Gly Tyr Met
225 230 235 240
Thr Ser Ser Ser Pro Met Gly Pro Phe Thr Tyr Arg Gly His Phe Leu
245 250 255
Lys Asn Pro Gly Ala Phe Phe Gly Gly Gly Gly Asn Asn His His Ala
260 265 270
Val Phe Asn Phe Lys Asn Glu Trp Tyr Val Val Tyr His Thr Gln Thr
275 280 285
Val Ser Ser Ala Leu Tyr Gly Ser Gly Lys Gly Tyr Arg Ser Pro His
290 295 300
Ile Asn Lys Leu Val His Asn Ala Asp Gly Ser Leu Arg Glu Val Ala
305 310 315 320
Ala Asn Phe Glu Gly Val Lys Gln Leu Ser Asn Leu Asn Pro Tyr Gln
325 330 335
Arg Val Glu Ala Glu Thr Phe Ala Trp Asn Gly Arg Ile Leu Thr Glu
340 345 350
Ala Ser Ser Ala Pro Gly Gly Pro Val Asn Asn Gln His Val Thr Asn
355 360 365
Ile Gln Asn Gly Asp Trp Val Ala Ala Ser Asn Val Asp Phe Gly Ser
370 375 380
Asn Gly Ala Arg Thr Phe Lys Ala Asn Val Ala Ser Asn Thr Gly Gly
385 390 395 400
Lys Ile Glu Val Arg Leu Gly Ser Pro Asp Gly Arg Leu Val Gly Thr
405 410 415
Leu Asn Val Pro Ser Thr Gly Gly Thr Asn Asn Trp Arg Glu Val Glu
420 425 430
Thr Ala Val Asn Gly Ala Ala Gly Val His Asn Val Phe Phe Val Phe
435 440 445
Thr Gly Thr Gly Ala Asn Leu Phe Gln Phe Asp Ser Trp Gln Phe Thr
450 455 460
Gln Arg
465
<210> 277
<211> 1128
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 277
atgcgaaaca cattaatcct tttgattccg gccttgatga tgctttcttg cagtgcggga 60
aatcaggata gagtaccatc cctgcacgcc gagttctcgg atgcattttt gattggaacg 120
gcgctgaatt ctgagcagat attgggtcgg gatacacgcg gactcgaatt gattagaact 180
cattttaacg ccattacgcc cgaaaacatt accaaatggg aggctatcca tcccgaaccc 240
ggtgtctatg attttaaaga ggctgatgca ttcgtcgatt ttggccaaaa atataatatg 300
ttcatggtgg gtcatacact ggtttggcat agtcagacac cgcgctgggt cttcaaagac 360
gaaaatggcg cgttggtatc gcgcgaggta ctgttagagc ggatgcgcga ccacatccac 420
accgttgttg gccgctaccg tggacgtatt cacggctggg atgtcgtaaa cgaagccctc 480
aatgaagacg gttcgtacag agaaacactg tggtaccaaa taattggtac ggactatatt 540
cttaaagcat tcgaatttgc ccgggaggcc gatcccgacg ctgagctata ctataacgat 600
tactcgcttg agaacccctc aaagagagcc ggcgcgatgc gaattgttca atacctgcag 660
gaacatggtg ctccgattac tggggttgga acccaggggc atttcaccct cgactggccc 720
gaactttctg aaattgaaca gaccgtcatt gattttgcct cccttggtat ggatgtaatg 780
attaccgaat tggatatcga tgtactgcct cagccagacg attatactgg cgccgatgtg 840
aattttagcg cagagcttta cgacgaactg aacccatggc ccaacggcct tccaccggaa 900
attgaacagg aattggccaa tcgatatgcc gacatcttcg aaatctattt gcgtcatcgt 960
gataaagtta cgcgagtgtc tttttggggt gtcacagatg gcgactcgtg gaaaaataac 1020
tggcctgtgc caggtcgtac caactatccg ctcatttttg atcgaaactg gaagccaaaa 1080
cccgcttttt tctcgattgt tgatgcagcc agggaggcac tggattaa 1128
<210> 278
<211> 375
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(19)
<400> 278
Met Arg Asn Thr Leu Ile Leu Leu Ile Pro Ala Leu Met Met Leu Ser
1 5 10 15
Cys Ser Ala Gly Asn Gln Asp Arg Val Pro Ser Leu His Ala Glu Phe
20 25 30
Ser Asp Ala Phe Leu Ile Gly Thr Ala Leu Asn Ser Glu Gln Ile Leu
35 40 45
Gly Arg Asp Thr Arg Gly Leu Glu Leu Ile Arg Thr His Phe Asn Ala
50 55 60
Ile Thr Pro Glu Asn Ile Thr Lys Trp Glu Ala Ile His Pro Glu Pro
65 70 75 80
Gly Val Tyr Asp Phe Lys Glu Ala Asp Ala Phe Val Asp Phe Gly Gln
85 90 95
Lys Tyr Asn Met Phe Met Val Gly His Thr Leu Val Trp His Ser Gln
100 105 110
Thr Pro Arg Trp Val Phe Lys Asp Glu Asn Gly Ala Leu Val Ser Arg
115 120 125
Glu Val Leu Leu Glu Arg Met Arg Asp His Ile His Thr Val Val Gly
130 135 140
Arg Tyr Arg Gly Arg Ile His Gly Trp Asp Val Val Asn Glu Ala Leu
145 150 155 160
Asn Glu Asp Gly Ser Tyr Arg Glu Thr Leu Trp Tyr Gln Ile Ile Gly
165 170 175
Thr Asp Tyr Ile Leu Lys Ala Phe Glu Phe Ala Arg Glu Ala Asp Pro
180 185 190
Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Leu Glu Asn Pro Ser Lys
195 200 205
Arg Ala Gly Ala Met Arg Ile Val Gln Tyr Leu Gln Glu His Gly Ala
210 215 220
Pro Ile Thr Gly Val Gly Thr Gln Gly His Phe Thr Leu Asp Trp Pro
225 230 235 240
Glu Leu Ser Glu Ile Glu Gln Thr Val Ile Asp Phe Ala Ser Leu Gly
245 250 255
Met Asp Val Met Ile Thr Glu Leu Asp Ile Asp Val Leu Pro Gln Pro
260 265 270
Asp Asp Tyr Thr Gly Ala Asp Val Asn Phe Ser Ala Glu Leu Tyr Asp
275 280 285
Glu Leu Asn Pro Trp Pro Asn Gly Leu Pro Pro Glu Ile Glu Gln Glu
290 295 300
Leu Ala Asn Arg Tyr Ala Asp Ile Phe Glu Ile Tyr Leu Arg His Arg
305 310 315 320
Asp Lys Val Thr Arg Val Ser Phe Trp Gly Val Thr Asp Gly Asp Ser
325 330 335
Trp Lys Asn Asn Trp Pro Val Pro Gly Arg Thr Asn Tyr Pro Leu Ile
340 345 350
Phe Asp Arg Asn Trp Lys Pro Lys Pro Ala Phe Phe Ser Ile Val Asp
355 360 365
Ala Ala Arg Glu Ala Leu Asp
370 375
<210> 279
<211> 786
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 279
atgctttctc cgacaaggaa actcccgccg gccattggac tcaccttcct cttcgccgct 60
tcggcgacgc cggaaaccac gctcaaggac gccttcgcgg accattttct cgtcggggcg 120
gcgctcaatg aatcgcactt tgcggagcac aatccggcgc acgccggtct cgtcgccgca 180
aacttcaatg cgatcaccgc ggagaatgtg atgaaatggg aggccgttca tccccggccg 240
ggagaatata cgttcggcgc cgcggaccgg ttcgttgagt tcggggaaaa gaacggcctg 300
ttcatcgtgg ggcacacgct gatctggcat tctcaaacgc cggcctgggt tttcgaggat 360
gagaatggcg cgccgctcgg ccgcgaggcg ctgctggagc ggatgcgcga tcacattcac 420
accgttgccg gacgttacag gggccgtgtg aaggggtggg acgtggtcaa cgaagccctc 480
gccgaggacg gttccctgcg ggattcgccg tggcgccgca tcataggcga cgactatttc 540
gtgaaggcct ttgagtttgc gcgggaagct gatccggatg cggagttgta ttacaacgat 600
tactcgattg aaaacgaacc gaagcgcaag ggggcggtgg cgttggtgag gacgctccag 660
gcggcgggtg ttcccgttgc cggcgtgggg attcagggac acggcaatct ccattggcct 720
tctccgcggc ttgtcgaaga ggcgatccgg gactttgcca gtttgggcgt caaggtgatg 780
atctga 786
<210> 280
<211> 261
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(22)
<400> 280
Met Leu Ser Pro Thr Arg Lys Leu Pro Pro Ala Ile Gly Leu Thr Phe
1 5 10 15
Leu Phe Ala Ala Ser Ala Thr Pro Glu Thr Thr Leu Lys Asp Ala Phe
20 25 30
Ala Asp His Phe Leu Val Gly Ala Ala Leu Asn Glu Ser His Phe Ala
35 40 45
Glu His Asn Pro Ala His Ala Gly Leu Val Ala Ala Asn Phe Asn Ala
50 55 60
Ile Thr Ala Glu Asn Val Met Lys Trp Glu Ala Val His Pro Arg Pro
65 70 75 80
Gly Glu Tyr Thr Phe Gly Ala Ala Asp Arg Phe Val Glu Phe Gly Glu
85 90 95
Lys Asn Gly Leu Phe Ile Val Gly His Thr Leu Ile Trp His Ser Gln
100 105 110
Thr Pro Ala Trp Val Phe Glu Asp Glu Asn Gly Ala Pro Leu Gly Arg
115 120 125
Glu Ala Leu Leu Glu Arg Met Arg Asp His Ile His Thr Val Ala Gly
130 135 140
Arg Tyr Arg Gly Arg Val Lys Gly Trp Asp Val Val Asn Glu Ala Leu
145 150 155 160
Ala Glu Asp Gly Ser Leu Arg Asp Ser Pro Trp Arg Arg Ile Ile Gly
165 170 175
Asp Asp Tyr Phe Val Lys Ala Phe Glu Phe Ala Arg Glu Ala Asp Pro
180 185 190
Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Ile Glu Asn Glu Pro Lys
195 200 205
Arg Lys Gly Ala Val Ala Leu Val Arg Thr Leu Gln Ala Ala Gly Val
210 215 220
Pro Val Ala Gly Val Gly Ile Gln Gly His Gly Asn Leu His Trp Pro
225 230 235 240
Ser Pro Arg Leu Val Glu Glu Ala Ile Arg Asp Phe Ala Ser Leu Gly
245 250 255
Val Lys Val Met Ile
260
<210> 281
<211> 963
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 281
gtgggcacct gcatgagcgg ggccgattcg cgcaaccctg cccgtctgga gctgatcaga 60
acgcagtaca gcatcatcac cccggaaaac gagctcaagc ccgattccgt tctggatgtg 120
gctgccagcc gtgctctggc caaggaggac gataccgccg tggccgtgca tttcagcgcc 180
gccgctccca tcctgaactt tgcccgtgac aacggcatca aggtgcacgg tcatgtgctg 240
gtctggcaca gccagactcc cgaggagttc ttccacgagg gctataacgc ctccgcgccc 300
tatgtgagcc gcgaggtgat gctggcccgt ctggacaact acatccgtct catctttgaa 360
tatatggatg aaaactatcc cggcctgatc gtgtcctggg atgtggccaa cgaatgcgtg 420
gccgacggct ccaccgccct gcgcacctcc aactggaccc gcgtggtggg gcaggatttt 480
gtggcccgcg ccttcgagat cgccgataaa tacgcgcccg aagatgtgat gctctgctac 540
aacgattatt ccactcccta tgagcccaag ctcaccggca tcgtgaacct gctcaccgag 600
ctgacacagg agggtcatat cgacggctac ggcttccaga gccactacag tgtcggcgat 660
ccctccctgc aggcggtcga gaacgcgttc aaaaagatct ccgccctggg gctcaagctg 720
cgcgtgagcg agctggacat caaggtagat gccgacagcg agcccaaccg cgcccttcag 780
gccgaccggt atgaggccct gctgcgcatc tatatgaaat acggcgtcag cgccgtgcag 840
gtgtggggcg tatgcgacgg caccagctgg atcggcgcga gctatcccct cccctttgac 900
gccgggctgc gtcccaagcc ctccttcttc ggcatactcc gcgcccttga cgaacagaac 960
tga 963
<210> 282
<211> 320
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 282
Met Gly Thr Cys Met Ser Gly Ala Asp Ser Arg Asn Pro Ala Arg Leu
1 5 10 15
Glu Leu Ile Arg Thr Gln Tyr Ser Ile Ile Thr Pro Glu Asn Glu Leu
20 25 30
Lys Pro Asp Ser Val Leu Asp Val Ala Ala Ser Arg Ala Leu Ala Lys
35 40 45
Glu Asp Asp Thr Ala Val Ala Val His Phe Ser Ala Ala Ala Pro Ile
50 55 60
Leu Asn Phe Ala Arg Asp Asn Gly Ile Lys Val His Gly His Val Leu
65 70 75 80
Val Trp His Ser Gln Thr Pro Glu Glu Phe Phe His Glu Gly Tyr Asn
85 90 95
Ala Ser Ala Pro Tyr Val Ser Arg Glu Val Met Leu Ala Arg Leu Asp
100 105 110
Asn Tyr Ile Arg Leu Ile Phe Glu Tyr Met Asp Glu Asn Tyr Pro Gly
115 120 125
Leu Ile Val Ser Trp Asp Val Ala Asn Glu Cys Val Ala Asp Gly Ser
130 135 140
Thr Ala Leu Arg Thr Ser Asn Trp Thr Arg Val Val Gly Gln Asp Phe
145 150 155 160
Val Ala Arg Ala Phe Glu Ile Ala Asp Lys Tyr Ala Pro Glu Asp Val
165 170 175
Met Leu Cys Tyr Asn Asp Tyr Ser Thr Pro Tyr Glu Pro Lys Leu Thr
180 185 190
Gly Ile Val Asn Leu Leu Thr Glu Leu Thr Gln Glu Gly His Ile Asp
195 200 205
Gly Tyr Gly Phe Gln Ser His Tyr Ser Val Gly Asp Pro Ser Leu Gln
210 215 220
Ala Val Glu Asn Ala Phe Lys Lys Ile Ser Ala Leu Gly Leu Lys Leu
225 230 235 240
Arg Val Ser Glu Leu Asp Ile Lys Val Asp Ala Asp Ser Glu Pro Asn
245 250 255
Arg Ala Leu Gln Ala Asp Arg Tyr Glu Ala Leu Leu Arg Ile Tyr Met
260 265 270
Lys Tyr Gly Val Ser Ala Val Gln Val Trp Gly Val Cys Asp Gly Thr
275 280 285
Ser Trp Ile Gly Ala Ser Tyr Pro Leu Pro Phe Asp Ala Gly Leu Arg
290 295 300
Pro Lys Pro Ser Phe Phe Gly Ile Leu Arg Ala Leu Asp Glu Gln Asn
305 310 315 320
<210> 283
<211> 4161
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 283
atgtataaaa gtttcgtcaa gaaagtctcc cttgtattat ctactctttt gctcttagtt 60
tcggcgtttc ctgtctcata tgcacaaatg aattccatcc ccgtttatga agaaacgttt 120
gaaaaccaag gaaactatgt ccaatctggt ggtgcgaccc tcactctagt aaaaaacaaa 180
gtgtttgcag ggaatgaaga tggaactgca ctatatatta gtaatcgatc gaataactgg 240
gacggggcag atttccgttt cacggatctt ggattacaag atggaaaaac atatacgatc 300
aatattatag gatatgtcga tgaaaatgaa gttgttcctt caggagccca agtgtatttg 360
caaactgtag ataaaacata tggatggtta gcaagcgcgg acttaaaaaa cggagagtcg 420
ttcactataa atacaacgtt cacccttgac atgagtaaag gggacacccg tcttcgtata 480
caatccaacg atagtggtaa aaaagtttca ttttacgtcg ggtatttttc aatttcaatt 540
agtgatgtag aaggagaaga tggtgggagc tctatttcaa ggccaccggc tttacctttt 600
gaaactattg actttgaaga tcaaagttta agtggatttg agggacgagc aggcacggaa 660
acattgaccg ttacgaatga agcaaataga actcctggag gatcttatgc actaaaagtg 720
gaaaatagat ctcaaaattg gcatggacct tccttacgca tcgagaaata tattgattta 780
ggttacgaat atacaatttc tctatgggtt aaacttattt cacccacaag tgcacaaatt 840
cagctttcta cccaagtcgg aagtggaagt ggtgcgagtt ataacaatat tttaagtaaa 900
gtaattagtg ttgatgatgg atgggtactg tatgaaggaa agtatcgcta caatagttcg 960
ggaggggaat atttaacaat ttacgtagaa agcccaaaca atagtactgc atctttttac 1020
atcgatgata ttcgtttaat aaagagtgga gacccaatct ctgtacaaaa agatcttctc 1080
cctatcaaga gtgtttatga aggtgacttc ttagttggta gtgccgtatc agcgactgat 1140
ttagagggag agagactcga gcttctcaag ttgcattaca atagcataac agcggaaaac 1200
gccatgaaac ctagctattt acaacctact aaaggaaact ttaccttcga agcagcagat 1260
agtattgtaa ataaagccct agaagaagga atgaaagtac atggacatgt tctcgtatgg 1320
catcagcaga cacctgaatg gatgaccact agagaagatg gaagccctct cggcagggaa 1380
gaagcgttag aaaatctaaa aaatcacatt gaaacagtta tgaaacattt tggtgataga 1440
gtaatttcat gggatgttgt caatgaagct atcattgata atccacctaa tcctgataat 1500
tgggaggaat cattaagaaa atcaccatgg tactattcaa tcggttctga ttatgttgag 1560
caagcattcc gaattgcacg acaagttttg gacgaaaatg ggtgggatat taagctatat 1620
tacaatgatt acaatgaaga taatcaaaga aaagcacaag ccatttacca tatggtaaaa 1680
gagcttaatg aaaaatatgc acaagagcat cctggtaaaa gattaatcga tggaattgga 1740
atgcaagggc attacagtat acgaacaaat ccagataatg tgaaaatgtc attagaaaga 1800
tttatttccc ttggtgtgga agttagtatt actgaactcg atattcaagc tggaacggat 1860
aatcatctta cggaagaaca gtcaaaagca caagcatatt tatacgctaa attattcaaa 1920
atattcaaag aaaatgcatc gcatatctcc cgagttacgt tatggggatt aaatgatgcg 1980
gcaagttggc gtgcgtcaac aagtccattg ttatttgatc gaaatttaca ggccaaacca 2040
agttactatg cggtaattga tcctgataca tttatagaag aaaatcctac tgtgacagaa 2100
gagtcgcgga aagcaattgc tttgtatggt atccctgtaa ttgatggaag catcgattcc 2160
atttgggaaa gtgttcctta catccctatt gatcgttacc aaatggcgtg gcaaggagca 2220
agcggaactg ctaaagttct ttgggacgaa gggaatctgt atgtattagt acaagttaac 2280
gatgaccagt tagataagtc gagtacaaat ccttgggagc aggattcgat agaggtgttt 2340
gtggacgaaa ataatgcaaa aacatcgttt taccaagagg atgatggaca atatagagta 2400
aactttgaca acgaaacatc gtttaatcca ccaagcattg aaaatggatt tatgtccgaa 2460
actaatgtat ctgggactaa ttatgtggtg gagatgaaaa tccctttaag aagtatacaa 2520
ctaaaaaatg ggtctgaaat agggtttgat gttcaaatta atgatgggaa aaatggtgct 2580
cgtcagagtg tggctgcttg gaatgatacg actggaactg catatatgga tacatctgta 2640
ttcgggacac ttactctttt aaccacttta gataatgaaa atacaccagg cagcggcaca 2700
acaccaggta gtggcacaac accaggcagt ggcacaacac caggcagcag cacaacacca 2760
ggcagcggta caacaccagg tagcggcaca acaccaggca gtggcacaac accaggcagc 2820
ggcacaacac caggcagtgg cacaacacca ggcagtggca caacaccggg cagcggtaca 2880
acaccaggca gtggcacaac accaggcagt ggtacaacac cgggcagtgg cacaacacca 2940
gtgaagggtg aaaatggtac ggttgtttta cagccgaaag tagagacgaa agaaaaagac 3000
ggcaaagtag tagaaaaagt ggcaactatt tcaacaaatg aagttgaagc gattgtcaag 3060
gagctgtcga atgaaaataa acaagtcgtc gtctccctcg gctcgcttcc aaaaggtgta 3120
gccacaaaag tagatgtgcc agctacatta tttacacaag cggcaaataa acaagcagaa 3180
gcaacgattg tgagcgccag tgaacaagcg acgtacaaat tgccagtcaa agaagtgcag 3240
gcgtctcttg cgacgattgc ccggtcactc ggtgcaacga tagaacaagt tagcatctcg 3300
attgaaatga aagtgaacga tgcgccgtca ctacgtgtga aaccgttgtc tgatgcggta 3360
gagtttcatg tcgtggcgaa agcaaatgga aaggaacgcg tcatcgatcg gtttactcaa 3420
tatgtcgaac gcgaaatcgc gttaaagcaa tcggtcaacg ctagtcgtgc cattgcagtg 3480
cgcgtgaacg atgacggttc acttacccca gtaccgacaa cgtttgttgg caacaaagca 3540
gtcattaaat cgttgacgaa ctcgacgtat gttgttgtgg aaggaacaca tacatttagt 3600
gacatccaac cacattgggc gaaaggttat attgaaacac tcgcggcaaa acagcttgtc 3660
aaagggatga cggacacaac atatcgacca aatgatcgga tgacgcgcgc gcaatttgcg 3720
gtgttgctcg tacgggcgct aggattgccg agcgaaacgt atgacggtcg ctttgctgat 3780
gtgaagggaa cggagtggtt taacaagaac ggtgaattag cagcggcagt caagttcgga 3840
atcattcaag gaaaaacagc ttatatgttt gcgccgaatg agccaatcac tcgcgcacaa 3900
gcagctgtca tgatcgaacg ggcattgaaa ctttcgatcg ttggctatga tgaggcaaca 3960
agcgacaaaa cgaaaaaagt gacagatttc cgcgatgcaa aacaattgcc aacatgggca 4020
aaacaggcga ttgaagcagt ataccaagca ggcatcatgc aaggacgaga tagcggaaac 4080
tttgatccga caagccatgt gacgcgtgcc gaaatggcga aggtgttaat ggatatttta 4140
gagttgacaa aacttattta a 4161
<210> 284
<211> 1386
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(28)
<400> 284
Met Tyr Lys Ser Phe Val Lys Lys Val Ser Leu Val Leu Ser Thr Leu
1 5 10 15
Leu Leu Leu Val Ser Ala Phe Pro Val Ser Tyr Ala Gln Met Asn Ser
20 25 30
Ile Pro Val Tyr Glu Glu Thr Phe Glu Asn Gln Gly Asn Tyr Val Gln
35 40 45
Ser Gly Gly Ala Thr Leu Thr Leu Val Lys Asn Lys Val Phe Ala Gly
50 55 60
Asn Glu Asp Gly Thr Ala Leu Tyr Ile Ser Asn Arg Ser Asn Asn Trp
65 70 75 80
Asp Gly Ala Asp Phe Arg Phe Thr Asp Leu Gly Leu Gln Asp Gly Lys
85 90 95
Thr Tyr Thr Ile Asn Ile Ile Gly Tyr Val Asp Glu Asn Glu Val Val
100 105 110
Pro Ser Gly Ala Gln Val Tyr Leu Gln Thr Val Asp Lys Thr Tyr Gly
115 120 125
Trp Leu Ala Ser Ala Asp Leu Lys Asn Gly Glu Ser Phe Thr Ile Asn
130 135 140
Thr Thr Phe Thr Leu Asp Met Ser Lys Gly Asp Thr Arg Leu Arg Ile
145 150 155 160
Gln Ser Asn Asp Ser Gly Lys Lys Val Ser Phe Tyr Val Gly Tyr Phe
165 170 175
Ser Ile Ser Ile Ser Asp Val Glu Gly Glu Asp Gly Gly Ser Ser Ile
180 185 190
Ser Arg Pro Pro Ala Leu Pro Phe Glu Thr Ile Asp Phe Glu Asp Gln
195 200 205
Ser Leu Ser Gly Phe Glu Gly Arg Ala Gly Thr Glu Thr Leu Thr Val
210 215 220
Thr Asn Glu Ala Asn Arg Thr Pro Gly Gly Ser Tyr Ala Leu Lys Val
225 230 235 240
Glu Asn Arg Ser Gln Asn Trp His Gly Pro Ser Leu Arg Ile Glu Lys
245 250 255
Tyr Ile Asp Leu Gly Tyr Glu Tyr Thr Ile Ser Leu Trp Val Lys Leu
260 265 270
Ile Ser Pro Thr Ser Ala Gln Ile Gln Leu Ser Thr Gln Val Gly Ser
275 280 285
Gly Ser Gly Ala Ser Tyr Asn Asn Ile Leu Ser Lys Val Ile Ser Val
290 295 300
Asp Asp Gly Trp Val Leu Tyr Glu Gly Lys Tyr Arg Tyr Asn Ser Ser
305 310 315 320
Gly Gly Glu Tyr Leu Thr Ile Tyr Val Glu Ser Pro Asn Asn Ser Thr
325 330 335
Ala Ser Phe Tyr Ile Asp Asp Ile Arg Leu Ile Lys Ser Gly Asp Pro
340 345 350
Ile Ser Val Gln Lys Asp Leu Leu Pro Ile Lys Ser Val Tyr Glu Gly
355 360 365
Asp Phe Leu Val Gly Ser Ala Val Ser Ala Thr Asp Leu Glu Gly Glu
370 375 380
Arg Leu Glu Leu Leu Lys Leu His Tyr Asn Ser Ile Thr Ala Glu Asn
385 390 395 400
Ala Met Lys Pro Ser Tyr Leu Gln Pro Thr Lys Gly Asn Phe Thr Phe
405 410 415
Glu Ala Ala Asp Ser Ile Val Asn Lys Ala Leu Glu Glu Gly Met Lys
420 425 430
Val His Gly His Val Leu Val Trp His Gln Gln Thr Pro Glu Trp Met
435 440 445
Thr Thr Arg Glu Asp Gly Ser Pro Leu Gly Arg Glu Glu Ala Leu Glu
450 455 460
Asn Leu Lys Asn His Ile Glu Thr Val Met Lys His Phe Gly Asp Arg
465 470 475 480
Val Ile Ser Trp Asp Val Val Asn Glu Ala Ile Ile Asp Asn Pro Pro
485 490 495
Asn Pro Asp Asn Trp Glu Glu Ser Leu Arg Lys Ser Pro Trp Tyr Tyr
500 505 510
Ser Ile Gly Ser Asp Tyr Val Glu Gln Ala Phe Arg Ile Ala Arg Gln
515 520 525
Val Leu Asp Glu Asn Gly Trp Asp Ile Lys Leu Tyr Tyr Asn Asp Tyr
530 535 540
Asn Glu Asp Asn Gln Arg Lys Ala Gln Ala Ile Tyr His Met Val Lys
545 550 555 560
Glu Leu Asn Glu Lys Tyr Ala Gln Glu His Pro Gly Lys Arg Leu Ile
565 570 575
Asp Gly Ile Gly Met Gln Gly His Tyr Ser Ile Arg Thr Asn Pro Asp
580 585 590
Asn Val Lys Met Ser Leu Glu Arg Phe Ile Ser Leu Gly Val Glu Val
595 600 605
Ser Ile Thr Glu Leu Asp Ile Gln Ala Gly Thr Asp Asn His Leu Thr
610 615 620
Glu Glu Gln Ser Lys Ala Gln Ala Tyr Leu Tyr Ala Lys Leu Phe Lys
625 630 635 640
Ile Phe Lys Glu Asn Ala Ser His Ile Ser Arg Val Thr Leu Trp Gly
645 650 655
Leu Asn Asp Ala Ala Ser Trp Arg Ala Ser Thr Ser Pro Leu Leu Phe
660 665 670
Asp Arg Asn Leu Gln Ala Lys Pro Ser Tyr Tyr Ala Val Ile Asp Pro
675 680 685
Asp Thr Phe Ile Glu Glu Asn Pro Thr Val Thr Glu Glu Ser Arg Lys
690 695 700
Ala Ile Ala Leu Tyr Gly Ile Pro Val Ile Asp Gly Ser Ile Asp Ser
705 710 715 720
Ile Trp Glu Ser Val Pro Tyr Ile Pro Ile Asp Arg Tyr Gln Met Ala
725 730 735
Trp Gln Gly Ala Ser Gly Thr Ala Lys Val Leu Trp Asp Glu Gly Asn
740 745 750
Leu Tyr Val Leu Val Gln Val Asn Asp Asp Gln Leu Asp Lys Ser Ser
755 760 765
Thr Asn Pro Trp Glu Gln Asp Ser Ile Glu Val Phe Val Asp Glu Asn
770 775 780
Asn Ala Lys Thr Ser Phe Tyr Gln Glu Asp Asp Gly Gln Tyr Arg Val
785 790 795 800
Asn Phe Asp Asn Glu Thr Ser Phe Asn Pro Pro Ser Ile Glu Asn Gly
805 810 815
Phe Met Ser Glu Thr Asn Val Ser Gly Thr Asn Tyr Val Val Glu Met
820 825 830
Lys Ile Pro Leu Arg Ser Ile Gln Leu Lys Asn Gly Ser Glu Ile Gly
835 840 845
Phe Asp Val Gln Ile Asn Asp Gly Lys Asn Gly Ala Arg Gln Ser Val
850 855 860
Ala Ala Trp Asn Asp Thr Thr Gly Thr Ala Tyr Met Asp Thr Ser Val
865 870 875 880
Phe Gly Thr Leu Thr Leu Leu Thr Thr Leu Asp Asn Glu Asn Thr Pro
885 890 895
Gly Ser Gly Thr Thr Pro Gly Ser Gly Thr Thr Pro Gly Ser Gly Thr
900 905 910
Thr Pro Gly Ser Ser Thr Thr Pro Gly Ser Gly Thr Thr Pro Gly Ser
915 920 925
Gly Thr Thr Pro Gly Ser Gly Thr Thr Pro Gly Ser Gly Thr Thr Pro
930 935 940
Gly Ser Gly Thr Thr Pro Gly Ser Gly Thr Thr Pro Gly Ser Gly Thr
945 950 955 960
Thr Pro Gly Ser Gly Thr Thr Pro Gly Ser Gly Thr Thr Pro Gly Ser
965 970 975
Gly Thr Thr Pro Val Lys Gly Glu Asn Gly Thr Val Val Leu Gln Pro
980 985 990
Lys Val Glu Thr Lys Glu Lys Asp Gly Lys Val Val Glu Lys Val Ala
995 1000 1005
Thr Ile Ser Thr Asn Glu Val Glu Ala Ile Val Lys Glu Leu Ser Asn
1010 1015 1020
Glu Asn Lys Gln Val Val Val Ser Leu Gly Ser Leu Pro Lys Gly Val
1025 1030 1035 1040
Ala Thr Lys Val Asp Val Pro Ala Thr Leu Phe Thr Gln Ala Ala Asn
1045 1050 1055
Lys Gln Ala Glu Ala Thr Ile Val Ser Ala Ser Glu Gln Ala Thr Tyr
1060 1065 1070
Lys Leu Pro Val Lys Glu Val Gln Ala Ser Leu Ala Thr Ile Ala Arg
1075 1080 1085
Ser Leu Gly Ala Thr Ile Glu Gln Val Ser Ile Ser Ile Glu Met Lys
1090 1095 1100
Val Asn Asp Ala Pro Ser Leu Arg Val Lys Pro Leu Ser Asp Ala Val
1105 1110 1115 1120
Glu Phe His Val Val Ala Lys Ala Asn Gly Lys Glu Arg Val Ile Asp
1125 1130 1135
Arg Phe Thr Gln Tyr Val Glu Arg Glu Ile Ala Leu Lys Gln Ser Val
1140 1145 1150
Asn Ala Ser Arg Ala Ile Ala Val Arg Val Asn Asp Asp Gly Ser Leu
1155 1160 1165
Thr Pro Val Pro Thr Thr Phe Val Gly Asn Lys Ala Val Ile Lys Ser
1170 1175 1180
Leu Thr Asn Ser Thr Tyr Val Val Val Glu Gly Thr His Thr Phe Ser
1185 1190 1195 1200
Asp Ile Gln Pro His Trp Ala Lys Gly Tyr Ile Glu Thr Leu Ala Ala
1205 1210 1215
Lys Gln Leu Val Lys Gly Met Thr Asp Thr Thr Tyr Arg Pro Asn Asp
1220 1225 1230
Arg Met Thr Arg Ala Gln Phe Ala Val Leu Leu Val Arg Ala Leu Gly
1235 1240 1245
Leu Pro Ser Glu Thr Tyr Asp Gly Arg Phe Ala Asp Val Lys Gly Thr
1250 1255 1260
Glu Trp Phe Asn Lys Asn Gly Glu Leu Ala Ala Ala Val Lys Phe Gly
1265 1270 1275 1280
Ile Ile Gln Gly Lys Thr Ala Tyr Met Phe Ala Pro Asn Glu Pro Ile
1285 1290 1295
Thr Arg Ala Gln Ala Ala Val Met Ile Glu Arg Ala Leu Lys Leu Ser
1300 1305 1310
Ile Val Gly Tyr Asp Glu Ala Thr Ser Asp Lys Thr Lys Lys Val Thr
1315 1320 1325
Asp Phe Arg Asp Ala Lys Gln Leu Pro Thr Trp Ala Lys Gln Ala Ile
1330 1335 1340
Glu Ala Val Tyr Gln Ala Gly Ile Met Gln Gly Arg Asp Ser Gly Asn
1345 1350 1355 1360
Phe Asp Pro Thr Ser His Val Thr Arg Ala Glu Met Ala Lys Val Leu
1365 1370 1375
Met Asp Ile Leu Glu Leu Thr Lys Leu Ile
1380 1385
<210> 285
<211> 1569
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 285
gtgaaccgaa acacatctcc ggacttcaag cttggagcag gcgttacggt aagtgatttc 60
ctgaacaagg gcaggcaata tgaggtcgct gtggcgaatc ttgatgaaat gacggccgga 120
aatgccatga agcagtcttc tgtaatgagg cctgacggat ccatggattt cactcaggtc 180
agaagattca tcgaggaggc cgaacgtgtc ggaatgacag tgtacggcca tacattggca 240
tggcattcac agcagcagaa cgcctatctt aacggtctga tcaagggcaa gaagaccgag 300
gtcgagccag gccaggagtc agaggtcgtt cttctccaga cagatttcaa tgacggaaat 360
gtcacattca acggatgggg aaacaattct tcaaggactg tcgagaatgg tgcattaaag 420
cttacaaacc cttctgtagt aaacagttgg gaggcccagt tcgcatatga tttttcagag 480
gccttcgaga tggacaagac atataagctc aagttcagga tcaagggctc ggctgcagga 540
aagatcgcgg caggcttcca gatcactgac ggctaccttt cggcaggtga gttcggaacc 600
gtagagttca atacccagtg gaaggatgtc gagctctcat gcgtatgttc cgctgaaggc 660
ggtacacgct tgatcttcag tttcggagag tttgccggag atatctatat cgacgatttc 720
tgcttcagtg tggaaggagc tggatatatc tacgaagatc ttaccccggc agagaagaag 780
gagcgcctta ccgaggcaat ggaccgttgg atcaagggaa tgatggaggt taccgctacc 840
agggtttctg cgtgggatgc tgtcaatgag gcgatttccg gccgtgatac aaatggcgac 900
ggcttctatg aacttgagtc ggcacaatgg ggaagctcga acaacttcta ttggcaggat 960
tatctcggct caggagatta tgtgcgtatc gtgatcgcaa aggcccgcaa gtattatgag 1020
gaattcggcg gtacggctcc tttgagactc ttcatcaatg actacaacct cgaatctgac 1080
tgggatgaca acaagaagct caagagcctt atccattgga tcggtgtctg ggagtctgac 1140
ggagtgacaa agatcgacgg aatcggtacc cagatgcacg tttcgtatta cgagaatcct 1200
gatattcagg caagcaagga gaaacattat gtgcagatgc ttcagcttat ggcaaataca 1260
ggaaagctcg tgaagatctc cgagcttgat atgggctatg tagaccgcaa cggaaatact 1320
gtgggaacag cggacatgac cgaccagcag catagggcca tggcggatta ttatgacttc 1380
atcgtgcgca agtactttga gatcgtgcct cctgcacagc agtatggcat cacgcagtgg 1440
tgcatgacgg atgctcccgg agctatcggc acaggctgga gaggcggtga gcctgtgggc 1500
ctgtgggacc agaattacaa ccgcaagtat gcgtacgcag gatttgcaaa cggacttaga 1560
gcgaaataa 1569
<210> 286
<211> 522
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 286
Met Asn Arg Asn Thr Ser Pro Asp Phe Lys Leu Gly Ala Gly Val Thr
1 5 10 15
Val Ser Asp Phe Leu Asn Lys Gly Arg Gln Tyr Glu Val Ala Val Ala
20 25 30
Asn Leu Asp Glu Met Thr Ala Gly Asn Ala Met Lys Gln Ser Ser Val
35 40 45
Met Arg Pro Asp Gly Ser Met Asp Phe Thr Gln Val Arg Arg Phe Ile
50 55 60
Glu Glu Ala Glu Arg Val Gly Met Thr Val Tyr Gly His Thr Leu Ala
65 70 75 80
Trp His Ser Gln Gln Gln Asn Ala Tyr Leu Asn Gly Leu Ile Lys Gly
85 90 95
Lys Lys Thr Glu Val Glu Pro Gly Gln Glu Ser Glu Val Val Leu Leu
100 105 110
Gln Thr Asp Phe Asn Asp Gly Asn Val Thr Phe Asn Gly Trp Gly Asn
115 120 125
Asn Ser Ser Arg Thr Val Glu Asn Gly Ala Leu Lys Leu Thr Asn Pro
130 135 140
Ser Val Val Asn Ser Trp Glu Ala Gln Phe Ala Tyr Asp Phe Ser Glu
145 150 155 160
Ala Phe Glu Met Asp Lys Thr Tyr Lys Leu Lys Phe Arg Ile Lys Gly
165 170 175
Ser Ala Ala Gly Lys Ile Ala Ala Gly Phe Gln Ile Thr Asp Gly Tyr
180 185 190
Leu Ser Ala Gly Glu Phe Gly Thr Val Glu Phe Asn Thr Gln Trp Lys
195 200 205
Asp Val Glu Leu Ser Cys Val Cys Ser Ala Glu Gly Gly Thr Arg Leu
210 215 220
Ile Phe Ser Phe Gly Glu Phe Ala Gly Asp Ile Tyr Ile Asp Asp Phe
225 230 235 240
Cys Phe Ser Val Glu Gly Ala Gly Tyr Ile Tyr Glu Asp Leu Thr Pro
245 250 255
Ala Glu Lys Lys Glu Arg Leu Thr Glu Ala Met Asp Arg Trp Ile Lys
260 265 270
Gly Met Met Glu Val Thr Ala Thr Arg Val Ser Ala Trp Asp Ala Val
275 280 285
Asn Glu Ala Ile Ser Gly Arg Asp Thr Asn Gly Asp Gly Phe Tyr Glu
290 295 300
Leu Glu Ser Ala Gln Trp Gly Ser Ser Asn Asn Phe Tyr Trp Gln Asp
305 310 315 320
Tyr Leu Gly Ser Gly Asp Tyr Val Arg Ile Val Ile Ala Lys Ala Arg
325 330 335
Lys Tyr Tyr Glu Glu Phe Gly Gly Thr Ala Pro Leu Arg Leu Phe Ile
340 345 350
Asn Asp Tyr Asn Leu Glu Ser Asp Trp Asp Asp Asn Lys Lys Leu Lys
355 360 365
Ser Leu Ile His Trp Ile Gly Val Trp Glu Ser Asp Gly Val Thr Lys
370 375 380
Ile Asp Gly Ile Gly Thr Gln Met His Val Ser Tyr Tyr Glu Asn Pro
385 390 395 400
Asp Ile Gln Ala Ser Lys Glu Lys His Tyr Val Gln Met Leu Gln Leu
405 410 415
Met Ala Asn Thr Gly Lys Leu Val Lys Ile Ser Glu Leu Asp Met Gly
420 425 430
Tyr Val Asp Arg Asn Gly Asn Thr Val Gly Thr Ala Asp Met Thr Asp
435 440 445
Gln Gln His Arg Ala Met Ala Asp Tyr Tyr Asp Phe Ile Val Arg Lys
450 455 460
Tyr Phe Glu Ile Val Pro Pro Ala Gln Gln Tyr Gly Ile Thr Gln Trp
465 470 475 480
Cys Met Thr Asp Ala Pro Gly Ala Ile Gly Thr Gly Trp Arg Gly Gly
485 490 495
Glu Pro Val Gly Leu Trp Asp Gln Asn Tyr Asn Arg Lys Tyr Ala Tyr
500 505 510
Ala Gly Phe Ala Asn Gly Leu Arg Ala Lys
515 520
<210> 287
<211> 1695
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 287
atgactattc atctacaaaa aaatctgctc tttgcagcag tcttactgac agggcaagca 60
gcgcatgcgc tcacctccgg atctggcgag gccacgctgg atgttaataa cagctggggt 120
tcaggttatt gcgctaacgt caccattgcc aacaacggca gccaagccat tacttcctgg 180
acggttggcc tgaaccttaa cggcacgacg atcaataatc tttggaacgg taatttgagt 240
ggggttacgg ttacccccgt ggcctacaat gcgaatgtgg cgccgggtgc taataccagc 300
tttggtttct gtgctaatgg cagcgcaacc cccacgttgg cgacgtttga agttcaaggc 360
ggcggtggcg cagccagtag ttccagcagt tctgctattt caagcagctc cagcagttcg 420
gttgccggcg gcagcaacag cgtcaccgta cgcatgagcg gcgtaaccgg agacgaaagc 480
gtgagcctgg aaatcggtgg tcagaccatc gagacctgga ccctgagcgt cggtatgctc 540
gactacaccg tacagaccaa cgctaccggt gagttgcgtg ttgcgtttac caatgatgaa 600
ggtgaccgcg atgtcgaagt ggattacatc atggtcaacg gcgtgaccta tcaggccgaa 660
gatcaggaag ataacaccgg cgcgtgggac ggagagtgtg gtgcgggttc cttctcgcag 720
atgctgcact gcaacggttc tatcggcttt ggcaatccat tcgatggcag caactcgtcg 780
tccagctcca gcaacacttc gagctcgagc agcagctcta accctaaccc tggcaatccg 840
aatttccccg atttcttcgt aggtaacatc accaccagcg gctcagttcg ctctgacttc 900
atgcagtatt gggatcaaat tacgccggaa aacgaaggta aatggggctc cgtagaggga 960
actcgcgacc agtacaactg gggtccgctg gatgcaattt acaatttcgc ccgtgcgaac 1020
ggtattcctg taaaagcgca cactctggtg tggggcagtc agcaaccggg ttggattggc 1080
ggcttgagtg ccgctgagca gcgcgcggaa attgaagagt ggattcgcga ttactgcgca 1140
cgctacccgg atacggcgat gatcgatgtg gtgaatgaag ctctgccttc gcacgctccg 1200
gcaaactatg cggccaatgc atttggaagc gattggatca ctgaatcctt ccgtttggca 1260
cgtcagtact gtccggatgc cgtgctgatc tacaacgact ataacttcat gacctgggac 1320
accgatgcca tcattcagat gattcgccca gccgtgaact ccggttatgt cgatgcactg 1380
ggtcttcaag cgcacagcct gtattcccca caagtctgga ccgctcagca aatccagagc 1440
aaattggatc agatttccga gttgggcttg ccgctgtaca tctccgagta cgacatcgaa 1500
gcaacgaatg atcagactca gttacagtac atgcagatgc acttcccgat cttctacaac 1560
catcccaacg tggccggtat taccctttgg ggttatgttg tgggtgctac ctggcgtgat 1620
ggcactggcc tgatccaaag caatggtcag cagcgcccgg ccatgcagtg gttgatggag 1680
tatctaaacc gctaa 1695
<210> 288
<211> 564
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(23)
<400> 288
Met Thr Ile His Leu Gln Lys Asn Leu Leu Phe Ala Ala Val Leu Leu
1 5 10 15
Thr Gly Gln Ala Ala His Ala Leu Thr Ser Gly Ser Gly Glu Ala Thr
20 25 30
Leu Asp Val Asn Asn Ser Trp Gly Ser Gly Tyr Cys Ala Asn Val Thr
35 40 45
Ile Ala Asn Asn Gly Ser Gln Ala Ile Thr Ser Trp Thr Val Gly Leu
50 55 60
Asn Leu Asn Gly Thr Thr Ile Asn Asn Leu Trp Asn Gly Asn Leu Ser
65 70 75 80
Gly Val Thr Val Thr Pro Val Ala Tyr Asn Ala Asn Val Ala Pro Gly
85 90 95
Ala Asn Thr Ser Phe Gly Phe Cys Ala Asn Gly Ser Ala Thr Pro Thr
100 105 110
Leu Ala Thr Phe Glu Val Gln Gly Gly Gly Gly Ala Ala Ser Ser Ser
115 120 125
Ser Ser Ser Ala Ile Ser Ser Ser Ser Ser Ser Ser Val Ala Gly Gly
130 135 140
Ser Asn Ser Val Thr Val Arg Met Ser Gly Val Thr Gly Asp Glu Ser
145 150 155 160
Val Ser Leu Glu Ile Gly Gly Gln Thr Ile Glu Thr Trp Thr Leu Ser
165 170 175
Val Gly Met Leu Asp Tyr Thr Val Gln Thr Asn Ala Thr Gly Glu Leu
180 185 190
Arg Val Ala Phe Thr Asn Asp Glu Gly Asp Arg Asp Val Glu Val Asp
195 200 205
Tyr Ile Met Val Asn Gly Val Thr Tyr Gln Ala Glu Asp Gln Glu Asp
210 215 220
Asn Thr Gly Ala Trp Asp Gly Glu Cys Gly Ala Gly Ser Phe Ser Gln
225 230 235 240
Met Leu His Cys Asn Gly Ser Ile Gly Phe Gly Asn Pro Phe Asp Gly
245 250 255
Ser Asn Ser Ser Ser Ser Ser Ser Asn Thr Ser Ser Ser Ser Ser Ser
260 265 270
Ser Asn Pro Asn Pro Gly Asn Pro Asn Phe Pro Asp Phe Phe Val Gly
275 280 285
Asn Ile Thr Thr Ser Gly Ser Val Arg Ser Asp Phe Met Gln Tyr Trp
290 295 300
Asp Gln Ile Thr Pro Glu Asn Glu Gly Lys Trp Gly Ser Val Glu Gly
305 310 315 320
Thr Arg Asp Gln Tyr Asn Trp Gly Pro Leu Asp Ala Ile Tyr Asn Phe
325 330 335
Ala Arg Ala Asn Gly Ile Pro Val Lys Ala His Thr Leu Val Trp Gly
340 345 350
Ser Gln Gln Pro Gly Trp Ile Gly Gly Leu Ser Ala Ala Glu Gln Arg
355 360 365
Ala Glu Ile Glu Glu Trp Ile Arg Asp Tyr Cys Ala Arg Tyr Pro Asp
370 375 380
Thr Ala Met Ile Asp Val Val Asn Glu Ala Leu Pro Ser His Ala Pro
385 390 395 400
Ala Asn Tyr Ala Ala Asn Ala Phe Gly Ser Asp Trp Ile Thr Glu Ser
405 410 415
Phe Arg Leu Ala Arg Gln Tyr Cys Pro Asp Ala Val Leu Ile Tyr Asn
420 425 430
Asp Tyr Asn Phe Met Thr Trp Asp Thr Asp Ala Ile Ile Gln Met Ile
435 440 445
Arg Pro Ala Val Asn Ser Gly Tyr Val Asp Ala Leu Gly Leu Gln Ala
450 455 460
His Ser Leu Tyr Ser Pro Gln Val Trp Thr Ala Gln Gln Ile Gln Ser
465 470 475 480
Lys Leu Asp Gln Ile Ser Glu Leu Gly Leu Pro Leu Tyr Ile Ser Glu
485 490 495
Tyr Asp Ile Glu Ala Thr Asn Asp Gln Thr Gln Leu Gln Tyr Met Gln
500 505 510
Met His Phe Pro Ile Phe Tyr Asn His Pro Asn Val Ala Gly Ile Thr
515 520 525
Leu Trp Gly Tyr Val Val Gly Ala Thr Trp Arg Asp Gly Thr Gly Leu
530 535 540
Ile Gln Ser Asn Gly Gln Gln Arg Pro Ala Met Gln Trp Leu Met Glu
545 550 555 560
Tyr Leu Asn Arg
<210> 289
<211> 2796
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 289
atgaagttca ctttgacacc gctgctgtgc gggttcgcct tattgttggg ttgcgcggtg 60
caggcaaccc cagccgcttc gttaaagcag gcctatcagc cgtttttcca tatcggcacc 120
gcagtcagtc tggcgcaatt acaaccatcc aaagaacatg aacgcgcttt aattgcgcag 180
cactttaaca gtctgaccgc cgaaaacctg atgaaatggg aggaaattca acccacggaa 240
ggcaactttg attttaaagc ggccgatcag ttggttgcgt ttgccgaaca acatcaaatg 300
tggatgatcg gccataccat tctgtggcat gaacaaaccc cagactgggt gtttcagggg 360
ctggatggca aacccgccag caagcagctg ctactggccc gcttgaccaa acatatccaa 420
acggtcgttg gccgttacca gggccgggtc aatggctggg atgtggtgaa tgaagcgctc 480
aatgaagatg gcagcctgcg cgataccccg tggcggcgca ttttgggtga tgattacatt 540
gccaccactt ttgcgttggt gcatcaggtc gaccctaaag ccaaactcta ttacaacgat 600
tacaacctgt ttaaaccgga aaaacgcgcc ggggtgctgc ggattatcca acaactgcag 660
caaaaaaatg tgcctattca tgccattggt gaacaagcgc attacggcct tgattcgcct 720
gcattcaaag acgttgaaga ttcgatcaac gcttttgctg ccaccggcct ggacgtgatg 780
ctaaccgaac tggagatttc agtattgccg tatccatccg gcatgacgca gggtgccgat 840
atcagtcagc atcaggaatt gcaggaacaa ctaaacccct atcgcgatgg tttgcccaaa 900
gccgtcgaac aagcctggca acaacggtat ctcgatttgt tttcgctgtt attacgccag 960
cagcaaaaac tgcatcgcgt gaccttctgg ggcttagatg atggccaaag ctggcgtaat 1020
aatttcccga tgcgcggtcg caccgattac ccactgctgt ttgatcgcaa gctgcaagcc 1080
aaaccgctgt taagcgcact gacggcatta gccgcagacc agactaaagc caagcccaaa 1140
atgaatcagc tgggctttgc gccgacttcg accaaactgt tgattgtgcc gggtcggcaa 1200
tcagtgcctt ttcatgtttt ggataccgag accggccaaa cggtgctgca aggccaaagt 1260
tcggcggcca ggttttggcc tgaatcgggg gaatgggtca gtgctgccga tttttctgcg 1320
gtgataactc ccggcaccta tcagatcaac atctcaggaa cgccgccaca aactgtcaag 1380
atccaggccg aaccctatgc cgcgctgcat gatgcggcaa tcaaagccta ttattttaac 1440
cgcgcctcgc tcacactgga gccaaagttt gccggacctt gggcacgcgc agcggggcat 1500
ccggatacca aagtacgggt gcatgcttct gctgcatcgg ccagcaggcc agaaggttat 1560
gagctcagcg ctgccaaagg ctggtatgac gccggtgact acaacaaata cgtggtgaat 1620
tccggcatta ccagttacac cctgttgcag gcctggcagg attttcctga gttttatcaa 1680
agccggacct ggaatattcc ggagtccggc aacgcggtac cggacattct cgacgaaacc 1740
ttatggaatc tgcagtggtt cagcgccatg caagacccaa acgacggggg cgtctatcac 1800
aagctgactg aactgaattt ttcggcaacc caaatgccgg accaagtgac agcagagcgt 1860
tatgtggtgc aaaaaaccac cgccgcggca ctgaatttcg ctgcggtgtt ggccaaagcc 1920
agtacggttt ttgccaaatt tgacgcccag ttgcccggcc tgtcgcaaca ataccgtcag 1980
caagcactgc tcgcctggca atgggcgcaa aaaaatccgc agcaaatcta tcaacaaccc 2040
aaagatgtcc acactggcgc ttatggtgac aaacaactgg ctgatgaatg ggcctgggct 2100
ggcgccgagc tgtatttatt gaccggcgag caaagttatc tgcagccact gttggcgctg 2160
gacacgccaa tcagtgcagc atcctgggcc agtgtcagcg ctttggggta tttttctttg 2220
gcttcggcga aacagcttga gcccgcacta cggcaacagg tacaacagaa aatccaacaa 2280
gccgccgcgc aaatcctgca ggaacatcaa acatccgcct atcaggtggc gatgaccaaa 2340
aacgattttg tctggggcag taatgcggtg gcaatgaata aagcgatgtt gttataccag 2400
gcgtggaaaa tagcgccaaa accggagctg ctacaggcga tgcaaggtct ggttgattac 2460
gttttggggc gcaacccgtt gcagcagtct tatgtcacag ggtttggcga gcaaagcccg 2520
cagcagatcc accaccgacc ttcggccgcc gatgccatca aagcgccggt accaggttgg 2580
ttagtcggtg gtgcacagcc gggtaagcag gataaatgca cttatgccgg cgctttaccc 2640
gctgtcggcg ctttacccgc tgccagcacc ttaccagcca ccacttatct tgatgactgg 2700
tgcagttacg ccaccaacga agtggcgatt aactggaatg cacctttggt gtatgtgctg 2760
gcatggcacc tttcgcaaaa caccaagaca ccataa 2796
<210> 290
<211> 931
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(22)
<400> 290
Met Lys Phe Thr Leu Thr Pro Leu Leu Cys Gly Phe Ala Leu Leu Leu
1 5 10 15
Gly Cys Ala Val Gln Ala Thr Pro Ala Ala Ser Leu Lys Gln Ala Tyr
20 25 30
Gln Pro Phe Phe His Ile Gly Thr Ala Val Ser Leu Ala Gln Leu Gln
35 40 45
Pro Ser Lys Glu His Glu Arg Ala Leu Ile Ala Gln His Phe Asn Ser
50 55 60
Leu Thr Ala Glu Asn Leu Met Lys Trp Glu Glu Ile Gln Pro Thr Glu
65 70 75 80
Gly Asn Phe Asp Phe Lys Ala Ala Asp Gln Leu Val Ala Phe Ala Glu
85 90 95
Gln His Gln Met Trp Met Ile Gly His Thr Ile Leu Trp His Glu Gln
100 105 110
Thr Pro Asp Trp Val Phe Gln Gly Leu Asp Gly Lys Pro Ala Ser Lys
115 120 125
Gln Leu Leu Leu Ala Arg Leu Thr Lys His Ile Gln Thr Val Val Gly
130 135 140
Arg Tyr Gln Gly Arg Val Asn Gly Trp Asp Val Val Asn Glu Ala Leu
145 150 155 160
Asn Glu Asp Gly Ser Leu Arg Asp Thr Pro Trp Arg Arg Ile Leu Gly
165 170 175
Asp Asp Tyr Ile Ala Thr Thr Phe Ala Leu Val His Gln Val Asp Pro
180 185 190
Lys Ala Lys Leu Tyr Tyr Asn Asp Tyr Asn Leu Phe Lys Pro Glu Lys
195 200 205
Arg Ala Gly Val Leu Arg Ile Ile Gln Gln Leu Gln Gln Lys Asn Val
210 215 220
Pro Ile His Ala Ile Gly Glu Gln Ala His Tyr Gly Leu Asp Ser Pro
225 230 235 240
Ala Phe Lys Asp Val Glu Asp Ser Ile Asn Ala Phe Ala Ala Thr Gly
245 250 255
Leu Asp Val Met Leu Thr Glu Leu Glu Ile Ser Val Leu Pro Tyr Pro
260 265 270
Ser Gly Met Thr Gln Gly Ala Asp Ile Ser Gln His Gln Glu Leu Gln
275 280 285
Glu Gln Leu Asn Pro Tyr Arg Asp Gly Leu Pro Lys Ala Val Glu Gln
290 295 300
Ala Trp Gln Gln Arg Tyr Leu Asp Leu Phe Ser Leu Leu Leu Arg Gln
305 310 315 320
Gln Gln Lys Leu His Arg Val Thr Phe Trp Gly Leu Asp Asp Gly Gln
325 330 335
Ser Trp Arg Asn Asn Phe Pro Met Arg Gly Arg Thr Asp Tyr Pro Leu
340 345 350
Leu Phe Asp Arg Lys Leu Gln Ala Lys Pro Leu Leu Ser Ala Leu Thr
355 360 365
Ala Leu Ala Ala Asp Gln Thr Lys Ala Lys Pro Lys Met Asn Gln Leu
370 375 380
Gly Phe Ala Pro Thr Ser Thr Lys Leu Leu Ile Val Pro Gly Arg Gln
385 390 395 400
Ser Val Pro Phe His Val Leu Asp Thr Glu Thr Gly Gln Thr Val Leu
405 410 415
Gln Gly Gln Ser Ser Ala Ala Arg Phe Trp Pro Glu Ser Gly Glu Trp
420 425 430
Val Ser Ala Ala Asp Phe Ser Ala Val Ile Thr Pro Gly Thr Tyr Gln
435 440 445
Ile Asn Ile Ser Gly Thr Pro Pro Gln Thr Val Lys Ile Gln Ala Glu
450 455 460
Pro Tyr Ala Ala Leu His Asp Ala Ala Ile Lys Ala Tyr Tyr Phe Asn
465 470 475 480
Arg Ala Ser Leu Thr Leu Glu Pro Lys Phe Ala Gly Pro Trp Ala Arg
485 490 495
Ala Ala Gly His Pro Asp Thr Lys Val Arg Val His Ala Ser Ala Ala
500 505 510
Ser Ala Ser Arg Pro Glu Gly Tyr Glu Leu Ser Ala Ala Lys Gly Trp
515 520 525
Tyr Asp Ala Gly Asp Tyr Asn Lys Tyr Val Val Asn Ser Gly Ile Thr
530 535 540
Ser Tyr Thr Leu Leu Gln Ala Trp Gln Asp Phe Pro Glu Phe Tyr Gln
545 550 555 560
Ser Arg Thr Trp Asn Ile Pro Glu Ser Gly Asn Ala Val Pro Asp Ile
565 570 575
Leu Asp Glu Thr Leu Trp Asn Leu Gln Trp Phe Ser Ala Met Gln Asp
580 585 590
Pro Asn Asp Gly Gly Val Tyr His Lys Leu Thr Glu Leu Asn Phe Ser
595 600 605
Ala Thr Gln Met Pro Asp Gln Val Thr Ala Glu Arg Tyr Val Val Gln
610 615 620
Lys Thr Thr Ala Ala Ala Leu Asn Phe Ala Ala Val Leu Ala Lys Ala
625 630 635 640
Ser Thr Val Phe Ala Lys Phe Asp Ala Gln Leu Pro Gly Leu Ser Gln
645 650 655
Gln Tyr Arg Gln Gln Ala Leu Leu Ala Trp Gln Trp Ala Gln Lys Asn
660 665 670
Pro Gln Gln Ile Tyr Gln Gln Pro Lys Asp Val His Thr Gly Ala Tyr
675 680 685
Gly Asp Lys Gln Leu Ala Asp Glu Trp Ala Trp Ala Gly Ala Glu Leu
690 695 700
Tyr Leu Leu Thr Gly Glu Gln Ser Tyr Leu Gln Pro Leu Leu Ala Leu
705 710 715 720
Asp Thr Pro Ile Ser Ala Ala Ser Trp Ala Ser Val Ser Ala Leu Gly
725 730 735
Tyr Phe Ser Leu Ala Ser Ala Lys Gln Leu Glu Pro Ala Leu Arg Gln
740 745 750
Gln Val Gln Gln Lys Ile Gln Gln Ala Ala Ala Gln Ile Leu Gln Glu
755 760 765
His Gln Thr Ser Ala Tyr Gln Val Ala Met Thr Lys Asn Asp Phe Val
770 775 780
Trp Gly Ser Asn Ala Val Ala Met Asn Lys Ala Met Leu Leu Tyr Gln
785 790 795 800
Ala Trp Lys Ile Ala Pro Lys Pro Glu Leu Leu Gln Ala Met Gln Gly
805 810 815
Leu Val Asp Tyr Val Leu Gly Arg Asn Pro Leu Gln Gln Ser Tyr Val
820 825 830
Thr Gly Phe Gly Glu Gln Ser Pro Gln Gln Ile His His Arg Pro Ser
835 840 845
Ala Ala Asp Ala Ile Lys Ala Pro Val Pro Gly Trp Leu Val Gly Gly
850 855 860
Ala Gln Pro Gly Lys Gln Asp Lys Cys Thr Tyr Ala Gly Ala Leu Pro
865 870 875 880
Ala Val Gly Ala Leu Pro Ala Ala Ser Thr Leu Pro Ala Thr Thr Tyr
885 890 895
Leu Asp Asp Trp Cys Ser Tyr Ala Thr Asn Glu Val Ala Ile Asn Trp
900 905 910
Asn Ala Pro Leu Val Tyr Val Leu Ala Trp His Leu Ser Gln Asn Thr
915 920 925
Lys Thr Pro
930
<210> 291
<211> 1230
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 291
atggtcaaag aaagaagttt tcttcatcat tcattcaata ggggcgaaaa tggacaggac 60
agtctgatgt ggaaaaaaga ggcggatgat cgaatctcag agcatagaca aagagatctt 120
gtgatcaacg taacaaacgg tgaaaaaaag ccaatagcag gtatagaggt tgaaataaag 180
caaatcagac atgaattcgc ctttggttca gcgatgaatg atcaagtgtt atttaatcaa 240
caatatgctg attttttcgt gaagtatttt aattgggctg tttttgaaaa tgaggcaaaa 300
tggtatgcga atgagccaca aagagggaga atcacctacg aaaaagcaga tgcgatgctg 360
aattttgcag atcgacatca gcttccagtg agagggcacg ctttgttttg ggaggtagag 420
gatgcgaatc caagctggct aaggtcactg ccaaatcatg aagtatatga agccatgaaa 480
aaccggcttg agcatgcggg caatcacttt aagggaaggt tccgtcattg ggatgtaaac 540
aatgaaatga tgcatggttc attttttaaa gatcgctttg ggaaaaatat ttggaagtgg 600
atgtatgaag aaacgaaaaa aattgaccct caagcactat tgtttgtgaa tgattataat 660
gtgatctcat atggtgaaca ccatgcctat aaagcgcata tcaatgaact gcgtcagtta 720
ggcgcaccta ttgaggcgat tggggttcaa ggccattttg aagaacgggt cgatccagtc 780
attgtcaaag agagactcga tgtgcttgct gagctaggtc ttccaatatg ggtcacagag 840
tacgattcgg ttcaccctga ccctaatcga agagcggata acctggaagc tttatatcgc 900
gtcgcattta gtcatccagc cgtaaaagga gtgctgatgt ggggattttg ggcaggtgcc 960
cattggagag gggaaaatgc agccatcgtg aattatgatt ggtctttaaa tgaagcagga 1020
agacgttatg aaaagcttct aaatgagtgg acgacccaaa gaattgaaaa aacagatgct 1080
aatggccatg tgagatgtcc agcatttcac ggaacatatg aggttcgaat cggtaaagaa 1140
agtaaaatgt tgaaacagca gacgattgaa cttgattcaa atgaacaaac accgtttcaa 1200
ctagacgtga tcctgcctca agaaggatag 1230
<210> 292
<211> 409
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 292
Met Val Lys Glu Arg Ser Phe Leu His His Ser Phe Asn Arg Gly Glu
1 5 10 15
Asn Gly Gln Asp Ser Leu Met Trp Lys Lys Glu Ala Asp Asp Arg Ile
20 25 30
Ser Glu His Arg Gln Arg Asp Leu Val Ile Asn Val Thr Asn Gly Glu
35 40 45
Lys Lys Pro Ile Ala Gly Ile Glu Val Glu Ile Lys Gln Ile Arg His
50 55 60
Glu Phe Ala Phe Gly Ser Ala Met Asn Asp Gln Val Leu Phe Asn Gln
65 70 75 80
Gln Tyr Ala Asp Phe Phe Val Lys Tyr Phe Asn Trp Ala Val Phe Glu
85 90 95
Asn Glu Ala Lys Trp Tyr Ala Asn Glu Pro Gln Arg Gly Arg Ile Thr
100 105 110
Tyr Glu Lys Ala Asp Ala Met Leu Asn Phe Ala Asp Arg His Gln Leu
115 120 125
Pro Val Arg Gly His Ala Leu Phe Trp Glu Val Glu Asp Ala Asn Pro
130 135 140
Ser Trp Leu Arg Ser Leu Pro Asn His Glu Val Tyr Glu Ala Met Lys
145 150 155 160
Asn Arg Leu Glu His Ala Gly Asn His Phe Lys Gly Arg Phe Arg His
165 170 175
Trp Asp Val Asn Asn Glu Met Met His Gly Ser Phe Phe Lys Asp Arg
180 185 190
Phe Gly Lys Asn Ile Trp Lys Trp Met Tyr Glu Glu Thr Lys Lys Ile
195 200 205
Asp Pro Gln Ala Leu Leu Phe Val Asn Asp Tyr Asn Val Ile Ser Tyr
210 215 220
Gly Glu His His Ala Tyr Lys Ala His Ile Asn Glu Leu Arg Gln Leu
225 230 235 240
Gly Ala Pro Ile Glu Ala Ile Gly Val Gln Gly His Phe Glu Glu Arg
245 250 255
Val Asp Pro Val Ile Val Lys Glu Arg Leu Asp Val Leu Ala Glu Leu
260 265 270
Gly Leu Pro Ile Trp Val Thr Glu Tyr Asp Ser Val His Pro Asp Pro
275 280 285
Asn Arg Arg Ala Asp Asn Leu Glu Ala Leu Tyr Arg Val Ala Phe Ser
290 295 300
His Pro Ala Val Lys Gly Val Leu Met Trp Gly Phe Trp Ala Gly Ala
305 310 315 320
His Trp Arg Gly Glu Asn Ala Ala Ile Val Asn Tyr Asp Trp Ser Leu
325 330 335
Asn Glu Ala Gly Arg Arg Tyr Glu Lys Leu Leu Asn Glu Trp Thr Thr
340 345 350
Gln Arg Ile Glu Lys Thr Asp Ala Asn Gly His Val Arg Cys Pro Ala
355 360 365
Phe His Gly Thr Tyr Glu Val Arg Ile Gly Lys Glu Ser Lys Met Leu
370 375 380
Lys Gln Gln Thr Ile Glu Leu Asp Ser Asn Glu Gln Thr Pro Phe Gln
385 390 395 400
Leu Asp Val Ile Leu Pro Gln Glu Gly
405
<210> 293
<211> 1002
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 293
atgaagatga acagctccct cccctccctc cgcgatgtat tcgcgaatga tttccgcatc 60
ggggcggcgg tcaatcctgt gacgatcgag atgcaaaaac agttgttgat cgatcatgtc 120
aacagtatta cggcagagaa ccatatgaag tttgagcatc ttcagccgga agaagggaaa 180
tttacctttc aggaagcgga tcggattgtg gattttgctt gttcgcaccg aatggcggtt 240
cgagggcaca cacttgtatg gcacaaccag actccggatt gggtgtttca agatggtcaa 300
ggccatttcg tcagtcggga tgtgttgctt gagcggatga aatgtcacat ttcaactgtt 360
gtacggcgat acaagggaaa aatatattgt tgggatgtca tcaacgaagc ggtagccgac 420
gaaggagacg aattgttgag gccgtcgaag tggcgacaaa tcatcgggga cgattttatg 480
gaacaagcat ttctctacgc ttatgaagct gacccagatg cactgctttt ttacaatgac 540
tataatgaat gttttccgga aaagagagaa aaaatttttg cacttgtcaa atcgctgcgt 600
gataaaggca ttccgattca tggcatcggg atgcaagcgc attggagttt gactcgcccg 660
tcgcttgatg aaattcgtgc ggccattgaa cgatatgcgt cccttggtgt tgttcttcat 720
attacggaac tcgatgtatc catgtttgaa tttcacgatc gtcgaaccga tttggcagct 780
ccaacgtcag aaatgatcga acggcaggca gagcggtatg ggcaaatttt tgctttgttt 840
aaggagtatc gcgatgttat tcaaagtgtc acattttggg gaattgctga tgaccataca 900
tggctcgata actttccagt gcacgggaga aaaaactggc cgcttttgtt cgatgaacag 960
cataaaccga aaccagcttt ttggcgggca gtgagtgtct ga 1002
<210> 294
<211> 333
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 294
Met Lys Met Asn Ser Ser Leu Pro Ser Leu Arg Asp Val Phe Ala Asn
1 5 10 15
Asp Phe Arg Ile Gly Ala Ala Val Asn Pro Val Thr Ile Glu Met Gln
20 25 30
Lys Gln Leu Leu Ile Asp His Val Asn Ser Ile Thr Ala Glu Asn His
35 40 45
Met Lys Phe Glu His Leu Gln Pro Glu Glu Gly Lys Phe Thr Phe Gln
50 55 60
Glu Ala Asp Arg Ile Val Asp Phe Ala Cys Ser His Arg Met Ala Val
65 70 75 80
Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro Asp Trp Val Phe
85 90 95
Gln Asp Gly Gln Gly His Phe Val Ser Arg Asp Val Leu Leu Glu Arg
100 105 110
Met Lys Cys His Ile Ser Thr Val Val Arg Arg Tyr Lys Gly Lys Ile
115 120 125
Tyr Cys Trp Asp Val Ile Asn Glu Ala Val Ala Asp Glu Gly Asp Glu
130 135 140
Leu Leu Arg Pro Ser Lys Trp Arg Gln Ile Ile Gly Asp Asp Phe Met
145 150 155 160
Glu Gln Ala Phe Leu Tyr Ala Tyr Glu Ala Asp Pro Asp Ala Leu Leu
165 170 175
Phe Tyr Asn Asp Tyr Asn Glu Cys Phe Pro Glu Lys Arg Glu Lys Ile
180 185 190
Phe Ala Leu Val Lys Ser Leu Arg Asp Lys Gly Ile Pro Ile His Gly
195 200 205
Ile Gly Met Gln Ala His Trp Ser Leu Thr Arg Pro Ser Leu Asp Glu
210 215 220
Ile Arg Ala Ala Ile Glu Arg Tyr Ala Ser Leu Gly Val Val Leu His
225 230 235 240
Ile Thr Glu Leu Asp Val Ser Met Phe Glu Phe His Asp Arg Arg Thr
245 250 255
Asp Leu Ala Ala Pro Thr Ser Glu Met Ile Glu Arg Gln Ala Glu Arg
260 265 270
Tyr Gly Gln Ile Phe Ala Leu Phe Lys Glu Tyr Arg Asp Val Ile Gln
275 280 285
Ser Val Thr Phe Trp Gly Ile Ala Asp Asp His Thr Trp Leu Asp Asn
290 295 300
Phe Pro Val His Gly Arg Lys Asn Trp Pro Leu Leu Phe Asp Glu Gln
305 310 315 320
His Lys Pro Lys Pro Ala Phe Trp Arg Ala Val Ser Val
325 330
<210> 295
<211> 1134
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 295
atgagatccg tccgcatcgt cacctttgct ctcgccgccg cgctggccgt cccgctggtg 60
acgtcgacgg ccacggccaa gccgtccgcc gaccacgagg ccgcgcccca ctccaacgcc 120
aagttcgacc gcctgcgctg ggccgccccc gaagggttct tcataggctc cgcggcggcc 180
ggcggcggcc accacctcga acaggactac ccggacccct tcaccttcga caagaagtac 240
cggaagatcc tgggccagca gttcaactcg gtctccgccg agaaccagat gaagtgggag 300
ttcatccacc ccgagcgcga ccagtaccgc ttcgaggagg ccgacgccat cgtcgagttc 360
gcccagcgga accgccaggc cgtgcgcggg cacaccctcc tgtggcacag ccagaacccc 420
gaatggctgg aggagggcga cttcaccaag gaggaactgc gcgccatcct caaggaccac 480
atcgacacgg tcgtcggccg ctacgccggc aagatccagc agtgggacgt ggccaacgag 540
atcttcaacg accaggccga gctgcgcacc gacgagaaca tctggatacg tgagctcggc 600
ccggagatcg tcgcggacgc cttccgctgg gcccacgagg ccgaccccga ggccaagctg 660
ttcctcaacg actacaacgt cgagggcatc aacgccaaga gcgacgccta ctacgagctc 720
gcccaggaga tgctggagca gggcgtgccg ctccacggat tcggcgccca gggccacctg 780
agcacccgct acggcttccc gggcgacctg cagcagaacc tgcagcggtt cgccgacctc 840
ggtctggaga ccgccatcac cgagatcgac gtccgcatgg acctcccggc gagcggcaag 900
cccaccaagg agcagctgcg gcagcaggcc gactactacc agcaggcact gtcggcctgc 960
ctggccgtga acgactgcaa ctccttcacc atctggggct tcaccgacaa gtactcgtgg 1020
gtgccggtct tcttcgaggg tgagggcagc gccacggtca tgacggagaa gttcgtccgc 1080
aagccggcct tcttcgccct gcagtccacc ctgaaggagg cgcgcaagcg ctga 1134
<210> 296
<211> 377
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(26)
<400> 296
Met Arg Ser Val Arg Ile Val Thr Phe Ala Leu Ala Ala Ala Leu Ala
1 5 10 15
Val Pro Leu Val Thr Ser Thr Ala Thr Ala Lys Pro Ser Ala Asp His
20 25 30
Glu Ala Ala Pro His Ser Asn Ala Lys Phe Asp Arg Leu Arg Trp Ala
35 40 45
Ala Pro Glu Gly Phe Phe Ile Gly Ser Ala Ala Ala Gly Gly Gly His
50 55 60
His Leu Glu Gln Asp Tyr Pro Asp Pro Phe Thr Phe Asp Lys Lys Tyr
65 70 75 80
Arg Lys Ile Leu Gly Gln Gln Phe Asn Ser Val Ser Ala Glu Asn Gln
85 90 95
Met Lys Trp Glu Phe Ile His Pro Glu Arg Asp Gln Tyr Arg Phe Glu
100 105 110
Glu Ala Asp Ala Ile Val Glu Phe Ala Gln Arg Asn Arg Gln Ala Val
115 120 125
Arg Gly His Thr Leu Leu Trp His Ser Gln Asn Pro Glu Trp Leu Glu
130 135 140
Glu Gly Asp Phe Thr Lys Glu Glu Leu Arg Ala Ile Leu Lys Asp His
145 150 155 160
Ile Asp Thr Val Val Gly Arg Tyr Ala Gly Lys Ile Gln Gln Trp Asp
165 170 175
Val Ala Asn Glu Ile Phe Asn Asp Gln Ala Glu Leu Arg Thr Asp Glu
180 185 190
Asn Ile Trp Ile Arg Glu Leu Gly Pro Glu Ile Val Ala Asp Ala Phe
195 200 205
Arg Trp Ala His Glu Ala Asp Pro Glu Ala Lys Leu Phe Leu Asn Asp
210 215 220
Tyr Asn Val Glu Gly Ile Asn Ala Lys Ser Asp Ala Tyr Tyr Glu Leu
225 230 235 240
Ala Gln Glu Met Leu Glu Gln Gly Val Pro Leu His Gly Phe Gly Ala
245 250 255
Gln Gly His Leu Ser Thr Arg Tyr Gly Phe Pro Gly Asp Leu Gln Gln
260 265 270
Asn Leu Gln Arg Phe Ala Asp Leu Gly Leu Glu Thr Ala Ile Thr Glu
275 280 285
Ile Asp Val Arg Met Asp Leu Pro Ala Ser Gly Lys Pro Thr Lys Glu
290 295 300
Gln Leu Arg Gln Gln Ala Asp Tyr Tyr Gln Gln Ala Leu Ser Ala Cys
305 310 315 320
Leu Ala Val Asn Asp Cys Asn Ser Phe Thr Ile Trp Gly Phe Thr Asp
325 330 335
Lys Tyr Ser Trp Val Pro Val Phe Phe Glu Gly Glu Gly Ser Ala Thr
340 345 350
Val Met Thr Glu Lys Phe Val Arg Lys Pro Ala Phe Phe Ala Leu Gln
355 360 365
Ser Thr Leu Lys Glu Ala Arg Lys Arg
370 375
<210> 297
<211> 1842
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 297
ttgaggtcag gcgcgttctg tttcatcata gtcgttttaa tcctgaacct tatatgcagg 60
gagttgtatg agtgtaaaaa agttgttacc gcagcactgg tatgcttggc tttcgggtca 120
tcgctgactt gggggcaatg caccacattt accaccagta ccattcggaa ttgcgatggt 180
atagattacg agctctggag ccagaataac tctggcacga ccaatatgca aatcacggga 240
gggaactcga atccaaacgg tggaaccttt gaggcgacat ggagtggcac gatcaatgtt 300
ctattccgcg cgggtaaaaa atggggcaca tccagcacca gtacccccaa aaccatcggc 360
aatatctctc ttgaattcgc agcgacatgg agttcggtcg ataatgtgaa aatgcttggc 420
atctatggct gggcgtatta tccctcggga agcgaaccaa caaaaacgga aagcggtcaa 480
agcacgaact tttccaatca gattgagtat tacatcattc aagaccgcgg tagctataac 540
ccggcatccg gcggcaccaa cgccaaaaag tacggtgaag ggacgatcga cggaatcgcg 600
tatgattttt atgtcgccga ccgtatcggc caggccatgc tgacaggaac gggaaatttc 660
aaacagtact tcagcgtgcc gaagagcaca agcagtcaca ggcaaagcgg cacggtttcc 720
gtctccaaac attttgaggc ctgggaaaaa gcgggcatga agatgatgga ttgtcggtta 780
tacgaagtcg cgatgaaagt ggaatcgtat accggttccg cgaatggcaa cggctcggcg 840
aaagtgacca aaaatctcct cacgatcggc ggaagcagca gcaacgagtt tagtctcgta 900
acgaatgttt ctcctgccag cgcgggaacg gtgtccaaga gcccggacaa cgcatcctat 960
gccccgaacg cctccgttca gctcacggcg accccgaata ccggttggaa gtttgtgggc 1020
tgggaagggg acgcctcggg ttccacgagc ccaaccagcg ttaccatgag caaagacctc 1080
acggttacag cgaagtttga gctggtatcg gaagaaggca gcacaaacct gatccaggat 1140
ggcaacttcc cgagcggcag cgtaatctct acagatgacg gggcttcatg gaaactcgga 1200
caaggggaaa actggggaaa ttccgcagcc acaacgagcg tcagcaatgg aatcgcgaca 1260
gtcaatgtga caactgtcgg agcggaagct tatcaaccgc agcttgtaca gtacggtttg 1320
ggactcgaca tggacatgag ttacaaactt accttcaagg caagagccga tgcggcaagg 1380
aagattgaag ttgcgttcca gcaggcggtg gatccttggg ctggttatgc ttcccaggaa 1440
ttcgacctga ccacgaccga tcaggatttc gagttcgtat tcacgatgac caacgccagc 1500
gacccggcat cacagttcgc gttcaatctt ggccaggcga caggcgatgt ctatatcagt 1560
gatgttaaac tggtatacac gacaggcacc acacccatat cccgcaccat agtccgcggc 1620
aatacggcat tcgtctcggt aagtggcaga accctgaata tttcggcagt cgacgcgtcc 1680
acacttcaga tcaaggtagt agatataaac ggaaaggtaa gagcgaattt caacacggct 1740
ggtgcagcaa gtgtttcctt gtccaatatt cctgcgggcc agtacttcgt tggtatcaca 1800
ggcacaggca taaaacaaat ctcaccgatc gttttggaat aa 1842
<210> 298
<211> 613
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 298
Met Arg Ser Gly Ala Phe Cys Phe Ile Ile Val Val Leu Ile Leu Asn
1 5 10 15
Leu Ile Cys Arg Glu Leu Tyr Glu Cys Lys Lys Val Val Thr Ala Ala
20 25 30
Leu Val Cys Leu Ala Phe Gly Ser Ser Leu Thr Trp Gly Gln Cys Thr
35 40 45
Thr Phe Thr Thr Ser Thr Ile Arg Asn Cys Asp Gly Ile Asp Tyr Glu
50 55 60
Leu Trp Ser Gln Asn Asn Ser Gly Thr Thr Asn Met Gln Ile Thr Gly
65 70 75 80
Gly Asn Ser Asn Pro Asn Gly Gly Thr Phe Glu Ala Thr Trp Ser Gly
85 90 95
Thr Ile Asn Val Leu Phe Arg Ala Gly Lys Lys Trp Gly Thr Ser Ser
100 105 110
Thr Ser Thr Pro Lys Thr Ile Gly Asn Ile Ser Leu Glu Phe Ala Ala
115 120 125
Thr Trp Ser Ser Val Asp Asn Val Lys Met Leu Gly Ile Tyr Gly Trp
130 135 140
Ala Tyr Tyr Pro Ser Gly Ser Glu Pro Thr Lys Thr Glu Ser Gly Gln
145 150 155 160
Ser Thr Asn Phe Ser Asn Gln Ile Glu Tyr Tyr Ile Ile Gln Asp Arg
165 170 175
Gly Ser Tyr Asn Pro Ala Ser Gly Gly Thr Asn Ala Lys Lys Tyr Gly
180 185 190
Glu Gly Thr Ile Asp Gly Ile Ala Tyr Asp Phe Tyr Val Ala Asp Arg
195 200 205
Ile Gly Gln Ala Met Leu Thr Gly Thr Gly Asn Phe Lys Gln Tyr Phe
210 215 220
Ser Val Pro Lys Ser Thr Ser Ser His Arg Gln Ser Gly Thr Val Ser
225 230 235 240
Val Ser Lys His Phe Glu Ala Trp Glu Lys Ala Gly Met Lys Met Met
245 250 255
Asp Cys Arg Leu Tyr Glu Val Ala Met Lys Val Glu Ser Tyr Thr Gly
260 265 270
Ser Ala Asn Gly Asn Gly Ser Ala Lys Val Thr Lys Asn Leu Leu Thr
275 280 285
Ile Gly Gly Ser Ser Ser Asn Glu Phe Ser Leu Val Thr Asn Val Ser
290 295 300
Pro Ala Ser Ala Gly Thr Val Ser Lys Ser Pro Asp Asn Ala Ser Tyr
305 310 315 320
Ala Pro Asn Ala Ser Val Gln Leu Thr Ala Thr Pro Asn Thr Gly Trp
325 330 335
Lys Phe Val Gly Trp Glu Gly Asp Ala Ser Gly Ser Thr Ser Pro Thr
340 345 350
Ser Val Thr Met Ser Lys Asp Leu Thr Val Thr Ala Lys Phe Glu Leu
355 360 365
Val Ser Glu Glu Gly Ser Thr Asn Leu Ile Gln Asp Gly Asn Phe Pro
370 375 380
Ser Gly Ser Val Ile Ser Thr Asp Asp Gly Ala Ser Trp Lys Leu Gly
385 390 395 400
Gln Gly Glu Asn Trp Gly Asn Ser Ala Ala Thr Thr Ser Val Ser Asn
405 410 415
Gly Ile Ala Thr Val Asn Val Thr Thr Val Gly Ala Glu Ala Tyr Gln
420 425 430
Pro Gln Leu Val Gln Tyr Gly Leu Gly Leu Asp Met Asp Met Ser Tyr
435 440 445
Lys Leu Thr Phe Lys Ala Arg Ala Asp Ala Ala Arg Lys Ile Glu Val
450 455 460
Ala Phe Gln Gln Ala Val Asp Pro Trp Ala Gly Tyr Ala Ser Gln Glu
465 470 475 480
Phe Asp Leu Thr Thr Thr Asp Gln Asp Phe Glu Phe Val Phe Thr Met
485 490 495
Thr Asn Ala Ser Asp Pro Ala Ser Gln Phe Ala Phe Asn Leu Gly Gln
500 505 510
Ala Thr Gly Asp Val Tyr Ile Ser Asp Val Lys Leu Val Tyr Thr Thr
515 520 525
Gly Thr Thr Pro Ile Ser Arg Thr Ile Val Arg Gly Asn Thr Ala Phe
530 535 540
Val Ser Val Ser Gly Arg Thr Leu Asn Ile Ser Ala Val Asp Ala Ser
545 550 555 560
Thr Leu Gln Ile Lys Val Val Asp Ile Asn Gly Lys Val Arg Ala Asn
565 570 575
Phe Asn Thr Ala Gly Ala Ala Ser Val Ser Leu Ser Asn Ile Pro Ala
580 585 590
Gly Gln Tyr Phe Val Gly Ile Thr Gly Thr Gly Ile Lys Gln Ile Ser
595 600 605
Pro Ile Val Leu Glu
610
<210> 299
<211> 1047
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 299
atgtttttga gtctcaaaag agtggcggcg cttgtttgcg tcgccggtct cggcatctct 60
gcggcccaag cacagacctg cctgacctcg agtcaaaccg gcactaacaa cggcttctac 120
tattcgttct ggaaagacaa tcccggcacc gtgaatttct gtctgcagtc cggcggccgc 180
tacacctcca actggagcgg catcaacaac tgggtcggcg gaaagggatg gcagacgggt 240
tcccgcagag tggtgaacta ctcgggcagc ttcaattcgc ctggcaatgg gtacctgact 300
ctctatgggt ggaccaccaa tccgctcatc gagtactaca ttgtcgacaa ctggggcacg 360
tatcgtccgc cgggtgggca ggggttcatg ggcacggtga ccagcgatgg cgcgacgtat 420
gacgtctatc gcacgcagcg cgtcaatcag ccctgcatca ccggcagcag ttgcacgttc 480
tatcaatact ggagcgtgcg gcagtcgaag cggaccggtg gcacgatcac caccggcaac 540
cacttcgatg cctgggccag ctacggaatg aatctgggcg ctcacaacta ccagatcatg 600
gcgaccgagg gctatcaaag cagcggcagc tctgacatca cggtgagtga gggaagcagc 660
agcagtagca gcggtggtgg cagcagcacg agcagcagtg gcggcggcgg caccaagagc 720
ttcacggtcc gggcgcgcgg aaccgcgggt ggtgagtcca tcacgctgcg tgtgaacaat 780
cagaacgtgc agacctggac gctgggcacc agcatgacga actacacggc atcgacgtcg 840
ttgagcggtg gcatcaccgt ggcttacacg aacgacagtg gcaatcgcga cgtgcaggtg 900
gattacatca tcgtgaacgg ctcgacgcgt cagtcagaag cgcagagcta caacaccggg 960
ctctatgcca acggtagttg tggtggcggc tccaatagcg aatggatgca ttgcaacggc 1020
gccattggct acgggaatac gccgtag 1047
<210> 300
<211> 348
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(24)
<400> 300
Met Phe Leu Ser Leu Lys Arg Val Ala Ala Leu Val Cys Val Ala Gly
1 5 10 15
Leu Gly Ile Ser Ala Ala Gln Ala Gln Thr Cys Leu Thr Ser Ser Gln
20 25 30
Thr Gly Thr Asn Asn Gly Phe Tyr Tyr Ser Phe Trp Lys Asp Asn Pro
35 40 45
Gly Thr Val Asn Phe Cys Leu Gln Ser Gly Gly Arg Tyr Thr Ser Asn
50 55 60
Trp Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly
65 70 75 80
Ser Arg Arg Val Val Asn Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn
85 90 95
Gly Tyr Leu Thr Leu Tyr Gly Trp Thr Thr Asn Pro Leu Ile Glu Tyr
100 105 110
Tyr Ile Val Asp Asn Trp Gly Thr Tyr Arg Pro Pro Gly Gly Gln Gly
115 120 125
Phe Met Gly Thr Val Thr Ser Asp Gly Ala Thr Tyr Asp Val Tyr Arg
130 135 140
Thr Gln Arg Val Asn Gln Pro Cys Ile Thr Gly Ser Ser Cys Thr Phe
145 150 155 160
Tyr Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Thr Gly Gly Thr Ile
165 170 175
Thr Thr Gly Asn His Phe Asp Ala Trp Ala Ser Tyr Gly Met Asn Leu
180 185 190
Gly Ala His Asn Tyr Gln Ile Met Ala Thr Glu Gly Tyr Gln Ser Ser
195 200 205
Gly Ser Ser Asp Ile Thr Val Ser Glu Gly Ser Ser Ser Ser Ser Ser
210 215 220
Gly Gly Gly Ser Ser Thr Ser Ser Ser Gly Gly Gly Gly Thr Lys Ser
225 230 235 240
Phe Thr Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Ser Ile Thr Leu
245 250 255
Arg Val Asn Asn Gln Asn Val Gln Thr Trp Thr Leu Gly Thr Ser Met
260 265 270
Thr Asn Tyr Thr Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val Ala
275 280 285
Tyr Thr Asn Asp Ser Gly Asn Arg Asp Val Gln Val Asp Tyr Ile Ile
290 295 300
Val Asn Gly Ser Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly
305 310 315 320
Leu Tyr Ala Asn Gly Ser Cys Gly Gly Gly Ser Asn Ser Glu Trp Met
325 330 335
His Cys Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro
340 345
<210> 301
<211> 642
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 301
atgtttaagt ttacaaagaa attcttagtt gggttaacgg cagctttgat gagtatgagc 60
ttgttttcgg caaacgcctc tgcagctaac acagactact ggcaaaattg gactgatggg 120
ggcggaacag taaacgctgt caatgggtct ggcgggaatt acagtgtgaa ttggtctaat 180
accggaaatt tcgttgttgg taaaggttgg actacaggtt cgccatttag gacgataaac 240
tataatgccg gagtttgggc gccgaacggc aatgcatatt tgactttata tggttggacg 300
cgatcccctc tcatagaata ttatgtagtg gattcatggg gtacttatag acctactgga 360
acgtataaag gtacggttta cagtgatggg ggtacatatg acgtgtacac aactacacgt 420
tatgatgcac cttccattga tggcgataaa actactttta cgcagtactg gagtgttcgc 480
cagtcgaaga gaccaactgg aagcaacgct acaatcactt tcagcaatca cgttaacgca 540
tggaagagat atgggatgaa tctgggtagt aattggtctt accaagtctt agcgacagag 600
ggatatcgaa gtagtggaag ttctaacgta acagtgtggt aa 642
<210> 302
<211> 213
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(28)
<400> 302
Met Phe Lys Phe Thr Lys Lys Phe Leu Val Gly Leu Thr Ala Ala Leu
1 5 10 15
Met Ser Met Ser Leu Phe Ser Ala Asn Ala Ser Ala Ala Asn Thr Asp
20 25 30
Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr Val Asn Ala Val Asn
35 40 45
Gly Ser Gly Gly Asn Tyr Ser Val Asn Trp Ser Asn Thr Gly Asn Phe
50 55 60
Val Val Gly Lys Gly Trp Thr Thr Gly Ser Pro Phe Arg Thr Ile Asn
65 70 75 80
Tyr Asn Ala Gly Val Trp Ala Pro Asn Gly Asn Ala Tyr Leu Thr Leu
85 90 95
Tyr Gly Trp Thr Arg Ser Pro Leu Ile Glu Tyr Tyr Val Val Asp Ser
100 105 110
Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Thr Val Tyr Ser
115 120 125
Asp Gly Gly Thr Tyr Asp Val Tyr Thr Thr Thr Arg Tyr Asp Ala Pro
130 135 140
Ser Ile Asp Gly Asp Lys Thr Thr Phe Thr Gln Tyr Trp Ser Val Arg
145 150 155 160
Gln Ser Lys Arg Pro Thr Gly Ser Asn Ala Thr Ile Thr Phe Ser Asn
165 170 175
His Val Asn Ala Trp Lys Arg Tyr Gly Met Asn Leu Gly Ser Asn Trp
180 185 190
Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Arg Ser Ser Gly Ser Ser
195 200 205
Asn Val Thr Val Trp
210
<210> 303
<211> 1404
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 303
ttgactataa aggcctggcc cgggacggct gccagctata ataccaatag aggttttatc 60
atgtcctacg ctcagtttaa gggggccgct accctagcga cgtccttcct gctcgcagtc 120
accttgacag cctgtggagg cagcaaatcc aaacccgttc tgccagaccc atcgaacagc 180
agctcgtcat caagcagcag ctcgtcatca agcagcagct cctcaagttc ctccagtagc 240
agttcgagct cttctagtgc tccctccagc caaacgttct tcattgagcc ggatttccag 300
cttcacaccc tggcggactt cccgattgga gtggcagtct cggcagccaa tgagccatac 360
agcatcttca accaaaccga tggtactgat cggcaggatg tgatcctgga gcatttcaac 420
gaaatgaccg ctggcaacat catgaaaatg agctacgtgt acgcaggtca acgtgcaaat 480
cagcaacccg atcaattcga cttcagcaga gctgatgagc tggttgggtt tgcccacgca 540
aacagtgtga agattcacgg tcacgccctc gtttggcacg ccgactatca agttccgggt 600
ttcatgcaga attatgatgg cgactttgct gagatgttgg ccaatcacgc gcggagtgtt 660
gtggaacatt ttgacgaaga gtttccaggt accgtggtca gctgggatgt ggtcaacgag 720
gcgataaccg acaacttcgg aaccgataca aatggctggc gccggtcgct gttttacaac 780
gcgctgccgc ccgcgacaga agacgatatt cctgagtaca tccgcgttgc cttccaggcc 840
gctcgcgatg ccaacccgga catcgacctc tattacaatg attacgacaa taccgccaac 900
accaaccggc tgaacaaaac cctgcagatc gccgatgccc tggccgagga cgagctgatc 960
gacggtgtgg gattccagat gcacgtctat atgacgtacc cgagccttag tcacttccaa 1020
aacgcgtttc aagaagtggt tgatcgaggc ttgaaggtga agatcaccga gctggacgta 1080
tcggtggtca acccatacgg tcagagcact ccgccaccgc agcccgtcta cgatgaagcg 1140
ttggcaggcg cacagaaaaa gcggttctgc gatatcacca gagtctatct ggaaacggtt 1200
ccggctgagc ttcgcggcgg tctcactgtt tgggggcttg ccgacaacga aagctggttg 1260
atgcaacagt tcaggaacgc aacgggagcg aactacaccg acgtgtggcc gttgttgttc 1320
aacgccgacc tgtcagccaa acctacactc caaggcgtgg ccgatgctct gcagggtctc 1380
ccctgcacca ccgacctcga ctaa 1404
<210> 304
<211> 467
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(74)
<400> 304
Met Thr Ile Lys Ala Trp Pro Gly Thr Ala Ala Ser Tyr Asn Thr Asn
1 5 10 15
Arg Gly Phe Ile Met Ser Tyr Ala Gln Phe Lys Gly Ala Ala Thr Leu
20 25 30
Ala Thr Ser Phe Leu Leu Ala Val Thr Leu Thr Ala Cys Gly Gly Ser
35 40 45
Lys Ser Lys Pro Val Leu Pro Asp Pro Ser Asn Ser Ser Ser Ser Ser
50 55 60
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser
65 70 75 80
Ser Ser Ser Ser Ser Ser Ala Pro Ser Ser Gln Thr Phe Phe Ile Glu
85 90 95
Pro Asp Phe Gln Leu His Thr Leu Ala Asp Phe Pro Ile Gly Val Ala
100 105 110
Val Ser Ala Ala Asn Glu Pro Tyr Ser Ile Phe Asn Gln Thr Asp Gly
115 120 125
Thr Asp Arg Gln Asp Val Ile Leu Glu His Phe Asn Glu Met Thr Ala
130 135 140
Gly Asn Ile Met Lys Met Ser Tyr Val Tyr Ala Gly Gln Arg Ala Asn
145 150 155 160
Gln Gln Pro Asp Gln Phe Asp Phe Ser Arg Ala Asp Glu Leu Val Gly
165 170 175
Phe Ala His Ala Asn Ser Val Lys Ile His Gly His Ala Leu Val Trp
180 185 190
His Ala Asp Tyr Gln Val Pro Gly Phe Met Gln Asn Tyr Asp Gly Asp
195 200 205
Phe Ala Glu Met Leu Ala Asn His Ala Arg Ser Val Val Glu His Phe
210 215 220
Asp Glu Glu Phe Pro Gly Thr Val Val Ser Trp Asp Val Val Asn Glu
225 230 235 240
Ala Ile Thr Asp Asn Phe Gly Thr Asp Thr Asn Gly Trp Arg Arg Ser
245 250 255
Leu Phe Tyr Asn Ala Leu Pro Pro Ala Thr Glu Asp Asp Ile Pro Glu
260 265 270
Tyr Ile Arg Val Ala Phe Gln Ala Ala Arg Asp Ala Asn Pro Asp Ile
275 280 285
Asp Leu Tyr Tyr Asn Asp Tyr Asp Asn Thr Ala Asn Thr Asn Arg Leu
290 295 300
Asn Lys Thr Leu Gln Ile Ala Asp Ala Leu Ala Glu Asp Glu Leu Ile
305 310 315 320
Asp Gly Val Gly Phe Gln Met His Val Tyr Met Thr Tyr Pro Ser Leu
325 330 335
Ser His Phe Gln Asn Ala Phe Gln Glu Val Val Asp Arg Gly Leu Lys
340 345 350
Val Lys Ile Thr Glu Leu Asp Val Ser Val Val Asn Pro Tyr Gly Gln
355 360 365
Ser Thr Pro Pro Pro Gln Pro Val Tyr Asp Glu Ala Leu Ala Gly Ala
370 375 380
Gln Lys Lys Arg Phe Cys Asp Ile Thr Arg Val Tyr Leu Glu Thr Val
385 390 395 400
Pro Ala Glu Leu Arg Gly Gly Leu Thr Val Trp Gly Leu Ala Asp Asn
405 410 415
Glu Ser Trp Leu Met Gln Gln Phe Arg Asn Ala Thr Gly Ala Asn Tyr
420 425 430
Thr Asp Val Trp Pro Leu Leu Phe Asn Ala Asp Leu Ser Ala Lys Pro
435 440 445
Thr Leu Gln Gly Val Ala Asp Ala Leu Gln Gly Leu Pro Cys Thr Thr
450 455 460
Asp Leu Asp
465
<210> 305
<211> 3705
<212> DNA
<213> Bacteria
<400> 305
atgaagagta ttgtaaacag agttgtatct atcgttacag ctttaataat gatttttggg 60
acatcactgc tttcacaaca cataagggca tttgctgatg acactaatac aaatctggtt 120
tctaatgggg actttgagac aggcacaatt gatggctgga ttaagcaagg taatcctaca 180
ttagaagtaa cgactgaaca agcaattggg caatacagta tgaaagttac gggtagaaca 240
cagacatatg aaggacctgc atatagcttt ttaggaaaaa tgcagaaagg tgaatcatat 300
aatgtatcgc ttaaagttag acttgtttct ggacaaaatt cttctaatcc ttttattacc 360
gtgactatgt ttagagaaga tgacaatggc aagcattatg atacaatagt ttggcaaaaa 420
caagtttctg aagattcatg gactactgta agcgggactt atacattaga ttatactgga 480
acattaaaaa cattatacat gtatgtagaa tcacccgatc caacgctgga atactatatt 540
gatgatgttg tagtgacacc acaaaatcca atacaagtag gaaatgtgat taccaatgga 600
acttttgaaa atggaaatac ttcaggatgg gttggaacag gctcatctgt tgttaaggca 660
gtgtatggag tggctcatag cggaggttat agtttattga cgacagggag aacagctaat 720
tggaatggtc ctagctatga tttgactggc aaaatagtac caggtcaaca atacaatgtt 780
gatttttggg tgaaatttgt taatggcaat gatacagaac aaataaaggc tactgttaaa 840
gcgacttcta acaaagacaa ttatatacaa gttaatgatt ttgtaaatgt aaataaaggc 900
gaatggacag aaataaaagg cagttttact ttacctgtga cagattacag cggtgtcagc 960
atctatgtag aatctcaaaa tcctacttta gagttttaca ttgatgattt ttctgtaata 1020
ggtgaaattt caaataatca gattacaata caaaatgata ttccggattt atattcagta 1080
ttcaaagatt atttccccat cggtgttgca gttgattcga gtagattaaa tgatgctgat 1140
ccacatgctc aattgactgc taaacatttt aatatgcttg ttgcagaaaa tgccatgaaa 1200
ccggaaagct tgcagcctac agagggaaac tttacctttg ataatgctga taagattgtt 1260
gattatgaaa tagcacataa tatgaagatg agaggtcata cattgctttg gcataatcag 1320
gttccggatt ggtttttcca ggacccatct gatccgtcta aaccagcttc aagggatctg 1380
ctgcttcaaa gattaagaac gcacataaca actgtgttag atcattttaa aacaaaatac 1440
ggttctcaaa atccaataat cggatgggat gttgtaaatg aggttcttga tgataatggc 1500
aatttaagaa attctaagtg gttacaaatt ataggacctg attatataga aaaagctttt 1560
gaatatgcgc atgaggcaga tccatctatg aaattgttta ttaatgatta caacatcgaa 1620
aataatggcg ttaaaacaca ggcaatgtat gatttagtga aaaagttaaa aagtgaaggt 1680
gtgcctataa acggaatagg catgcaaatg cacataagca taaattcaaa tatagacaat 1740
ataaaagctt ctatagaaaa acttgcatca ttaggtgtgg aaatacaggt aactgaatta 1800
gatatgaaca tgaatggtaa tgtatctaac gacgcattgc ttaagcaagc gagattgtat 1860
aaacaattat ttgacttatt taaagcagaa aaacaatata taactgctgt agttttttgg 1920
ggagtttcag atgatgtaag ttggcttagt aagccaaatg ctccactact ttttgattca 1980
aagttacagg caaagccagc atactgggca attgtagatc aaggcaaagc catacctgac 2040
attcaatctg caaaagcttt agaaggatca ccgacgattg gtgcaaatgt tgatagttct 2100
tggaaacttg taaaaccatt gtatgctaat acttatgtga aaggaactat tggagcaact 2160
gctgctgtta aatctatgtg ggatactaaa aacttatatt tgttagtaca agtttcagac 2220
aatactccat ctaataatga tggtatcgag atttttgtgg ataagaatga caacaaatct 2280
actacctatg aaagtgacga tgaacattat atagttaaga gggatggtac agggagttca 2340
aatattacaa agtatgtaat gtctaatgct gatggatatg tagcacagat agctattcca 2400
attgaagaca ttagtcctgt gctgaatgat aaaattggat ttgatatcag aataaatgat 2460
gaccaaggca gtggcaatat aaatgcgata acagtttgga atgattatac aaacagtcaa 2520
gatactaata cagcatattt tggagattta gtattatcaa aacctgcaca gattgcaaca 2580
gctatatatg gcactcctgt tattgacggt aaagtagatg gtatttggaa taatgctgaa 2640
gctatttcga caaatacatg ggtcttgggt tcaaatggtg ctactgcaac agcaaaaatg 2700
atgtgggacg ataaatatct ttatatattg gcagatgtaa cagataacaa tttaaataaa 2760
tccagtgtga atccttatga acaggattct gtggaagttt ttgtagatca gaataatgat 2820
aagacaactt attatgaaaa tgatgatggg cagtttagag ttaactatga taatgaacaa 2880
agttttggag gaagcactaa ttcaaatgga tttaagtcgg caacaagtct tacacaaaat 2940
ggatatattg tagaagaagc tattccttgg acgagtatta ctccgtcaaa tggtactatc 3000
atagggtttg acttgcaagt taacgatgca gatgaaaatg gtaagaggac aggtattgtc 3060
acatggtgtg atccaagcgg aaattcttgg caagatactt ctggatttgg aaacttgatg 3120
cttacaggta agccatctgg tgtccttaaa aaggttgtgg catttaatga cataaaagac 3180
aattgggcga aagacgtaat agaagtatta gcgtcaaggc acatagtaga agggatgaca 3240
gacacccagt atgaaccaaa caagacagtg acgagagcag aatttacagc aatgatactg 3300
aggctattaa acataaaaga agaagcatac agcggagaat ttagcgatgt aaaaagtgga 3360
gactggtatg caaacgcgat agaagcagca tacaaaacag gaataatcga aggtgacgga 3420
aagaacgcaa ggccaaatga cagcataaca agagaagaga tgacagcaat agccatgagg 3480
gcatacgaga tgctgacaca gtacgaagaa gagaatatag gtgcgacaac atttagcgac 3540
gacaaatcca taagcgattg ggcaagaaat gtagtggcaa atgcagcgaa attaggaata 3600
gtaaatggtg agccaaataa cgtatttgca cctaaaggaa atgccacaag agcagaagca 3660
gcagctatca tatacggctt attagaaaaa acaaataagc tttaa 3705
<210> 306
<211> 1234
<212> PRT
<213> Bacteria
<220>
<221> SIGNAL
<222> (1)...(32)
<400> 306
Met Lys Ser Ile Val Asn Arg Val Val Ser Ile Val Thr Ala Leu Ile
1 5 10 15
Met Ile Phe Gly Thr Ser Leu Leu Ser Gln His Ile Arg Ala Phe Ala
20 25 30
Asp Asp Thr Asn Thr Asn Leu Val Ser Asn Gly Asp Phe Glu Thr Gly
35 40 45
Thr Ile Asp Gly Trp Ile Lys Gln Gly Asn Pro Thr Leu Glu Val Thr
50 55 60
Thr Glu Gln Ala Ile Gly Gln Tyr Ser Met Lys Val Thr Gly Arg Thr
65 70 75 80
Gln Thr Tyr Glu Gly Pro Ala Tyr Ser Phe Leu Gly Lys Met Gln Lys
85 90 95
Gly Glu Ser Tyr Asn Val Ser Leu Lys Val Arg Leu Val Ser Gly Gln
100 105 110
Asn Ser Ser Asn Pro Phe Ile Thr Val Thr Met Phe Arg Glu Asp Asp
115 120 125
Asn Gly Lys His Tyr Asp Thr Ile Val Trp Gln Lys Gln Val Ser Glu
130 135 140
Asp Ser Trp Thr Thr Val Ser Gly Thr Tyr Thr Leu Asp Tyr Thr Gly
145 150 155 160
Thr Leu Lys Thr Leu Tyr Met Tyr Val Glu Ser Pro Asp Pro Thr Leu
165 170 175
Glu Tyr Tyr Ile Asp Asp Val Val Val Thr Pro Gln Asn Pro Ile Gln
180 185 190
Val Gly Asn Val Ile Thr Asn Gly Thr Phe Glu Asn Gly Asn Thr Ser
195 200 205
Gly Trp Val Gly Thr Gly Ser Ser Val Val Lys Ala Val Tyr Gly Val
210 215 220
Ala His Ser Gly Gly Tyr Ser Leu Leu Thr Thr Gly Arg Thr Ala Asn
225 230 235 240
Trp Asn Gly Pro Ser Tyr Asp Leu Thr Gly Lys Ile Val Pro Gly Gln
245 250 255
Gln Tyr Asn Val Asp Phe Trp Val Lys Phe Val Asn Gly Asn Asp Thr
260 265 270
Glu Gln Ile Lys Ala Thr Val Lys Ala Thr Ser Asn Lys Asp Asn Tyr
275 280 285
Ile Gln Val Asn Asp Phe Val Asn Val Asn Lys Gly Glu Trp Thr Glu
290 295 300
Ile Lys Gly Ser Phe Thr Leu Pro Val Thr Asp Tyr Ser Gly Val Ser
305 310 315 320
Ile Tyr Val Glu Ser Gln Asn Pro Thr Leu Glu Phe Tyr Ile Asp Asp
325 330 335
Phe Ser Val Ile Gly Glu Ile Ser Asn Asn Gln Ile Thr Ile Gln Asn
340 345 350
Asp Ile Pro Asp Leu Tyr Ser Val Phe Lys Asp Tyr Phe Pro Ile Gly
355 360 365
Val Ala Val Asp Ser Ser Arg Leu Asn Asp Ala Asp Pro His Ala Gln
370 375 380
Leu Thr Ala Lys His Phe Asn Met Leu Val Ala Glu Asn Ala Met Lys
385 390 395 400
Pro Glu Ser Leu Gln Pro Thr Glu Gly Asn Phe Thr Phe Asp Asn Ala
405 410 415
Asp Lys Ile Val Asp Tyr Glu Ile Ala His Asn Met Lys Met Arg Gly
420 425 430
His Thr Leu Leu Trp His Asn Gln Val Pro Asp Trp Phe Phe Gln Asp
435 440 445
Pro Ser Asp Pro Ser Lys Pro Ala Ser Arg Asp Leu Leu Leu Gln Arg
450 455 460
Leu Arg Thr His Ile Thr Thr Val Leu Asp His Phe Lys Thr Lys Tyr
465 470 475 480
Gly Ser Gln Asn Pro Ile Ile Gly Trp Asp Val Val Asn Glu Val Leu
485 490 495
Asp Asp Asn Gly Asn Leu Arg Asn Ser Lys Trp Leu Gln Ile Ile Gly
500 505 510
Pro Asp Tyr Ile Glu Lys Ala Phe Glu Tyr Ala His Glu Ala Asp Pro
515 520 525
Ser Met Lys Leu Phe Ile Asn Asp Tyr Asn Ile Glu Asn Asn Gly Val
530 535 540
Lys Thr Gln Ala Met Tyr Asp Leu Val Lys Lys Leu Lys Ser Glu Gly
545 550 555 560
Val Pro Ile Asn Gly Ile Gly Met Gln Met His Ile Ser Ile Asn Ser
565 570 575
Asn Ile Asp Asn Ile Lys Ala Ser Ile Glu Lys Leu Ala Ser Leu Gly
580 585 590
Val Glu Ile Gln Val Thr Glu Leu Asp Met Asn Met Asn Gly Asn Val
595 600 605
Ser Asn Asp Ala Leu Leu Lys Gln Ala Arg Leu Tyr Lys Gln Leu Phe
610 615 620
Asp Leu Phe Lys Ala Glu Lys Gln Tyr Ile Thr Ala Val Val Phe Trp
625 630 635 640
Gly Val Ser Asp Asp Val Ser Trp Leu Ser Lys Pro Asn Ala Pro Leu
645 650 655
Leu Phe Asp Ser Lys Leu Gln Ala Lys Pro Ala Tyr Trp Ala Ile Val
660 665 670
Asp Gln Gly Lys Ala Ile Pro Asp Ile Gln Ser Ala Lys Ala Leu Glu
675 680 685
Gly Ser Pro Thr Ile Gly Ala Asn Val Asp Ser Ser Trp Lys Leu Val
690 695 700
Lys Pro Leu Tyr Ala Asn Thr Tyr Val Lys Gly Thr Ile Gly Ala Thr
705 710 715 720
Ala Ala Val Lys Ser Met Trp Asp Thr Lys Asn Leu Tyr Leu Leu Val
725 730 735
Gln Val Ser Asp Asn Thr Pro Ser Asn Asn Asp Gly Ile Glu Ile Phe
740 745 750
Val Asp Lys Asn Asp Asn Lys Ser Thr Thr Tyr Glu Ser Asp Asp Glu
755 760 765
His Tyr Ile Val Lys Arg Asp Gly Thr Gly Ser Ser Asn Ile Thr Lys
770 775 780
Tyr Val Met Ser Asn Ala Asp Gly Tyr Val Ala Gln Ile Ala Ile Pro
785 790 795 800
Ile Glu Asp Ile Ser Pro Val Leu Asn Asp Lys Ile Gly Phe Asp Ile
805 810 815
Arg Ile Asn Asp Asp Gln Gly Ser Gly Asn Ile Asn Ala Ile Thr Val
820 825 830
Trp Asn Asp Tyr Thr Asn Ser Gln Asp Thr Asn Thr Ala Tyr Phe Gly
835 840 845
Asp Leu Val Leu Ser Lys Pro Ala Gln Ile Ala Thr Ala Ile Tyr Gly
850 855 860
Thr Pro Val Ile Asp Gly Lys Val Asp Gly Ile Trp Asn Asn Ala Glu
865 870 875 880
Ala Ile Ser Thr Asn Thr Trp Val Leu Gly Ser Asn Gly Ala Thr Ala
885 890 895
Thr Ala Lys Met Met Trp Asp Asp Lys Tyr Leu Tyr Ile Leu Ala Asp
900 905 910
Val Thr Asp Asn Asn Leu Asn Lys Ser Ser Val Asn Pro Tyr Glu Gln
915 920 925
Asp Ser Val Glu Val Phe Val Asp Gln Asn Asn Asp Lys Thr Thr Tyr
930 935 940
Tyr Glu Asn Asp Asp Gly Gln Phe Arg Val Asn Tyr Asp Asn Glu Gln
945 950 955 960
Ser Phe Gly Gly Ser Thr Asn Ser Asn Gly Phe Lys Ser Ala Thr Ser
965 970 975
Leu Thr Gln Asn Gly Tyr Ile Val Glu Glu Ala Ile Pro Trp Thr Ser
980 985 990
Ile Thr Pro Ser Asn Gly Thr Ile Ile Gly Phe Asp Leu Gln Val Asn
995 1000 1005
Asp Ala Asp Glu Asn Gly Lys Arg Thr Gly Ile Val Thr Trp Cys Asp
1010 1015 1020
Pro Ser Gly Asn Ser Trp Gln Asp Thr Ser Gly Phe Gly Asn Leu Met
1025 1030 1035 1040
Leu Thr Gly Lys Pro Ser Gly Val Leu Lys Lys Val Val Ala Phe Asn
1045 1050 1055
Asp Ile Lys Asp Asn Trp Ala Lys Asp Val Ile Glu Val Leu Ala Ser
1060 1065 1070
Arg His Ile Val Glu Gly Met Thr Asp Thr Gln Tyr Glu Pro Asn Lys
1075 1080 1085
Thr Val Thr Arg Ala Glu Phe Thr Ala Met Ile Leu Arg Leu Leu Asn
1090 1095 1100
Ile Lys Glu Glu Ala Tyr Ser Gly Glu Phe Ser Asp Val Lys Ser Gly
1105 1110 1115 1120
Asp Trp Tyr Ala Asn Ala Ile Glu Ala Ala Tyr Lys Thr Gly Ile Ile
1125 1130 1135
Glu Gly Asp Gly Lys Asn Ala Arg Pro Asn Asp Ser Ile Thr Arg Glu
1140 1145 1150
Glu Met Thr Ala Ile Ala Met Arg Ala Tyr Glu Met Leu Thr Gln Tyr
1155 1160 1165
Glu Glu Glu Asn Ile Gly Ala Thr Thr Phe Ser Asp Asp Lys Ser Ile
1170 1175 1180
Ser Asp Trp Ala Arg Asn Val Val Ala Asn Ala Ala Lys Leu Gly Ile
1185 1190 1195 1200
Val Asn Gly Glu Pro Asn Asn Val Phe Ala Pro Lys Gly Asn Ala Thr
1205 1210 1215
Arg Ala Glu Ala Ala Ala Ile Ile Tyr Gly Leu Leu Glu Lys Thr Asn
1220 1225 1230
Lys Leu
<210> 307
<211> 3729
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 307
atgaaatccg ccatcggcga cgctgcgttt atggcggcga tggaacgcaa ctccgacatc 60
gtgacgatgc agtgctacgc acctatcttt gtcaatgtca atcccggcgg gcggcagtgg 120
cgccccaatt tgatgggcta cgatgcgtta agcgctttcg gctcgccctc gtattacgcc 180
atcaaaatgt tcagcaacaa tttgggcgat acgattttga agcccagtct cagcggtgcg 240
cgcctgccag tttccgttac acaagagcag aaaagcggca cgattttcat taaattggtg 300
aacccgcaaa cgacgccaca gagcgtaaaa attgatctca aaggcgtgcg ctccgtcgaa 360
ttcagcggca ccgccactgt tttagctgcc gactccggcg cgcttaactc cattgatgcg 420
cctaccaaag tcgttcctgt cacgcgcaga attactggaa tcagcccctc gtttgcgcaa 480
acgctggagc cgtattcgat tactgttttg caaatcaagg ccactgctct gccaacggcg 540
acagcaaacg ccgttgcgcc gccaaccttc accacggagc caaaagtgaa caccaccacg 600
cccgttacta ttcccgttgc gacttcgcag ccgcagccag tttcgcaacc gtcgccagat 660
gcaaacgcta tcgcgccgct gaaaaacgct ttcaaaggca agttcctcat tggcaccgtg 720
ttgagcgggc cagacctgcg cggccagcaa acgcgcagcg tgggtatcgc caccacgcat 780
ttcgacgcct ttacggcaga aaacgaaatg aagccggatg cgatgcagcc tcgcgaagga 840
caattcaact ttgctgccgg cgaccgctta gtggaactgg ccgaaaaaag cggcgccacg 900
cccatcggcc acacgctaat ctggcactcg caaacaccac gctggttctt tgaagggccg 960
gacggacaac cggcgaatcg tgaattggcc ttggcgcgga tgcgcaagca tattgcaacc 1020
gtcgtcggcc actacaaagg gcgcgtcaag cagtgggacg tggtgaacga agccataaac 1080
gatggccccg gcgtgctgcg ccaaagcccg tggctgcgcg ctatcggcga agactacatc 1140
gctgaagcgt ttcgagccgc gcacgccgcc gaccctgacg caattctcat ctataacgat 1200
tacaacatcg aaatgggcta caaacggccc aaagcaatcc aactcttaaa atctctggtt 1260
gatcagaaag tgccgattca tgcggttggt attcagggcc actggcgtat ggacaccaac 1320
ctcaccgaag tggaacaagc tattaaagaa ttctcggcgc tgggcctgaa ggtgatgatc 1380
actgaactcg acatcggtgt tttgccgacg cgttatcagg gcgctgatat ttcgcaggtg 1440
caaaacatga cgcctgaaca gcgcgccgcc gtgaacccat ataccaatgg tttgcccgac 1500
gacgtagcgc aaaaacacgc cgataaatat cgccaggcct tcgatatttt cctgcgctac 1560
aaagatgtca tcgaacgcgt cacgttctgg ggtgtggacg atgctcattc gtggctgaac 1620
ggtttcccga ttcgcgggcg caccgattac ccattgcttt tcgaccggca gggcaaacct 1680
aaacccgcct ttttcgccgt gcaaaacctg gctttaggcg tgaccgccgc gccgcaatcg 1740
aatgcttcgt ctgcacccag agctgtcgct caagctgcgc cggcaaccag caatattcgt 1800
ggccaggaat ttccacgggt cgaaagcgat ttgcgtgtga cgtttcgcat caaagccccc 1860
gaagcgcaaa aagtgcagtt cgatttaggc aagccttacg acgcgacccg cgatgctgaa 1920
ggcaactgga cggcaaccac cgagccgcag gtgcccggct ttcactatta caatttggtg 1980
attgacggcg tgcgcgtgaa cgacccggcc agcgaaacct tttacggcgc gggccgccag 2040
atgagcggca tcgaaatccc cgaccctgac agcgcctttt attcgccgca aaacgtgccg 2100
cacggcgaag tgcgcgagcg ctggtatttt tccaacacca cgcaggcgtg gcgtcgcatt 2160
ttcatttata cgccgccggg ttatgacacg aatcaagtgg agcgttttcc cgttttgtat 2220
ttacagcatg gcggcggcga agatgagcgc ggctggcctc aacagggtcg catgagcttt 2280
atcatggata atctcatcgc cacacgtaaa gccaaaccga tgcttgtggt gatggaacaa 2340
ggctatgcgc gcaagcccaa cgagccgcag gtgccgttgc gcccgcccgg cggtagcgcc 2400
ggagccatgc cccccgattt caatcgcatg ttcggcacac tgggtgaagt gttcaccaaa 2460
gacctgattc cctttattga tgctaattac cgcaccaaaa ccgaccgcga aaaccgcgcc 2520
atggccggac tttcgatggg cgggatgcaa agtttcctta ttggcttgtc gaacaccgat 2580
ttattcgcgc acatcggagg cttcagcggc gcgggcggcg gtttcggtgg cggcaccttc 2640
gacgcaaaaa cggcgcacgg cggtgtaatg gccgacgccg acgcgttcaa caaaaaagtt 2700
cgcacgctgt ttctcagcat cggcacagcg gaaaacgaac gctttcagag cagcgtgcgc 2760
ggttaccgcg atgcgctgac caaagcgggc atcaaaacca cattctacga atcgcccggc 2820
acctcacatg aatggctgac atggcggcgt agcctgaaag aattcgcacc gctcttgttt 2880
caagaagtcg aagtgcaaat tgagcgcggc ccgaatgcgc gcccaattgc gccgcaaccg 2940
attaatctcg gccccgacga taaacccgca tttcccccgg tgcccgccgg tttcgatgtc 3000
cgccgcaacg atattccgca tggcgaaatc aaactcgtgg aatatccatc cgctacagtg 3060
ggcacaaatc gtaagatgca ggtttacacg ccgcccggtt acaatccgca agaaaagtat 3120
gcggtgcttt atctgttgca cggaatcggc ggcgacgagt gggaatggaa aaatggcggc 3180
acgccggaag tgattctcga taatctttac gccgcgaaaa aactccagcc gatgattgtg 3240
gtcatgccca atggccgcgc gcaaaaagat gaccgtccaa tcggcaatgt gttcgcatca 3300
gcgcctgctt ttgaaacctt cgagaaagat ttactcaacg acgtaattcc gtttatcgaa 3360
aagaattatc cagtcaaaac cggcgccgaa aatcgcgcgc ttgcgggcct ttcgatgggc 3420
ggtgggcaat cgctgaactt tggtctgggc aatctcgaca cctttgcgtg ggtcggcggc 3480
ttttcttcgg cgcccaacac gcgcactggc gcaaggctat tagccaatcc cgacgatgcc 3540
aaaaagaagc tgaaattgtt atgggtttcg tgtggcgata aagacggctt gtttttcatc 3600
agccagcgca cgcatcgcta tctcgccgaa aacaatgtgc cacacgtctg gcatgtgcag 3660
cccggcggcc acgatttccg agtgtggaag caagaccttt ataacttttc gcaactgctg 3720
ttccgctaa 3729
<210> 308
<211> 1242
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 308
Met Lys Ser Ala Ile Gly Asp Ala Ala Phe Met Ala Ala Met Glu Arg
1 5 10 15
Asn Ser Asp Ile Val Thr Met Gln Cys Tyr Ala Pro Ile Phe Val Asn
20 25 30
Val Asn Pro Gly Gly Arg Gln Trp Arg Pro Asn Leu Met Gly Tyr Asp
35 40 45
Ala Leu Ser Ala Phe Gly Ser Pro Ser Tyr Tyr Ala Ile Lys Met Phe
50 55 60
Ser Asn Asn Leu Gly Asp Thr Ile Leu Lys Pro Ser Leu Ser Gly Ala
65 70 75 80
Arg Leu Pro Val Ser Val Thr Gln Glu Gln Lys Ser Gly Thr Ile Phe
85 90 95
Ile Lys Leu Val Asn Pro Gln Thr Thr Pro Gln Ser Val Lys Ile Asp
100 105 110
Leu Lys Gly Val Arg Ser Val Glu Phe Ser Gly Thr Ala Thr Val Leu
115 120 125
Ala Ala Asp Ser Gly Ala Leu Asn Ser Ile Asp Ala Pro Thr Lys Val
130 135 140
Val Pro Val Thr Arg Arg Ile Thr Gly Ile Ser Pro Ser Phe Ala Gln
145 150 155 160
Thr Leu Glu Pro Tyr Ser Ile Thr Val Leu Gln Ile Lys Ala Thr Ala
165 170 175
Leu Pro Thr Ala Thr Ala Asn Ala Val Ala Pro Pro Thr Phe Thr Thr
180 185 190
Glu Pro Lys Val Asn Thr Thr Thr Pro Val Thr Ile Pro Val Ala Thr
195 200 205
Ser Gln Pro Gln Pro Val Ser Gln Pro Ser Pro Asp Ala Asn Ala Ile
210 215 220
Ala Pro Leu Lys Asn Ala Phe Lys Gly Lys Phe Leu Ile Gly Thr Val
225 230 235 240
Leu Ser Gly Pro Asp Leu Arg Gly Gln Gln Thr Arg Ser Val Gly Ile
245 250 255
Ala Thr Thr His Phe Asp Ala Phe Thr Ala Glu Asn Glu Met Lys Pro
260 265 270
Asp Ala Met Gln Pro Arg Glu Gly Gln Phe Asn Phe Ala Ala Gly Asp
275 280 285
Arg Leu Val Glu Leu Ala Glu Lys Ser Gly Ala Thr Pro Ile Gly His
290 295 300
Thr Leu Ile Trp His Ser Gln Thr Pro Arg Trp Phe Phe Glu Gly Pro
305 310 315 320
Asp Gly Gln Pro Ala Asn Arg Glu Leu Ala Leu Ala Arg Met Arg Lys
325 330 335
His Ile Ala Thr Val Val Gly His Tyr Lys Gly Arg Val Lys Gln Trp
340 345 350
Asp Val Val Asn Glu Ala Ile Asn Asp Gly Pro Gly Val Leu Arg Gln
355 360 365
Ser Pro Trp Leu Arg Ala Ile Gly Glu Asp Tyr Ile Ala Glu Ala Phe
370 375 380
Arg Ala Ala His Ala Ala Asp Pro Asp Ala Ile Leu Ile Tyr Asn Asp
385 390 395 400
Tyr Asn Ile Glu Met Gly Tyr Lys Arg Pro Lys Ala Ile Gln Leu Leu
405 410 415
Lys Ser Leu Val Asp Gln Lys Val Pro Ile His Ala Val Gly Ile Gln
420 425 430
Gly His Trp Arg Met Asp Thr Asn Leu Thr Glu Val Glu Gln Ala Ile
435 440 445
Lys Glu Phe Ser Ala Leu Gly Leu Lys Val Met Ile Thr Glu Leu Asp
450 455 460
Ile Gly Val Leu Pro Thr Arg Tyr Gln Gly Ala Asp Ile Ser Gln Val
465 470 475 480
Gln Asn Met Thr Pro Glu Gln Arg Ala Ala Val Asn Pro Tyr Thr Asn
485 490 495
Gly Leu Pro Asp Asp Val Ala Gln Lys His Ala Asp Lys Tyr Arg Gln
500 505 510
Ala Phe Asp Ile Phe Leu Arg Tyr Lys Asp Val Ile Glu Arg Val Thr
515 520 525
Phe Trp Gly Val Asp Asp Ala His Ser Trp Leu Asn Gly Phe Pro Ile
530 535 540
Arg Gly Arg Thr Asp Tyr Pro Leu Leu Phe Asp Arg Gln Gly Lys Pro
545 550 555 560
Lys Pro Ala Phe Phe Ala Val Gln Asn Leu Ala Leu Gly Val Thr Ala
565 570 575
Ala Pro Gln Ser Asn Ala Ser Ser Ala Pro Arg Ala Val Ala Gln Ala
580 585 590
Ala Pro Ala Thr Ser Asn Ile Arg Gly Gln Glu Phe Pro Arg Val Glu
595 600 605
Ser Asp Leu Arg Val Thr Phe Arg Ile Lys Ala Pro Glu Ala Gln Lys
610 615 620
Val Gln Phe Asp Leu Gly Lys Pro Tyr Asp Ala Thr Arg Asp Ala Glu
625 630 635 640
Gly Asn Trp Thr Ala Thr Thr Glu Pro Gln Val Pro Gly Phe His Tyr
645 650 655
Tyr Asn Leu Val Ile Asp Gly Val Arg Val Asn Asp Pro Ala Ser Glu
660 665 670
Thr Phe Tyr Gly Ala Gly Arg Gln Met Ser Gly Ile Glu Ile Pro Asp
675 680 685
Pro Asp Ser Ala Phe Tyr Ser Pro Gln Asn Val Pro His Gly Glu Val
690 695 700
Arg Glu Arg Trp Tyr Phe Ser Asn Thr Thr Gln Ala Trp Arg Arg Ile
705 710 715 720
Phe Ile Tyr Thr Pro Pro Gly Tyr Asp Thr Asn Gln Val Glu Arg Phe
725 730 735
Pro Val Leu Tyr Leu Gln His Gly Gly Gly Glu Asp Glu Arg Gly Trp
740 745 750
Pro Gln Gln Gly Arg Met Ser Phe Ile Met Asp Asn Leu Ile Ala Thr
755 760 765
Arg Lys Ala Lys Pro Met Leu Val Val Met Glu Gln Gly Tyr Ala Arg
770 775 780
Lys Pro Asn Glu Pro Gln Val Pro Leu Arg Pro Pro Gly Gly Ser Ala
785 790 795 800
Gly Ala Met Pro Pro Asp Phe Asn Arg Met Phe Gly Thr Leu Gly Glu
805 810 815
Val Phe Thr Lys Asp Leu Ile Pro Phe Ile Asp Ala Asn Tyr Arg Thr
820 825 830
Lys Thr Asp Arg Glu Asn Arg Ala Met Ala Gly Leu Ser Met Gly Gly
835 840 845
Met Gln Ser Phe Leu Ile Gly Leu Ser Asn Thr Asp Leu Phe Ala His
850 855 860
Ile Gly Gly Phe Ser Gly Ala Gly Gly Gly Phe Gly Gly Gly Thr Phe
865 870 875 880
Asp Ala Lys Thr Ala His Gly Gly Val Met Ala Asp Ala Asp Ala Phe
885 890 895
Asn Lys Lys Val Arg Thr Leu Phe Leu Ser Ile Gly Thr Ala Glu Asn
900 905 910
Glu Arg Phe Gln Ser Ser Val Arg Gly Tyr Arg Asp Ala Leu Thr Lys
915 920 925
Ala Gly Ile Lys Thr Thr Phe Tyr Glu Ser Pro Gly Thr Ser His Glu
930 935 940
Trp Leu Thr Trp Arg Arg Ser Leu Lys Glu Phe Ala Pro Leu Leu Phe
945 950 955 960
Gln Glu Val Glu Val Gln Ile Glu Arg Gly Pro Asn Ala Arg Pro Ile
965 970 975
Ala Pro Gln Pro Ile Asn Leu Gly Pro Asp Asp Lys Pro Ala Phe Pro
980 985 990
Pro Val Pro Ala Gly Phe Asp Val Arg Arg Asn Asp Ile Pro His Gly
995 1000 1005
Glu Ile Lys Leu Val Glu Tyr Pro Ser Ala Thr Val Gly Thr Asn Arg
1010 1015 1020
Lys Met Gln Val Tyr Thr Pro Pro Gly Tyr Asn Pro Gln Glu Lys Tyr
1025 1030 1035 1040
Ala Val Leu Tyr Leu Leu His Gly Ile Gly Gly Asp Glu Trp Glu Trp
1045 1050 1055
Lys Asn Gly Gly Thr Pro Glu Val Ile Leu Asp Asn Leu Tyr Ala Ala
1060 1065 1070
Lys Lys Leu Gln Pro Met Ile Val Val Met Pro Asn Gly Arg Ala Gln
1075 1080 1085
Lys Asp Asp Arg Pro Ile Gly Asn Val Phe Ala Ser Ala Pro Ala Phe
1090 1095 1100
Glu Thr Phe Glu Lys Asp Leu Leu Asn Asp Val Ile Pro Phe Ile Glu
1105 1110 1115 1120
Lys Asn Tyr Pro Val Lys Thr Gly Ala Glu Asn Arg Ala Leu Ala Gly
1125 1130 1135
Leu Ser Met Gly Gly Gly Gln Ser Leu Asn Phe Gly Leu Gly Asn Leu
1140 1145 1150
Asp Thr Phe Ala Trp Val Gly Gly Phe Ser Ser Ala Pro Asn Thr Arg
1155 1160 1165
Thr Gly Ala Arg Leu Leu Ala Asn Pro Asp Asp Ala Lys Lys Lys Leu
1170 1175 1180
Lys Leu Leu Trp Val Ser Cys Gly Asp Lys Asp Gly Leu Phe Phe Ile
1185 1190 1195 1200
Ser Gln Arg Thr His Arg Tyr Leu Ala Glu Asn Asn Val Pro His Val
1205 1210 1215
Trp His Val Gln Pro Gly Gly His Asp Phe Arg Val Trp Lys Gln Asp
1220 1225 1230
Leu Tyr Asn Phe Ser Gln Leu Leu Phe Arg
1235 1240
<210> 309
<211> 1830
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 309
ttgaaaaaac tcacaatcgc cctatccctt gcaatcactt ttgccgcgcc agtttttgcg 60
acagatgctt gtttgcaaaa tactcaatta aatgctaccg cccaaggagc acaaacctgg 120
actggcaaaa aaggagctac aactttaggc ggttcaggtg acgatgctta tggagttgaa 180
acttggacag aagctggtgg agacgctact aaatttacat ggtttggacc aaatcagggt 240
ggtggtttcg cttatagagc ggaatggaca aattccacag attacttagg tcgctttggt 300
tatttttggg gtattgacgg gaaaaaatgg gacaaattag gagacctttg cgttgattat 360
aactataaaa gatctgccaa tggcactgga ggttcatatt cttatatagg cgtttatgga 420
tggacaaacg ctggcggtgg tactgaagct gaatattata tagttgaaga ttggtttgga 480
gaaaatcaac agactgcaaa taatttaggc aatggttgcc aagagcacgg tgaaattaca 540
gtggacgaga aaagctataa agttgtcact tgcataagac cagcaggctc tggctgcgta 600
acttgcaacg gacaacaatt cgggcaagtc tttagcatac gccaaggcat gagaagcgaa 660
caacctaaaa catgcggaac aatctccatc aaaaagcact ttgaagaatg ggtaaaaatg 720
acaaccgaaa aaagcggaca atccccagct aaatatattt acgataaaac ttatgaatcc 780
aaatttttag cggaggcaca aggcggcact ggttggcttg aaaccacttt ccttaaattt 840
tctagaaacg gtgattgcgg cttcgatatt cctgatggtc atttcaccct tcaattagct 900
acctctccgt ctgagggcgg tactgtaagc agaaacccaa aggaatcttc ttatgcctcc 960
ggttcaactg taactctcac agccactccg gcagcaggtt ggaaatttgc cagttggagt 1020
ggtgatgcat gtcaaaccac aagcccattg acagtcacta tggacaaaaa caaggtaatc 1080
acagcgaaat ttacccccgt tgtagatctc aataaaaacc ttgttacaaa tggtactttc 1140
acgaataaag agagttggac ttttaatact ggttccagtt atggcaactc cgaaggaact 1200
tttgatgtgt caaacagcga aggcagaata aatgtgacga aaattggctc caacccgtgg 1260
gaaccacagc tcgttcaaaa tggcatcacc cttgttgaag gaatgaatta caaaataact 1320
tttgaagctt ctgcctctgc tgctcgaaaa ataggcttgg ttatacaaat ggcaggcggc 1380
gattatacca cttattttga aaaagatata gacttgactg cctcaaatca acaattttcg 1440
tatgaattca aaatgaatgc accaagcgat gaaagcggtc gtattgggtt taatcttggg 1500
caaacgactg gaaacgtcac tctaagcaaa atcacccttc attatttaga agaagattca 1560
cacgaaccgt ccgacaatcc ctgcgaagac ccaagtccaa ttttgaaaaa acgcatccct 1620
gcaactcatt tctcccttca aacgcttagc gacaaagcct tgcgcataga agtgaacgct 1680
ccaaccattg tggacatttt tgacctgaga gggaataaag ttaagagttt gaatgtctcc 1740
ggctcgcaaa cggttaaatt atccctgcca agcggagtgt attttgccaa agcacgtgga 1800
atgaaaagcg tcagatttgt gttgaggtaa 1830
<210> 310
<211> 609
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(20)
<400> 310
Met Lys Lys Leu Thr Ile Ala Leu Ser Leu Ala Ile Thr Phe Ala Ala
1 5 10 15
Pro Val Phe Ala Thr Asp Ala Cys Leu Gln Asn Thr Gln Leu Asn Ala
20 25 30
Thr Ala Gln Gly Ala Gln Thr Trp Thr Gly Lys Lys Gly Ala Thr Thr
35 40 45
Leu Gly Gly Ser Gly Asp Asp Ala Tyr Gly Val Glu Thr Trp Thr Glu
50 55 60
Ala Gly Gly Asp Ala Thr Lys Phe Thr Trp Phe Gly Pro Asn Gln Gly
65 70 75 80
Gly Gly Phe Ala Tyr Arg Ala Glu Trp Thr Asn Ser Thr Asp Tyr Leu
85 90 95
Gly Arg Phe Gly Tyr Phe Trp Gly Ile Asp Gly Lys Lys Trp Asp Lys
100 105 110
Leu Gly Asp Leu Cys Val Asp Tyr Asn Tyr Lys Arg Ser Ala Asn Gly
115 120 125
Thr Gly Gly Ser Tyr Ser Tyr Ile Gly Val Tyr Gly Trp Thr Asn Ala
130 135 140
Gly Gly Gly Thr Glu Ala Glu Tyr Tyr Ile Val Glu Asp Trp Phe Gly
145 150 155 160
Glu Asn Gln Gln Thr Ala Asn Asn Leu Gly Asn Gly Cys Gln Glu His
165 170 175
Gly Glu Ile Thr Val Asp Glu Lys Ser Tyr Lys Val Val Thr Cys Ile
180 185 190
Arg Pro Ala Gly Ser Gly Cys Val Thr Cys Asn Gly Gln Gln Phe Gly
195 200 205
Gln Val Phe Ser Ile Arg Gln Gly Met Arg Ser Glu Gln Pro Lys Thr
210 215 220
Cys Gly Thr Ile Ser Ile Lys Lys His Phe Glu Glu Trp Val Lys Met
225 230 235 240
Thr Thr Glu Lys Ser Gly Gln Ser Pro Ala Lys Tyr Ile Tyr Asp Lys
245 250 255
Thr Tyr Glu Ser Lys Phe Leu Ala Glu Ala Gln Gly Gly Thr Gly Trp
260 265 270
Leu Glu Thr Thr Phe Leu Lys Phe Ser Arg Asn Gly Asp Cys Gly Phe
275 280 285
Asp Ile Pro Asp Gly His Phe Thr Leu Gln Leu Ala Thr Ser Pro Ser
290 295 300
Glu Gly Gly Thr Val Ser Arg Asn Pro Lys Glu Ser Ser Tyr Ala Ser
305 310 315 320
Gly Ser Thr Val Thr Leu Thr Ala Thr Pro Ala Ala Gly Trp Lys Phe
325 330 335
Ala Ser Trp Ser Gly Asp Ala Cys Gln Thr Thr Ser Pro Leu Thr Val
340 345 350
Thr Met Asp Lys Asn Lys Val Ile Thr Ala Lys Phe Thr Pro Val Val
355 360 365
Asp Leu Asn Lys Asn Leu Val Thr Asn Gly Thr Phe Thr Asn Lys Glu
370 375 380
Ser Trp Thr Phe Asn Thr Gly Ser Ser Tyr Gly Asn Ser Glu Gly Thr
385 390 395 400
Phe Asp Val Ser Asn Ser Glu Gly Arg Ile Asn Val Thr Lys Ile Gly
405 410 415
Ser Asn Pro Trp Glu Pro Gln Leu Val Gln Asn Gly Ile Thr Leu Val
420 425 430
Glu Gly Met Asn Tyr Lys Ile Thr Phe Glu Ala Ser Ala Ser Ala Ala
435 440 445
Arg Lys Ile Gly Leu Val Ile Gln Met Ala Gly Gly Asp Tyr Thr Thr
450 455 460
Tyr Phe Glu Lys Asp Ile Asp Leu Thr Ala Ser Asn Gln Gln Phe Ser
465 470 475 480
Tyr Glu Phe Lys Met Asn Ala Pro Ser Asp Glu Ser Gly Arg Ile Gly
485 490 495
Phe Asn Leu Gly Gln Thr Thr Gly Asn Val Thr Leu Ser Lys Ile Thr
500 505 510
Leu His Tyr Leu Glu Glu Asp Ser His Glu Pro Ser Asp Asn Pro Cys
515 520 525
Glu Asp Pro Ser Pro Ile Leu Lys Lys Arg Ile Pro Ala Thr His Phe
530 535 540
Ser Leu Gln Thr Leu Ser Asp Lys Ala Leu Arg Ile Glu Val Asn Ala
545 550 555 560
Pro Thr Ile Val Asp Ile Phe Asp Leu Arg Gly Asn Lys Val Lys Ser
565 570 575
Leu Asn Val Ser Gly Ser Gln Thr Val Lys Leu Ser Leu Pro Ser Gly
580 585 590
Val Tyr Phe Ala Lys Ala Arg Gly Met Lys Ser Val Arg Phe Val Leu
595 600 605
Arg
<210> 311
<211> 3972
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 311
atgcggaaaa gagtaatagc tttatttgta actctcatct ttgtcatgtc tattttaagt 60
ccaggatatc ttccatttct gagtactaaa gcaaatgctc aaacacaaaa tacaccaaca 120
attttaaaat ttgattttga aagcggtaat caaggctgga cggggagagg tctttcaaca 180
actgttgcaa ccgtttacaa tgttgcttat gaaggtgatt attcattaaa agtttctggc 240
agaaatgctt catgggatgg agctgttatt gatttaacag acaagctttc ggcaaatgtg 300
agttatacag tttctctgtt tgttcgtcac agtgaccaaa aacctcaaag attttcagta 360
tatgcatatg taaaagattc agcaagtgaa aaatatattc cagttgtaga taaagttgca 420
gttcctaatt attggaagca actggttggt aaattcacaa tcaacacttc aaatccagtc 480
caaaagattc agctgcttgt ctgtgttcct acaaataaat cattggaatt ttttatcgat 540
agcgtattaa ttgcaagtag tgcaggagca acatctggag ttgtaaaatc cacaaatttt 600
gaaagcggta caacagaagg ctggcaagca aggggaacag gttctgttgc tcagattagt 660
gttgtttcta cagtagctca ttcaggtagt aaaagtttgt atgtgacagg gcgagttcaa 720
acgtggcaag gtgcacaaat agatttgaca agtttgttag agaagggtaa agaatatcag 780
ttttctgtgt gggtatatca ggatagtgga agcgaccaaa agctgacact gaccatggaa 840
aggaaaaatg cagatggaag tacaaattat gatacaataa aatggcagca aacagtttca 900
agcaatacat gggtagagct aacaggttca tatacagtac ctgcaacagc aacacaacta 960
atattctaca ttgaatcacc caatgctacc ctaagctttt atattgatga ttttactgct 1020
gttgataaaa atgcaccagt tgtagcgcct ggaattataa aatcagccac atttgaaagc 1080
ggtacaacag aagactggca agcaagaggg acaggagtga ccgtttctgt tgttaacaca 1140
gtggcacata ctgggagcaa gagtttgtat gtgacaggga gaagtcaaaa ttggcatggt 1200
gcagaaattg atctgacaaa tgtgctagag aagggcaagg aatatcaatt ttctgtgtgg 1260
gtatatcagg atagtggaag cgatcagaag ctgacattga ccatgcaaag gaaaaatgca 1320
gataacacaa cagattatga ttctataaaa tatcagcaga cagtagcaac aaatacatgg 1380
gtagagctaa caggttcata tacagtgccg acaacagcca cccagttaat tttatatgtt 1440
gaagctgcag atactaccct aagcttttat attgatgatt ttactgctgt tgataaaaac 1500
ccagaggtaa taccaacagt atcgagagta ccagaatggg aaattccttc actctttgag 1560
cagtatacga attatttcag cattggtgtg gcaataccat ataaagtact tacaaatcca 1620
accgaaaagg caatggtact caaacatttc aacagtataa cagctgagaa tgaaatgaaa 1680
cctgatgcta ttcaaaagac agaagggaat tttacattta atgttgcaga ccaatacgta 1740
gattttgcac agcaaaatag aattggaatc agaggtcaca ctcttgtttg gcatcagcaa 1800
acaccaaatt ggttcttcca gcatagtgat ggtactccgc ttgatccaag caatcctgct 1860
gacaaacaac ttctacgcga tagattaaga acgcatatcc aaacacttgt tggaagatac 1920
gcagggaaaa tttatgcatg ggatgttgta aacgaggcaa ttgacgagaa ccagccagat 1980
ggatacagaa gaagtgaatg gtacagaata ttggggccaa ctgatacaac agatggcatt 2040
ccagaatata ttctgcttgc attccagtat gcaagagagg cagacccaaa tactaagctc 2100
ttttataacg actataatac agaaaatcca aagaaaagac agtttatata caatcttgtt 2160
aagaagctca aagaaagagg cttgattgat ggtgtaggtc tgcagtgcca tattaatgtc 2220
gattcaccta cagttaaaga gatagaggat acaattaaac tgtttagtac aatccctggc 2280
ttagacattc acattacaga gcttgacatt agcgtttata caagcagcag ccagagatat 2340
gatactcttc cacaggatat aatgataaaa caggctttga agttcaaaga gctttttgag 2400
atgctaaaaa gatatagcta tgttgtcaca aacgttactt tctggggact caaagatgac 2460
tattcatggc tttcaacaag cagatctaac tggccactac tgtttgacaa caactaccag 2520
gcaaaatttg catactgggc aattgttgaa ccgtcagtat tgccacttgc tataaacaaa 2580
ggatatgcaa acaatgcatc agcaaggata gatggagttt tagacagaga atacaaaggt 2640
gcgattccaa ttaagattac aaatgaaagt ggacaagaag ttgcaactgt tcgagctcta 2700
tggaattcaa gtgaactcag cctctatata tcggtcaatg atacaacaat agatgctgct 2760
aatgataaag tagttgtatt tgtagaccag gataatggaa aaatgccaga aattaaacct 2820
gatgactatt gggtttcaat tacgagaact ggtacaaaag cacaatcagc tcaaggctat 2880
gtaaaggatt atgctgtcgt gcagcaagca aatggatatg tggttgagtt gaagctttta 2940
attaataaca cgttaactgt taactcttct ataggttttg atatagcaat ctttgacaat 3000
ggagttcaat acagctggaa tgacaagaca aactcacagt ttatagaaac tgataactat 3060
ggtattttaa caatggcaga tagcgtcaag tttgcttctg ctccaaaagg tacagcaata 3120
attgatgcag aattagatga tacatggaaa aacgctcagg aaataacaac tgacacaaag 3180
gtcacggtta caggcacagt atacgactca gcttatgcaa aggctaagat gatgtgggat 3240
gaaaatagta tctatgtcta tgcaattgtt tatgacttgc ttttgaacaa ggctaataca 3300
aatccatggg agcaggattc aattgagata tttgtggatg aaaataatca caaaacgcct 3360
tactatgaaa atgatgatgt tcagtacaga gtgaactatg agaatactca aacatttggc 3420
acgaacggtg ctcctcagaa cttcattaca gcaacaaaga taattccaaa cggatatata 3480
gtggaagctc aagtttacat gaggacgaca aagctttctg aaggaatggt tataggcttt 3540
gacattcaag tgaatgatgc agaccataca ggtaaaagag tcggtgttct aacctggaat 3600
gataaggttg ggaacaatta tagagacaca acaaggttta gatgcttaga gcttgtagca 3660
gcacctgtaa gccagccacc aatacaagct ccatcaccat cacaaccaac aacaataacg 3720
tatatactaa caccgacacc aacacagcca tcaacccaaa cacagcagca acctgctcag 3780
caaccatcac agcagcaaca gcaaccgcaa cagcagcagc ctgcacagac acaacaacct 3840
cagacacagc ctgcacaaaa gcctcagaat gttgtttcga taaagataga ccagacaaaa 3900
gctgagacat ttactgttgg cgctgatacc aaggttgttg tacctcaagg ttctgtaact 3960
ggtgcaaact ga 3972
<210> 312
<211> 1323
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(33)
<400> 312
Met Arg Lys Arg Val Ile Ala Leu Phe Val Thr Leu Ile Phe Val Met
1 5 10 15
Ser Ile Leu Ser Pro Gly Tyr Leu Pro Phe Leu Ser Thr Lys Ala Asn
20 25 30
Ala Gln Thr Gln Asn Thr Pro Thr Ile Leu Lys Phe Asp Phe Glu Ser
35 40 45
Gly Asn Gln Gly Trp Thr Gly Arg Gly Leu Ser Thr Thr Val Ala Thr
50 55 60
Val Tyr Asn Val Ala Tyr Glu Gly Asp Tyr Ser Leu Lys Val Ser Gly
65 70 75 80
Arg Asn Ala Ser Trp Asp Gly Ala Val Ile Asp Leu Thr Asp Lys Leu
85 90 95
Ser Ala Asn Val Ser Tyr Thr Val Ser Leu Phe Val Arg His Ser Asp
100 105 110
Gln Lys Pro Gln Arg Phe Ser Val Tyr Ala Tyr Val Lys Asp Ser Ala
115 120 125
Ser Glu Lys Tyr Ile Pro Val Val Asp Lys Val Ala Val Pro Asn Tyr
130 135 140
Trp Lys Gln Leu Val Gly Lys Phe Thr Ile Asn Thr Ser Asn Pro Val
145 150 155 160
Gln Lys Ile Gln Leu Leu Val Cys Val Pro Thr Asn Lys Ser Leu Glu
165 170 175
Phe Phe Ile Asp Ser Val Leu Ile Ala Ser Ser Ala Gly Ala Thr Ser
180 185 190
Gly Val Val Lys Ser Thr Asn Phe Glu Ser Gly Thr Thr Glu Gly Trp
195 200 205
Gln Ala Arg Gly Thr Gly Ser Val Ala Gln Ile Ser Val Val Ser Thr
210 215 220
Val Ala His Ser Gly Ser Lys Ser Leu Tyr Val Thr Gly Arg Val Gln
225 230 235 240
Thr Trp Gln Gly Ala Gln Ile Asp Leu Thr Ser Leu Leu Glu Lys Gly
245 250 255
Lys Glu Tyr Gln Phe Ser Val Trp Val Tyr Gln Asp Ser Gly Ser Asp
260 265 270
Gln Lys Leu Thr Leu Thr Met Glu Arg Lys Asn Ala Asp Gly Ser Thr
275 280 285
Asn Tyr Asp Thr Ile Lys Trp Gln Gln Thr Val Ser Ser Asn Thr Trp
290 295 300
Val Glu Leu Thr Gly Ser Tyr Thr Val Pro Ala Thr Ala Thr Gln Leu
305 310 315 320
Ile Phe Tyr Ile Glu Ser Pro Asn Ala Thr Leu Ser Phe Tyr Ile Asp
325 330 335
Asp Phe Thr Ala Val Asp Lys Asn Ala Pro Val Val Ala Pro Gly Ile
340 345 350
Ile Lys Ser Ala Thr Phe Glu Ser Gly Thr Thr Glu Asp Trp Gln Ala
355 360 365
Arg Gly Thr Gly Val Thr Val Ser Val Val Asn Thr Val Ala His Thr
370 375 380
Gly Ser Lys Ser Leu Tyr Val Thr Gly Arg Ser Gln Asn Trp His Gly
385 390 395 400
Ala Glu Ile Asp Leu Thr Asn Val Leu Glu Lys Gly Lys Glu Tyr Gln
405 410 415
Phe Ser Val Trp Val Tyr Gln Asp Ser Gly Ser Asp Gln Lys Leu Thr
420 425 430
Leu Thr Met Gln Arg Lys Asn Ala Asp Asn Thr Thr Asp Tyr Asp Ser
435 440 445
Ile Lys Tyr Gln Gln Thr Val Ala Thr Asn Thr Trp Val Glu Leu Thr
450 455 460
Gly Ser Tyr Thr Val Pro Thr Thr Ala Thr Gln Leu Ile Leu Tyr Val
465 470 475 480
Glu Ala Ala Asp Thr Thr Leu Ser Phe Tyr Ile Asp Asp Phe Thr Ala
485 490 495
Val Asp Lys Asn Pro Glu Val Ile Pro Thr Val Ser Arg Val Pro Glu
500 505 510
Trp Glu Ile Pro Ser Leu Phe Glu Gln Tyr Thr Asn Tyr Phe Ser Ile
515 520 525
Gly Val Ala Ile Pro Tyr Lys Val Leu Thr Asn Pro Thr Glu Lys Ala
530 535 540
Met Val Leu Lys His Phe Asn Ser Ile Thr Ala Glu Asn Glu Met Lys
545 550 555 560
Pro Asp Ala Ile Gln Lys Thr Glu Gly Asn Phe Thr Phe Asn Val Ala
565 570 575
Asp Gln Tyr Val Asp Phe Ala Gln Gln Asn Arg Ile Gly Ile Arg Gly
580 585 590
His Thr Leu Val Trp His Gln Gln Thr Pro Asn Trp Phe Phe Gln His
595 600 605
Ser Asp Gly Thr Pro Leu Asp Pro Ser Asn Pro Ala Asp Lys Gln Leu
610 615 620
Leu Arg Asp Arg Leu Arg Thr His Ile Gln Thr Leu Val Gly Arg Tyr
625 630 635 640
Ala Gly Lys Ile Tyr Ala Trp Asp Val Val Asn Glu Ala Ile Asp Glu
645 650 655
Asn Gln Pro Asp Gly Tyr Arg Arg Ser Glu Trp Tyr Arg Ile Leu Gly
660 665 670
Pro Thr Asp Thr Thr Asp Gly Ile Pro Glu Tyr Ile Leu Leu Ala Phe
675 680 685
Gln Tyr Ala Arg Glu Ala Asp Pro Asn Thr Lys Leu Phe Tyr Asn Asp
690 695 700
Tyr Asn Thr Glu Asn Pro Lys Lys Arg Gln Phe Ile Tyr Asn Leu Val
705 710 715 720
Lys Lys Leu Lys Glu Arg Gly Leu Ile Asp Gly Val Gly Leu Gln Cys
725 730 735
His Ile Asn Val Asp Ser Pro Thr Val Lys Glu Ile Glu Asp Thr Ile
740 745 750
Lys Leu Phe Ser Thr Ile Pro Gly Leu Asp Ile His Ile Thr Glu Leu
755 760 765
Asp Ile Ser Val Tyr Thr Ser Ser Ser Gln Arg Tyr Asp Thr Leu Pro
770 775 780
Gln Asp Ile Met Ile Lys Gln Ala Leu Lys Phe Lys Glu Leu Phe Glu
785 790 795 800
Met Leu Lys Arg Tyr Ser Tyr Val Val Thr Asn Val Thr Phe Trp Gly
805 810 815
Leu Lys Asp Asp Tyr Ser Trp Leu Ser Thr Ser Arg Ser Asn Trp Pro
820 825 830
Leu Leu Phe Asp Asn Asn Tyr Gln Ala Lys Phe Ala Tyr Trp Ala Ile
835 840 845
Val Glu Pro Ser Val Leu Pro Leu Ala Ile Asn Lys Gly Tyr Ala Asn
850 855 860
Asn Ala Ser Ala Arg Ile Asp Gly Val Leu Asp Arg Glu Tyr Lys Gly
865 870 875 880
Ala Ile Pro Ile Lys Ile Thr Asn Glu Ser Gly Gln Glu Val Ala Thr
885 890 895
Val Arg Ala Leu Trp Asn Ser Ser Glu Leu Ser Leu Tyr Ile Ser Val
900 905 910
Asn Asp Thr Thr Ile Asp Ala Ala Asn Asp Lys Val Val Val Phe Val
915 920 925
Asp Gln Asp Asn Gly Lys Met Pro Glu Ile Lys Pro Asp Asp Tyr Trp
930 935 940
Val Ser Ile Thr Arg Thr Gly Thr Lys Ala Gln Ser Ala Gln Gly Tyr
945 950 955 960
Val Lys Asp Tyr Ala Val Val Gln Gln Ala Asn Gly Tyr Val Val Glu
965 970 975
Leu Lys Leu Leu Ile Asn Asn Thr Leu Thr Val Asn Ser Ser Ile Gly
980 985 990
Phe Asp Ile Ala Ile Phe Asp Asn Gly Val Gln Tyr Ser Trp Asn Asp
995 1000 1005
Lys Thr Asn Ser Gln Phe Ile Glu Thr Asp Asn Tyr Gly Ile Leu Thr
1010 1015 1020
Met Ala Asp Ser Val Lys Phe Ala Ser Ala Pro Lys Gly Thr Ala Ile
1025 1030 1035 1040
Ile Asp Ala Glu Leu Asp Asp Thr Trp Lys Asn Ala Gln Glu Ile Thr
1045 1050 1055
Thr Asp Thr Lys Val Thr Val Thr Gly Thr Val Tyr Asp Ser Ala Tyr
1060 1065 1070
Ala Lys Ala Lys Met Met Trp Asp Glu Asn Ser Ile Tyr Val Tyr Ala
1075 1080 1085
Ile Val Tyr Asp Leu Leu Leu Asn Lys Ala Asn Thr Asn Pro Trp Glu
1090 1095 1100
Gln Asp Ser Ile Glu Ile Phe Val Asp Glu Asn Asn His Lys Thr Pro
1105 1110 1115 1120
Tyr Tyr Glu Asn Asp Asp Val Gln Tyr Arg Val Asn Tyr Glu Asn Thr
1125 1130 1135
Gln Thr Phe Gly Thr Asn Gly Ala Pro Gln Asn Phe Ile Thr Ala Thr
1140 1145 1150
Lys Ile Ile Pro Asn Gly Tyr Ile Val Glu Ala Gln Val Tyr Met Arg
1155 1160 1165
Thr Thr Lys Leu Ser Glu Gly Met Val Ile Gly Phe Asp Ile Gln Val
1170 1175 1180
Asn Asp Ala Asp His Thr Gly Lys Arg Val Gly Val Leu Thr Trp Asn
1185 1190 1195 1200
Asp Lys Val Gly Asn Asn Tyr Arg Asp Thr Thr Arg Phe Arg Cys Leu
1205 1210 1215
Glu Leu Val Ala Ala Pro Val Ser Gln Pro Pro Ile Gln Ala Pro Ser
1220 1225 1230
Pro Ser Gln Pro Thr Thr Ile Thr Tyr Ile Leu Thr Pro Thr Pro Thr
1235 1240 1245
Gln Pro Ser Thr Gln Thr Gln Gln Gln Pro Ala Gln Gln Pro Ser Gln
1250 1255 1260
Gln Gln Gln Gln Pro Gln Gln Gln Gln Pro Ala Gln Thr Gln Gln Pro
1265 1270 1275 1280
Gln Thr Gln Pro Ala Gln Lys Pro Gln Asn Val Val Ser Ile Lys Ile
1285 1290 1295
Asp Gln Thr Lys Ala Glu Thr Phe Thr Val Gly Ala Asp Thr Lys Val
1300 1305 1310
Val Val Pro Gln Gly Ser Val Thr Gly Ala Asn
1315 1320
<210> 313
<211> 1392
<212> DNA
<213> Bacteria
<400> 313
gtgaaacgtc tatccgcgct gaccgccgtc gtattgttag cgctaacaac tcacgtcgcc 60
gccgctgacc ccgcgccacc cgccaccggc cccgccatcg acttccgggc cgaactccag 120
cccatcgacg gattcggctt ctccatggcc ttccagcggg ccgacctgct gcacggcgcg 180
cgcggcctca gccccgccaa gcggcgcgag gtgctcgacc tgctgctcga caaggagagg 240
ggcgcgggcc tgtcgatcct gcgcctgggc atcgggtcgt cgaccgaccg ggtctacgac 300
cacatgccga cgatcctgcc gaccgatccc ggcgggccgg acgccccgcc gaagtacgtc 360
tgggacggct gggacggcgg ccaggtctgg ctcgccaagg aggccaaggc gtacggcgtc 420
aagcggttct tcgccgacgc ctggagcgcg ccggccttca tgaagaccaa cggcagcgag 480
aacgacggcg gcgagctccg gcccgaatgg cgccaggcct acgcgaacta cctcgtcaag 540
tacgcgaagt tctaccaacg ggaaggcatc ccgatcaccg acctggggtt caccaacgaa 600
cccgactggg cggcgaccta cgcctcgatg cgtttcaccc cgcagcaggc cgtcgacttc 660
ctcaaggtgc tcgggccgac cgtccgcgcg tccggactga agaccggcgt cgtctgctgc 720
gacgcggcgg gctgggaccg gcaggtcgcc tacaccgagg ccatcgaggc ggaccccgag 780
gccgccaagg ccgtgcggac cgtcaccggc caccgctaca gcggtccgac cacggtcccg 840
cagcccaccg acaagcgggt ctggatgtcg gagtggtcac cggacggcac cacctggaac 900
gagaactggg acgacggcag cggctacgac ggcctcaccg tcgccgccga catccagaac 960
accctcaccg tcggcaacgc caacgcctac gtctactgga ccggcgcgtc cctcggcgcc 1020
acccggggac tcatccagct cgccaacccc ggcgactcct accgggtgtc caagcggtac 1080
tgggcgctgg ccgccttcag ccgcttcatc cgccccgacg ccgtccgcgt accggtcacg 1140
aacgccgacc cggccctgag cgtcacggcc ttccgcaaca ccgacggcag ccgcgtgatc 1200
gagatcctca acacggcgac caccgagaag tccgcccagt tcgccctccg cggcggccac 1260
gaccggcacc ccgagggcta cgtcaccgac gagacccgct cgatcacccc ggcccacgtc 1320
gcctccgcgc gcggtacgac cctcaaggcc acgctcgccc cgcgcgcgct gaccacgatc 1380
gtcctcgact ga 1392
<210> 314
<211> 463
<212> PRT
<213> Bacteria
<220>
<221> SIGNAL
<222> (1)...(22)
<400> 314
Met Lys Arg Leu Ser Ala Leu Thr Ala Val Val Leu Leu Ala Leu Thr
1 5 10 15
Thr His Val Ala Ala Ala Asp Pro Ala Pro Pro Ala Thr Gly Pro Ala
20 25 30
Ile Asp Phe Arg Ala Glu Leu Gln Pro Ile Asp Gly Phe Gly Phe Ser
35 40 45
Met Ala Phe Gln Arg Ala Asp Leu Leu His Gly Ala Arg Gly Leu Ser
50 55 60
Pro Ala Lys Arg Arg Glu Val Leu Asp Leu Leu Leu Asp Lys Glu Arg
65 70 75 80
Gly Ala Gly Leu Ser Ile Leu Arg Leu Gly Ile Gly Ser Ser Thr Asp
85 90 95
Arg Val Tyr Asp His Met Pro Thr Ile Leu Pro Thr Asp Pro Gly Gly
100 105 110
Pro Asp Ala Pro Pro Lys Tyr Val Trp Asp Gly Trp Asp Gly Gly Gln
115 120 125
Val Trp Leu Ala Lys Glu Ala Lys Ala Tyr Gly Val Lys Arg Phe Phe
130 135 140
Ala Asp Ala Trp Ser Ala Pro Ala Phe Met Lys Thr Asn Gly Ser Glu
145 150 155 160
Asn Asp Gly Gly Glu Leu Arg Pro Glu Trp Arg Gln Ala Tyr Ala Asn
165 170 175
Tyr Leu Val Lys Tyr Ala Lys Phe Tyr Gln Arg Glu Gly Ile Pro Ile
180 185 190
Thr Asp Leu Gly Phe Thr Asn Glu Pro Asp Trp Ala Ala Thr Tyr Ala
195 200 205
Ser Met Arg Phe Thr Pro Gln Gln Ala Val Asp Phe Leu Lys Val Leu
210 215 220
Gly Pro Thr Val Arg Ala Ser Gly Leu Lys Thr Gly Val Val Cys Cys
225 230 235 240
Asp Ala Ala Gly Trp Asp Arg Gln Val Ala Tyr Thr Glu Ala Ile Glu
245 250 255
Ala Asp Pro Glu Ala Ala Lys Ala Val Arg Thr Val Thr Gly His Arg
260 265 270
Tyr Ser Gly Pro Thr Thr Val Pro Gln Pro Thr Asp Lys Arg Val Trp
275 280 285
Met Ser Glu Trp Ser Pro Asp Gly Thr Thr Trp Asn Glu Asn Trp Asp
290 295 300
Asp Gly Ser Gly Tyr Asp Gly Leu Thr Val Ala Ala Asp Ile Gln Asn
305 310 315 320
Thr Leu Thr Val Gly Asn Ala Asn Ala Tyr Val Tyr Trp Thr Gly Ala
325 330 335
Ser Leu Gly Ala Thr Arg Gly Leu Ile Gln Leu Ala Asn Pro Gly Asp
340 345 350
Ser Tyr Arg Val Ser Lys Arg Tyr Trp Ala Leu Ala Ala Phe Ser Arg
355 360 365
Phe Ile Arg Pro Asp Ala Val Arg Val Pro Val Thr Asn Ala Asp Pro
370 375 380
Ala Leu Ser Val Thr Ala Phe Arg Asn Thr Asp Gly Ser Arg Val Ile
385 390 395 400
Glu Ile Leu Asn Thr Ala Thr Thr Glu Lys Ser Ala Gln Phe Ala Leu
405 410 415
Arg Gly Gly His Asp Arg His Pro Glu Gly Tyr Val Thr Asp Glu Thr
420 425 430
Arg Ser Ile Thr Pro Ala His Val Ala Ser Ala Arg Gly Thr Thr Leu
435 440 445
Lys Ala Thr Leu Ala Pro Arg Ala Leu Thr Thr Ile Val Leu Asp
450 455 460
<210> 315
<211> 1224
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 315
atgcggaacg tcgtgcgtaa accattgaca atcggactcg ctttaacact attattgccc 60
atgggaatga cggcaacatc agcgaagaat gcagattcct atgcgaaaaa acctcacatc 120
agcgcattga atgccccaca attggatcaa cgctacaaaa acgagttcac gattggtgcg 180
gcagtagaac cttatcaact acaaaatgaa aaagacgtac aaatgctaaa gcgccacttc 240
aacagcattg ttgccgagaa cgtaatgaaa ccgatcagca ttcaacctga ggaaggaaaa 300
ttcaattttg aacaagcgga tcgaattgtg aagttcgcta aggcaaatgg catggatatt 360
cgcttccata cactcgtttg gcacagccaa gtacctcaat ggttctttct tgacaaggaa 420
ggcaagccaa tggttaatga aacagatcca gtgaaacgtg aacaaaataa acaactgctg 480
ttaaaacgac ttgaaactca tattaaaacg atcgtcgagc ggtacaaaga tgacattaag 540
tactgggacg ttgtaaatga ggttgtgggg gacgacggaa aactgcgcaa ctctccatgg 600
tatcaaatcg ccggcatcga ttatattaaa gtggcattcc aaacagcgag aaaatatggc 660
ggcaacaaga ttaaacttta tatcaatgat tacaataccg aagtggaacc aaagcgaagc 720
gctctttata acttggtgaa gcaattaaaa gaagagggcg ttcctattga cggcatcggc 780
catcaatccc acattcaaat cggctggcct tctgaagcag aaatcgagaa aacgattaac 840
atgttcgccg ctctcggctt agacaaccaa atcactgagc ttgatgtgag catgtacggt 900
tggccgccgc gcgcttaccc gacgtatgac gccattccaa aacaaaagtt tttggatcag 960
gcagcgcgct atgatcgttt gttcaaactg tatgaaaagt tgagcgataa aattagcaac 1020
gtcaccttct ggggcatcgc cgacaatcat acgtggctcg acagccgtgc ggatgtgtac 1080
tatgacgcca acgggaatgt tgtggttgac ccgaacgctc cgtacgcaaa agtggaaaaa 1140
gggaaaggaa aagatgcgcc gttcgttttt ggaccggatt acaaagtcaa acccgcatat 1200
tgggctatta tcgaccacaa atag 1224
<210> 316
<211> 407
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(28)
<400> 316
Met Arg Asn Val Val Arg Lys Pro Leu Thr Ile Gly Leu Ala Leu Thr
1 5 10 15
Leu Leu Leu Pro Met Gly Met Thr Ala Thr Ser Ala Lys Asn Ala Asp
20 25 30
Ser Tyr Ala Lys Lys Pro His Ile Ser Ala Leu Asn Ala Pro Gln Leu
35 40 45
Asp Gln Arg Tyr Lys Asn Glu Phe Thr Ile Gly Ala Ala Val Glu Pro
50 55 60
Tyr Gln Leu Gln Asn Glu Lys Asp Val Gln Met Leu Lys Arg His Phe
65 70 75 80
Asn Ser Ile Val Ala Glu Asn Val Met Lys Pro Ile Ser Ile Gln Pro
85 90 95
Glu Glu Gly Lys Phe Asn Phe Glu Gln Ala Asp Arg Ile Val Lys Phe
100 105 110
Ala Lys Ala Asn Gly Met Asp Ile Arg Phe His Thr Leu Val Trp His
115 120 125
Ser Gln Val Pro Gln Trp Phe Phe Leu Asp Lys Glu Gly Lys Pro Met
130 135 140
Val Asn Glu Thr Asp Pro Val Lys Arg Glu Gln Asn Lys Gln Leu Leu
145 150 155 160
Leu Lys Arg Leu Glu Thr His Ile Lys Thr Ile Val Glu Arg Tyr Lys
165 170 175
Asp Asp Ile Lys Tyr Trp Asp Val Val Asn Glu Val Val Gly Asp Asp
180 185 190
Gly Lys Leu Arg Asn Ser Pro Trp Tyr Gln Ile Ala Gly Ile Asp Tyr
195 200 205
Ile Lys Val Ala Phe Gln Thr Ala Arg Lys Tyr Gly Gly Asn Lys Ile
210 215 220
Lys Leu Tyr Ile Asn Asp Tyr Asn Thr Glu Val Glu Pro Lys Arg Ser
225 230 235 240
Ala Leu Tyr Asn Leu Val Lys Gln Leu Lys Glu Glu Gly Val Pro Ile
245 250 255
Asp Gly Ile Gly His Gln Ser His Ile Gln Ile Gly Trp Pro Ser Glu
260 265 270
Ala Glu Ile Glu Lys Thr Ile Asn Met Phe Ala Ala Leu Gly Leu Asp
275 280 285
Asn Gln Ile Thr Glu Leu Asp Val Ser Met Tyr Gly Trp Pro Pro Arg
290 295 300
Ala Tyr Pro Thr Tyr Asp Ala Ile Pro Lys Gln Lys Phe Leu Asp Gln
305 310 315 320
Ala Ala Arg Tyr Asp Arg Leu Phe Lys Leu Tyr Glu Lys Leu Ser Asp
325 330 335
Lys Ile Ser Asn Val Thr Phe Trp Gly Ile Ala Asp Asn His Thr Trp
340 345 350
Leu Asp Ser Arg Ala Asp Val Tyr Tyr Asp Ala Asn Gly Asn Val Val
355 360 365
Val Asp Pro Asn Ala Pro Tyr Ala Lys Val Glu Lys Gly Lys Gly Lys
370 375 380
Asp Ala Pro Phe Val Phe Gly Pro Asp Tyr Lys Val Lys Pro Ala Tyr
385 390 395 400
Trp Ala Ile Ile Asp His Lys
405
<210> 317
<211> 1695
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 317
gtggctggaa gctcgctcac gagcaacggc ctctcggcca ttctctcgct ccagtcggac 60
tggggcagcg gttactgcgc gacggtagaa cttcagaacg tcggcggaac tccgatcacg 120
gcgtgggagg tccaggtgga gctcgctggg acgaccgtga acagcagcca cagcgcggcg 180
ttctcctcga caggcacccg cctggtcgcc aagcccttgt cctggaacgc gacgctggca 240
cccgccgcca agacgacctt cggcttctgc gcggccgctc cgagcgcagc ggcgcgcccg 300
tccgtggtgc aagtgacagc gaacggctcc gccaccggaa cgggcggaac gagcggcggc 360
ggcacgggcg gctcgaccgc tacgggcggc tcgaccgcta cgggcggctc cggtgggtcg 420
accgcgggag tgtgcgcggc aacctacgag gccgagagca tgctccacag caccggcaac 480
gccatcagcg gcggctggaa catctattcg aacggcaaca tcaccgccac gcactccttc 540
gcagccggct cgaatcgact caccgtgcac gccaagggcg accaggccaa cggggcgccc 600
atcatgcgcg tcagcgtggg caacaccgtc gtcggcgagg tgccagtgcc ggtgaccgtg 660
tggacaccgt actgcttcga ctacgccgcg gcgagcgcag gcgcgcagac cgtcaagatc 720
gagttcacga acgactacaa tggcggcacc ggcgccgacc gcaatctgca cgtggacaag 780
gtcgcggtgc agtgcggcgc gagctgcaac agcgggagcg gagggggcac cggcggctcg 840
agcggaagcg gcggcacctc ggccaccggc ggctccgcca gcggtggcgc ggcagggacg 900
acctgcacga acgttcgtcc cactggaacc gactgggacg cggcgacctg cgacatgtgg 960
gcctcgcaaa ctagcgagtg cagcgcggcc tggatgatcg acaaccatta ctgcgaccag 1020
agctgcgggc gctgctcggg cgggagcggg accggtggca cgaacacggg aggcaccggc 1080
ggtggagtga ccccgagtac ctgcacggag cccaattctc agcagtgctc cacctacaag 1140
gtcgggactc actgcggcct cacctacgag atctggaccg acggctccgc gggctgcatg 1200
acgaacacct cctacgggtt cctcgccaat tggagccagg ggaacgcaaa ctacctggct 1260
cgcaagggcg ttcggcccgg ctcgtcgcga ccggtcgtga cgtacagcgc gaactaccag 1320
ccgaacggga attcctacct ggggatctac ggttggacgc agaacccgct cgtcgagtac 1380
tacatcatcg atagctgggg gagctggcgt ccaccgggga cccaggcgat gggcaccgtc 1440
caggtggacg gcgggaccta cgatatctac cggagcgagc gggtgaacaa gccctcgatc 1500
gagggcaaca agaccttctg gcagtactgg agcgtccgca cccagaagcg caccagtggg 1560
accatcaccg tggctccgca cttcgccgcg tgggcggcat ccggactgca gatgggctcc 1620
ttctacgagg tctccctggt ggtggagggc tacaacagct ccggcagcgc cgacgtaacg 1680
gtgtcgttcc ggtag 1695
<210> 318
<211> 564
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 318
Met Ala Gly Ser Ser Leu Thr Ser Asn Gly Leu Ser Ala Ile Leu Ser
1 5 10 15
Leu Gln Ser Asp Trp Gly Ser Gly Tyr Cys Ala Thr Val Glu Leu Gln
20 25 30
Asn Val Gly Gly Thr Pro Ile Thr Ala Trp Glu Val Gln Val Glu Leu
35 40 45
Ala Gly Thr Thr Val Asn Ser Ser His Ser Ala Ala Phe Ser Ser Thr
50 55 60
Gly Thr Arg Leu Val Ala Lys Pro Leu Ser Trp Asn Ala Thr Leu Ala
65 70 75 80
Pro Ala Ala Lys Thr Thr Phe Gly Phe Cys Ala Ala Ala Pro Ser Ala
85 90 95
Ala Ala Arg Pro Ser Val Val Gln Val Thr Ala Asn Gly Ser Ala Thr
100 105 110
Gly Thr Gly Gly Thr Ser Gly Gly Gly Thr Gly Gly Ser Thr Ala Thr
115 120 125
Gly Gly Ser Thr Ala Thr Gly Gly Ser Gly Gly Ser Thr Ala Gly Val
130 135 140
Cys Ala Ala Thr Tyr Glu Ala Glu Ser Met Leu His Ser Thr Gly Asn
145 150 155 160
Ala Ile Ser Gly Gly Trp Asn Ile Tyr Ser Asn Gly Asn Ile Thr Ala
165 170 175
Thr His Ser Phe Ala Ala Gly Ser Asn Arg Leu Thr Val His Ala Lys
180 185 190
Gly Asp Gln Ala Asn Gly Ala Pro Ile Met Arg Val Ser Val Gly Asn
195 200 205
Thr Val Val Gly Glu Val Pro Val Pro Val Thr Val Trp Thr Pro Tyr
210 215 220
Cys Phe Asp Tyr Ala Ala Ala Ser Ala Gly Ala Gln Thr Val Lys Ile
225 230 235 240
Glu Phe Thr Asn Asp Tyr Asn Gly Gly Thr Gly Ala Asp Arg Asn Leu
245 250 255
His Val Asp Lys Val Ala Val Gln Cys Gly Ala Ser Cys Asn Ser Gly
260 265 270
Ser Gly Gly Gly Thr Gly Gly Ser Ser Gly Ser Gly Gly Thr Ser Ala
275 280 285
Thr Gly Gly Ser Ala Ser Gly Gly Ala Ala Gly Thr Thr Cys Thr Asn
290 295 300
Val Arg Pro Thr Gly Thr Asp Trp Asp Ala Ala Thr Cys Asp Met Trp
305 310 315 320
Ala Ser Gln Thr Ser Glu Cys Ser Ala Ala Trp Met Ile Asp Asn His
325 330 335
Tyr Cys Asp Gln Ser Cys Gly Arg Cys Ser Gly Gly Ser Gly Thr Gly
340 345 350
Gly Thr Asn Thr Gly Gly Thr Gly Gly Gly Val Thr Pro Ser Thr Cys
355 360 365
Thr Glu Pro Asn Ser Gln Gln Cys Ser Thr Tyr Lys Val Gly Thr His
370 375 380
Cys Gly Leu Thr Tyr Glu Ile Trp Thr Asp Gly Ser Ala Gly Cys Met
385 390 395 400
Thr Asn Thr Ser Tyr Gly Phe Leu Ala Asn Trp Ser Gln Gly Asn Ala
405 410 415
Asn Tyr Leu Ala Arg Lys Gly Val Arg Pro Gly Ser Ser Arg Pro Val
420 425 430
Val Thr Tyr Ser Ala Asn Tyr Gln Pro Asn Gly Asn Ser Tyr Leu Gly
435 440 445
Ile Tyr Gly Trp Thr Gln Asn Pro Leu Val Glu Tyr Tyr Ile Ile Asp
450 455 460
Ser Trp Gly Ser Trp Arg Pro Pro Gly Thr Gln Ala Met Gly Thr Val
465 470 475 480
Gln Val Asp Gly Gly Thr Tyr Asp Ile Tyr Arg Ser Glu Arg Val Asn
485 490 495
Lys Pro Ser Ile Glu Gly Asn Lys Thr Phe Trp Gln Tyr Trp Ser Val
500 505 510
Arg Thr Gln Lys Arg Thr Ser Gly Thr Ile Thr Val Ala Pro His Phe
515 520 525
Ala Ala Trp Ala Ala Ser Gly Leu Gln Met Gly Ser Phe Tyr Glu Val
530 535 540
Ser Leu Val Val Glu Gly Tyr Asn Ser Ser Gly Ser Ala Asp Val Thr
545 550 555 560
Val Ser Phe Arg
<210> 319
<211> 1095
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 319
atgaaggtga cccgaacagc tgtcgcgggc attgtcgccg cagcggtcct catcacgatc 60
ggcacgtcga ccgcgtcggc tgaggatgaa ccaaccagcg agaacacgtc gacggatcag 120
ccgttgcgcg tcctggcagc caaagccggg atcgcgttcg gcacggccgt cgacatgaac 180
gcgtacaaca acgacgcgac ctaccgtgag ctcgtcggcc aggagttctc gagcgtcacg 240
gccgagaacg tcatgaagtg gcagctcctc gagccgcagc gaggggtcta caactggggt 300
ccggccgatc agctcgtgcg cgtagccaac gagaacggcc agaaggtgcg cgggcacacg 360
ctcatctggc acaaccagct gcccacctgg cttaccagcg gagtcgcctc cggtgagatc 420
acaccggacg agctccggca gctcctgagg aaccacatct tcacggtgat gcgccacttc 480
aagggcgaga tccaccagtg ggatgtcgcc aacgaggtca tcgacgacag cggcaacctg 540
cgcaacacga tctggctgca gaacctgggt ccgagctaca tcgcggacgc gttccggtgg 600
gctcgcaagg ccgacccgga cgccgccctc tatctgaacg actacaacgt cgagggcccg 660
aacgccaagg ccgatgcgta ctacgccctg gtcaagcagc tcctcgccga cgacgtgccg 720
gtggacggct tcggaataca ggggcacctc ggtgtgcagt tcggcttctg gcccgcgagt 780
gcggtggccg acaacatggg gcgcttcgag gcactcggcc tgcagacggc ggtcaccgag 840
gcggatgtcc ggatgatcat gccgcccgac gaggacaagc tggccgcaca ggcacgtggc 900
tacagcacgt tggtccaggg ctgcctgatg gccaagcgtt gcaggtcgtt caccgtctgg 960
ggcttcaccg acaagtactc ctgggttccg ggcaccttcc ccggccaggg cgcggcgaac 1020
ctcctggccg aggacttcca gcccaagccg gcttactacg ccgtccagga tgacctcgcg 1080
cgcgccggac ggtag 1095
<210> 320
<211> 364
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(27)
<400> 320
Met Lys Val Thr Arg Thr Ala Val Ala Gly Ile Val Ala Ala Ala Val
1 5 10 15
Leu Ile Thr Ile Gly Thr Ser Thr Ala Ser Ala Glu Asp Glu Pro Thr
20 25 30
Ser Glu Asn Thr Ser Thr Asp Gln Pro Leu Arg Val Leu Ala Ala Lys
35 40 45
Ala Gly Ile Ala Phe Gly Thr Ala Val Asp Met Asn Ala Tyr Asn Asn
50 55 60
Asp Ala Thr Tyr Arg Glu Leu Val Gly Gln Glu Phe Ser Ser Val Thr
65 70 75 80
Ala Glu Asn Val Met Lys Trp Gln Leu Leu Glu Pro Gln Arg Gly Val
85 90 95
Tyr Asn Trp Gly Pro Ala Asp Gln Leu Val Arg Val Ala Asn Glu Asn
100 105 110
Gly Gln Lys Val Arg Gly His Thr Leu Ile Trp His Asn Gln Leu Pro
115 120 125
Thr Trp Leu Thr Ser Gly Val Ala Ser Gly Glu Ile Thr Pro Asp Glu
130 135 140
Leu Arg Gln Leu Leu Arg Asn His Ile Phe Thr Val Met Arg His Phe
145 150 155 160
Lys Gly Glu Ile His Gln Trp Asp Val Ala Asn Glu Val Ile Asp Asp
165 170 175
Ser Gly Asn Leu Arg Asn Thr Ile Trp Leu Gln Asn Leu Gly Pro Ser
180 185 190
Tyr Ile Ala Asp Ala Phe Arg Trp Ala Arg Lys Ala Asp Pro Asp Ala
195 200 205
Ala Leu Tyr Leu Asn Asp Tyr Asn Val Glu Gly Pro Asn Ala Lys Ala
210 215 220
Asp Ala Tyr Tyr Ala Leu Val Lys Gln Leu Leu Ala Asp Asp Val Pro
225 230 235 240
Val Asp Gly Phe Gly Ile Gln Gly His Leu Gly Val Gln Phe Gly Phe
245 250 255
Trp Pro Ala Ser Ala Val Ala Asp Asn Met Gly Arg Phe Glu Ala Leu
260 265 270
Gly Leu Gln Thr Ala Val Thr Glu Ala Asp Val Arg Met Ile Met Pro
275 280 285
Pro Asp Glu Asp Lys Leu Ala Ala Gln Ala Arg Gly Tyr Ser Thr Leu
290 295 300
Val Gln Gly Cys Leu Met Ala Lys Arg Cys Arg Ser Phe Thr Val Trp
305 310 315 320
Gly Phe Thr Asp Lys Tyr Ser Trp Val Pro Gly Thr Phe Pro Gly Gln
325 330 335
Gly Ala Ala Asn Leu Leu Ala Glu Asp Phe Gln Pro Lys Pro Ala Tyr
340 345 350
Tyr Ala Val Gln Asp Asp Leu Ala Arg Ala Gly Arg
355 360
<210> 321
<211> 1608
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 321
gtggactggt gggacgtgga tattttttcc gcgaaggaaa tcacccaccc gcaactggca 60
accttcctgg atgcctcacg agaccatcgc aagccggtca tgatcggcga gatgacccca 120
cgccacgtcg gcgtgatcga ggggcagaaa tgctgggatg aatggtttgg cccgatgatt 180
gatctgctca aacgtcgccc cgaaatcaag gccacggcct atatcaactg ggaatggcgc 240
gagtggtccg accgcctcgg cttccgctgg cacaactggg gcgacgcccg catcgagggc 300
aacgcccttg ttcgtgatcg ctgggtgcag gaactctccc accccatcta tctccacgcg 360
gcgcgcgacg gatcttgtcc gctgccgcca atcaccgccc tcccatccgc gaccccgtcg 420
ctccagaccg tgttccagga ccatttcctg atgggtgctg ccttgaatgt gaggcagttc 480
accgaaaacg acgcaaccaa gaccgctctc atcaagaagc aattcaacac catcacgccc 540
gagaatgttc tcaagtgggg gccggttcat cctgagccca accggttcaa cttcgaatcc 600
accgatcgtt acgtggactt tggtgtgaag aaccggatgt tcatcgtcgg ccacaccctc 660
gtctggcacc accagacacc cgcctgggtg tttcaagatt cccaaggcca gccgctcgac 720
cgggatggac tgctcaatcg cttgagcaac cacatccaca cggtggttgg acgctacaag 780
ggccgcatcc acgggtggga tatggtgaac gaggccttga acgatgacgg caccctccgc 840
cctagccaat ggcttaaaat catcggcccc gactacattg ccaaagcgtt tgcccttgcc 900
cacgccgccg accctgccgc tgaactgtat tacaacgatt acagtctcga tcatcccgcc 960
aagtgtgctg gtgcgatcgc gctggtgaag cagctccaga cgaatggcat atccattgcc 1020
gggattggca cgcagaccca cgtcggactc aacggacctt ccccccagtc ggtggatgat 1080
tcattgacgg cctttggcca gctcggcgtg aaggtcatgg ttaccgaact cgacgttgat 1140
gtgctgcccg ccgccagcca aaatcaaaac gcggatctca accagcccgc cttgtccaat 1200
cccgccctca atcccgccct caatccctat cccgatgggc tgccgcaagc cgtccaggac 1260
aaactggccg ctcgctatgc ggaactcttc gccgtgttcg tcaagcacgc cgacaaaatc 1320
agccgcgtca cgttctggtg cgtcaccgac ggcgactcct ggctgaacaa ctggcccgtg 1380
cgtggccgcg tcaactatcc gctgctgttc gaccgtgcca gccagcccaa gcccgccttc 1440
gatgcggtca ttcgcgtcgc caaggacccg ccgacggttt cgcacaatct caccccgctc 1500
cacgatgcgg cgcgggtcct ggtcaatccg cacaagggct ggtaccacca ctacccggac 1560
aatcacatca acaagtatga gatcgcccgc gatgccgacc tgacggaa 1608
<210> 322
<211> 536
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 322
Met Asp Trp Trp Asp Val Asp Ile Phe Ser Ala Lys Glu Ile Thr His
1 5 10 15
Pro Gln Leu Ala Thr Phe Leu Asp Ala Ser Arg Asp His Arg Lys Pro
20 25 30
Val Met Ile Gly Glu Met Thr Pro Arg His Val Gly Val Ile Glu Gly
35 40 45
Gln Lys Cys Trp Asp Glu Trp Phe Gly Pro Met Ile Asp Leu Leu Lys
50 55 60
Arg Arg Pro Glu Ile Lys Ala Thr Ala Tyr Ile Asn Trp Glu Trp Arg
65 70 75 80
Glu Trp Ser Asp Arg Leu Gly Phe Arg Trp His Asn Trp Gly Asp Ala
85 90 95
Arg Ile Glu Gly Asn Ala Leu Val Arg Asp Arg Trp Val Gln Glu Leu
100 105 110
Ser His Pro Ile Tyr Leu His Ala Ala Arg Asp Gly Ser Cys Pro Leu
115 120 125
Pro Pro Ile Thr Ala Leu Pro Ser Ala Thr Pro Ser Leu Gln Thr Val
130 135 140
Phe Gln Asp His Phe Leu Met Gly Ala Ala Leu Asn Val Arg Gln Phe
145 150 155 160
Thr Glu Asn Asp Ala Thr Lys Thr Ala Leu Ile Lys Lys Gln Phe Asn
165 170 175
Thr Ile Thr Pro Glu Asn Val Leu Lys Trp Gly Pro Val His Pro Glu
180 185 190
Pro Asn Arg Phe Asn Phe Glu Ser Thr Asp Arg Tyr Val Asp Phe Gly
195 200 205
Val Lys Asn Arg Met Phe Ile Val Gly His Thr Leu Val Trp His His
210 215 220
Gln Thr Pro Ala Trp Val Phe Gln Asp Ser Gln Gly Gln Pro Leu Asp
225 230 235 240
Arg Asp Gly Leu Leu Asn Arg Leu Ser Asn His Ile His Thr Val Val
245 250 255
Gly Arg Tyr Lys Gly Arg Ile His Gly Trp Asp Met Val Asn Glu Ala
260 265 270
Leu Asn Asp Asp Gly Thr Leu Arg Pro Ser Gln Trp Leu Lys Ile Ile
275 280 285
Gly Pro Asp Tyr Ile Ala Lys Ala Phe Ala Leu Ala His Ala Ala Asp
290 295 300
Pro Ala Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Leu Asp His Pro Ala
305 310 315 320
Lys Cys Ala Gly Ala Ile Ala Leu Val Lys Gln Leu Gln Thr Asn Gly
325 330 335
Ile Ser Ile Ala Gly Ile Gly Thr Gln Thr His Val Gly Leu Asn Gly
340 345 350
Pro Ser Pro Gln Ser Val Asp Asp Ser Leu Thr Ala Phe Gly Gln Leu
355 360 365
Gly Val Lys Val Met Val Thr Glu Leu Asp Val Asp Val Leu Pro Ala
370 375 380
Ala Ser Gln Asn Gln Asn Ala Asp Leu Asn Gln Pro Ala Leu Ser Asn
385 390 395 400
Pro Ala Leu Asn Pro Ala Leu Asn Pro Tyr Pro Asp Gly Leu Pro Gln
405 410 415
Ala Val Gln Asp Lys Leu Ala Ala Arg Tyr Ala Glu Leu Phe Ala Val
420 425 430
Phe Val Lys His Ala Asp Lys Ile Ser Arg Val Thr Phe Trp Cys Val
435 440 445
Thr Asp Gly Asp Ser Trp Leu Asn Asn Trp Pro Val Arg Gly Arg Val
450 455 460
Asn Tyr Pro Leu Leu Phe Asp Arg Ala Ser Gln Pro Lys Pro Ala Phe
465 470 475 480
Asp Ala Val Ile Arg Val Ala Lys Asp Pro Pro Thr Val Ser His Asn
485 490 495
Leu Thr Pro Leu His Asp Ala Ala Arg Val Leu Val Asn Pro His Lys
500 505 510
Gly Trp Tyr His His Tyr Pro Asp Asn His Ile Asn Lys Tyr Glu Ile
515 520 525
Ala Arg Asp Ala Asp Leu Thr Glu
530 535
<210> 323
<211> 2355
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 323
atgatgctca atgcccgttg tatccaactt atgaagttgt tgcttcgctc ttctctttat 60
cttaccgctg acaaattggc gcaatcattg aatgtatcca agcgaacgat ttattacgat 120
atacaaaaaa cgaatgaatg gttgcatcat gaagggctga agccgattca atatgcgcgc 180
gggctcggat ttcgcttgga tgatgaagtg aaacaagaaa taacaacaaa gtggaacaca 240
ttacaacctg cccgacatta cacatatcag tcatgggagc gaaaagcttg gattggttta 300
tggattttga ctcgcgttca tccactgtat ttgtctgatt ttttagagaa attacatgta 360
agcaggagca cgttgttaaa tgacataaag gaactgaaag aagattggca gtcatttcag 420
ttgcgattgt cattccatcg caaaaaaggg tatttttcat caggggaaga aatccaaaaa 480
aggaaattga tgattcgtta tattcatcaa atattagcgg cgatggatga ccagcatttc 540
gctgcagaat tgtcagctga gtgtcaatgg ccaatctttg attggatttg ccaattcgag 600
tctacttttt ctattcgcta taccggtgag gttattcaaa ctttacctat ttacctcgca 660
ttgttccaaa gacggtgggc tagaggcaaa tttgtgcaaa tggacgagca agaaaaagaa 720
gtgctaaggt caatgcggga ataccagatt gctgatcatc tcgttagacg aattgaaaac 780
gtttccgaaa tatctattcc cgatgacgag gtttgttatt tgacgaccca tttactcagt 840
tttcgagttg cagatgacaa gcaaatcgat cataacgatg acatcactac tttgaaacga 900
atcattcgac atatggtgga tgattttcaa acttatgcct gtgtacaatt caagcgtcgc 960
gaagagttgg aaaaaaattt attggttcat atgaagcctg cctattatcg actgaaatac 1020
ggttttcatc tgcaaaacga tctgaccgaa tcggtcaaag cgaactatca agatttattt 1080
accttaacga aaaaagtcgt ccatcattta gaaagtgtag ttggccagcc ggtcagcgac 1140
gatgaaattg cttatatcgc catgcatttt ggcggatggt tggacagaga gggggtgtcg 1200
gttccagtac ggaaaaaggt gttgatcgtc tgcgagagcg ggattggaac atcgcgaatg 1260
ttgcaaaaac aattggatca acgctacaaa aacgagttca cgattggtgc ggcagtagaa 1320
ccttatcaac tacaaaatga aaaagacgta caaatgctaa agcgccactt caacagcatt 1380
gttgccgaga acgtaatgaa accgatcagc attcaacctg aggaaggaaa attcaatttt 1440
gaacaagcgg atcgaattgt gaagttcgct aaggcaaatg gcatggatat tcgcttccat 1500
acactcgttt ggcacagcca agtacctcaa tggttctttc ttgacaagga aggcaagcca 1560
atggttaatg aaacagatcc agtgaaacgt gaacaaaata aacaactgct gttaaaacga 1620
cttgaaactc atattaaaac gatcgtcgag cggtacaaag atgacattaa gtactgggac 1680
gttgtaaatg aggttgtggg ggacgacgga aaactgcgca actctccatg gtatcaaatc 1740
gccggcatcg attatattaa agtggcattc caaacagcga gaaaatatgg cggcaacaag 1800
attaaacttt atatcaatga ttacaatacc gaagtggaac caaagcgaag cgctctttat 1860
aacttggtga agcaattaaa agaagagggc gttcctattg acggcatcgg ccatcaatcc 1920
cacattcaaa tcggctggcc ttctgaagca gaaatcgaga aaacgattaa catgttcgcc 1980
gctctcggct tagacaacca aatcactgag cttgatgtga gcatgtacgg ttggccgccg 2040
cgcgcttacc cgacgtatga cgccattcca aaacaaaagt ttttggatca ggcagcgcgc 2100
tatgatcgtt tgttcaaact gtatgaaaag ttgagcgata aaattagcaa cgtcaccttc 2160
tggggcatcg ccgacaatca tacgtggctc gacagccgtg cggatgtgta ctatgacgcc 2220
aacgggaatg ttgtggttga cccgaacgct ccgtacgcaa aagtggaaaa agggaaagga 2280
aaagatgcgc cgttcgtttt tggaccggat tacaaagtca aacccgcata ttgggctatt 2340
atcgaccaca aatag 2355
<210> 324
<211> 784
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 324
Met Met Leu Asn Ala Arg Cys Ile Gln Leu Met Lys Leu Leu Leu Arg
1 5 10 15
Ser Ser Leu Tyr Leu Thr Ala Asp Lys Leu Ala Gln Ser Leu Asn Val
20 25 30
Ser Lys Arg Thr Ile Tyr Tyr Asp Ile Gln Lys Thr Asn Glu Trp Leu
35 40 45
His His Glu Gly Leu Lys Pro Ile Gln Tyr Ala Arg Gly Leu Gly Phe
50 55 60
Arg Leu Asp Asp Glu Val Lys Gln Glu Ile Thr Thr Lys Trp Asn Thr
65 70 75 80
Leu Gln Pro Ala Arg His Tyr Thr Tyr Gln Ser Trp Glu Arg Lys Ala
85 90 95
Trp Ile Gly Leu Trp Ile Leu Thr Arg Val His Pro Leu Tyr Leu Ser
100 105 110
Asp Phe Leu Glu Lys Leu His Val Ser Arg Ser Thr Leu Leu Asn Asp
115 120 125
Ile Lys Glu Leu Lys Glu Asp Trp Gln Ser Phe Gln Leu Arg Leu Ser
130 135 140
Phe His Arg Lys Lys Gly Tyr Phe Ser Ser Gly Glu Glu Ile Gln Lys
145 150 155 160
Arg Lys Leu Met Ile Arg Tyr Ile His Gln Ile Leu Ala Ala Met Asp
165 170 175
Asp Gln His Phe Ala Ala Glu Leu Ser Ala Glu Cys Gln Trp Pro Ile
180 185 190
Phe Asp Trp Ile Cys Gln Phe Glu Ser Thr Phe Ser Ile Arg Tyr Thr
195 200 205
Gly Glu Val Ile Gln Thr Leu Pro Ile Tyr Leu Ala Leu Phe Gln Arg
210 215 220
Arg Trp Ala Arg Gly Lys Phe Val Gln Met Asp Glu Gln Glu Lys Glu
225 230 235 240
Val Leu Arg Ser Met Arg Glu Tyr Gln Ile Ala Asp His Leu Val Arg
245 250 255
Arg Ile Glu Asn Val Ser Glu Ile Ser Ile Pro Asp Asp Glu Val Cys
260 265 270
Tyr Leu Thr Thr His Leu Leu Ser Phe Arg Val Ala Asp Asp Lys Gln
275 280 285
Ile Asp His Asn Asp Asp Ile Thr Thr Leu Lys Arg Ile Ile Arg His
290 295 300
Met Val Asp Asp Phe Gln Thr Tyr Ala Cys Val Gln Phe Lys Arg Arg
305 310 315 320
Glu Glu Leu Glu Lys Asn Leu Leu Val His Met Lys Pro Ala Tyr Tyr
325 330 335
Arg Leu Lys Tyr Gly Phe His Leu Gln Asn Asp Leu Thr Glu Ser Val
340 345 350
Lys Ala Asn Tyr Gln Asp Leu Phe Thr Leu Thr Lys Lys Val Val His
355 360 365
His Leu Glu Ser Val Val Gly Gln Pro Val Ser Asp Asp Glu Ile Ala
370 375 380
Tyr Ile Ala Met His Phe Gly Gly Trp Leu Asp Arg Glu Gly Val Ser
385 390 395 400
Val Pro Val Arg Lys Lys Val Leu Ile Val Cys Glu Ser Gly Ile Gly
405 410 415
Thr Ser Arg Met Leu Gln Lys Gln Leu Asp Gln Arg Tyr Lys Asn Glu
420 425 430
Phe Thr Ile Gly Ala Ala Val Glu Pro Tyr Gln Leu Gln Asn Glu Lys
435 440 445
Asp Val Gln Met Leu Lys Arg His Phe Asn Ser Ile Val Ala Glu Asn
450 455 460
Val Met Lys Pro Ile Ser Ile Gln Pro Glu Glu Gly Lys Phe Asn Phe
465 470 475 480
Glu Gln Ala Asp Arg Ile Val Lys Phe Ala Lys Ala Asn Gly Met Asp
485 490 495
Ile Arg Phe His Thr Leu Val Trp His Ser Gln Val Pro Gln Trp Phe
500 505 510
Phe Leu Asp Lys Glu Gly Lys Pro Met Val Asn Glu Thr Asp Pro Val
515 520 525
Lys Arg Glu Gln Asn Lys Gln Leu Leu Leu Lys Arg Leu Glu Thr His
530 535 540
Ile Lys Thr Ile Val Glu Arg Tyr Lys Asp Asp Ile Lys Tyr Trp Asp
545 550 555 560
Val Val Asn Glu Val Val Gly Asp Asp Gly Lys Leu Arg Asn Ser Pro
565 570 575
Trp Tyr Gln Ile Ala Gly Ile Asp Tyr Ile Lys Val Ala Phe Gln Thr
580 585 590
Ala Arg Lys Tyr Gly Gly Asn Lys Ile Lys Leu Tyr Ile Asn Asp Tyr
595 600 605
Asn Thr Glu Val Glu Pro Lys Arg Ser Ala Leu Tyr Asn Leu Val Lys
610 615 620
Gln Leu Lys Glu Glu Gly Val Pro Ile Asp Gly Ile Gly His Gln Ser
625 630 635 640
His Ile Gln Ile Gly Trp Pro Ser Glu Ala Glu Ile Glu Lys Thr Ile
645 650 655
Asn Met Phe Ala Ala Leu Gly Leu Asp Asn Gln Ile Thr Glu Leu Asp
660 665 670
Val Ser Met Tyr Gly Trp Pro Pro Arg Ala Tyr Pro Thr Tyr Asp Ala
675 680 685
Ile Pro Lys Gln Lys Phe Leu Asp Gln Ala Ala Arg Tyr Asp Arg Leu
690 695 700
Phe Lys Leu Tyr Glu Lys Leu Ser Asp Lys Ile Ser Asn Val Thr Phe
705 710 715 720
Trp Gly Ile Ala Asp Asn His Thr Trp Leu Asp Ser Arg Ala Asp Val
725 730 735
Tyr Tyr Asp Ala Asn Gly Asn Val Val Val Asp Pro Asn Ala Pro Tyr
740 745 750
Ala Lys Val Glu Lys Gly Lys Gly Lys Asp Ala Pro Phe Val Phe Gly
755 760 765
Pro Asp Tyr Lys Val Lys Pro Ala Tyr Trp Ala Ile Ile Asp His Lys
770 775 780
<210> 325
<211> 1146
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 325
atgactattt cccgccggaa atttatgtgg ggcacagctg cactcctggc caccacccag 60
ctcaaaaccc gcgctctcgc cgctgccatg gccagcacag gcatcaagga cgccttcaag 120
ggcgacttcc atatcggcac cgccatcagc aacgctaccc tgcaaaacca ggatgccacc 180
atgctggatt tgatcaagcg cgaatttaat gcaattaccg ctgaaaattg catgaagtgg 240
gagcctattc gcccacagct ggatcagtgg aattgggagc tggccgaccg ctttgtggat 300
ttcggcgtta aaaacaagat gtatgtggta ggtcacacgc tgatttggca cagccaggcg 360
ccagcgcaca tttatctcga cgccgatggt aagcccaaca gtcgcgatgc ccagttgaaa 420
gtaatggagg agcacatacg taccctggcg ggccgctaca aaggaaagat agacgcctgg 480
gacgtggtta acgaagcagt ggaggatgat ggcagctggc gtcaaaccgg ctggtacaaa 540
aacatgggtg aagaatatat cgcccatgcc ttccgcttgg cagccgaggt agaccccaac 600
gccaagctac tctacaacga ctacaacgag gctgtacccg ccaagcgtga tgcgattatt 660
cgggtggtaa aaggcgtgca gaaggctggc gcacccattc acggtgtggg gatgcaaggg 720
cacatgagcc tgtcacatcc ggatttcgcg gagttcgaaa aatccataat cgaatacgcc 780
aagttggggg tgaaggtgca cgttaccgaa ctggatatcg acgtgttgcc actggcgtgg 840
aacctgagtg cggaaatttc caatcgcttt gaataccgcc cagagatgga tccttatcgc 900
gaaggtttgc ccgccaaagt cgaggaggag ctagcggctc gttacgaggc gctgtttaaa 960
atcctgctgc gtcatcgcga caaaattgag cgtgtgacca cttggggcac caacgactca 1020
gagacctggt taaatggctt ccccattccg gggcgcatga attacccaat gctgttcgat 1080
cgtaataacc agcccaagtt ggcctatcac cggctgctgg cactcaaaca aaagaaaagt 1140
cagtaa 1146
<210> 326
<211> 381
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(27)
<400> 326
Met Thr Ile Ser Arg Arg Lys Phe Met Trp Gly Thr Ala Ala Leu Leu
1 5 10 15
Ala Thr Thr Gln Leu Lys Thr Arg Ala Leu Ala Ala Ala Met Ala Ser
20 25 30
Thr Gly Ile Lys Asp Ala Phe Lys Gly Asp Phe His Ile Gly Thr Ala
35 40 45
Ile Ser Asn Ala Thr Leu Gln Asn Gln Asp Ala Thr Met Leu Asp Leu
50 55 60
Ile Lys Arg Glu Phe Asn Ala Ile Thr Ala Glu Asn Cys Met Lys Trp
65 70 75 80
Glu Pro Ile Arg Pro Gln Leu Asp Gln Trp Asn Trp Glu Leu Ala Asp
85 90 95
Arg Phe Val Asp Phe Gly Val Lys Asn Lys Met Tyr Val Val Gly His
100 105 110
Thr Leu Ile Trp His Ser Gln Ala Pro Ala His Ile Tyr Leu Asp Ala
115 120 125
Asp Gly Lys Pro Asn Ser Arg Asp Ala Gln Leu Lys Val Met Glu Glu
130 135 140
His Ile Arg Thr Leu Ala Gly Arg Tyr Lys Gly Lys Ile Asp Ala Trp
145 150 155 160
Asp Val Val Asn Glu Ala Val Glu Asp Asp Gly Ser Trp Arg Gln Thr
165 170 175
Gly Trp Tyr Lys Asn Met Gly Glu Glu Tyr Ile Ala His Ala Phe Arg
180 185 190
Leu Ala Ala Glu Val Asp Pro Asn Ala Lys Leu Leu Tyr Asn Asp Tyr
195 200 205
Asn Glu Ala Val Pro Ala Lys Arg Asp Ala Ile Ile Arg Val Val Lys
210 215 220
Gly Val Gln Lys Ala Gly Ala Pro Ile His Gly Val Gly Met Gln Gly
225 230 235 240
His Met Ser Leu Ser His Pro Asp Phe Ala Glu Phe Glu Lys Ser Ile
245 250 255
Ile Glu Tyr Ala Lys Leu Gly Val Lys Val His Val Thr Glu Leu Asp
260 265 270
Ile Asp Val Leu Pro Leu Ala Trp Asn Leu Ser Ala Glu Ile Ser Asn
275 280 285
Arg Phe Glu Tyr Arg Pro Glu Met Asp Pro Tyr Arg Glu Gly Leu Pro
290 295 300
Ala Lys Val Glu Glu Glu Leu Ala Ala Arg Tyr Glu Ala Leu Phe Lys
305 310 315 320
Ile Leu Leu Arg His Arg Asp Lys Ile Glu Arg Val Thr Thr Trp Gly
325 330 335
Thr Asn Asp Ser Glu Thr Trp Leu Asn Gly Phe Pro Ile Pro Gly Arg
340 345 350
Met Asn Tyr Pro Met Leu Phe Asp Arg Asn Asn Gln Pro Lys Leu Ala
355 360 365
Tyr His Arg Leu Leu Ala Leu Lys Gln Lys Lys Ser Gln
370 375 380
<210> 327
<211> 1500
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 327
atgaaacgtt cagtctctat ctttatcgca tgtttagtaa tgacagtatt aacaattagc 60
ggtgtcgcgg caccagaagc atctgcagca ggggcgaaaa cgcctgtagc ccttaatggc 120
cagcttagca ttaaaggtac tcagctagtc aatcaaaacg gaaaatcggt gcagctgaag 180
gggatcagct cacacggttt gcagtggttc ggcgattatg tcaataaaga ctctttaaaa 240
tggctaagag acgattgggg aattaccgtc ttccgagcgg caatgtacac ggctgaaggc 300
ggttatatag agaatccgtc tgtgaaaaat aaagtcaaag aagctgttga agcggcaaaa 360
gagctcggga tatatgtcat cattgactgg catattttaa atgacggcaa tccaaatcaa 420
aataaagaga aggcgaagga attctttaag gaaatgtcga gcctttacgg aagcacacca 480
aacgttattt atgaaattgc taatgaaccg aacggtgatg taaattggaa gcgcgatatc 540
aaaccgtatg cggaggaagt gatttccgtt atccgtaaaa atgacccgga taacatcatt 600
attaccggaa ctggcacttg gagtcaggat gtcaatgatg ctgctgatga tcagcttaag 660
gatgcaaacg tcatgtacgc gcttcatttt tatgcaggta cacacggcca gtatttaagg 720
gataaagccg attatgcgct cagcaaagga gcgccgattt ttgtaacgga atgggggacg 780
agtgacgctt ccggaaatgg cggggtcttc cttgaccagt cgagggaatg gctgaattat 840
ctcgacaaca agaaaatcag ctgggtaaac tggaaccttt ctgataagca ggaatcttcc 900
tcagctttaa agccgggggc atctaaaaca ggcggctggc cgttatcaga tttatccgct 960
tcagggacat ttgtaaggga aaagatccgt ggctcccaac attcgactga agacagatct 1020
gagacaccaa agcaagataa acccgtacag gaaaacagcc tatctgtgca atacagaaca 1080
ggggatggaa gtgtgaacag caaccaaatc cgtcctcaga tccatgtgaa aaacaacagc 1140
aagaccaccg ttaatttaaa aaatgtaact gtccgctact ggtataacac gaaaaacaaa 1200
ggccaaaact tcgactgtga ctacgcgaag atcggatgca gcaatgtgac gcacaagttt 1260
gtgacattac aaaaacctgt aaaaggtgca gatgcctatc tggaacttgg gtttaaaaac 1320
gggacactgt caccgggagc aaacactgga gaaatccaaa ttcgtcttca caatgaggat 1380
tggggcaatt attcacaaat cggggattat tctttttctc agtcaaatac gtttaaagat 1440
acaaaaaaaa tcacattata taataacgga aaactaattt ggggaactga acccaaatag 1500
<210> 328
<211> 499
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(29)
<400> 328
Met Lys Arg Ser Val Ser Ile Phe Ile Ala Cys Leu Val Met Thr Val
1 5 10 15
Leu Thr Ile Ser Gly Val Ala Ala Pro Glu Ala Ser Ala Ala Gly Ala
20 25 30
Lys Thr Pro Val Ala Leu Asn Gly Gln Leu Ser Ile Lys Gly Thr Gln
35 40 45
Leu Val Asn Gln Asn Gly Lys Ser Val Gln Leu Lys Gly Ile Ser Ser
50 55 60
His Gly Leu Gln Trp Phe Gly Asp Tyr Val Asn Lys Asp Ser Leu Lys
65 70 75 80
Trp Leu Arg Asp Asp Trp Gly Ile Thr Val Phe Arg Ala Ala Met Tyr
85 90 95
Thr Ala Glu Gly Gly Tyr Ile Glu Asn Pro Ser Val Lys Asn Lys Val
100 105 110
Lys Glu Ala Val Glu Ala Ala Lys Glu Leu Gly Ile Tyr Val Ile Ile
115 120 125
Asp Trp His Ile Leu Asn Asp Gly Asn Pro Asn Gln Asn Lys Glu Lys
130 135 140
Ala Lys Glu Phe Phe Lys Glu Met Ser Ser Leu Tyr Gly Ser Thr Pro
145 150 155 160
Asn Val Ile Tyr Glu Ile Ala Asn Glu Pro Asn Gly Asp Val Asn Trp
165 170 175
Lys Arg Asp Ile Lys Pro Tyr Ala Glu Glu Val Ile Ser Val Ile Arg
180 185 190
Lys Asn Asp Pro Asp Asn Ile Ile Ile Thr Gly Thr Gly Thr Trp Ser
195 200 205
Gln Asp Val Asn Asp Ala Ala Asp Asp Gln Leu Lys Asp Ala Asn Val
210 215 220
Met Tyr Ala Leu His Phe Tyr Ala Gly Thr His Gly Gln Tyr Leu Arg
225 230 235 240
Asp Lys Ala Asp Tyr Ala Leu Ser Lys Gly Ala Pro Ile Phe Val Thr
245 250 255
Glu Trp Gly Thr Ser Asp Ala Ser Gly Asn Gly Gly Val Phe Leu Asp
260 265 270
Gln Ser Arg Glu Trp Leu Asn Tyr Leu Asp Asn Lys Lys Ile Ser Trp
275 280 285
Val Asn Trp Asn Leu Ser Asp Lys Gln Glu Ser Ser Ser Ala Leu Lys
290 295 300
Pro Gly Ala Ser Lys Thr Gly Gly Trp Pro Leu Ser Asp Leu Ser Ala
305 310 315 320
Ser Gly Thr Phe Val Arg Glu Lys Ile Arg Gly Ser Gln His Ser Thr
325 330 335
Glu Asp Arg Ser Glu Thr Pro Lys Gln Asp Lys Pro Val Gln Glu Asn
340 345 350
Ser Leu Ser Val Gln Tyr Arg Thr Gly Asp Gly Ser Val Asn Ser Asn
355 360 365
Gln Ile Arg Pro Gln Ile His Val Lys Asn Asn Ser Lys Thr Thr Val
370 375 380
Asn Leu Lys Asn Val Thr Val Arg Tyr Trp Tyr Asn Thr Lys Asn Lys
385 390 395 400
Gly Gln Asn Phe Asp Cys Asp Tyr Ala Lys Ile Gly Cys Ser Asn Val
405 410 415
Thr His Lys Phe Val Thr Leu Gln Lys Pro Val Lys Gly Ala Asp Ala
420 425 430
Tyr Leu Glu Leu Gly Phe Lys Asn Gly Thr Leu Ser Pro Gly Ala Asn
435 440 445
Thr Gly Glu Ile Gln Ile Arg Leu His Asn Glu Asp Trp Gly Asn Tyr
450 455 460
Ser Gln Ile Gly Asp Tyr Ser Phe Ser Gln Ser Asn Thr Phe Lys Asp
465 470 475 480
Thr Lys Lys Ile Thr Leu Tyr Asn Asn Gly Lys Leu Ile Trp Gly Thr
485 490 495
Glu Pro Lys
<210> 329
<211> 2268
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 329
atgaggaacg ttcaggaaat aggaggcagt atgtacaaaa aggcttttct tgtactggca 60
ttgtttttgc tgttggcggc ggtggcgctc ccgtctgtgg gggctgcgcc gcaggggccg 120
cgcctgcgcg atgtggcggg cgacatttta gtgggttacg cctccagaaa cgatttctgg 180
aacatgtctg actcagccca atacacagaa gttgcccgca ctgagttcaa cttcatgacg 240
cccgaaaacg ccatgaagtg ggacgccatt catcccgcgc aaaactcata cagttttgcc 300
caggccgacc ggcacgtgca gtttgcccag gccaacaaca tggccgtgca tggacatgcc 360
ctcgtgtggc acagccaaaa tccaggctgg ctgaccaatg gcaactggtc ccgcagccaa 420
ttgatcaaca tcatgaacga ccacattgac acggtcgccg gccgttatgc aggtgaggtg 480
ctggtgtggg acgtggtcaa tcaggcgttt aatgaggatg gaacttatcg cagcaccatc 540
tggtacaacg ggatcggaca ggaatatatc gacctggcct ttacccgcgc ccgcgccgcc 600
gatcctcatg ccaaactcat ttacaacgat tacaacattg gctggttaaa cagtaagtcg 660
aatggcgtct acaacatggc cgccgatatg gtcaggcgcg gtgtgcccat cgacggcgtt 720
ggtttccaga tgcacctgga acggggcggc gtcagcggca gcagtctggc gagcaacatg 780
cagcgtttcg ccgatttggg attggaagtt tacatcaccg aattggacgt gcgcattccc 840
caaaacccaa cccagcagga tttgcaggct caggcggcag tttaccaaac ggtgacgaat 900
cgctgtttgg cgcagcctgc ctgcaaggcg ttgcaggtct ggggcatccc cgacaaatat 960
tcctgggtac cggacgtatt ccccggcacg ggcgcgcctc tgttgtttaa cgacaactat 1020
gaggccaaac ccgcctatta tgccgtccag gcagagttga tggccgcgaa tccgcagccc 1080
acaaacacac cgggaacgcc cgctcatacc ccttcggcca cgtctacgtc tgcggccact 1140
gctacgcccc cggcaacggc cacggcgacc gccaccaccc cctccggcgg cggcgtttgc 1200
gccgttgatt acgtcattgc caaccagtgg ggcaatggct ttcaggccaa cgtcaccatc 1260
accaatcaca gcgccgcgcc ggtgaacggc tataccctgg cctggaccca cgcgccgggg 1320
cagattgtca ccagcggctg gaacgtaacc atcgcccaaa gcggcagcgc cgtcagcgcc 1380
agcaacccgg ccggttattg gaacggtgtg atcggagcca acggcggcaa gatttctttt 1440
ggtttccagg gatctctggc gggcggcagc gcggtcgcgc ccacttattt tgccttgaac 1500
ggcgctgcct gtaacggggc cgtccttccg cctactgcca ccttcacgcc ttcaccgacg 1560
gctaccatgt gtccccaggc aacgcctgaa ctgcttgtcg tgcagccggt gacttcaccc 1620
actacccaac tgtctcaaac gctggtggtg cgtttaggca acggcgaatg ggtgcgcgct 1680
gccggaccgg caggcgttgt caccgtcact gcgccggacc cggatggtta tttccgcctg 1740
acgataccgc tggcagccaa taccagcaac gccattctgg tagaagggcg ggtgcgggtt 1800
atcacccatt caaatggctg cacctatggc ggttatacct tgagcagaac cgtaacgatt 1860
gtgcaagcca gcagcccagt caccttaacg ccgactgcca caccttcccc caccgccacg 1920
gcaacgccta cggtaaccgc cacgtcgccg tcaggcgcct gcaccgtcgc ctacgccatc 1980
accaacgact ggggcagcgg tttcaccgcc aacgttaccc tcaccaatac tggcggaagc 2040
gccctcaacg gctggaccct ggcctatgcc tttcccggca atcaaaccat cagcaacgcc 2100
tggaacggaa cggccgttca gtccggcagc agcgtcagcg tcaccaacgc cggttggaat 2160
ggcagcctgc cgcccaacgt ctccgccagc tttggcttcc aggcgagcta cagcggcaat 2220
aacagcgtcc ctgccagctt tacgctgaac ggcgcgcttt gccattga 2268
<210> 330
<211> 755
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(35)
<400> 330
Met Arg Asn Val Gln Glu Ile Gly Gly Ser Met Tyr Lys Lys Ala Phe
1 5 10 15
Leu Val Leu Ala Leu Phe Leu Leu Leu Ala Ala Val Ala Leu Pro Ser
20 25 30
Val Gly Ala Ala Pro Gln Gly Pro Arg Leu Arg Asp Val Ala Gly Asp
35 40 45
Ile Leu Val Gly Tyr Ala Ser Arg Asn Asp Phe Trp Asn Met Ser Asp
50 55 60
Ser Ala Gln Tyr Thr Glu Val Ala Arg Thr Glu Phe Asn Phe Met Thr
65 70 75 80
Pro Glu Asn Ala Met Lys Trp Asp Ala Ile His Pro Ala Gln Asn Ser
85 90 95
Tyr Ser Phe Ala Gln Ala Asp Arg His Val Gln Phe Ala Gln Ala Asn
100 105 110
Asn Met Ala Val His Gly His Ala Leu Val Trp His Ser Gln Asn Pro
115 120 125
Gly Trp Leu Thr Asn Gly Asn Trp Ser Arg Ser Gln Leu Ile Asn Ile
130 135 140
Met Asn Asp His Ile Asp Thr Val Ala Gly Arg Tyr Ala Gly Glu Val
145 150 155 160
Leu Val Trp Asp Val Val Asn Gln Ala Phe Asn Glu Asp Gly Thr Tyr
165 170 175
Arg Ser Thr Ile Trp Tyr Asn Gly Ile Gly Gln Glu Tyr Ile Asp Leu
180 185 190
Ala Phe Thr Arg Ala Arg Ala Ala Asp Pro His Ala Lys Leu Ile Tyr
195 200 205
Asn Asp Tyr Asn Ile Gly Trp Leu Asn Ser Lys Ser Asn Gly Val Tyr
210 215 220
Asn Met Ala Ala Asp Met Val Arg Arg Gly Val Pro Ile Asp Gly Val
225 230 235 240
Gly Phe Gln Met His Leu Glu Arg Gly Gly Val Ser Gly Ser Ser Leu
245 250 255
Ala Ser Asn Met Gln Arg Phe Ala Asp Leu Gly Leu Glu Val Tyr Ile
260 265 270
Thr Glu Leu Asp Val Arg Ile Pro Gln Asn Pro Thr Gln Gln Asp Leu
275 280 285
Gln Ala Gln Ala Ala Val Tyr Gln Thr Val Thr Asn Arg Cys Leu Ala
290 295 300
Gln Pro Ala Cys Lys Ala Leu Gln Val Trp Gly Ile Pro Asp Lys Tyr
305 310 315 320
Ser Trp Val Pro Asp Val Phe Pro Gly Thr Gly Ala Pro Leu Leu Phe
325 330 335
Asn Asp Asn Tyr Glu Ala Lys Pro Ala Tyr Tyr Ala Val Gln Ala Glu
340 345 350
Leu Met Ala Ala Asn Pro Gln Pro Thr Asn Thr Pro Gly Thr Pro Ala
355 360 365
His Thr Pro Ser Ala Thr Ser Thr Ser Ala Ala Thr Ala Thr Pro Pro
370 375 380
Ala Thr Ala Thr Ala Thr Ala Thr Thr Pro Ser Gly Gly Gly Val Cys
385 390 395 400
Ala Val Asp Tyr Val Ile Ala Asn Gln Trp Gly Asn Gly Phe Gln Ala
405 410 415
Asn Val Thr Ile Thr Asn His Ser Ala Ala Pro Val Asn Gly Tyr Thr
420 425 430
Leu Ala Trp Thr His Ala Pro Gly Gln Ile Val Thr Ser Gly Trp Asn
435 440 445
Val Thr Ile Ala Gln Ser Gly Ser Ala Val Ser Ala Ser Asn Pro Ala
450 455 460
Gly Tyr Trp Asn Gly Val Ile Gly Ala Asn Gly Gly Lys Ile Ser Phe
465 470 475 480
Gly Phe Gln Gly Ser Leu Ala Gly Gly Ser Ala Val Ala Pro Thr Tyr
485 490 495
Phe Ala Leu Asn Gly Ala Ala Cys Asn Gly Ala Val Leu Pro Pro Thr
500 505 510
Ala Thr Phe Thr Pro Ser Pro Thr Ala Thr Met Cys Pro Gln Ala Thr
515 520 525
Pro Glu Leu Leu Val Val Gln Pro Val Thr Ser Pro Thr Thr Gln Leu
530 535 540
Ser Gln Thr Leu Val Val Arg Leu Gly Asn Gly Glu Trp Val Arg Ala
545 550 555 560
Ala Gly Pro Ala Gly Val Val Thr Val Thr Ala Pro Asp Pro Asp Gly
565 570 575
Tyr Phe Arg Leu Thr Ile Pro Leu Ala Ala Asn Thr Ser Asn Ala Ile
580 585 590
Leu Val Glu Gly Arg Val Arg Val Ile Thr His Ser Asn Gly Cys Thr
595 600 605
Tyr Gly Gly Tyr Thr Leu Ser Arg Thr Val Thr Ile Val Gln Ala Ser
610 615 620
Ser Pro Val Thr Leu Thr Pro Thr Ala Thr Pro Ser Pro Thr Ala Thr
625 630 635 640
Ala Thr Pro Thr Val Thr Ala Thr Ser Pro Ser Gly Ala Cys Thr Val
645 650 655
Ala Tyr Ala Ile Thr Asn Asp Trp Gly Ser Gly Phe Thr Ala Asn Val
660 665 670
Thr Leu Thr Asn Thr Gly Gly Ser Ala Leu Asn Gly Trp Thr Leu Ala
675 680 685
Tyr Ala Phe Pro Gly Asn Gln Thr Ile Ser Asn Ala Trp Asn Gly Thr
690 695 700
Ala Val Gln Ser Gly Ser Ser Val Ser Val Thr Asn Ala Gly Trp Asn
705 710 715 720
Gly Ser Leu Pro Pro Asn Val Ser Ala Ser Phe Gly Phe Gln Ala Ser
725 730 735
Tyr Ser Gly Asn Asn Ser Val Pro Ala Ser Phe Thr Leu Asn Gly Ala
740 745 750
Leu Cys His
755
<210> 331
<211> 1242
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 331
gtgttcaagg gcttgcgcta tttgctgttg ctgtgcctga gtgcgggact ggtctttgcc 60
tgtgcgccac ggtctgtgac cgccccaccc gatgggctaa gcgggcaaat taggctcctg 120
cgccaaggaa ccctcactgt ccttgtccag aatgcccaag ggcaacccat tgccaacgcc 180
aaggtggtag ctgctcagca aacccatgcc ttcccctttg gtgttgcctt agatacagca 240
atgtttgagc cttccccgcc acccgcagcc aactggtacc gcaacaccgc tcgccaaaat 300
tttaatgccg ctgtccatga aaacgccctc aagtggtatg cccttgaacc ggagcagggc 360
aagctggact ttacgatggc ggatcgcatc ctcgcttgga gtgaagccca aggctggccg 420
atgcgggggc acaccctctt ttgggaagtt gagcaattta accccccatg gctgaaaacg 480
ctgccaccag agcaactgcg ggctgccgtc aagaaccatg ccatgacggt gtgtcgccat 540
taccgcgggc gaatcaatga atttgatgtc aataatgaaa tgctccacgg taactttttc 600
cgcagtcgtt tgggaaacgg catagttaaa gagatgttcg agtggtgccg cgagggtaac 660
cccgaggccg tcctttatgt gaacgactac ggcattattg agggcgatcg cctcgacgac 720
tacgtgcagc agattcgcga tttactgggg caaggggttc ccattggtgg cattggcatt 780
caagcccatt tggaatatcc cttggatgca gccaagatga aacgcgccct tgataccctt 840
gcccaattca acctgcccct aaaaatcact gaagttagtg tcagccttgc cgacgagcag 900
cagcaggcgg agacactgcg ccaaatctac cgcattggtt ttgcccatcc agccgtcaaa 960
gagatcctcc tgtggggatt ttgggaaggc aaccactggc gaccccaagc aggactgtac 1020
cgtcgcgact tttccgccaa acctgctgcc gaagcctatc gacaactcct ctttcaggag 1080
tggtggacca ccagcaacgg caaaactaat gccgatgggc gctggcagac ccgcggctat 1140
gcggggcgct atcgcctcac agtaacggcc aacggccaga ccattaaccg cgacattgac 1200
ctaccagact tggagagaac cgtgaccgta caattcccat ga 1242
<210> 332
<211> 413
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(28)
<400> 332
Met Phe Lys Gly Leu Arg Tyr Leu Leu Leu Leu Cys Leu Ser Ala Gly
1 5 10 15
Leu Val Phe Ala Cys Ala Pro Arg Ser Val Thr Ala Pro Pro Asp Gly
20 25 30
Leu Ser Gly Gln Ile Arg Leu Leu Arg Gln Gly Thr Leu Thr Val Leu
35 40 45
Val Gln Asn Ala Gln Gly Gln Pro Ile Ala Asn Ala Lys Val Val Ala
50 55 60
Ala Gln Gln Thr His Ala Phe Pro Phe Gly Val Ala Leu Asp Thr Ala
65 70 75 80
Met Phe Glu Pro Ser Pro Pro Pro Ala Ala Asn Trp Tyr Arg Asn Thr
85 90 95
Ala Arg Gln Asn Phe Asn Ala Ala Val His Glu Asn Ala Leu Lys Trp
100 105 110
Tyr Ala Leu Glu Pro Glu Gln Gly Lys Leu Asp Phe Thr Met Ala Asp
115 120 125
Arg Ile Leu Ala Trp Ser Glu Ala Gln Gly Trp Pro Met Arg Gly His
130 135 140
Thr Leu Phe Trp Glu Val Glu Gln Phe Asn Pro Pro Trp Leu Lys Thr
145 150 155 160
Leu Pro Pro Glu Gln Leu Arg Ala Ala Val Lys Asn His Ala Met Thr
165 170 175
Val Cys Arg His Tyr Arg Gly Arg Ile Asn Glu Phe Asp Val Asn Asn
180 185 190
Glu Met Leu His Gly Asn Phe Phe Arg Ser Arg Leu Gly Asn Gly Ile
195 200 205
Val Lys Glu Met Phe Glu Trp Cys Arg Glu Gly Asn Pro Glu Ala Val
210 215 220
Leu Tyr Val Asn Asp Tyr Gly Ile Ile Glu Gly Asp Arg Leu Asp Asp
225 230 235 240
Tyr Val Gln Gln Ile Arg Asp Leu Leu Gly Gln Gly Val Pro Ile Gly
245 250 255
Gly Ile Gly Ile Gln Ala His Leu Glu Tyr Pro Leu Asp Ala Ala Lys
260 265 270
Met Lys Arg Ala Leu Asp Thr Leu Ala Gln Phe Asn Leu Pro Leu Lys
275 280 285
Ile Thr Glu Val Ser Val Ser Leu Ala Asp Glu Gln Gln Gln Ala Glu
290 295 300
Thr Leu Arg Gln Ile Tyr Arg Ile Gly Phe Ala His Pro Ala Val Lys
305 310 315 320
Glu Ile Leu Leu Trp Gly Phe Trp Glu Gly Asn His Trp Arg Pro Gln
325 330 335
Ala Gly Leu Tyr Arg Arg Asp Phe Ser Ala Lys Pro Ala Ala Glu Ala
340 345 350
Tyr Arg Gln Leu Leu Phe Gln Glu Trp Trp Thr Thr Ser Asn Gly Lys
355 360 365
Thr Asn Ala Asp Gly Arg Trp Gln Thr Arg Gly Tyr Ala Gly Arg Tyr
370 375 380
Arg Leu Thr Val Thr Ala Asn Gly Gln Thr Ile Asn Arg Asp Ile Asp
385 390 395 400
Leu Pro Asp Leu Glu Arg Thr Val Thr Val Gln Phe Pro
405 410
<210> 333
<211> 1152
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 333
atgaaaagac aatttattgg acgattgaga cttgtcacta tcctttcaat catagtgatt 60
atgggatgtg cttcaaacaa aagtgatcag aatgttgata acctaaagga cgccttcgac 120
ggtttgttcc ttattggaac tgccatgaat accccccaga tcaccggaca ggatacccgg 180
acgcttgaat tgatcaaaaa acacatgaac tccattgtgg cagaaaacgt tatgaaaagc 240
ggactaatac agcccagcga aggggagttc gacttctcac ttgccgacca gtttgtgcaa 300
ttcggtgttg acaacaacat gcacatcgta gggcataccc ttatctggca ttcgcaggct 360
ccagggtggt tttttgtgga tgaaaacggt aatgatgtta gtcccgaagt tcttaagcaa 420
aggatgaaag accacatcta cacagtagtt ggccgttaca aaggcaaagt gcacggttgg 480
gatgtggtga atgaatgtat cgttgacgat gggtcatggc gcaacagcaa gttttaccag 540
atcctgggtg aagactttgt aaagtatgcc ttccagtttg cttcagaagc cgacccgaat 600
gctgaattgt attacaacga ttattccatg gcacttcccg gccgccgcca gggagtcgta 660
aacatggtaa aaaatctaca ggcacaaggt attaaaattg acggaatagg aatgcagggc 720
cacctgatga tcgaccatcc atcccttgaa gatttcgaaa ccagtttgct tgcctttgcc 780
gatctgggtg tacatgttat gatcactgag cttgatgtat ctgtacttcc ttttcctacc 840
cgcaacctcg gtgctgatgt atctctaaac atagcttaca acactgaact gaacccctat 900
cccgatggat tgcctgatga tgtggcccaa aaacttcatg atcgctggct cgatatatat 960
cgtttattta taaaacatca cgacaagatc acccgtgtta ctacctgggg tacagccgat 1020
ggtatgtcat ggaagaacaa ctggcccatt cgtggacgca cagactttcc tttattattc 1080
gaccgcgatt ttcaacccaa accggtagta gctgatatta tcaaagaagc attggctgca 1140
aagagaaaat ag 1152
<210> 334
<211> 383
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(30)
<400> 334
Met Lys Arg Gln Phe Ile Gly Arg Leu Arg Leu Val Thr Ile Leu Ser
1 5 10 15
Ile Ile Val Ile Met Gly Cys Ala Ser Asn Lys Ser Asp Gln Asn Val
20 25 30
Asp Asn Leu Lys Asp Ala Phe Asp Gly Leu Phe Leu Ile Gly Thr Ala
35 40 45
Met Asn Thr Pro Gln Ile Thr Gly Gln Asp Thr Arg Thr Leu Glu Leu
50 55 60
Ile Lys Lys His Met Asn Ser Ile Val Ala Glu Asn Val Met Lys Ser
65 70 75 80
Gly Leu Ile Gln Pro Ser Glu Gly Glu Phe Asp Phe Ser Leu Ala Asp
85 90 95
Gln Phe Val Gln Phe Gly Val Asp Asn Asn Met His Ile Val Gly His
100 105 110
Thr Leu Ile Trp His Ser Gln Ala Pro Gly Trp Phe Phe Val Asp Glu
115 120 125
Asn Gly Asn Asp Val Ser Pro Glu Val Leu Lys Gln Arg Met Lys Asp
130 135 140
His Ile Tyr Thr Val Val Gly Arg Tyr Lys Gly Lys Val His Gly Trp
145 150 155 160
Asp Val Val Asn Glu Cys Ile Val Asp Asp Gly Ser Trp Arg Asn Ser
165 170 175
Lys Phe Tyr Gln Ile Leu Gly Glu Asp Phe Val Lys Tyr Ala Phe Gln
180 185 190
Phe Ala Ser Glu Ala Asp Pro Asn Ala Glu Leu Tyr Tyr Asn Asp Tyr
195 200 205
Ser Met Ala Leu Pro Gly Arg Arg Gln Gly Val Val Asn Met Val Lys
210 215 220
Asn Leu Gln Ala Gln Gly Ile Lys Ile Asp Gly Ile Gly Met Gln Gly
225 230 235 240
His Leu Met Ile Asp His Pro Ser Leu Glu Asp Phe Glu Thr Ser Leu
245 250 255
Leu Ala Phe Ala Asp Leu Gly Val His Val Met Ile Thr Glu Leu Asp
260 265 270
Val Ser Val Leu Pro Phe Pro Thr Arg Asn Leu Gly Ala Asp Val Ser
275 280 285
Leu Asn Ile Ala Tyr Asn Thr Glu Leu Asn Pro Tyr Pro Asp Gly Leu
290 295 300
Pro Asp Asp Val Ala Gln Lys Leu His Asp Arg Trp Leu Asp Ile Tyr
305 310 315 320
Arg Leu Phe Ile Lys His His Asp Lys Ile Thr Arg Val Thr Thr Trp
325 330 335
Gly Thr Ala Asp Gly Met Ser Trp Lys Asn Asn Trp Pro Ile Arg Gly
340 345 350
Arg Thr Asp Phe Pro Leu Leu Phe Asp Arg Asp Phe Gln Pro Lys Pro
355 360 365
Val Val Ala Asp Ile Ile Lys Glu Ala Leu Ala Ala Lys Arg Lys
370 375 380
<210> 335
<211> 849
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 335
atgattccaa ggatcgtcct ggccgtccgc atatccccta cttttctcag cccacaaaaa 60
ggggtaataa aaatgataaa gcgggctttt atgataaccc tggcggcctt cctcctcctt 120
ttcgccctaa attccctgcc tatccatgcc ggggccgaag gcggggagga aaagtttacc 180
cccaaggtca tcgtggagca cggtttcgag aataacgact tccacggttg ggtcccccgg 240
ggcggggtcg ggaccatttc cattaccaat gaggcggccc atagcgggtc ctcctgcctg 300
aagatcaccg gccggactca agcttggcat atgccgcggg tggagatcac caagtactta 360
gaaaagggag ctaagtataa gatcgaattg tacgtcaagc tccccgcggg cacctcgccg 420
cgcaagttcc agctggcggt tctcacccgt tatctcgaag gcaaccagac cagggacaaa 480
gaggactcca tctcggacga ggtggaggtg accgccgata cctggaccaa ggtcgagggc 540
gagtacgtct tcgacccggc ggccatcggc gcctacgtct acccctacct caagggcgac 600
cccgcagggg cctatgcccc ctatctcatc gatgatttca agatcaccac gatcgccccc 660
gcccccaaga agaccgccgc taccgccgcg gcaaaagagg cagaagagcc cttaatcgag 720
accgatatac catccttaaa agacgtctgc gcgtcctact tcgagatcgg cgcggccatc 780
gagccatatg agttattctc caagccccac gatcagctgc tccggaaaca tttcaacacc 840
gttggttga 849
<210> 336
<211> 282
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(50)
<400> 336
Met Ile Pro Arg Ile Val Leu Ala Val Arg Ile Ser Pro Thr Phe Leu
1 5 10 15
Ser Pro Gln Lys Gly Val Ile Lys Met Ile Lys Arg Ala Phe Met Ile
20 25 30
Thr Leu Ala Ala Phe Leu Leu Leu Phe Ala Leu Asn Ser Leu Pro Ile
35 40 45
His Ala Gly Ala Glu Gly Gly Glu Glu Lys Phe Thr Pro Lys Val Ile
50 55 60
Val Glu His Gly Phe Glu Asn Asn Asp Phe His Gly Trp Val Pro Arg
65 70 75 80
Gly Gly Val Gly Thr Ile Ser Ile Thr Asn Glu Ala Ala His Ser Gly
85 90 95
Ser Ser Cys Leu Lys Ile Thr Gly Arg Thr Gln Ala Trp His Met Pro
100 105 110
Arg Val Glu Ile Thr Lys Tyr Leu Glu Lys Gly Ala Lys Tyr Lys Ile
115 120 125
Glu Leu Tyr Val Lys Leu Pro Ala Gly Thr Ser Pro Arg Lys Phe Gln
130 135 140
Leu Ala Val Leu Thr Arg Tyr Leu Glu Gly Asn Gln Thr Arg Asp Lys
145 150 155 160
Glu Asp Ser Ile Ser Asp Glu Val Glu Val Thr Ala Asp Thr Trp Thr
165 170 175
Lys Val Glu Gly Glu Tyr Val Phe Asp Pro Ala Ala Ile Gly Ala Tyr
180 185 190
Val Tyr Pro Tyr Leu Lys Gly Asp Pro Ala Gly Ala Tyr Ala Pro Tyr
195 200 205
Leu Ile Asp Asp Phe Lys Ile Thr Thr Ile Ala Pro Ala Pro Lys Lys
210 215 220
Thr Ala Ala Thr Ala Ala Ala Lys Glu Ala Glu Glu Pro Leu Ile Glu
225 230 235 240
Thr Asp Ile Pro Ser Leu Lys Asp Val Cys Ala Ser Tyr Phe Glu Ile
245 250 255
Gly Ala Ala Ile Glu Pro Tyr Glu Leu Phe Ser Lys Pro His Asp Gln
260 265 270
Leu Leu Arg Lys His Phe Asn Thr Val Gly
275 280
<210> 337
<211> 870
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 337
atgaagcccg acagcgtgct ggatgtaaac gccagcaaaa agctctccgc ccaggatgaa 60
accgccgtgg cggtgaaatt cgacgccgcc cgcgccctgc tggattttgt caaggaaaac 120
gggctcaagg tgcacggtca cgtgctggta tggcattccc agacgccgga agccttcttc 180
cacgagggct atgatgccgc caggccctac gtggggcggg acgtgatgct ggggcgcatg 240
aaaaactaca tcaaggccgt gtttgaatac actgagacca attaccccgg cgtcatcgtc 300
tcctgggacg tagtgaacga agccatcgac gacggcacca acaagctgcg ccagtccaac 360
tggttcaaaa ccgttggcga ggatttcgtg ctccgcgcct ttgaatacgc caggaaatac 420
gcccccgaag gcacgctgct ttattacaac gattacaaca ccgccatgcc cggcaagctg 480
aacggcatcg ccaatctgct caaagccctc atcgccgagg gcaacatcga cggctacggc 540
ttccaaatgc accacagcgt gggcttcccc tccatggaaa tgatttccgc gtctgtggag 600
cgcatcgccg gcatgggcct taagctccgg gtcagcgaat tggacgtggg caccgacgga 660
aacaccgaaa gcagcttcac caagcaggcg gaaaaatacg ccgccatcat gcggctgctg 720
ctggattata aggatcaaat ggaagccgtg caggtatggg gcctcaccga cgatatgagc 780
tggcgccggg ccaactatcc cctgctcttc gacggcaaat tcaaccccaa gcccgccttc 840
tacgccgtgg ctgacccata cgcaaaataa 870
<210> 338
<211> 289
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 338
Met Lys Pro Asp Ser Val Leu Asp Val Asn Ala Ser Lys Lys Leu Ser
1 5 10 15
Ala Gln Asp Glu Thr Ala Val Ala Val Lys Phe Asp Ala Ala Arg Ala
20 25 30
Leu Leu Asp Phe Val Lys Glu Asn Gly Leu Lys Val His Gly His Val
35 40 45
Leu Val Trp His Ser Gln Thr Pro Glu Ala Phe Phe His Glu Gly Tyr
50 55 60
Asp Ala Ala Arg Pro Tyr Val Gly Arg Asp Val Met Leu Gly Arg Met
65 70 75 80
Lys Asn Tyr Ile Lys Ala Val Phe Glu Tyr Thr Glu Thr Asn Tyr Pro
85 90 95
Gly Val Ile Val Ser Trp Asp Val Val Asn Glu Ala Ile Asp Asp Gly
100 105 110
Thr Asn Lys Leu Arg Gln Ser Asn Trp Phe Lys Thr Val Gly Glu Asp
115 120 125
Phe Val Leu Arg Ala Phe Glu Tyr Ala Arg Lys Tyr Ala Pro Glu Gly
130 135 140
Thr Leu Leu Tyr Tyr Asn Asp Tyr Asn Thr Ala Met Pro Gly Lys Leu
145 150 155 160
Asn Gly Ile Ala Asn Leu Leu Lys Ala Leu Ile Ala Glu Gly Asn Ile
165 170 175
Asp Gly Tyr Gly Phe Gln Met His His Ser Val Gly Phe Pro Ser Met
180 185 190
Glu Met Ile Ser Ala Ser Val Glu Arg Ile Ala Gly Met Gly Leu Lys
195 200 205
Leu Arg Val Ser Glu Leu Asp Val Gly Thr Asp Gly Asn Thr Glu Ser
210 215 220
Ser Phe Thr Lys Gln Ala Glu Lys Tyr Ala Ala Ile Met Arg Leu Leu
225 230 235 240
Leu Asp Tyr Lys Asp Gln Met Glu Ala Val Gln Val Trp Gly Leu Thr
245 250 255
Asp Asp Met Ser Trp Arg Arg Ala Asn Tyr Pro Leu Leu Phe Asp Gly
260 265 270
Lys Phe Asn Pro Lys Pro Ala Phe Tyr Ala Val Ala Asp Pro Tyr Ala
275 280 285
Lys
<210> 339
<211> 1125
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 339
atgcctatgg agcgacccac tttcttgcgg tttcttgcct tttttcttct ttttaccatg 60
attttcgccg ccggagggtg ccgacccctt gccccttcac ggatggagat cgagacggat 120
atcccctccc tcaaggaagt cgccgcttct tatttcgaga tcggcgcggc cgtcgagccg 180
tatcagttat cctctccacc ccacgatgcc cttctgcgga aacattttaa ctgcctcgtg 240
gcggagaacg tcatgaagcc cgcctccatc cagccatcgg aggggtattt caactggacc 300
gaagcggaca agatcgtgaa ctacgccaaa gcccacggga tgaagctccg cttccatacc 360
ctcgtctggc ataatcaggt cccggattgg ttcttcgcgg gtaacgacaa aacccgcctt 420
ttgcagcgct tggagaatca tatccggact atcattaaaa gatatggcga taaggtcgac 480
tattgggacg tggtgaacga agtaatagac gacaacggcg gtatgcgaaa cagcaagtgg 540
taccagatca ccgggaagga ctacatcaag accgccttcc gggtggcaga cgacgagctc 600
aggaagaatg ggtggaggaa agaaggtcgt cagctctata tcaacgacta caacacccat 660
aacccaacga agagagaggg gatctggcgc ttgatccaag agctccgggc ggaagggatt 720
cccgtcgacg gagtaggcca ccagacgcat atcaatatcg aatggccgcc cgtaagccag 780
atcgtggaat cgatccgctt cttcggcgaa aaaggcctcg ataaccaggt gaccgagctg 840
gatgtgagca tctatacgaa tgacaaggat tcacatggta gttatcaggc catcccgcag 900
gaagtcttca tcaagcaggg taatcgctac aaggaactct ttgaagggct aaaaagtgta 960
aaaaactacc tcagcaacgt caccttctgg ggcatggcgg acgatcatac ctggctgaac 1020
cgttggccca tcgaacggcc cgatgctcct cttcctttcg atatctatct caaggccaag 1080
ccggcgtatt gggggatcgt ggatgctttg aagctttcgc ggtga 1125
<210> 340
<211> 374
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(23)
<400> 340
Met Pro Met Glu Arg Pro Thr Phe Leu Arg Phe Leu Ala Phe Phe Leu
1 5 10 15
Leu Phe Thr Met Ile Phe Ala Ala Gly Gly Cys Arg Pro Leu Ala Pro
20 25 30
Ser Arg Met Glu Ile Glu Thr Asp Ile Pro Ser Leu Lys Glu Val Ala
35 40 45
Ala Ser Tyr Phe Glu Ile Gly Ala Ala Val Glu Pro Tyr Gln Leu Ser
50 55 60
Ser Pro Pro His Asp Ala Leu Leu Arg Lys His Phe Asn Cys Leu Val
65 70 75 80
Ala Glu Asn Val Met Lys Pro Ala Ser Ile Gln Pro Ser Glu Gly Tyr
85 90 95
Phe Asn Trp Thr Glu Ala Asp Lys Ile Val Asn Tyr Ala Lys Ala His
100 105 110
Gly Met Lys Leu Arg Phe His Thr Leu Val Trp His Asn Gln Val Pro
115 120 125
Asp Trp Phe Phe Ala Gly Asn Asp Lys Thr Arg Leu Leu Gln Arg Leu
130 135 140
Glu Asn His Ile Arg Thr Ile Ile Lys Arg Tyr Gly Asp Lys Val Asp
145 150 155 160
Tyr Trp Asp Val Val Asn Glu Val Ile Asp Asp Asn Gly Gly Met Arg
165 170 175
Asn Ser Lys Trp Tyr Gln Ile Thr Gly Lys Asp Tyr Ile Lys Thr Ala
180 185 190
Phe Arg Val Ala Asp Asp Glu Leu Arg Lys Asn Gly Trp Arg Lys Glu
195 200 205
Gly Arg Gln Leu Tyr Ile Asn Asp Tyr Asn Thr His Asn Pro Thr Lys
210 215 220
Arg Glu Gly Ile Trp Arg Leu Ile Gln Glu Leu Arg Ala Glu Gly Ile
225 230 235 240
Pro Val Asp Gly Val Gly His Gln Thr His Ile Asn Ile Glu Trp Pro
245 250 255
Pro Val Ser Gln Ile Val Glu Ser Ile Arg Phe Phe Gly Glu Lys Gly
260 265 270
Leu Asp Asn Gln Val Thr Glu Leu Asp Val Ser Ile Tyr Thr Asn Asp
275 280 285
Lys Asp Ser His Gly Ser Tyr Gln Ala Ile Pro Gln Glu Val Phe Ile
290 295 300
Lys Gln Gly Asn Arg Tyr Lys Glu Leu Phe Glu Gly Leu Lys Ser Val
305 310 315 320
Lys Asn Tyr Leu Ser Asn Val Thr Phe Trp Gly Met Ala Asp Asp His
325 330 335
Thr Trp Leu Asn Arg Trp Pro Ile Glu Arg Pro Asp Ala Pro Leu Pro
340 345 350
Phe Asp Ile Tyr Leu Lys Ala Lys Pro Ala Tyr Trp Gly Ile Val Asp
355 360 365
Ala Leu Lys Leu Ser Arg
370
<210> 341
<211> 1347
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 341
atgacaatta acaacaaaac tacagcgagt cctagtattc ccagcaccca caattccctc 60
ccgtcgcttc gcacactgtt taccaccagc ctgctcacgc tggccctgac cgcctgcggt 120
ggttcttcca gcagcgacaa ggacccttca agctccagct ccagtgaatc atcaagttcc 180
agcgaatcct cgagctcagc ttccagcgaa tcctcgagca gtgagtccag cagtagctct 240
tccgcgggcc atttctccat cgagccggac ttccagctct acagcctggc caacttcccg 300
gtgggcgtgg cggtctccgc cgccaacgag aacgacagca tcttcaacag tccggatgcc 360
gccgaacgtc aggccgttat tattgagcac ttctctcagc tcaccgccgg caacatcatg 420
aaaatgagct acctgcagcc gagtcaaggc aacttcacct tcgatgacgc cgacgagttg 480
gttaacttcg cccaagccaa tggcatgacc gtacacggcc actccaccat ctggcacgcg 540
gactaccaag taccgaactt catgagaaac tttgaaggtg accaggagga atgggcagaa 600
attctgaccg atcacgtcac taccatcatc gagcacttcc ccgacgatgt ggtcatcagc 660
tgggacgtgg tgaacgaggc tgtcgatcaa ggcacggcga acggctggcg ccattcggtg 720
ttctacaatg cattcgacgc cccggaagaa ggcgacattc ccgaatacat caaagtcgct 780
ttccgcgccg cgcgcgaggc tgacgccaac gtagacctct actacaacga ctacgacaat 840
accgccaatg cccagcgcct ggccaaaaca ctgcaaattg ccgaggtact ggacgccgaa 900
ggcaccattg acggcgtcgg tttccagatg cacgcctaca tggattaccc gagcctgacc 960
cattttgaaa acgccttccg gcaagtcgtc gacctggggc tcaaagtgaa agttaccgag 1020
ctggacgtat ccgtagtcaa cccctacggc ggcgaagcac ctccacaacc ggaatacgac 1080
aaagaactgg ccggcgcgca aaaactgcgc ttctgccaaa tcgccgaagt ttacatgaac 1140
actgtacccg aggagttacg cggtggcttc accgtctggg gcctgaccga tgatgaaagt 1200
tggctgatgc aacagttcag aaacgccacc ggcgccgact acgacgacgt ctggccgtta 1260
ctgttcaatg ccgacaaatc cgccaaaccg gcactgcaag gcgtggccga cgcctttacc 1320
ggacaaacct gcacctccga gttctaa 1347
<210> 342
<211> 448
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(45)
<400> 342
Met Thr Ile Asn Asn Lys Thr Thr Ala Ser Pro Ser Ile Pro Ser Thr
1 5 10 15
His Asn Ser Leu Pro Ser Leu Arg Thr Leu Phe Thr Thr Ser Leu Leu
20 25 30
Thr Leu Ala Leu Thr Ala Cys Gly Gly Ser Ser Ser Ser Asp Lys Asp
35 40 45
Pro Ser Ser Ser Ser Ser Ser Glu Ser Ser Ser Ser Ser Glu Ser Ser
50 55 60
Ser Ser Ala Ser Ser Glu Ser Ser Ser Ser Glu Ser Ser Ser Ser Ser
65 70 75 80
Ser Ala Gly His Phe Ser Ile Glu Pro Asp Phe Gln Leu Tyr Ser Leu
85 90 95
Ala Asn Phe Pro Val Gly Val Ala Val Ser Ala Ala Asn Glu Asn Asp
100 105 110
Ser Ile Phe Asn Ser Pro Asp Ala Ala Glu Arg Gln Ala Val Ile Ile
115 120 125
Glu His Phe Ser Gln Leu Thr Ala Gly Asn Ile Met Lys Met Ser Tyr
130 135 140
Leu Gln Pro Ser Gln Gly Asn Phe Thr Phe Asp Asp Ala Asp Glu Leu
145 150 155 160
Val Asn Phe Ala Gln Ala Asn Gly Met Thr Val His Gly His Ser Thr
165 170 175
Ile Trp His Ala Asp Tyr Gln Val Pro Asn Phe Met Arg Asn Phe Glu
180 185 190
Gly Asp Gln Glu Glu Trp Ala Glu Ile Leu Thr Asp His Val Thr Thr
195 200 205
Ile Ile Glu His Phe Pro Asp Asp Val Val Ile Ser Trp Asp Val Val
210 215 220
Asn Glu Ala Val Asp Gln Gly Thr Ala Asn Gly Trp Arg His Ser Val
225 230 235 240
Phe Tyr Asn Ala Phe Asp Ala Pro Glu Glu Gly Asp Ile Pro Glu Tyr
245 250 255
Ile Lys Val Ala Phe Arg Ala Ala Arg Glu Ala Asp Ala Asn Val Asp
260 265 270
Leu Tyr Tyr Asn Asp Tyr Asp Asn Thr Ala Asn Ala Gln Arg Leu Ala
275 280 285
Lys Thr Leu Gln Ile Ala Glu Val Leu Asp Ala Glu Gly Thr Ile Asp
290 295 300
Gly Val Gly Phe Gln Met His Ala Tyr Met Asp Tyr Pro Ser Leu Thr
305 310 315 320
His Phe Glu Asn Ala Phe Arg Gln Val Val Asp Leu Gly Leu Lys Val
325 330 335
Lys Val Thr Glu Leu Asp Val Ser Val Val Asn Pro Tyr Gly Gly Glu
340 345 350
Ala Pro Pro Gln Pro Glu Tyr Asp Lys Glu Leu Ala Gly Ala Gln Lys
355 360 365
Leu Arg Phe Cys Gln Ile Ala Glu Val Tyr Met Asn Thr Val Pro Glu
370 375 380
Glu Leu Arg Gly Gly Phe Thr Val Trp Gly Leu Thr Asp Asp Glu Ser
385 390 395 400
Trp Leu Met Gln Gln Phe Arg Asn Ala Thr Gly Ala Asp Tyr Asp Asp
405 410 415
Val Trp Pro Leu Leu Phe Asn Ala Asp Lys Ser Ala Lys Pro Ala Leu
420 425 430
Gln Gly Val Ala Asp Ala Phe Thr Gly Gln Thr Cys Thr Ser Glu Phe
435 440 445
<210> 343
<211> 2217
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 343
atggtggagc acgaagctga gcttcatgat taccgcgaac gaatatgcga agttgcttgg 60
caattcgctg ggcctggagg gcgagaaggc aaagcggatt ttgcgggaaa tcaacaactg 120
gctgttttga agatgaaatt atcgagaggg agggggcatg gcgttttgaa acgagcaggt 180
ctgattgggc ttattgcagc gatattgggc tgcgcggcgc tgcttatgca caatgagatc 240
tcatccctgg gaattcagct gagatcatgg ctcagaggga gcgacaatgt gaacgctagc 300
tgggaaaagg attggaagac ggctgctaac gagcaaatcg agcagctccg caagcgcaat 360
gtggagatcg aggtcgtcga tctgaacgga aacccgctgc ctggggctac cgttcgcgcg 420
gttcagcgca cgcatcagtt tggcttcggc accgccatca accgaacggc gttgagcaat 480
ccggtgtacg ccgattttgt caaaaaccgt ttcgaatggg tgaccttcga gaacgaggcc 540
aagtggctct ggaatgaggc cgtacaaggg cgggtctatt atcgggaggc cgatcagctg 600
ctcgaatttg ccaggcaaaa cgggctgaag gtgcgcggac ataatctgtt ctgggaggcg 660
gagaaatatc agccgcagtg ggtgaagagt ctgacgggcg ctgcgctgaa ggaagcgatc 720
gataaccggc tgaacagcgc cgtcctgcat tttaagggca attttctgca ctgggacgtc 780
aacaacgaaa tgtttcacgg cagcttcttc aaggatcgcc tgggggaaga aatctggacc 840
tatatgtata agcgaacccg ggaactcgat cccggcgtca agctgttcgt caacgattac 900
aattttatcg agtacccgcc ggagcgggat tataaccagg tcattcaagc gctcatcgat 960
cgggggatgc cgattgacgg catcggcgcg caagggcatt ttaacggagt catcgatccc 1020
ttgttcgtta agggaagact ggataagctg gctgagctga atctgccgat ctggattacc 1080
gaattcgatt ccacgcataa ggacgagaga gtccgtgccg ataatctgga gaagatgtat 1140
cggctggcgt tcgcccatcc ggcggtcgaa gggattgtca tgtggggctt ctgggcgggc 1200
tcccattgga agggcactga cggcgcgatc gtgaatcaag actggacgct caatgccgcc 1260
ggacagcgat accagcagct tatggatgaa tggacgacgg tcgtcgaagg cacgaccgat 1320
cagcgcggca tgttttcgtt ccgggggttc cacggaacct acgatatgct ggtcgattac 1380
cctggagcgg cggctgtgaa gcagtccttt accttggagc ccggctctgg caatgcgaag 1440
ctgcacattc cgttcgacgt tcaggacaag tccatcccgg aggctcctgc caagctcagc 1500
gccgctgccg cggattccca ggttatgctg agctggagca aggtcaacgg ggcaaccggc 1560
tatacggtta aaagcgcggt cagcgccgac ggtccctata cgccgattgc ccatcagctg 1620
ctcaccgaga ccttcacgca catcggtcta gtgaaccgga aagattatta ttacgtggtg 1680
agcgccagca accatctagg tgagagcccg gattccgccc cgatccgggc cactccgcgt 1740
gccgcgggcg agttacaaac gaatctcgtg cttcagtacc gctccgctga tggagataac 1800
aactatcaaa tgaagcctca gttcacgatc aagaacgcag gcaaagtgcc catcccgtta 1860
agcgagctga cgatccgcta ctatttcacg ccggagagca cgcagccggt ggataccagg 1920
atcgactggg cccaattcgg agcagagcat gtccagacga cggtcgttcc gccatccgat 1980
gccgcggcgc acgcctatgt cgagctcagc ttcctggagt cggcaggggc catcccttcc 2040
gatacgacat taggcaatat tcagctgcgc atctttaaca gcgatggctc ttcgttcgat 2100
aaaacgaacg attattcctt cgacccgacg aaaaaggctt atacggcgtg ggagaaggtc 2160
acgctttatc ggaacgggga actggtttgg gggatagagc cttggggcgc gaagtaa 2217
<210> 344
<211> 738
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 344
Met Val Glu His Glu Ala Glu Leu His Asp Tyr Arg Glu Arg Ile Cys
1 5 10 15
Glu Val Ala Trp Gln Phe Ala Gly Pro Gly Gly Arg Glu Gly Lys Ala
20 25 30
Asp Phe Ala Gly Asn Gln Gln Leu Ala Val Leu Lys Met Lys Leu Ser
35 40 45
Arg Gly Arg Gly His Gly Val Leu Lys Arg Ala Gly Leu Ile Gly Leu
50 55 60
Ile Ala Ala Ile Leu Gly Cys Ala Ala Leu Leu Met His Asn Glu Ile
65 70 75 80
Ser Ser Leu Gly Ile Gln Leu Arg Ser Trp Leu Arg Gly Ser Asp Asn
85 90 95
Val Asn Ala Ser Trp Glu Lys Asp Trp Lys Thr Ala Ala Asn Glu Gln
100 105 110
Ile Glu Gln Leu Arg Lys Arg Asn Val Glu Ile Glu Val Val Asp Leu
115 120 125
Asn Gly Asn Pro Leu Pro Gly Ala Thr Val Arg Ala Val Gln Arg Thr
130 135 140
His Gln Phe Gly Phe Gly Thr Ala Ile Asn Arg Thr Ala Leu Ser Asn
145 150 155 160
Pro Val Tyr Ala Asp Phe Val Lys Asn Arg Phe Glu Trp Val Thr Phe
165 170 175
Glu Asn Glu Ala Lys Trp Leu Trp Asn Glu Ala Val Gln Gly Arg Val
180 185 190
Tyr Tyr Arg Glu Ala Asp Gln Leu Leu Glu Phe Ala Arg Gln Asn Gly
195 200 205
Leu Lys Val Arg Gly His Asn Leu Phe Trp Glu Ala Glu Lys Tyr Gln
210 215 220
Pro Gln Trp Val Lys Ser Leu Thr Gly Ala Ala Leu Lys Glu Ala Ile
225 230 235 240
Asp Asn Arg Leu Asn Ser Ala Val Leu His Phe Lys Gly Asn Phe Leu
245 250 255
His Trp Asp Val Asn Asn Glu Met Phe His Gly Ser Phe Phe Lys Asp
260 265 270
Arg Leu Gly Glu Glu Ile Trp Thr Tyr Met Tyr Lys Arg Thr Arg Glu
275 280 285
Leu Asp Pro Gly Val Lys Leu Phe Val Asn Asp Tyr Asn Phe Ile Glu
290 295 300
Tyr Pro Pro Glu Arg Asp Tyr Asn Gln Val Ile Gln Ala Leu Ile Asp
305 310 315 320
Arg Gly Met Pro Ile Asp Gly Ile Gly Ala Gln Gly His Phe Asn Gly
325 330 335
Val Ile Asp Pro Leu Phe Val Lys Gly Arg Leu Asp Lys Leu Ala Glu
340 345 350
Leu Asn Leu Pro Ile Trp Ile Thr Glu Phe Asp Ser Thr His Lys Asp
355 360 365
Glu Arg Val Arg Ala Asp Asn Leu Glu Lys Met Tyr Arg Leu Ala Phe
370 375 380
Ala His Pro Ala Val Glu Gly Ile Val Met Trp Gly Phe Trp Ala Gly
385 390 395 400
Ser His Trp Lys Gly Thr Asp Gly Ala Ile Val Asn Gln Asp Trp Thr
405 410 415
Leu Asn Ala Ala Gly Gln Arg Tyr Gln Gln Leu Met Asp Glu Trp Thr
420 425 430
Thr Val Val Glu Gly Thr Thr Asp Gln Arg Gly Met Phe Ser Phe Arg
435 440 445
Gly Phe His Gly Thr Tyr Asp Met Leu Val Asp Tyr Pro Gly Ala Ala
450 455 460
Ala Val Lys Gln Ser Phe Thr Leu Glu Pro Gly Ser Gly Asn Ala Lys
465 470 475 480
Leu His Ile Pro Phe Asp Val Gln Asp Lys Ser Ile Pro Glu Ala Pro
485 490 495
Ala Lys Leu Ser Ala Ala Ala Ala Asp Ser Gln Val Met Leu Ser Trp
500 505 510
Ser Lys Val Asn Gly Ala Thr Gly Tyr Thr Val Lys Ser Ala Val Ser
515 520 525
Ala Asp Gly Pro Tyr Thr Pro Ile Ala His Gln Leu Leu Thr Glu Thr
530 535 540
Phe Thr His Ile Gly Leu Val Asn Arg Lys Asp Tyr Tyr Tyr Val Val
545 550 555 560
Ser Ala Ser Asn His Leu Gly Glu Ser Pro Asp Ser Ala Pro Ile Arg
565 570 575
Ala Thr Pro Arg Ala Ala Gly Glu Leu Gln Thr Asn Leu Val Leu Gln
580 585 590
Tyr Arg Ser Ala Asp Gly Asp Asn Asn Tyr Gln Met Lys Pro Gln Phe
595 600 605
Thr Ile Lys Asn Ala Gly Lys Val Pro Ile Pro Leu Ser Glu Leu Thr
610 615 620
Ile Arg Tyr Tyr Phe Thr Pro Glu Ser Thr Gln Pro Val Asp Thr Arg
625 630 635 640
Ile Asp Trp Ala Gln Phe Gly Ala Glu His Val Gln Thr Thr Val Val
645 650 655
Pro Pro Ser Asp Ala Ala Ala His Ala Tyr Val Glu Leu Ser Phe Leu
660 665 670
Glu Ser Ala Gly Ala Ile Pro Ser Asp Thr Thr Leu Gly Asn Ile Gln
675 680 685
Leu Arg Ile Phe Asn Ser Asp Gly Ser Ser Phe Asp Lys Thr Asn Asp
690 695 700
Tyr Ser Phe Asp Pro Thr Lys Lys Ala Tyr Thr Ala Trp Glu Lys Val
705 710 715 720
Thr Leu Tyr Arg Asn Gly Glu Leu Val Trp Gly Ile Glu Pro Trp Gly
725 730 735
Ala Lys
<210> 345
<211> 849
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 345
atgaagatga cctacatgca tccggctgaa gatacttact cgtttggtca agcggatcag 60
ttggtcaact gggcgaaagc gaatggtatt ggcgtgcacg gccacactct ggtttggcac 120
tccgaatacc aggtacccaa ttggatgaaa aattactctg gtgatgcaac tgcattccaa 180
accatgctca acacccatgt gaaaactgtg gctgagcatt ttgctggcga actggacagc 240
tgggacgttg tgaatgaagt gctggagccg ggctccaatg gttgctggcg tgaaaactct 300
ctgttctacc agaagcttgg caaagacttt gtcgcgaacg cattccgtgc agctcgcgag 360
ggcgatccca atgcagactt gtattacaac gattactcga ctgaaaatgg tgtaacttcc 420
gatgagaagt tcagttgttt gttggaacta gtcgatgagc ttctggaagc ggacgtgccg 480
attacaggtg ttggtttcca aatgcacgtg caggcgacgt ggcctagcaa tgccaacatc 540
ggcaaggcat tcaaagccat cgcggatcgc ggtctgaaag ttaaaatttc tgagctcgat 600
gttcctgtta acaaccctta cggaaccact aatttcccgc aatacagcag ttttaccgcg 660
gaagccgccg agctgcagaa gcagcgctac aagggcatta tgcaagcgta ccttgataac 720
gtaccggcca acctgcgtgg tggtttcacc gtgtggggcg tttgggatgg cgatagctgg 780
atcatgacgt tcagccagta caccaacgct aacgccaacg actggccact gttgttcacc 840
gggccgtag 849
<210> 346
<211> 282
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 346
Met Lys Met Thr Tyr Met His Pro Ala Glu Asp Thr Tyr Ser Phe Gly
1 5 10 15
Gln Ala Asp Gln Leu Val Asn Trp Ala Lys Ala Asn Gly Ile Gly Val
20 25 30
His Gly His Thr Leu Val Trp His Ser Glu Tyr Gln Val Pro Asn Trp
35 40 45
Met Lys Asn Tyr Ser Gly Asp Ala Thr Ala Phe Gln Thr Met Leu Asn
50 55 60
Thr His Val Lys Thr Val Ala Glu His Phe Ala Gly Glu Leu Asp Ser
65 70 75 80
Trp Asp Val Val Asn Glu Val Leu Glu Pro Gly Ser Asn Gly Cys Trp
85 90 95
Arg Glu Asn Ser Leu Phe Tyr Gln Lys Leu Gly Lys Asp Phe Val Ala
100 105 110
Asn Ala Phe Arg Ala Ala Arg Glu Gly Asp Pro Asn Ala Asp Leu Tyr
115 120 125
Tyr Asn Asp Tyr Ser Thr Glu Asn Gly Val Thr Ser Asp Glu Lys Phe
130 135 140
Ser Cys Leu Leu Glu Leu Val Asp Glu Leu Leu Glu Ala Asp Val Pro
145 150 155 160
Ile Thr Gly Val Gly Phe Gln Met His Val Gln Ala Thr Trp Pro Ser
165 170 175
Asn Ala Asn Ile Gly Lys Ala Phe Lys Ala Ile Ala Asp Arg Gly Leu
180 185 190
Lys Val Lys Ile Ser Glu Leu Asp Val Pro Val Asn Asn Pro Tyr Gly
195 200 205
Thr Thr Asn Phe Pro Gln Tyr Ser Ser Phe Thr Ala Glu Ala Ala Glu
210 215 220
Leu Gln Lys Gln Arg Tyr Lys Gly Ile Met Gln Ala Tyr Leu Asp Asn
225 230 235 240
Val Pro Ala Asn Leu Arg Gly Gly Phe Thr Val Trp Gly Val Trp Asp
245 250 255
Gly Asp Ser Trp Ile Met Thr Phe Ser Gln Tyr Thr Asn Ala Asn Ala
260 265 270
Asn Asp Trp Pro Leu Leu Phe Thr Gly Pro
275 280
<210> 347
<211> 1794
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 347
atgcccgttt tgttcgccct gtttcttgtt gcctcgtcct gcgcggcgca gtcgctggcc 60
gggccggttt ccctgcttgg cggagatgcg ggcgcggcgt tccgctatac cgggccatcg 120
gcgggcgcgg cgagcggctc ggccgaatgg gtggcggtgg agaacatgcc gttcacgcac 180
gcctggcggc tgcgcacgaa tccgctgccg gagagcggcg gcaacgaatg ggacctgcgc 240
atccgcgccc gcggagcggc ggctgtttcg gcaggggaca agatcctggc cgagttctgg 300
atgcgctgcg tggagcccga aaacggcgac tgcattctgc gcctgaacgt ggagcgcgac 360
gggtcgccgt ggaccaaatc catcagcaac ccctacccgg tgggccggga gtggcggcgg 420
ttccgcgtgc tgttcgagat gcgggagagc tacgccgccg gcggctacat gatcgatttc 480
tggatgggcc agcaggtgca gacggcggaa gtgggcggga tttccctgct gaattacggt 540
ccgcaggcca cggccgagca gcttggcctg gaccggtttt atgagggcgc ggcggcggac 600
gccgcgtggc ggcaggcggc cgagcagcgg atcgaggaga tccggaaagc gggcatgatc 660
atcgtggcgg tgacgccgga cggcgagccg atcgagggcg ctgaaatccg ggcgaagctg 720
aagcggcacg cgttcgggtg gggcacggct gtggcggcat cacggcttct ggggacggga 780
acggacagcg agcgctaccg caacttcatc cgcgagaact tcaacatggc ggtgctcgag 840
aacgacctga aatggggccc gttcgaagag aaccgcaacc gcgcgatgaa cgcgctgcgc 900
tggctgcatg agaacgggat cacgtggatc cgcgggcaca atctcgtctg gccgggctgg 960
cggtggatgc cgaacgacgt gcgcaacctg gcgaacaatc ccgaggcgct gcggcagcgg 1020
attctggacc gcatccggga cacggccacg gccacgcgcg ggctggtggt gcactgggac 1080
gtcgtcaacg agccggtggc cgagcgcgac gtgctgaaca ttctgggcga cgaggtgatg 1140
gcggactggt tccgcgccgc gaaggagtgc gatcccgagg cgaggatgtt catcaatgag 1200
tacgacattc tggcggcgaa cggggccaat ctgcggaagc agaacgcgta ttaccgcatg 1260
atcgagatgc tgttgaagct cgaggcgccg gtggagggca tcggcttcca gggccacttc 1320
gacacggcca cgccgccgga gcggatgctg gagatcatga accggtacgc ccggctcggg 1380
ctgccgatcg ccatcaccga gtacgatttc gccacggcgg acgaggagct gcaggcgcag 1440
ttcacgcgcg acctgatgat tctcgccttc agccatccgg cggtttcgga cttcctgatg 1500
tggggcttct gggaagggag ccactggaag ccgctgggcg ccatgatccg gcgcgactgg 1560
agcgagaagc cgatgtaccg cgtctggcgc gagctgatct tcgagcgctg gcagacggat 1620
gaaacaggcg tgacgccgga gcacggtgcc atctacgtgc ggggcttcaa gggcgactac 1680
gagatcacgg tgaaggcggg cgggcaggaa gtccgggtgc cgtacacgct gaaagaagac 1740
ggccaggtgc tgtgggtgac ggtgggcggg gcttctgaag agcgcgtgca gtaa 1794
<210> 348
<211> 597
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(20)
<400> 348
Met Pro Val Leu Phe Ala Leu Phe Leu Val Ala Ser Ser Cys Ala Ala
1 5 10 15
Gln Ser Leu Ala Gly Pro Val Ser Leu Leu Gly Gly Asp Ala Gly Ala
20 25 30
Ala Phe Arg Tyr Thr Gly Pro Ser Ala Gly Ala Ala Ser Gly Ser Ala
35 40 45
Glu Trp Val Ala Val Glu Asn Met Pro Phe Thr His Ala Trp Arg Leu
50 55 60
Arg Thr Asn Pro Leu Pro Glu Ser Gly Gly Asn Glu Trp Asp Leu Arg
65 70 75 80
Ile Arg Ala Arg Gly Ala Ala Ala Val Ser Ala Gly Asp Lys Ile Leu
85 90 95
Ala Glu Phe Trp Met Arg Cys Val Glu Pro Glu Asn Gly Asp Cys Ile
100 105 110
Leu Arg Leu Asn Val Glu Arg Asp Gly Ser Pro Trp Thr Lys Ser Ile
115 120 125
Ser Asn Pro Tyr Pro Val Gly Arg Glu Trp Arg Arg Phe Arg Val Leu
130 135 140
Phe Glu Met Arg Glu Ser Tyr Ala Ala Gly Gly Tyr Met Ile Asp Phe
145 150 155 160
Trp Met Gly Gln Gln Val Gln Thr Ala Glu Val Gly Gly Ile Ser Leu
165 170 175
Leu Asn Tyr Gly Pro Gln Ala Thr Ala Glu Gln Leu Gly Leu Asp Arg
180 185 190
Phe Tyr Glu Gly Ala Ala Ala Asp Ala Ala Trp Arg Gln Ala Ala Glu
195 200 205
Gln Arg Ile Glu Glu Ile Arg Lys Ala Gly Met Ile Ile Val Ala Val
210 215 220
Thr Pro Asp Gly Glu Pro Ile Glu Gly Ala Glu Ile Arg Ala Lys Leu
225 230 235 240
Lys Arg His Ala Phe Gly Trp Gly Thr Ala Val Ala Ala Ser Arg Leu
245 250 255
Leu Gly Thr Gly Thr Asp Ser Glu Arg Tyr Arg Asn Phe Ile Arg Glu
260 265 270
Asn Phe Asn Met Ala Val Leu Glu Asn Asp Leu Lys Trp Gly Pro Phe
275 280 285
Glu Glu Asn Arg Asn Arg Ala Met Asn Ala Leu Arg Trp Leu His Glu
290 295 300
Asn Gly Ile Thr Trp Ile Arg Gly His Asn Leu Val Trp Pro Gly Trp
305 310 315 320
Arg Trp Met Pro Asn Asp Val Arg Asn Leu Ala Asn Asn Pro Glu Ala
325 330 335
Leu Arg Gln Arg Ile Leu Asp Arg Ile Arg Asp Thr Ala Thr Ala Thr
340 345 350
Arg Gly Leu Val Val His Trp Asp Val Val Asn Glu Pro Val Ala Glu
355 360 365
Arg Asp Val Leu Asn Ile Leu Gly Asp Glu Val Met Ala Asp Trp Phe
370 375 380
Arg Ala Ala Lys Glu Cys Asp Pro Glu Ala Arg Met Phe Ile Asn Glu
385 390 395 400
Tyr Asp Ile Leu Ala Ala Asn Gly Ala Asn Leu Arg Lys Gln Asn Ala
405 410 415
Tyr Tyr Arg Met Ile Glu Met Leu Leu Lys Leu Glu Ala Pro Val Glu
420 425 430
Gly Ile Gly Phe Gln Gly His Phe Asp Thr Ala Thr Pro Pro Glu Arg
435 440 445
Met Leu Glu Ile Met Asn Arg Tyr Ala Arg Leu Gly Leu Pro Ile Ala
450 455 460
Ile Thr Glu Tyr Asp Phe Ala Thr Ala Asp Glu Glu Leu Gln Ala Gln
465 470 475 480
Phe Thr Arg Asp Leu Met Ile Leu Ala Phe Ser His Pro Ala Val Ser
485 490 495
Asp Phe Leu Met Trp Gly Phe Trp Glu Gly Ser His Trp Lys Pro Leu
500 505 510
Gly Ala Met Ile Arg Arg Asp Trp Ser Glu Lys Pro Met Tyr Arg Val
515 520 525
Trp Arg Glu Leu Ile Phe Glu Arg Trp Gln Thr Asp Glu Thr Gly Val
530 535 540
Thr Pro Glu His Gly Ala Ile Tyr Val Arg Gly Phe Lys Gly Asp Tyr
545 550 555 560
Glu Ile Thr Val Lys Ala Gly Gly Gln Glu Val Arg Val Pro Tyr Thr
565 570 575
Leu Lys Glu Asp Gly Gln Val Leu Trp Val Thr Val Gly Gly Ala Ser
580 585 590
Glu Glu Arg Val Gln
595
<210> 349
<211> 1794
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 349
atgcccgttt tgttcgccct gtttcttgtt gcctcgtcct gcgcggcgca gtcgctggcc 60
gggccggttt ccctgcttgg cggagatgcg ggcgcggcgt tccgctatac cgggccatcg 120
gcgggcgcgg cgagcggctc ggccgaatgg gtggcggtgg agaacatgcc gttcacgcac 180
gcctggcggc tgcgcacgaa tccgctgccg gagagcggcg gcaacgaatg ggacctgcgc 240
atccgcgccc gcggagcggc ggctgtttcg gcaggggaca agatcctggc cgagttctgg 300
atgcgctgcg tggagcccga aaacggcgac tgcattctgc gcctgaacgt ggagcgcgac 360
gggtcgccgt ggaccaaatc catcagcaac ccctacccgg tgggccggga gtggcggcgg 420
ttccgcgtgc tgttcgagat gcgggagagc tacgccgccg gcggctacat gatcgatttc 480
tggatgggcc agcaggtgca gacggcggaa gtgggcggga tttccctgct gaattacggt 540
ccgcaggcca cggccgagca gcttggcctg gaccggttct atgaaggcgc ggcggcggac 600
gccgcgtggc ggcaggcggc cgagcagcgg atcgaggaga tccggaaagc gggcatgatc 660
atcgtggcgg tgacgccgga cggcgagccg atcgaaggcg ccgagatccg ggcgaagctg 720
aagcggcacg cgttcgggtg gggcacggcg gtggcggcat cacggcttct ggggacggga 780
acggacagcg agcgctaccg caacttcatc cgcgagaact tcaacatggc ggtgctcgag 840
aacgacctga aatggggccc gttcgaggag aaccgcgccc gcgcaatgaa cgcgctgcgc 900
tggctgcatg agaacgggat cacgtggatc cgcgggcaca atctcgtctg gccaggctgg 960
cggtggatgc cgagcgacgt gcgcaacctg gcgaacaatc ccgaagccct gcggcagcgg 1020
attctggacc gcatccggga cacggccacc gccacgcgcg ggctggtcgt gcactgggac 1080
gtcgtcaacg agccggtggc cgagcgcgac gtgctgaaca ttctgggcga cgaggtgatg 1140
gcggactggt tccgcgccgc gaaggagtgc gatcccgagg cgaggatgtt catcaacgaa 1200
tacgacattc tggcggcgaa cggggccaac ctgcggaagc agaacgcgta ctaccgcatg 1260
atcgagatgc tgttgaagct cgaggcgccg gtagagggca tcggcttcca gggccatttc 1320
gacacggcta cgccgccgga gcggatgctg gagatcatga accggtacgc ccggctcggg 1380
ctgccgatcg ccatcaccga gtacgatttc gccacggtag acgaagagct gcaggcgcag 1440
ttcacgcgcg acctgatgat tctcgctttc agccatccgg cggtttcgga cttcttgatg 1500
tggggcttct gggaagggag ccactggaag ccgctgggcg ccatgatccg gcgcgactgg 1560
agcgagaagc cgatgtaccg cgtctggcgc gagctgatct tcgagcgctg gcagacggat 1620
gaaacgggag tgacgccgga gcacggggcc atctacgtgc ggggcttcaa gggcgactac 1680
gaaatcacgg tgaaggctgg cgggcaggaa gtccgggtgc cgtacacgct gaaagaagac 1740
ggccaggtgc tgtgggtgac ggtgggcggt acttctgaag agcaggcgcc gtaa 1794
<210> 350
<211> 597
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(20)
<400> 350
Met Pro Val Leu Phe Ala Leu Phe Leu Val Ala Ser Ser Cys Ala Ala
1 5 10 15
Gln Ser Leu Ala Gly Pro Val Ser Leu Leu Gly Gly Asp Ala Gly Ala
20 25 30
Ala Phe Arg Tyr Thr Gly Pro Ser Ala Gly Ala Ala Ser Gly Ser Ala
35 40 45
Glu Trp Val Ala Val Glu Asn Met Pro Phe Thr His Ala Trp Arg Leu
50 55 60
Arg Thr Asn Pro Leu Pro Glu Ser Gly Gly Asn Glu Trp Asp Leu Arg
65 70 75 80
Ile Arg Ala Arg Gly Ala Ala Ala Val Ser Ala Gly Asp Lys Ile Leu
85 90 95
Ala Glu Phe Trp Met Arg Cys Val Glu Pro Glu Asn Gly Asp Cys Ile
100 105 110
Leu Arg Leu Asn Val Glu Arg Asp Gly Ser Pro Trp Thr Lys Ser Ile
115 120 125
Ser Asn Pro Tyr Pro Val Gly Arg Glu Trp Arg Arg Phe Arg Val Leu
130 135 140
Phe Glu Met Arg Glu Ser Tyr Ala Ala Gly Gly Tyr Met Ile Asp Phe
145 150 155 160
Trp Met Gly Gln Gln Val Gln Thr Ala Glu Val Gly Gly Ile Ser Leu
165 170 175
Leu Asn Tyr Gly Pro Gln Ala Thr Ala Glu Gln Leu Gly Leu Asp Arg
180 185 190
Phe Tyr Glu Gly Ala Ala Ala Asp Ala Ala Trp Arg Gln Ala Ala Glu
195 200 205
Gln Arg Ile Glu Glu Ile Arg Lys Ala Gly Met Ile Ile Val Ala Val
210 215 220
Thr Pro Asp Gly Glu Pro Ile Glu Gly Ala Glu Ile Arg Ala Lys Leu
225 230 235 240
Lys Arg His Ala Phe Gly Trp Gly Thr Ala Val Ala Ala Ser Arg Leu
245 250 255
Leu Gly Thr Gly Thr Asp Ser Glu Arg Tyr Arg Asn Phe Ile Arg Glu
260 265 270
Asn Phe Asn Met Ala Val Leu Glu Asn Asp Leu Lys Trp Gly Pro Phe
275 280 285
Glu Glu Asn Arg Ala Arg Ala Met Asn Ala Leu Arg Trp Leu His Glu
290 295 300
Asn Gly Ile Thr Trp Ile Arg Gly His Asn Leu Val Trp Pro Gly Trp
305 310 315 320
Arg Trp Met Pro Ser Asp Val Arg Asn Leu Ala Asn Asn Pro Glu Ala
325 330 335
Leu Arg Gln Arg Ile Leu Asp Arg Ile Arg Asp Thr Ala Thr Ala Thr
340 345 350
Arg Gly Leu Val Val His Trp Asp Val Val Asn Glu Pro Val Ala Glu
355 360 365
Arg Asp Val Leu Asn Ile Leu Gly Asp Glu Val Met Ala Asp Trp Phe
370 375 380
Arg Ala Ala Lys Glu Cys Asp Pro Glu Ala Arg Met Phe Ile Asn Glu
385 390 395 400
Tyr Asp Ile Leu Ala Ala Asn Gly Ala Asn Leu Arg Lys Gln Asn Ala
405 410 415
Tyr Tyr Arg Met Ile Glu Met Leu Leu Lys Leu Glu Ala Pro Val Glu
420 425 430
Gly Ile Gly Phe Gln Gly His Phe Asp Thr Ala Thr Pro Pro Glu Arg
435 440 445
Met Leu Glu Ile Met Asn Arg Tyr Ala Arg Leu Gly Leu Pro Ile Ala
450 455 460
Ile Thr Glu Tyr Asp Phe Ala Thr Val Asp Glu Glu Leu Gln Ala Gln
465 470 475 480
Phe Thr Arg Asp Leu Met Ile Leu Ala Phe Ser His Pro Ala Val Ser
485 490 495
Asp Phe Leu Met Trp Gly Phe Trp Glu Gly Ser His Trp Lys Pro Leu
500 505 510
Gly Ala Met Ile Arg Arg Asp Trp Ser Glu Lys Pro Met Tyr Arg Val
515 520 525
Trp Arg Glu Leu Ile Phe Glu Arg Trp Gln Thr Asp Glu Thr Gly Val
530 535 540
Thr Pro Glu His Gly Ala Ile Tyr Val Arg Gly Phe Lys Gly Asp Tyr
545 550 555 560
Glu Ile Thr Val Lys Ala Gly Gly Gln Glu Val Arg Val Pro Tyr Thr
565 570 575
Leu Lys Glu Asp Gly Gln Val Leu Trp Val Thr Val Gly Gly Thr Ser
580 585 590
Glu Glu Gln Ala Pro
595
<210> 351
<211> 1860
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 351
atgcaccttc caaattaccg ctcgctcgca acggcgctca gtcgctacag ttgctcggcg 60
ctgctggccg tcagtcttgt ggcctgcggg ggcaataatg accaagatcc gccgaccccg 120
gagccaactc cggtcccaac gccgactcca actccaaccc cgaccccgac tccggagcca 180
accccgactc cgactccgga gcccactccg actccagagc caactccgac gccgaccccg 240
gaaccaacac cgacgccgga gccgacgcca acaccggatc ccggggccga ctaccagccg 300
cccagcaatg acattgccgt caatggcgac gtggaaagcg gtactaccaa ctggggtgca 360
cgcggttcgg catccattag ccgagtcact ttagagagct ttgaaggtga tgccagcttg 420
agtgttaccg gccgagaaga cgactggcat ggcgccacct tctctgtagg ccatctgacc 480
ccgggtaata gctatgaagt ggctgcgtgg gtcaagttag cctcaggcga gcccaacaca 540
gtggtcaaaa tcacgggtaa gcgcgagggc gagagcgcga cttacgaaga gtacacggat 600
gtcggtacgg cattggctac cgacggtagc tggaccgaaa ttaccggcac ttatattcct 660
gatagcgcca gcccatttga atattttatt gtggagaccc aagagggtgg accgaccgtt 720
agcttctacg tggacgcgtt ttcagtggcc ggtgaggtgg aagatacgcc agcgccaacg 780
ccgcccccaa ccgctccgcc accgagtggc tcaggcctag cggaactagt ggatttcccg 840
gtgggcgttg ccgttgcggt agctagtttt gccaataacg atttcctgag taacacgcaa 900
caacaagata tcgtgcttaa caattttagt gaaattgttg cggagaatca gatgaagatg 960
gaatatttca acgatgacta ctccaacccc agggcagatc aactggtcag ctgggccaat 1020
gagcgaggta ttcgggttca cggccacgct ttggtctggc acgcgcaagc agcgtcatgg 1080
gtcagtcctc cggtaagcaa ctttcgcgag cgttatgtca accatgttcg tggtgtggca 1140
tcccggtatg cggacacggt agtaagctgg gatgtcgtca atgaagcttt gaccgatgat 1200
gatgtctccc cgggtggaag ctactaccgg caatctgagt tctaccgaca gttcaatggc 1260
ccagagttca ttgatatcgc tttccgtgaa gctcgagagg cagcccccaa tgcgctgctt 1320
tactacaacg actacaatat tgagaacgga ctggacaaaa ccgatggttt gattcagcta 1380
cttgagaggt tgagggataa tgacgtgccc attgatggcg tgggcttcca aatgcatgtt 1440
ttgttggatt ggcccgatat cagcactatt cgacgttcct gggagcgcgc attagcggtt 1500
gaccccgatg accgtatgct tttaaaaata acggaactcg atgtgcgtat caacaatccc 1560
tacgacgata atctcgaaag aggcatcgtt cactccagcc ggggtgactg cgatgacatt 1620
tccggggtct gcgaaggctt tgagcggcaa gccgctcgtt accgggagat tattgaggcc 1680
tactttgacg tcgtgccacc gcaccgccga ggtggcatca gtgtttgggg tattgccgac 1740
cattatagtt ggtattatac ccatgaaggc tatgtcgatt ggcccctttt gtgggacagg 1800
aacctacagc caaagcctgc ttacaacgct gtttatgaag ctctgcagca gggccaataa 1860
<210> 352
<211> 619
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(73)
<400> 352
Met His Leu Pro Asn Tyr Arg Ser Leu Ala Thr Ala Leu Ser Arg Tyr
1 5 10 15
Ser Cys Ser Ala Leu Leu Ala Val Ser Leu Val Ala Cys Gly Gly Asn
20 25 30
Asn Asp Gln Asp Pro Pro Thr Pro Glu Pro Thr Pro Val Pro Thr Pro
35 40 45
Thr Pro Thr Pro Thr Pro Thr Pro Thr Pro Glu Pro Thr Pro Thr Pro
50 55 60
Thr Pro Glu Pro Thr Pro Thr Pro Glu Pro Thr Pro Thr Pro Thr Pro
65 70 75 80
Glu Pro Thr Pro Thr Pro Glu Pro Thr Pro Thr Pro Asp Pro Gly Ala
85 90 95
Asp Tyr Gln Pro Pro Ser Asn Asp Ile Ala Val Asn Gly Asp Val Glu
100 105 110
Ser Gly Thr Thr Asn Trp Gly Ala Arg Gly Ser Ala Ser Ile Ser Arg
115 120 125
Val Thr Leu Glu Ser Phe Glu Gly Asp Ala Ser Leu Ser Val Thr Gly
130 135 140
Arg Glu Asp Asp Trp His Gly Ala Thr Phe Ser Val Gly His Leu Thr
145 150 155 160
Pro Gly Asn Ser Tyr Glu Val Ala Ala Trp Val Lys Leu Ala Ser Gly
165 170 175
Glu Pro Asn Thr Val Val Lys Ile Thr Gly Lys Arg Glu Gly Glu Ser
180 185 190
Ala Thr Tyr Glu Glu Tyr Thr Asp Val Gly Thr Ala Leu Ala Thr Asp
195 200 205
Gly Ser Trp Thr Glu Ile Thr Gly Thr Tyr Ile Pro Asp Ser Ala Ser
210 215 220
Pro Phe Glu Tyr Phe Ile Val Glu Thr Gln Glu Gly Gly Pro Thr Val
225 230 235 240
Ser Phe Tyr Val Asp Ala Phe Ser Val Ala Gly Glu Val Glu Asp Thr
245 250 255
Pro Ala Pro Thr Pro Pro Pro Thr Ala Pro Pro Pro Ser Gly Ser Gly
260 265 270
Leu Ala Glu Leu Val Asp Phe Pro Val Gly Val Ala Val Ala Val Ala
275 280 285
Ser Phe Ala Asn Asn Asp Phe Leu Ser Asn Thr Gln Gln Gln Asp Ile
290 295 300
Val Leu Asn Asn Phe Ser Glu Ile Val Ala Glu Asn Gln Met Lys Met
305 310 315 320
Glu Tyr Phe Asn Asp Asp Tyr Ser Asn Pro Arg Ala Asp Gln Leu Val
325 330 335
Ser Trp Ala Asn Glu Arg Gly Ile Arg Val His Gly His Ala Leu Val
340 345 350
Trp His Ala Gln Ala Ala Ser Trp Val Ser Pro Pro Val Ser Asn Phe
355 360 365
Arg Glu Arg Tyr Val Asn His Val Arg Gly Val Ala Ser Arg Tyr Ala
370 375 380
Asp Thr Val Val Ser Trp Asp Val Val Asn Glu Ala Leu Thr Asp Asp
385 390 395 400
Asp Val Ser Pro Gly Gly Ser Tyr Tyr Arg Gln Ser Glu Phe Tyr Arg
405 410 415
Gln Phe Asn Gly Pro Glu Phe Ile Asp Ile Ala Phe Arg Glu Ala Arg
420 425 430
Glu Ala Ala Pro Asn Ala Leu Leu Tyr Tyr Asn Asp Tyr Asn Ile Glu
435 440 445
Asn Gly Leu Asp Lys Thr Asp Gly Leu Ile Gln Leu Leu Glu Arg Leu
450 455 460
Arg Asp Asn Asp Val Pro Ile Asp Gly Val Gly Phe Gln Met His Val
465 470 475 480
Leu Leu Asp Trp Pro Asp Ile Ser Thr Ile Arg Arg Ser Trp Glu Arg
485 490 495
Ala Leu Ala Val Asp Pro Asp Asp Arg Met Leu Leu Lys Ile Thr Glu
500 505 510
Leu Asp Val Arg Ile Asn Asn Pro Tyr Asp Asp Asn Leu Glu Arg Gly
515 520 525
Ile Val His Ser Ser Arg Gly Asp Cys Asp Asp Ile Ser Gly Val Cys
530 535 540
Glu Gly Phe Glu Arg Gln Ala Ala Arg Tyr Arg Glu Ile Ile Glu Ala
545 550 555 560
Tyr Phe Asp Val Val Pro Pro His Arg Arg Gly Gly Ile Ser Val Trp
565 570 575
Gly Ile Ala Asp His Tyr Ser Trp Tyr Tyr Thr His Glu Gly Tyr Val
580 585 590
Asp Trp Pro Leu Leu Trp Asp Arg Asn Leu Gln Pro Lys Pro Ala Tyr
595 600 605
Asn Ala Val Tyr Glu Ala Leu Gln Gln Gly Gln
610 615
<210> 353
<211> 1983
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 353
atggtttgct cggccgccct cggggcgacc gccgtcagtg cccaaacctt gagcaacaac 60
tcaaccggta ccaacaacgg tttctactac accttttgga aggactcggg cagcgcgacc 120
atgaccctcg cagcgggtgg tcgttacacc tcccaatgga ccaacaacac caataactgg 180
gtgggtggta aaggctggaa cccgggcaat agcacccgcg tgatcagcta ttccggtaac 240
tatggcgtca gcaatagcca aaattcctac ctggccttgt acggctggac ccgcagcccg 300
ctgattgaat actacgtgat cgaaagctac ggctcctaca acccggcatc ctgctctggc 360
ggtaccaata tgggtagctt ccagagtgat ggcgcgacct acgatgtgcg ccgttgccag 420
cgcgtgcaac agccatccat cgatggcacc caaaccttct accaatattt cagcgtgcgc 480
aatccgaaaa aaggcttcgg ccaaatttcc ggcaccatca cctttgctaa ccacgcagcc 540
ttttgggcga gcaagggcat gaacctgggt gcccataact atcaagtaat ggcgaccgag 600
ggttatcaaa gtaccggcag ttccgatatc acagtgagtg aaggccccat caacggcggc 660
accagcagca cgcccccggt aacaaccagc agcagtgcca gctcagtggc aacgggcggt 720
ggtaacaccg gtagtggcgt agtggtgcgc gcgcgcggcg tcgcgggcgg cgagcatatt 780
aacctgcgta tcggtggcaa taccgtcgcc agctggaacc tcaccaccag cttccaggat 840
ctcagctaca gcggcaccgc gtcgggcgat atccaggtgc aatatgacaa cgacggcggc 900
agccgcgatg tcgtagtgga ttacatccgc gttaacggcg aaacccgcca ggcggaggat 960
atgagctaca acaccgcctt gtacgcgaat ggttcctgcg gtggcggcgg caattccgaa 1020
ctgatgcact gcaatggcgt gatcggtttt ggctacacct atgattgctt cagcggcaac 1080
tgctccggcg gcagcacggg gggtggcaac actggcacca gcagcagcgc ggcgagcgcc 1140
ggtggtggca acagcaactg ctccggctat gttggtatta ctttcgacga tggcccaacc 1200
gctaacactc ccaccctggt taacctgttg aagcaaaaca acctgacgcc ggtaacctgg 1260
ttcaaccagg gcaacaacgt ggttgccaat gccaattaca tggcccagca attgagcgtt 1320
ggtgaagtac ataaccacag ctacagccat ccgcaaatgg gcagcatgac ctaccaacag 1380
gtttatgacg agttgaaccg tgccaaccag gctatccaaa ccgcgggtgc acccaagcca 1440
accctgttcc gcccacctta tggcaccgtt aactccacca tccaacaagc ggcccaggcc 1500
ttgggtttgc gggtgatcac ctgggatgtg gattcgcaag actggaatgg cgccactgcc 1560
tcggccatcg ccagcgcagc taaccgcctg acaaacggcc aggtaatcct gatgcacgac 1620
ggcagctaca ccaacaccaa tgccgctatt gcccagatcg cctccagcct gcgcgccaag 1680
ggcttgtgcc cgggtcgtat cgatccggca accggccgag ccgttgctcc tgcgggtggc 1740
aatactggcg gcggtactgt gtcaagcagc actcgcagca gcactccggt agtggtaagc 1800
agcagccgta gcagcagtag tgttgccgct ggcggcgcct gccaatgcaa ttggtggggc 1860
acccgttacc cgatctgtac gtccactgcc agtggttggg gttgggagaa caaccgcagc 1920
tgtatcacca ccagcacctg taacagtcag ggccctggcg gtggtggggt agtgtgtaac 1980
taa 1983
<210> 354
<211> 660
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(18)
<400> 354
Met Val Cys Ser Ala Ala Leu Gly Ala Thr Ala Val Ser Ala Gln Thr
1 5 10 15
Leu Ser Asn Asn Ser Thr Gly Thr Asn Asn Gly Phe Tyr Tyr Thr Phe
20 25 30
Trp Lys Asp Ser Gly Ser Ala Thr Met Thr Leu Ala Ala Gly Gly Arg
35 40 45
Tyr Thr Ser Gln Trp Thr Asn Asn Thr Asn Asn Trp Val Gly Gly Lys
50 55 60
Gly Trp Asn Pro Gly Asn Ser Thr Arg Val Ile Ser Tyr Ser Gly Asn
65 70 75 80
Tyr Gly Val Ser Asn Ser Gln Asn Ser Tyr Leu Ala Leu Tyr Gly Trp
85 90 95
Thr Arg Ser Pro Leu Ile Glu Tyr Tyr Val Ile Glu Ser Tyr Gly Ser
100 105 110
Tyr Asn Pro Ala Ser Cys Ser Gly Gly Thr Asn Met Gly Ser Phe Gln
115 120 125
Ser Asp Gly Ala Thr Tyr Asp Val Arg Arg Cys Gln Arg Val Gln Gln
130 135 140
Pro Ser Ile Asp Gly Thr Gln Thr Phe Tyr Gln Tyr Phe Ser Val Arg
145 150 155 160
Asn Pro Lys Lys Gly Phe Gly Gln Ile Ser Gly Thr Ile Thr Phe Ala
165 170 175
Asn His Ala Ala Phe Trp Ala Ser Lys Gly Met Asn Leu Gly Ala His
180 185 190
Asn Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln Ser Thr Gly Ser Ser
195 200 205
Asp Ile Thr Val Ser Glu Gly Pro Ile Asn Gly Gly Thr Ser Ser Thr
210 215 220
Pro Pro Val Thr Thr Ser Ser Ser Ala Ser Ser Val Ala Thr Gly Gly
225 230 235 240
Gly Asn Thr Gly Ser Gly Val Val Val Arg Ala Arg Gly Val Ala Gly
245 250 255
Gly Glu His Ile Asn Leu Arg Ile Gly Gly Asn Thr Val Ala Ser Trp
260 265 270
Asn Leu Thr Thr Ser Phe Gln Asp Leu Ser Tyr Ser Gly Thr Ala Ser
275 280 285
Gly Asp Ile Gln Val Gln Tyr Asp Asn Asp Gly Gly Ser Arg Asp Val
290 295 300
Val Val Asp Tyr Ile Arg Val Asn Gly Glu Thr Arg Gln Ala Glu Asp
305 310 315 320
Met Ser Tyr Asn Thr Ala Leu Tyr Ala Asn Gly Ser Cys Gly Gly Gly
325 330 335
Gly Asn Ser Glu Leu Met His Cys Asn Gly Val Ile Gly Phe Gly Tyr
340 345 350
Thr Tyr Asp Cys Phe Ser Gly Asn Cys Ser Gly Gly Ser Thr Gly Gly
355 360 365
Gly Asn Thr Gly Thr Ser Ser Ser Ala Ala Ser Ala Gly Gly Gly Asn
370 375 380
Ser Asn Cys Ser Gly Tyr Val Gly Ile Thr Phe Asp Asp Gly Pro Thr
385 390 395 400
Ala Asn Thr Pro Thr Leu Val Asn Leu Leu Lys Gln Asn Asn Leu Thr
405 410 415
Pro Val Thr Trp Phe Asn Gln Gly Asn Asn Val Val Ala Asn Ala Asn
420 425 430
Tyr Met Ala Gln Gln Leu Ser Val Gly Glu Val His Asn His Ser Tyr
435 440 445
Ser His Pro Gln Met Gly Ser Met Thr Tyr Gln Gln Val Tyr Asp Glu
450 455 460
Leu Asn Arg Ala Asn Gln Ala Ile Gln Thr Ala Gly Ala Pro Lys Pro
465 470 475 480
Thr Leu Phe Arg Pro Pro Tyr Gly Thr Val Asn Ser Thr Ile Gln Gln
485 490 495
Ala Ala Gln Ala Leu Gly Leu Arg Val Ile Thr Trp Asp Val Asp Ser
500 505 510
Gln Asp Trp Asn Gly Ala Thr Ala Ser Ala Ile Ala Ser Ala Ala Asn
515 520 525
Arg Leu Thr Asn Gly Gln Val Ile Leu Met His Asp Gly Ser Tyr Thr
530 535 540
Asn Thr Asn Ala Ala Ile Ala Gln Ile Ala Ser Ser Leu Arg Ala Lys
545 550 555 560
Gly Leu Cys Pro Gly Arg Ile Asp Pro Ala Thr Gly Arg Ala Val Ala
565 570 575
Pro Ala Gly Gly Asn Thr Gly Gly Gly Thr Val Ser Ser Ser Thr Arg
580 585 590
Ser Ser Thr Pro Val Val Val Ser Ser Ser Arg Ser Ser Ser Ser Val
595 600 605
Ala Ala Gly Gly Ala Cys Gln Cys Asn Trp Trp Gly Thr Arg Tyr Pro
610 615 620
Ile Cys Thr Ser Thr Ala Ser Gly Trp Gly Trp Glu Asn Asn Arg Ser
625 630 635 640
Cys Ile Thr Thr Ser Thr Cys Asn Ser Gln Gly Pro Gly Gly Gly Gly
645 650 655
Val Val Cys Asn
660
<210> 355
<211> 1125
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 355
atgaaacgaa ccatcttctt aagactctta gccggcgccc tcctctccgc cgcggccctc 60
gcggccgggg ggtgccggcc ctctagtccc ccgaaggtcg agatcgaggc caatatcccc 120
tccctcaaag aggtctgcgc ttcttatttc gagatcggcg cggccgtcga gccgtatcag 180
ttatcctctc caccccacga tgcccttctg cggaaacatt ttaactgcct cgtggcggag 240
aacgtcatga agcccgcctc catccagcct tcggaggggt atttcaactg gaccgaagca 300
gacaagatcg tgaactacgc caaagcccac gggatgaagc tccgcttcca taccctcgtc 360
tggcataatc aggtcccgga ttggttcttc gcgggtaacg acaaaaccct ccttttgcag 420
cgcttggaga atcatatccg gactatcatt aaaagatatg gcgataaggt cgactattgg 480
gacgtggtaa atgaggctat agacccgagc caaccggatg gcatgaggag gagcaaatgg 540
taccagatca ccgggaagga ctacatcaag accgccttcc gggtggcaga cgacgagctc 600
aggaagaatg ggtggaggaa agaaggtcgt cagctctata tcaacgacta caacacccat 660
gatccgacga agagagagta catctggcgc ttgatcgatg agcttcaaac ggaagggatt 720
cccgtcgacg gagtaggcca ccagacgcat atcaatatcg aatggccgcc cgtaaaccag 780
atcgtggact cgatccgctt cttcggggaa aaaggcctcg ataaccaggt gaccgagctg 840
gatgtgagca tatatacgga tagatccagt tcctacggga gttaccaagc gatcccgcag 900
gaagtcttca tcaagcaggg taatcgctac aaggaactct ttgaagggct aaaaagtgta 960
aaaaactacc tcagcaacgt caccttctgg ggcatggcgg acgatcatac ctggctgaac 1020
cattggccca tcgaacggcc cgatgctcct cttcctttcg atatctatct caaggccaag 1080
ccggcgtatt gggggatcgt ggatgctttg aagctttcgc ggtga 1125
<210> 356
<211> 374
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(21)
<400> 356
Met Lys Arg Thr Ile Phe Leu Arg Leu Leu Ala Gly Ala Leu Leu Ser
1 5 10 15
Ala Ala Ala Leu Ala Ala Gly Gly Cys Arg Pro Ser Ser Pro Pro Lys
20 25 30
Val Glu Ile Glu Ala Asn Ile Pro Ser Leu Lys Glu Val Cys Ala Ser
35 40 45
Tyr Phe Glu Ile Gly Ala Ala Val Glu Pro Tyr Gln Leu Ser Ser Pro
50 55 60
Pro His Asp Ala Leu Leu Arg Lys His Phe Asn Cys Leu Val Ala Glu
65 70 75 80
Asn Val Met Lys Pro Ala Ser Ile Gln Pro Ser Glu Gly Tyr Phe Asn
85 90 95
Trp Thr Glu Ala Asp Lys Ile Val Asn Tyr Ala Lys Ala His Gly Met
100 105 110
Lys Leu Arg Phe His Thr Leu Val Trp His Asn Gln Val Pro Asp Trp
115 120 125
Phe Phe Ala Gly Asn Asp Lys Thr Leu Leu Leu Gln Arg Leu Glu Asn
130 135 140
His Ile Arg Thr Ile Ile Lys Arg Tyr Gly Asp Lys Val Asp Tyr Trp
145 150 155 160
Asp Val Val Asn Glu Ala Ile Asp Pro Ser Gln Pro Asp Gly Met Arg
165 170 175
Arg Ser Lys Trp Tyr Gln Ile Thr Gly Lys Asp Tyr Ile Lys Thr Ala
180 185 190
Phe Arg Val Ala Asp Asp Glu Leu Arg Lys Asn Gly Trp Arg Lys Glu
195 200 205
Gly Arg Gln Leu Tyr Ile Asn Asp Tyr Asn Thr His Asp Pro Thr Lys
210 215 220
Arg Glu Tyr Ile Trp Arg Leu Ile Asp Glu Leu Gln Thr Glu Gly Ile
225 230 235 240
Pro Val Asp Gly Val Gly His Gln Thr His Ile Asn Ile Glu Trp Pro
245 250 255
Pro Val Asn Gln Ile Val Asp Ser Ile Arg Phe Phe Gly Glu Lys Gly
260 265 270
Leu Asp Asn Gln Val Thr Glu Leu Asp Val Ser Ile Tyr Thr Asp Arg
275 280 285
Ser Ser Ser Tyr Gly Ser Tyr Gln Ala Ile Pro Gln Glu Val Phe Ile
290 295 300
Lys Gln Gly Asn Arg Tyr Lys Glu Leu Phe Glu Gly Leu Lys Ser Val
305 310 315 320
Lys Asn Tyr Leu Ser Asn Val Thr Phe Trp Gly Met Ala Asp Asp His
325 330 335
Thr Trp Leu Asn His Trp Pro Ile Glu Arg Pro Asp Ala Pro Leu Pro
340 345 350
Phe Asp Ile Tyr Leu Lys Ala Lys Pro Ala Tyr Trp Gly Ile Val Asp
355 360 365
Ala Leu Lys Leu Ser Arg
370
<210> 357
<211> 1155
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 357
atgaataact tcagaaatac atttctaatc gtcgttgtac tggcggtcgt cgtcggcgtg 60
ctgccggcct gcgaagccgg tccgccggaa aatacaagtt cgtccctgca ggaggcatat 120
gcagatgtgt ttctgatcgg caccgcgctc aatctggcac agatcgacgg aagggatgaa 180
caaggcgtac gtctggtgga gcggcatttt aatgcgatta caccagagaa cattacaaaa 240
tggggaccga tacatccggc gccgggcgaa tataatttcg gaccggccga ccggtttgtt 300
gaattcggtg aagcccacga catgttcatg ataggccata cgcttgtatg gcacagccag 360
acgcccggat gggtattcga ggatgaagcc ggaaatccgc tcggccgcga cgagctcatc 420
gaacgcatgc gcgatcatat ccataccgtc gtcggacggt accggggtag aatacacgca 480
tgggacgtcg tcaacgaagc gttgaatgaa gacggaaccc tgcgggaatc cccctggtac 540
cgtatcatcg gcgaggatta cctgttgaaa gcgttcgagt tcgcgcatga agcggacccg 600
gatgccgagc tgtactataa cgattattct ctcgaaaatc ccgccaagcg ggcgggggcg 660
gtacgcctgg tccggtacct gcaggagaac ggggcgccga tacacgggat cggtacccag 720
ggacactact ctcttgactg gccatcgctc gacgagatcg aaagaaccat caccgatttc 780
gccgcgttgg acgtggacgt catggttacc gaacttgaaa tcgacgtcct cccttccgcg 840
ttcgagtatc agggggccga tattgcgatg cgggcggaac tcgaagagcg gttgaatccg 900
tatcccgacg aactgccggc cgaggtcgat gaagcgctta cacagcggta tcgggacatc 960
ttcgaggtat ttctgcggca cagcgacgtt cttacgcgcg taacgttctg gggggtgacc 1020
gatggagatt cgtggaagaa taactggccg gtaccgggaa ggacgaatta tccgctgctg 1080
ttcgaccgcg aatggcagcc aaaaccagca ttttattccg tgatcgaagt tgcggatgag 1140
atgctgaatg aataa 1155
<210> 358
<211> 384
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(25)
<400> 358
Met Asn Asn Phe Arg Asn Thr Phe Leu Ile Val Val Val Leu Ala Val
1 5 10 15
Val Val Gly Val Leu Pro Ala Cys Glu Ala Gly Pro Pro Glu Asn Thr
20 25 30
Ser Ser Ser Leu Gln Glu Ala Tyr Ala Asp Val Phe Leu Ile Gly Thr
35 40 45
Ala Leu Asn Leu Ala Gln Ile Asp Gly Arg Asp Glu Gln Gly Val Arg
50 55 60
Leu Val Glu Arg His Phe Asn Ala Ile Thr Pro Glu Asn Ile Thr Lys
65 70 75 80
Trp Gly Pro Ile His Pro Ala Pro Gly Glu Tyr Asn Phe Gly Pro Ala
85 90 95
Asp Arg Phe Val Glu Phe Gly Glu Ala His Asp Met Phe Met Ile Gly
100 105 110
His Thr Leu Val Trp His Ser Gln Thr Pro Gly Trp Val Phe Glu Asp
115 120 125
Glu Ala Gly Asn Pro Leu Gly Arg Asp Glu Leu Ile Glu Arg Met Arg
130 135 140
Asp His Ile His Thr Val Val Gly Arg Tyr Arg Gly Arg Ile His Ala
145 150 155 160
Trp Asp Val Val Asn Glu Ala Leu Asn Glu Asp Gly Thr Leu Arg Glu
165 170 175
Ser Pro Trp Tyr Arg Ile Ile Gly Glu Asp Tyr Leu Leu Lys Ala Phe
180 185 190
Glu Phe Ala His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr Asn Asp
195 200 205
Tyr Ser Leu Glu Asn Pro Ala Lys Arg Ala Gly Ala Val Arg Leu Val
210 215 220
Arg Tyr Leu Gln Glu Asn Gly Ala Pro Ile His Gly Ile Gly Thr Gln
225 230 235 240
Gly His Tyr Ser Leu Asp Trp Pro Ser Leu Asp Glu Ile Glu Arg Thr
245 250 255
Ile Thr Asp Phe Ala Ala Leu Asp Val Asp Val Met Val Thr Glu Leu
260 265 270
Glu Ile Asp Val Leu Pro Ser Ala Phe Glu Tyr Gln Gly Ala Asp Ile
275 280 285
Ala Met Arg Ala Glu Leu Glu Glu Arg Leu Asn Pro Tyr Pro Asp Glu
290 295 300
Leu Pro Ala Glu Val Asp Glu Ala Leu Thr Gln Arg Tyr Arg Asp Ile
305 310 315 320
Phe Glu Val Phe Leu Arg His Ser Asp Val Leu Thr Arg Val Thr Phe
325 330 335
Trp Gly Val Thr Asp Gly Asp Ser Trp Lys Asn Asn Trp Pro Val Pro
340 345 350
Gly Arg Thr Asn Tyr Pro Leu Leu Phe Asp Arg Glu Trp Gln Pro Lys
355 360 365
Pro Ala Phe Tyr Ser Val Ile Glu Val Ala Asp Glu Met Leu Asn Glu
370 375 380
<210> 359
<211> 2724
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 359
atgacccggt ctgtacgacc aagagcatgg ggggccggcc tactggccct cgcgatggtg 60
gcgacagtcg cccccacggc caccggccac agccacgaca cggcagagcc cgtcgtcgtg 120
gtctacaccg acttcgagaa cgacagcatc gagccgtggg cgcagtccgg cggcccgacg 180
ctgaacatcg tcgaggtcga cggcgggcac gcgctgcgcg tcggcaacca ccagaacacc 240
tgggacggca tccagaccca gcccgccacc acgcggatcg agccgggtgt cgagcacacc 300
ctgtcgatgc gcgtccggct cgtgggcgac ggcacggcga cgacgccggc ccggtggatc 360
ggccgcgacc ccggagccga gaacggctac cagtggatcg gtaacacgac gatctcgacc 420
gagagctgga cgaccatccg gggaacgtgg ctccctcggg cggacgcgaa cgcctcggag 480
ctctatgtct accccgaggt cacaccggtg gccggcttcg actacctcct cgatgacctg 540
ctcatcgagc gtgctgcccc tgtcgacggc ggcgccccgg gcaccgtcgt ctacaccgct 600
ggattcgaga cggacctgga cggctgggag gcacgcgccg acggcgtcgg tgtcggccag 660
ctcgaccgga ccgacgcgga gtcggccgag ggcgactggt ccgcgatcgt gaccgaccgc 720
acctcgcacg gccacggcct gcgcctggac gtcacggaca tcatggacgc gggcgtcacg 780
tacgagatca gcgcccaggt gaagttcgcc gggaccggtg gtccgggcaa catctggctg 840
agccaggagc tggtcgtgga cgggggtagc acctacggca ccgtcctcca ggtccctggc 900
gtcacctcga cagcctggac gcagatcacc acgaactacg tcacgccgac ggccgaccag 960
ctgttcctct acttcgagac gaactggccg gacggcatcg aggacgactt cctcctcgac 1020
gacgtccgca tccgtgtcgc ccctcgggcg atcatccagg aggacctcac tccgctgatg 1080
gacacgctgg acgtgcccat gggtgtcgcg atcgaccagc gtgagacctc cggcagcctc 1140
gcggacctcc tgctgctgca cttcgaccag gtcacggccg agaaccacat gaagccggag 1200
gcgtggtacg acgcggcggg caacttccgc atccacccgc aggcccgcgc catcatggac 1260
ttcgcggcgg agaacgacct gcgcgtcttc ggtcacgtcc tggtgtggca cggccagacc 1320
ccggacttct tcttcacgca cgcggacggc accccgctga cctcgagcga ggccgaccag 1380
gcgatcctgc gcgaccgcat gcgcacgcac atcttcaacg tcgccgaggc cctctccgag 1440
tggggcgagt acggcggcga caacccgctc gtggcctggg acgtcgtcaa cgaggtcgtc 1500
tccgacagcg gcgagcacag cgacggcctg cgccgtagcc gctggtacga cgtgctgggc 1560
gaggagttca tcgacctggc gttcatctac gcgaaccagg cgttcaacgg tgagttcgcc 1620
gctgacgacg ccaaccaccc ggtcacgctc ttcatcaacg actacaacac cgagcagtcc 1680
ggcaagcaga accggtacgc cgcgctcatc gaccgcctca tcgagcgcga ggtcccgatc 1740
gacgccgtgg ggcaccagtt ccacgtcagc ctggccatgc ccatcgcgaa cctgcgcggc 1800
gccctcgagc gcttccagga caccgggctg atccagggcg tcaccgagct cgacgtcacc 1860
gtcggcaaca acccgaccga ggcgctgctc gtcgagcagg gctactacta ccgggacgcc 1920
ttccggctgt tccgtgagtt cacggaggac ctctactcgg tcaccgtgtg gggtctcacc 1980
gacgaccgca gctggcgcag cgctcaggcg ccgctgctgt tcgacgcggg cctgcaggcc 2040
aagccggcct actacggcgc catcgacgcc gacctggacg cacgcgtgcg tgcggcctac 2100
gtgttcgccg aggacatcgc cctcgacgag gccgcgctga cgagccccac ctgggaccgt 2160
ctgccgctgc accagatcga cggggccggc gagttccagc tccgctgggc ggccgaccac 2220
ctcacggtgt tcgtccacgt caccgacggt gacgaggtcg agatcgtgct cggcgacgag 2280
acctacacgg tctcgtcgga cggcgagggc gacctggacg cggtcaccgc ggccggggag 2340
aacggctcct ggaccgctgt ggtccgcgtg ccgctcacgg ccgagcaggg cgacaccgcc 2400
cagttcgacc tccggatcat cgacggcgcc accacctccg ggtggaacgt cgaaggtgtc 2460
ctgggcaccc tgaccctggt cgaggagctg tccttcgtcg aggtcgtcga ggcggccgac 2520
cggccgacca tcgacggcga gatcgacgcc gtgtgggagg acgccaacgt cgtcaccacg 2580
gacgtccgta tcgagggcgc tgctgacggc gcgaaggccg agatccggac cctgtgggac 2640
aacaacacgc tgttcgtcct cgcggagatc gccgacccgg tgatcgacgt gacggcctcc 2700
agcccgtggg agcaggactc gctc 2724
<210> 360
<211> 908
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(31)
<400> 360
Met Thr Arg Ser Val Arg Pro Arg Ala Trp Gly Ala Gly Leu Leu Ala
1 5 10 15
Leu Ala Met Val Ala Thr Val Ala Pro Thr Ala Thr Gly His Ser His
20 25 30
Asp Thr Ala Glu Pro Val Val Val Val Tyr Thr Asp Phe Glu Asn Asp
35 40 45
Ser Ile Glu Pro Trp Ala Gln Ser Gly Gly Pro Thr Leu Asn Ile Val
50 55 60
Glu Val Asp Gly Gly His Ala Leu Arg Val Gly Asn His Gln Asn Thr
65 70 75 80
Trp Asp Gly Ile Gln Thr Gln Pro Ala Thr Thr Arg Ile Glu Pro Gly
85 90 95
Val Glu His Thr Leu Ser Met Arg Val Arg Leu Val Gly Asp Gly Thr
100 105 110
Ala Thr Thr Pro Ala Arg Trp Ile Gly Arg Asp Pro Gly Ala Glu Asn
115 120 125
Gly Tyr Gln Trp Ile Gly Asn Thr Thr Ile Ser Thr Glu Ser Trp Thr
130 135 140
Thr Ile Arg Gly Thr Trp Leu Pro Arg Ala Asp Ala Asn Ala Ser Glu
145 150 155 160
Leu Tyr Val Tyr Pro Glu Val Thr Pro Val Ala Gly Phe Asp Tyr Leu
165 170 175
Leu Asp Asp Leu Leu Ile Glu Arg Ala Ala Pro Val Asp Gly Gly Ala
180 185 190
Pro Gly Thr Val Val Tyr Thr Ala Gly Phe Glu Thr Asp Leu Asp Gly
195 200 205
Trp Glu Ala Arg Ala Asp Gly Val Gly Val Gly Gln Leu Asp Arg Thr
210 215 220
Asp Ala Glu Ser Ala Glu Gly Asp Trp Ser Ala Ile Val Thr Asp Arg
225 230 235 240
Thr Ser His Gly His Gly Leu Arg Leu Asp Val Thr Asp Ile Met Asp
245 250 255
Ala Gly Val Thr Tyr Glu Ile Ser Ala Gln Val Lys Phe Ala Gly Thr
260 265 270
Gly Gly Pro Gly Asn Ile Trp Leu Ser Gln Glu Leu Val Val Asp Gly
275 280 285
Gly Ser Thr Tyr Gly Thr Val Leu Gln Val Pro Gly Val Thr Ser Thr
290 295 300
Ala Trp Thr Gln Ile Thr Thr Asn Tyr Val Thr Pro Thr Ala Asp Gln
305 310 315 320
Leu Phe Leu Tyr Phe Glu Thr Asn Trp Pro Asp Gly Ile Glu Asp Asp
325 330 335
Phe Leu Leu Asp Asp Val Arg Ile Arg Val Ala Pro Arg Ala Ile Ile
340 345 350
Gln Glu Asp Leu Thr Pro Leu Met Asp Thr Leu Asp Val Pro Met Gly
355 360 365
Val Ala Ile Asp Gln Arg Glu Thr Ser Gly Ser Leu Ala Asp Leu Leu
370 375 380
Leu Leu His Phe Asp Gln Val Thr Ala Glu Asn His Met Lys Pro Glu
385 390 395 400
Ala Trp Tyr Asp Ala Ala Gly Asn Phe Arg Ile His Pro Gln Ala Arg
405 410 415
Ala Ile Met Asp Phe Ala Ala Glu Asn Asp Leu Arg Val Phe Gly His
420 425 430
Val Leu Val Trp His Gly Gln Thr Pro Asp Phe Phe Phe Thr His Ala
435 440 445
Asp Gly Thr Pro Leu Thr Ser Ser Glu Ala Asp Gln Ala Ile Leu Arg
450 455 460
Asp Arg Met Arg Thr His Ile Phe Asn Val Ala Glu Ala Leu Ser Glu
465 470 475 480
Trp Gly Glu Tyr Gly Gly Asp Asn Pro Leu Val Ala Trp Asp Val Val
485 490 495
Asn Glu Val Val Ser Asp Ser Gly Glu His Ser Asp Gly Leu Arg Arg
500 505 510
Ser Arg Trp Tyr Asp Val Leu Gly Glu Glu Phe Ile Asp Leu Ala Phe
515 520 525
Ile Tyr Ala Asn Gln Ala Phe Asn Gly Glu Phe Ala Ala Asp Asp Ala
530 535 540
Asn His Pro Val Thr Leu Phe Ile Asn Asp Tyr Asn Thr Glu Gln Ser
545 550 555 560
Gly Lys Gln Asn Arg Tyr Ala Ala Leu Ile Asp Arg Leu Ile Glu Arg
565 570 575
Glu Val Pro Ile Asp Ala Val Gly His Gln Phe His Val Ser Leu Ala
580 585 590
Met Pro Ile Ala Asn Leu Arg Gly Ala Leu Glu Arg Phe Gln Asp Thr
595 600 605
Gly Leu Ile Gln Gly Val Thr Glu Leu Asp Val Thr Val Gly Asn Asn
610 615 620
Pro Thr Glu Ala Leu Leu Val Glu Gln Gly Tyr Tyr Tyr Arg Asp Ala
625 630 635 640
Phe Arg Leu Phe Arg Glu Phe Thr Glu Asp Leu Tyr Ser Val Thr Val
645 650 655
Trp Gly Leu Thr Asp Asp Arg Ser Trp Arg Ser Ala Gln Ala Pro Leu
660 665 670
Leu Phe Asp Ala Gly Leu Gln Ala Lys Pro Ala Tyr Tyr Gly Ala Ile
675 680 685
Asp Ala Asp Leu Asp Ala Arg Val Arg Ala Ala Tyr Val Phe Ala Glu
690 695 700
Asp Ile Ala Leu Asp Glu Ala Ala Leu Thr Ser Pro Thr Trp Asp Arg
705 710 715 720
Leu Pro Leu His Gln Ile Asp Gly Ala Gly Glu Phe Gln Leu Arg Trp
725 730 735
Ala Ala Asp His Leu Thr Val Phe Val His Val Thr Asp Gly Asp Glu
740 745 750
Val Glu Ile Val Leu Gly Asp Glu Thr Tyr Thr Val Ser Ser Asp Gly
755 760 765
Glu Gly Asp Leu Asp Ala Val Thr Ala Ala Gly Glu Asn Gly Ser Trp
770 775 780
Thr Ala Val Val Arg Val Pro Leu Thr Ala Glu Gln Gly Asp Thr Ala
785 790 795 800
Gln Phe Asp Leu Arg Ile Ile Asp Gly Ala Thr Thr Ser Gly Trp Asn
805 810 815
Val Glu Gly Val Leu Gly Thr Leu Thr Leu Val Glu Glu Leu Ser Phe
820 825 830
Val Glu Val Val Glu Ala Ala Asp Arg Pro Thr Ile Asp Gly Glu Ile
835 840 845
Asp Ala Val Trp Glu Asp Ala Asn Val Val Thr Thr Asp Val Arg Ile
850 855 860
Glu Gly Ala Ala Asp Gly Ala Lys Ala Glu Ile Arg Thr Leu Trp Asp
865 870 875 880
Asn Asn Thr Leu Phe Val Leu Ala Glu Ile Ala Asp Pro Val Ile Asp
885 890 895
Val Thr Ala Ser Ser Pro Trp Glu Gln Asp Ser Leu
900 905
<210> 361
<211> 5040
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 361
atggcaagaa gtaagcgagt attagcatgg attatgtcta gtgtgcttct gatatccatg 60
gcgatgccat ccttcgcatc aggtgattca agccaagtgc caagggttat atttgaaaca 120
ggttttgaaa cgggattaga tggcttcaaa ggacggggta gtgccacctt aactcgaacg 180
actgatgaaa cgcaagcagg cgactattcg gttcttgtga gcaatcggct tgagcactgg 240
aatggggcat cattgccact tacaggcttc gttctaccag gtaatacata tgaatttgtt 300
ggttacataa aagcaaaagc agatgtagca gacaattatg tcatgagtgg tgagtacaat 360
gaggggattt ctggaaatca atatccatgg atatctaatc gtttgttaac ggttcaagat 420
ggctttgttg agtttagagg tgaactaacc atactagagg atatgacgtc ctttaatcta 480
aactttgaac atcaaaatgc tgaagtggaa ttttatttag attctgttca ggttattcta 540
atcgaagaag gtcaagtcaa tgacttacca atgaatgtaa gaagagcgcc acttacactt 600
gctgaaactc ccttacatga gatttgggca gatcacttta ctattggcaa tatttatacg 660
ccaggttttc gcacagatat acgtggtgag gtattagccc atcattttaa tgtgatcaca 720
gctgaaaata ttatgaagcc agatcatttg caaagggaac aaggtatttt tacttttagt 780
gcttccaacg atatgatgga atttgccaga gcaaataatc aagaagtcat tggacatact 840
ttggtgtggc attctcaatc cttcccatgg tttgaagctt taaatccaac acgtgatgaa 900
gctatagcca ttatgcatgc ccatattgaa actgttatgg gacattttaa tgaaaactac 960
ccaggtgtca ttacaggatg ggatgttttg aatgaagcca ttcaaccaag acagggtcaa 1020
gatcctgaaa attggcgctt gcatttaagg gataccaaat ggttacgtgc cattggtgat 1080
gattatattg ccatcgcttt taacaaagcc catgaaatgg atccagatgc tattctttat 1140
tataatgatt ataatgataa tgactatttt aaagcaacca ttataaaagc catggtgcag 1200
gagttgcgta atgaaggcgt gcccattcat cgtattggga tgcaaggtca ttataattta 1260
cagacaccat taaactctat tagaaccagc gttgagcgtt ttagtgaaat tactggtcat 1320
gaagatctac cacctattgg cattagtttc acagaaattg atgtaacggt accagggttt 1380
gaaagtgcag cccgtttacc tgaagaggta gaaattcgcc aagctcagtt ttatgctcaa 1440
ttaatgcaga ttttaagaga caacagcgat gtgattcatc gtgttacttt ctggggtatg 1500
tctgatcgtg aatcatggcg tgcagatcgt catcctaaca tgttagatcc tcagtatggt 1560
ccaaagcatg tctttcatgc tatagccaat ccagaggctt tccttacggc ctacccatta 1620
ccagagacgc cagatgctca aacagcctat gcatctcaag gtcaaccagt tgtggggcag 1680
tttaatttgg atgcgtatca aaattcagaa gtaataccag tggctaatca aatgacagcc 1740
cataatggcg caacagcggt tgcaagggtg gtttggcacg aagatgctat ttatatttta 1800
gccaatgtca gcgatgccac accgaatgta gcagcttcgg ctgcccatga gcaagactca 1860
cttgaggtat ttatttcaaa tacggattca agaatttcta attatatgcc aggtgactat 1920
caactgagat ttaatcgtgc cggcgtgcat acatatggtt cgactggttc gattgaaggt 1980
atgacctttg cggtacaaga tggtccaata ggttatcaag ttgaagtgcg tattccctta 2040
gaaaatgaag tctatgttgg cagaagactt ggttttgact tacaagtcaa tgatgcatgg 2100
gaagttggcg gtacttctgg ccgacaagca tttgctaaat ggaatgatca cactgacaat 2160
ggctggcagt ctacagagtt ttggggctgg ttattattac aaggcgatgc ggcacctgtc 2220
ttacccgttg tattagtgga agaaggcttt gaaacggatt taggttcatt ccaaccaagg 2280
ggtagtagta cactgactcg aacccaagag gttagtcatg aaggcgacta ttccgtattg 2340
gttagcaacc gtgtcaacaa ctggaacggt gcgtcattac cgttaacagg cattgttcaa 2400
ccaggcaaca cttatgagtt tgttggttac attagagcaa aagcagatgt aactggatca 2460
tatatcatga gtggtgagtt taataatgga tctggtgtat tagaaaacgg tagtattaat 2520
cgatggccat ggctatcaaa ccgttcatta acgatagcag atggttttgt tgagtttaag 2580
tcagaactaa ccatacctag tgacatgacg acgtttaact tgaactttga acaccaaaat 2640
gctgaagtag aattttactt agatgctgtt caagtcactt tgattgcaga agctgatgta 2700
acaccagtgg acccaccagt agacccacca gtagagccag aaattacagt ggtctattca 2760
atggtagatg atgcagccat tcaagggatt gaagtgggaa caacaggcac tgctgaagat 2820
ttttcggata ttagtgaagc tttattagta tctggttcac cagttgttac tgctgtagca 2880
catccagaag aagcaggaaa gatcggtata gagcttagta atcgagcaga gaattggcat 2940
gcgctagact ttatgttccc agccataggt gtgcagcggg gtgggagcta tcgatttgtg 3000
gccagtggcc gtatggcaga aggaacaggt aattcaaatc gtagaatgca gtggaatcaa 3060
acggatgcgc catggagtga aatatcaggt tctagaacca atgtggcacc tgcagcaacc 3120
acatggacca ttgacgtgac tttaagtcga ttacagatca acacattatt aaacgctggt 3180
caaagaggtc ttcgaattca aacgggtaat gcaccaactg tgaccattac cattgacgat 3240
gtgtttgttt atcagattgg tgacattgac acagcaggtt taccattacc accacaatgg 3300
aattttgatt tgccaagatt atcagaatta ttcgagccat attttggtct tggtaacatt 3360
tattcaaccg aaacattaat gaacgctaat gaaacaaaaa gagcattttt acatcacttt 3420
aacgtgatta cagcagaaaa tggtcataaa ccatccagta ttgcagggcc agaaaatagc 3480
tttacagtac cagaacctga gcaattcaac tttacggatg cagaccgaat tgtaaacttt 3540
gctgttgaaa atgacattga attagtagga catgcacttg tatggcattc acaaagtcca 3600
aactggctgt ttagaagtgc ggctaacaca ccgctaacaa gagcagaagc caaagagcgc 3660
atggcatatt acatgaaaac tgtttcagag catttcgaag cacaaggtac attaggcgca 3720
ttttatggtt gggatgttgt gaatgaagcc atcgccagtg gtggtggtac attcgtagat 3780
caaccaggtc attggcgcac gcaaatgcga acatcatcac catggttcca agcatttaac 3840
aatggattag atgtagaagc cggtgaacat gccagtgatt atattttcta tgcatactat 3900
tatgcaagaa agtatttccc aacatcgatc ctatactaca acgattacaa cgatgaaata 3960
ccaaacaagc gagacaatat cgctcaaatg gtagaagaga taaatgcact ttgggaagca 4020
catgaagaat atgatggtcg cttactgatt gaatccatcg gtatgcaaag tcattatcac 4080
atggaaggtt ggacaaccag cgtagacaat gtaagagctg ctttagatcg atacattgca 4140
acaggtgcaa gagtcagtgt gactgagtta gatatcactt atggtggtca tggtagtaat 4200
gcatatgcat cacttacacc agaacaatta gcggcacaag cggagcgata tgcagagata 4260
tttacattgt atttagagcg tgcagatcag ttaagccgtg tatccatctg gggtatgtct 4320
gatgctaaca gctggagaag ttctggattc ccattactat ttgacagttc acttaatgct 4380
aaaccagcat ttaatgccat tgtagaatta gttaaaaact gggagacacc aacagttgta 4440
gcaccagtga ttcaaacaag aacactagca ccattagaaa gtggtgaaag agtctttacc 4500
atgttagatg tggtaagagg atctaatgca cctgtatggt ttagcataac agacggtgca 4560
ttaccagaag gtataatcct tcattctaga acaggtattt tagaaggaac accagttgaa 4620
gatggtcact atagctttac tgtaactgct agaaattacg gcggttcaac aagtcaagcg 4680
ctgactttaa cagtaggtca tccagtagca ccaccagtaa cgccaccagt aacgccacca 4740
accgtaatca ttgatgaatc ggatatacca caggctggtc caggccttag ggcaccacag 4800
attgttgtaa ccgttcaaga aggcagtgaa gtaacgtttg atcttgaaaa attagaagaa 4860
gttatggcat cactttcaag tcaagtgcca ttggtgttag atgttgaatt ggaagattct 4920
atcatcacct tggatcaaac attacttaaa cgattaacag acaaggcggc tggaatcgaa 4980
atacaagcag atggatttag ttatatgctt ccagcagagg tattagaggc aattctttgg 5040
<210> 362
<211> 1680
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(26)
<400> 362
Met Ala Arg Ser Lys Arg Val Leu Ala Trp Ile Met Ser Ser Val Leu
1 5 10 15
Leu Ile Ser Met Ala Met Pro Ser Phe Ala Ser Gly Asp Ser Ser Gln
20 25 30
Val Pro Arg Val Ile Phe Glu Thr Gly Phe Glu Thr Gly Leu Asp Gly
35 40 45
Phe Lys Gly Arg Gly Ser Ala Thr Leu Thr Arg Thr Thr Asp Glu Thr
50 55 60
Gln Ala Gly Asp Tyr Ser Val Leu Val Ser Asn Arg Leu Glu His Trp
65 70 75 80
Asn Gly Ala Ser Leu Pro Leu Thr Gly Phe Val Leu Pro Gly Asn Thr
85 90 95
Tyr Glu Phe Val Gly Tyr Ile Lys Ala Lys Ala Asp Val Ala Asp Asn
100 105 110
Tyr Val Met Ser Gly Glu Tyr Asn Glu Gly Ile Ser Gly Asn Gln Tyr
115 120 125
Pro Trp Ile Ser Asn Arg Leu Leu Thr Val Gln Asp Gly Phe Val Glu
130 135 140
Phe Arg Gly Glu Leu Thr Ile Leu Glu Asp Met Thr Ser Phe Asn Leu
145 150 155 160
Asn Phe Glu His Gln Asn Ala Glu Val Glu Phe Tyr Leu Asp Ser Val
165 170 175
Gln Val Ile Leu Ile Glu Glu Gly Gln Val Asn Asp Leu Pro Met Asn
180 185 190
Val Arg Arg Ala Pro Leu Thr Leu Ala Glu Thr Pro Leu His Glu Ile
195 200 205
Trp Ala Asp His Phe Thr Ile Gly Asn Ile Tyr Thr Pro Gly Phe Arg
210 215 220
Thr Asp Ile Arg Gly Glu Val Leu Ala His His Phe Asn Val Ile Thr
225 230 235 240
Ala Glu Asn Ile Met Lys Pro Asp His Leu Gln Arg Glu Gln Gly Ile
245 250 255
Phe Thr Phe Ser Ala Ser Asn Asp Met Met Glu Phe Ala Arg Ala Asn
260 265 270
Asn Gln Glu Val Ile Gly His Thr Leu Val Trp His Ser Gln Ser Phe
275 280 285
Pro Trp Phe Glu Ala Leu Asn Pro Thr Arg Asp Glu Ala Ile Ala Ile
290 295 300
Met His Ala His Ile Glu Thr Val Met Gly His Phe Asn Glu Asn Tyr
305 310 315 320
Pro Gly Val Ile Thr Gly Trp Asp Val Leu Asn Glu Ala Ile Gln Pro
325 330 335
Arg Gln Gly Gln Asp Pro Glu Asn Trp Arg Leu His Leu Arg Asp Thr
340 345 350
Lys Trp Leu Arg Ala Ile Gly Asp Asp Tyr Ile Ala Ile Ala Phe Asn
355 360 365
Lys Ala His Glu Met Asp Pro Asp Ala Ile Leu Tyr Tyr Asn Asp Tyr
370 375 380
Asn Asp Asn Asp Tyr Phe Lys Ala Thr Ile Ile Lys Ala Met Val Gln
385 390 395 400
Glu Leu Arg Asn Glu Gly Val Pro Ile His Arg Ile Gly Met Gln Gly
405 410 415
His Tyr Asn Leu Gln Thr Pro Leu Asn Ser Ile Arg Thr Ser Val Glu
420 425 430
Arg Phe Ser Glu Ile Thr Gly His Glu Asp Leu Pro Pro Ile Gly Ile
435 440 445
Ser Phe Thr Glu Ile Asp Val Thr Val Pro Gly Phe Glu Ser Ala Ala
450 455 460
Arg Leu Pro Glu Glu Val Glu Ile Arg Gln Ala Gln Phe Tyr Ala Gln
465 470 475 480
Leu Met Gln Ile Leu Arg Asp Asn Ser Asp Val Ile His Arg Val Thr
485 490 495
Phe Trp Gly Met Ser Asp Arg Glu Ser Trp Arg Ala Asp Arg His Pro
500 505 510
Asn Met Leu Asp Pro Gln Tyr Gly Pro Lys His Val Phe His Ala Ile
515 520 525
Ala Asn Pro Glu Ala Phe Leu Thr Ala Tyr Pro Leu Pro Glu Thr Pro
530 535 540
Asp Ala Gln Thr Ala Tyr Ala Ser Gln Gly Gln Pro Val Val Gly Gln
545 550 555 560
Phe Asn Leu Asp Ala Tyr Gln Asn Ser Glu Val Ile Pro Val Ala Asn
565 570 575
Gln Met Thr Ala His Asn Gly Ala Thr Ala Val Ala Arg Val Val Trp
580 585 590
His Glu Asp Ala Ile Tyr Ile Leu Ala Asn Val Ser Asp Ala Thr Pro
595 600 605
Asn Val Ala Ala Ser Ala Ala His Glu Gln Asp Ser Leu Glu Val Phe
610 615 620
Ile Ser Asn Thr Asp Ser Arg Ile Ser Asn Tyr Met Pro Gly Asp Tyr
625 630 635 640
Gln Leu Arg Phe Asn Arg Ala Gly Val His Thr Tyr Gly Ser Thr Gly
645 650 655
Ser Ile Glu Gly Met Thr Phe Ala Val Gln Asp Gly Pro Ile Gly Tyr
660 665 670
Gln Val Glu Val Arg Ile Pro Leu Glu Asn Glu Val Tyr Val Gly Arg
675 680 685
Arg Leu Gly Phe Asp Leu Gln Val Asn Asp Ala Trp Glu Val Gly Gly
690 695 700
Thr Ser Gly Arg Gln Ala Phe Ala Lys Trp Asn Asp His Thr Asp Asn
705 710 715 720
Gly Trp Gln Ser Thr Glu Phe Trp Gly Trp Leu Leu Leu Gln Gly Asp
725 730 735
Ala Ala Pro Val Leu Pro Val Val Leu Val Glu Glu Gly Phe Glu Thr
740 745 750
Asp Leu Gly Ser Phe Gln Pro Arg Gly Ser Ser Thr Leu Thr Arg Thr
755 760 765
Gln Glu Val Ser His Glu Gly Asp Tyr Ser Val Leu Val Ser Asn Arg
770 775 780
Val Asn Asn Trp Asn Gly Ala Ser Leu Pro Leu Thr Gly Ile Val Gln
785 790 795 800
Pro Gly Asn Thr Tyr Glu Phe Val Gly Tyr Ile Arg Ala Lys Ala Asp
805 810 815
Val Thr Gly Ser Tyr Ile Met Ser Gly Glu Phe Asn Asn Gly Ser Gly
820 825 830
Val Leu Glu Asn Gly Ser Ile Asn Arg Trp Pro Trp Leu Ser Asn Arg
835 840 845
Ser Leu Thr Ile Ala Asp Gly Phe Val Glu Phe Lys Ser Glu Leu Thr
850 855 860
Ile Pro Ser Asp Met Thr Thr Phe Asn Leu Asn Phe Glu His Gln Asn
865 870 875 880
Ala Glu Val Glu Phe Tyr Leu Asp Ala Val Gln Val Thr Leu Ile Ala
885 890 895
Glu Ala Asp Val Thr Pro Val Asp Pro Pro Val Asp Pro Pro Val Glu
900 905 910
Pro Glu Ile Thr Val Val Tyr Ser Met Val Asp Asp Ala Ala Ile Gln
915 920 925
Gly Ile Glu Val Gly Thr Thr Gly Thr Ala Glu Asp Phe Ser Asp Ile
930 935 940
Ser Glu Ala Leu Leu Val Ser Gly Ser Pro Val Val Thr Ala Val Ala
945 950 955 960
His Pro Glu Glu Ala Gly Lys Ile Gly Ile Glu Leu Ser Asn Arg Ala
965 970 975
Glu Asn Trp His Ala Leu Asp Phe Met Phe Pro Ala Ile Gly Val Gln
980 985 990
Arg Gly Gly Ser Tyr Arg Phe Val Ala Ser Gly Arg Met Ala Glu Gly
995 1000 1005
Thr Gly Asn Ser Asn Arg Arg Met Gln Trp Asn Gln Thr Asp Ala Pro
1010 1015 1020
Trp Ser Glu Ile Ser Gly Ser Arg Thr Asn Val Ala Pro Ala Ala Thr
1025 1030 1035 1040
Thr Trp Thr Ile Asp Val Thr Leu Ser Arg Leu Gln Ile Asn Thr Leu
1045 1050 1055
Leu Asn Ala Gly Gln Arg Gly Leu Arg Ile Gln Thr Gly Asn Ala Pro
1060 1065 1070
Thr Val Thr Ile Thr Ile Asp Asp Val Phe Val Tyr Gln Ile Gly Asp
1075 1080 1085
Ile Asp Thr Ala Gly Leu Pro Leu Pro Pro Gln Trp Asn Phe Asp Leu
1090 1095 1100
Pro Arg Leu Ser Glu Leu Phe Glu Pro Tyr Phe Gly Leu Gly Asn Ile
1105 1110 1115 1120
Tyr Ser Thr Glu Thr Leu Met Asn Ala Asn Glu Thr Lys Arg Ala Phe
1125 1130 1135
Leu His His Phe Asn Val Ile Thr Ala Glu Asn Gly His Lys Pro Ser
1140 1145 1150
Ser Ile Ala Gly Pro Glu Asn Ser Phe Thr Val Pro Glu Pro Glu Gln
1155 1160 1165
Phe Asn Phe Thr Asp Ala Asp Arg Ile Val Asn Phe Ala Val Glu Asn
1170 1175 1180
Asp Ile Glu Leu Val Gly His Ala Leu Val Trp His Ser Gln Ser Pro
1185 1190 1195 1200
Asn Trp Leu Phe Arg Ser Ala Ala Asn Thr Pro Leu Thr Arg Ala Glu
1205 1210 1215
Ala Lys Glu Arg Met Ala Tyr Tyr Met Lys Thr Val Ser Glu His Phe
1220 1225 1230
Glu Ala Gln Gly Thr Leu Gly Ala Phe Tyr Gly Trp Asp Val Val Asn
1235 1240 1245
Glu Ala Ile Ala Ser Gly Gly Gly Thr Phe Val Asp Gln Pro Gly His
1250 1255 1260
Trp Arg Thr Gln Met Arg Thr Ser Ser Pro Trp Phe Gln Ala Phe Asn
1265 1270 1275 1280
Asn Gly Leu Asp Val Glu Ala Gly Glu His Ala Ser Asp Tyr Ile Phe
1285 1290 1295
Tyr Ala Tyr Tyr Tyr Ala Arg Lys Tyr Phe Pro Thr Ser Ile Leu Tyr
1300 1305 1310
Tyr Asn Asp Tyr Asn Asp Glu Ile Pro Asn Lys Arg Asp Asn Ile Ala
1315 1320 1325
Gln Met Val Glu Glu Ile Asn Ala Leu Trp Glu Ala His Glu Glu Tyr
1330 1335 1340
Asp Gly Arg Leu Leu Ile Glu Ser Ile Gly Met Gln Ser His Tyr His
1345 1350 1355 1360
Met Glu Gly Trp Thr Thr Ser Val Asp Asn Val Arg Ala Ala Leu Asp
1365 1370 1375
Arg Tyr Ile Ala Thr Gly Ala Arg Val Ser Val Thr Glu Leu Asp Ile
1380 1385 1390
Thr Tyr Gly Gly His Gly Ser Asn Ala Tyr Ala Ser Leu Thr Pro Glu
1395 1400 1405
Gln Leu Ala Ala Gln Ala Glu Arg Tyr Ala Glu Ile Phe Thr Leu Tyr
1410 1415 1420
Leu Glu Arg Ala Asp Gln Leu Ser Arg Val Ser Ile Trp Gly Met Ser
1425 1430 1435 1440
Asp Ala Asn Ser Trp Arg Ser Ser Gly Phe Pro Leu Leu Phe Asp Ser
1445 1450 1455
Ser Leu Asn Ala Lys Pro Ala Phe Asn Ala Ile Val Glu Leu Val Lys
1460 1465 1470
Asn Trp Glu Thr Pro Thr Val Val Ala Pro Val Ile Gln Thr Arg Thr
1475 1480 1485
Leu Ala Pro Leu Glu Ser Gly Glu Arg Val Phe Thr Met Leu Asp Val
1490 1495 1500
Val Arg Gly Ser Asn Ala Pro Val Trp Phe Ser Ile Thr Asp Gly Ala
1505 1510 1515 1520
Leu Pro Glu Gly Ile Ile Leu His Ser Arg Thr Gly Ile Leu Glu Gly
1525 1530 1535
Thr Pro Val Glu Asp Gly His Tyr Ser Phe Thr Val Thr Ala Arg Asn
1540 1545 1550
Tyr Gly Gly Ser Thr Ser Gln Ala Leu Thr Leu Thr Val Gly His Pro
1555 1560 1565
Val Ala Pro Pro Val Thr Pro Pro Val Thr Pro Pro Thr Val Ile Ile
1570 1575 1580
Asp Glu Ser Asp Ile Pro Gln Ala Gly Pro Gly Leu Arg Ala Pro Gln
1585 1590 1595 1600
Ile Val Val Thr Val Gln Glu Gly Ser Glu Val Thr Phe Asp Leu Glu
1605 1610 1615
Lys Leu Glu Glu Val Met Ala Ser Leu Ser Ser Gln Val Pro Leu Val
1620 1625 1630
Leu Asp Val Glu Leu Glu Asp Ser Ile Ile Thr Leu Asp Gln Thr Leu
1635 1640 1645
Leu Lys Arg Leu Thr Asp Lys Ala Ala Gly Ile Glu Ile Gln Ala Asp
1650 1655 1660
Gly Phe Ser Tyr Met Leu Pro Ala Glu Val Leu Glu Ala Ile Leu Trp
1665 1670 1675 1680
<210> 363
<211> 1317
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 363
gtgaccaccc gcgcacaggt tcttgatcag gcgctggcac tgggccaccg gtgtggctgg 60
gaaaaactca gcctggacgc catcgccagg gcgctgggcc gttttggcag cctggctctg 120
tgtgtcgcgc tgttgagcgc ctgcggcagt agtagtagct ccctggatga tccgggtgct 180
ggcagcagtt cttccagctc tgagagcagc caaagctcca gcgccagttc ccaggctgat 240
ggcgacggta cccaggacag cctctacgcc caggcggact tccctgtagg ggttgcggtg 300
caggtggcca attgggagcc tttcagcctg tttaccgcgc ccgatgccgc tgcgcgtcag 360
aacctggttg cccgacactt ctccgaagtg accgcgacca acgtcatgaa aatgtcctat 420
atgcgcacca acagtggtgg ttttaccgac gcgccggcgc gtccgctgat tgattttgcc 480
cgcgccaatg gcatcaaagt gcacggtcac gcactggtct ggcatgcgga ttatcaggtg 540
ccaaatgtgt ttcgtgacta cgaaggggac aattggcagg ggcttttaac cgagcatgtc 600
gagggcgtta tggggctgtt tgacgacacc gtggtaagtt gggatgtcgt aaacgaagcg 660
gttgataccg gctcacctga cggctggcgc cggtcgattt tctataattt tgcgccgccg 720
gaagcagggc aggtgccgga atatattgaa gtggcttacc aggccgctcg agaggccaat 780
ccggaagtga ccctctacta caacgatttt gacaacacgg ccaataccgg gcgcctcaac 840
aagaccctgg aaattgccga tcgcctgaaa gagctggacg cgatcgacgg tatcgggttc 900
cagatgcacg cctatatgaa ctacccgagt attgcgcagt ttcgcaatgc ctttcaggaa 960
gtggtcgatc gtgacctgaa agtcaaagtc accgagctgg acattgccat cgtcaaccct 1020
tacggcagct cgacgcctcc gccgctgccg gagtttgatc aggcgctggc cgacgcccaa 1080
ggtgtccgtt actgccagat tgccgaggcc tatctggatg tcgttcctgc cgagctgcgg 1140
ggtggtttca ccgtctgggg cctgaccgat gacgacagct ggctgatggg agcgttcgcg 1200
tccgcaaccg gcgcccaata cgaccaggtc tatccggtgt tgtttgacga taatctgcaa 1260
gccaagcccg cgttctttgg cgtcaagcgc gccctccgcg gcgaaccctg cgagtaa 1317
<210> 364
<211> 438
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 364
Met Thr Thr Arg Ala Gln Val Leu Asp Gln Ala Leu Ala Leu Gly His
1 5 10 15
Arg Cys Gly Trp Glu Lys Leu Ser Leu Asp Ala Ile Ala Arg Ala Leu
20 25 30
Gly Arg Phe Gly Ser Leu Ala Leu Cys Val Ala Leu Leu Ser Ala Cys
35 40 45
Gly Ser Ser Ser Ser Ser Leu Asp Asp Pro Gly Ala Gly Ser Ser Ser
50 55 60
Ser Ser Ser Glu Ser Ser Gln Ser Ser Ser Ala Ser Ser Gln Ala Asp
65 70 75 80
Gly Asp Gly Thr Gln Asp Ser Leu Tyr Ala Gln Ala Asp Phe Pro Val
85 90 95
Gly Val Ala Val Gln Val Ala Asn Trp Glu Pro Phe Ser Leu Phe Thr
100 105 110
Ala Pro Asp Ala Ala Ala Arg Gln Asn Leu Val Ala Arg His Phe Ser
115 120 125
Glu Val Thr Ala Thr Asn Val Met Lys Met Ser Tyr Met Arg Thr Asn
130 135 140
Ser Gly Gly Phe Thr Asp Ala Pro Ala Arg Pro Leu Ile Asp Phe Ala
145 150 155 160
Arg Ala Asn Gly Ile Lys Val His Gly His Ala Leu Val Trp His Ala
165 170 175
Asp Tyr Gln Val Pro Asn Val Phe Arg Asp Tyr Glu Gly Asp Asn Trp
180 185 190
Gln Gly Leu Leu Thr Glu His Val Glu Gly Val Met Gly Leu Phe Asp
195 200 205
Asp Thr Val Val Ser Trp Asp Val Val Asn Glu Ala Val Asp Thr Gly
210 215 220
Ser Pro Asp Gly Trp Arg Arg Ser Ile Phe Tyr Asn Phe Ala Pro Pro
225 230 235 240
Glu Ala Gly Gln Val Pro Glu Tyr Ile Glu Val Ala Tyr Gln Ala Ala
245 250 255
Arg Glu Ala Asn Pro Glu Val Thr Leu Tyr Tyr Asn Asp Phe Asp Asn
260 265 270
Thr Ala Asn Thr Gly Arg Leu Asn Lys Thr Leu Glu Ile Ala Asp Arg
275 280 285
Leu Lys Glu Leu Asp Ala Ile Asp Gly Ile Gly Phe Gln Met His Ala
290 295 300
Tyr Met Asn Tyr Pro Ser Ile Ala Gln Phe Arg Asn Ala Phe Gln Glu
305 310 315 320
Val Val Asp Arg Asp Leu Lys Val Lys Val Thr Glu Leu Asp Ile Ala
325 330 335
Ile Val Asn Pro Tyr Gly Ser Ser Thr Pro Pro Pro Leu Pro Glu Phe
340 345 350
Asp Gln Ala Leu Ala Asp Ala Gln Gly Val Arg Tyr Cys Gln Ile Ala
355 360 365
Glu Ala Tyr Leu Asp Val Val Pro Ala Glu Leu Arg Gly Gly Phe Thr
370 375 380
Val Trp Gly Leu Thr Asp Asp Asp Ser Trp Leu Met Gly Ala Phe Ala
385 390 395 400
Ser Ala Thr Gly Ala Gln Tyr Asp Gln Val Tyr Pro Val Leu Phe Asp
405 410 415
Asp Asn Leu Gln Ala Lys Pro Ala Phe Phe Gly Val Lys Arg Ala Leu
420 425 430
Arg Gly Glu Pro Cys Glu
435
<210> 365
<211> 3246
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 365
atgaaccact tcgcttcaaa atcgctgcgc atggcgtggc aacccggact gcttgcgaca 60
accgtgctgc cgttggcggc tgccgcccca ataccagcgc cgaatacgga taccaaagtg 120
agcaatactt cgtccatcac cactccggct gcggctccac agtcgcagcc acaaccaacg 180
caagacgcaa acgctcccgc accgcttaaa gcggctttcc gggataagtt tctcatcggc 240
gcggtgctga gtgacgctgc gctgcgaggc agtgcgcccg acaaggtggc gatagccacc 300
acgcacttta acgcgctcac cgccgaaaac gccatgaagc cagacgcgat gcaaccgcgc 360
gaagggcagt tcaacttcgc tgcaggcgat cggctcgtcg aactcgccga aaaaagcggc 420
ggtgtgccca tcggccacac gctggtgtgg cacgcgcaaa caccgaagtg gttttttgaa 480
gggccggatg gacagcccgc gacgcgcgaa ctggctttgg agcgcatgcg caaacacatt 540
tccactgtgg tggggcgcta caaagggcgc atcaaggagt gggatgtggt gaacgaagcc 600
atcaacgacg gacccggtgt gctgcgtccc tctccctggc tcaaagccat cggcgaagat 660
tacatcgccg aagccttccg cgccgcgcac gccgccgacc ccgacgcgat tttgatttat 720
aacgattaca acatcgaact gggctacaaa cggcccaaag cgctgcaact cctaaaatcg 780
ctcattgacc agaaagtgcc gattcacgcc gtgggcattc agggtcactg gcgcatggac 840
aacccgaact tcgccgaagt ggaacaggcc atcaaagagt tttcggcgct ggggttgaaa 900
gtcatgatca ccgaactcga catcggcgtg ctgccgacgc gttatcaggg cgcggatatt 960
tcagcgaccg aaaccatgac gcccgaacag cgcgccgtga tgaaccccta tacggacgga 1020
ttgccggacg atgtggcgca aaagcacgcc gagcgctatc gccaggcgtt tgagatgttc 1080
ctgcggcaca aagacaaaat cagtcgtgtg acattttggg gtgtggacga cggcacttcg 1140
tggctgaacg gtttcccggt gcgcggccgc accgattatc cgctgctatt tgatcgtcag 1200
ggcaagccaa aacccgcctt tttcgcggtg caaaacgcgg cgatgggcgc aacagcgcaa 1260
ccgagcgcca gcgctcccgc aacgcatggc gccgctcctg catccaccaa cattcgcggc 1320
gccgagtttc ctcgcgtgga aagcgacggg cgggtgacgt ttcgcatcaa agcgcctgac 1380
gcgcaaaaag tgcaatttga tttaggtaag ccttacgacg ccacccgcga cgccgagggc 1440
aactggacgg cgaccacaga gccacaagtg cccggcttcc attattattt tttgattgtc 1500
gatggagtgc gcgtggccga cccggcgagc gaaacctttt acggtgcggg ccgccagatg 1560
agcggcatcg aaattcccga tcccgacagc gcgttttatt cgccgcaaaa cgtgccgcat 1620
ggcgaagtgc gcgaacgctg gtatttttcc aacaccacgc aggcgtggcg gcgcatcttc 1680
atttatacgc cgccgggtta cgacaccgat caggccatgc gttttcctgt gctgtatttg 1740
cagcacggcg gtggcgaaga cgaacgcggc tggcccaatc aggggcgcgt gagctttatc 1800
atggacaatc tcatcgcgca gggcaaagcc aaaccgatgc tggtggtgat ggagcaaggc 1860
tatgcgcgca agcccgatga accgcaggtg ccgctgcgcc cgcccggaag caacgccgga 1920
gcgatgccgc ccgactttaa tcgcatgttc gccacgctgg gcgaagtgtt caccaaagac 1980
ctgattccgt ttattgacgc aaattaccgc accaaaaccg agcgcgaaaa ccgcgcgatg 2040
gccggacttt cgatgggtgg aatgcaaagt ttcatcatcg gcctggcgaa caccgatcta 2100
ttcgcgcacc tcggcggttt cagcggcgcg ggtggtggtt ttggcggcgg cgccttcgac 2160
gccaaaaccg cgcacggcgg tgtgatggcc gatgccgatg ccttcaacaa aaaagttcgc 2220
acgatgtttc tcagcatcgg cactgccgag aacgagcgtt ttcagagcag cgtgcgcggt 2280
taccgcgacg cgctgaccaa agcgggcatc aaaaccacgt tctacgaatc gcccggcact 2340
tcgcacgagt ggctgacatg gcgccgcagc ctgcgcgaat tcgcgccgct cttgtttcaa 2400
gaggccaaca cgcagatcga gcgcggcccc aatgcccgcc cgattgcgcc gcagccgatt 2460
gttcttggcc cgggcgacaa gcccgccttc cctccggcgc cctccggttt cgatgcgcgg 2520
cgcgatggca ttccgcacgg cgaaattaaa cttgtggaat acccttctgc cacggtcggc 2580
accacgcgca agatgcaggt ctatacgccg ccgggctaca acccgcaaga agaatatccc 2640
gtgctctatt tgctgcacgg catcggcggc gacgagtggg aatggaaaaa tggcggcacg 2700
cccgaagtga ttctcgacaa cctctacgct gagaagaaac tccagccgat gatcgtggtg 2760
atgcccaatg ggcgcgcgca aaaagacgac cgtcctatcg gcaacgtgtt cgcttccgct 2820
ccggcgtttg cgacgtttga gaaagatttg ctgaacgaca ttatcccctt tgttgagaag 2880
aattacccga ccaaaaccgg cccgcaaaat cgcgctttgg ccggtctttc gatgggcggc 2940
gggcaatctc tcaactttgg cctcggcaac ctcgacacct tcgcgtgggt tggcggcttt 3000
tcgtccgcgc ccaacacgcg cagcggcgca agtctactgg ccaatcccga cgacgccaaa 3060
aagaagctga agctgctgtg ggtttcgtgc ggcgataaag acaatttgat gtttatcagc 3120
cagcgcacgc accgttatct tgccgagaat aacgtgccgc acatctggca tgtacagccc 3180
ggcggacacg acttcaaggt gtggaagcaa gacctgtata acttcgccca actgctattc 3240
cgttaa 3246
<210> 366
<211> 1081
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(65)
<400> 366
Met Asn His Phe Ala Ser Lys Ser Leu Arg Met Ala Trp Gln Pro Gly
1 5 10 15
Leu Leu Ala Thr Thr Val Leu Pro Leu Ala Ala Ala Ala Pro Ile Pro
20 25 30
Ala Pro Asn Thr Asp Thr Lys Val Ser Asn Thr Ser Ser Ile Thr Thr
35 40 45
Pro Ala Ala Ala Pro Gln Ser Gln Pro Gln Pro Thr Gln Asp Ala Asn
50 55 60
Ala Pro Ala Pro Leu Lys Ala Ala Phe Arg Asp Lys Phe Leu Ile Gly
65 70 75 80
Ala Val Leu Ser Asp Ala Ala Leu Arg Gly Ser Ala Pro Asp Lys Val
85 90 95
Ala Ile Ala Thr Thr His Phe Asn Ala Leu Thr Ala Glu Asn Ala Met
100 105 110
Lys Pro Asp Ala Met Gln Pro Arg Glu Gly Gln Phe Asn Phe Ala Ala
115 120 125
Gly Asp Arg Leu Val Glu Leu Ala Glu Lys Ser Gly Gly Val Pro Ile
130 135 140
Gly His Thr Leu Val Trp His Ala Gln Thr Pro Lys Trp Phe Phe Glu
145 150 155 160
Gly Pro Asp Gly Gln Pro Ala Thr Arg Glu Leu Ala Leu Glu Arg Met
165 170 175
Arg Lys His Ile Ser Thr Val Val Gly Arg Tyr Lys Gly Arg Ile Lys
180 185 190
Glu Trp Asp Val Val Asn Glu Ala Ile Asn Asp Gly Pro Gly Val Leu
195 200 205
Arg Pro Ser Pro Trp Leu Lys Ala Ile Gly Glu Asp Tyr Ile Ala Glu
210 215 220
Ala Phe Arg Ala Ala His Ala Ala Asp Pro Asp Ala Ile Leu Ile Tyr
225 230 235 240
Asn Asp Tyr Asn Ile Glu Leu Gly Tyr Lys Arg Pro Lys Ala Leu Gln
245 250 255
Leu Leu Lys Ser Leu Ile Asp Gln Lys Val Pro Ile His Ala Val Gly
260 265 270
Ile Gln Gly His Trp Arg Met Asp Asn Pro Asn Phe Ala Glu Val Glu
275 280 285
Gln Ala Ile Lys Glu Phe Ser Ala Leu Gly Leu Lys Val Met Ile Thr
290 295 300
Glu Leu Asp Ile Gly Val Leu Pro Thr Arg Tyr Gln Gly Ala Asp Ile
305 310 315 320
Ser Ala Thr Glu Thr Met Thr Pro Glu Gln Arg Ala Val Met Asn Pro
325 330 335
Tyr Thr Asp Gly Leu Pro Asp Asp Val Ala Gln Lys His Ala Glu Arg
340 345 350
Tyr Arg Gln Ala Phe Glu Met Phe Leu Arg His Lys Asp Lys Ile Ser
355 360 365
Arg Val Thr Phe Trp Gly Val Asp Asp Gly Thr Ser Trp Leu Asn Gly
370 375 380
Phe Pro Val Arg Gly Arg Thr Asp Tyr Pro Leu Leu Phe Asp Arg Gln
385 390 395 400
Gly Lys Pro Lys Pro Ala Phe Phe Ala Val Gln Asn Ala Ala Met Gly
405 410 415
Ala Thr Ala Gln Pro Ser Ala Ser Ala Pro Ala Thr His Gly Ala Ala
420 425 430
Pro Ala Ser Thr Asn Ile Arg Gly Ala Glu Phe Pro Arg Val Glu Ser
435 440 445
Asp Gly Arg Val Thr Phe Arg Ile Lys Ala Pro Asp Ala Gln Lys Val
450 455 460
Gln Phe Asp Leu Gly Lys Pro Tyr Asp Ala Thr Arg Asp Ala Glu Gly
465 470 475 480
Asn Trp Thr Ala Thr Thr Glu Pro Gln Val Pro Gly Phe His Tyr Tyr
485 490 495
Phe Leu Ile Val Asp Gly Val Arg Val Ala Asp Pro Ala Ser Glu Thr
500 505 510
Phe Tyr Gly Ala Gly Arg Gln Met Ser Gly Ile Glu Ile Pro Asp Pro
515 520 525
Asp Ser Ala Phe Tyr Ser Pro Gln Asn Val Pro His Gly Glu Val Arg
530 535 540
Glu Arg Trp Tyr Phe Ser Asn Thr Thr Gln Ala Trp Arg Arg Ile Phe
545 550 555 560
Ile Tyr Thr Pro Pro Gly Tyr Asp Thr Asp Gln Ala Met Arg Phe Pro
565 570 575
Val Leu Tyr Leu Gln His Gly Gly Gly Glu Asp Glu Arg Gly Trp Pro
580 585 590
Asn Gln Gly Arg Val Ser Phe Ile Met Asp Asn Leu Ile Ala Gln Gly
595 600 605
Lys Ala Lys Pro Met Leu Val Val Met Glu Gln Gly Tyr Ala Arg Lys
610 615 620
Pro Asp Glu Pro Gln Val Pro Leu Arg Pro Pro Gly Ser Asn Ala Gly
625 630 635 640
Ala Met Pro Pro Asp Phe Asn Arg Met Phe Ala Thr Leu Gly Glu Val
645 650 655
Phe Thr Lys Asp Leu Ile Pro Phe Ile Asp Ala Asn Tyr Arg Thr Lys
660 665 670
Thr Glu Arg Glu Asn Arg Ala Met Ala Gly Leu Ser Met Gly Gly Met
675 680 685
Gln Ser Phe Ile Ile Gly Leu Ala Asn Thr Asp Leu Phe Ala His Leu
690 695 700
Gly Gly Phe Ser Gly Ala Gly Gly Gly Phe Gly Gly Gly Ala Phe Asp
705 710 715 720
Ala Lys Thr Ala His Gly Gly Val Met Ala Asp Ala Asp Ala Phe Asn
725 730 735
Lys Lys Val Arg Thr Met Phe Leu Ser Ile Gly Thr Ala Glu Asn Glu
740 745 750
Arg Phe Gln Ser Ser Val Arg Gly Tyr Arg Asp Ala Leu Thr Lys Ala
755 760 765
Gly Ile Lys Thr Thr Phe Tyr Glu Ser Pro Gly Thr Ser His Glu Trp
770 775 780
Leu Thr Trp Arg Arg Ser Leu Arg Glu Phe Ala Pro Leu Leu Phe Gln
785 790 795 800
Glu Ala Asn Thr Gln Ile Glu Arg Gly Pro Asn Ala Arg Pro Ile Ala
805 810 815
Pro Gln Pro Ile Val Leu Gly Pro Gly Asp Lys Pro Ala Phe Pro Pro
820 825 830
Ala Pro Ser Gly Phe Asp Ala Arg Arg Asp Gly Ile Pro His Gly Glu
835 840 845
Ile Lys Leu Val Glu Tyr Pro Ser Ala Thr Val Gly Thr Thr Arg Lys
850 855 860
Met Gln Val Tyr Thr Pro Pro Gly Tyr Asn Pro Gln Glu Glu Tyr Pro
865 870 875 880
Val Leu Tyr Leu Leu His Gly Ile Gly Gly Asp Glu Trp Glu Trp Lys
885 890 895
Asn Gly Gly Thr Pro Glu Val Ile Leu Asp Asn Leu Tyr Ala Glu Lys
900 905 910
Lys Leu Gln Pro Met Ile Val Val Met Pro Asn Gly Arg Ala Gln Lys
915 920 925
Asp Asp Arg Pro Ile Gly Asn Val Phe Ala Ser Ala Pro Ala Phe Ala
930 935 940
Thr Phe Glu Lys Asp Leu Leu Asn Asp Ile Ile Pro Phe Val Glu Lys
945 950 955 960
Asn Tyr Pro Thr Lys Thr Gly Pro Gln Asn Arg Ala Leu Ala Gly Leu
965 970 975
Ser Met Gly Gly Gly Gln Ser Leu Asn Phe Gly Leu Gly Asn Leu Asp
980 985 990
Thr Phe Ala Trp Val Gly Gly Phe Ser Ser Ala Pro Asn Thr Arg Ser
995 1000 1005
Gly Ala Ser Leu Leu Ala Asn Pro Asp Asp Ala Lys Lys Lys Leu Lys
1010 1015 1020
Leu Leu Trp Val Ser Cys Gly Asp Lys Asp Asn Leu Met Phe Ile Ser
1025 1030 1035 1040
Gln Arg Thr His Arg Tyr Leu Ala Glu Asn Asn Val Pro His Ile Trp
1045 1050 1055
His Val Gln Pro Gly Gly His Asp Phe Lys Val Trp Lys Gln Asp Leu
1060 1065 1070
Tyr Asn Phe Ala Gln Leu Leu Phe Arg
1075 1080
<210> 367
<211> 1338
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 367
atgaaaagaa ttggattact atttatggcg ttggcgctaa ccgcatttat ggcgcagcat 60
tcgtccgctc aaaggatttg caataaccaa acagggaccc atggtggatt ctactacaca 120
tggtggagtg atgggggtgg atctgcatgt ataacaatgg gcgatggcgg taactacagc 180
acccaatgga gcaataccgg taactttgta ggcggtaagg gttggagcac aggaagatcc 240
aaccgcgtaa ttagttacaa tgctggtaac tggtcgccat cgggtaatgc ttacctatgt 300
ttatatggct ggactaccaa cccgcttgtt gagtactacg tagttgatag ctggggttct 360
tggagacctc ccggagcaac atcgcaggga acagtaaata ctgatggtgg cacctatgag 420
atatacagaa ctcagcgtgt aaaccagcca tctattcagg ggaatactac tttctatcag 480
tattggagcg ttagaacctc taaaagggcc actggaagca atgctaccat caccttccag 540
aaccacgtaa atgcttgggc aagtaggggt tggaacttgg gagctcatag ctatcaggta 600
ctggctaccg agggttatca gagcagcgga agttcaaata ttactgtttg ggaaggtggt 660
tcaagtggag gttcttcagg tggaagcacc ggaggcagca ctggaggtgg atcacacgag 720
atcattgtaa gagcccgtgg tgtagtaggt tcagagcaaa ttaggcttag ggttggcaat 780
acaaccgttg caacttggac ccttactacc ggttataggg actatagggc tactacctca 840
gctactggtg gtattctggt agagtacttc aatgatagcg gcaaccgtga tgttcagatt 900
gattacatta gggtaaacgg ctcaactcgt caatctgaga acatgtcgta caatacaggg 960
gtatggcaga atggctcatg cggcggctcc aatagcgagt ggctacactg caacggagct 1020
attggctacg gcgatgtggt tactggcaga tcaaccgctg ttgaggaagc atttactgct 1080
gccgaggatt gtggctgtga acctaaggca accctattcc ccaaccctgc tggcagtacc 1140
ctcagtatta tgctagacag gcaaccctat ggcgatgtaa gtattagaat atataatacg 1200
gtaggtgcag ttgttcgcac catcaacaat ccagacctac tcactgaggt tgatgtcagt 1260
gcattaaatt ctggaatcta ctttgtagag cttaggtccg aaggacatgt aagcaactac 1320
aaatttatta aaaagtag 1338
<210> 368
<211> 445
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(23)
<400> 368
Met Lys Arg Ile Gly Leu Leu Phe Met Ala Leu Ala Leu Thr Ala Phe
1 5 10 15
Met Ala Gln His Ser Ser Ala Gln Arg Ile Cys Asn Asn Gln Thr Gly
20 25 30
Thr His Gly Gly Phe Tyr Tyr Thr Trp Trp Ser Asp Gly Gly Gly Ser
35 40 45
Ala Cys Ile Thr Met Gly Asp Gly Gly Asn Tyr Ser Thr Gln Trp Ser
50 55 60
Asn Thr Gly Asn Phe Val Gly Gly Lys Gly Trp Ser Thr Gly Arg Ser
65 70 75 80
Asn Arg Val Ile Ser Tyr Asn Ala Gly Asn Trp Ser Pro Ser Gly Asn
85 90 95
Ala Tyr Leu Cys Leu Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr
100 105 110
Tyr Val Val Asp Ser Trp Gly Ser Trp Arg Pro Pro Gly Ala Thr Ser
115 120 125
Gln Gly Thr Val Asn Thr Asp Gly Gly Thr Tyr Glu Ile Tyr Arg Thr
130 135 140
Gln Arg Val Asn Gln Pro Ser Ile Gln Gly Asn Thr Thr Phe Tyr Gln
145 150 155 160
Tyr Trp Ser Val Arg Thr Ser Lys Arg Ala Thr Gly Ser Asn Ala Thr
165 170 175
Ile Thr Phe Gln Asn His Val Asn Ala Trp Ala Ser Arg Gly Trp Asn
180 185 190
Leu Gly Ala His Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln Ser
195 200 205
Ser Gly Ser Ser Asn Ile Thr Val Trp Glu Gly Gly Ser Ser Gly Gly
210 215 220
Ser Ser Gly Gly Ser Thr Gly Gly Ser Thr Gly Gly Gly Ser His Glu
225 230 235 240
Ile Ile Val Arg Ala Arg Gly Val Val Gly Ser Glu Gln Ile Arg Leu
245 250 255
Arg Val Gly Asn Thr Thr Val Ala Thr Trp Thr Leu Thr Thr Gly Tyr
260 265 270
Arg Asp Tyr Arg Ala Thr Thr Ser Ala Thr Gly Gly Ile Leu Val Glu
275 280 285
Tyr Phe Asn Asp Ser Gly Asn Arg Asp Val Gln Ile Asp Tyr Ile Arg
290 295 300
Val Asn Gly Ser Thr Arg Gln Ser Glu Asn Met Ser Tyr Asn Thr Gly
305 310 315 320
Val Trp Gln Asn Gly Ser Cys Gly Gly Ser Asn Ser Glu Trp Leu His
325 330 335
Cys Asn Gly Ala Ile Gly Tyr Gly Asp Val Val Thr Gly Arg Ser Thr
340 345 350
Ala Val Glu Glu Ala Phe Thr Ala Ala Glu Asp Cys Gly Cys Glu Pro
355 360 365
Lys Ala Thr Leu Phe Pro Asn Pro Ala Gly Ser Thr Leu Ser Ile Met
370 375 380
Leu Asp Arg Gln Pro Tyr Gly Asp Val Ser Ile Arg Ile Tyr Asn Thr
385 390 395 400
Val Gly Ala Val Val Arg Thr Ile Asn Asn Pro Asp Leu Leu Thr Glu
405 410 415
Val Asp Val Ser Ala Leu Asn Ser Gly Ile Tyr Phe Val Glu Leu Arg
420 425 430
Ser Glu Gly His Val Ser Asn Tyr Lys Phe Ile Lys Lys
435 440 445
<210> 369
<211> 1077
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 369
atgaaatcat ttatcactgg caaaaaaatt gctgctggac taattactgc agctgctttg 60
agcgcatcta tggtgagcgc gcaaaccctg acttcaaatt ctcaaggcac ccacgacgga 120
tttttctact ctttctggaa ggactcaggc aacgcctcaa tgaacttatt ggcgggcggc 180
cgttatcagt ctagctggaa caccggcacc aacaactggg taggcggtaa aggctggaac 240
ccaggcacta acaaccgtgt aattaactac tctggttact acggtgtgga caactcccaa 300
aactcttacg tcgcgcttta cggctggacc agaaacccat tggttgagta ctacgtgatt 360
gagagctacg gctcatacaa ccctgctagc tgctctggcg gcaccgattt cggtagcttc 420
caaagtgacg gcgccaccta caacgtgcgt cgttgccagc gcgtgcaaca gccttcgatc 480
gatggcaccc agactttcta ccaatacttc agcgtgagaa atccgaaaaa agggtttggg 540
aacatttctg gcaccatcac ctttgctaac cacgtaaact actggagaag cagagggatg 600
aatcttggta accacgatta ccaagttctc gctactgaag gctacagaag cacgggttct 660
tctgacctca ccatcagcca aggcgcaagc aacaacggcg gtggcggcag tagctcaagt 720
gctccatctg ctgggggcgg tagcaagaca atcgtcgtgc gggcacgcgg gactaccgga 780
caagagcaaa tccgtttgcg ggtgaacaac actattgttc agacctggac cttgtccacc 840
accatgcgcg actacaccgt caacactaac ttggcaggcg ggtcattggt tgaatacttc 900
aatgacagcg gcaaccgcga cgtccaagtt gattacatca gcgtaaatgg caatgttcgc 960
caatccgaaa accaaaccta caacaccggt gtctaccaga acggtgcgtg tggcggcggt 1020
aacggccgga gcgagtggct ccattgcaac ggtgcaatcg ggtacggcga tatctaa 1077
<210> 370
<211> 358
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<221> SIGNAL
<222> (1)...(27)
<400> 370
Met Lys Ser Phe Ile Thr Gly Lys Lys Ile Ala Ala Gly Leu Ile Thr
1 5 10 15
Ala Ala Ala Leu Ser Ala Ser Met Val Ser Ala Gln Thr Leu Thr Ser
20 25 30
Asn Ser Gln Gly Thr His Asp Gly Phe Phe Tyr Ser Phe Trp Lys Asp
35 40 45
Ser Gly Asn Ala Ser Met Asn Leu Leu Ala Gly Gly Arg Tyr Gln Ser
50 55 60
Ser Trp Asn Thr Gly Thr Asn Asn Trp Val Gly Gly Lys Gly Trp Asn
65 70 75 80
Pro Gly Thr Asn Asn Arg Val Ile Asn Tyr Ser Gly Tyr Tyr Gly Val
85 90 95
Asp Asn Ser Gln Asn Ser Tyr Val Ala Leu Tyr Gly Trp Thr Arg Asn
100 105 110
Pro Leu Val Glu Tyr Tyr Val Ile Glu Ser Tyr Gly Ser Tyr Asn Pro
115 120 125
Ala Ser Cys Ser Gly Gly Thr Asp Phe Gly Ser Phe Gln Ser Asp Gly
130 135 140
Ala Thr Tyr Asn Val Arg Arg Cys Gln Arg Val Gln Gln Pro Ser Ile
145 150 155 160
Asp Gly Thr Gln Thr Phe Tyr Gln Tyr Phe Ser Val Arg Asn Pro Lys
165 170 175
Lys Gly Phe Gly Asn Ile Ser Gly Thr Ile Thr Phe Ala Asn His Val
180 185 190
Asn Tyr Trp Arg Ser Arg Gly Met Asn Leu Gly Asn His Asp Tyr Gln
195 200 205
Val Leu Ala Thr Glu Gly Tyr Arg Ser Thr Gly Ser Ser Asp Leu Thr
210 215 220
Ile Ser Gln Gly Ala Ser Asn Asn Gly Gly Gly Gly Ser Ser Ser Ser
225 230 235 240
Ala Pro Ser Ala Gly Gly Gly Ser Lys Thr Ile Val Val Arg Ala Arg
245 250 255
Gly Thr Thr Gly Gln Glu Gln Ile Arg Leu Arg Val Asn Asn Thr Ile
260 265 270
Val Gln Thr Trp Thr Leu Ser Thr Thr Met Arg Asp Tyr Thr Val Asn
275 280 285
Thr Asn Leu Ala Gly Gly Ser Leu Val Glu Tyr Phe Asn Asp Ser Gly
290 295 300
Asn Arg Asp Val Gln Val Asp Tyr Ile Ser Val Asn Gly Asn Val Arg
305 310 315 320
Gln Ser Glu Asn Gln Thr Tyr Asn Thr Gly Val Tyr Gln Asn Gly Ala
325 330 335
Cys Gly Gly Gly Asn Gly Arg Ser Glu Trp Leu His Cys Asn Gly Ala
340 345 350
Ile Gly Tyr Gly Asp Ile
355
<210> 371
<211> 1245
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 371
gtgaccggga tcgcgagaaa aggcgtatgg tccgtgattt ccggaacttt cactgccggg 60
gattacgatt cctacctgct gtatgtcgaa acacaggacc agggcggcgg acacccgacg 120
ctgagctttg aaatccggaa cttcagactg acggcaccgg aaggcatcgc tccgccgaag 180
gcgacagaag aaccggctga cgcggcagag gcgacgcctg ttccggcact gagcgagatt 240
ccgggcctga aggacgtcta cgcggactac tttgacttcg gcgctgcggc gccgcagtat 300
gcattcggcc tcggccagac ccagctgcag gacctgatga tcagccagtt cagcatcctg 360
acccctgaaa acgaactgaa accggacagc gtgcttgatg tccagacgag taaaaaactg 420
gcggcagaag acgaaaccgc ggtggcgatc aggctgaacg ccgcaacgcc gctgctgaag 480
ttcgcgcaga agaacggcat caaagtgcac ggccatgtgc tggtatggca cagccagacg 540
ccggaagctt tcttccatga aggatacgat accaagaaac cctatgtgac gagagaggtt 600
atgctcggcc gcctggaaaa ctatatccgt gaagtgctga cgcagacaga ggaacagttc 660
ccgggcgtga tcgtcagctg ggacgtcgtg aacgaggcga tcgacgacgg tactcactgg 720
ctgcggaaga cttccagctg gtacaaagtc gtcggcgagg atttcctgaa cagggctttt 780
gaatacgcca ggaaatacgc cgcggagggc gtgctgctgt actacaacga ttacagcacg 840
gcaaattcgg ctaaactgat gggcatcacg aagctgctga agcagctgat tccagacggg 900
aatatcgacg gctacggatt ccagatgcac catgacctcg gctggccgag catcgacctt 960
atggcggcag ctgtgaagca gattgccggc ctggggctga aactgcgcgt cagcgaactg 1020
gatatcggcg tatccaagaa caatcaggaa aactatgaca aacaggccaa acgctacaag 1080
gaaatgctga acctgatgct gcagtacgcg gaccagacgg aagccgtgca ggtctggggc 1140
ctgacggaca acatgagctg gagaaccggc aaatacccgc tgctgttcga cagcgcggca 1200
aaaccgaaaa aggcgttctt cgcggtgatt gaagccgcag aggaa 1245
<210> 372
<211> 415
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 372
Met Thr Gly Ile Ala Arg Lys Gly Val Trp Ser Val Ile Ser Gly Thr
1 5 10 15
Phe Thr Ala Gly Asp Tyr Asp Ser Tyr Leu Leu Tyr Val Glu Thr Gln
20 25 30
Asp Gln Gly Gly Gly His Pro Thr Leu Ser Phe Glu Ile Arg Asn Phe
35 40 45
Arg Leu Thr Ala Pro Glu Gly Ile Ala Pro Pro Lys Ala Thr Glu Glu
50 55 60
Pro Ala Asp Ala Ala Glu Ala Thr Pro Val Pro Ala Leu Ser Glu Ile
65 70 75 80
Pro Gly Leu Lys Asp Val Tyr Ala Asp Tyr Phe Asp Phe Gly Ala Ala
85 90 95
Ala Pro Gln Tyr Ala Phe Gly Leu Gly Gln Thr Gln Leu Gln Asp Leu
100 105 110
Met Ile Ser Gln Phe Ser Ile Leu Thr Pro Glu Asn Glu Leu Lys Pro
115 120 125
Asp Ser Val Leu Asp Val Gln Thr Ser Lys Lys Leu Ala Ala Glu Asp
130 135 140
Glu Thr Ala Val Ala Ile Arg Leu Asn Ala Ala Thr Pro Leu Leu Lys
145 150 155 160
Phe Ala Gln Lys Asn Gly Ile Lys Val His Gly His Val Leu Val Trp
165 170 175
His Ser Gln Thr Pro Glu Ala Phe Phe His Glu Gly Tyr Asp Thr Lys
180 185 190
Lys Pro Tyr Val Thr Arg Glu Val Met Leu Gly Arg Leu Glu Asn Tyr
195 200 205
Ile Arg Glu Val Leu Thr Gln Thr Glu Glu Gln Phe Pro Gly Val Ile
210 215 220
Val Ser Trp Asp Val Val Asn Glu Ala Ile Asp Asp Gly Thr His Trp
225 230 235 240
Leu Arg Lys Thr Ser Ser Trp Tyr Lys Val Val Gly Glu Asp Phe Leu
245 250 255
Asn Arg Ala Phe Glu Tyr Ala Arg Lys Tyr Ala Ala Glu Gly Val Leu
260 265 270
Leu Tyr Tyr Asn Asp Tyr Ser Thr Ala Asn Ser Ala Lys Leu Met Gly
275 280 285
Ile Thr Lys Leu Leu Lys Gln Leu Ile Pro Asp Gly Asn Ile Asp Gly
290 295 300
Tyr Gly Phe Gln Met His His Asp Leu Gly Trp Pro Ser Ile Asp Leu
305 310 315 320
Met Ala Ala Ala Val Lys Gln Ile Ala Gly Leu Gly Leu Lys Leu Arg
325 330 335
Val Ser Glu Leu Asp Ile Gly Val Ser Lys Asn Asn Gln Glu Asn Tyr
340 345 350
Asp Lys Gln Ala Lys Arg Tyr Lys Glu Met Leu Asn Leu Met Leu Gln
355 360 365
Tyr Ala Asp Gln Thr Glu Ala Val Gln Val Trp Gly Leu Thr Asp Asn
370 375 380
Met Ser Trp Arg Thr Gly Lys Tyr Pro Leu Leu Phe Asp Ser Ala Ala
385 390 395 400
Lys Pro Lys Lys Ala Phe Phe Ala Val Ile Glu Ala Ala Glu Glu
405 410 415
<210> 373
<211> 1539
<212> DNA
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 373
ttgattggct gcgtcatgtc gccgccggaa gcgggaagtc cccgttttga tcttttaacc 60
cggcacttta atgtcatcac cgcggaaaac gccatgaagc ccgcgtcgtt gcagcgcgaa 120
aagggggtgt ttacttttga acaggcggac atgatggtgg acgcggtatt ggagcgggga 180
ctgaagatcc acggacatac tctggcctgg caccagcagt ctccggagtg gatgaatcat 240
gaggggattt cccgggacga agccgtggaa aatctcaccg tccacgccaa aaccgcggcc 300
gctcatttta gggggcgggt catatcctgg gatgtactca acgaggcgat cattgacaat 360
ccccccaacc ccggggattg gcgggcatcc ctcaggcaaa gcccctggta caaagccata 420
ggcccggatt acgtggagct tgtgttcaag gcggccaggg aggcggaccc ggaggcaaaa 480
ctttattata acgattacaa ccttgataac cggaacaagg ccctggcggt ttacaacatg 540
gtcagggaac tgaacgaaaa gaatccgaat ccgggcggca ggcccctcat cgacggcgtg 600
ggcatgcagg gccattaccg cctgaatacc aataccgata acgtgaggct gtcgctggaa 660
cggtttattt ccctgggggt cgaggtcagc atcacggagc tcgatataca ggccggttcg 720
gattcaaacc agacagagcg gcagcgggtg gaacagggcc tggtctatgc cgctttgttt 780
accattttcc gggaacacgc ggcaaacata ggccgggtaa ctttttgggg acttgacgac 840
ggggcaagct ggcgttccgc ggcgagtccc tgcctctttg ataaaaacct caacgcaaaa 900
cctgcctttt acgcggtcct ggacccggat tcctttattg cggaaaacag cgccctgctg 960
atcagggaag cgaaagaggg agaggcttat tatggtacgc ctgctttagg cgccgtccct 1020
gatcccctct gggacagggc gccttccctc ccggtggatc agtacctcat ggcctggcag 1080
ggcgcttcgg gaagggcaaa agtcctctgg gacgaaaaaa atctctatgt gctggtccgg 1140
gttgaaaacg cggaaataaa caaggacagt tccaacagct acgaacagga ttcggtcgaa 1200
atttttattg atgaggataa ccggaaaagt tcctttttca gggaggatga cgggcagtac 1260
cgggtcaatt ttgccaacga ggcgggcttt aacccctcgt ccgccggggc ggggtttgtt 1320
tcggccgccg cggtggatgg aaaatcctat accgttacca tgaagattcc ctttaaaaca 1380
atagtccccg gagcggggac gcgtatcggg tttgatgtcc agatcaacgg cgcgtcggcc 1440
agggggatac gggagagcgt ggcggtatgg aatgatacca cgggcaattc atttcaggat 1500
acctcaggtt acggggtact gcggttagta aaaaagtaa 1539
<210> 374
<211> 512
<212> PRT
<213> Unknown
<220>
<223> Obtained from an environmental sample.
<400> 374
Met Ile Gly Cys Val Met Ser Pro Pro Glu Ala Gly Ser Pro Arg Phe
1 5 10 15
Asp Leu Leu Thr Arg His Phe Asn Val Ile Thr Ala Glu Asn Ala Met
20 25 30
Lys Pro Ala Ser Leu Gln Arg Glu Lys Gly Val Phe Thr Phe Glu Gln
35 40 45
Ala Asp Met Met Val Asp Ala Val Leu Glu Arg Gly Leu Lys Ile His
50 55 60
Gly His Thr Leu Ala Trp His Gln Gln Ser Pro Glu Trp Met Asn His
65 70 75 80
Glu Gly Ile Ser Arg Asp Glu Ala Val Glu Asn Leu Thr Val His Ala
85 90 95
Lys Thr Ala Ala Ala His Phe Arg Gly Arg Val Ile Ser Trp Asp Val
100 105 110
Leu Asn Glu Ala Ile Ile Asp Asn Pro Pro Asn Pro Gly Asp Trp Arg
115 120 125
Ala Ser Leu Arg Gln Ser Pro Trp Tyr Lys Ala Ile Gly Pro Asp Tyr
130 135 140
Val Glu Leu Val Phe Lys Ala Ala Arg Glu Ala Asp Pro Glu Ala Lys
145 150 155 160
Leu Tyr Tyr Asn Asp Tyr Asn Leu Asp Asn Arg Asn Lys Ala Leu Ala
165 170 175
Val Tyr Asn Met Val Arg Glu Leu Asn Glu Lys Asn Pro Asn Pro Gly
180 185 190
Gly Arg Pro Leu Ile Asp Gly Val Gly Met Gln Gly His Tyr Arg Leu
195 200 205
Asn Thr Asn Thr Asp Asn Val Arg Leu Ser Leu Glu Arg Phe Ile Ser
210 215 220
Leu Gly Val Glu Val Ser Ile Thr Glu Leu Asp Ile Gln Ala Gly Ser
225 230 235 240
Asp Ser Asn Gln Thr Glu Arg Gln Arg Val Glu Gln Gly Leu Val Tyr
245 250 255
Ala Ala Leu Phe Thr Ile Phe Arg Glu His Ala Ala Asn Ile Gly Arg
260 265 270
Val Thr Phe Trp Gly Leu Asp Asp Gly Ala Ser Trp Arg Ser Ala Ala
275 280 285
Ser Pro Cys Leu Phe Asp Lys Asn Leu Asn Ala Lys Pro Ala Phe Tyr
290 295 300
Ala Val Leu Asp Pro Asp Ser Phe Ile Ala Glu Asn Ser Ala Leu Leu
305 310 315 320
Ile Arg Glu Ala Lys Glu Gly Glu Ala Tyr Tyr Gly Thr Pro Ala Leu
325 330 335
Gly Ala Val Pro Asp Pro Leu Trp Asp Arg Ala Pro Ser Leu Pro Val
340 345 350
Asp Gln Tyr Leu Met Ala Trp Gln Gly Ala Ser Gly Arg Ala Lys Val
355 360 365
Leu Trp Asp Glu Lys Asn Leu Tyr Val Leu Val Arg Val Glu Asn Ala
370 375 380
Glu Ile Asn Lys Asp Ser Ser Asn Ser Tyr Glu Gln Asp Ser Val Glu
385 390 395 400
Ile Phe Ile Asp Glu Asp Asn Arg Lys Ser Ser Phe Phe Arg Glu Asp
405 410 415
Asp Gly Gln Tyr Arg Val Asn Phe Ala Asn Glu Ala Gly Phe Asn Pro
420 425 430
Ser Ser Ala Gly Ala Gly Phe Val Ser Ala Ala Ala Val Asp Gly Lys
435 440 445
Ser Tyr Thr Val Thr Met Lys Ile Pro Phe Lys Thr Ile Val Pro Gly
450 455 460
Ala Gly Thr Arg Ile Gly Phe Asp Val Gln Ile Asn Gly Ala Ser Ala
465 470 475 480
Arg Gly Ile Arg Glu Ser Val Ala Val Trp Asn Asp Thr Thr Gly Asn
485 490 495
Ser Phe Gln Asp Thr Ser Gly Tyr Gly Val Leu Arg Leu Val Lys Lys
500 505 510
<210> 375
<211> 570
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetically generated polynucleotide
<400> 375
atggccctta tggcttcgac attctactgg cacttgtgga ctgatggtat agggacagta 60
aatgctacca atggatctga tggcaattac agcgtttcat ggtcaaattg cgggaatttt 120
gttgttggta aaggctggac taccggatca gcaactaggg taataaacta taatgcccac 180
gccttttcgg tagtgggtaa tgcttatttg gctctttatg ggtggacgag aaattcactc 240
atagaatatt acgtcgttga tagctggggg acttatagac ctactggaac ttataaaggc 300
actgtgacta gtgatggagg gacttatgac atatacacga ctacacgaac caacgcacct 360
tccattgacg gcaataatac aactttcacc cagttctgga gtgttaggca gtcgaagaga 420
ccgattggta ccaacaatac catcaccttt agcaaccatg ttaacgcctg gaagagtaaa 480
ggaatgaatt tggggagtag ttggtcttat caggtattag caacagaggg ctatcaaagt 540
agtgggtact ctaacgtaac ggtctggtaa 570
<210> 376
<211> 189
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically generated polypeptide
<400> 376
Met Ala Leu Met Ala Ser Thr Phe Tyr Trp His Leu Trp Thr Asp Gly
1 5 10 15
Ile Gly Thr Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val
20 25 30
Ser Trp Ser Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr
35 40 45
Gly Ser Ala Thr Arg Val Ile Asn Tyr Asn Ala His Ala Phe Ser Val
50 55 60
Val Gly Asn Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu
65 70 75 80
Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly
85 90 95
Thr Tyr Lys Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr
100 105 110
Thr Thr Thr Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr
115 120 125
Phe Thr Gln Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr
130 135 140
Asn Asn Thr Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys
145 150 155 160
Gly Met Asn Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu
165 170 175
Gly Tyr Gln Ser Ser Gly Tyr Ser Asn Val Thr Val Trp
180 185
<210> 377
<211> 570
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetically generated polynucleotide
<400> 377
atggccctta tggcttcgac attctactgg cacttgtgga ctgatggtat agggacagta 60
aatgctacca atggatctga tggcaattac agcgtttcat ggtcaaattg cgggaatttt 120
gttgttggta aaggctggac taccggatca gcaactaggg taataaacta taatgcccac 180
gccttttcgg tagtgggtaa tgcttatttg gctctttatg ggtggacgag aaatccactc 240
atagaatatt acgtcgttga tagctggggg acttatagac ctactggaac ttataaaggc 300
actgtgacta gtgatggagg gacttatgac atatacacga ctacacgaac caacgcacct 360
tccattgacg gcaataatac aactttcacc cagttctgga gtgttaggca gtcgaagaga 420
ccgattggta ccaacaatac catcaccttt agcaaccatg ttaacgcctg gaagagtaaa 480
ggaatgaatt tggggagtag ttggtcttat caggtattag caacagaggg ctatcaaagt 540
agtgggtact ctaacgtaac ggtctggtaa 570
<210> 378
<211> 189
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically generated polypeptide
<400> 378
Met Ala Leu Met Ala Ser Thr Phe Tyr Trp His Leu Trp Thr Asp Gly
1 5 10 15
Ile Gly Thr Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val
20 25 30
Ser Trp Ser Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr
35 40 45
Gly Ser Ala Thr Arg Val Ile Asn Tyr Asn Ala His Ala Phe Ser Val
50 55 60
Val Gly Asn Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Pro Leu
65 70 75 80
Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly
85 90 95
Thr Tyr Lys Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr
100 105 110
Thr Thr Thr Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr
115 120 125
Phe Thr Gln Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr
130 135 140
Asn Asn Thr Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys
145 150 155 160
Gly Met Asn Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu
165 170 175
Gly Tyr Gln Ser Ser Gly Tyr Ser Asn Val Thr Val Trp
180 185
<210> 379
<211> 570
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetically generated polynucleotide.
<400> 379
atggccctta tggcttcgac attctactgg cacaattgga ctgatggtat agggacagta 60
aatgctacca atggatctga tggcaattac agcgtttcat ggtcaaattg cgggaatttt 120
gttgttggta aaggctggac taccggatca gcaactaggg taataaacta taatgcccac 180
gccttttcgc cggtgggtaa tgcttatttg gctctttatg ggtggacgag aaattcactc 240
atagaatatt acgtcgttga tagctggggg acttatagac ctactggaac ttataaaggc 300
actgtgacta gtgatggagg gacttatgac atatacacga ctacacgaac caacgcacct 360
tccattgacg gcaataatac aactttcacc cagttctgga gtgttaggca gtcgaagaga 420
ccgattggta ccaacaatac catcaccttt agcaaccatg ttaacgcctg gaagagtaaa 480
ggaatgaatt tggggagtag ttggtcttat caggtattag caacagaggg ctatcaaagt 540
agtgggtact ctaacgtaac ggtctggtaa 570
<210> 380
<211> 189
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically generated polypeptide.
<400> 380
Met Ala Leu Met Ala Ser Thr Phe Tyr Trp His Asn Trp Thr Asp Gly
1 5 10 15
Ile Gly Thr Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val
20 25 30
Ser Trp Ser Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr
35 40 45
Gly Ser Ala Thr Arg Val Ile Asn Tyr Asn Ala His Ala Phe Ser Pro
50 55 60
Val Gly Asn Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu
65 70 75 80
Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly
85 90 95
Thr Tyr Lys Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr
100 105 110
Thr Thr Thr Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr
115 120 125
Phe Thr Gln Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr
130 135 140
Asn Asn Thr Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys
145 150 155 160
Gly Met Asn Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu
165 170 175
Gly Tyr Gln Ser Ser Gly Tyr Ser Asn Val Thr Val Trp
180 185
Claims (215)
- 약 100개 이상의 잔기로 이루어진 영역에 걸쳐 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379의 서열에 대해 50% 이상의서열 동일성을 보유하는 핵산 서열을 포함하는 분리된 핵산 또는 재조합 핵산으로서, 상기 핵산은 자일라나제 활성을 보유하는 하나 이상의 폴리펩티드를 암호화하고, 상기 서열 동일성은 서열 비교 알고리즘에 의한 분석 또는 시각 검사를 통해 결정한 것인 분리된 핵산 또는 재조합 핵산.
- 제1항에 있어서, 상기 서열 동일성은 약 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63% 또는 64% 이상인 분리된 핵산 또는 재조합 핵산.
- 제1항에 있어서, 상기 서열 동일성은 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379의 서열에 대해 약 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성인 분리된 핵산 또는 재조합 핵산.
- 제1항에 있어서, 상기 서열 동일성은 약 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150개 이상의 잔기로 이루어진 영역, 전장 유전자 또는 전사체에 걸친 것인 분리된 핵산 또는 재조합 핵산.
- 제1항에 있어서, 상기 핵산 서열은 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379의 서열을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제1항에 있어서, 상기 핵산은 서열 번호 2, 서열 번호 4, 서열 번호 6, 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18, 서열 번호 20, 서열 번호 22, 서열 번호 24, 서열 번호 26, 서열 번호 28, 서열 번호 30, 서열 번호 32, 서열 번호 34, 서열 번호 36, 서열 번호 38, 서열 번호 40,서열 번호 42, 서열 번호 44, 서열 번호 46, 서열 번호 48, 서열 번호 50, 서열 번호 52, 서열 번호 54, 서열 번호 56, 서열 번호 58, 서열 번호 60, 서열 번호 62, 서열 번호 64, 서열 번호 66, 서열 번호 68, 서열 번호 70, 서열 번호 72, 서열 번호 74, 서열 번호 76, 서열 번호 78, 서열 번호 80, 서열 번호 82, 서열 번호 84, 서열 번호 86, 서열 번호 88, 서열 번호 90, 서열 번호 92, 서열 번호 94, 서열 번호 96, 서열 번호 98, 서열 번호 100, 서열 번호 102, 서열 번호 104, 서열 번호 106, 서열 번호 108, 서열 번호 110, 서열 번호 112, 서열 번호 114, 서열 번호 116, 서열 번호 118, 서열 번호 120, 서열 번호 122, 서열 번호 124, 서열 번호 126, 서열 번호 128, 서열 번호 130, 서열 번호 132, 서열 번호 134, 서열 번호 136, 서열 번호 138, 서열 번호 140, 서열 번호 142, 서열 번호 144, 서열 번호 146, 서열 번호 148, 서열 번호 150, 서열 번호 152, 서열 번호 154, 서열 번호 156, 서열 번호 158, 서열 번호 160, 서열 번호 162, 서열 번호 164, 서열 번호 166, 서열 번호 168, 서열 번호 170, 서열 번호 172, 서열 번호 174, 서열 번호 176, 서열 번호 178, 서열 번호 180, 서열 번호 182, 서열 번호 184, 서열 번호 186, 서열 번호 188, 서열 번호 190, 서열 번호 192, 서열 번호 194, 서열 번호 196, 서열 번호 198, 서열 번호 200, 서열 번호 202, 서열 번호 204, 서열 번호 206, 서열 번호 208, 서열 번호 210, 서열 번호 212, 서열 번호 214, 서열 번호 216, 서열 번호 218, 서열 번호 220, 서열 번호 222, 서열 번호 224, 서열 번호 226, 서열 번호 228, 서열 번호 230, 서열 번호 232, 서열 번호 234, 서열 번호 236, 서열 번호 238, 서열 번호 240, 서열 번호 242, 서열 번호 244, 서열 번호246, 서열 번호 248, 서열 번호 250, 서열 번호 252, 서열 번호 254, 서열 번호 256, 서열 번호 258, 서열 번호 260, 서열 번호 262, 서열 번호 264, 서열 번호 266, 서열 번호 268, 서열 번호 270, 서열 번호 272, 서열 번호 274, 서열 번호 276, 서열 번호 278, 서열 번호 280, 서열 번호 282, 서열 번호 284, 서열 번호 286, 서열 번호 288, 서열 번호 290, 서열 번호 292, 서열 번호 294, 서열 번호 296, 서열 번호 298, 서열 번호 300, 서열 번호 302, 서열 번호 304, 서열 번호 306, 서열 번호 308, 서열 번호 310, 서열 번호 312, 서열 번호 314, 서열 번호 316, 서열 번호 318, 서열 번호 320, 서열 번호 322, 서열 번호 324, 서열 번호 326, 서열 번호 328, 서열 번호 330, 서열 번호 332, 서열 번호 334, 서열 번호 336, 서열 번호 338, 서열 번호 340, 서열 번호 342, 서열 번호 344, 서열 번호 346, 서열 번호 348, 서열 번호 350, 서열 번호 352, 서열 번호 354, 서열 번호 356, 서열 번호 358, 서열 번호 360, 서열 번호 362, 서열 번호 364, 서열 번호 366, 서열 번호 368, 서열 번호 370, 서열 번호 372, 서열 번호 374, 서열 번호 376, 서열 번호 378 또는 서열 번호 380의 서열을 보유하는 폴리펩티드를 암호화하는 것인 분리된 핵산 또는 재조합 핵산.
- 제1항에 있어서, 상기 서열 비교 알고리즘은 BLAST 버젼 2.2.2 알고리즘이며, 이때 필터링 세팅은 blastall-p blastp-d "nr pataa" -F F로 설정하고, 모든 다른 옵션은 디폴트로 설정하는 것인 분리된 핵산 또는 재조합 핵산.
- 제1항에 있어서, 상기 자일라나제 활성은 내부 β-1,4-자일로시드 결합의 가수분해를 촉진하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제8항에 있어서, 상기 자일라나제 활성은 엔도-1,4-베타-자일라나제 활성을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제1항에 있어서, 상기 자일라나제 활성은 더 적은 분자량의 자일로즈와 자일로-올리고머를 생성하기 위한 자일란의 가수분해를 촉진하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제10항에 있어서, 상기 자일란은 아라비노자일란을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제11항에 있어서, 상기 아라비노자일란은 수용성 아라비노자일란을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제12항에 있어서, 상기 수용성 아라비노자일란은 반죽 또는 빵류 제품을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제1항에 있어서, 상기 자일라나제 활성은 1,4-β-글리코시드-결합된 D-자일로피라노즈를 포함하는 다당류를 가수분해하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제1항에 있어서, 상기 자일라나제 활성은 헤미셀룰로즈를 가수분해하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제15항에 있어서, 상기 자일라나제 활성은 목재 또는 종이 펄프 또는 종이 제품내 헤미셀룰로즈를 가수분해하는 것을 포함하는 것인 분리된 핵산 또는 재조합핵산.
- 제8항에 있어서, 상기 자일라나제 활성은 사료 또는 식품 중 자일란의 가수분해를 촉진하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제17항에 있어서, 상기 사료 또는 식품은 곡물이 주성분인 동물 사료, 맥아즙 또는 맥주, 우유 또는 유제품, 과일 또는 채소를 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제1항에 있어서, 상기 자일란 활성은 미생물 세포 또는 식물 세포중 자알린의 가수분해를 촉진하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제1항에 있어서, 상기 자일라나제 활성은 열안정성인 분리된 핵산 또는 재조합 핵산.
- 제20항에 있어서, 상기 폴리펩티드는 약 37℃∼약 95℃, 또는 약 55℃∼약 85℃, 또는 약 70℃∼약 75℃, 또는 약 70℃∼약 95℃, 또는 약 90℃∼약 95℃의 온도를 포함하는 조건 하에서 자일라나제 활성을 보유하는 것인 분리된 핵산 또는 재조합 핵산.
- 제1항에 있어서, 상기 자일라나제 활성은 내열성인 분리된 핵산 또는 재조합 핵산.
- 제22항에 있어서, 상기 폴리펩티드는 약 37℃∼약 95℃, 또는 약 55℃∼약 85℃, 또는 약 70℃∼약 75℃, 또는 약 90℃∼약 95℃ 범위의 온도에 노출후 자일라나제 활성을 보유하는 것인 분리된 핵산 또는 재조합
- 엄격한 조건 하에서 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51,서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379를 포함하는 핵산에 하이브리드화하는 서열을 포함하며, 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 것인 분리된 핵산 또는 재조합 핵산.
- 제24항에 있어서, 상기 핵산은 길이가 약 50, 75, 100, 150, 200, 300, 400, 500, 600, 700, 800, 900, 1000개 이상의 잔기이거나, 유전자 또는 전사체의 전체 길이인 분리된 핵산 또는 재조합 핵산.
- 제24항에 있어서, 상기 엄격한 조건은 약 65℃의 온도에서 약 15분 동안 0.2X SSC 중에서 세척하는 단계를 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산을 동정하기 위한 핵산 프로브로서, 상기 프로브는 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379를 포함하는 서열의 10개 이상의 연속 염기를 포함하고 결합 또는 하이브리드화에 의해 핵산을 동정하는 것인 핵산 프로브.
- 제27항에 있어서, 상기 프로브는 약 10∼50, 약 20∼60, 약 30∼70, 약 40∼80, 약 60∼100 또는 약 50∼150개의 연속 염기를 포함하는 올리고뉴클레오티드를 포함하는 것인 핵산 프로브.
- 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산을 동정하기 위한 핵산 프로브로서, 상기 프로브는 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379의 서열에 대해 50% 이상의 서열 동일성을 보유하는 핵산 서열의 약 10개 이상의 연속 잔기를 포함하는 핵산을 포함하며, 상기 서열 동일성은 서열 비교 알고리즘 또는 시각 검사를 통해 결정된 것인 핵산 프로브.
- 제29항에 있어서, 상기 프로브는 약 10∼50, 약 20∼60, 약 30∼70, 약 40∼80, 약 60∼100 또는 약 50∼150개 이상의 연속 염기를 포함하는 올리고뉴클레오티드를 포함하는 것인 핵산 프로브.
- 자일라나제 할성을 보유하는 폴리펩티드를 암호화하는 핵산을 증폭하기 위한 증폭 프라이머 쌍으로서, 상기 프라이머 쌍은 제1항 또는 제24항의 서열 또는 이의하위서열을 포함하는 핵산을 증폭시킬 수 있는 것인 증폭 프라이머 쌍.
- 제31항에 있어서, 상기 다수의 증폭 프라이머 서열 쌍은 상기 서열의 약 10∼50개의 연속 염기 또는 상기 서열의 약 12, 13, 14, 15, 16, 17, 18, 19, 20,21, 22, 23, 24, 25, 26, 27, 28, 29, 30개 이상의 연속 염기를 포함하는 것인 증폭 프라이머 쌍.
- 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379의 대략 최초 (5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30개 이상의 잔기로 나타낸 서열을 보유하는 제1 요소 및 상기 제1 요소의 상보성 스트랜드의 대략 최초 (5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30개 이상의 잔기로 나타낸 서열을 보유하는 제2 요소를 포함하는 증폭 프라이머 쌍.
- 제33항의 증폭 프라이머 쌍을 이용하는 폴리뉴클레오티드의 증폭에 의해 생성된, 자일라나제를 암호화하는 핵산.
- 제34항에 있어서, 상기 증폭은 폴리머라제 연쇄 반응(PCR)에 의한 것인 자일라나제를 암호화하는 핵산.
- 제34항에 있어서, 상기 핵산은 유전자 라이브러리의 증폭에 의해 생성된 것인 자일라나제를 암호화하는 핵산.
- 제34항에 있어서, 상기 유전자 라이브러리는 환경 라이브러리인 자일라나제를 암호화하는 핵산.
- 제34항의 자일라나제를 암호화하는 핵산에 의해 암호화된 분리된 자일라나제 또는 재조합 자일라나제.
- 제1항 또는 제24항의 핵산 서열 또는 이의 하위서열을 증폭킬 수 있는 증폭 프라이머 서열 쌍을 이용하여 주형 핵산을 증폭시키는 단계를 포함하는, 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산의 증폭 방법.
- 제1항 또는 제24항의 서열을 포함하는 핵산을 포함하는 발현 카세트.
- 제1항 또는 제24항의 서열을 포함하는 핵산을 포함하는 벡터.
- 제1항 또는 제24항의 서열을 포함하는 핵산을 포함하는 클로닝 비히클로서, 상기 클로닝 비히클은 바이러스 벡터, 플라스미드, 파지, 파지미드, 코스미드, 포스미드, 박테리오파지 또는 인공 염색체를 포함하는 것인 클로닝 비히클.
- 제42항에 있어서, 상기 바이러스 벡터는 아데노바이러스 벡터, 레트로바이러스 벡터 또는 아데노-관련 바이러스 벡터를 포함하는 것인 클로닝 비히클.
- 제42항에 있어서, 박테리아 인공 염색체(BAC), 플라스미드, 박테리오파지 P1-유도된 벡터(PAC), 효모 인공 염색체(YAC) 또는 포유류 인공 염색체(MAC)를 포함하는 것인 클로닝 벡터.
- 제1항 또는 제24항의 서열을 포함하는 핵산을 포함하는 형질전환 세포.
- 제40항의 발현 카세트를 포함하는 형질전환 세포.
- 제40항에 있어서, 상기 세포는 박테리아 세포, 포유류 세포, 진균 세포, 효모 세포, 곤충 세포 또는 식물 세포인 형질전환 세포.
- 제1항 또는 제24항의 서열을 포함하는 트랜스게닉 비인간 동물.
- 제48항에 있어서, 상기 동물은 마우스인 트랜스게닉 비인간 동물.
- 제1항 또는 제24항의 서열을 포함하는 트랜스게닉 식물
- 제50항에 있어서, 상기 식물이 옥수수 식물, 사탕수수 식물, 감자 식물, 토마토 식물, 밀 식물, 오일시드 식물, 평자씨 식물, 대두 식물, 쌀 식물, 보리 식물, 잔디 또는 담배 식물인 트랜스게닉 식물.
- 제1항 또는 제24항의 서열을 포함하는 트랜스게닉 종자.
- 제52항에 있어서, 상기 종자는 옥수수 종자, 밀 낟알, 오일시드, 평자씨, 대두 종자, 종려 종자, 해바라기씨, 참깨씨, 쌀, 보리, 땅콩 또는 담배 식물 종자인 트랜스게닉 종자.
- 엄격한 조건 하에서 제1항 또는 제24항의 서열 또는 이의 하위서열에 상보적이거나, 또는 하이브리드화할 수 있는 핵산 서열을 포함하는 안티센스 올리고뉴클레오티드.
- 제49항에 있어서, 상기 안티센스 올리고뉴클레오티드는 길이가 약 10∼50, 약 20∼60, 약 30∼70, 약 40∼80 또는 약 60∼100개의 염기인 안티센스 올리고뉴클레오티드.
- 엄격한 조건 하에서 제1항 또는 제24항의 서열에 상보적이거나, 또는 하이브리드화할 수 있는 핵산 서열을 포함하는 안티센스 올리고뉴클레오티드를 세포에 투여하거나, 또는 세포 내에서 발현시키는 단계를 포함하는, 세포 내에서 자일라나제 메세지의 번역을 억제하는 방법.
- 제1항 또는 제24항의 서열의 하위서열을 포함하는 이본쇄 억제성 RNA(RNAi) 분자.
- 제52항에 있어서, 상기 RNAi는 길이가 약 15, 16, 17, 18, 19, 20, 21, 22,23, 24, 25개 이상의 이중 뉴클레오티드인 이본쇄 억제성 RNA(RNAi) 분자.
- 이본쇄 억제성 RNA(RNAi)를 세포에 투여하거나, 또는 세포 내에서 발현시키는 단계를 포함하는, 세포 내에서 자일라나제의 발현을 억제하는 방법으로서, 상기 RNA는 제1항 또는 제24항의 서열의 하위서열을 포함하는 것인 방법.
- (i) 약 100개 이상의 잔기로 이루어진 영역에 걸쳐 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379의 서열에 대해 50% 이상의 서열 동일성을 보유하거나(이때, 상기 서열 동일성은 서열 비교 알고리즘에 의한 분석 또는 시각 검사를 통해 결정한 것임) 또는(ii) 약 100개 이상의 잔기로 이루어진 영역에 걸쳐 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379의 서열에 대해 50% 이상의 서열 동일성을 보유(이때, 상기 서열 동일성은 서열 비교 알고리즘에 의한 분석 또는 시각 검사를 통해 결정한 것임)하는 핵산에 의해 암호화되거나, 또는 엄격한 조건 하에서 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379의 서열에 하이브리드화할 수 있는 핵산에 의해 암호화된 분리된 폴리펩티드 또는 재조합 폴리펩티드.
- 제60항에 있어서, 상기 서열 동일성은 일정 영역에 걸쳐 약 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상, 또는 100%인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
- 제60항에 있어서, 상기 서열 동일성은 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050개 이상의 잔기로 이루어진 영역 또는 효소의 전체 길이에 걸친 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
- 제60항에 있어서, 상기 폴리펩티드는 서열 번호 2, 서열 번호 4, 서열 번호 6, 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18, 서열 번호 20, 서열 번호 22, 서열 번호 24, 서열 번호 26, 서열 번호28, 서열 번호 30, 서열 번호 32, 서열 번호 34, 서열 번호 36, 서열 번호 38, 서열 번호 40, 서열 번호 42, 서열 번호 44, 서열 번호 46, 서열 번호 48, 서열 번호 50, 서열 번호 52, 서열 번호 54, 서열 번호 56, 서열 번호 58, 서열 번호 60, 서열 번호 62, 서열 번호 64, 서열 번호 66, 서열 번호 68, 서열 번호 70, 서열 번호 72, 서열 번호 74, 서열 번호 76, 서열 번호 78, 서열 번호 80, 서열 번호 82, 서열 번호 84, 서열 번호 86, 서열 번호 88, 서열 번호 90, 서열 번호 92, 서열 번호 94, 서열 번호 96, 서열 번호 98, 서열 번호 100, 서열 번호 102, 서열 번호 104, 서열 번호 106, 서열 번호 108, 서열 번호 110, 서열 번호 112, 서열 번호 114, 서열 번호 116, 서열 번호 118, 서열 번호 120, 서열 번호 122, 서열 번호 124, 서열 번호 126, 서열 번호 128, 서열 번호 130, 서열 번호 132, 서열 번호 134, 서열 번호 136, 서열 번호 138, 서열 번호 140, 서열 번호 142, 서열 번호 144, 서열 번호 146, 서열 번호 148, 서열 번호 150, 서열 번호 152, 서열 번호 154, 서열 번호 156, 서열 번호 158, 서열 번호 160, 서열 번호 162, 서열 번호 164, 서열 번호 166, 서열 번호 168, 서열 번호 170, 서열 번호 172, 서열 번호 174, 서열 번호 176, 서열 번호 178, 서열 번호 180, 서열 번호 182, 서열 번호 184, 서열 번호 186, 서열 번호 188, 서열 번호 190, 서열 번호 192, 서열 번호 194, 서열 번호 196, 서열 번호 198, 서열 번호 200, 서열 번호 202, 서열 번호 204, 서열 번호 206, 서열 번호 208, 서열 번호 210, 서열 번호 212, 서열 번호 214, 서열 번호 216, 서열 번호 218, 서열 번호 220, 서열 번호 222, 서열 번호 224, 서열 번호 226, 서열 번호 228, 서열 번호 230, 서열 번호 232, 서열 번호 234, 서열 번호236, 서열 번호 238, 서열 번호 240, 서열 번호 242, 서열 번호 244, 서열 번호 246, 서열 번호 248, 서열 번호 250, 서열 번호 252, 서열 번호 254, 서열 번호 256, 서열 번호 258, 서열 번호 260, 서열 번호 262, 서열 번호 264, 서열 번호 266, 서열 번호 268, 서열 번호 270, 서열 번호 272, 서열 번호 274, 서열 번호 276, 서열 번호 278, 서열 번호 280, 서열 번호 282, 서열 번호 284, 서열 번호 286, 서열 번호 288, 서열 번호 290, 서열 번호 292, 서열 번호 294, 서열 번호 296, 서열 번호 298, 서열 번호 300, 서열 번호 302, 서열 번호 304, 서열 번호 306, 서열 번호 308, 서열 번호 310, 서열 번호 312, 서열 번호 314, 서열 번호 316, 서열 번호 318, 서열 번호 320, 서열 번호 322, 서열 번호 324, 서열 번호 326, 서열 번호 328, 서열 번호 330, 서열 번호 332, 서열 번호 334, 서열 번호 336, 서열 번호 338, 서열 번호 340, 서열 번호 342, 서열 번호 344, 서열 번호 346, 서열 번호 348, 서열 번호 350, 서열 번호 352, 서열 번호 354, 서열 번호 356, 서열 번호 358, 서열 번호 360, 서열 번호 362, 서열 번호 364, 서열 번호 366, 서열 번호 368, 서열 번호 370, 서열 번호 372, 서열 번호 374, 서열 번호 376, 서열 번호 378 또는 서열 번호 380의 서열을 보유하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
- 제60항에 있어서, 상기 폴리펩티드는 자일라나제 활성을 보유하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
- 제64항에 있어서, 상기 자일라나제 활성은 내부 β-1,4-자일로시드 결합의 가수분해를 촉진하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제65항에 있어서, 상기 자일라나제 활성은 엔도-1,4-베타-자일라나제 활성을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제64항에 있어서, 상기 자일라나제 활성은 더 적은 분자량의 자일로즈와 자일로-올리고머를 생성하기 위한 자일란의 가수분해를 촉진하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제67항에 있어서, 상기 자일란은 아라비노자일란을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제68항에 있어서, 상기 아라비노자일란은 수용성 아라비노자일란을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제69항에 있어서, 상기 수용성 아라비노자일란은 반죽 또는 빵류 제품을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제64항에 있어서, 상기 자일라나제 활성은 1,4-β-글리코시드-결합된 D-자일로피라노즈를 포함하는 다당류를 가수분해하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제64항에 있어서, 상기 자일라나제 활성은 헤미셀룰로즈를 가수분해하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제72항에 있어서, 상기 자일라나제 활성은 목재 또는 종이 펄프 또는 종이 제품내 헤미셀룰로즈를 가수분해하는 것을 포함하는 것인 분리된 핵산 또는 재조합핵산.
- 제73항에 있어서, 상기 자일라나제 활성은 사료 또는 식품 중 자일란의 가수분해를 촉진하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제74항에 있어서, 상기 사료 또는 식품은 곡물이 주성분인 동물 사료, 맥아즙 또는 맥주, 우유 또는 유제품, 과일 또는 채소를 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제64항에 있어서, 상기 자일란 활성은 미생물 세포 또는 식물 세포중 자알린의 가수분해를 촉진하는 것을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제64항에 있어서, 상기 자일라나제 활성은 열안정성인 분리된 핵산 또는 재조합 핵산.
- 제77항에 있어서 상기 폴리펩티드는 약 1℃∼약 5℃, 약 5℃∼약 15℃, 약 15℃∼약 25℃, 약 25℃∼약 37℃, 약 37℃∼약 95℃, 약 55℃∼약 85℃, 약 70℃∼약 95℃, 약 70℃∼약 75℃ 또는 약 90℃∼약 95℃의 온도를 포함하는 조건 하에서 자일라나제 활성을 보유하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
- 제64항에 있어서, 상기 자일라나제 활성은 내열성인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
- 제79항에 있어서, 상기 폴리펩티드는 약 1℃∼약 5℃, 약 5℃∼약 15℃, 약 15℃∼약 25℃, 약 25℃∼약 37℃, 약 37℃∼약 95℃, 약 55℃∼약 85℃, 약 70℃∼약 75℃ 또는 약 90℃∼약 95℃ 범위의 온도에 노출 후 자일라나제 활성을 보유하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
- 제60항의 폴리펩티드를 포함하고, 신호 서열 또는 프리프로 서열이 결여된 분리된 폴리펩티드 또는 재조합 폴리펩티드.
- 제60항의 폴리펩티드를 포함하고, 이종 신호 서열 또는 이종 프리프로 서열을 보유하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
- 제64항에 있어서, 상기 자일라나제 활성은 약 37℃에서 단백질 1 mg당 약 100∼약 1000 유닛, 단백질 1 mg당 약 500∼약 750 유닛, 단백질 1 mg당 약 500∼약 1200 유닛 또는 단백질 1 mg당 약 750∼약 1000 유닛 범위의 특이 활성을 포함하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
- 제79항에 있어서, 상기 내열성은 고온으로 가열한 후 37℃에서 자일라나제의 특이 활성의 1/2 이상을 보유하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
- 제79항에 있어서, 상기 내열성은 고온으로 가열한 후 37℃에서 단백질 1 mg 당 약 500∼약 1200 유닛 범위의 특이 활성을 보유하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
- 제60항에 있어서, 상기 폴리펩티드는 하나 이상의 글리코실화 부위를 포함하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
- 제86항에 있어서, 상기 글리코실화는 N-연결 글리코실화인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
- 제87항에 있어서, 상기 폴리펩티드는 피. 파스토리스(P. pastoris) 또는 에스. 폼브(S. pombe)에서 발현된 후 글리코실화되는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
- 제64항에 있어서, 상기 폴리펩티드는 약 pH 6.5, pH 6.0, pH 5.5, pH 5.0, pH 4.5 또는 pH 4.0을 포함하는 조건 하에서 자일라나제 활성을 보유하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
- 제64항에 있어서, 상기 폴리펩티드는 약 pH 7.5, pH 8. 0, pH 8.5, pH 9, pH 9.5, pH 10 또는 pH 10.5를 포함하는 조건 하에서 자일라나제 활성을 보유하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
- 제60항의 폴리펩티드를 포함하는 단백질 제제로서, 상기 단백질 제제는 액체, 고체 또는 젤을 포함하는 것인 단백질 제제.
- 제60항의 폴리펩티드 및 제2 도메인을 포함하는 이종이량체.
- 제92항에 있어서, 상기 제2 도메인은 폴리펩티드이고, 상기 이종이량체는 융합 단백질인 이종이량체.
- 제92항에 있어서, 상기 제2 도메인은 에피토프 또는 태그인 이종이량체.
- 제60항의 폴리펩티드를 포함하는 동종이량체.
- 제60항의 서열 또는 이의 하위서열을 포함하는, 고정화된 폴리펩티드.
- 제96항에 있어서, 상기 폴리펩티드는 세포, 금속, 수지, 중합체, 세라믹, 유리, 마이크로전극, 흑연 입자, 비드, 젤, 플레이트, 어레이 또는 모세관 위에 고정화된 것인 고정화된 폴리펩티드.
- 제60항의 고정화된 폴리펩티드를 포함하는 어레이.
- 제1항 또는 제24항의 고정화된 핵산을 포함하는 어레이.
- 제60항의 폴리펩티드에 특이적으로 결합하는 분리된 항체 또는 재조합 항체.
- 제100항에 있어서, 상기 항체는 모노클로날 항체 또는 폴리클로날 항체인 분리된 항체 또는 재조합 항체.
- 제60항의 폴리펩티드에 특이적으로 결합하는 항체를 포함하는 하이브리도마.
- (a) 제100항의 항체를 제공하는 단계;(b) 폴리펩티드를 포함하는 샘플을 제공하는 단계; 및(c) 상기 단계 (b)의 샘플과 상기 단계 (a)의 항체를, 상기 항체가 상기 폴리펩티드에 특이적으로 결합함으로써 자일라나제 활성을 보유하는 폴리펩티드를 동정할 수 있는 조건하에서 접촉시키는 단계를 포함하는 자일라나제 활성을 보유하는 폴리펩티드의 분리 또는 동정 방법.
- 비인간 동물에게, 체액성 면역 반응을 생성함으로써 항자일라나제 항체를 제조하기에 충분한 양으로 제1항 또는 제24항의 핵산 또는 이의 하위서열을 투여하는 단계를 포함하는, 항자일라나제 항체의 제조 방법.
- 비인간 동물에게, 체액성 면역 반응을 생성함으로써 항자일라나제 항체를 제조하기에 충분한 양으로 제60항의 폴리펩티드 또는 이의 하위서열을 투여하는 단계를 포함하는, 항자일라나제 항체의 제조 방법.
- (a) 제1항 또는 제24항의 서열을 포함하고, 프로모터에 작동가능하게 연결된 핵산을 제공하는 단계; 및(b) 폴리펩티드의 발현이 가능한 조건 하에서 상기 단계 (a)의 핵산을 발현시켜 재조합 폴리펩티드를 생성하는 단계를 포함하는, 재조합 폴리펩티드의 제조 방법.
- 제106항에 있어서, 상기 단계 (a)의 핵산을 이용하여 숙주 세포를 형질전환시키고, 이어서 상기 단계 (a)의 핵산을 발현시킴으로써 형질전환된 세포 내에서 재조합 폴리펩티드를 생성하는 단계를 더 포함하는 것인 방법.
- (a) 제64항의 폴리펩티드를 제공하는 단계;(b) 자일라나제 기질을 제공하는 단계; 및(c) 상기 단계 (b)의 기질과 상기 폴리펩티드를 접촉시키고, 반응 생성물 양의 증가 또는 기질 양의 감소를 검출하는 단계로서, 상기 반응 생성물 양의 증가 또는 기질 양의 감소는 자일라나제 활성을 보유하는 폴리펩티드를 검출하는 것인 단계를 포함하는, 자일라나제 활성을 보유하는 폴리펩티드의 동정 방법.
- (a) 제64항의 폴리펩티드를 제공하는 단계;(b) 테스트 기질을 제공하는 단계;(c) 상기 단계 (a)의 폴리펩티드와 상기 단계 (b)의 테스트 기질을 접촉시키고 반응 생성물 양의 증가 또는 기질 양의 감소를 검출하는 단계로서, 상기 반응생성물 양의 증가 또는 기질 양의 감소는 자일라나제 활성을 보유하는 폴리펩티드를 검출하는 것인 단계를 포함하는, 자일라나제 기질의 동정 방법.
- (a) 핵산의 폴리펩티드로의 번역이 가능한 조건 하에서 제1항 또는 제24항의 서열을 보유하는 핵산 또는 상기 서열을 포함하는 벡터를 발현시키는 단계;(b) 테스트 화합물을 제공하는 단계;(c) 상기 테스트 화합물과 상기 폴리펩티드를 접촉시키는 단계; 및(d) 상기 단계 (b)의 테스트 화합물이 상기 폴리펩티드에 특이적으로 결합하는 지 여부를 결정하는 단계를 포함하는, 테스트 화합물이 폴리펩티드에 특이적으로 결합하는 지 여부를 결정하는 방법.
- (a) 제60항의 폴리펩티드를 제공하는 단계;(b) 테스트 화합물을 제공하는 단계;(c) 상기 폴리펩티드와 상기 테스트 화합물을 접촉시키는 단계; 및(d) 상기 단계 (b)의 테스트 화합물이 상기 폴리펩티드에 특이적으로 결합하는 지 여부를 결정하는 단계를 포함하는, 테스트 화합물이 폴리펩티드에 특이적으로 결합하는 지 여부를 결정하는 방법.
- (a) 제64항의 폴리펩티드를 제공하는 단계;(b) 테스트 화합물을 제공하는 단계;(c) 상기 단계 (a)의 폴리펩티드와 상기 단계 (b)의 테스트 화합물을 접촉시키고 자일라나제 활성을 측정하는 단계로서, 테스트 화합물의 부재 하에서의 활성과 비교한 테스트 화합물 존재 하에서 측정된 자일라나제 활성의 변화가, 테스트 화합물이 자일라나제 활성을 조절하는 지 여부에 대한 결정을 제공하는 단계를 포함하는, 자일라나제 활성 조절제의 동정 방법.
- 제112항에 있어서, 상기 자일라나제 활성은 자일라나제 기질을 제공하고, 기질의 감소량 또는 반응 생성물의 증가량, 또는 기질의 증가량 또는 반응 생성물의 감소량을 검출함으로써 측정하는 것인 방법.
- 제113항에 있어서, 테스트 화합물 부재시 기질 또는 반응 생성물의 양과 비교한 테스트 화합물 존재시 기질의 감소량 또는 반응 생성물의 증가량은 자일라나제 활성의 활성제로서 테스트 화합물을 동정하는 것인 방법.
- 제113항에 있어서, 테스트 화합물 부재시 기질 또는 반응 생성물의 양과 비교한 테스트 화합물 존재시 기질의 증가량 또는 반응 생성물의 감소량은 자일라나제 활성의 활성제로서 테스트 화합물을 동정하는 것인 방법.
- 프로쎄서 및 데이타 저장 장치를 포함하는 컴퓨터 시스템으로서, 상기 데이타 저장 장치에는 폴리펩티드 서열 또는 핵산 서열이 저장되어 있고, 상기 폴리펩티드 서열은 제60항의 서열을 포함하고, 제1항 또는 제24항의 핵산에 의해 암호화된 폴리펩티드인 컴퓨터 시스템.
- 제115항에 있어서, 서열 비교 알고리즘, 및 저장된 하나 이상의 참조 서열을 보유하는 데이타 저장 장치를 더 포함하는 것인 컴퓨터 시스템.
- 제117항에 있어서, 상기 서열 비교 알고리즘은 다형태를 나타내는 컴퓨터 프로그램을 포함하는 것인 컴퓨터 시스템.
- 제117항에 있어서, 상기 서열내의 하나 이상의 특징을 확인하는 확인자를 더 포함하는 것인 컴퓨터 시스템.
- 저장된 폴리펩티드 서열 또는 핵산 서열을 보유하는 컴퓨터 판독가능한 매체로서, 상기 폴리펩티드 서열은 제60항의 폴리펩티드 또는 제1항 또는 제24항의 핵산에 의해 암호화된 폴리펩티드를 포함하는 것인 컴퓨터 판독가능한 매체.
- (a) 서열 내의 하나 이상의 특징을 확인하는 컴퓨터 프로그램을 이용하여 서열을 판독하는 단계로서, 상기 서열은 폴리펩티드 서열 또는 핵산 서열을 포함하고, 상기 폴리펩티드 서열은 제60항의 폴리펩티드 또는 제1항 또는 제24항의 핵산에 의해 암호화된 폴리펩티드를 포함하는 것인 단계; 및(b) 상기 컴퓨터 프로그램을 이용하여 상기 서열 내의 하나 이상의 특징을 확인하는 단계를 포함하는, 서열내의 특징을 확인하는 방법.
- (a) 서열을 비교하는 컴퓨터 프로그램을 이용하여 제1 서열 및 제2 서열을 판독하는 단계로서, 상기 제1 서열은 폴리펩티드 서열 또는 핵산 서열을 포함하고, 상기 폴리펩티드 서열은 제60항의 폴리펩티드 또는 제1항 또는 제24항의 핵산에 의해 암호화된 폴리펩티드를 포함하는 것인 단계; 및(b) 상기 컴퓨터 프로그램을 이용하여 상기 제1 서열 및 제2 서열 사이의 차이를 결정하는 단계를 포함하는, 제1 서열과 제2 서열의 비교 방법.
- 제122항에 있어서, 상기 제1 서열과 제2 서열 사이의 차이를 결정하는 단계는 다형태를 확인하는 단계를 더 포함하는 것인 방법.
- 제123항에 있어서, 서열내의 하나 이상의 특징을 확인하는 확인자를 더 포함하는 것인 방법.
- 제124항에 있어서, 컴퓨터 프로그램을 이용하여 상기 제1 서열을 판독하는 단계 및 상기 서열내의 하나 이상의 특징을 확인하는 단계를 포함하는 것인 방법.
- (a) 제31항 또는 제33항의 증폭 프라이머 서열 쌍을 제공하는 단계;(b) 환경 샘플로부터 핵산을 분리하거나 환경 샘플을 처리하여 샘플내의 핵산이 하이브리드화를 위해 상기 증폭 프라이머 쌍에 접근가능하도록 하는 단계;(c) 상기 단계 (b)의 핵산과 상기 단계 (a)의 증폭 프라이머 쌍을 조합하고, 환경 샘플로부터 핵산을 증폭함으로써 환경 샘플로부터 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산을 분리 또는 회수하는 단계를 포함하는, 환경 샘플로부터 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산의 분리 또는 회수 방법.
- 상기 증폭 프라이머 서열 쌍의 각각의 요소가 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호 123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호 323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379의 서열 또는 이의 하위서열의 약 10∼50개 이상의 연속 염기를 포함하는 올리고뉴클레오티드를 포함하는 것인 방법.
- (a) 제1항 또는 제24항의 서열 또는 이의 하위서열을 포함하는 폴리뉴클레오티드 프로브를 제공하는 단계;(b) 환경 샘플로부터 핵산을 분리하거나 환경 샘플을 처리하여 상기 샘플내의 핵산이 하이브리드화를 위해 상기 단계 (a)의 폴리뉴클레오티드 프로브에 접근가능하도록 하는 단계;(c) 상기 단계 (b)의 분리된 핵산 또는 처리된 환경 샘플과 상기 단계 (a)의폴리뉴클레오티드 프로브를 조합하는 단계; 및(d) 상기 단계 (a)의 폴리뉴클레오티드 프로브와 특이적으로 하이브리드화하는 핵산을 분리하여 환경 샘플로부터 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산을 분리 또는 회수하는 단계를 포함하는, 환경 샘플로부터 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산의 분리 또는 회수 방법.
- 제127항 또는 제128항에 있어서, 상기 환경 샘플은 물 샘플, 액체 샘플, 토양 샘플, 공기 샘플 또는 생물학적 샘플을 포함하는 것인 방법.
- 제129항에 있어서, 상기 생물학적 샘플은 박테리아 세포, 원생동물 세포, 곤충 세포, 효모 세포, 식물 세포, 진균 세포 또는 포유류 세포로부터 유래한 것인 방법.
- (a) 제1항 또는 제24항의 서열을 포함하는 주형 핵산을 제공하는 단계; 및(b) 상기 주형 서열내의 하나 이상의 뉴클레오티드를 변형, 결실 또는 첨가하거나, 또는 상기 변형, 결실 또는 첨가를 조합하여 주형 핵산의 변이체를 생성하는 단계를 포함하는, 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산의 변이체의 생성 방법.
- 제131항에 있어서, 상기 변이체 핵산을 발현시켜 변이체 자일라나제 폴리펩티드를 생성하는 단계를 더 포함하는 것인 방법.
- 제131항에 있어서, 상기 변형, 첨가 또는 결실은 에러-프론 PCR, 셔플링, 올리고뉴클레오티드-지정 돌연변이유발법, 어셈블리 PCR, 성별 PCR 돌연변이유발법, 생체내 돌연변이유발법, 카세트 돌연변이유발법, 반복 앙상블 돌연변이유발법, 지수 앙상블 돌연변이유발법, 부위 특이성 돌연변이유발법, 유전자 재어셈블리, 유전자 위치 포화 돌연변이유발법(GSSM(상표명)), 합성 연결 재어셈블리(SLR) 및 이의 조합을 포함하는 방법에 의해 도입하는 것인 방법.
- 제131항에 있어서, 상기 변형, 첨가 또는 결실은 재조합, 반복 서열 재조합, 포스포티오에이트-변형된 DNA 돌연변이유발법, 우리실-함유 주형 돌연변이유발법, 갭핑된 이중체 돌연변이유발법, 점 부정합 수복 돌연변이유발법, 수복-결여 숙주 균주 돌연변이유발법, 화학적 돌연변이유발법, 방사원성 돌연변이유발법, 결실 돌연변이유발법, 제한-선택 돌연변이유발법, 제한-정제 돌연변이유발법, 인공 유전자 합성, 앙상블 돌연변이유발법, 키메라 핵산 다량체 생성 및 이의 조합을 포함하는 방법에 의해 도입하는 것인 방법.
- 제131항에 있어서, 상기 방법은 주형 핵산에 의해 암호화된 폴리펩티드의 활성이나 안정성과는 변경된 또는 상이한 활성 또는 변경된 또는 상이한 안정성을 보유하는 자일라나제가 생성될 때까지 되풀이하여 반복하는 것인 방법.
- 제135항에 있어서, 상기 변이체 자일라나제 폴리펩티드는 내열성이고, 고온에서 노출후 일부 활성을 보유하는 것인 방법.
- 제135항에 있어서, 상기 변이체 자일라나제 폴리펩티드는 주형 핵산에 의해 암호화된 자일라나제와 비교시 증가된 글리코실화를 보유하는 것인 방법.
- 제135항에 있어서, 상기 변이체 자일라나제 폴리펩티드는 고온 하에서 자일라나제 활성을 보유하며, 상기 주형 핵산에 의해 암호화된 자일라나제는 고온 하에서 불활성인 것인 방법.
- 제131항에 있어서, 상기 방법은 주형 핵산의 코돈 사용 용법과는 변경된 코돈 사용 용법을 보유하는 자일라나제 암호 서열이 생성될 때까지 되풀이하여 반복하는 것인 방법.
- 제131항에 있어서, 상기 방법은 주형 핵산 보다 더 높거나 또는 더 낮은 수준의 메세지 발현 수준 또는 안정성을 보유하는 자일라나제 유전자가 생성될 때까지 되풀이하여 반복하는 것인 방법.
- (a) 제1항 내지 제24항의 서열을 포함하는 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산을 제공하는 단계; 및(b) 상기 단계 (a)의 핵산에서 바람직하지 않은 코돈 또는 덜 바람직한 코돈을 확인하고, 이를 대체된 코돈과 동일한 아미노산을 암호화하는 바람직한 코돈 또는 통상적으로 사용되는 코돈으로 대체함으로써 핵산을 숙주 세포 내에서 그의 발현을 증가시키도록 변형시키는 단계로서, 이때 바람직한 코돈은 숙주 세포의 유전자 내의 암호 서열에서 과도하게 나타나는 코돈이며, 바람직하지 않은 코돈 또는 덜 바람직한 코돈은 숙주 세포 내의 유전자 내의 암호 서열에서 과소하게 나타나는 코돈인 단계를 포함하는, 숙주 세포 내에서 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산의 발현을 증가시키기 위한 상기 핵산내 코돈의 변형 방법.
- (a) 제1항 또는 제24항의 서열을 포함하는 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산을 제공하는 단계; 및(b) 상기 단계 (a)의 핵산내의 코돈을 확인하고, 이를 대체된 코돈과 동일한 아미노산을 암호화하는 상이한 코돈으로 대체함으로써 자일라나제를 암호화하는 핵산내의 코돈을 변형시키는 단계를 포함하는, 자일라나제 폴리펩티드를 암호화하는 핵산내의 코돈 변형 방법.
- (a) 제1항 또는 제24항의 서열을 포함하는 자일라나제 폴리펩티드를 암호화하는 핵산을 제공하는 단계; 및(b) 상기 단계 (a)의 핵산에서 바람직하지 않은 코돈 또는 덜 바람직한 코돈을 확인하고, 이를 대체된 코돈과 동일한 아미노산을 암호화하는 바람직한 코돈 또는 통상적으로 사용되는 코돈으로 대체함으로써 핵산을 숙주 세포 내에서 그의 발현을 증가시키도록 변형시키는 단계로서, 이때 바람직한 코돈은 숙주 세포의 유전자 내의 암호 서열에서 과도하게 나타나는 코돈이며, 바람직하지 않은 코돈 또는 덜 바람직한 코돈은 숙주 세포 내의 유전자 내의 암호 서열에서 과소하게 나타나는 코돈인 단계를 포함하는, 숙주 세포 내에서 자일라나제 폴리펩티드를 암호화하는 핵산의 발현을 증가시키기 위한 상기 핵산내 코돈의 변형 방법.
- (a) 제1항 또는 제24항의 서열을 포함하는 자일라나제 폴리펩티드를 암호화하는 핵산을 제공하는 단계; 및(b) 상기 단계 (a)의 핵산에서 하나 이상의 바람직한 코돈을 확인하고, 이를 대체된 코돈과 동일한 아미노산을 암호화하는 바람직하지 않은 코돈 또는 덜 바람직한 코돈으로 대체함으로써 핵산을 숙주 세포 내에서 그의 발현을 증가시키도록 변형시키는 단계로서, 이때 바람직한 코돈은 숙주 세포의 유전자 내의 암호 서열에서 과도하게 나타나는 코돈이며, 바람직하지 않은 코돈 또는 덜 바람직한 코돈은숙주 세포 내의 유전자 내의 암호 서열에서 과소하게 나타나는 코돈인 단계를 포함하는, 숙주 세포 내에서 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 핵산의 발현을 감소시키기 위한 상기 핵산내 코돈의 변형 방법.
- 제144항에 있어서, 상기 숙주 세포는 박테리아 세포, 진균 세포, 곤충 세포, 효모 세포, 식물 세포 또는 포유류 세포인 방법.
- (a) 제1 활성 부위 또는 제1 기질 결합 부위를 암호화하는 제1 핵산을 제공하는 단계로서, 상기 제1 핵산 서열은 엄격한 조건 하에서 서열 번호 1, 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 11, 서열 번호 13, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 27, 서열 번호 29, 서열 번호 31, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 39, 서열 번호 41, 서열 번호 43, 서열 번호 45, 서열 번호 47, 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 서열 번호 65, 서열 번호 67, 서열 번호 69, 서열 번호 71, 서열 번호 73, 서열 번호 75, 서열 번호 77, 서열 번호 79, 서열 번호 81, 서열 번호 83, 서열 번호 85, 서열 번호 87, 서열 번호 89, 서열 번호 91, 서열 번호 93, 서열 번호 95, 서열 번호 97, 서열 번호 99, 서열 번호 101, 서열 번호 103, 서열 번호 105, 서열 번호 107, 서열 번호 109, 서열 번호 111, 서열 번호 113, 서열 번호 115, 서열 번호 117, 서열 번호 119, 서열 번호 121, 서열 번호123, 서열 번호 125, 서열 번호 127, 서열 번호 129, 서열 번호 131, 서열 번호 133, 서열 번호 135, 서열 번호 137, 서열 번호 139, 서열 번호 141, 서열 번호 143, 서열 번호 145, 서열 번호 147, 서열 번호 149, 서열 번호 151, 서열 번호 153, 서열 번호 155, 서열 번호 157, 서열 번호 159, 서열 번호 161, 서열 번호 163, 서열 번호 165, 서열 번호 167, 서열 번호 169, 서열 번호 171, 서열 번호 173, 서열 번호 175, 서열 번호 177, 서열 번호 179, 서열 번호 181, 서열 번호 183, 서열 번호 185, 서열 번호 187, 서열 번호 189, 서열 번호 191, 서열 번호 193, 서열 번호 195, 서열 번호 197, 서열 번호 199, 서열 번호 201, 서열 번호 203, 서열 번호 205, 서열 번호 207, 서열 번호 209, 서열 번호 211, 서열 번호 213, 서열 번호 215, 서열 번호 217, 서열 번호 219, 서열 번호 221, 서열 번호 223, 서열 번호 225, 서열 번호 227, 서열 번호 229, 서열 번호 231, 서열 번호 233, 서열 번호 235, 서열 번호 237, 서열 번호 239, 서열 번호 241, 서열 번호 243, 서열 번호 245, 서열 번호 247, 서열 번호 249, 서열 번호 251, 서열 번호 253, 서열 번호 255, 서열 번호 257, 서열 번호 259, 서열 번호 261, 서열 번호 263, 서열 번호 265, 서열 번호 267, 서열 번호 269, 서열 번호 271, 서열 번호 273, 서열 번호 275, 서열 번호 277, 서열 번호 279, 서열 번호 281, 서열 번호 283, 서열 번호 285, 서열 번호 287, 서열 번호 289, 서열 번호 291, 서열 번호 293, 서열 번호 295, 서열 번호 297, 서열 번호 299, 서열 번호 301, 서열 번호 303, 서열 번호 305, 서열 번호 307, 서열 번호 309, 서열 번호 311, 서열 번호 313, 서열 번호 315, 서열 번호 317, 서열 번호 319, 서열 번호 321, 서열 번호323, 서열 번호 325, 서열 번호 327, 서열 번호 329, 서열 번호 331, 서열 번호 333, 서열 번호 335, 서열 번호 337, 서열 번호 339, 서열 번호 341, 서열 번호 343, 서열 번호 345, 서열 번호 347, 서열 번호 349, 서열 번호 351, 서열 번호 353, 서열 번호 355, 서열 번호 357, 서열 번호 359, 서열 번호 361, 서열 번호 363, 서열 번호 365, 서열 번호 367, 서열 번호 369, 서열 번호 371, 서열 번호 373, 서열 번호 375, 서열 번호 377 또는 서열 번호 379의 서열 또는 이의 하위서열에 하이브리드화하는 서열을 포함하고, 상기 핵산 서열은 자일라나제 활성 부위 또는 자일라나제 기질 결합 부위를 암호화하는 것인 단계;(b) 제1 핵산 내의 다수의 표적화된 코돈에서 자연 발생하는 아미노산 변이체를 암호화하는 돌연변이원성 올리고뉴클레오티드 세트를 제공하는 단계; 및(c) 돌연변이유발된 각각의 아미노산 코돈에서 일정 범위의 아미노산 변이를 활성 부위 암호화하거나 또는 기질 결합 부위 암호화하는 변이체 핵산 세트를 생성하는 돌연변이원성 올리고뉴클레오티드 세트를 이용하여 다수의 변형된 자일라나제 활성 부위 또는 기질 결합 부위를 암호화하는 핵산 라이브러리를 생성하는 단계를 포함하는, 다수의 변형된 자일라나제 활성 부위 또는 기질 결합 부위를 암호화하는 핵산 라이브러리의 생성 방법으로서, 상기 변형된 활성 부위 또는 기질 결합 부위는 제1 활성 부위 또는 제1 기질 결합 부위를 암호화하는 서열을 포함하는 제1 핵산으로부터 유래하는 것인 방법.
- 제145항에 있어서, 최적화된 유도 진화 시스템, 유전자 부위-포화 돌연변이유발법(GSSM; 상표명) 또는 합성 연결 재어셈블리(SLR)를 포함하는 방법에 의해 상기 단계 (a)의 제1 핵산을 돌연변이유발시키는 단계를 포함하는 것인 방법.
- 제145항에 있어서, 에러-프론 PCR, 셔플링, 올리고뉴클레오티드-지정 돌연변이유발법, 어셈블리 PCR, 성별 PCR 돌연변이유발법, 생체내 돌연변이유발법, 카세트 돌연변이유발법, 반복 앙상블 돌연변이유발법, 지수 앙상블 돌연변이유발법, 부위 특이성 돌연변이유발법, 유전자 재어셈블리, 유전자 위치 포화 돌연변이유발법(GSSM(상표명)), 합성 연결 재어셈블리(SLR) 및 이의 조합을 포함하는 방법에 의해 상기 단계 (a)의 제1 핵산 또는 변이체를 돌연변이유발시키는 단계를 포함하는 것인 방법.
- 제145항에 있어서, 재조합, 반복 서열 재조합, 포스포티오에이트-변형된 DNA 돌연변이유발법, 우리실-함유 주형 돌연변이유발법, 갭핑된 이중체 돌연변이유발법, 점 부정합 수복 돌연변이유발법, 수복-결여 숙주 균주 돌연변이유발법, 화학적 돌연변이유발법, 방사원성 돌연변이유발법, 결실 돌연변이유발법, 제한-선택 돌연변이유발법, 제한-정제 돌연변이유발법, 인공 유전자 합성, 앙상블 돌연변이유발법, 키메라 핵산 다량체 생성 및 이의 조합을 포함하는 방법에 의해 상기 단계 (a)의 제1 핵산 또는 변이체를 돌연변이유발시키는 것인 방법.
- (a) 소분자를 합성 또는 변형시킬 수 있는 다수의 생합성 효소를 제공하는단계로서, 상기 효소중 하나는 제1항 또는 제24항의 서열을 포함하는 핵산에 의해 암호화된 자일라나제 효소를 포함하는 것인 단계;(b) 상기 단계 (a)의 효소중 하나 이상을 위한 기질을 제공하는 단계; 및(c) 일련의 생촉매 반응에 의해 소분자를 생성하기 위해 다수의 생촉매 반응을 용이하게 하는 조건 하에서 상기 효소와 상기 단계 (b)의 기질을 반응시키는 단계를 포함하는, 소분자의 제조 방법.
- (a) 제64항의 폴리펩티드 또는 제1항 또는 제24항의 핵산 서열을 포함하는 핵산에 의해 암호화된 폴리펩티드를 포함하는 자일라나제 효소를 제공하는 단계;(b) 소분자를 제공하는 단계; 및(c) 자일라나제 효소에 의해 촉진되는 효소 반응을 용이하게 하는 조건 하에서 상기 단계 (a)의 효소와 상기 단계 (b)의 소분자를 접촉시켜 자일라나제 효소 반응에 의해 소분자를 변형시키는 단계를 포함하는, 소분자의 변형 방법.
- 제151항에 있어서, 상기 단계 (a)의 효소를 위한 다수의 소분자 기질을 포함하여 자일라나제 효소에 의해 촉진된 하나 이상의 효소 반응에 의해 생성된 변형된 소분자 라이브러리를 생성하는 단계를 포함하는 것인 방법.
- 제151항에 있어서, 상기 효소에 의한 다수의 생촉매 반응을 용이하게 하는 조건 하에서 다수의 추가 효소를 포함하여 다수의 효소 반응에 의해 생성된 변형된 소분자 라이브러리를 형성하는 단계를 더 포함하는 것인 방법.
- 제153항에 있어서, 상기 라이브러리를 테스트하여 소정 활성을 나타내는 특정 변형된 소분자가 상기 라이브러리 내에 존재하는 지 여부를 결정하는 단계를 더 포함하는 것인 방법.
- 제154항에 있어서, 상기 라이브러리를 테스트하는 단계는 소정 활성을 보유하는 특정 변형된 소분자의 존재 또는 부재에 대해 변형된 소분자의 일부분을 테스트하고 소정 활성의 특정 변형된 소분자를 생성하는 하나 이상의 특이적인 생촉매 반응을 확인함으로써 상기 라이브러리내 다수의 변형된 소분자의 일부분을 생성하기 위해 사용된 생촉매 반응중 하나를 제외한 모두를 전체적으로 제거하는 단계를 더 포함하는 것인 방법.
- (a) 제64항의 폴리펩티드 또는 제1항 또는 제24항의 핵산에 의해 암호화된 폴리펩티드를 포함하는 자일라나제 효소를 제공하는 단계;(b) 상기 단계 (a)의 서열로부터 다수의 아미노산 잔기를 결실시켜 자일라나제 효소의 기능적 단편을 결정하는 단계를 포함하는, 자일라나제 효소의 기능적 단편의 결정 방법.
- 제156항에 있어서, 상기 자일라나제 활성은 자일라나제 기질을 제공하고 기질의 감소량 또는 반응 생성물의 증가량을 검출함으로써 측정하는 것인 방법.
- (a) 세포의 유전 조성물을 변형하여 변형된 세포를 제조하는 단계로서, 상기 유전 조성물은 제1항 또는 제24항의 서열을 포함하는 핵산을 세포에 첨가함으로써 변경되는 것인 단계;(b) 상기 변형된 세포를 배양하여 다수의 변형된 세포를 생성하는 단계;(c) 상기 단계 (b) 세포 배양을 실시간으로 모니터링함으로써 상기 세포의 하나 이상의 대사 매개변수를 측정하는 단계; 및(d) 상기 단계 (c)의 데이타를 분석하여 측정된 매개변수가 유사한 조건 하에서 변형되지 않은 세포의 필적하는 측정치와 상이한지 여부를 결정함으로써, 실시간 대사 플럭스 분석을 이용하여 세포 내에서 조작된 표현형을 확인하는 단계를 포함하는, 실시간 대사 플럭스 분석을 이용하는 신규 또는 변형된 표현형의 전체 세포 조작 방법.
- 제158항에 있어서, 상기 세포의 유전 조성물은 세포내 서열의 결실 또는 서열의 변형 또는 유전자 발현의 녹아웃을 포함하는 방법에 의해 변경되는 것인 방법.
- 제158항에 있어서, 새롭게 조작된 표현형을 포함하는 세포를 선택하는 단계를 더 포함하는 것인 방법.
- 제160항에 있어서, 선택된 세포를 배양함으로써 새롭게 조작된 표현형을 포함하는 신규한 세포 균주를 생성하는 단계를 더 포함하는 것인 방법.
- 서열 번호 2, 서열 번호 4, 서열 번호 6, 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18, 서열 번호 20, 서열 번호 22, 서열 번호 24, 서열 번호 26, 서열 번호 28, 서열 번호 30, 서열 번호 32, 서열 번호 34, 서열 번호 36, 서열 번호 38, 서열 번호 40, 서열 번호 42, 서열 번호 44, 서열 번호 46, 서열 번호 48, 서열 번호 50, 서열 번호 52, 서열 번호 54, 서열 번호 56, 서열 번호 58, 서열 번호 60, 서열 번호 62, 서열 번호 64, 서열 번호 66, 서열 번호 68, 서열 번호 70, 서열 번호 72, 서열 번호 74, 서열 번호 76, 서열 번호 78, 서열 번호 80, 서열 번호 82, 서열 번호 84, 서열 번호 86, 서열 번호 88, 서열 번호 90, 서열 번호 92, 서열 번호 94, 서열 번호 96, 서열 번호 98, 서열 번호 100, 서열 번호 102, 서열 번호 104, 서열 번호 106, 서열 번호 108, 서열 번호 110, 서열 번호 112, 서열 번호 114, 서열 번호 116, 서열 번호 118, 서열 번호 120, 서열 번호 122, 서열 번호 124, 서열 번호 126, 서열 번호 128, 서열 번호 130, 서열 번호 132, 서열 번호 134, 서열 번호 136, 서열 번호 138, 서열 번호 140, 서열 번호 142, 서열 번호 144, 서열 번호 146, 서열 번호 148, 서열 번호150, 서열 번호 152, 서열 번호 154, 서열 번호 156, 서열 번호 158, 서열 번호 160, 서열 번호 162, 서열 번호 164, 서열 번호 166, 서열 번호 168, 서열 번호 170, 서열 번호 172, 서열 번호 174, 서열 번호 176, 서열 번호 178, 서열 번호 180, 서열 번호 182, 서열 번호 184, 서열 번호 186, 서열 번호 188, 서열 번호 190, 서열 번호 192, 서열 번호 194, 서열 번호 196, 서열 번호 198, 서열 번호 200, 서열 번호 202, 서열 번호 204, 서열 번호 206, 서열 번호 208, 서열 번호 210, 서열 번호 212, 서열 번호 214, 서열 번호 216, 서열 번호 218, 서열 번호 220, 서열 번호 222, 서열 번호 224, 서열 번호 226, 서열 번호 228, 서열 번호 230, 서열 번호 232, 서열 번호 234, 서열 번호 236, 서열 번호 238, 서열 번호 240, 서열 번호 242, 서열 번호 244, 서열 번호 246, 서열 번호 248, 서열 번호 250, 서열 번호 252, 서열 번호 254, 서열 번호 256, 서열 번호 258, 서열 번호 260, 서열 번호 262, 서열 번호 264, 서열 번호 266, 서열 번호 268, 서열 번호 270, 서열 번호 272, 서열 번호 274, 서열 번호 276, 서열 번호 278, 서열 번호 280, 서열 번호 282, 서열 번호 284, 서열 번호 286, 서열 번호 288, 서열 번호 290, 서열 번호 292, 서열 번호 294, 서열 번호 296, 서열 번호 298, 서열 번호 300, 서열 번호 302, 서열 번호 304, 서열 번호 306, 서열 번호 308, 서열 번호 310, 서열 번호 312, 서열 번호 314, 서열 번호 316, 서열 번호 318, 서열 번호 320, 서열 번호 322, 서열 번호 324, 서열 번호 326, 서열 번호 328, 서열 번호 330, 서열 번호 332, 서열 번호 334, 서열 번호 336, 서열 번호 338, 서열 번호 340, 서열 번호 342, 서열 번호 344, 서열 번호 346, 서열 번호 348, 서열 번호350, 서열 번호 352, 서열 번호 354, 서열 번호 356, 서열 번호 358, 서열 번호 360, 서열 번호 362, 서열 번호 364, 서열 번호 366, 서열 번호 368, 서열 번호 370, 서열 번호 372, 서열 번호 374, 서열 번호 376, 서열 번호 378 또는 서열 번호 380의 잔기 1∼14, 1∼15, 1∼16, 1∼17, 1∼18, 1∼19, 1∼20, 1∼21, 1∼22, 1∼23, 1∼24, 1∼25, 1∼26, 1∼27, 1∼28, 1∼29, 1∼30, 1∼31, 1∼32, 1∼33, 1∼34, 1∼35, 1∼36, 1∼37, 1∼38, 1∼40, 1∼41, 1∼42, 1∼43 또는 1∼44의 서열로 구성되거나, 또는 표 4의 서열로 구성된 분리된 신호 서열 또는 재조합 신호 서열.
- 적어도 제162항의 서열을 보유하는 신호 펩티드(SP)를 포함하는 제1 도메인, 및 적어도 이종 폴리펩티드 또는 펩티드를 포함하는 제2 도메인을 포함하는 키메라 폴리펩티드로서, 상기 이종 폴리펩티드 또는 펩티드는 신호 펩티드(SP)와 자연 결합하지 않는 것인 키메라 폴리펩티드.
- 제163항에 있어서, 상기 이종 폴리펩티드 또는 펩티드는 자일라나제가 아닌 것인 키메라 폴리펩티드.
- 제163항에 있어서, 상기 이종 폴리펩티드 또는 펩티드는 상기 신호 펩티드(SP) 또는 자일라나제 촉매 도메인(CD)의 아미노 단부, 카르복시 단부 또는 이들 양 단부인 키메라 폴리펩티드.
- 키메라 폴리펩티드를 암호화하는 분리된 핵산 또는 재조합 핵산으로서, 상기 키메라 폴리펩티드는 적어도 제162항의 서열을 보유하는 신호 펩티드(SP)를 포함하는 제1 도메인 및 적어도 이종 폴리펩티드 또는 펩티드를 포함하는 제2 도메인을 포함하고, 상기 이종 폴리펩티드 또는 펩티드는 상기 신호 펩티드(SP)와 자연적으로 결합되지 않는 것인 분리된 핵산 또는 재조합 핵산.
- 자일라나제 폴리펩티드의 내열성 또는 열안정성의 증가 방법으로서, 상기 방법은 자일라나제를 글리코실화시켜 자일라나제의 내열성 또는 열안정성을 증가시키는 단계를 포함하고, 이때 상기 폴리펩티드는 제60항의 폴리펩티드 또는 제1항 또는 제24항의 핵산에 의해 암호화된 폴리펩티드의 30개 이상의 연속 아미노산을 포함하는 것인 방법.
- 제1항 또는 제24항의 핵산 서열을 포함하는 벡터를 발현시키는 단계를 포함하는, 세포 내에서 재조합 자일라나제를 과다발현시키는 방법으로서, 상기 과다발현은 고활성 프로모터, 2시스트론성 벡터를 이용하거나 또는 상기 벡터의 유전자 증폭에 의해 수행하는 것인 방법.
- (a) 이종 핵산 서열을 세포 내로 도입시켜 형질전환된 식물 세포를 형성하는 단계로서, 상기 이종 핵산 서열은 제1항 또는 제24항의 서열을 포함하는 것인 단계; 및(b) 상기 형질전환된 세포로부터 트랜스게닉 식물을 생성하는 단계를 포함하는, 트랜스게닉 식물의 제조 방법.
- 제169항에 있어서, 상기 단계 (a)는 식물 세포 원형질체의 전기적천공법 또는 미세주입법에 의해 이종 핵산 서열을 도입하는 단계를 더 포함하는 것인 방법.
- 제169항에 있어서, 상기 단계 (a)는 DNA 입자 투하 또는 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) 숙주를 이용하여 식물 조직에 직접적으로 이종 핵산 서열을 도입하는 단계를 포함하는 것인 방법.
- (a) 프로모터에 작동가능하게 연결된 이종 핵산 서열로 식물 세포를 형질전환하는 단계로서, 상기 이종 핵산 서열은 제1항 또는 제24항의 서열을 포함하는 것인 단계;(b) 상기 이종 핵산 서열이 식물 세포 내에서 발현하는 조건 하에서 식물을 성장시키는 단계를 포함하는, 식물 세포 내에서 이종 핵산 서열의 발현 방법.
- (a) 제64항의 자일라나제 활성을 보유하는 폴리펩티드 또는 제1항 또는 제24항의 핵산에 의해 암호화된 폴리펩티드를 제공하는 단계;(b) 자일란을 포함하는 조성물을 제공하는 단계; 및(c) 자일라나제가 자일란을 함유하는 조성물을 가수분해, 분해 또는 붕괴시키는 조건 하에서 상기 단계 (a)의 폴리펩티드와 상기 단계 (b)의 조성물을 접촉시키는 단계를 포함하는, 자일란을 함유하는 조성물의 가수분해, 분해 또는 붕괴 방법.
- 제173항에 있어서, 상기 조성물은 식물 세포, 박테리아 세포, 효모 세포, 곤충 세포 또는 동물 세포를 포함하는 것인 방법.
- 제64항의 폴리펩티드를 포함하는 반죽 또는 빵류 제품.
- 반죽을 컨디셔닝하기에 충분한 조건 하에서 제64항의 하나 이상의 폴리펩티드와 반죽 또는 빵류 제품을 접촉시키는 단계를 포함하는, 반죽 컨디셔닝 방법.
- 제64항의 폴리펩티드를 포함하는 음료.
- 음료의 점도를 감소시키기에 충분한 조건 하에서 음료 또는 음료 전구체에 제64항의 하나 이상의 폴리펩티드를 투여하는 단계를 포함하는, 음료 제조 방법.
- 제178항에 있어서, 상기 음료 또는 음료 전구체는 맥아즙 또는 맥주인 방법.
- 제64항의 폴리펩티드를 포함하는, 식품, 사료 또는 영양보조식품.
- 제64항의 폴리펩티드의 30개 이상의 연속 아미노산을 포함하는 자일라나제 효소를 함유하는 영양보조식품을 제조하는 단계; 및동물에게 상기 영양보조식품을 투여하여 동물에 의해 소화된 사료 또는 식품내에 함유된 자일란의 이용을 증가시키는 단계를 포함하는, 동물 사료내 영양보조식품으로서 자일라나제의 이용 방법.
- 제181항에 있어서, 상기 동물은 인간인 방법.
- 제181항에 있어서, 상기 동물은 인간인 방법.
- 제181항에 있어서, 상기 동물은 반추동물 또는 단위동물인 방법
- 제181항에 있어서, 상기 자일라나제 효소는 박테리아, 효모, 식물, 곤충, 진균 및 동물로 구성되는 군으로부터 선택되는 유기체 내에서 자일라나제를 암호화하는 폴리뉴클레오티드의 발현에 의해 제조하는 것인 방법.
- 제185항에 있어서, 상기 유기체는 에스. 폼브(S. pombe), 에스. 세레비재(S.cerevisiae), 피치아 파스토리스(Pichia pastoris), 슈도모나스종(Pseudomonassp.) , 이. 콜라이(E. coli), 스트렙토마이세스종(Streptomycessp.), 바실러스종(Bacillussp.) 및 락토바실러스종(Lactobacillussp.)으로 구성되는 군으로부터 선택하는 것인 방법.
- 열안정성 재조합 자일라나제 효소를 포함하는 식용 효소 전달 매트릭스.
- 제187항에 있어서, 제64항의 폴리펩티드를 포함하는 식용 효소 전달 매트릭스.
- 과립성 식용 담체와 열가소성 재조합 자일라나제 효소를 포함하는 펠릿 형태의 식용 효소 전달 매트릭스를 제조하는 단계로서, 상기 펠릿은 그 내부에 함유된 자일라나제 효소를 수성 매체 내에 용이하게 분산시키는 것인 단계; 및상기 식용 효소 전달 매트릭스를 동물에게 투여하는 단계를 포함하는, 동물에게 자일라나제 보조식품을 전달하는 방법.
- 제189항에 있어서, 상기 재조합 자일라나제 효소는 제64항의 폴리펩티드를 포함하는 것인 방법.
- 제189항에 있어서, 상기 과립성 식용 담체는 곡물 배아(grain germ), 오일을제거한 곡물 배아, 건초, 알팔파, 티모시, 콩껍질, 해바라기씨 밀 및 밀 미드(wheat midd)로 구성되는 군으로부터 선택한 담체를 포함하는 것인 방법.
- 제189항에 있어서, 상기 식용 담체는 오일을 제거한 곡물 배아를 포함하는 것인 방법
- 제189항에 있어서, 상기 자일라나제 효소는 펠릿화 조건에서 열안정성을 제공하기 위해 글리코실화하는 것인 방법.
- 제189항에 있어서, 상기 전달 매트릭스는 곡물 배아 및 자일라나제를 포함하는 혼합물의 펠릿화에 의해 형성하는 것인 방법.
- 제189항에 있어서, 상기 펠릿화 조건은 스팀 적용을 포함하는 것인 방법.
- 제189항에 있어서, 상기 펠릿화 조건은 약 80℃ 이상의 온도를 약 5분 동안 적용하는 과정을 포함하고, 상기 효소는 효소 1 mg 당 350 유닛 이상 내지 약 900 유닛의 특이 활성을 보유하는 것인 방법.
- 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 서열 및 신호 서열을 포함하는 분리된 핵산 또는 재조합 핵산으로서, 상기 핵산은 제1항의 서열을 포함하는 것인 분리된 핵산 또는 재조합 핵산.
- 제197항에 있어서, 상기 신호 서열은 다른 자일라나제 또는 비자일라나제 효소로부터 유래한 것인 분리된 핵산 또는 재조합 핵산.
- 자일라나제 활성을 보유하는 폴리펩티드를 암호화하는 서열을 포함하는 분리된 핵산 또는 재조합 핵산으로서, 상기 서열은 신호 서열 및 제1항의 서열을 포함하는 핵산을 함유하지 않는 것인 분리된 핵산 분자 또는 재조합 핵산 분자.
- 하기 돌연변이중 하나 이상을 함유하는 서열 번호 189의 서열을 포함하는 분리된 핵산 또는 재조합 핵산: 위치 22∼24의 뉴클레오티드는 TTC, 위치 31∼33의 뉴클레오티드는 CAC, 위치 34∼36의 뉴클레오티드는 TTG, 위치 49∼51의 뉴클레오티드는 ATA, 위치 31∼33의 뉴클레오티드는 CAT, 위치 67∼69의 뉴클레오티드는 ACG, 위치 178∼180의 뉴클레오티드는 CAC, 위치 190∼192의 뉴클레오티드는 TGT, 위치 190∼192의 뉴클레오티드는 GTA, 위치 190∼192의 뉴클레오티드는 GTT, 위치 193∼195의 뉴클레오티드는 GTG, 위치 202∼204의 뉴클레오티드는 GCT, 위치 235∼237의 뉴클레오티드는 CCA, 또는 위치 235∼237의 뉴클레오티드는 CCC.
- 제200항의 서열을 포함하는 핵산 서열의 제조 방법으로서, 서열 번호 189중의 돌연변이는 유전자 부위 포화 돌연변이유발법(GSSM; 상표명)에 의해 얻는 것인방법.
- 하기 돌연변이중 하나 이상을 함유하는 서열 번호 190을 포함하는 아미노산을 포함하는 분리된 폴리펩티드 또는 재조합 폴리펩티드: 아미노산 위치 8의 아스파르트산은 페닐알라닌, 아미노산 위치 11의 글루타민은 히스티딘, 아미노산 위치 12의 아스파라긴은 루신, 아미노산 위치 17의 글리신은 이소루신, 아미노산 위치 23의 트레오닌은 야생형 코돈 이외의 코돈에 의해 암호화된 트레오닌, 아미노산 위치 60의 글리신은 히스티딘, 아미노산 위치 64의 프롤린은 시스테인, 아미노산 위치 64의 프롤린은 발린, 아미노산 위치 65의 세린은 발린, 아미노산 위치 68의 글리신은 이소루신, 아미노산 위치 68의 글리신은 알라닌, 또는 아미노산 위치 79의 발린은 프롤린.
- 목재 또는 목제품과 제64항의 폴리펩티드를 접촉시키는 단계를 포함하는, 목재 또는 목제품중 리그닌 감소 방법.
- 제64항의 폴리펩티드를 포함하는 세정 조성물.
- 제64항의 폴리펩티드를 포함하는 약학 조성물.
- 제64항의 폴리펩티드를 투여하는 단계를 포함하는, 자일란을 포함하는 미생물을 동물로부터 제거하거나 동물을 보호하는 방법.
- 제206항에 있어서, 상기 미생물은 박테리아인 방법.
- 제205항에 있어서, 상기 박테리아는 살모넬라인 방법.
- 하기 서열 변이중 하나 이상 또는 모두를 포함하는 서열 번호 189의 서열을 포함하는 분리된 핵산 또는 재조합 핵산: 위치 22∼24의 뉴클레오티드는 TTC, 위치 22∼24의 뉴클레오티드는 TTT, 위치 31∼33의 뉴클레오티드는 CAC, 위치 31∼33의 뉴클레오티드는 CAT, 위치 34∼36의 뉴클레오티드는 TTG, 위치 34∼36의 뉴클레오티드는 TTA, 위치 34∼36의 뉴클레오티드는 CTC, 위치 34∼36의 뉴클레오티드는 CTT, 위치 34∼36의 뉴클레오티드는 CTA, 위치 34∼36의 뉴클레오티드는 CTG, 위치 49∼51의 뉴클레오티드는 ATA, 위치 49∼51의 뉴클레오티드는 ATT, 위치 49∼51의 뉴클레오티드는 ATC, 위치 178∼180의 뉴클레오티드는 CAC, 위치 178∼180의 뉴클레오티드는 CAT, 위치 190∼192의 뉴클레오티드는 TGT, 위치 190∼192의 뉴클레오티드는 TGC, 위치 190∼192의 뉴클레오티드는 GTA, 위치 190∼192의 뉴클레오티드는 GTT, 위치 190∼192의 뉴클레오티드는 GTC, 위치 190∼192의 뉴클레오티드는 GTG, 위치 193∼195의 뉴클레오티드는 GTG, 위치 193∼195의 뉴클레오티드는 GTC, 위치 193∼195의 뉴클레오티드는 GTA, 위치 193∼195의 뉴클레오티드는 GTT, 위치 202∼204의 뉴클레오티드는 ATA, 위치 202∼204의 뉴클레오티드는 ATT, 위치 202∼204의 뉴클레오티드는 ATC, 위치 202∼204의 뉴클레오티드는 GCT, 위치 202∼204의 뉴클레오티드는 GCG, 위치 202∼204의 뉴클레오티드는 GCC, 위치 202∼204의 뉴클레오티드는 GCA, 위치 235∼237의 뉴클레오티드는 CCA, 위치 235∼237의 뉴클레오티드는 CCC, 또는 위치 235∼237의 뉴클레오티드는 CCG.
- 하기 서열 변이중 하나 이상 또는 모두를 포함하는 서열 번호 190의 서열을 포함하는 아미노산 서열을 포함하는 분리된 폴리펩티드 또는 재조합 폴리펩티드: 아미노산 위치 8의 아스파르트산은 페닐알라닌, 아미노산 위치 11의 글루타민은 히스티딘, 아미노산 위치 12의 아스파라긴은 루신, 아미노산 위치 17의 글리신은 이소루신, 아미노산 위치 23의 트레오닌은 야생형 코돈 이외의 코돈에 의해 암호화된 트레오닌, 아미노산 위치 60의 글리신은 히스티딘, 아미노산 위치 64의 프롤린은 시스테인, 아미노산 위치 64의 프롤린은 발린, 아미노산 위치 65의 세린은 발린, 아미노산 위치 68의 글리신은 이소루신, 아미노산 위치 68의 글리신은 알라닌, 또는 아미노산 위치 79의 세린은 프롤린임.
- 표 1 또는 표 2에 기재된 서열 변이중 하나 이상 또는 모두를 포함하는 서열 번호 189의 서열을 포함하는 분리된 핵산 또는 재조합 핵산.
- 제211항의 핵산에 의해 암호화된 분리된 폴리펩티드 또는 재조합 폴리펩티드.
- 하기 서열 변이중 하나 이상 또는 모두를 포함하는 서열 번호 379의 서열을 포함하는 분리된 핵산 또는 재조합 핵산: 위치 22∼24의 뉴클레오티드는 TTC, 위치 31∼33의 뉴클레오티드는 CAC, 위치 49∼51의 뉴클레오티드는 ATA, 위치 178∼180의 뉴클레오티드는 CAC, 위치 193∼195의 뉴클레오티드는 GTG, 위치 202∼204의 뉴클레오티드는 GCT임.
- D8F, Q11H, G17I, G60H, S65V 및/또는 G68A 서열 변이중 하나 이상 또는 모두를 포함하는 서열 번호 380의 서열을 포함하는 분리된 폴리펩티드 또는 재조합 폴리펩티드.
- 제210항 또는 제214항에 있어서, 상기 폴리펩티드는 열안정성 자일라나제 활성을 보유하는 것인 분리된 폴리펩티드 또는 재조합 폴리펩티드.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US38929902P | 2002-06-14 | 2002-06-14 | |
US60/389,299 | 2002-06-14 | ||
PCT/US2003/019153 WO2003106654A2 (en) | 2002-06-14 | 2003-06-16 | Xylanases, nucleic adics encoding them and methods for making and using them |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087009502A Division KR20080045764A (ko) | 2002-06-14 | 2003-06-16 | 자일라나제, 이를 암호화하는 핵산, 및 이의 제조 및 사용방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20050010053A true KR20050010053A (ko) | 2005-01-26 |
Family
ID=29736623
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2004-7020345A KR20050010053A (ko) | 2002-06-14 | 2003-06-16 | 자일라나제, 이를 암호화하는 핵산, 및 이의 제조 및 사용방법 |
KR1020087009502A KR20080045764A (ko) | 2002-06-14 | 2003-06-16 | 자일라나제, 이를 암호화하는 핵산, 및 이의 제조 및 사용방법 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087009502A KR20080045764A (ko) | 2002-06-14 | 2003-06-16 | 자일라나제, 이를 암호화하는 핵산, 및 이의 제조 및 사용방법 |
Country Status (14)
Country | Link |
---|---|
US (4) | US7547534B2 (ko) |
EP (4) | EP2298904B1 (ko) |
KR (2) | KR20050010053A (ko) |
CN (2) | CN1675365A (ko) |
AU (1) | AU2003251549B2 (ko) |
BR (2) | BR0312121A (ko) |
CA (1) | CA2488916C (ko) |
DK (2) | DK2298904T3 (ko) |
EA (1) | EA200500019A1 (ko) |
ES (1) | ES2394708T3 (ko) |
MX (1) | MXPA04012614A (ko) |
NZ (1) | NZ537597A (ko) |
WO (1) | WO2003106654A2 (ko) |
ZA (2) | ZA200500171B (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9816078B2 (en) | 2009-11-19 | 2017-11-14 | Solis Biodyne Oü | Compositions for increasing polypeptide stability and activity, and related methods |
Families Citing this family (94)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050010053A (ko) | 2002-06-14 | 2005-01-26 | 다이버사 코포레이션 | 자일라나제, 이를 암호화하는 핵산, 및 이의 제조 및 사용방법 |
DK1618183T3 (en) | 2003-04-29 | 2015-02-23 | Danisco Us Inc | New Bacillus cellulase 029cel |
CA2548723A1 (en) | 2003-12-19 | 2005-06-19 | Syngenta Participations Ag | Microbially expressed xylanases and their use as feed additives and other uses |
EP1725115A1 (en) * | 2004-02-11 | 2006-11-29 | Novozymes A/S | Preparation of dough-based product with xylanase |
WO2005079585A1 (en) * | 2004-02-20 | 2005-09-01 | Novozymes A/S | Preparation of dough-based product |
ES2377408T3 (es) | 2004-03-25 | 2012-03-27 | Iogen Bio-Products Corporation | Xilanasas modificadas que exhiben expresión mejorada |
US7316998B2 (en) | 2004-05-27 | 2008-01-08 | Acceleron Pharma Inc. | Cerberus/Coco derivatives and uses thereof |
EP1614747A1 (en) * | 2004-07-06 | 2006-01-11 | Gesellschaft für Biotechnologische Forschung mbH et al | New esterases from rumen |
US7024796B2 (en) * | 2004-07-19 | 2006-04-11 | Earthrenew, Inc. | Process and apparatus for manufacture of fertilizer products from manure and sewage |
US20070084077A1 (en) * | 2004-07-19 | 2007-04-19 | Gorbell Brian N | Control system for gas turbine in material treatment unit |
US7024800B2 (en) * | 2004-07-19 | 2006-04-11 | Earthrenew, Inc. | Process and system for drying and heat treating materials |
US7685737B2 (en) | 2004-07-19 | 2010-03-30 | Earthrenew, Inc. | Process and system for drying and heat treating materials |
JP4836701B2 (ja) * | 2005-07-26 | 2011-12-14 | 花王株式会社 | アルカリキシラナーゼ |
US20070163316A1 (en) * | 2006-01-18 | 2007-07-19 | Earthrenew Organics Ltd. | High organic matter products and related systems for restoring organic matter and nutrients in soil |
US7610692B2 (en) * | 2006-01-18 | 2009-11-03 | Earthrenew, Inc. | Systems for prevention of HAP emissions and for efficient drying/dehydration processes |
CA2946924A1 (en) * | 2006-02-14 | 2007-08-23 | Bp Corporation North America Inc. | Xylanases, nucleic acids encoding them and methods for making and using them |
WO2007115391A1 (en) | 2006-04-12 | 2007-10-18 | National Research Council Of Cananda | Modification of xylanases to increase thermophilicity, thermostability and alkalophilicity |
US8877478B2 (en) * | 2006-09-21 | 2014-11-04 | Verenium Corporation | Phytases, nucleic acids encoding them and methods for making and using them |
CN101522045A (zh) | 2006-09-29 | 2009-09-02 | 诺维信公司 | 用于动物饲料的木聚糖酶 |
AU2008307371B2 (en) * | 2007-10-03 | 2015-05-28 | Bp Corporation North America Inc. | Xylanases, nucleic acids encoding them and methods for making and using them |
EP2238243B1 (en) | 2007-11-30 | 2019-01-09 | Novozymes A/S | Polypeptides having arabinofuranosidase activity and polynucleotides encoding same |
CN101932704A (zh) | 2007-12-05 | 2010-12-29 | 诺维信公司 | 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸 |
WO2009146464A2 (en) * | 2008-05-30 | 2009-12-03 | Edenspace Systems Corporation | Methods and compositions for modifying levels of lignin and increasing the digestibility of cellulose by the recombinant overexpression of lignocellulolytic enzymes |
US8847031B2 (en) * | 2008-07-09 | 2014-09-30 | The Board Of Regents For Oklahoma State University | Thermocellulases for lignocellulosic degradation |
TWI466680B (zh) | 2008-08-01 | 2015-01-01 | Oncotherapy Science Inc | Melk抗原決定位胜肽及含此胜肽的疫苗 |
KR101018790B1 (ko) * | 2008-08-14 | 2011-03-03 | 한국화학연구원 | 자일라나아제를 생산하는 신규한 페니바실러스 sp. HPL-001 균주, 이로부터 분리한 신규한 자일라나아제 효소 및 이의 생산 방법 |
EP2382311A4 (en) * | 2008-12-23 | 2012-08-15 | POLYPEPTIDES WITH XYLANASE ACTIVITY | |
MX347545B (es) | 2008-12-23 | 2017-05-02 | Dupont Nutrition Biosci Aps | Polipeptidos con actividad xilanasa. |
US20120040410A1 (en) * | 2009-01-19 | 2012-02-16 | The Board Of Regents For Oklahoma State University | Thermohemicellulases for lignocellulosic degradation |
US9012186B2 (en) | 2009-04-27 | 2015-04-21 | The Board Of Trustees Of The University Of Illinois | Hemicellulose-degrading enzymes |
WO2012015452A1 (en) * | 2009-11-11 | 2012-02-02 | International Paper Company | Effect of low dose xylanase on pulp in prebleach treatment process |
CN106929494B (zh) * | 2009-12-09 | 2021-05-14 | 诺维信公司 | 产生gh8木聚糖酶变体的方法 |
ES2523242T3 (es) * | 2009-12-21 | 2014-11-24 | Süd-Chemie Ip Gmbh & Co. Kg | Xilanasa termoestable para la hidrólisis selectiva de polisacáridos que contienen pentosa |
TWI485245B (zh) | 2010-01-25 | 2015-05-21 | Oncotherapy Science Inc | 經修飾之melk胜肽及含此胜肽之疫苗 |
EP2534295B1 (en) | 2010-02-12 | 2018-06-13 | Kemira Oyj | Method for removing ink from paper |
WO2011157231A1 (zh) * | 2010-06-18 | 2011-12-22 | 中国科学院上海生命科学研究院 | 新型内切木聚糖酶,其编码基因和应用 |
US8563284B2 (en) * | 2010-10-08 | 2013-10-22 | Jenn Tu | Thermostable Paenibacillus xylanases |
CN107674882B (zh) * | 2011-01-28 | 2021-06-25 | 加利福尼亚大学董事会 | 植物中经空间修饰的基因表达 |
WO2012142591A2 (en) * | 2011-04-14 | 2012-10-18 | The Regents Of The University Of Colorado | Compositions, methods and uses for multiplex protein sequence activity relationship mapping |
WO2013024909A1 (ko) * | 2011-08-12 | 2013-02-21 | 한국화학연구원 | 내열성,광범위 pH,고활성 자일라나아제를 생산하는 신규 페니바실러스 sp.HPL-3 균주,이로부터 분리한 신규 자일라나아제 효소 및 이의 형질전환체를 이용한 이의 대량 생산 방법 |
CN103998680B (zh) * | 2011-10-27 | 2017-04-26 | 巴克曼实验室国际公司 | 用于酶降解处理造纸纤维的方法和组合物及由其制成的纸制品 |
EP2776561A4 (en) * | 2011-11-11 | 2015-09-02 | Novozymes Inc | POLYPEPTIDES WITH XYLANASE ACTIVITY AND POLYNUCLEOTIDES THAT CODE |
CN104039959A (zh) * | 2011-11-11 | 2014-09-10 | 诺维信股份有限公司 | 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸 |
CN102735642B (zh) * | 2012-07-12 | 2014-07-02 | 河北大学 | 一种快速无损鉴别初榨橄榄油和油橄榄果渣油的方法 |
US8759041B1 (en) * | 2013-02-12 | 2014-06-24 | Novozymes Inc. | Polypeptides having xylanase activity and polynucleotides encoding same |
GB201308853D0 (en) * | 2013-03-12 | 2013-07-03 | Verenium Corp | Genes encoding xylanase |
US9573980B2 (en) | 2013-03-15 | 2017-02-21 | Spogen Biotech Inc. | Fusion proteins and methods for stimulating plant growth, protecting plants from pathogens, and immobilizing Bacillus spores on plant roots |
US9850512B2 (en) | 2013-03-15 | 2017-12-26 | The Research Foundation For The State University Of New York | Hydrolysis of cellulosic fines in primary clarified sludge of paper mills and the addition of a surfactant to increase the yield |
US11981942B2 (en) | 2013-07-23 | 2024-05-14 | International N&H Denmark Aps | Xylanases for solubilizing arabinoxylan-containing material |
BR112016017349A2 (pt) * | 2014-01-31 | 2017-10-17 | Danisco Us Inc | métodos para melhorar os subprodutos de processos de fermentação usando xilanase |
GB201401699D0 (en) * | 2014-01-31 | 2014-03-19 | Dupont Nutrition Biosci Aps | Protein |
CA2938456C (en) | 2014-02-11 | 2022-06-21 | The Regents Of The University Of Colorado, A Body Corporate | Crispr enabled multiplexed genome engineering |
CN103834627B (zh) * | 2014-03-11 | 2015-05-13 | 云南师范大学 | 一种低温木聚糖酶XynAGN16及其基因、重组载体、重组菌株 |
US9951363B2 (en) | 2014-03-14 | 2018-04-24 | The Research Foundation for the State University of New York College of Environmental Science and Forestry | Enzymatic hydrolysis of old corrugated cardboard (OCC) fines from recycled linerboard mill waste rejects |
JP6354462B2 (ja) * | 2014-08-29 | 2018-07-11 | 本田技研工業株式会社 | Ghファミリー10に属する耐熱性キシラナーゼ |
BR112017005509A2 (pt) | 2014-09-17 | 2018-08-14 | Bayer Cropscience Lp | composições que compreendem células recombinantes de bacillus e um outro agente de controle biológico. |
BR122023020858A2 (pt) | 2014-09-17 | 2024-01-30 | Spogen Biotech Inc | Semente de planta revestida com um microrganismo recombinante que expressa uma enzima que catalisa a produção de óxido nítrico |
AR101959A1 (es) | 2014-09-17 | 2017-01-25 | Bayer Cropscience Lp | Composiciones que comprenden células recombinantes de bacillus y un insecticida |
WO2016044533A1 (en) | 2014-09-17 | 2016-03-24 | Bayer Cropscience Lp | Compositions comprising recombinant bacillus cells and a fungicide |
CN104450649B (zh) * | 2014-11-17 | 2017-04-05 | 北京大学 | F52‑6蛋白及其编码基因及水解木聚糖的应用 |
CN105779491A (zh) * | 2014-12-25 | 2016-07-20 | 中国石油天然气股份有限公司 | 嗜热β-1,4木聚糖酶-His融合蛋白、其制备方法及应用、其基因工程菌的构建 |
CN104651337B (zh) * | 2015-01-28 | 2017-11-03 | 浙江大学 | 一种木聚糖酶、其编码基因xyn‑lxy及其应用 |
IL295513B1 (en) * | 2016-03-16 | 2024-04-01 | Spogen Biotech Inc | Methods for promoting plant health using free enzymes and microorganisms that cause enzyme overexpression |
LT3474669T (lt) | 2016-06-24 | 2022-06-10 | The Regents Of The University Of Colorado, A Body Corporate | Barkodu pažymėtų kombinatorinių bibliotekų generavimo būdai |
WO2018007154A1 (en) | 2016-07-08 | 2018-01-11 | Novozymes A/S | Xylanase variants and polynucleotides encoding same |
BR112019000125A2 (pt) * | 2016-07-08 | 2019-07-09 | Novozymes As | grânulo, polipeptídeo isolado, composição, aditivo de ração animal, ração animal peletizada, métodos de aprimoramento de um ou mais parâmetros de desempenho de um animal, de preparação de uma ração animal, para aprimorar o valor nutricional de uma ração animal, de solubilização de xilana a partir do material à base de planta e de produção do polipeptídeo, polinucleotídeo, construto de ácido nucleico ou vetor de expressão, célula hospedeira recombinante, e, uso do grânulo |
JP2019162036A (ja) * | 2016-08-05 | 2019-09-26 | 味の素株式会社 | ヘミセルラーゼ |
CN109688843A (zh) | 2016-09-16 | 2019-04-26 | 诺维信公司 | 纤维洗涤方法和系统 |
CN108456667B (zh) * | 2017-02-17 | 2019-10-18 | 中国科学院微生物研究所 | 一种木聚糖酶及其编码基因和它们的应用 |
WO2018234465A1 (en) * | 2017-06-22 | 2018-12-27 | Novozymes A/S | XYLANASE VARIANTS AND POLYNUCLEOTIDES ENCODING THE SAME |
US10011849B1 (en) | 2017-06-23 | 2018-07-03 | Inscripta, Inc. | Nucleic acid-guided nucleases |
US9982279B1 (en) | 2017-06-23 | 2018-05-29 | Inscripta, Inc. | Nucleic acid-guided nucleases |
JP7391827B2 (ja) | 2017-07-24 | 2023-12-05 | ノボザイムス アクティーゼルスカブ | 湿式製粉におけるgh5及びgh30 |
BR112020012438A2 (pt) | 2018-01-11 | 2020-11-24 | Novozymes A/S | composição, ração animal ou aditivo de ração animal, e, método de melhoria da liberação de xilana a partir de alimento para animais. |
CN108018274B (zh) * | 2018-02-01 | 2020-05-05 | 中南民族大学 | 一种极端耐热木聚糖酶1vbr的突变体xynh及其用途 |
WO2020009964A1 (en) * | 2018-07-06 | 2020-01-09 | Dupont Nutrition Biosciences Aps | Xylanase-containing feed additives for cereal-based animal feed |
CN109997970B (zh) * | 2019-03-07 | 2022-05-06 | 青岛红樱桃生物技术有限公司 | 一类酶活和耐热性提高的酸性木聚糖酶突变体及其编码基因和应用 |
BR112021017999A2 (pt) | 2019-03-11 | 2022-01-25 | Novozymes As | Métodos para aperfeiçoar a razão de conversão alimentar de uma ração animal, para gerar um prebiótico in situ em uma ração animal à base de milho, para diminuir a fração de milho insolúvel em uma ração animal à base de milho, para aperfeiçoar a saúde intestinal de um animal monogástrico, para causar um efeito butirogênico em um animal monogástrico, para a produção in situ de prebióticos em animais monogástricos, ração animal enriquecida com enzima, e, uso de glucuronoxilano hidrolase gh30 para preparar uma ração animal enriquecida com enzima |
CN110124025B (zh) * | 2019-04-22 | 2022-10-25 | 肇庆大华农生物药品有限公司 | 一种禽流感与禽腺病毒4型二联基因工程亚单位疫苗及其制备方法 |
CN112564485B (zh) * | 2019-09-10 | 2022-03-08 | 中车株洲电力机车研究所有限公司 | Llc谐振变换器及其控制方法 |
WO2021078839A1 (en) | 2019-10-22 | 2021-04-29 | Novozymes A/S | Animal feed composition |
CN111269903B (zh) * | 2020-03-30 | 2021-08-17 | 郑州大学 | 木聚糖酶、基因及其应用 |
BR112022023230A2 (pt) | 2020-05-18 | 2022-12-27 | Dsm Ip Assets Bv | Composições de ração animal |
EP4152945A1 (en) | 2020-05-18 | 2023-03-29 | DSM IP Assets B.V. | Animal feed compositions |
CN111876398B (zh) * | 2020-07-14 | 2022-03-22 | 云南师范大学 | 一种内切木聚糖酶突变体s05f04及其制备方法和应用 |
CN111690632B (zh) * | 2020-07-14 | 2022-03-18 | 云南师范大学 | 一种内切木聚糖酶突变体s23e11及其制备方法和应用 |
CN111849942B (zh) * | 2020-07-14 | 2022-06-24 | 云南师范大学 | 一种内切木聚糖酶突变体s44a09及制备方法和应用 |
CN111849943B (zh) * | 2020-07-14 | 2022-06-24 | 云南师范大学 | 一种内切木聚糖酶突变体s06h03及制备方法和应用 |
CN111848759B (zh) * | 2020-07-27 | 2022-03-29 | 齐鲁工业大学 | 一种活性提高的纤维小体对接蛋白突变体36741及应用 |
CN112322604B (zh) * | 2020-11-03 | 2022-05-17 | 南京工业大学 | 一种高比酶活木聚糖酶突变体及其应用 |
KR20220085367A (ko) * | 2020-12-15 | 2022-06-22 | 주식회사 잇다 | 기능성 발효 녹차 복합 생균제 및 이의 제조방법 |
EP4026900A3 (en) * | 2020-12-17 | 2022-10-05 | Fornia BioSolutions, Inc. | Xylanase variants and methods |
WO2023225459A2 (en) | 2022-05-14 | 2023-11-23 | Novozymes A/S | Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections |
CN114807093B (zh) * | 2022-06-22 | 2022-09-27 | 中国农业科学院北京畜牧兽医研究所 | 一种通过c端添加融合肽段提高木聚糖酶和植酸酶热稳定性的方法 |
Family Cites Families (117)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2643800C2 (de) * | 1976-09-29 | 1986-10-30 | Fritz Werner Industrie-Ausrüstungen GmbH, 6222 Geisenheim | Verfahren zur Herstellung von Xylose durch enzymatische Hydrolyse von Xylanen |
US4261868A (en) | 1979-08-08 | 1981-04-14 | Lever Brothers Company | Stabilized enzymatic liquid detergent composition containing a polyalkanolamine and a boron compound |
US4404128A (en) | 1981-05-29 | 1983-09-13 | The Procter & Gamble Company | Enzyme detergent composition |
US5021246A (en) | 1984-03-30 | 1991-06-04 | Anheuser-Busch, Incorporated | Step mashing process for producing low alcohol beer |
US5204015A (en) | 1984-05-29 | 1993-04-20 | Genencor International, Inc. | Subtilisin mutants |
US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
US5780292A (en) | 1987-04-29 | 1998-07-14 | Alko Group Ltd. | Production of phytate degrading enzymes in trichoderma |
GB8610670D0 (en) | 1986-05-01 | 1986-06-04 | British Petroleum Co Plc | Enzyme |
US4966850A (en) * | 1987-01-21 | 1990-10-30 | Forintek Canada Corp. | Production of thermostable xylanase and cellulase |
US4788066A (en) | 1987-12-14 | 1988-11-29 | Grain Processing Corporation | Preparation of low alcohol beer |
US5116746A (en) * | 1988-03-04 | 1992-05-26 | Institut Armand Frappier | Cellulase-free endo-xylanase enzyme of use in pulp delignification |
US5179021A (en) * | 1989-02-10 | 1993-01-12 | Gil Inc. (Now Ici Canada Inc.) | Pulp bleaching process comprising oxygen delignification and xylanase enzyme treatment |
NZ235679A (en) | 1989-10-18 | 1993-01-27 | Int Paper Co | Bleaching lignocellulosic pulp using (a) treatment with xylanase and (b) one or more chemical bleaching stages |
FI89814C (fi) | 1990-02-02 | 1993-11-25 | Enso Gutzeit Oy | Foerfarande foer blekning av cellulosamassa |
US5326477A (en) | 1990-05-07 | 1994-07-05 | Bio-Sep, Inc. | Process for digesting solid waste |
GB9018426D0 (en) * | 1990-08-22 | 1990-10-03 | Sandoz Ltd | Improvements in or relating to novel compounds |
DK203490D0 (da) | 1990-08-24 | 1990-08-24 | Novo Nordisk As | Fremgangsmaade til behandling af lignocellulosepulp og apparat til udfoerelse af processen |
NL9100050A (nl) | 1991-01-11 | 1992-08-03 | Heineken Technische Beheer Bv | Werkwijze voor het continu bereiden van wort. |
FR2672066B1 (fr) * | 1991-01-25 | 1997-01-31 | Du Pin Cellulose | Traitement enzymatique d'une pate ligno-cellulosique chimique. |
US5405624A (en) | 1991-02-14 | 1995-04-11 | Bio-Technical Resources | Process for producing a product with an intensified beer flavor |
FI108800B (fi) * | 1991-05-07 | 2002-03-28 | Iogen Corp | Menetelmä ja laitteisto entsyymin käyttämiseksi paperimassan valmistuksessa ja valkaisussa |
DK175391D0 (da) * | 1991-10-18 | 1991-10-18 | Novo Nordisk As | Nye enzymer |
CA2082185C (en) * | 1991-11-26 | 2004-01-20 | Alexander R. Pokora | Protease catalyzed treatments of lignocellulose materials |
DK87092D0 (da) * | 1992-07-02 | 1992-07-02 | Novo Nordisk As | Nyt enzym |
DK105592D0 (da) | 1992-08-26 | 1992-08-26 | Novo Nordisk As | Nyt enzym |
US5785811A (en) * | 1992-11-09 | 1998-07-28 | The Mead Corporation | Process for treating lignocellulosic material with soybean peroxidase in the presence of peroxide |
BR9307805A (pt) | 1992-12-31 | 1996-07-30 | Metallgesellschaft Ag | Processo para a preparaçao de cerveja |
US6021536A (en) | 1993-03-04 | 2000-02-08 | Wasinger; Eric | Mechanical desizing and abrading device |
US5405769A (en) * | 1993-04-08 | 1995-04-11 | National Research Council Of Canada | Construction of thermostable mutants of a low molecular mass xylanase |
GB2279955B (en) * | 1993-07-15 | 1998-02-18 | Solvay | Xylanase derived from a Bacillus species, expression vectors for such xylanase and other proteins, host organisms therefor and use thereof |
AU7807394A (en) * | 1993-10-04 | 1995-05-01 | Novo Nordisk A/S | An enzyme preparation comprising a modified enzyme |
BE1007651A3 (fr) * | 1993-10-22 | 1995-09-05 | Solvay Interox | Procede pour le blanchiment d'une pate a papier chimique. |
EP0686193B1 (en) * | 1993-12-24 | 2010-08-11 | DSM IP Assets B.V. | Alkali-tolerant xylanases |
BR9507229A (pt) | 1994-03-29 | 1997-09-16 | Novo Nordisk As | Amilase composição detergente aditivo detergente uso de um detergente e de uma amilase construç~o de dna vetor de expressão recombinante célula e processo para produzir amilase |
AUPM493594A0 (en) | 1994-04-11 | 1994-05-05 | Biotech International Limited | Bacterial xylanase |
US5437992A (en) * | 1994-04-28 | 1995-08-01 | Genencor International, Inc. | Five thermostable xylanases from microtetraspora flexuosa for use in delignification and/or bleaching of pulp |
EP0716702B1 (en) | 1994-06-14 | 2002-08-28 | Genencor International, Inc. | Thermostable xylanases |
EP0769049A1 (en) * | 1994-06-15 | 1997-04-23 | Novo Nordisk A/S | Pyrodictium xylanase, amylase and pullulanase |
US5830732A (en) | 1994-07-05 | 1998-11-03 | Mitsui Toatsu Chemicals, Inc. | Phytase |
BE1008751A3 (fr) | 1994-07-26 | 1996-07-02 | Solvay | Xylanase, microorganismes la produisant, molecules d'adn, procedes de preparation de cette xylanase et utilisations de celle-ci. |
US5503709A (en) * | 1994-07-27 | 1996-04-02 | Burton; Steven W. | Environmentally improved process for preparing recycled lignocellulosic materials for bleaching |
US5935836A (en) * | 1994-07-29 | 1999-08-10 | Rohm Enzyme Finland Oy | Actinomadura xylanase sequences and methods of use |
US5795737A (en) | 1994-09-19 | 1998-08-18 | The General Hospital Corporation | High level expression of proteins |
US5786316A (en) | 1994-10-27 | 1998-07-28 | The Procter & Gamble Company | Cleaning compositions comprising xylanases |
JP3435946B2 (ja) * | 1994-12-21 | 2003-08-11 | 王子製紙株式会社 | 耐熱性キシラナーゼ |
DE69617641T3 (de) | 1995-01-26 | 2009-10-22 | Novozymes A/S | Xylanase beinhaltende futterzusätze für tiere |
US6093562A (en) | 1996-02-05 | 2000-07-25 | Novo Nordisk A/S | Amylase variants |
AU6298896A (en) | 1995-06-28 | 1997-01-30 | Novo Nordisk A/S | A cellulase with reduced mobility |
US6057103A (en) | 1995-07-18 | 2000-05-02 | Diversa Corporation | Screening for novel bioactivities |
US5958672A (en) | 1995-07-18 | 1999-09-28 | Diversa Corporation | Protein activity screening of clones having DNA from uncultivated microorganisms |
AU6513096A (en) | 1995-07-19 | 1997-02-18 | Novo Nordisk A/S | Treatment of fabrics |
AU7294396A (en) | 1995-10-13 | 1997-04-30 | Gist-Brocades B.V. | Protein detection |
HUP9900738A2 (hu) * | 1995-10-17 | 1999-06-28 | Institut National De La Recherche Agronomique | Xilanáz, azt kódoló oligonukleotid-szekvencia és alkalmazásai |
CN1151247C (zh) | 1995-11-15 | 2004-05-26 | 诺沃奇梅兹有限公司 | 用于染色粗斜布的合并脱浆和“石洗”的一步方法 |
US5939250A (en) | 1995-12-07 | 1999-08-17 | Diversa Corporation | Production of enzymes having desired activities by mutagenesis |
US6537776B1 (en) | 1999-06-14 | 2003-03-25 | Diversa Corporation | Synthetic ligation reassembly in directed evolution |
US6361974B1 (en) | 1995-12-07 | 2002-03-26 | Diversa Corporation | Exonuclease-mediated nucleic acid reassembly in directed evolution |
US5830696A (en) | 1996-12-05 | 1998-11-03 | Diversa Corporation | Directed evolution of thermophilic enzymes |
AU1099597A (en) * | 1995-12-18 | 1997-07-14 | Rohm Enzyme Finland Oy | Novel xylanases and uses thereof |
EP0874893A2 (en) * | 1995-12-29 | 1998-11-04 | The Procter & Gamble Company | Detergent compositions comprising immobilized enzymes |
EP0877799A1 (en) | 1996-01-29 | 1998-11-18 | Novo Nordisk A/S | Process for desizing cellulosic fabric |
US6197070B1 (en) | 1996-05-15 | 2001-03-06 | The Procter & Gamble Company | Detergent compositions comprising alpha combination of α-amylases for malodor stripping |
US5759840A (en) * | 1996-09-09 | 1998-06-02 | National Research Council Of Canada | Modification of xylanase to improve thermophilicity, alkalophilicity and thermostability |
US6326341B1 (en) | 1996-09-11 | 2001-12-04 | The Procter & Gamble Company | Low foaming automatic dishwashing compositions |
EP1011620A1 (en) | 1996-10-11 | 2000-06-28 | Novo Nordisk A/S | CELLULOSE BINDING DOMAINS (CBDs) FOR ORAL CARE PRODUCTS |
US6069122A (en) | 1997-06-16 | 2000-05-30 | The Procter & Gamble Company | Dishwashing detergent compositions containing organic diamines for improved grease cleaning, sudsing, low temperature stability and dissolution |
AU743305C (en) | 1997-01-17 | 2006-03-30 | Maxygen, Inc. | Evolution of whole cells and organisms by recursive sequence recombination |
DE19703364A1 (de) | 1997-01-30 | 1998-08-06 | Henkel Ecolab Gmbh & Co Ohg | Pastenförmiges Wasch- und Reinigungsmittel |
US6023065A (en) | 1997-03-10 | 2000-02-08 | Alberta Research Council | Method and apparatus for monitoring and controlling characteristics of process effluents |
JP4263248B2 (ja) | 1997-03-18 | 2009-05-13 | ノボザイムス アクティーゼルスカブ | Dnaのシャッフリングによるライブラリーの作成方法 |
US5948653A (en) | 1997-03-21 | 1999-09-07 | Pati; Sushma | Sequence alterations using homologous recombination |
US6153410A (en) | 1997-03-25 | 2000-11-28 | California Institute Of Technology | Recombination of polynucleotide sequences using random or defined primers |
GB2327345B (en) | 1997-07-18 | 1999-06-23 | Finnfeeds Int Ltd | Use of an enzyme for manufacturing an agent for controlling bacterial infection |
CA2308119C (en) | 1997-10-30 | 2014-06-03 | Novo Nordisk A/S | .alpha.-amylase mutants |
JP3905310B2 (ja) | 1997-11-10 | 2007-04-18 | ザ プロクター アンド ギャンブル カンパニー | 洗剤タブレツトの製法 |
US6187580B1 (en) | 1997-11-24 | 2001-02-13 | Novo Nordisk A/S | Pectate lyases |
US6506559B1 (en) | 1997-12-23 | 2003-01-14 | Carnegie Institute Of Washington | Genetic inhibition by double-stranded RNA |
US6015703A (en) * | 1998-03-10 | 2000-01-18 | Iogen Corporation | Genetic constructs and genetically modified microbes for enhanced production of beta-glucosidase |
JP2003527450A (ja) | 1998-05-01 | 2003-09-16 | ノボ ノルディスク アクティーゼルスカブ | N−ヒドロキシアセトアニリドの様な増強剤 |
DE19824705A1 (de) | 1998-06-03 | 1999-12-09 | Henkel Kgaa | Amylase und Protease enthaltende Wasch- und Reinigungsmittel |
JP4335995B2 (ja) | 1998-07-22 | 2009-09-30 | 昭 神谷 | 環境保全型粒状洗浄用組成物 |
EP1109912A1 (en) * | 1998-09-04 | 2001-06-27 | University Of Georgia Research Foundation, Inc. | Phenolic acid esterases, coding sequences and methods |
US5980581A (en) | 1998-09-08 | 1999-11-09 | The Virkler Company | Process for desizing and cleaning woven fabrics and garments |
EP1129252A1 (en) * | 1998-09-17 | 2001-09-05 | Novozymes North America, Inc. | Methods for deinking and decolorizing printed paper |
EP1131447B2 (en) | 1998-11-16 | 2011-10-12 | National Research Council Of Canada | Thermostable xylanases |
CA2356255C (en) * | 1998-12-23 | 2011-02-22 | Danisco A/S | Use of a xylanase in the preparation of dough |
US6376246B1 (en) | 1999-02-05 | 2002-04-23 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
US6368861B1 (en) | 1999-01-19 | 2002-04-09 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
US6436675B1 (en) | 1999-09-28 | 2002-08-20 | Maxygen, Inc. | Use of codon-varied oligonucleotide synthesis for synthetic shuffling |
FR2788782B1 (fr) * | 1999-01-25 | 2003-01-31 | Gie Agro Ind | Produit multienzymatique a activites glucoamylasique, proteolytique et xylanasique et procede pour sa production par fermentation a l'etat solide de son de ble avec aspergillus niger |
US6024766A (en) | 1999-01-27 | 2000-02-15 | Wasinger; Eric M. | Process for enzymatic desizing of garments and enzyme deactivation |
JP2000245356A (ja) | 1999-02-26 | 2000-09-12 | Fuji Oil Co Ltd | マンノース含有コプラミール組成物 |
CN1266903A (zh) * | 1999-03-15 | 2000-09-20 | 财团法人生物技术开发中心 | 重组木聚糖酶、其制备方法及应用 |
US6511824B1 (en) | 1999-03-17 | 2003-01-28 | Exelixis, Inc. | Nucleic acids and polypeptides of invertebrate TWIK channels and methods of use |
US6824646B2 (en) * | 1999-03-23 | 2004-11-30 | Oji Paper Co., Ltd. | Process for oxygen bleaching and enzyme treating lignocellulosic pulp with liquid treatment and recovery |
US6309871B1 (en) | 1999-03-31 | 2001-10-30 | Novozymes A/S | Polypeptides having alkaline α-amylase activity |
CN1390260A (zh) | 1999-09-09 | 2003-01-08 | 伊奥根生物产品公司 | 蛋白在基因修饰真菌中的表达 |
AU7476600A (en) * | 1999-12-30 | 2001-07-16 | Genencor International, Inc. | Trichoderma reesei xylanase |
US6531644B1 (en) | 2000-01-14 | 2003-03-11 | Exelixis, Inc. | Methods for identifying anti-cancer drug targets |
DE60136267D1 (de) * | 2000-02-17 | 2008-12-04 | Biogasol Ipr Aps | Methode zur behandlung von lignin- und zellulosehaltigen stoffen |
BR0108750A (pt) * | 2000-03-08 | 2002-12-24 | Danisco | Variantes da xilanase que apresentam sensibilidade alterada para inibidores da xilanase |
US6399123B1 (en) | 2000-05-25 | 2002-06-04 | University Of Missouri Board Of Curators | Oligosaccharide removal from animal feed |
CA2410917C (en) * | 2000-05-31 | 2012-11-27 | Wing L. Sung | Modified xylanases exhibiting increased thermophilicity and alkalophilicity |
CA2425671A1 (en) | 2000-10-12 | 2002-04-18 | Exelixis, Inc. | Human ect2 and methods of use |
AU2002230784A1 (en) | 2000-11-10 | 2002-05-21 | Xencor | Novel thermostable alkaliphilic xylanase |
WO2002052100A2 (en) | 2000-12-22 | 2002-07-04 | Iogen Bio-Products Corporation | Alkaline extraction stages comprising xylanase |
AU2002229430A1 (en) | 2001-01-18 | 2002-07-30 | Iogen Bio-Products Corporation | Use of xylanase in pulp bleaching |
GB0121387D0 (en) | 2001-09-04 | 2001-10-24 | Danisco | Modified hydrolases |
WO2003074780A1 (en) | 2002-03-06 | 2003-09-12 | Iogen Bio-Products Corporation | Xylanase treatment of chemical pulp |
US20040005674A1 (en) | 2002-04-30 | 2004-01-08 | Athenix Corporation | Methods for enzymatic hydrolysis of lignocellulose |
KR20050010053A (ko) | 2002-06-14 | 2005-01-26 | 다이버사 코포레이션 | 자일라나제, 이를 암호화하는 핵산, 및 이의 제조 및 사용방법 |
US7033077B2 (en) * | 2002-07-16 | 2006-04-25 | Peter Taylor | Sealable bags made of plastics or other materials and method of making plastic sheeting for manufacturing sealable bags |
US20040112555A1 (en) * | 2002-12-03 | 2004-06-17 | Jeffrey Tolan | Bleaching stage using xylanase with hydrogen peroxide, peracids, or a combination thereof |
WO2004066945A2 (en) | 2003-01-24 | 2004-08-12 | Diversa Corporation | Enzymes and the nucleic acids encoding them and methods for making and using them |
CA2946924A1 (en) | 2006-02-14 | 2007-08-23 | Bp Corporation North America Inc. | Xylanases, nucleic acids encoding them and methods for making and using them |
CN109738224B (zh) | 2013-06-21 | 2021-07-16 | 伯乐生命医学产品有限公司 | 具有流体收集管的微流体系统 |
-
2003
- 2003-06-16 KR KR10-2004-7020345A patent/KR20050010053A/ko not_active Application Discontinuation
- 2003-06-16 US US10/517,939 patent/US7547534B2/en not_active Expired - Fee Related
- 2003-06-16 EP EP10179325.5A patent/EP2298904B1/en not_active Expired - Lifetime
- 2003-06-16 EP EP10179289A patent/EP2314698A1/en not_active Ceased
- 2003-06-16 BR BRPI0312121-6A patent/BR0312121A/pt not_active IP Right Cessation
- 2003-06-16 EP EP10179307A patent/EP2305820A1/en not_active Ceased
- 2003-06-16 ES ES03760440T patent/ES2394708T3/es not_active Expired - Lifetime
- 2003-06-16 CN CNA038191474A patent/CN1675365A/zh active Pending
- 2003-06-16 MX MXPA04012614A patent/MXPA04012614A/es active IP Right Grant
- 2003-06-16 BR BRPI0312121-6A patent/BRPI0312121B1/pt unknown
- 2003-06-16 DK DK10179325.5T patent/DK2298904T3/en active
- 2003-06-16 NZ NZ537597A patent/NZ537597A/en not_active IP Right Cessation
- 2003-06-16 EP EP03760440A patent/EP1516053B1/en not_active Expired - Lifetime
- 2003-06-16 WO PCT/US2003/019153 patent/WO2003106654A2/en not_active Application Discontinuation
- 2003-06-16 US US10/463,720 patent/US7504120B2/en not_active Expired - Lifetime
- 2003-06-16 CN CN201010268914.8A patent/CN101967490B/zh not_active Expired - Lifetime
- 2003-06-16 CA CA2488916A patent/CA2488916C/en not_active Expired - Fee Related
- 2003-06-16 KR KR1020087009502A patent/KR20080045764A/ko not_active Application Discontinuation
- 2003-06-16 EA EA200500019A patent/EA200500019A1/ru unknown
- 2003-06-16 AU AU2003251549A patent/AU2003251549B2/en not_active Ceased
- 2003-06-16 DK DK03760440.2T patent/DK1516053T3/da active
-
2005
- 2005-01-07 ZA ZA200500171A patent/ZA200500171B/xx unknown
-
2009
- 2009-03-11 US US12/402,421 patent/US8728769B2/en not_active Expired - Fee Related
- 2009-09-03 ZA ZA2009/06125A patent/ZA200906125B/en unknown
-
2013
- 2013-03-15 US US13/835,743 patent/US9765319B2/en not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9816078B2 (en) | 2009-11-19 | 2017-11-14 | Solis Biodyne Oü | Compositions for increasing polypeptide stability and activity, and related methods |
KR20180128086A (ko) * | 2009-11-19 | 2018-11-30 | 솔리스 바이오다인 오위 | 폴리펩티드 안정성 및 활성을 증가시키는 조성물 및 관련된 방법 |
KR20200018726A (ko) * | 2009-11-19 | 2020-02-19 | 솔리스 바이오다인 오위 | 폴리펩티드 안정성 및 활성을 증가시키는 조성물 및 관련된 방법 |
US11118169B2 (en) | 2009-11-19 | 2021-09-14 | Solis Biodyne Oü | Compositions for increasing polypeptide stability and activity, and related methods |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DK2298904T3 (en) | XYLANASES, NUCLEIC ACIDS, CODING THEM, AND METHODS FOR THE PREPARATION AND USE OF THEM | |
JP5343212B2 (ja) | セルラーゼ、それらをコードする核酸、並びにそれらを作製及び使用する方法 | |
JP6436946B2 (ja) | グルカナーゼ、それらをコードする核酸並びにそれらを製造及び使用する方法 | |
KR20050052666A (ko) | 프로테아제, 이를 암호화하는 핵산, 및 이를 제조하고사용하는 방법 | |
DK1613733T3 (en) | PEKTATLYASER, nucleic acids encoding them, and methods for making and using the | |
BRPI0707784A2 (pt) | xilanases, ácidos nucléicos que as codificam e métodos para produzì-las e usá-las | |
MX2010003600A (es) | Xilanasas, acidos nucleicos que las codifican, y metodos para hacerlas y usarlas. | |
KR101508249B1 (ko) | 알돌라제, 이것을 코딩하는 핵산과 그 제조 방법 및 사용 방법 | |
JP5563990B2 (ja) | トランスフェラーゼおよびオキシドレダクターゼ、それらをコードする核酸並びにそれらを製造および使用する方法 | |
HUE030573T2 (en) | Phospholipases, their coding nucleic acids, and a method for their production and use | |
KR20200111172A (ko) | 네페탈락톨 산화 환원 효소, 네페탈락톨 합성 효소, 및 네페탈락톤을 생산할 수 있는 미생물 | |
CN101688201A (zh) | 植物co2传感器、编码它们的核酸以及制造和使用它们的方法 | |
MXPA05004869A (es) | Isomerasas de xilosa, acidos nucleicos que las codifican, y metodos para hacerlas y usarlas. | |
KR102224897B1 (ko) | 신규한 폴리펩타이드 및 이를 포함하는 그람음성균에 대한 항생제 | |
JP2006524050A (ja) | グルコシダーゼ、それをコードする核酸、並びにその製造および使用方法 | |
CN101287827A (zh) | 具有二级酰胺酶活性的酶及其应用方法 | |
KR20230113365A (ko) | 뇌 기능의 저하의 예방 혹은 치료, 또는 뇌 기능의유지 혹은 개선을 하기 위한 조성물 | |
CN102618564A (zh) | 淀粉酶、编码它们的核酸及其制备和应用方法 | |
GB2479462A (en) | Polysaccharide degrading enzymes from Coleoptera insects | |
AU2016307152A1 (en) | A transgenic plant having resistance to a phyto-pathogenic fungus | |
AU2015210488A1 (en) | Xylanases, nucleic acids encoding them and methods for making and using them | |
AU2008201402A1 (en) | Xylanases, nucleic acids encoding them and methods for making and using them |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
N231 | Notification of change of applicant | ||
A107 | Divisional application of patent | ||
WITB | Written withdrawal of application |