KR102613549B1 - 신규 세린 프로테아제 변이체 - Google Patents

신규 세린 프로테아제 변이체 Download PDF

Info

Publication number
KR102613549B1
KR102613549B1 KR1020210032885A KR20210032885A KR102613549B1 KR 102613549 B1 KR102613549 B1 KR 102613549B1 KR 1020210032885 A KR1020210032885 A KR 1020210032885A KR 20210032885 A KR20210032885 A KR 20210032885A KR 102613549 B1 KR102613549 B1 KR 102613549B1
Authority
KR
South Korea
Prior art keywords
gly
thr
ala
ser
val
Prior art date
Application number
KR1020210032885A
Other languages
English (en)
Other versions
KR20220128171A (ko
Inventor
이주희
조아라
지창준
Original Assignee
씨제이제일제당 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 씨제이제일제당 주식회사 filed Critical 씨제이제일제당 주식회사
Priority to KR1020210032885A priority Critical patent/KR102613549B1/ko
Priority to CA3175414A priority patent/CA3175414A1/en
Priority to CN202280004542.9A priority patent/CN115698280A/zh
Priority to TW111108938A priority patent/TW202237835A/zh
Priority to PCT/KR2022/003415 priority patent/WO2022191653A1/ko
Priority to JP2022562328A priority patent/JP2023521203A/ja
Priority to US17/997,455 priority patent/US20230174964A1/en
Priority to EP22767549.3A priority patent/EP4116416A4/en
Publication of KR20220128171A publication Critical patent/KR20220128171A/ko
Application granted granted Critical
Publication of KR102613549B1 publication Critical patent/KR102613549B1/ko

Links

Classifications

    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23KFODDER
    • A23K20/00Accessory food factors for animal feeding-stuffs
    • A23K20/10Organic substances
    • A23K20/189Enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/52Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23KFODDER
    • A23K10/00Animal feeding-stuffs
    • A23K10/10Animal feeding-stuffs obtained by microbiological or biochemical processes
    • A23K10/14Pretreatment of feeding-stuffs with enzymes
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23KFODDER
    • A23K10/00Animal feeding-stuffs
    • A23K10/10Animal feeding-stuffs obtained by microbiological or biochemical processes
    • A23K10/16Addition of microorganisms or extracts thereof, e.g. single-cell proteins, to feeding-stuff compositions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/21Serine endopeptidases (3.4.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/02Libraries contained in or displayed by microorganisms, e.g. bacteria or animal cells; Libraries contained in or displayed by vectors, e.g. plasmids; Libraries containing only microorganisms or vectors
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • C40B40/08Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Polymers & Plastics (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Animal Husbandry (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Physiology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Detergent Compositions (AREA)

Abstract

본 출원은 신규한 세린 프로테아제 변이체에 관한 것이다.

Description

신규 세린 프로테아제 변이체{A novel serine protease variant}
본 출원은 신규한 세린 프로테아제 변이체에 관한 것이다.
단백질 분해효소(protease)는 생체내에서 소화, 흡수, 방어 등의 다양한 기능을 하고 있으며 활성 자리의 구조에 따라 세린 단백질 분해효소(serine protease), 시스테인 단백질 분해효소(cystein protease), 아스파테이트 단백질 분해효소(sapartic protease) 그리고 메탈로단백질 분해효소(metalloprotease)로 구분된다. 그 중 세린 프로테아제(또는 세린 엔도펩티다아제)는 주로 활성 부위에 활성 세린 잔기를 공통적으로 갖는 것을 특징으로, 세린이 프로테아제의 활성 부위에서 친핵성 아미노산으로 작용하여 단백질 내 펩티드 결합을 절단하는 효소이다(Hedstrom, 2002. Chem Rev 102: 4501-4524).
세린 프로테아제는 그 용도가 다양하여 혈전의 용해 등과 같은 인류의 질병 치료 이외에도 의류용 세제의 성분, 콘택트렌즈 세정제의 성분으로 이용될 뿐만 아니라 우유 단백질의 변형, 견 섬유의 고무질 제거(silk degumming), 가죽의 침지(soaking), 제모(unhairing), 올리고 펩타이드 합성 및 폐 Xray 필름으로부터 은의 회수, 사료 및 식품의 제조와 개선(한국공개특허 10-2005-0068750호) 등에 다양하게 이용되고 있다. 그러나, 보다 뛰어난 산업적 경제성 및 효능을 확보하기 위하여 활성 등의 측면에서 개선된 세린 프로테아제가 요구되는 실정이다.
본 출원의 목적은 세린 프로테아제 변이체를 제공하는 것이다.
본 출원의 다른 목적은 상기 세린 프로테아제 변이체를 코딩하는 폴리뉴클레오티드 및 이를 포함하는 벡터를 제공하는 것이다.
본 출원의 또 다른 목적은 상기 세린 프로테아제 변이체; 상기 변이체를 코딩하는 폴리뉴클레오티드; 및 상기 폴리뉴클레오티드를 포함하는 벡터 중 1 이상을 포함하는, 미생물을 제공하는 것이다.
본 출원의 또 다른 목적은 상기 세린 프로테아제 변이체 및 상기 미생물 중 하나 이상을 포함하는, 사료용 조성물을 제공하는 것이다.
이를 구체적으로 설명하면 다음과 같다. 한편, 본 출원에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시 형태에도 적용될 수 있다. 즉, 본 출원에서 개시된 다양한 요소들의 모든 조합이 본 출원의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 출원의 범주가 제한된다고 볼 수 없다.
또한, 당해 기술분야의 통상의 지식을 가진 자는 통상의 실험만을 사용하여 본 출원에 기재된 본 출원의 특정 양태에 대한 다수의 등가물을 인지하거나 확인할 수 있다. 또한, 이러한 등가물은 본 출원에 포함되는 것으로 의도된다.
본 출원의 하나의 양태는 세린 프로테아제 변이체를 제공한다.
본 출원의 용어 "세린 프로테아제(serine protease)"는 프로테아제의 하위그룹에 속하며 단백질 분해 활성을 갖는 효소를 의미한다. 구체적으로, 세린 프로테아제는 펩티드 결합을 가수분해함으로써 단백질을 분해하고 기본적으로 활성 부위에 활성 세린 잔기를 갖는 효소일 수 있으며, 보다 구체적으로 세 작용기 촉매(catalytic triad)라고 칭해질 수 있는 아미노산 잔기인 히스티딘, 아스파테이트와 세린의 공간 배치를 갖는 효소일 수 있으나 이에 제한되지 않는다.
본 출원의 세린 프로테아제는, 이에 제한되지는 않으나, 써모비피다(Thermobifida) 속, 노카르디옵시스(Nocardiopsis) 속, 액티노루기스포라(Actinorugispora) 속, 또는 스핀액티노스포라(Spinactinospora) 속 미생물 유래인 것일 수 있다. 구체적으로, 본 출원에서 상기 세린 프로테아제의 야생형은 써모비피다 푸스카(Thermobifida fusca), 써모비피다 셀룰로실리티카(Thermobifida cellulosilytica), 써모비피다 할로톨러런스(Thermobifida halotolerans), 액티노루기스포라 엔도피티카(Actinorugispora endophytica), 스핀액티노스포라 알칼리톨러런스(Spinactinospora alkalitolerans), 노카르디옵시스 컴포스타(Nocardiopsis composta), 또는 노카르디옵시스 포텐스(Nocardiopsis potens) 유래 세린 프로테아제일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 본 출원의 세린 프로테아제는 서열번호 31로 기재된 아미노산 서열을 포함하거나, 이로 필수적으로 이루어지거나(consisting essentially of) 또는 이루어진 폴리펩티드일 수 있으나, 이에 제한되지 않는다. 일 구현예로, 상기 서열번호 31의 아미노산 서열은 서열번호 40 또는 서열번호 2로부터 유래하는 아미노산 서열일 수 있으나 이에 제한되지 않는다.
일 구현예로, 본 출원의 세린 프로테아제는 서열번호 49 내지 54 중 어느 하나의 아미노산 서열을 포함하거나, 이로 필수적으로 이루어지거나(consisting essentially of) 또는 이루어진 것일 수 있으나 이에 제한되지 않는다. 일 구현예로, 상기 서열번호 49 내지 54의 아미노산 서열은 서열번호 67 내지 72 중 어느 하나의 아미노산 서열로부터 유래한 것일 수 있으나, 이에 제한되지는 않는다.
본 출원의 세린 프로테아제는 전술한 아미노산 서열과 동일한 활성을 갖는 서열은 제한 없이 포함할 수 있다. 또한, 서열번호 31 및 49 내지 54 중 어느 하나의 아미노산 서열 또는 이와 60% 이상의 상동성(homology) 또는 동일성(identity)을 갖는 아미노산 서열을 포함하거나, 이로 필수적으로 이루어지거나(consisting essentially of) 또는 이루어진 것일 수 있으나, 이에 제한되는 것은 아니다. 구체적으로 상기 아미노산 서열은 서열번호 31 및 49 내지 54로 기재되는 아미노산 서열 중 어느 하나 또는 상기 서열번호 31 및 49 내지 54로 기재되는 아미노산 서열 중 어느 하나와 적어도 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 가지는 아미노산 서열을 포함할 수 있다. 또한, 이러한 상동성 또는 동일성을 가지며 상기 단백질에 상응하는 효능을 나타내는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 갖는 단백질도 본 출원의 범위 내에 포함됨은 자명하다.
즉, 본 출원에서 '특정 서열번호로 기재된 아미노산 서열을 갖는 단백질 또는 폴리펩티드', '특정 서열번호로 기재된 아미노산 서열을 포함하는 단백질 또는 폴리펩티드'라고 기재되어 있다 하더라도, 해당 서열번호의 아미노산 서열로 이루어진 폴리펩티드와 동일 혹은 상응하는 활성을 가지는 경우라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 갖는 단백질도 본 출원에서 사용될 수 있음은 자명하다. 예를 들어, '서열번호 31의 아미노산 서열을 포함하는 폴리펩티드'는, 이와 동일 혹은 상응하는 활성을 가지는 경우라면 '서열번호 31의 아미노산 서열로 이루어진 폴리펩티드'에 속할 수 있음은 자명하다.
본 출원에서 용어 '상동성(homology)' 또는 '동일성(identity)'은 두 개의 주어진 아미노산 서열 또는 염기 서열과 관련된 정도를 의미하며 백분율로 표시될 수 있다. 용어 상동성 및 동일성은 종종 상호교환적으로 이용될 수 있다.
보존된 (conserved) 폴리뉴클레오티드 또는 폴리펩티드의 서열 상동성 또는 동일성은 표준 배열 알고리즘에 의해 결정되며, 사용되는 프로그램에 의해 확립된 디폴트 갭 페널티가 함께 이용될 수 있다. 실질적으로, 상동성을 갖거나 (homologous) 또는 동일한 (identical) 서열은 일반적으로 서열 전체 또는 전체-길이의 적어도 약 50%, 60%, 70%, 80% 또는 90%를 따라 중간 또는 높은 엄격한 조건(stringent conditions)에서 하이브리드할 수 있다. 하이브리드화는 폴리뉴클레오티드에서 코돈 대신 축퇴 코돈을 함유하는 폴리뉴클레오티드 또한 고려된다.
임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는 예를 들어, Pearson et al (1988)[Proc. Natl. Acad. Sci. USA 85]: 2444에서와 같은 디폴트 파라미터를 이용하여 "FASTA" 프로그램과 같은 공지의 컴퓨터 알고리즘을 이용하여 결정될 수 있다. 또는, EMBOSS 패키지의 니들만 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277)(버전 5.0.0 또는 이후 버전)에서 수행되는 바와 같은, 니들만-운치(Needleman-Wunsch) 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)이 사용되어 결정될 수 있다. (GCG 프로그램 패키지 (Devereux, J., et al, Nucleic Acids Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop, [ED.,] Academic Press, San Diego,1994, 및 [CARILLO ETA/.](1988) SIAM J Applied Math 48: 1073을 포함한다). 예를 들어, 국립 생물공학 정보 데이터베이스 센터의 BLAST, 또는 ClustalW를 이용하여 상동성, 유사성 또는 동일성을 결정할 수 있다.
폴리뉴클레오티드 또는 폴리펩티드의 상동성, 유사성 또는 동일성은 예를 들어, Smith and Waterman, Adv. Appl. Math (1981) 2:482 에 공지된 대로, 예를 들면, Needleman et al. (1970), J Mol Biol.48 : 443과 같은 GAP 컴퓨터 프로그램을 이용하여 서열 정보를 비교함으로써 결정될 수 있다. 요약하면, GAP 프로그램은 두 서열 중 더 짧은 것에서의 기호의 전체 수로, 유사한 배열된 기호(즉, 뉴클레오티드 또는 아미노산)의 수를 나눈 값으로 정의한다. GAP 프로그램을 위한 디폴트 파라미터는 (1) 이진법 비교 매트릭스(동일성을 위해 1 그리고 비-동일성을 위해 0의 값을 함유함) 및 Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation, pp. 353-358 (1979)에 의해 개시된 대로, Gribskov et al(1986) Nucl. Acids Res. 14: 6745의 가중된 비교 매트릭스 (또는 EDNAFULL(NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스); (2) 각 갭을 위한 3.0의 페널티 및 각 갭에서 각 기호를 위한 추가의 0.10 페널티 (또는 갭 개방 패널티 10, 갭 연장 패널티 0.5); 및 (3) 말단 갭을 위한 무 페널티를 포함할 수 있다.
또한, 임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는 정의된 엄격한 조건하에서 써던 혼성화 실험에 의해 서열을 비교함으로써 확인할 수 있으며, 정의되는 적절한 혼성화 조건은 해당 기술 범위 내이고, 당업자에게 잘 알려진 방법으로 결정될 수 있다.
일 구현예로, 본 출원에서 제공하는 세린 프로테아제 변이체는, 상기에서 설명한 세린 프로테아제 활성을 갖는 단백질 중, 특이적 위치의 아미노산이 치환되어, 효소 활성이 변이 전 단백질 대비 100% 초과되는 변이체를 의미할 수 있다.
하나의 구체예로, 본 출원에서 제공하는 변이체는 서열번호 31 및 49 내지 54 중 어느 하나의 아미노산 서열을 포함하는 야생형 효소 대비, 약 100% 초과, 구체적으로 약 110%, 약 120%, 약 130%, 약 140%, 약 150%, 약 160%, 약 170%, 약 180%, 약 190%, 또는 약 200% 이상의 증가된 효소 활성을 가질 수 있으나, 이에 제한되지 않는다.
상기 용어 “약(about)”은 ±0.5, ±0.4, ±0.3, ±0.2, ±0.1 등을 모두 포함하는 범위로, 약 이란 용어 뒤에 나오는 수치와 동등하거나 유사한 범위의 수치를 모두 포함하나, 이에 제한되지 않는다.
본 출원에서 용어, "변이체(variant)"는 하나 이상의 아미노산이 보존적 치환(conservative substitution) 및/또는 변형(modification)에 있어서 상기 열거된 서열 (the recited sequence)과 상이하나, 상기 단백질의 기능(functions) 또는 특성(properties)이 유지되는 폴리펩티드를 지칭한다. 변이체는 수 개의 아미노산 치환, 결실 또는 부가에 의해 식별되는 서열(identified sequence)과 상이하다. 이러한 변이체는 일반적으로 상기 폴리펩티드 서열 중 하나를 변형하고, 상기 변형된 폴리펩티드의 특성을 평가하여 식별될 수 있다. 즉, 변이체의 능력은 본래 단백질(native protein)에 비하여 증가되거나, 변하지 않거나, 또는 감소될 수 있다.
또한, 일부 변이체는 N-말단 리더 서열 또는 막전이 도메인(transmembrane domain)과 같은 하나 이상의 부분이 제거된 변이체를 포함할 수 있다. 다른 변이체는 성숙 단백질 (mature protein)의 N- 및/또는 C- 말단으로부터 일부분이 제거되거나, 혹은 부가된 변이형을 포함할 수 있다.
상기 용어 "변이체"는 변형/변이된 단백질, 변이형 폴리펩티드, 변이 등의 용어(영문 표현으로는 modification, modified protein, modified polypeptide, mutant, mutein, divergent, variant 등)가 사용될 수 있으며, 변이된 의미로 사용되는 용어라면 이에 제한되지 않는다.
상기 변이체는 천연의 야생형 또는 비변형 단백질 대비 변이된 단백질의 활성이 증가된 것일 수 있으나, 이에 제한되지 않는다.
본 출원에서 용어 "보존적 치환(conservative substitution)"은 한 아미노산을 유사한 구조적 및/또는 화학적 성질을 갖는 또 다른 아미노산으로 치환시키는 것을 의미한다. 상기 변이체는 하나 이상의 생물학적 활성을 여전히 보유하면서, 예를 들어 하나 이상의 보존적 치환을 가질 수 있다. 이러한 아미노산 치환은 일반적으로 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성(amphipathic nature)에서의 유사성에 근거하여 발생할 수 있다. 예를 들면, 전하를 띠는 곁사슬(electrically charged amino acid)을 갖는 아미노산 중 양으로 하전된(염기성) 아미노산은 아르기닌, 라이신, 및 히스티딘을, 음으로 하전된(산성) 아미노산은 글루탐산 및 아스파테이트를 포함하고; 전하를 띠지 않는 곁사슬(uncharged amino acid)을 갖는 아미노산 중 비극성 아미노산(nonpolar amino acid)은 글리신, 알라닌, 발린, 류신, 이소류신, 메티오닌, 페닐알라닌, 트립토판 및 프롤린을 포함하고, 극성(polar) 또는 친수성(hydrophilic) 아미노산은 세린, 쓰레오닌, 시스테인, 타이로신, 아스파라긴 및 글루타민을 포함하고, 상기 아미노산 중 방향족 아미노산은 페닐알라닌, 트립토판 및 타이로신을 포함한다. 또한, 변이체는 폴리펩티드의 특성과 2차 구조에 최소한의 영향을 갖는 아미노산들의 결실 또는 부가를 포함할 수 있다. 예를 들면 폴리펩티드는 번역-동시에(co-translationally) 또는 번역-후에(post-translationally) 단백질의 이전(transfer)에 관여하는 단백질 N-말단의 시그널 (또는 리더)서열과 컨쥬게이트 할 수 있다. 또한 상기 폴리펩티드는 폴리펩티드를 확인, 정제, 또는 합성할 수 있도록 다른 서열 또는 링커와 컨쥬게이트 될 수 있다.
본 출원에서 용어, "세린 프로테아제 변이체"는 세린 프로테아제 활성을 갖는 폴리펩티드의 아미노산 서열에서 하나 이상의 아미노산 치환을 포함하는 폴리펩티드를 의미한다.
본 출원의 세린 프로테아제 변이체는 서열번호 31의 N-말단으로부터 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 것을 포함할 수 있다. 구체적으로, 상기 세린 프로테아제 변이체는 서열번호 31의 12번 아미노산 및/또는 116번 아미노산에 상응하는 아미노산의 치환을 포함하고, 서열번호 31 및 49 내지 54 중 어느 하나의 아미노산 서열과 60% 이상 100% 미만의 상동성 또는 동일성을 가지는 아미노산 서열을 포함하는 것일 수 있다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 31의 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산의 치환을 포함하고, 서열번호 31 및 49 내지 54 중 어느 하나의 아미노산 서열과 60% 이상, 예를 들어 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상, 100% 미만의 상동성 또는 동일성을 가지는 것일 수 있으나, 이에 제한되지 않는다.
한편, 서열번호 31의 N-말단으로부터 12번 아미노산 및 116번 아미노산은 서열번호 49 내지 54의 N-말단으로부터 12번 아미노산 및 116번 아미노산에 대응하므로, 서열번호 31을 기준으로 아미노산의 위치에 대해 기재한 내용은 서열번호 49 내지 54 중 어느 하나의 아미노산 서열의 12번 아미노산 및 116번 아미노산에도 동일하게 적용될 수 있다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 54의 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산의 치환을 포함하고, 서열번호 52 내지 54 중 어느 하나의 아미노산 서열과 60% 이상, 예를 들어 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상, 100% 미만의 상동성 또는 동일성을 가지는 아미노산 서열을 포함하는 것일 수 있다. 구체적으로 상기 세린 프로테아제 변이체는 서열번호 54의 12번 아미노산에 상응하는 위치의 아미노산의 치환을 포함하고, 서열번호 54의 아미노산 서열과 60% 이상, 예를 들어 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상, 100% 미만의 상동성 또는 동일성을 가지는 것일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 31 및 49 내지 54 중에서 선택되는 어느 하나의 아미노산 서열 내 N-말단으로부터 12번 위치, 116번 위치, 또는 12번 및 116번 위치에 상응하는 아미노산 모두가 다른 아미노산으로 치환된 단백질일 수 있다. 상기 '다른 아미노산'은 치환 전과는 다른 아미노산을 의미하며, 치환 전의 아미노산을 제외한 아미노산이면 제한되지 않는다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 31 및 49 내지 51 중 선택되는 어느 하나의 아미노산 서열에서 12번 위치의 페닐알라닌(phenylalanine)이 글리신(glycine), 알라닌 (alanine), 아르기닌 (arginine), 아스파테이트 (aspartate), 시스테인 (cysteine), 글루탐산 (glutamate), 아스파라긴 (asparagine), 글루타민 (glutamine), 히스티딘 (histidine), 프롤린 (proline), 세린 (serine), 타이로신 (tyrosine), 이소류신 (isoleucine), 류신 (leucine), 라이신 (lysine), 트립토판 (tryptophan), 발린 (valine), 메티오닌 (methionine) 또는 쓰레오닌 (threonine)으로 치환되거나/되고, 116번 위치의 아스파라긴이 글리신, 알라닌, 아르기닌, 아스파테이트, 시스테인, 글루탐산, 글루타민, 히스티딘, 프롤린, 세린, 타이로신, 이소류신, 류신, 라이신, 페닐알라닌, 트립토판, 발린, 메티오닌 또는 쓰레오닌으로 치환된 것일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 52 내지 54 중 선택되는 어느 하나의 아미노산 서열에서 12번 위치의 프롤린 (proline)이 페닐알라닌(phenylalanine), 글리신(glycine), 알라닌 (alanine), 아르기닌 (arginine), 아스파테이트 (aspartate), 시스테인 (cysteine), 글루탐산 (glutamate), 아스파라긴 (asparagine), 글루타민 (glutamine), 히스티딘 (histidine), 세린 (serine), 타이로신 (tyrosine), 이소류신 (isoleucine), 류신 (leucine), 라이신 (lysine), 트립토판 (tryptophan), 발린 (valine), 메티오닌 (methionine) 또는 쓰레오닌 (threonine)으로 치환되거나/되고, 116번 위치의 아스파라긴이 글리신, 알라닌, 아르기닌, 아스파테이트, 시스테인, 글루탐산, 글루타민, 히스티딘, 프롤린, 세린, 타이로신, 이소류신, 류신, 라이신, 페닐알라닌, 트립토판, 발린, 메티오닌 또는 쓰레오닌으로 치환된 것일 수 있으나, 이에 제한되지 않는다.
구체적으로, 상기 변이체는 서열번호 31 및 49 내지 54 중 선택되는 어느 하나의 아미노산 서열에서 12번 위치에 상응하는 아미노산이 타이로신(Y), 세린(S), 알라닌(A) 또는 아르기닌(R)으로 치환되거나, 116번 위치에 상응하는 아미노산이 아스파테이트(D), 세린(S), 쓰레오닌(T) 또는 글리신(G)으로 치환되거나, 또는 서열번호 31의 아미노산 서열에서 12번 및 116번 위치에 상응하는 아미노산이 각각 타이로신(Y) 및 아스파테이트(D); 타이로신(Y) 및 세린(S); 세린(S) 및 아스파테이트(D); 세린(S) 및 쓰레오닌(T); 또는, 알라닌(A) 및 글리신(G)으로 치환된 것을 포함하는 단백질일 수 있으나, 이에 제한되지 않는다. 일 구현예로, 상기 세린 프로테아제 변이체는 서열번호 52 내지 54 중 선택되는 어느 하나의 아미노산 서열에서 12번 위치의 프롤린이 타이로신, 알라닌, 세린 또는 아르기닌으로 치환된 것일 수 있으나, 이에 제한되지 않는다.
상기 서열번호 31 및 49 내지 54 중 선택되는 어느 하나의 아미노산 서열에서 12번 및/또는 116번 위치의 아미노산이 다른 아미노산으로 치환된 변이체는, 상기 위치에 상응하는 아미노산이 다른 아미노산으로 치환된 변이체를 포함하는 것은 자명하다.
또한, 상기 변이체는 위에서 설명한 서열번호 31 및 49 내지 54 중 선택되는 어느 하나로 기재되는 아미노산 서열 또는 상기 서열번호 31 및 49 내지 54 중 선택되는 어느 하나의 아미노산 서열과 적어도 60% 이상, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 가지는 아미노산 서열에서, 서열번호 31 및 49 내지 54 중 선택되는 어느 하나의 아미노산 서열의 N-말단으로부터 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 것을 포함한다.
일 구현예로, 상기 변이체 중 서열번호 31의 아미노산 서열에서 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 변이체는, 서열번호 32 내지 39에서 선택되는 어느 하나의 서열번호로 기재되는 아미노산 서열로 이루어진 것일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 상기 변이체 중 서열번호 49의 아미노산 서열에서 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 변이체는 서열번호 55 또는 56의 아미노산 서열로 이루어진 것일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 상기 변이체 중 서열번호 50의 아미노산 서열에서 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 변이체는 서열번호 57 또는 58의 아미노산 서열로 이루어진 것일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 상기 변이체 중 서열번호 51의 아미노산 서열에서 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 변이체는 서열번호 59 또는 60의 아미노산 서열로 이루어진 것일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 상기 변이체 중 서열번호 52의 아미노산 서열에서 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 변이체는 서열번호 61 또는 62의 아미노산 서열로 이루어진 것일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 상기 변이체 중 서열번호 53의 아미노산 서열에서 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 변이체는 서열번호 63 또는 64의 아미노산 서열로 이루어진 것일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 상기 변이체 중 서열번호 54의 아미노산 서열에서 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 변이체는 서열번호 65 또는 66의 아미노산 서열로 이루어진 것일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 31 및 49 내지 54 중 선택되는 어느 하나의 아미노산 서열의 12번째 및/또는 116번째 위치에 상응하는 위치에서 다른 아미노산으로의 치환을 포함하고, 서열번호 31 및 49 내지 54 중 선택되는 어느 하나의 아미노산 서열과 60%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상, 100% 미만의 서열 상동성을 가지며, 세린 프로테아제 활성을 가지는 것일 수 있다.
본 출원의 세린 프로테아제 변이체는 변이 전의 폴리펩티드, 천연의 야생형 폴리펩티드 또는 비변형 폴리펩티드에 비해 활성이 강화된 것일 수 있으나 이에 제한되지 않는다. 또한, 이러한 상동성을 가지며 상기 단백질에 상응하는 효능을 나타내는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 갖는 단백질도 본 출원의 범위 내에 포함됨은 자명하다.
또한 본 출원의 변이체와 동일 혹은 상응하는 활성을 가지는 경우라면 상기 12번째 및/또는 116번째 아미노산의 변이 또는 이에 상응하는 위치의 변이 이외에 해당 서열번호의 아미노산 서열 앞뒤의 무의미한 서열 추가 또는 자연적으로 발생할 수 있는 돌연변이, 혹은 이의 잠재성 돌연변이 (silent mutation)를 제외하는 것이 아니며, 이러한 서열 추가 혹은 돌연변이를 가지는 경우에도 본원의 범위 내에 속하는 것이 자명하다.
한편, NCBI Reference Sequence WP_016188200.1 (서열번호 40)의 mature region은 본 출원의 서열번호 31에 상응하며, 서열번호 40에서 signal peptide만을 제외한 서열은 본 출원의 서열번호 2에 상응한다.
본 출원의 세린 프로테아제 변이체는, 전술한대로 서열번호 31의 12번, 116번에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 세린 프로테아제의 특성과 2차 구조에 최소한의 영향을 갖는 아미노산들의 결실 또는 부가를 포함할 수 있음은 자명하다. 또한, 당업자라면 당업계에 알려진 서열 얼라인먼트를 통해 본 출원의 서열번호 31의 N-말단으로부터 12번, 116번 위치가 서열번호 40의 193, 297번 위치, 서열번호 2의 163, 267번 위치에 상응하는 것임을 알 수 있으며, 서열번호 31이 서열번호 2 및 서열번호 40에 포함되는 것을 알 수 있다.
따라서 본 출원의 세린 프로테아제 변이체는, 서열번호 31의 아미노산 서열을 포함하는 서열번호 2 및 서열번호 40에 대해서, 서열번호 31의 12, 116번에 상응하는 위치의 아미노산 (서열번호 2에서 163 및/또는 267번째 아미노산, 서열번호 40에서 193 및/또는 297번째 아미노산)이 치환된 변이체를 포함한다. 또한 본 출원에서 서열번호 31 및 이의 12, 116번째 아미노산에 대해 설명한 내용을 서열번호 2 및 이의 163, 267번째 아미노산, 서열번호 40 및 이의 193, 297번째 아미노산에 적용할 수 있다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 31의 12 및/또는 116번에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 아미노산 서열을 포함하고, 서열번호 2와 적어도 60% 이상, 예를 들어 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상, 100% 미만의 서열 상동성을 가지는 것일 수 있다. 다른 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 2의 163 및/또는 267번째 아미노산이 다른 아미노산으로 치환되고, 서열번호 2와 60% 이상 100% 미만의 서열 상동성을 갖는 것일 수 있으며, 서열번호 3 내지 10 중에서 선택되는 어느 하나의 아미노산 서열과 60% 이상의 서열 상동성을 갖는 것일 수 있다. 그러나, 이에 제한되지 않는다.
한편 서열번호 49 내지 54 중 어느 하나의 아미노산 서열을 포함하는 폴리펩티드에서 서열번호 49 내지 54의 N-말단으로부터 12번 및/또는 116번 위치에 상응하는 아미노산의 치환을 포함하는 변이체 역시 본 출원의 세린 프로테아제의 범위에 포함되는 것은 자명하다.
상기 서열번호 49 내지 54 중 어느 하나의 아미노산 서열을 포함하는 폴리펩티드의 서열은, 예를 들어 GenBank Accession: KUP96625.1(서열번호 67), NCBI Reference Sequence: WP_068687914.1(서열번호 68), NCBI Reference Sequence: WP_133739400.1(서열번호 69), NCBI Reference Sequence: WP_179641868.1(서열번호 70), NCBI Reference Sequence: WP_184391208.1(서열번호 71), 또는 NCBI Reference Sequence: WP_017594871.1 (서열번호 72) 등에 기재된 아미노산 서열일 수 있다.
당업자라면 당업계에 알려진 서열 얼라인먼트를 통해 서열번호 67 내지 72에서 서열번호 49 내지 54의 N-말단으로부터 12번 및/또는 116번 위치에 상응하는 아미노산을 확인하여, 서열번호 49 내지 54의 N-말단으로부터 12번 및/또는 116번 위치에 대해 설명한 내용을 적용할 수 있다.
일 구현예로 본 출원의 세린 프로테아제 변이체는 서열번호 49 내지 54 중 어느 하나의 아미노산 서열의 N-말단으로부터 12번 및/또는 116번 위치에 상응하는 아미노산의 다른 아미노산으로의 치환을 포함하고, 서열번호 67 내지 72 중 어느 하나의 아미노산 서열과 60% 이상, 예를 들어 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 갖는 것일 수 있다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 54로 기재되는 아미노산 서열을 기준으로 12번 위치에 상응하는 아미노산의 치환을 포함하고, 서열번호 70 내지 72 중 어느 하나로 기재되는 아미노산 서열과 60% 이상, 예를 들어 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 갖는 것일 수 있다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 67로 기재되는 아미노산 서열을 기준으로 198번 위치에 상응하는 아미노산의 치환을 포함하는 것일 수 있다. 상기 변이체는 서열번호 67과 60% 이상, 예를 들어 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 갖는 것일 수 있다. 예를 들어, 상기 변이체는 서열번호 49의 12번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환되고, 서열번호 49와 70% 이상 서열 동일성을 가지는 아미노산 서열을 포함하는 것일 수 있다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 68로 기재되는 아미노산 서열을 기준으로 178번 위치에 상응하는 아미노산의 치환을 포함하는 것일 수 있다. 상기 변이체는 서열번호 68과 60% 이상, 예를 들어 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 갖는 것일 수 있다. 예를 들어, 상기 변이체는 서열번호 50의 12번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환되고, 서열번호 50과 70% 이상 서열 동일성을 가지는 아미노산 서열을 포함하는 것일 수 있다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 69로 기재되는 아미노산 서열을 기준으로 207번 위치에 상응하는 아미노산의 치환을 포함하는 것일 수 있다. 상기 변이체는 서열번호 69와 60% 이상, 예를 들어 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 갖는 것일 수 있다. 예를 들어, 상기 변이체는 서열번호 51의 12번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환되고, 서열번호 51과 70% 이상 서열 동일성을 가지는 아미노산 서열을 포함하는 것일 수 있다
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 70으로 기재되는 아미노산 서열을 기준으로 203번 위치에 상응하는 아미노산의 치환을 포함하는 것일 수 있다. 상기 변이체는 서열번호 70과 60% 이상, 예를 들어 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 갖는 것일 수 있다. 예를 들어, 상기 변이체는 서열번호 52의 12번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환되고, 서열번호 52와 70% 이상 서열 동일성을 가지는 아미노산 서열을 포함하는 것일 수 있다
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 71로 기재되는 아미노산 서열을 기준으로 201번 위치에 상응하는 아미노산의 치환을 포함하는 것일 수 있다. 상기 변이체는 서열번호 71과 60% 이상, 예를 들어 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 갖는 것일 수 있다. 예를 들어, 상기 변이체는 서열번호 53의 12번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환되고, 서열번호 53과 70% 이상 서열 동일성을 가지는 아미노산 서열을 포함하는 것일 수 있다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 72로 기재되는 아미노산 서열을 기준으로 201번 위치에 상응하는 아미노산의 치환을 포함하는 것일 수 있다. 상기 변이체는 서열번호 72와 60% 이상, 예를 들어 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 갖는 것일 수 있다. 예를 들어, 상기 변이체는 서열번호 54의 12번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환되고, 서열번호 54와 70% 이상 서열 동일성을 가지는 아미노산 서열을 포함하는 것일 수 있다.
그러나, 이에 제한되지 않는다.
본 출원에서, 용어 "상응하는(corresponding to)"은, 단백질 또는 폴리펩티드에서 열거되는 위치의 아미노산 잔기이거나, 또는 단백질 또는 폴리펩티드에서 열거되는 잔기와 유사하거나 동일하거나 상동한 아미노산 잔기를 지칭한다. 상응하는 위치의 아미노산을 확인하는 것은 특정 서열을 참조하는 서열의 특정 아미노산을 결정하는 것일 수 있다. 본 출원에 사용된 "상응 영역"은 일반적으로 관련 단백질 또는 참조 (reference) 단백질에서의 유사하거나 대응되는 위치를 지칭한다.예를 들어, 임의의 아미노산 서열을 서열번호 31과 정렬(align)하고, 이를 토대로 상기 아미노산 서열의 각 아미노산 잔기는 서열번호 31의 아미노산 잔기와 상응하는 아미노산 잔기의 숫자 위치를 참조하여 넘버링 할 수 있다. 예를 들어, 본 출원에 기재된 것과 같은 서열 정렬 알고리즘은, 쿼리 시퀀스("참조 서열"이라고도 함)와 비교하여 아미노산의 위치, 또는 치환, 삽입 또는 결실 등의 변형이 발생하는 위치를 확인할 수 있다.
이러한 정렬에는 Needleman-Wunsch 알고리즘 (Needleman 및 Wunsch, 1970, J. Mol. Biol. 48: 443-453), EMBOSS 패키지의 Needle 프로그램 (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000), Trends Genet. 16: 276-277) 등을 이용할 수 있으나, 이에 제한되지는 않는다. 또한 다중 서열 정렬(Multiple sequence alignment)을 통해 상응하는 아미노산 잔기를 식별할 수 있다. 당업계에 알려진 다중 서열 정렬 프로그램의 예시로 MUSCLE (multiple sequence comparison by log-expectation; 3.5 버전 이상; Edgar, 2004, Nucleic Acids Research 32: 1792-1797), MAFFT (6.857 버전 이상; Katoh and Kuma, 2002, Nucleic Acids Research 30: 3059-3066; Katoh et al., 2005, Nucleic Acids Research 33: 511-518; Katoh and Toh, 2007, Bioinformatics 23: 372-374; Katoh et al., 2009, Methods in Molecular Biology 537: 39-64; Katoh and Toh, 2010, Bioinformatics 26: 1899-1900) 등의 프로그램 및 ClustalW를 사용하는 EMBOSS EMMA (1.83 이상; Thompson et al., 1994, Nucleic Acids Research 22 : 4673-4680) 등이 있으며, 상기 프로그램 각각의 기본 매개 변수를 사용할 수 있으며, 이에 제한되지는 않는다.
본 출원의 다른 하나의 양태는 상기 세린 프로테아제 변이체를 코딩하는 폴리뉴클레오티드를 제공하는 것이다.
본 출원에서 용어, "폴리뉴클레오티드"는 뉴클레오티드 단위체(monomer)가 공유결합에 의해 길게 사슬모양으로 이어진 뉴클레오티드의 중합체(polymer)로 일정한 길이 이상의 DNA 또는 RNA 가닥으로서, 보다 구체적으로는 상기 변이체를 코딩하는 폴리뉴클레오티드 단편을 의미한다.
본 출원의 세린 프로테아제 변이체를 코딩하는 폴리뉴클레오티드는, 본 출원의 강화된 활성을 갖는 세린 프로테아제 변이체를 코딩하는 폴리뉴클레오티드 서열이라면 제한 없이 포함할 수 있다. 일 구현예로, 본 출원에서 야생형 세린 프로테아제를 코딩하는 유전자는 써모비피다(Thermobifida) 속, 노카르디옵시스(Nocardiopsis) 속, 액티노루기스포라(Actinorugispora) 속, 또는 스핀액티노스포라(Spinactinospora) 속 미생물 유래일 수 있고, 구체적으로 써모비피다 푸스카(Thermobifida fusca), 써모비피다 셀룰로실리티카(Thermobifida cellulosilytica), 써모비피다 할로톨러런스(Thermobifida halotolerans), 액티노루기스포라 엔도피티카(Actinorugispora endophytica), 스핀액티노스포라 알칼리톨러런스(Spinactinospora alkalitolerans), 노카르디옵시스 컴포스타(Nocardiopsis composta), 노카르디옵시스 포텐스(Nocardiopsis potens), 유래일 수 있으나, 이에 제한되지 않는다.
본 출원의 폴리뉴클레오티드는 코돈의 축퇴성(degeneracy)으로 인하여 또는 상기 폴리펩티드를 발현시키고자 하는 생물에서 선호되는 코돈을 고려하여, 폴리펩티드의 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 구체적으로, 서열번호 31 및 49 내지 54 중 선택되는 어느 하나의 아미노산 서열의 N-말단으로부터 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 변이체를 코딩하는 폴리뉴클레오티드 서열이라면 제한 없이 포함할 수 있다.
예를 들어, 본 출원의 폴리뉴클레오티드는 본 출원의 변이체, 구체적으로는 서열번호 32 내지 39 및 서열번호 55 내지 66 중에서 선택되는 어느 하나의 서열번호로 기재되는 아미노산 서열로 이루어진 폴리펩티드 또는 이와 상동성을 가지는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열일 수 있으나, 이에 제한되는 것은 아니다.
일 구현예로, 상기 서열번호 32 내지 39 중에서 선택되는 어느 하나의 서열번호로 기재되는 아미노산 서열로 이루어진 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열은 서열번호 41 내지 48에서 선택되는 어느 하나의 서열번호로 기재되는 폴리뉴클레오티드 서열로 구성된 것일 수 있으나, 이에 제한되는 것은 아니다.
또한, 전술한대로 본 출원의 세린 프로테아제 변이체는 서열번호 31 및 49 내지 54 중 어느 하나의 아미노산 서열을 포함하는 폴리펩티드에서 상기 서열의 12번 및/또는 116번에 상응하는 위치의 아미노산이 치환된 변이체를 포함하므로, 이러한 세린 프로테아제 변이체를 코딩하는 폴리뉴클레오티드 서열 또한 본 출원의 범위에 포함됨은 자명하다.
일 예로, 서열번호 2 및 서열번호 40에서 서열번호 31의 12번 및/또는 116번에 상응하는 위치의 아미노산(서열번호 2에서 163 및/또는 267번째 아미노산, 서열번호 40에서 193 및/또는 297번째 아미노산)이 치환된 변이체 또한 본 출원의 세린 프로테아제의 범위에 포함되므로, 이를 코딩하는 폴리뉴클레오티드 서열 또한 본 출원의 범위에 포함된다. 예를 들어, 상기 세린 프로테아제 변이체를 코딩하는 폴리뉴클레오티드 서열은 서열번호 3 내지 10 중에서 선택되는 어느 하나의 서열번호로 기재되는 아미노산 서열을 코딩하는 것일 수 있으며, 구체적으로는 서열번호 23 내지 30에서 선택되는 어느 하나의 서열번호로 기재되는 폴리뉴클레오티드 서열로 구성된 것일 수 있으나, 이에 제한되지 않는다.
또한 공지의 유전자 서열로부터 조제될 수 있는 프로브, 예를 들면, 상기 염기 서열의 전체 또는 일부에 대한 상보 서열과 엄격한 조건 하에 하이브리드화하여, 서열번호 31 및 49 내지 54 중 선택되는 어느 하나의 N-말단으로부터 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 변이체의 활성을 가지는 단백질을 코딩하는 서열이라면 제한 없이 포함될 수 있다.
상기 "엄격한 조건"이란 폴리뉴클레오티드 간의 특이적 혼성화를 가능하게 하는 조건을 의미한다. 이러한 조건은 공지된 문헌에 구체적으로 기재되어 있다. 예를 들어, 상동성이 높은 유전자끼리, 40% 이상, 구체적으로는 90% 이상, 보다 구체적으로는 95% 이상, 더욱 구체적으로는 97% 이상, 특히 구체적으로는 99% 이상의 상동성을 갖는 유전자끼리 하이브리드화하고, 그보다 상동성이 낮은 유전자끼리 하이브리드화하지 않는 조건, 또는 통상의 써던 하이브리드화의 세척 조건인 60℃, 1X SSC, 0.1% SDS, 구체적으로는 60℃, 0.1X SSC, 0.1% SDS, 보다 구체적으로는 68℃, 0.1X SSC, 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 구체적으로는 2회 내지 3회 세정하는 조건을 열거할 수 있다. 그러나 이에 제한되는 것은 아니며, 그 목적에 따라 당업자에 의해 적절히 조절될 수 있다.
혼성화는 비록 혼성화의 엄격도에 따라 염기 간의 미스매치 (mismatch)가 가능할지라도, 두 개의 폴리뉴클레오티드가 상보적 서열을 가질 것을 요구한다. 용어, "상보적"은 서로 혼성화가 가능한 뉴클레오티드 염기 간의 관계를 기술하는데 사용된다. 예를 들면, DNA에 관하여, 아데노신은 티민에 상보적이며 시토신은 구아닌에 상보적이다. 따라서, 본 출원은 또한 실질적으로 유사한 폴리뉴클레오티드 서열뿐만 아니라 전체 서열에 상보적인 단리된 폴리뉴클레오티드 단편을 포함할 수 있다.
구체적으로, 상동성을 가지는 폴리뉴클레오티드는 55℃의 Tm 값에서 혼성화 단계를 포함하는 혼성화 조건을 사용하고 상술한 조건을 사용하여 탐지할 수 있다. 또한, 상기 Tm 값은 60℃, 63℃ 또는 65℃일 수 있으나, 이에 제한되는 것은 아니고 그 목적에 따라 당업자에 의해 적절히 조절될 수 있다.
폴리뉴클레오티드를 혼성화하는 적절한 엄격도는 폴리뉴클레오티드의 길이 및 상보성 정도에 의존하고 변수는 해당기술분야에 잘 알려져 있다.
본 출원의 다른 하나의 양태는 본 출원의 세린 프로테아제 변이체를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 제공하는 것이다.
본 출원의 용어 "벡터"는 적합한 숙주 내에서 목적 단백질을 발현시킬 수 있도록 적합한 조절 서열에 작동 가능하게 연결된 상기 목적 단백질을 코딩하는 폴리뉴클레오티드의 염기서열을 함유하는 DNA 제조물을 의미한다. 상기 조절 서열은 전사를 개시할 수 있는 프로모터, 그러한 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합부위를 코딩하는 서열, 및 전사 및 해독의 종결을 조절하는 서열을 포함할 수 있다. 벡터는 적당한 숙주세포 내로 형질전환된 후, 숙주 게놈과 무관하게 복제되거나 기능할 수 있으며, 게놈 그 자체에 통합될 수 있다.
상기에서 용어 "작동 가능하게 연결"된 것이란 본 출원의 목적 단백질을 코딩하는 폴리뉴클레오티드의 전사를 개시 및 매개하도록 하는 프로모터 서열과 상기 폴리뉴클레오티드 서열이 기능적으로 연결되어 있는 것을 의미한다. 작동 가능한 연결은 당업계의 공지된 유전자 재조합 기술을 이용하여 제조할 수 있으며, 부위-특이적 DNA 절단 및 연결은 당업계의 절단 및 연결 효소 등을 사용하여 제작할 수 있으나, 이에 제한되지 않는다.
본 출원에서 사용되는 벡터는 특별히 한정되지 않으며, 당업계에 알려진 임의의 벡터를 이용할 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스 및 박테리오파지를 들 수 있다. 예를 들어, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계, pET계 및 pUB110계 등을 사용할 수 있다. 구체적으로는 pDZ, pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC, pSM704 벡터 등을 사용할 수 있다. 본 출원에서 사용 가능한 벡터는 특별히 제한되는 것이 아니며 공지된 발현 벡터를 사용할 수 있다.
일 구현예로, 세포 내 염색체 삽입용 벡터를 통해 염색체 내에 목적 변이체를 코딩하는 폴리뉴클레오티드를 변이된 폴리뉴클레오티드로 교체시킬 수 있다. 상기 폴리뉴클레오티드의 염색체 내로의 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동재조합에 의하여 이루어질 수 있으나, 이에 한정되지는 않는다. 상기 염색체 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 선별 마커는 벡터로 형질전환된 세포를 선별, 즉 목적 핵산 분자의 삽입 여부를 확인하기 위한 것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 변이형 폴리펩티드의 발현과 같은 선택가능 표현형을 부여하는 마커들이 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질전환된 세포를 선별할 수 있다.
본 출원의 다른 하나의 양태는, 본 출원의 세린 프로테아제 변이체; 상기 변이체를 코딩하는 폴리뉴클레오티드; 및 상기 폴리뉴클레오티드를 포함하는 벡터 중 하나 이상을 포함하는 숙주세포를 제공한다.
상기 숙주세포는, 구체적으로, 미생물 일 수 있다.
상기 세린 프로테아제 변이체, 상기 변이체를 코딩하는 폴리뉴클레오티드 및 이를 포함하는 벡터 중 하나 이상을 포함하는 미생물은, 구체적으로 변이체를 코딩하는 폴리뉴클레오티드를 포함하는 벡터로 형질전환되어 제조되는 미생물일 수 있으나, 이에 제한되지 않는다.
상기 미생물은 세린 프로테아제 변이체를 발현하는 미생물 일 수 있다.
본 출원에서 용어, 단백질이 "발현되도록/되는/하는"은 목적 단백질이 미생물 내에 도입되거나, 미생물내에서 발현되도록 변형된 상태를 의미할 수 있다. 본 출원의 목적상 "목적 단백질"은 전술한 세린 프로테아제 변이체일 수 있다.
구체적으로, "단백질의 도입"은, 미생물이 본래 가지고 있지 않았던 특정 단백질의 활성을 나타나게 되는 것 또는 해당 단백질의 내재적 활성 또는 변형 전 활성에 비하여 향상된 활성을 나타나게 되는 것을 의미할 수 있다. 예를 들어, 특정 단백질을 코딩하는 폴리뉴클레오티드가 미생물 내 염색체로 도입되거나, 특정 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터가 미생물 내로 도입되어 이의 활성이 나타나는 것일 수 있다.
본 출원의 미생물은 재조합 미생물일 수 있다. 상기 재조합은 형질전환과 같은 유전적 변형(genetically modification)에 의해 이루어질 수 있다.
본 출원에서 용어 "형질전환"은 표적 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 숙주세포 내에 도입하여 숙주세포 내에서 상기 폴리뉴클레오티드가 코딩하는 단백질이 발현할 수 있도록 하는 것을 의미한다. 형질전환된 폴리뉴클레오티드는 숙주세포 내에서 발현될 수 있기만 한다면, 숙주세포의 염색체 내에 삽입되어 위치하거나 염색체 외에 위치하거나 상관없이 이들 모두를 포함할 수 있다. 또한, 상기 폴리뉴클레오티드는 표적 단백질을 코딩하는 DNA 및 RNA를 포함한다. 상기 폴리뉴클레오티드는 숙주세포 내로 도입되어 발현될 수 있는 것이면, 어떠한 형태로 도입되는 것이든 상관없다. 예를 들면, 상기 폴리뉴클레오티드는 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체인 발현 카세트(expression cassette)의 형태로 숙주세포에 도입될 수 있다. 상기 발현 카세트는 통상 상기 폴리뉴클레오티드에 작동 가능하게 연결되어 있는 프로모터(promoter), 전사 종결신호, 리보좀 결합부위 및 번역 종결신호를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 폴리뉴클레오티드는 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있으며, 이에 한정되지 않는다. 상기 형질전환 하는 방법은 폴리뉴클레오티드를 세포 내로 도입하는 어떤 방법도 포함되며, 숙주세포에 따라 당 분야에서 공지된 바와 같이 적합한 표준 기술을 선택하여 수행할 수 있다. 예를 들어, 전기천공법(electroporation), 인산칼슘(Ca(H2PO4)2, CaHPO4, 또는 Ca3(PO4)2) 침전, 염화칼슘(CaCl2) 침전, 미세주입법(microinjection), 폴리에틸렌글리콜(PEG)법, DEAE-덱스트란법, 양이온 리포좀법, 천연 수용성(natural competence)(예를 들어, 문헌[Perry and Kuramitsu, 1981, Infect. Immun. 32: 1295-1297] 참조) 및 초산 리튬-DMSO법 등이 있으나, 이에 제한되지 않는다.
상기 재조합 미생물은, 본 출원의 세린 프로테아제 활성이 강화된 것일 수 있다.
상기 "활성의 강화"는 미생물이 가진 특정 단백질의 내재적 활성 또는 변형 전 활성에 비하여 활성이 향상된 것을 의미할 수 있다. "내재적 활성"은 자연적, 또는 인위적 요인에 의한 유전적 변이로 미생물의 형질이 변화하는 경우, 형질 변화 전 모균주가 본래 가지고 있던 특정 단백질의 활성을 의미할 수 있다.
구체적으로, 본 출원에서 상기 단백질 변이체의 활성 강화는, 상기 단백질 변이체를 코딩하는 유전자의 세포 내 카피수 증가, 상기 단백질 변이체를 코딩하는 유전자의 발현 조절 서열에 변이를 도입하는 방법, 상기 단백질 변이체를 코딩하는 유전자 발현 조절 서열을 활성이 강력한 서열로 교체하는 방법, 염색체상의 세린 프로테아제 활성을 갖는 자연형 단백질을 코딩하는 유전자를 상기 단백질 변이체를 코딩하는 유전자로 대체하는 방법, 상기 단백질 변이체의 활성이 강화되도록 상기 변이체를 코딩하는 유전자에 변이를 추가적으로 도입시키는 방법 중 어느 하나 이상의 방법으로 이루어질 수 있으나 이에 제한되지 않는다.
다음으로, 폴리뉴클레오티드의 발현이 증가하도록 발현 조절서열을 변형하는 것은, 특별히 이에 제한되지 않으나, 상기 발현 조절서열의 활성을 더욱 강화하도록 핵산 서열을 결실, 삽입, 비보전적 또는 보전적 치환 또는 이들의 조합으로 서열상의 변이를 유도하여 수행하거나, 더욱 강한 활성을 갖는 핵산 서열로 교체함에 의하여 수행될 수 있다. 상기 발현 조절서열은, 특별히 이에 제한되지 않으나, 프로모터, 오퍼레이터 서열, 리보좀 결합부위를 코딩하는 서열, 전사 및 해독의 종결을 조절하는 서열 등을 포함할 수 있다.
상기 폴리뉴클레오티드 발현 단위의 상부에는 본래의 프로모터 대신 강력한 프로모터가 연결될 수 있으며 이에 한정되는 것은 아니다. 공지된 강력한 프로모터의 예에는 cj1 내지 cj7 프로모터(US 7662943 B2), lac 프로모터, trp 프로모터, trc 프로모터, tac 프로모터, 람다 파아지 PR 프로모터, PL 프로모터, tet 프로모터, gapA 프로모터, SPL7 프로모터, SPL13(sm3) 프로모터 (US 10584338 B2), O2 프로모터(US 10273491 B2), tkt 프로모터 및 yccA 프로모터 등이 있으나 이에 한정되는 것은 아니다.
아울러, 염색체상의 폴리뉴클레오티드 서열의 변형은, 특별히 이에 제한되지 않으나, 상기 폴리뉴클레오티드 서열의 활성을 더욱 강화하도록 핵산 서열을 결실, 삽입, 비보전적 또는 보전적 치환 또는 이들의 조합으로 발현 조절서열상의 변이를 유도하여 수행하거나, 더욱 강한 활성을 갖도록 개량된 폴리뉴클레오티드 서열로 교체함에 의하여 수행될 수 있다.
이와 같은 단백질 활성의 도입 및 강화는, 상응하는 단백질의 활성 또는 농도가 야생형이나 비변형 미생물 균주에서의 단백질의 활성 또는 농도를 기준으로 하여 일반적으로 최소 1%, 10%, 25%, 50%, 75%, 100%, 150%, 200%, 300%, 400% 또는 500%, 최대 1000% 또는 2000%까지 증가되는 것일 수 있으나, 이에 제한되는 것은 아니다.
본 출원의 숙주세포 또는 미생물은 본 출원의 폴리뉴클레오티드 또는 본 출원의 벡터를 포함하여 세린 프로테아제 변이체를 발현하는 미생물일 수 있으면 모두 가능하다. 구체적으로, 에스케리키아(Escherichia) 속, 세라티아(Serratia) 속, 어위니아(Erwinia) 속, 엔테로박테리아(Enterobacteria) 속, 프로비덴시아(Providencia) 속, 살모넬라(Salmonella) 속, 스트렙토마이세스(Streptomyces) 속, 슈도모나스(Pseudomonas) 속, 브레비박테리움(Brevibacterium) 속, 코리네박테리움(Corynebacterium) 속 또는 바실러스 속 등의 미생물 균주가 포함될 수 있으며, 구체적으로 바실러스 섭틸리스(Bacillus subtilis), 바실러스 리체니포르미스 (Bacillus licheniformis), 바실러스 아미롤리케파시엔스 (Bacillus amyloliquefaciens), 바실러스 벨레젠시스 (Bacillus velezensis), 대장균(Escherichiacoli), 코리네박테리움 글루타미쿰(Corynebacterum glutamicum), 아스퍼질러스 오리제(Aspergillusoryzae) 등의 균주일 수 있고, 보다 구체적으로는 바실러스 섭틸리스(Bacillus subtilis) 일 수 있으나 이에 제한되지 않는다.
본 출원의 다른 하나의 양태는, 본 출원의 세린 프로테아제 변이체를 제조하는 방법을 제공한다.
본 출원의 변이체를 제조하는 방법은 본 출원의 세린 프로테아제 변이체; 상기 변이체를 코딩하는 폴리뉴클레오티드; 및 상기 폴리뉴클레오티드를 포함하는 벡터 중 1 이상을 포함하는 미생물을 배양하는 단계를 포함하는 것일 수 있다.
본 출원에서, 용어 "배양"은 상기 숙주 세포를 적당히 조절된 환경 조건에서 생육시키는 것을 의미한다. 본 출원의 배양과정은 당업계에 알려진 적당한 배지와 배양조건에 따라 이루어질 수 있다. 이러한 배양 과정은 선택되는 균주에 따라 당업자가 용이하게 조정하여 사용할 수 있다. 구체적으로 상기 배양은 회분식, 연속식 및 유가식일 수 있으나, 이에 제한되는 것은 아니다.
본 출원에서 용어, "배지"는 상기 숙주 세포를 배양하기 위해 필요로 하는 영양물질을 주성분으로 혼합한 물질을 의미하며, 생존 및 발육에 불가결한 물을 비롯하여 영양물질 및 발육인자 등을 공급한다. 구체적으로, 본 출원의 숙주 세포의 배양에 사용되는 배지 및 기타 배양 조건은 통상의 숙주 세포의 배양에 사용되는 배지라면 특별한 제한 없이 어느 것이나 사용할 수 있으나, 본 출원의 숙주 세포를 적당한 탄소원, 질소원, 인원, 무기화합물, 아미노산 및/또는 비타민 등을 함유한 통상의 배지 내에서 호기성 조건 하에서 온도, pH 등을 조절하면서 배양할 수 있다.
일 구현예로, 본 출원의 변이체를 제조하는 방법은 상기 배양단계에서 발현되는 본 출원의 변이체를 회수하는 단계를 더 포함할 수 잇다.
다른 하나의 구체예로, 상기 배양단계에서 발현된 변이체는 본 발명이 속하는 분야에 알려져 있는 방법을 사용하여 회수될 수 있다. 예를 들어, 변이체는 수집, 원심분리, 여과, 추출, 분무-건조, 증발 또는 침전을 포함하나 이들에 한정되지 않는 통상적인 절차에 의해 영양 배지로부터 회수될 수 있다.
상기 회수 방법은 본 출원의 숙주 세포의 배양 방법, 예를 들어 회분식, 연속식 또는 유가식 배양 방법 등에 따라 당해 기술 분야에 공지된 적합한 방법을 이용하여 변이체를 수집(collect)하는 것일 수 있다. 예를 들어, 원심분리, 여과, 결정화 단백질 침전제에 의한 처리(염석법), 추출, 초음파 파쇄, 한외여과, 투석법, 분자체 크로마토그래피(겔여과), 흡착크로마토그래피, 이온교환 크로마토그래피, 친화도 크로마토그래피 등의 각종 크로마토그래피, HPLC 및 이들의 방법을 조합하여 사용될 수 있으며, 당해 분야에 공지된 적합한 방법을 이용하여 배지 또는 숙주 세포로부터 변이체를 회수할 수 있다.
다른 하나의 구체예로, 배양단계에서 숙주 세포에 의해 발현되는 변이체는 회수되지 않을 수 있다. 상기 구체예에서, 변이체를 발현하는 숙주 세포 자체를 변이체의 공급원으로 사용할 수 있다.
본 출원의 다른 하나의 양태는, 본 출원의 세린 프로테아제 변이체; 및 이를 발현하는 미생물 중 하나 이상을 포함하는, 사료용 조성물을 제공한다.
본 출원의 사료용 조성물에 포함되는 세린 프로테아제 변이체는 이를 발현하는 미생물 자체가 포함되거나, 혹은 이를 발현하는 미생물로부터 분리 정제된 형태일 수 있으나 이에 제한되지 않는다.
본 출원의 "사료용 조성물"은 동물이 먹고, 섭취하며, 소화시키기 위한 또는 이에 적당한 임의의 천연 또는 인공 규정식, 한끼식 등 또는 상기 한끼식의 성분으로, 사료는 당업계의 공지된 다양한 형태의 사료로 제조 가능하다.
상기 사료용 조성물은, 사료 첨가제 일 수 있다.
상기 사료의 종류는 특별히 제한되지 아니하며, 당해 기술 분야에서 통상적으로 사용되는 사료를 사용할 수 있다. 상기 사료의 비제한적인 예로는, 곡물류, 근과류, 식품 가공 부산물류, 조류, 섬유질류, 제약 부산물류, 유지류, 전분류, 박 류 또는 곡물 부산물류 등과 같은 식물성 사료; 단백질류, 무기물류, 유지류, 광물성류, 유지류, 단세포 단백질류, 동물성 플랑크톤류 또는 음식물 등과 같은 동물성 사료를 들 수 있다. 이들은 단독으로 사용되거나 2종 이상을 혼합하여 사용될 수 있다.
본 출원의 사료용 조성물은 구연산, 후말산, 아디픽산, 젖산 및 사과산 등과 같은 유기산; 인산나트륨, 인산칼륨, 산성피로인산염, 폴리인산염(중합인산염)등과 같은 인산염; 폴리페놀, 카테킨(catechin), 알파-토코페롤, 로즈메리 추출물(rosemary extract), 비타민 C, 녹차 추출물, 감초 추출물, 키토산, 탄닌산, 피틴산 등과 같은 천연 항산화제;로부터 선택되는 하나 이상을 더 포함할 수 있다.
본 출원의 사료용 조성물은 아미노산, 무기염류, 비타민, 항생물질, 항균물질, 항산화, 항곰팡이 효소 및 다른 생균 형태의 미생물 제제 등과 같은 보조제 성분; 곡물, 예를 들어, 분쇄 또는 파쇄된 밀, 귀리, 보리, 옥수수 및 쌀; 식물성 단백질 사료, 예를 들어, 평지, 콩 및 해바라기를 주성분으로 하는 것; 동물성 단백질 사료, 예를 들어, 혈분, 육분, 골분 및 생선분; 당분 및 유제품, 예를 들어, 각종 분유 및 유장 분말로 이루어지는 건조성분; 지질, 예를 들어, 가열에 의해 임의로 액화시킨 동물성 지방 및 식물성 지방 등과 같은 주성분; 영양보충제, 소화 및 흡수향상제, 성장촉진제, 질병예방제 등과 같은 첨가제;로부터 선택되는 하나 이상을 더 포함할 수 있다.
본 출원의 사료용 조성물은 건조 또는 액체 상태의 제제 형태일 수 있으며, 사료 첨가용 부형제를 포함할 수 있다. 상기 사료 첨가용 부형제로는 예를 들어, 제올라이트, 옥분 또는 미강 등이 있으나, 이에 제한되지 않는다.
본 출원의 사료용 조성물은 상기 세린 프로테아제 변이체 외의 효소 제제를 더 포함할 수 있다. 예를 들어, 리파아제(lipase)와 같은 지방 분해효소, 피틴산(phytic acid)을 분해하여 인산염과 이노시톨인산염을 만드는 파이타제(phytase), 녹말과 글리코겐 등에 포함되어 있는 알파-1,4-글리코시드 결합(α-1,4-glycoside bond)을 가수분해하는 효소인 아밀라제, 유기인산에스테르를 가수분해하는 효소인 포스파타제(phosphatase), 말토오스를 두 분자의 글루코스로 가수분해하는 말타제 및 사카로스를 가수분해하여 글루코스-프룩토스 혼합물을 만드는 전환효소 등으로부터 선택되는 하나 이상을 더 포함할 수 있다. 그러나 이에 제한되지 않는다.
본 출원의 사료용 조성물은 동물에게 단독으로 투여되거나 식용 담체 중에서 다른 사료 첨가제와 조합되어 투여될 수 있다. 또한, 상기 사료용 조성물은 사료 첨가제로서, 탑 드레싱으로서 또는 이들을 가축 사료에 직접 혼합하거나 또는 사료와 별도로, 별도의 경구 제형으로, 또는 다른 성분과 조합하여 쉽게 투여할 수 있다. 또한 당해 기술분야에서 통상적으로 알려진 바와 같이 단독 일일 섭취량 또는 분할 일일 섭취량을 사용할 수 있다.
본 출원의 사료용 조성물이 사용될 수 있는 동물은 예를 들어 식용우, 젖소, 송아지, 돼지, 돼지새끼, 양, 염소, 말, 토끼, 개, 고양이 등과 같은 가축, 병아리, 알닭, 가정용 닭, 수탉, 오리, 거위, 칠면조, 메추라기, 작은새 등과 같은 가금류를 포함하나, 이에 제한되지 않는다.
본 출원의 사료용 조성물에 포함되는 본 출원의 세린 프로테아제 변이체의 양은 특별히 한정되지 않고 그 목적에 따라 적절히 조절할 수 있다. 일 구현예로, 본 출원이 속하는 기술분야에서 통상적으로 알려진 바와 같이 가축의 소화관에서 장기간 생존하면서 단백질원 물질을 분해하기에 적합한 양으로 포함될 수 있으나 이에 제한되지 않는다.
본 출원의 다른 하나의 양태는, 본 출원의 세린 프로테아제 변이체; 및 이를 발현하는 미생물 중 하나 이상을 포함하는, 식품 조성물을 제공한다. 상기 프로테아제 단백질은 액체 또는 고체 형태의 식품 조성물에 사용이 가능할 수 있다. 또한, 상기 식품은 분말, 환, 음료, 차 또는 일반 식품의 첨가물일 수 있다.
일 구현예로, 상기 식품은 유제품, 배변용 또는 다이어트용 건강기능식품, 고혈압 예방용 기능성 건강기능식품 등 프로테아제를 필요로 하는 식품군일 수 있다.
다른 구현예로, 상기 프로테아제 변이체는 다양한 식품 조성물에 포함되어 식품의 가용화 또는 연화제, 육질 개질제로서 사용될 수 있다. 그 밖에 다양한 구현예로서, 제빵 과정에 첨가되어, 글루텐 망을 파괴하는 단계에서 사용될 수 있다. 또는, 식품 단백질(예를 들어, 우유 중의 단백질)을 가수분해하는데 사용될 수 있다. 또는, 렌더링, 향료 제조, 쓴맛 저감, 에멀젼화 특성 변화, 생체활성(bioactive) 펩타이드 생성, 단백질의 알레르기 유발 항원 감소 등의 용도로서 다양한 식품 조성물에 포함되어 사용 될 수 있으나, 이는 일 예시로, 전술한 용도에 제한되지 않는다.
상기 식품 조성물 내의 세린 프로테아제 변이체의 양은, 목적하는 바에 따라 당업자가 적절히 조절할 수 있다.
본 출원의 다른 하나의 양태는 본 출원의 세린 프로테아제 변이체; 및 이를 발현하는 미생물 중 하나 이상을 포함하는, 세제 조성물을 제공한다.
본 출원에 따른 세제 조성물은 1부 및 2부 수성 세제 조성물, 비수성 액체 세제 조성물, 성형 고체(cast solid), 과립 형태, 입자 형태, 압축 정제, 겔, 페이스트 또는 슬러리 형태일 수 있다. 상기 세제 조성물은 음식물의 찌든 때, 음식물 잔류막 및 기타 소량의 식품 조성물 제거에 이용 될 수 있다.
본 출원에 따른 세제 조성물은 단단한 표면을 세정하는 세제 조성물, 직물을 세정하는 세제 조성물, 설거지용 세제 조성물, 구강 세정용 세제 조성물, 의치 세정용 세제 또는 콘택트 렌즈 세정 용액과 같은 형태로 제공될 수 있다. 그러나 이에 제한되지 않는다.
본 출원의 다른 하나의 양태는 본 출원의 세린 프로테아제 변이체; 및 이를 발현하는 미생물 중 하나 이상을 포함하는, 약학 조성물을 제공한다.
본 출원의 약학 조성물은, 소화기의 질환, 소화 이상, 소화기 수술 후의 비정상적 질환을 개선하기 위한 소화 효소용 약학적 조성물, 혈전에 직접 작용하여 피브린을 용해시키는 혈전 용해제 내지는 항혈전용 조성물, 생체내 방어 시스템으로서 작용하여 염증성 물질 또는 괴사 조직을 제거하는 소염제 또는 수술 또는 외상후 부종을 경감시키기 위한 소염제로서의 용도를 포함한다.
상기 약학적 조성물은, 사용방법 및 사용목적에 따라 약제학적으로 허용되거나 영양학적으로 허용되는 담체, 부형제, 희석제 또는 부성분을 추가로 포함할 수 있다. 상기 담체, 부형제 또는 희석제는 락토스, 덱스트로스, 수크로스, 솔비톨, 만니톨, 자이리톨, 에리스리톨, 말티톨, 전분, 아키시아 고무, 알지네이트, 젤라틴, 칼슘 포스페이트, 칼슘 실리케이트, 셀룰로오스, 메틸 셀룰로오스, 미정질 셀루로오스, 폴리비닐 피롤리돈, 물, 메틸하이드록시벤조에이트, 프로필하이드록시벤조에이트, 탈크, 마그네슘 스테아레이트 및 광물유, 덱스트린, 칼슘카보네이드, 프로필렌글리콜, 리퀴드 파라핀, 생리식염수로 이루어진 군에서 선택된 1 이상일 수 있으나, 이에 한정되는 것은 아니다.
본 출원의 세린 프로테아제 변이체 또는 이를 발현하는 미생물은, 전술한 용도 외에도 예를 들어 화장품, 피혁 가공, 약제, 진단제, 폐기물 관리 및 학술 연구용 화학제 제조 등의 용도로 사용될 수 있다. 다만 상기 용도는 일 예시이며, 그 밖에 당업계에 알려진 단백질성 물질의 변성, 분해 또는 제거와 관련된 임의의 용도로 사용 될 수 있다.
본 출원의 세린 프로테아제 변이체는 기존 세린 프로테아제에 비해 우수한 활성을 가지므로 산업적으로 유용하게 이용될 수 있다.
도 1은 써모비피다 푸스카 유래 세린 프로테아제 변이체의 3차 구조에서 변이가 도입된 잔기의 위치를 나타낸 것이다.
이하 본 출원을 실시예 및 실험예를 통하여 보다 상세하게 설명한다. 그러나 이들 실시예 및 실험예는 본 출원을 예시적으로 설명하기 위한 것으로 본 출원의 범위가 이들 실시예 및 실험예에 한정되는 것은 아니다.
실시예 1. Thermobifida fusca 유래 세린 프로테아제 변이체 선별
실시예 1-1: Thermobifida fusca 유래 세린 프로테아제 라이브러리 제작
Thermobifida fusca 유래 세린 프로테아제의 mature region에 해당하는 아미노산(서열번호 31)을 암호화하는 유전자에 error-prone PCR을 통해 랜덤 변이를 도입하였다. Error prone PCR은 Diversify™ PCR Random Mutagenesis Kit (Clontech, Cat# 630703)을 사용하였으며, PCR 조건은 [표1]과 같다. 하기 조건으로 진행 시, 6.2mutations/Kb의 빈도로 변이가 삽입됨을 확인하였다.
조성 함량 비고
주형 DNA 0.5ng 서열번호 1
프라이머_정방향 5uM 서열번호 11
프라이머_역방향 5uM 서열번호 12
10X Titanium Taq buffer 5uL
MnSO4 640uM
dGTP 40uM
50X Diversify dNTP mix 1uL
50X dNTP mix 1uL
Titanium Taq Polymerase 1uL
Total 50uL Adjust to 50ul with DW
PCR 조건
I. 94 ℃ 30sec II, III 50사이클 반복
II. 94 ℃ 30sec
III. 68 ℃ 1min
IV. 68 ℃ 1min
V. 4 ℃
상기 과정을 통해 얻은 PCR fragment는 [표2]에 표기한 프라이머를 이용하여 증폭한 벡터에 In-FusionR HD cloning kit (clontech)을 이용하여 라이게이션한 후, DH5α에 형질전환하여 콜로니를 획득하였다. 획득한 콜로니로부터 플라스미드를 정제하여 약 5*104 사이즈의 라이브러리를 확보하였다.
주형 DNA(pBE-S-TAP) 서열번호 1
프라이머_정방향 서열번호 13
프라이머_역방향 서열번호 14
실시예 1-2: Thermobifida fusca 유래 세린 프로테아제 라이브러리 스크리닝
실시예 1-1에서 제작된 프로테아제 라이브러리를 단백질 분비가 용이한 바실러스 서브틸리스(Bacillus subtilis) LB700 균주에 형질전환하여 스크리닝을 진행하였다. 스크리닝은 총 2단계에 걸쳐서 진행하였다. 1단계는 라이브러리를 형질전환한 바실러스 서브틸리스 균주를 2% 스킴밀크 플레이트에 도말한 후, 형성된 halo 사이즈를 기준으로 선별하는 방식이다. 바실러스 서브틸리스 형질전환은 Groningen method를 따라서 진행하였고, 스크리닝에 사용한 스킴밀크 플레이트 조성은 [표3]과 같다.
조성 함량 비고
M9 minimal salts 11.28 g BD, cat#248510
Agar 20 g
Skim milk 20 g BD, cat#232100
50%Glucose 20 g
1M MgSO4 2 mM
1M CaCl2 0.1mM
Kanamycin 50ug/ml
(1L 기준)
2단계는 1단계에서 1차적으로 선별된 콜로니를 Azocasein 발색을 통해 선별하는 방식이다. 96 deep well 플레이트에 카나마이신 항생제가 포함된 BHI(Brain Heart Infusion, bd, cat#53286) 액체배지를 넣고, 1단계에서 선별된 콜로니를 접종하여 37℃, 20-24시간 배양하였다. 배양 후, 원심분리를 통해 효소가 포함되어 있는 상등액을 얻고, 상등액과 기질인 2%(w/v) Azocasein을 동량으로 섞은 후, 37℃에서 1시간 반응을 진행하였다. 효소 반응액에 10% TCA(Trichloro acetic acid)를 3배 볼륨으로 첨가하여 반응을 중단시키고, 원심분리를 통해 응고된 단백질을 제거하였다. NaOH를 동량으로 섞어 발색반응을 진행 후, 440nm에서 흡광을 측정함으로써 발색 정도를 비교하였다. 이 과정을 통해 야생형 세린 프로테아제 대비 흡광도가 150% 이상 증가된 콜로니를 선별하였다.
실시예 2. 선별된 변이체 제조 및 활성 평가
실시예 2-1: 변이체 제작
스크리닝을 통해서 선별된 변이체의 시퀀스 분석결과 서열번호 31의 12번째 아미노산(페닐알라닌, Phe), 116번째 아미노산(아스파라긴, Asn)이 각각 타이로신(Tyr), 아스파테이트(Asp)으로 치환되어 있음을 최종적으로 확인하였다. [도 1]에는 상기 변이의 위치를 표시하였다. 선별된 변이 2종(F12, N116)은 site directed mutagenesis를 통해서 pBE-S-TAP 플라스미드에 단독변이 형태로 재도입한 후, double 변이 및 single 변이 형태의 활성을 야생형의 활성과 비교 평가하였다. 변이체 제작시 사용한 프라이머는 [표4]와 같다.
TAP_F12Y_F  서열번호 15
TAP_F12Y_R  서열번호 16
TAP_N116D_F  서열번호 17
TAP_N116D_R  서열번호 18
실시예 2-2: 활성평가
상기 제작된 플라스미드를 바실러스 서브틸리스 LB700 균주에 형질전환 하여 발현시킨 후, N-SUCCINYL-ALA-ALA-PRO-PHE-P-NITROANILIDE(Sigma, cat#S7388, 이하 SUC-AAPF-pNA로 표기) 펩타이드를 기질로 하여 활성평가를 진행하였다. 형질전환 된 바실러스 서브틸리스 균주를 카나마이신 항생제가 포함된 BHI 배지에 접종하여 37℃에서 20-24시간 배양 후, 세포를 제외하고 배양액 일부를 25mM Tris-HCl(pH7.5) buffer, 1mM Suc-AAPF-pNA와 섞은 후, 37℃에서 30분간 반응하였다. 상기의 반응액은 410nm에서 흡광을 측정하였다. 효소 생성물인 para-nitroaniline의 문헌에 알려진 extinction coefficient는 410nm에서 8,800M-1cm-1이며, 이를 토대로 효소의 유닛을 환산하였다(Barrett, A. J., Cathepsin G. Methods Enzymol., 80, Pt. C, 561-565, (1981)). 측정된 활성은 [표5]와 같다.
효소활성 (unit/ml)
야생형 16.3
F12Y 34.0
F12YN116D 63.8
측정 결과, pH7.5, 37℃ 조건에서 야생형 대비 F12Y, F12YN116D 변이 각각 약 2.1배, 3.9배 활성이 증가된 것을 확인할 수 있었다.
실시예 2-3: 열안정성 평가
변이체 도입시 열안정성에 미치는 영향을 확인하기 위하여 다음과 같은 실험을 진행하였다.
구체적으로, 실시예 2-2에서 활성평가를 진행한 동일 샘플을 상온, 70℃, 80℃, 90℃의 온도 조건에서 각각 5분간 정치 후, 효소 활성을 측정하였다. 측정된 활성은 [표6]과 같다.
효소활성 (unit/ml)
열처리 조건 RT, 5분 70℃, 5분 80℃, 5분 90℃, 5분
야생형 16.3 15.9 10.6 0.3
F12Y 34.0 34.7 22.8 0.1
F12YN116D 63.8 63.3 41.7 0.1
측정 결과, F12Y, F12YN116D 변이는 80℃에서도 야생형 대비 각각 약 2배 및 약 4배의 효소 활성을 유지하는 것을 확인하였다. 이를 통해, 본 출원의 세린 프로테아제 변이체는 고온에서도 활성이 높게 유지되는 것을 확인하였는 바, 산업적으로 유용하게 사용 될 수 있다.
실시예 3. 포화 변이 라이브러리(Saturation mutagenesis library) 제작 및 선별
실시예 3-1. F12, N116 잔기 포화 변이 라이브러리 제작
앞서 선별한 변이체인 F12, N116 잔기를 타이로신, 아스파테이트 이외의 다른 잔기로 치환하여 활성에 미치는 영향을 확인하고자 2개의 잔기에 대하여 포화 변이 라이브러리를 제작하였다.
pBE-S-TAP를 주형으로 서열번호 11 및 12, 서열번호 13 및 14 프라이머를 각각 이용하여 두 개의 PCR fragment를 얻었고, In-Fusion HD cloning kit를 이용하여 라이게이션한 후, DH5α에 형질전환하여 콜로니를 획득하였다. 획득한 콜로니로부터 플라스미드를 정제하여 약 4x103 사이즈의 라이브러리를 확보하였다.
주형 DNA(pBE-S-TAP) 서열번호 1
Saturation mutagenesis_F_1 서열번호 19
Saturation mutagenesis_R_1 서열번호 20
Saturation mutagenesis_F_2 서열번호 21
Saturation mutagenesis_R_2 서열번호 22
실시예 3-2: 포화 변이 라이브러리 스크리닝 및 활성 평가
실시예 3-1에서 제작된 포화 변이 라이브러리는 실시예 1-2에서 언급한 것과 동일한 방법으로 스크리닝을 진행하였다. 스크리닝을 통해 F12YN116D 변이체 대비 활성이 동등 또는 증가한 변이체를 선별하였고, 이 변이체들에 대해 서열 분석 및 Suc-AAPF-pNA를 기질로 하여 활성 평가를 진행하였다.
효소활성 (unit/ml)
야생형 23.52
F12YN116D 65
F12YN116S 77.35
F12SN116D 61.75
F12SN116T 117.65
F12AN116G 94.9
F12A 94.25
F12R 58.5
확인 결과, F12, N116 잔기는 실시예 2에서 확인한 타이로신, 아스파테이트 이외에도 F12S, F12A, F12R, N116S, N116T, N116G 등의 다른 아미노산으로 치환되어도 활성이 증가하는 결과를 보였다.
실시예 4. Thermobifida fusca 유래 세린 프로테아제 유사 단백질의 12번, 116번 잔기 영향성 확인
실시예 4-1: 야생형 및 변이체 제작
서열번호 31번과 서열 상동성을 갖는 다른 세린 프로테아제에서도 서열번호 31의 12번, 116번에 상응하는 아미노산 잔기가 활성 증가에 영향을 미치는지 확인하기 위해, 각각 87.2%, 81.8%, 81.3%, 73.8%, 69.9%, 66.7% 의 서열 상동성을 갖는 세린 프로테아제의 12번, 116번 잔기를 타이로신(Y), 아스파테이트(D)로 치환한 후, 야생형과 활성을 비교하였다. 각 세린 프로테아제의 유래 및 서열 정보는 [표9]와 같다.
유래 서열번호 서열번호 31과 상동성 (%) 서열번호 54와 상동성(%)
Thermobifida fusca 서열번호 31 - 66.7
Thermobifida cellulosilytica 서열번호 49 87.2 65.1
Thermobifida halotolerans 서열번호 50 81.8 61.3
Actinorugispora endophytica 서열번호 51 81.3 64
Spinactinospora alkalitolerans 서열번호 52 73.8 75.4
Nocardiopsis composta 서열번호 53 69.9 86.6
Nocardiopsis potens 서열번호 54 66.7 -
각 세린 프로테아제의 12번, 116번 잔기를 타이로신(Y)과 아스파테이트(D)로 치환하여, 서열 번호 55번-66번의 변이체를 제작하였다.
실시예 4-2: 활성평가
상기 제작된 플라스미드를 바실러스 서브틸리스 LB700 균주에 형질전환하여 발현 시킨 후, 실시예 2-2에서 언급한 활성 측정법과 동일한 방법으로 활성평가를 진행하였다. 측정된 활성은 [표10]과 같다.
유래 변이형 activity
(U/ml)
Thermobifida cellulosilytica WT 13.6
F12Y 16.3
F12YN116D 29.1
Thermobifida halotolerans WT 4.0
F12Y 6.3
Actinorugispora endophytica WT 10.4
F12Y 14.0
Spinactinospora alkalitolerans WT 2.0
P12Y 2.6
Nocardiopsis composta WT 12.1
P12Y 26.5
Nocardiopsis potens WT 33.1
P12Y 86.3
측정 결과, Thermobifida fusca 유래 세린 프로테아제와 마찬가지로 이와 서열 상동성을 갖는 6종의 단백질 역시, 12번 잔기에 변이 도입 시 활성이 증가함을 확인하였다.
이를 통해 12번, 116번 잔기는 세린 프로테아제 효소 활성에 중요한 잔기이며, 서열번호 31을 통해 확인한 바와 마찬가지로 이를 다른 아미노산으로 치환함으로써 효소활성을 증가시킬 수 있음을 확인하였는 바, 본 출원의 세린 프로테아제 변이체는 효소활성이 증가되어 산업적으로 유용하게 사용될 수 있다.
이상의 설명으로부터, 본 출원이 속하는 기술분야의 당업자는 본 출원이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 출원의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 출원의 범위에 포함되는 것으로 해석되어야 한다.
<110> CJ CheilJedang Corporation <120> A novel serine protease variant <130> KPA210177-KR <160> 72 <170> KoPatentIn 3.0 <210> 1 <211> 6922 <212> DNA <213> Artificial Sequence <220> <223> pBE-S-TFP <400> 1 actagtgttc ttttctgtat gaaaatagtt atttcgagtc tctacggaaa tagcgagaga 60 tgatatacct aaatagagat aaaatcatct caaaaaaatg ggtctactaa aatattattc 120 catctattac aataaattca cagaatagtc ttttaagtaa gtctactctg aacttaagca 180 aaaggagagg gacgcgtgtg agaagcaaaa aattgtggat cagcttgttg tttgcgttaa 240 cgttaatctt tacgatggcg ttcagcaaca tgtctgcgca ggctgcggcc ggtgcacata 300 tgcaagagct ggcgttgaaa cgggacctcg gcctctctga cgcagaagta gccgaactcc 360 gggctgctga ggcggaagcg gtcgagctcg aggaggagct ccgcgattca ttagggtcag 420 acttcggcgg tgtatatctg gatgctgaca ccaccgaaat tacggtcgcg gtaaccgacc 480 cggcagcggt aagtcgtgtc gacgcggatg atgtcacagt tgatgttgtc gatttcgggg 540 aaacagcttt gaatgatttt gtggcttcat taaatgccat tgccgacacg gcagacccta 600 aagtcactgg atggtatacc gatctcgaaa gtgatgccgt agtcattacg accttgcgtg 660 gcgggactcc tgctgccgag gaacttgctg agagagcggg tctcgacgaa agagccgttc 720 ggattgtgga agaagatgaa gaaccacaga gcttggctgc aattattggt ggaaacccgt 780 actatttcgg aaattacaga tgcagtatcg ggtttagtgt ccgtcagggc tctcaaacgg 840 gattcgcgac cgcaggccac tgcggatcca cggggacgcg tgtgtcttct ccttcaggaa 900 cagttgcagg aagttatttc ccgggtcgcg atatgggctg ggtgcggatt acatcagcag 960 atactgtaac accactcgta aatcggtata atgggggaac tgttacggtc actgggtcac 1020 aagaagctgc caccggatcc tccgtttgtc gctctggagc aacaacgggc tggcgctgcg 1080 gaactatcca atcaaaaaac caaacggttc gctatgcaga agggactgtt actggtttaa 1140 caagaactac agcctgtgct gaaggtgggg attctggagg gccatggctc acaggtagcc 1200 aggcgcaagg ggttacaagc ggcggaacag gcgattgcag aagtggaggg attacctttt 1260 tccaaccaat caatccattg cttagctatt tcggccttca attagtgacc ggctgaaagc 1320 ttgtcgacct gcagtctaga catcaccatc atcaccacta atgcggtagt ttatcacagt 1380 taaattgcta acgcagtcag gcaccgtgta tgaaatctaa caatgcgctc atcgtcatcc 1440 tcggcaccgt caccctggat gctgtaggca taggcttggt tatgccggta ctgccgggcc 1500 tatttcactt tttgcattct acaaactgca taactattat gtaaatcgct cctttttagg 1560 tggcacaaat gtgaggcatt ttcgctcttt ccggcaacca cttccaagta aagtataaca 1620 cactatactt tatattcata aagtgtgtgc tctgcgaggc tgtcggcagt gccgaccaaa 1680 accataaaac ctttaagacc tttctttttt ttacgagaaa aaagaaacaa aaaaacctgc 1740 cctctgccac ctcagcaaag gggggttttg ctctcgtgct cgtttaaaaa tcagcaaggg 1800 acaggtagta ttttttgaga agatcactca aaaaatctcc acctttaaac ccttgccaat 1860 ttttattttg tccgttttgt ctagcttacc gaaagccaga ctcagcaaga ataaaatttt 1920 tattgtcttt cggttttcta gtgtaacgga caaaaccact caaaataaaa aagatacaag 1980 agaggtctct cgtatctttt attcagcaat cgcgcccgat tgctgaacag attaataata 2040 gattttagct ttttatttgt tgaaaaaagc taatcaaatt gttgtcggga tcaattactg 2100 caaagtctcg ttcatcccac cactgatctt ttaatgatgt attggggtgc aaaatgccca 2160 aaggcttaat atgttgatat aattcatcaa ttccctctac ttcaatgcgg caactagcag 2220 taccagcaat aaacgactcc gcacctgtac aaaccggtga atcattacta cgagagcgcc 2280 agccttcatc acttgcctcc catagatgaa tccgaacctc attacacatt agaactgcga 2340 atccatcttc atggtgaacc aaagtgaaac ctagtttatc gcaataaaaa cctatactct 2400 ttttaatatc cccgactggc aatgccggga tagactgtaa cattctcacg cataaaatcc 2460 cctttcattt tctaatgtaa atctattacc ttattattaa ttcaattcgc tcataattaa 2520 tcctttttct tattacgcaa aatggcccga tttaagcaca ccctttattc cgttaatgcg 2580 ccatgacagc catgataatt actaatacta ggagaagtta ataaatacga gcaaaaggcc 2640 agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 2700 cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 2760 tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 2820 tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 2880 gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 2940 acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 3000 acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 3060 cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 3120 gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 3180 gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 3240 agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 3300 ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 3360 ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 3420 atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 3480 tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 3540 gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 3600 ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 3660 caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 3720 cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 3780 cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 3840 cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 3900 agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 3960 tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 4020 agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 4080 atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 4140 ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 4200 cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 4260 caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 4320 attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 4380 agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct 4440 aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc 4500 gtctcgcgcg tttcggtgat gacggtgaaa acctctgaca gtaaccaaca tgattaacaa 4560 ttattagagg tcatcgttca aaatggtatg cgttttgaca catccactat atatccgtgt 4620 cgttctgtcc actcctgaat cccattccag aaattctcta gcgattccag aagtttctca 4680 gagtcggaaa gttgaccaga cattacgaac tggcacagat ggtcataacc tgaaggaaga 4740 tctgattgct taactgcttc agttaagacc gaagcgctcg tcgtataaca gatgcgatga 4800 tgcagaccaa tcaacatggc acctgccatt gctacctgta cagtcaagga tggtagaaat 4860 gttgtcggtc cttgcacacg aatattacgc catttgcctg catattcaaa cagctcttct 4920 acgataaggg cacaaatcgc atcgtggaac gtttgggctt ctaccgattt agcagtttga 4980 tacactttct ctaagtatcc acctgaatca taaatcggca aaatagagaa aaattgacca 5040 tgtgtaagcg gccaatctga ttccacctga gatgcataat ctagtagaat ctcttcgcta 5100 tcaaaattca cttccacctt ccactcaccg gttgtccatt catggctgaa ctctgcttcc 5160 tctgttgaca tgacacacat catctcaata tccgaatagg gcccatcagt ctgacgacca 5220 agagagccat aaacaccaat agccttaaca tcatccccat atttatccaa tattcgttcc 5280 ttaatttcat gaacaatctt cattctttct tctctagtca ttattattgg tccattcact 5340 attctcattc ccttttcaga taattttaga tttgcttttc taaataagaa tatttggaga 5400 gcaccgttct tattcagcta ttaataactc gtcttcctaa gcatccttca atccttttaa 5460 taacaattat agcatctaat cttcaacaaa ctggcccgtt tgttgaacta ctctttaata 5520 aaataatttt tccgttccca attccacatt gcaataatag aaaatccatc ttcatcggct 5580 ttttcgtcat catctgtatg aatcaaatcg ccttcttctg tgtcatcaag gtttaatttt 5640 ttatgtattt cttttaacaa accaccatag gagattaacc ttttacggtg taaaccttcc 5700 tccaaatcag acaaacgttt caaattcttt tcttcatcat cggtcataaa atccgtatcc 5760 tttacaggat attttgcagt ttcgtcaatt gccgattgta tatccgattt atatttattt 5820 ttcggtcgaa tcatttgaac ttttacattt ggatcatagt ctaatttcat tgcctttttc 5880 caaaattgaa tccattgttt ttgattcacg tagttttctg tattcttaaa ataagttggt 5940 tccacacata ccaatacatg catgtgctga ttataagaat tatctttatt atttattgtc 6000 acttccgttg cacgcataaa accaacaaga tttttattaa tttttttata ttgcatcatt 6060 cggcgaaatc cttgagccat atctgacaaa ctcttattta attcttcgcc atcataaaca 6120 tttttaactg ttaatgtgag aaacaaccaa cgaactgttg gcttttgttt aataacttca 6180 gcaacaacct tttgtgactg aatgccatgt ttcattgctc tcctccagtt gcacattgga 6240 caaagcctgg atttacaaaa ccacactcga tacaactttc tttcgcctgt ttcacgattt 6300 tgtttatact ctaatatttc agcacaatct tttactcttt cagccttttt aaattcaaga 6360 atatgcagaa gttcaaagta atcaacatta gcgattttct tttctctcca tggtctcact 6420 tttccacttt ttgtcttgtc cactaaaacc cttgattttt catctgaata aatgctacta 6480 ttaggacaca taatattaaa agaaaccccc atctatttag ttatttgttt agtcacttat 6540 aactttaaca gatggggttt ttctgtgcaa ccaattttaa gggttttcaa tactttaaaa 6600 cacatacata ccaacacttc aacgcacctt tcagcaacta aaataaaaat gacgttattt 6660 ctatatgtat caagataaga aagaacaagt tcaaaaccat caaaaaaaga caccttttca 6720 ggtgcttttt ttattttata aactcattcc ctgatctcga cttcgttctt tttttacctc 6780 tcggttatga gttagttcaa attcgttctt tttaggttct aaatcgtgtt tttcttggaa 6840 ttgtgctgtt ttatccttta ccttgtctac aaacccctta aaaacgtttt taaaggcttt 6900 taagccgtct gtacgttcct aa 6922 <210> 2 <211> 338 <212> PRT <213> Unknown <220> <223> Thermobifida fusca <400> 2 Met Gln Glu Leu Ala Leu Lys Arg Asp Leu Gly Leu Ser Asp Ala Glu 1 5 10 15 Val Ala Glu Leu Arg Ala Ala Glu Ala Glu Ala Val Glu Leu Glu Glu 20 25 30 Glu Leu Arg Asp Ser Leu Gly Ser Asp Phe Gly Gly Val Tyr Leu Asp 35 40 45 Ala Asp Thr Thr Glu Ile Thr Val Ala Val Thr Asp Pro Ala Ala Val 50 55 60 Ser Arg Val Asp Ala Asp Asp Val Thr Val Asp Val Val Asp Phe Gly 65 70 75 80 Glu Thr Ala Leu Asn Asp Phe Val Ala Ser Leu Asn Ala Ile Ala Asp 85 90 95 Thr Ala Asp Pro Lys Val Thr Gly Trp Tyr Thr Asp Leu Glu Ser Asp 100 105 110 Ala Val Val Ile Thr Thr Leu Arg Gly Gly Thr Pro Ala Ala Glu Glu 115 120 125 Leu Ala Glu Arg Ala Gly Leu Asp Glu Arg Ala Val Arg Ile Val Glu 130 135 140 Glu Asp Glu Glu Pro Gln Ser Leu Ala Ala Ile Ile Gly Gly Asn Pro 145 150 155 160 Tyr Tyr Phe Gly Asn Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Gln 165 170 175 Gly Ser Gln Thr Gly Phe Ala Thr Ala Gly His Cys Gly Ser Thr Gly 180 185 190 Thr Arg Val Ser Ser Pro Ser Gly Thr Val Ala Gly Ser Tyr Phe Pro 195 200 205 Gly Arg Asp Met Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr 210 215 220 Pro Leu Val Asn Arg Tyr Asn Gly Gly Thr Val Thr Val Thr Gly Ser 225 230 235 240 Gln Glu Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ala Thr Thr 245 250 255 Gly Trp Arg Cys Gly Thr Ile Gln Ser Lys Asn Gln Thr Val Arg Tyr 260 265 270 Ala Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu 275 280 285 Gly Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Ala Gln Gly 290 295 300 Val Thr Ser Gly Gly Thr Gly Asp Cys Arg Ser Gly Gly Ile Thr Phe 305 310 315 320 Phe Gln Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu Gln Leu Val 325 330 335 Thr Gly <210> 3 <211> 338 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida fusca (F163Y) <400> 3 Met Gln Glu Leu Ala Leu Lys Arg Asp Leu Gly Leu Ser Asp Ala Glu 1 5 10 15 Val Ala Glu Leu Arg Ala Ala Glu Ala Glu Ala Val Glu Leu Glu Glu 20 25 30 Glu Leu Arg Asp Ser Leu Gly Ser Asp Phe Gly Gly Val Tyr Leu Asp 35 40 45 Ala Asp Thr Thr Glu Ile Thr Val Ala Val Thr Asp Pro Ala Ala Val 50 55 60 Ser Arg Val Asp Ala Asp Asp Val Thr Val Asp Val Val Asp Phe Gly 65 70 75 80 Glu Thr Ala Leu Asn Asp Phe Val Ala Ser Leu Asn Ala Ile Ala Asp 85 90 95 Thr Ala Asp Pro Lys Val Thr Gly Trp Tyr Thr Asp Leu Glu Ser Asp 100 105 110 Ala Val Val Ile Thr Thr Leu Arg Gly Gly Thr Pro Ala Ala Glu Glu 115 120 125 Leu Ala Glu Arg Ala Gly Leu Asp Glu Arg Ala Val Arg Ile Val Glu 130 135 140 Glu Asp Glu Glu Pro Gln Ser Leu Ala Ala Ile Ile Gly Gly Asn Pro 145 150 155 160 Tyr Tyr Tyr Gly Asn Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Gln 165 170 175 Gly Ser Gln Thr Gly Phe Ala Thr Ala Gly His Cys Gly Ser Thr Gly 180 185 190 Thr Arg Val Ser Ser Pro Ser Gly Thr Val Ala Gly Ser Tyr Phe Pro 195 200 205 Gly Arg Asp Met Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr 210 215 220 Pro Leu Val Asn Arg Tyr Asn Gly Gly Thr Val Thr Val Thr Gly Ser 225 230 235 240 Gln Glu Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ala Thr Thr 245 250 255 Gly Trp Arg Cys Gly Thr Ile Gln Ser Lys Asn Gln Thr Val Arg Tyr 260 265 270 Ala Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu 275 280 285 Gly Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Ala Gln Gly 290 295 300 Val Thr Ser Gly Gly Thr Gly Asp Cys Arg Ser Gly Gly Ile Thr Phe 305 310 315 320 Phe Gln Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu Gln Leu Val 325 330 335 Thr Gly <210> 4 <211> 338 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida fusca (F163Y_N267D) <400> 4 Met Gln Glu Leu Ala Leu Lys Arg Asp Leu Gly Leu Ser Asp Ala Glu 1 5 10 15 Val Ala Glu Leu Arg Ala Ala Glu Ala Glu Ala Val Glu Leu Glu Glu 20 25 30 Glu Leu Arg Asp Ser Leu Gly Ser Asp Phe Gly Gly Val Tyr Leu Asp 35 40 45 Ala Asp Thr Thr Glu Ile Thr Val Ala Val Thr Asp Pro Ala Ala Val 50 55 60 Ser Arg Val Asp Ala Asp Asp Val Thr Val Asp Val Val Asp Phe Gly 65 70 75 80 Glu Thr Ala Leu Asn Asp Phe Val Ala Ser Leu Asn Ala Ile Ala Asp 85 90 95 Thr Ala Asp Pro Lys Val Thr Gly Trp Tyr Thr Asp Leu Glu Ser Asp 100 105 110 Ala Val Val Ile Thr Thr Leu Arg Gly Gly Thr Pro Ala Ala Glu Glu 115 120 125 Leu Ala Glu Arg Ala Gly Leu Asp Glu Arg Ala Val Arg Ile Val Glu 130 135 140 Glu Asp Glu Glu Pro Gln Ser Leu Ala Ala Ile Ile Gly Gly Asn Pro 145 150 155 160 Tyr Tyr Tyr Gly Asn Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Gln 165 170 175 Gly Ser Gln Thr Gly Phe Ala Thr Ala Gly His Cys Gly Ser Thr Gly 180 185 190 Thr Arg Val Ser Ser Pro Ser Gly Thr Val Ala Gly Ser Tyr Phe Pro 195 200 205 Gly Arg Asp Met Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr 210 215 220 Pro Leu Val Asn Arg Tyr Asn Gly Gly Thr Val Thr Val Thr Gly Ser 225 230 235 240 Gln Glu Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ala Thr Thr 245 250 255 Gly Trp Arg Cys Gly Thr Ile Gln Ser Lys Asp Gln Thr Val Arg Tyr 260 265 270 Ala Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu 275 280 285 Gly Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Ala Gln Gly 290 295 300 Val Thr Ser Gly Gly Thr Gly Asp Cys Arg Ser Gly Gly Ile Thr Phe 305 310 315 320 Phe Gln Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu Gln Leu Val 325 330 335 Thr Gly <210> 5 <211> 338 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida fusca (F163Y_N267S) <400> 5 Met Gln Glu Leu Ala Leu Lys Arg Asp Leu Gly Leu Ser Asp Ala Glu 1 5 10 15 Val Ala Glu Leu Arg Ala Ala Glu Ala Glu Ala Val Glu Leu Glu Glu 20 25 30 Glu Leu Arg Asp Ser Leu Gly Ser Asp Phe Gly Gly Val Tyr Leu Asp 35 40 45 Ala Asp Thr Thr Glu Ile Thr Val Ala Val Thr Asp Pro Ala Ala Val 50 55 60 Ser Arg Val Asp Ala Asp Asp Val Thr Val Asp Val Val Asp Phe Gly 65 70 75 80 Glu Thr Ala Leu Asn Asp Phe Val Ala Ser Leu Asn Ala Ile Ala Asp 85 90 95 Thr Ala Asp Pro Lys Val Thr Gly Trp Tyr Thr Asp Leu Glu Ser Asp 100 105 110 Ala Val Val Ile Thr Thr Leu Arg Gly Gly Thr Pro Ala Ala Glu Glu 115 120 125 Leu Ala Glu Arg Ala Gly Leu Asp Glu Arg Ala Val Arg Ile Val Glu 130 135 140 Glu Asp Glu Glu Pro Gln Ser Leu Ala Ala Ile Ile Gly Gly Asn Pro 145 150 155 160 Tyr Tyr Tyr Gly Asn Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Gln 165 170 175 Gly Ser Gln Thr Gly Phe Ala Thr Ala Gly His Cys Gly Ser Thr Gly 180 185 190 Thr Arg Val Ser Ser Pro Ser Gly Thr Val Ala Gly Ser Tyr Phe Pro 195 200 205 Gly Arg Asp Met Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr 210 215 220 Pro Leu Val Asn Arg Tyr Asn Gly Gly Thr Val Thr Val Thr Gly Ser 225 230 235 240 Gln Glu Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ala Thr Thr 245 250 255 Gly Trp Arg Cys Gly Thr Ile Gln Ser Lys Ser Gln Thr Val Arg Tyr 260 265 270 Ala Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu 275 280 285 Gly Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Ala Gln Gly 290 295 300 Val Thr Ser Gly Gly Thr Gly Asp Cys Arg Ser Gly Gly Ile Thr Phe 305 310 315 320 Phe Gln Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu Gln Leu Val 325 330 335 Thr Gly <210> 6 <211> 338 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida fusca (F163S_N267D) <400> 6 Met Gln Glu Leu Ala Leu Lys Arg Asp Leu Gly Leu Ser Asp Ala Glu 1 5 10 15 Val Ala Glu Leu Arg Ala Ala Glu Ala Glu Ala Val Glu Leu Glu Glu 20 25 30 Glu Leu Arg Asp Ser Leu Gly Ser Asp Phe Gly Gly Val Tyr Leu Asp 35 40 45 Ala Asp Thr Thr Glu Ile Thr Val Ala Val Thr Asp Pro Ala Ala Val 50 55 60 Ser Arg Val Asp Ala Asp Asp Val Thr Val Asp Val Val Asp Phe Gly 65 70 75 80 Glu Thr Ala Leu Asn Asp Phe Val Ala Ser Leu Asn Ala Ile Ala Asp 85 90 95 Thr Ala Asp Pro Lys Val Thr Gly Trp Tyr Thr Asp Leu Glu Ser Asp 100 105 110 Ala Val Val Ile Thr Thr Leu Arg Gly Gly Thr Pro Ala Ala Glu Glu 115 120 125 Leu Ala Glu Arg Ala Gly Leu Asp Glu Arg Ala Val Arg Ile Val Glu 130 135 140 Glu Asp Glu Glu Pro Gln Ser Leu Ala Ala Ile Ile Gly Gly Asn Pro 145 150 155 160 Tyr Tyr Ser Gly Asn Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Gln 165 170 175 Gly Ser Gln Thr Gly Phe Ala Thr Ala Gly His Cys Gly Ser Thr Gly 180 185 190 Thr Arg Val Ser Ser Pro Ser Gly Thr Val Ala Gly Ser Tyr Phe Pro 195 200 205 Gly Arg Asp Met Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr 210 215 220 Pro Leu Val Asn Arg Tyr Asn Gly Gly Thr Val Thr Val Thr Gly Ser 225 230 235 240 Gln Glu Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ala Thr Thr 245 250 255 Gly Trp Arg Cys Gly Thr Ile Gln Ser Lys Asp Gln Thr Val Arg Tyr 260 265 270 Ala Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu 275 280 285 Gly Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Ala Gln Gly 290 295 300 Val Thr Ser Gly Gly Thr Gly Asp Cys Arg Ser Gly Gly Ile Thr Phe 305 310 315 320 Phe Gln Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu Gln Leu Val 325 330 335 Thr Gly <210> 7 <211> 338 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida fusca (F163S_N267T) <400> 7 Met Gln Glu Leu Ala Leu Lys Arg Asp Leu Gly Leu Ser Asp Ala Glu 1 5 10 15 Val Ala Glu Leu Arg Ala Ala Glu Ala Glu Ala Val Glu Leu Glu Glu 20 25 30 Glu Leu Arg Asp Ser Leu Gly Ser Asp Phe Gly Gly Val Tyr Leu Asp 35 40 45 Ala Asp Thr Thr Glu Ile Thr Val Ala Val Thr Asp Pro Ala Ala Val 50 55 60 Ser Arg Val Asp Ala Asp Asp Val Thr Val Asp Val Val Asp Phe Gly 65 70 75 80 Glu Thr Ala Leu Asn Asp Phe Val Ala Ser Leu Asn Ala Ile Ala Asp 85 90 95 Thr Ala Asp Pro Lys Val Thr Gly Trp Tyr Thr Asp Leu Glu Ser Asp 100 105 110 Ala Val Val Ile Thr Thr Leu Arg Gly Gly Thr Pro Ala Ala Glu Glu 115 120 125 Leu Ala Glu Arg Ala Gly Leu Asp Glu Arg Ala Val Arg Ile Val Glu 130 135 140 Glu Asp Glu Glu Pro Gln Ser Leu Ala Ala Ile Ile Gly Gly Asn Pro 145 150 155 160 Tyr Tyr Ser Gly Asn Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Gln 165 170 175 Gly Ser Gln Thr Gly Phe Ala Thr Ala Gly His Cys Gly Ser Thr Gly 180 185 190 Thr Arg Val Ser Ser Pro Ser Gly Thr Val Ala Gly Ser Tyr Phe Pro 195 200 205 Gly Arg Asp Met Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr 210 215 220 Pro Leu Val Asn Arg Tyr Asn Gly Gly Thr Val Thr Val Thr Gly Ser 225 230 235 240 Gln Glu Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ala Thr Thr 245 250 255 Gly Trp Arg Cys Gly Thr Ile Gln Ser Lys Thr Gln Thr Val Arg Tyr 260 265 270 Ala Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu 275 280 285 Gly Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Ala Gln Gly 290 295 300 Val Thr Ser Gly Gly Thr Gly Asp Cys Arg Ser Gly Gly Ile Thr Phe 305 310 315 320 Phe Gln Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu Gln Leu Val 325 330 335 Thr Gly <210> 8 <211> 338 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida fusca (F163A_N267G) <400> 8 Met Gln Glu Leu Ala Leu Lys Arg Asp Leu Gly Leu Ser Asp Ala Glu 1 5 10 15 Val Ala Glu Leu Arg Ala Ala Glu Ala Glu Ala Val Glu Leu Glu Glu 20 25 30 Glu Leu Arg Asp Ser Leu Gly Ser Asp Phe Gly Gly Val Tyr Leu Asp 35 40 45 Ala Asp Thr Thr Glu Ile Thr Val Ala Val Thr Asp Pro Ala Ala Val 50 55 60 Ser Arg Val Asp Ala Asp Asp Val Thr Val Asp Val Val Asp Phe Gly 65 70 75 80 Glu Thr Ala Leu Asn Asp Phe Val Ala Ser Leu Asn Ala Ile Ala Asp 85 90 95 Thr Ala Asp Pro Lys Val Thr Gly Trp Tyr Thr Asp Leu Glu Ser Asp 100 105 110 Ala Val Val Ile Thr Thr Leu Arg Gly Gly Thr Pro Ala Ala Glu Glu 115 120 125 Leu Ala Glu Arg Ala Gly Leu Asp Glu Arg Ala Val Arg Ile Val Glu 130 135 140 Glu Asp Glu Glu Pro Gln Ser Leu Ala Ala Ile Ile Gly Gly Asn Pro 145 150 155 160 Tyr Tyr Ala Gly Asn Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Gln 165 170 175 Gly Ser Gln Thr Gly Phe Ala Thr Ala Gly His Cys Gly Ser Thr Gly 180 185 190 Thr Arg Val Ser Ser Pro Ser Gly Thr Val Ala Gly Ser Tyr Phe Pro 195 200 205 Gly Arg Asp Met Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr 210 215 220 Pro Leu Val Asn Arg Tyr Asn Gly Gly Thr Val Thr Val Thr Gly Ser 225 230 235 240 Gln Glu Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ala Thr Thr 245 250 255 Gly Trp Arg Cys Gly Thr Ile Gln Ser Lys Gly Gln Thr Val Arg Tyr 260 265 270 Ala Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu 275 280 285 Gly Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Ala Gln Gly 290 295 300 Val Thr Ser Gly Gly Thr Gly Asp Cys Arg Ser Gly Gly Ile Thr Phe 305 310 315 320 Phe Gln Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu Gln Leu Val 325 330 335 Thr Gly <210> 9 <211> 338 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida fusca (F163A) <400> 9 Met Gln Glu Leu Ala Leu Lys Arg Asp Leu Gly Leu Ser Asp Ala Glu 1 5 10 15 Val Ala Glu Leu Arg Ala Ala Glu Ala Glu Ala Val Glu Leu Glu Glu 20 25 30 Glu Leu Arg Asp Ser Leu Gly Ser Asp Phe Gly Gly Val Tyr Leu Asp 35 40 45 Ala Asp Thr Thr Glu Ile Thr Val Ala Val Thr Asp Pro Ala Ala Val 50 55 60 Ser Arg Val Asp Ala Asp Asp Val Thr Val Asp Val Val Asp Phe Gly 65 70 75 80 Glu Thr Ala Leu Asn Asp Phe Val Ala Ser Leu Asn Ala Ile Ala Asp 85 90 95 Thr Ala Asp Pro Lys Val Thr Gly Trp Tyr Thr Asp Leu Glu Ser Asp 100 105 110 Ala Val Val Ile Thr Thr Leu Arg Gly Gly Thr Pro Ala Ala Glu Glu 115 120 125 Leu Ala Glu Arg Ala Gly Leu Asp Glu Arg Ala Val Arg Ile Val Glu 130 135 140 Glu Asp Glu Glu Pro Gln Ser Leu Ala Ala Ile Ile Gly Gly Asn Pro 145 150 155 160 Tyr Tyr Ala Gly Asn Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Gln 165 170 175 Gly Ser Gln Thr Gly Phe Ala Thr Ala Gly His Cys Gly Ser Thr Gly 180 185 190 Thr Arg Val Ser Ser Pro Ser Gly Thr Val Ala Gly Ser Tyr Phe Pro 195 200 205 Gly Arg Asp Met Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr 210 215 220 Pro Leu Val Asn Arg Tyr Asn Gly Gly Thr Val Thr Val Thr Gly Ser 225 230 235 240 Gln Glu Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ala Thr Thr 245 250 255 Gly Trp Arg Cys Gly Thr Ile Gln Ser Lys Asn Gln Thr Val Arg Tyr 260 265 270 Ala Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu 275 280 285 Gly Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Ala Gln Gly 290 295 300 Val Thr Ser Gly Gly Thr Gly Asp Cys Arg Ser Gly Gly Ile Thr Phe 305 310 315 320 Phe Gln Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu Gln Leu Val 325 330 335 Thr Gly <210> 10 <211> 338 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida fusca (F163R) <400> 10 Met Gln Glu Leu Ala Leu Lys Arg Asp Leu Gly Leu Ser Asp Ala Glu 1 5 10 15 Val Ala Glu Leu Arg Ala Ala Glu Ala Glu Ala Val Glu Leu Glu Glu 20 25 30 Glu Leu Arg Asp Ser Leu Gly Ser Asp Phe Gly Gly Val Tyr Leu Asp 35 40 45 Ala Asp Thr Thr Glu Ile Thr Val Ala Val Thr Asp Pro Ala Ala Val 50 55 60 Ser Arg Val Asp Ala Asp Asp Val Thr Val Asp Val Val Asp Phe Gly 65 70 75 80 Glu Thr Ala Leu Asn Asp Phe Val Ala Ser Leu Asn Ala Ile Ala Asp 85 90 95 Thr Ala Asp Pro Lys Val Thr Gly Trp Tyr Thr Asp Leu Glu Ser Asp 100 105 110 Ala Val Val Ile Thr Thr Leu Arg Gly Gly Thr Pro Ala Ala Glu Glu 115 120 125 Leu Ala Glu Arg Ala Gly Leu Asp Glu Arg Ala Val Arg Ile Val Glu 130 135 140 Glu Asp Glu Glu Pro Gln Ser Leu Ala Ala Ile Ile Gly Gly Asn Pro 145 150 155 160 Tyr Tyr Arg Gly Asn Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Gln 165 170 175 Gly Ser Gln Thr Gly Phe Ala Thr Ala Gly His Cys Gly Ser Thr Gly 180 185 190 Thr Arg Val Ser Ser Pro Ser Gly Thr Val Ala Gly Ser Tyr Phe Pro 195 200 205 Gly Arg Asp Met Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr 210 215 220 Pro Leu Val Asn Arg Tyr Asn Gly Gly Thr Val Thr Val Thr Gly Ser 225 230 235 240 Gln Glu Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ala Thr Thr 245 250 255 Gly Trp Arg Cys Gly Thr Ile Gln Ser Lys Asn Gln Thr Val Arg Tyr 260 265 270 Ala Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu 275 280 285 Gly Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Ala Gln Gly 290 295 300 Val Thr Ser Gly Gly Thr Gly Asp Cys Arg Ser Gly Gly Ile Thr Phe 305 310 315 320 Phe Gln Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu Gln Leu Val 325 330 335 Thr Gly <210> 11 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> TAP_mature region_F <400> 11 aagaagatga agaaccacag agcttggctg caattattgg tggaaac 47 <210> 12 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> TAP_mature region_R <400> 12 gactgcaggt cgacaagctt tcagccggtc actaattgaa ggcc 44 <210> 13 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> pBE-S-vector-F <400> 13 aagcttgtcg acctgcagtc tag 23 <210> 14 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> pBE-S-vector-R <400> 14 ctgtggttct tcatcttctt ccac 24 <210> 15 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> TAP_F12Y_F <400> 15 gtggaaaccc gtactattac ggaaattaca gatgcag 37 <210> 16 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> TAP_F12Y_R <400> 16 ctgcatctgt aatttccgta atagtacggg tttccac 37 <210> 17 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> TAP_N116D_F <400> 17 ggaactatcc aatcaaaaga ccaaacggtt cgctatgc 38 <210> 18 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> TAP_N116D_R <400> 18 gcatagcgaa ccgtttggtc ttttgattgg atagttcc 38 <210> 19 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Saturation mutagenesis_F_1 <400> 19 gtggaaaccc gtactatnnn ggaaattaca gatgcag 37 <210> 20 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Saturation mutagenesis_R_1 <400> 20 gcatagcgaa ccgtttgnnn ttttgattgg atagttcc 38 <210> 21 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Saturation mutagenesis_F_2 <400> 21 ggaactatcc aatcaaaann ncaaacggtt cgctatgc 38 <210> 22 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Saturation mutagenesis_R_2 <400> 22 ctgcatctgt aatttccnnn atagtacggg tttccac 37 <210> 23 <211> 1017 <212> DNA <213> Artificial Sequence <220> <223> Thermobifida fusca (F12Y) <400> 23 atgcaagagc tggcgttgaa acgggacctc ggcctctctg acgcagaagt agccgaactc 60 cgggctgctg aggcggaagc ggtcgagctc gaggaggagc tccgcgattc attagggtca 120 gacttcggcg gtgtatatct ggatgctgac accaccgaaa ttacggtcgc ggtaaccgac 180 ccggcagcgg taagtcgtgt cgacgcggat gatgtcacag ttgatgttgt cgatttcggg 240 gaaacagctt tgaatgattt tgtggcttca ttaaatgcca ttgccgacac ggcagaccct 300 aaagtcactg gatggtatac cgatctcgaa agtgatgccg tagtcattac gaccttgcgt 360 ggcgggactc ctgctgccga ggaacttgct gagagagcgg gtctcgacga aagagccgtt 420 cggattgtgg aagaagatga agaaccacag agcttggctg caattattgg tggaaacccg 480 tactattacg gaaattacag atgcagtatc gggtttagtg tccgtcaggg ctctcaaacg 540 ggattcgcga ccgcaggcca ctgcggatcc acggggacgc gtgtgtcttc tccttcagga 600 acagttgcag gaagttattt cccgggtcgc gatatgggct gggtgcggat tacatcagca 660 gatactgtaa caccactcgt aaatcggtat aatgggggaa ctgttacggt cactgggtca 720 caagaagctg ccaccggatc ctccgtttgt cgctctggag caacaacggg ctggcgctgc 780 ggaactatcc aatcaaaaaa ccaaacggtt cgctatgcag aagggactgt tactggttta 840 acaagaacta cagcctgtgc tgaaggtggg gattctggag ggccatggct cacaggtagc 900 caggcgcaag gggttacaag cggcggaaca ggcgattgca gaagtggagg gattaccttt 960 ttccaaccaa tcaatccatt gcttagctat ttcggccttc aattagtgac cggctga 1017 <210> 24 <211> 1017 <212> DNA <213> Artificial Sequence <220> <223> Thermobifida fusca (F163Y_N267D) <400> 24 atgcaagagc tggcgttgaa acgggacctc ggcctctctg acgcagaagt agccgaactc 60 cgggctgctg aggcggaagc ggtcgagctc gaggaggagc tccgcgattc attagggtca 120 gacttcggcg gtgtatatct ggatgctgac accaccgaaa ttacggtcgc ggtaaccgac 180 ccggcagcgg taagtcgtgt cgacgcggat gatgtcacag ttgatgttgt cgatttcggg 240 gaaacagctt tgaatgattt tgtggcttca ttaaatgcca ttgccgacac ggcagaccct 300 aaagtcactg gatggtatac cgatctcgaa agtgatgccg tagtcattac gaccttgcgt 360 ggcgggactc ctgctgccga ggaacttgct gagagagcgg gtctcgacga aagagccgtt 420 cggattgtgg aagaagatga agaaccacag agcttggctg caattattgg tggaaacccg 480 tactattacg gaaattacag atgcagtatc gggtttagtg tccgtcaggg ctctcaaacg 540 ggattcgcga ccgcaggcca ctgcggatcc acggggacgc gtgtgtcttc tccttcagga 600 acagttgcag gaagttattt cccgggtcgc gatatgggct gggtgcggat tacatcagca 660 gatactgtaa caccactcgt aaatcggtat aatgggggaa ctgttacggt cactgggtca 720 caagaagctg ccaccggatc ctccgtttgt cgctctggag caacaacggg ctggcgctgc 780 ggaactatcc aatcaaaaga ccaaacggtt cgctatgcag aagggactgt tactggttta 840 acaagaacta cagcctgtgc tgaaggtggg gattctggag ggccatggct cacaggtagc 900 caggcgcaag gggttacaag cggcggaaca ggcgattgca gaagtggagg gattaccttt 960 ttccaaccaa tcaatccatt gcttagctat ttcggccttc aattagtgac cggctga 1017 <210> 25 <211> 1017 <212> DNA <213> Artificial Sequence <220> <223> Thermobifida fusca (F163Y_N267S) <400> 25 atgcaagagc tggcgttgaa acgggacctc ggcctctctg acgcagaagt agccgaactc 60 cgggctgctg aggcggaagc ggtcgagctc gaggaggagc tccgcgattc attagggtca 120 gacttcggcg gtgtatatct ggatgctgac accaccgaaa ttacggtcgc ggtaaccgac 180 ccggcagcgg taagtcgtgt cgacgcggat gatgtcacag ttgatgttgt cgatttcggg 240 gaaacagctt tgaatgattt tgtggcttca ttaaatgcca ttgccgacac ggcagaccct 300 aaagtcactg gatggtatac cgatctcgaa agtgatgccg tagtcattac gaccttgcgt 360 ggcgggactc ctgctgccga ggaacttgct gagagagcgg gtctcgacga aagagccgtt 420 cggattgtgg aagaagatga agaaccacag agcttggctg caattattgg tggaaacccg 480 tactattacg gaaattacag atgcagtatc gggtttagtg tccgtcaggg ctctcaaacg 540 ggattcgcga ccgcaggcca ctgcggatcc acggggacgc gtgtgtcttc tccttcagga 600 acagttgcag gaagttattt cccgggtcgc gatatgggct gggtgcggat tacatcagca 660 gatactgtaa caccactcgt aaatcggtat aatgggggaa ctgttacggt cactgggtca 720 caagaagctg ccaccggatc ctccgtttgt cgctctggag caacaacggg ctggcgctgc 780 ggaactatcc aatcaaaaag tcaaacggtt cgctatgcag aagggactgt tactggttta 840 acaagaacta cagcctgtgc tgaaggtggg gattctggag ggccatggct cacaggtagc 900 caggcgcaag gggttacaag cggcggaaca ggcgattgca gaagtggagg gattaccttt 960 ttccaaccaa tcaatccatt gcttagctat ttcggccttc aattagtgac cggctga 1017 <210> 26 <211> 1017 <212> DNA <213> Artificial Sequence <220> <223> Thermobifida fusca (F163S_N267D) <400> 26 atgcaagagc tggcgttgaa acgggacctc ggcctctctg acgcagaagt agccgaactc 60 cgggctgctg aggcggaagc ggtcgagctc gaggaggagc tccgcgattc attagggtca 120 gacttcggcg gtgtatatct ggatgctgac accaccgaaa ttacggtcgc ggtaaccgac 180 ccggcagcgg taagtcgtgt cgacgcggat gatgtcacag ttgatgttgt cgatttcggg 240 gaaacagctt tgaatgattt tgtggcttca ttaaatgcca ttgccgacac ggcagaccct 300 aaagtcactg gatggtatac cgatctcgaa agtgatgccg tagtcattac gaccttgcgt 360 ggcgggactc ctgctgccga ggaacttgct gagagagcgg gtctcgacga aagagccgtt 420 cggattgtgg aagaagatga agaaccacag agcttggctg caattattgg tggaaacccg 480 tactatagtg gaaattacag atgcagtatc gggtttagtg tccgtcaggg ctctcaaacg 540 ggattcgcga ccgcaggcca ctgcggatcc acggggacgc gtgtgtcttc tccttcagga 600 acagttgcag gaagttattt cccgggtcgc gatatgggct gggtgcggat tacatcagca 660 gatactgtaa caccactcgt aaatcggtat aatgggggaa ctgttacggt cactgggtca 720 caagaagctg ccaccggatc ctccgtttgt cgctctggag caacaacggg ctggcgctgc 780 ggaactatcc aatcaaaaga tcaaacggtt cgctatgcag aagggactgt tactggttta 840 acaagaacta cagcctgtgc tgaaggtggg gattctggag ggccatggct cacaggtagc 900 caggcgcaag gggttacaag cggcggaaca ggcgattgca gaagtggagg gattaccttt 960 ttccaaccaa tcaatccatt gcttagctat ttcggccttc aattagtgac cggctga 1017 <210> 27 <211> 1017 <212> DNA <213> Artificial Sequence <220> <223> Thermobifida fusca (F163S_N267T) <400> 27 atgcaagagc tggcgttgaa acgggacctc ggcctctctg acgcagaagt agccgaactc 60 cgggctgctg aggcggaagc ggtcgagctc gaggaggagc tccgcgattc attagggtca 120 gacttcggcg gtgtatatct ggatgctgac accaccgaaa ttacggtcgc ggtaaccgac 180 ccggcagcgg taagtcgtgt cgacgcggat gatgtcacag ttgatgttgt cgatttcggg 240 gaaacagctt tgaatgattt tgtggcttca ttaaatgcca ttgccgacac ggcagaccct 300 aaagtcactg gatggtatac cgatctcgaa agtgatgccg tagtcattac gaccttgcgt 360 ggcgggactc ctgctgccga ggaacttgct gagagagcgg gtctcgacga aagagccgtt 420 cggattgtgg aagaagatga agaaccacag agcttggctg caattattgg tggaaacccg 480 tactatagtg gaaattacag atgcagtatc gggtttagtg tccgtcaggg ctctcaaacg 540 ggattcgcga ccgcaggcca ctgcggatcc acggggacgc gtgtgtcttc tccttcagga 600 acagttgcag gaagttattt cccgggtcgc gatatgggct gggtgcggat tacatcagca 660 gatactgtaa caccactcgt aaatcggtat aatgggggaa ctgttacggt cactgggtca 720 caagaagctg ccaccggatc ctccgtttgt cgctctggag caacaacggg ctggcgctgc 780 ggaactatcc aatcaaaaac tcaaacggtt cgctatgcag aagggactgt tactggttta 840 acaagaacta cagcctgtgc tgaaggtggg gattctggag ggccatggct cacaggtagc 900 caggcgcaag gggttacaag cggcggaaca ggcgattgca gaagtggagg gattaccttt 960 ttccaaccaa tcaatccatt gcttagctat ttcggccttc aattagtgac cggctga 1017 <210> 28 <211> 1017 <212> DNA <213> Artificial Sequence <220> <223> Thermobifida fusca (F163A_N267G) <400> 28 atgcaagagc tggcgttgaa acgggacctc ggcctctctg acgcagaagt agccgaactc 60 cgggctgctg aggcggaagc ggtcgagctc gaggaggagc tccgcgattc attagggtca 120 gacttcggcg gtgtatatct ggatgctgac accaccgaaa ttacggtcgc ggtaaccgac 180 ccggcagcgg taagtcgtgt cgacgcggat gatgtcacag ttgatgttgt cgatttcggg 240 gaaacagctt tgaatgattt tgtggcttca ttaaatgcca ttgccgacac ggcagaccct 300 aaagtcactg gatggtatac cgatctcgaa agtgatgccg tagtcattac gaccttgcgt 360 ggcgggactc ctgctgccga ggaacttgct gagagagcgg gtctcgacga aagagccgtt 420 cggattgtgg aagaagatga agaaccacag agcttggctg caattattgg tggaaacccg 480 tactatgctg gaaattacag atgcagtatc gggtttagtg tccgtcaggg ctctcaaacg 540 ggattcgcga ccgcaggcca ctgcggatcc acggggacgc gtgtgtcttc tccttcagga 600 acagttgcag gaagttattt cccgggtcgc gatatgggct gggtgcggat tacatcagca 660 gatactgtaa caccactcgt aaatcggtat aatgggggaa ctgttacggt cactgggtca 720 caagaagctg ccaccggatc ctccgtttgt cgctctggag caacaacggg ctggcgctgc 780 ggaactatcc aatcaaaagg tcaaacggtt cgctatgcag aagggactgt tactggttta 840 acaagaacta cagcctgtgc tgaaggtggg gattctggag ggccatggct cacaggtagc 900 caggcgcaag gggttacaag cggcggaaca ggcgattgca gaagtggagg gattaccttt 960 ttccaaccaa tcaatccatt gcttagctat ttcggccttc aattagtgac cggctga 1017 <210> 29 <211> 1017 <212> DNA <213> Artificial Sequence <220> <223> Thermobifida fusca (F163A) <400> 29 atgcaagagc tggcgttgaa acgggacctc ggcctctctg acgcagaagt agccgaactc 60 cgggctgctg aggcggaagc ggtcgagctc gaggaggagc tccgcgattc attagggtca 120 gacttcggcg gtgtatatct ggatgctgac accaccgaaa ttacggtcgc ggtaaccgac 180 ccggcagcgg taagtcgtgt cgacgcggat gatgtcacag ttgatgttgt cgatttcggg 240 gaaacagctt tgaatgattt tgtggcttca ttaaatgcca ttgccgacac ggcagaccct 300 aaagtcactg gatggtatac cgatctcgaa agtgatgccg tagtcattac gaccttgcgt 360 ggcgggactc ctgctgccga ggaacttgct gagagagcgg gtctcgacga aagagccgtt 420 cggattgtgg aagaagatga agaaccacag agcttggctg caattattgg tggaaacccg 480 tactatgctg gaaattacag atgcagtatc gggtttagtg tccgtcaggg ctctcaaacg 540 ggattcgcga ccgcaggcca ctgcggatcc acggggacgc gtgtgtcttc tccttcagga 600 acagttgcag gaagttattt cccgggtcgc gatatgggct gggtgcggat tacatcagca 660 gatactgtaa caccactcgt aaatcggtat aatgggggaa ctgttacggt cactgggtca 720 caagaagctg ccaccggatc ctccgtttgt cgctctggag caacaacggg ctggcgctgc 780 ggaactatcc aatcaaaaaa tcaaacggtt cgctatgcag aagggactgt tactggttta 840 acaagaacta cagcctgtgc tgaaggtggg gattctggag ggccatggct cacaggtagc 900 caggcgcaag gggttacaag cggcggaaca ggcgattgca gaagtggagg gattaccttt 960 ttccaaccaa tcaatccatt gcttagctat ttcggccttc aattagtgac cggctga 1017 <210> 30 <211> 1017 <212> DNA <213> Artificial Sequence <220> <223> Thermobifida fusca (F163R) <400> 30 atgcaagagc tggcgttgaa acgggacctc ggcctctctg acgcagaagt agccgaactc 60 cgggctgctg aggcggaagc ggtcgagctc gaggaggagc tccgcgattc attagggtca 120 gacttcggcg gtgtatatct ggatgctgac accaccgaaa ttacggtcgc ggtaaccgac 180 ccggcagcgg taagtcgtgt cgacgcggat gatgtcacag ttgatgttgt cgatttcggg 240 gaaacagctt tgaatgattt tgtggcttca ttaaatgcca ttgccgacac ggcagaccct 300 aaagtcactg gatggtatac cgatctcgaa agtgatgccg tagtcattac gaccttgcgt 360 ggcgggactc ctgctgccga ggaacttgct gagagagcgg gtctcgacga aagagccgtt 420 cggattgtgg aagaagatga agaaccacag agcttggctg caattattgg tggaaacccg 480 tactatagag gaaattacag atgcagtatc gggtttagtg tccgtcaggg ctctcaaacg 540 ggattcgcga ccgcaggcca ctgcggatcc acggggacgc gtgtgtcttc tccttcagga 600 acagttgcag gaagttattt cccgggtcgc gatatgggct gggtgcggat tacatcagca 660 gatactgtaa caccactcgt aaatcggtat aatgggggaa ctgttacggt cactgggtca 720 caagaagctg ccaccggatc ctccgtttgt cgctctggag caacaacggg ctggcgctgc 780 ggaactatcc aatcaaaaaa tcaaacggtt cgctatgcag aagggactgt tactggttta 840 acaagaacta cagcctgtgc tgaaggtggg gattctggag ggccatggct cacaggtagc 900 caggcgcaag gggttacaag cggcggaaca ggcgattgca gaagtggagg gattaccttt 960 ttccaaccaa tcaatccatt gcttagctat ttcggccttc aattagtgac cggctga 1017 <210> 31 <211> 187 <212> PRT <213> Unknown <220> <223> Thermobifida fusca_mature region <400> 31 Leu Ala Ala Ile Ile Gly Gly Asn Pro Tyr Tyr Phe Gly Asn Tyr Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Arg Gln Gly Ser Gln Thr Gly Phe Ala 20 25 30 Thr Ala Gly His Cys Gly Ser Thr Gly Thr Arg Val Ser Ser Pro Ser 35 40 45 Gly Thr Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val 50 55 60 Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn 65 70 75 80 Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Ala Thr Gly Ser 85 90 95 Ser Val Cys Arg Ser Gly Ala Thr Thr Gly Trp Arg Cys Gly Thr Ile 100 105 110 Gln Ser Lys Asn Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly 115 120 125 Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro 130 135 140 Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Thr Gly 145 150 155 160 Asp Cys Arg Ser Gly Gly Ile Thr Phe Phe Gln Pro Ile Asn Pro Leu 165 170 175 Leu Ser Tyr Phe Gly Leu Gln Leu Val Thr Gly 180 185 <210> 32 <211> 187 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida fusca_mature region (F12Y) <400> 32 Leu Ala Ala Ile Ile Gly Gly Asn Pro Tyr Tyr Tyr Gly Asn Tyr Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Arg Gln Gly Ser Gln Thr Gly Phe Ala 20 25 30 Thr Ala Gly His Cys Gly Ser Thr Gly Thr Arg Val Ser Ser Pro Ser 35 40 45 Gly Thr Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val 50 55 60 Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn 65 70 75 80 Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Ala Thr Gly Ser 85 90 95 Ser Val Cys Arg Ser Gly Ala Thr Thr Gly Trp Arg Cys Gly Thr Ile 100 105 110 Gln Ser Lys Asn Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly 115 120 125 Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro 130 135 140 Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Thr Gly 145 150 155 160 Asp Cys Arg Ser Gly Gly Ile Thr Phe Phe Gln Pro Ile Asn Pro Leu 165 170 175 Leu Ser Tyr Phe Gly Leu Gln Leu Val Thr Gly 180 185 <210> 33 <211> 187 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida fusca_mature region (F12Y_N116D) <400> 33 Leu Ala Ala Ile Ile Gly Gly Asn Pro Tyr Tyr Tyr Gly Asn Tyr Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Arg Gln Gly Ser Gln Thr Gly Phe Ala 20 25 30 Thr Ala Gly His Cys Gly Ser Thr Gly Thr Arg Val Ser Ser Pro Ser 35 40 45 Gly Thr Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val 50 55 60 Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn 65 70 75 80 Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Ala Thr Gly Ser 85 90 95 Ser Val Cys Arg Ser Gly Ala Thr Thr Gly Trp Arg Cys Gly Thr Ile 100 105 110 Gln Ser Lys Asp Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly 115 120 125 Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro 130 135 140 Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Thr Gly 145 150 155 160 Asp Cys Arg Ser Gly Gly Ile Thr Phe Phe Gln Pro Ile Asn Pro Leu 165 170 175 Leu Ser Tyr Phe Gly Leu Gln Leu Val Thr Gly 180 185 <210> 34 <211> 187 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida fusca_mature region (F12Y_N116S) <400> 34 Leu Ala Ala Ile Ile Gly Gly Asn Pro Tyr Tyr Tyr Gly Asn Tyr Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Arg Gln Gly Ser Gln Thr Gly Phe Ala 20 25 30 Thr Ala Gly His Cys Gly Ser Thr Gly Thr Arg Val Ser Ser Pro Ser 35 40 45 Gly Thr Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val 50 55 60 Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn 65 70 75 80 Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Ala Thr Gly Ser 85 90 95 Ser Val Cys Arg Ser Gly Ala Thr Thr Gly Trp Arg Cys Gly Thr Ile 100 105 110 Gln Ser Lys Ser Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly 115 120 125 Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro 130 135 140 Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Thr Gly 145 150 155 160 Asp Cys Arg Ser Gly Gly Ile Thr Phe Phe Gln Pro Ile Asn Pro Leu 165 170 175 Leu Ser Tyr Phe Gly Leu Gln Leu Val Thr Gly 180 185 <210> 35 <211> 187 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida fusca_mature region (F12S_N116D) <400> 35 Leu Ala Ala Ile Ile Gly Gly Asn Pro Tyr Tyr Ser Gly Asn Tyr Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Arg Gln Gly Ser Gln Thr Gly Phe Ala 20 25 30 Thr Ala Gly His Cys Gly Ser Thr Gly Thr Arg Val Ser Ser Pro Ser 35 40 45 Gly Thr Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val 50 55 60 Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn 65 70 75 80 Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Ala Thr Gly Ser 85 90 95 Ser Val Cys Arg Ser Gly Ala Thr Thr Gly Trp Arg Cys Gly Thr Ile 100 105 110 Gln Ser Lys Asp Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly 115 120 125 Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro 130 135 140 Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Thr Gly 145 150 155 160 Asp Cys Arg Ser Gly Gly Ile Thr Phe Phe Gln Pro Ile Asn Pro Leu 165 170 175 Leu Ser Tyr Phe Gly Leu Gln Leu Val Thr Gly 180 185 <210> 36 <211> 187 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida fusca_mature region (F12S_N116T) <400> 36 Leu Ala Ala Ile Ile Gly Gly Asn Pro Tyr Tyr Ser Gly Asn Tyr Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Arg Gln Gly Ser Gln Thr Gly Phe Ala 20 25 30 Thr Ala Gly His Cys Gly Ser Thr Gly Thr Arg Val Ser Ser Pro Ser 35 40 45 Gly Thr Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val 50 55 60 Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn 65 70 75 80 Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Ala Thr Gly Ser 85 90 95 Ser Val Cys Arg Ser Gly Ala Thr Thr Gly Trp Arg Cys Gly Thr Ile 100 105 110 Gln Ser Lys Thr Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly 115 120 125 Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro 130 135 140 Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Thr Gly 145 150 155 160 Asp Cys Arg Ser Gly Gly Ile Thr Phe Phe Gln Pro Ile Asn Pro Leu 165 170 175 Leu Ser Tyr Phe Gly Leu Gln Leu Val Thr Gly 180 185 <210> 37 <211> 187 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida fusca_mature region (F12A_N116G) <400> 37 Leu Ala Ala Ile Ile Gly Gly Asn Pro Tyr Tyr Ala Gly Asn Tyr Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Arg Gln Gly Ser Gln Thr Gly Phe Ala 20 25 30 Thr Ala Gly His Cys Gly Ser Thr Gly Thr Arg Val Ser Ser Pro Ser 35 40 45 Gly Thr Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val 50 55 60 Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn 65 70 75 80 Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Ala Thr Gly Ser 85 90 95 Ser Val Cys Arg Ser Gly Ala Thr Thr Gly Trp Arg Cys Gly Thr Ile 100 105 110 Gln Ser Lys Gly Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly 115 120 125 Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro 130 135 140 Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Thr Gly 145 150 155 160 Asp Cys Arg Ser Gly Gly Ile Thr Phe Phe Gln Pro Ile Asn Pro Leu 165 170 175 Leu Ser Tyr Phe Gly Leu Gln Leu Val Thr Gly 180 185 <210> 38 <211> 187 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida fusca_mature region (F12A) <400> 38 Leu Ala Ala Ile Ile Gly Gly Asn Pro Tyr Tyr Ala Gly Asn Tyr Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Arg Gln Gly Ser Gln Thr Gly Phe Ala 20 25 30 Thr Ala Gly His Cys Gly Ser Thr Gly Thr Arg Val Ser Ser Pro Ser 35 40 45 Gly Thr Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val 50 55 60 Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn 65 70 75 80 Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Ala Thr Gly Ser 85 90 95 Ser Val Cys Arg Ser Gly Ala Thr Thr Gly Trp Arg Cys Gly Thr Ile 100 105 110 Gln Ser Lys Asn Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly 115 120 125 Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro 130 135 140 Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Thr Gly 145 150 155 160 Asp Cys Arg Ser Gly Gly Ile Thr Phe Phe Gln Pro Ile Asn Pro Leu 165 170 175 Leu Ser Tyr Phe Gly Leu Gln Leu Val Thr Gly 180 185 <210> 39 <211> 187 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida fusca_mature region (F12R) <400> 39 Leu Ala Ala Ile Ile Gly Gly Asn Pro Tyr Tyr Arg Gly Asn Tyr Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Arg Gln Gly Ser Gln Thr Gly Phe Ala 20 25 30 Thr Ala Gly His Cys Gly Ser Thr Gly Thr Arg Val Ser Ser Pro Ser 35 40 45 Gly Thr Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val 50 55 60 Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn 65 70 75 80 Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Ala Thr Gly Ser 85 90 95 Ser Val Cys Arg Ser Gly Ala Thr Thr Gly Trp Arg Cys Gly Thr Ile 100 105 110 Gln Ser Lys Asn Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly 115 120 125 Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro 130 135 140 Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Thr Gly 145 150 155 160 Asp Cys Arg Ser Gly Gly Ile Thr Phe Phe Gln Pro Ile Asn Pro Leu 165 170 175 Leu Ser Tyr Phe Gly Leu Gln Leu Val Thr Gly 180 185 <210> 40 <211> 368 <212> PRT <213> Unknown <220> <223> Thermobifida fusca <400> 40 Met Asn His Ser Ser Arg Arg Thr Thr Ser Leu Leu Phe Thr Ala Ala 1 5 10 15 Leu Ala Ala Thr Ala Leu Val Ala Ala Thr Thr Pro Ala Ser Ala Gln 20 25 30 Glu Leu Ala Leu Lys Arg Asp Leu Gly Leu Ser Asp Ala Glu Val Ala 35 40 45 Glu Leu Arg Ala Ala Glu Ala Glu Ala Val Glu Leu Glu Glu Glu Leu 50 55 60 Arg Asp Ser Leu Gly Ser Asp Phe Gly Gly Val Tyr Leu Asp Ala Asp 65 70 75 80 Thr Thr Glu Ile Thr Val Ala Val Thr Asp Pro Ala Ala Val Ser Arg 85 90 95 Val Asp Ala Asp Asp Val Thr Val Asp Val Val Asp Phe Gly Glu Thr 100 105 110 Ala Leu Asn Asp Phe Val Ala Ser Leu Asn Ala Ile Ala Asp Thr Ala 115 120 125 Asp Pro Lys Val Thr Gly Trp Tyr Thr Asp Leu Glu Ser Asp Ala Val 130 135 140 Val Ile Thr Thr Leu Arg Gly Gly Thr Pro Ala Ala Glu Glu Leu Ala 145 150 155 160 Glu Arg Ala Gly Leu Asp Glu Arg Ala Val Arg Ile Val Glu Glu Asp 165 170 175 Glu Glu Pro Gln Ser Leu Ala Ala Ile Ile Gly Gly Asn Pro Tyr Tyr 180 185 190 Phe Gly Asn Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Gln Gly Ser 195 200 205 Gln Thr Gly Phe Ala Thr Ala Gly His Cys Gly Ser Thr Gly Thr Arg 210 215 220 Val Ser Ser Pro Ser Gly Thr Val Ala Gly Ser Tyr Phe Pro Gly Arg 225 230 235 240 Asp Met Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu 245 250 255 Val Asn Arg Tyr Asn Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu 260 265 270 Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ala Thr Thr Gly Trp 275 280 285 Arg Cys Gly Thr Ile Gln Ser Lys Asn Gln Thr Val Arg Tyr Ala Glu 290 295 300 Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly 305 310 315 320 Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr 325 330 335 Ser Gly Gly Thr Gly Asp Cys Arg Ser Gly Gly Ile Thr Phe Phe Gln 340 345 350 Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu Gln Leu Val Thr Gly 355 360 365 <210> 41 <211> 564 <212> DNA <213> Artificial Sequence <220> <223> Thermobifida fusca_mature region (F12Y) <400> 41 ttggctgcaa ttattggtgg aaacccgtac tattacggaa attacagatg cagtatcggg 60 tttagtgtcc gtcagggctc tcaaacggga ttcgcgaccg caggccactg cggatccacg 120 gggacgcgtg tgtcttctcc ttcaggaaca gttgcaggaa gttatttccc gggtcgcgat 180 atgggctggg tgcggattac atcagcagat actgtaacac cactcgtaaa tcggtataat 240 gggggaactg ttacggtcac tgggtcacaa gaagctgcca ccggatcctc cgtttgtcgc 300 tctggagcaa caacgggctg gcgctgcgga actatccaat caaaaaacca aacggttcgc 360 tatgcagaag ggactgttac tggtttaaca agaactacag cctgtgctga aggtggggat 420 tctggagggc catggctcac aggtagccag gcgcaagggg ttacaagcgg cggaacaggc 480 gattgcagaa gtggagggat tacctttttc caaccaatca atccattgct tagctatttc 540 ggccttcaat tagtgaccgg ctga 564 <210> 42 <211> 564 <212> DNA <213> Artificial Sequence <220> <223> Thermobifida fusca_mature region (F12Y_N116D) <400> 42 ttggctgcaa ttattggtgg aaacccgtac tattacggaa attacagatg cagtatcggg 60 tttagtgtcc gtcagggctc tcaaacggga ttcgcgaccg caggccactg cggatccacg 120 gggacgcgtg tgtcttctcc ttcaggaaca gttgcaggaa gttatttccc gggtcgcgat 180 atgggctggg tgcggattac atcagcagat actgtaacac cactcgtaaa tcggtataat 240 gggggaactg ttacggtcac tgggtcacaa gaagctgcca ccggatcctc cgtttgtcgc 300 tctggagcaa caacgggctg gcgctgcgga actatccaat caaaagacca aacggttcgc 360 tatgcagaag ggactgttac tggtttaaca agaactacag cctgtgctga aggtggggat 420 tctggagggc catggctcac aggtagccag gcgcaagggg ttacaagcgg cggaacaggc 480 gattgcagaa gtggagggat tacctttttc caaccaatca atccattgct tagctatttc 540 ggccttcaat tagtgaccgg ctga 564 <210> 43 <211> 564 <212> DNA <213> Artificial Sequence <220> <223> Thermobifida fusca_mature region (F12Y_N116S) <400> 43 ttggctgcaa ttattggtgg aaacccgtac tattacggaa attacagatg cagtatcggg 60 tttagtgtcc gtcagggctc tcaaacggga ttcgcgaccg caggccactg cggatccacg 120 gggacgcgtg tgtcttctcc ttcaggaaca gttgcaggaa gttatttccc gggtcgcgat 180 atgggctggg tgcggattac atcagcagat actgtaacac cactcgtaaa tcggtataat 240 gggggaactg ttacggtcac tgggtcacaa gaagctgcca ccggatcctc cgtttgtcgc 300 tctggagcaa caacgggctg gcgctgcgga actatccaat caaaaagtca aacggttcgc 360 tatgcagaag ggactgttac tggtttaaca agaactacag cctgtgctga aggtggggat 420 tctggagggc catggctcac aggtagccag gcgcaagggg ttacaagcgg cggaacaggc 480 gattgcagaa gtggagggat tacctttttc caaccaatca atccattgct tagctatttc 540 ggccttcaat tagtgaccgg ctga 564 <210> 44 <211> 564 <212> DNA <213> Artificial Sequence <220> <223> Thermobifida fusca_mature region (F12S_N116D) <400> 44 ttggctgcaa ttattggtgg aaacccgtac tatagtggaa attacagatg cagtatcggg 60 tttagtgtcc gtcagggctc tcaaacggga ttcgcgaccg caggccactg cggatccacg 120 gggacgcgtg tgtcttctcc ttcaggaaca gttgcaggaa gttatttccc gggtcgcgat 180 atgggctggg tgcggattac atcagcagat actgtaacac cactcgtaaa tcggtataat 240 gggggaactg ttacggtcac tgggtcacaa gaagctgcca ccggatcctc cgtttgtcgc 300 tctggagcaa caacgggctg gcgctgcgga actatccaat caaaagatca aacggttcgc 360 tatgcagaag ggactgttac tggtttaaca agaactacag cctgtgctga aggtggggat 420 tctggagggc catggctcac aggtagccag gcgcaagggg ttacaagcgg cggaacaggc 480 gattgcagaa gtggagggat tacctttttc caaccaatca atccattgct tagctatttc 540 ggccttcaat tagtgaccgg ctga 564 <210> 45 <211> 564 <212> DNA <213> Artificial Sequence <220> <223> Thermobifida fusca_mature region (F12S_N116T) <400> 45 ttggctgcaa ttattggtgg aaacccgtac tatagtggaa attacagatg cagtatcggg 60 tttagtgtcc gtcagggctc tcaaacggga ttcgcgaccg caggccactg cggatccacg 120 gggacgcgtg tgtcttctcc ttcaggaaca gttgcaggaa gttatttccc gggtcgcgat 180 atgggctggg tgcggattac atcagcagat actgtaacac cactcgtaaa tcggtataat 240 gggggaactg ttacggtcac tgggtcacaa gaagctgcca ccggatcctc cgtttgtcgc 300 tctggagcaa caacgggctg gcgctgcgga actatccaat caaaaactca aacggttcgc 360 tatgcagaag ggactgttac tggtttaaca agaactacag cctgtgctga aggtggggat 420 tctggagggc catggctcac aggtagccag gcgcaagggg ttacaagcgg cggaacaggc 480 gattgcagaa gtggagggat tacctttttc caaccaatca atccattgct tagctatttc 540 ggccttcaat tagtgaccgg ctga 564 <210> 46 <211> 564 <212> DNA <213> Artificial Sequence <220> <223> Thermobifida fusca_mature region (F12A_N116G) <400> 46 ttggctgcaa ttattggtgg aaacccgtac tatgctggaa attacagatg cagtatcggg 60 tttagtgtcc gtcagggctc tcaaacggga ttcgcgaccg caggccactg cggatccacg 120 gggacgcgtg tgtcttctcc ttcaggaaca gttgcaggaa gttatttccc gggtcgcgat 180 atgggctggg tgcggattac atcagcagat actgtaacac cactcgtaaa tcggtataat 240 gggggaactg ttacggtcac tgggtcacaa gaagctgcca ccggatcctc cgtttgtcgc 300 tctggagcaa caacgggctg gcgctgcgga actatccaat caaaaggtca aacggttcgc 360 tatgcagaag ggactgttac tggtttaaca agaactacag cctgtgctga aggtggggat 420 tctggagggc catggctcac aggtagccag gcgcaagggg ttacaagcgg cggaacaggc 480 gattgcagaa gtggagggat tacctttttc caaccaatca atccattgct tagctatttc 540 ggccttcaat tagtgaccgg ctga 564 <210> 47 <211> 564 <212> DNA <213> Artificial Sequence <220> <223> Thermobifida fusca_mature region (F12A) <400> 47 ttggctgcaa ttattggtgg aaacccgtac tatgctggaa attacagatg cagtatcggg 60 tttagtgtcc gtcagggctc tcaaacggga ttcgcgaccg caggccactg cggatccacg 120 gggacgcgtg tgtcttctcc ttcaggaaca gttgcaggaa gttatttccc gggtcgcgat 180 atgggctggg tgcggattac atcagcagat actgtaacac cactcgtaaa tcggtataat 240 gggggaactg ttacggtcac tgggtcacaa gaagctgcca ccggatcctc cgtttgtcgc 300 tctggagcaa caacgggctg gcgctgcgga actatccaat caaaaaatca aacggttcgc 360 tatgcagaag ggactgttac tggtttaaca agaactacag cctgtgctga aggtggggat 420 tctggagggc catggctcac aggtagccag gcgcaagggg ttacaagcgg cggaacaggc 480 gattgcagaa gtggagggat tacctttttc caaccaatca atccattgct tagctatttc 540 ggccttcaat tagtgaccgg ctga 564 <210> 48 <211> 564 <212> DNA <213> Artificial Sequence <220> <223> Thermobifida fusca_mature region (F12R) <400> 48 ttggctgcaa ttattggtgg aaacccgtac tatagaggaa attacagatg cagtatcggg 60 tttagtgtcc gtcagggctc tcaaacggga ttcgcgaccg caggccactg cggatccacg 120 gggacgcgtg tgtcttctcc ttcaggaaca gttgcaggaa gttatttccc gggtcgcgat 180 atgggctggg tgcggattac atcagcagat actgtaacac cactcgtaaa tcggtataat 240 gggggaactg ttacggtcac tgggtcacaa gaagctgcca ccggatcctc cgtttgtcgc 300 tctggagcaa caacgggctg gcgctgcgga actatccaat caaaaaatca aacggttcgc 360 tatgcagaag ggactgttac tggtttaaca agaactacag cctgtgctga aggtggggat 420 tctggagggc catggctcac aggtagccag gcgcaagggg ttacaagcgg cggaacaggc 480 gattgcagaa gtggagggat tacctttttc caaccaatca atccattgct tagctatttc 540 ggccttcaat tagtgaccgg ctga 564 <210> 49 <211> 187 <212> PRT <213> Unknown <220> <223> Thermobifida cellulosilytica <400> 49 Phe Ala Asp Val Ile Gly Gly Asn Pro Tyr Tyr Phe Gly Gly Tyr Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Arg Lys Gly Ser Asp Thr Gly Phe Ala 20 25 30 Thr Ala Gly His Cys Gly Glu Thr Gly Thr Leu Thr Arg Ser Pro Glu 35 40 45 Gly Val Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val 50 55 60 Arg Leu Thr Gly Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asp 65 70 75 80 Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Val Thr Gly Ser 85 90 95 Ser Val Cys Arg Ser Gly Ser Thr Thr Gly Trp Arg Cys Gly Ile Ile 100 105 110 Gln Ser Lys Asn Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly 115 120 125 Leu Thr Arg Thr Thr Ala Cys Ala Glu Ala Gly Asp Ser Gly Gly Pro 130 135 140 Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly 145 150 155 160 Asn Cys Arg Thr Gly Gly Ile Thr Tyr Phe Gln Pro Ile Asn Pro Leu 165 170 175 Leu Ser Tyr Phe Gly Leu Glu Leu Val Thr Gly 180 185 <210> 50 <211> 187 <212> PRT <213> Unknown <220> <223> Thermobifida halotolerans <400> 50 Phe Thr Asp Ile Ile Gly Gly Asn Pro Tyr Tyr Phe Asp Gly Tyr Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Arg Arg Gly Ser Glu Ser Gly Phe Ala 20 25 30 Thr Ala Gly His Cys Gly Glu Glu Gly Thr Glu Thr Ser Asp Pro Glu 35 40 45 Gly Thr Val Ala Gly Ala Tyr Phe Pro Gly Arg Asp Met Gly Trp Val 50 55 60 Arg Ile Thr Asp Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn 65 70 75 80 Gly Glu Asn Val Thr Val Ala Gly Ser Arg Glu Ala Ala Thr Gly Ser 85 90 95 Ser Val Cys Arg Ser Gly Ser Thr Thr Gly Trp Arg Cys Gly Thr Ile 100 105 110 Arg Ser Lys Asn Gln Thr Val Arg Tyr Ile Glu Gly Thr Val Thr Gly 115 120 125 Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro 130 135 140 Trp Leu Thr Gly Ser Gln Gly Gln Gly Val Thr Ser Gly Gly Ser Gly 145 150 155 160 Asn Cys Thr Leu Gly Gly Val Thr Tyr Phe Gln Pro Leu Asn Pro Leu 165 170 175 Leu Ser His Phe Asp Leu Asp Leu Val Thr Gly 180 185 <210> 51 <211> 187 <212> PRT <213> Unknown <220> <223> Actinorugispora endophytica <400> 51 Leu Ala Asn Val Ile Gly Gly Asn Ala Tyr Tyr Phe Gly Gly Tyr Arg 1 5 10 15 Cys Ser Val Gly Phe Ser Val Arg His Ser Ser Gly Pro Gly Phe Ala 20 25 30 Thr Ala Gly His Cys Gly Asp Val Gly Thr Arg Thr Thr Ser Pro Thr 35 40 45 Gly Thr Ile Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val 50 55 60 Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn 65 70 75 80 Gly Ser Tyr Ile Thr Val Thr Gly Ser Ser Glu Ala Ala Asn Gly Ser 85 90 95 Ser Val Cys Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile 100 105 110 Gln Ser Lys Asn Gln Thr Val Asn Tyr Ala Glu Gly Ser Val Ala Gly 115 120 125 Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Ser 130 135 140 Trp Leu Thr Gly Thr Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly 145 150 155 160 Asn Cys Thr Trp Gly Gly Thr Thr Tyr Phe Gln Pro Ile Asn Pro Leu 165 170 175 Leu Ser Tyr Phe Asn Leu Thr Leu Val Thr Gly 180 185 <210> 52 <211> 183 <212> PRT <213> Unknown <220> <223> Spinactinospora alkalitolerans <400> 52 Phe Ala Asp Ile Ile Gly Gly Asn Ala Tyr Tyr Pro Gly Ser Ser Arg 1 5 10 15 Cys Ser Ile Gly Phe Ala Val Gln Gly Gly Phe Val Thr Ala Gly His 20 25 30 Cys Gly Ser Thr Gly Thr Arg Thr Ser Ser Pro Ser Gly Thr Val Ala 35 40 45 Gly Ser Trp Phe Pro Gly Arg Asp Met Gly Trp Val Arg Thr Gly Ser 50 55 60 Gly Asp Thr Pro Arg Pro Trp Val Asn Asn Tyr Arg Gly Gly Tyr Val 65 70 75 80 Thr Val Ala Gly Ser Gln Glu Ala Gly Ile Gly Ser Ser Val Cys Arg 85 90 95 Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ser Lys Asn 100 105 110 Gln Thr Val Arg Tyr Ser Gln Gly Ser Val Tyr Gly Leu Thr Arg Thr 115 120 125 Ser Ala Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp Val Thr Gly 130 135 140 Asn Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Thr Trp 145 150 155 160 Gly Gly Thr Thr Tyr Phe Gln Pro Val Asn Pro Ile Leu Ser Gln Tyr 165 170 175 Gly Leu Arg Leu Val Thr Gly 180 <210> 53 <211> 186 <212> PRT <213> Unknown <220> <223> Nocardiopsis composta <400> 53 Phe Gly Asp Ile Val Gly Gly Asn Ala Tyr Tyr Pro Gly Gly Ser Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Gln Gly Gly Phe Ala Thr Ala Gly His 20 25 30 Cys Gly Ser Gln Gly Thr Arg Val Thr Gly Gly Ala Gly Glu Ser Gly 35 40 45 Thr Val Ala Gly Ser Ile Phe Pro Gly Arg Asp Met Gly Trp Val Arg 50 55 60 Val Asn Ser Gly Trp Asn Pro Ser Pro Tyr Val Asn Asn Tyr Ser Gly 65 70 75 80 Gly Arg Val Leu Val Thr Gly Ser Gln Glu Ala Ser Val Gly Ala Ser 85 90 95 Val Cys Arg Ser Gly Ser Thr Thr Gly Trp Arg Cys Gly Thr Ile Gln 100 105 110 Ala Lys Asn Gln Thr Val Arg Tyr Pro Glu Gly Thr Val Asn Gly Leu 115 120 125 Thr Arg Thr Thr Ala Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp 130 135 140 Leu Ser Gly Asn Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn 145 150 155 160 Cys Ser Ser Gly Gly Thr Thr Phe Phe Gln Pro Leu Asn Pro Ile Leu 165 170 175 Ser Gln Trp Gly Leu Thr Leu Thr Thr Gly 180 185 <210> 54 <211> 186 <212> PRT <213> Unknown <220> <223> Nocardiopsis potens <400> 54 Phe Gly Asp Ile Val Gly Gly Asn Ala Tyr Tyr Pro Gly Gly Ser Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Gln Gly Gly Phe Ala Thr Ala Gly His 20 25 30 Cys Gly Ser Gln Gly Thr Arg Val Thr Gly Gly Ala Gly Glu Ser Gly 35 40 45 Thr Val Ala Gly Ser Ile Phe Pro Gly Arg Asp Met Gly Trp Val Arg 50 55 60 Val Asn Ser Gly Trp Asn Pro Ser Pro Tyr Val Asn Asn Tyr Ser Gly 65 70 75 80 Gly Arg Val Leu Val Thr Gly Ser Gln Glu Ala Ser Val Gly Ala Ser 85 90 95 Ile Cys Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln 100 105 110 Ala Lys Asn Gln Thr Val Arg Tyr Pro Gln Gly Thr Val Asn Gly Leu 115 120 125 Thr Arg Thr Asn Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp 130 135 140 Ile Ser Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn 145 150 155 160 Cys Ser Thr Gly Gly Thr Thr Phe Tyr Gln Pro Ile Asn Pro Ile Leu 165 170 175 Ser Gln Trp Gly Leu Thr Leu Thr Thr Gly 180 185 <210> 55 <211> 187 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida cellulosilytica_F12Y <400> 55 Phe Ala Asp Val Ile Gly Gly Asn Pro Tyr Tyr Tyr Gly Gly Tyr Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Arg Lys Gly Ser Asp Thr Gly Phe Ala 20 25 30 Thr Ala Gly His Cys Gly Glu Thr Gly Thr Leu Thr Arg Ser Pro Glu 35 40 45 Gly Val Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val 50 55 60 Arg Leu Thr Gly Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asp 65 70 75 80 Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Val Thr Gly Ser 85 90 95 Ser Val Cys Arg Ser Gly Ser Thr Thr Gly Trp Arg Cys Gly Ile Ile 100 105 110 Gln Ser Lys Asn Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly 115 120 125 Leu Thr Arg Thr Thr Ala Cys Ala Glu Ala Gly Asp Ser Gly Gly Pro 130 135 140 Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly 145 150 155 160 Asn Cys Arg Thr Gly Gly Ile Thr Tyr Phe Gln Pro Ile Asn Pro Leu 165 170 175 Leu Ser Tyr Phe Gly Leu Glu Leu Val Thr Gly 180 185 <210> 56 <211> 187 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida cellulosilytica_F12YN116D <400> 56 Phe Ala Asp Val Ile Gly Gly Asn Pro Tyr Tyr Tyr Gly Gly Tyr Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Arg Lys Gly Ser Asp Thr Gly Phe Ala 20 25 30 Thr Ala Gly His Cys Gly Glu Thr Gly Thr Leu Thr Arg Ser Pro Glu 35 40 45 Gly Val Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val 50 55 60 Arg Leu Thr Gly Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asp 65 70 75 80 Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Val Thr Gly Ser 85 90 95 Ser Val Cys Arg Ser Gly Ser Thr Thr Gly Trp Arg Cys Gly Ile Ile 100 105 110 Gln Ser Lys Asp Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly 115 120 125 Leu Thr Arg Thr Thr Ala Cys Ala Glu Ala Gly Asp Ser Gly Gly Pro 130 135 140 Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly 145 150 155 160 Asn Cys Arg Thr Gly Gly Ile Thr Tyr Phe Gln Pro Ile Asn Pro Leu 165 170 175 Leu Ser Tyr Phe Gly Leu Glu Leu Val Thr Gly 180 185 <210> 57 <211> 187 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida halotolerans_F12Y <400> 57 Phe Thr Asp Ile Ile Gly Gly Asn Pro Tyr Tyr Tyr Asp Gly Tyr Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Arg Arg Gly Ser Glu Ser Gly Phe Ala 20 25 30 Thr Ala Gly His Cys Gly Glu Glu Gly Thr Glu Thr Ser Asp Pro Glu 35 40 45 Gly Thr Val Ala Gly Ala Tyr Phe Pro Gly Arg Asp Met Gly Trp Val 50 55 60 Arg Ile Thr Asp Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn 65 70 75 80 Gly Glu Asn Val Thr Val Ala Gly Ser Arg Glu Ala Ala Thr Gly Ser 85 90 95 Ser Val Cys Arg Ser Gly Ser Thr Thr Gly Trp Arg Cys Gly Thr Ile 100 105 110 Arg Ser Lys Asn Gln Thr Val Arg Tyr Ile Glu Gly Thr Val Thr Gly 115 120 125 Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro 130 135 140 Trp Leu Thr Gly Ser Gln Gly Gln Gly Val Thr Ser Gly Gly Ser Gly 145 150 155 160 Asn Cys Thr Leu Gly Gly Val Thr Tyr Phe Gln Pro Leu Asn Pro Leu 165 170 175 Leu Ser His Phe Asp Leu Asp Leu Val Thr Gly 180 185 <210> 58 <211> 187 <212> PRT <213> Artificial Sequence <220> <223> Thermobifida halotolerans_F12YN116D <400> 58 Phe Thr Asp Ile Ile Gly Gly Asn Pro Tyr Tyr Tyr Asp Gly Tyr Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Arg Arg Gly Ser Glu Ser Gly Phe Ala 20 25 30 Thr Ala Gly His Cys Gly Glu Glu Gly Thr Glu Thr Ser Asp Pro Glu 35 40 45 Gly Thr Val Ala Gly Ala Tyr Phe Pro Gly Arg Asp Met Gly Trp Val 50 55 60 Arg Ile Thr Asp Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn 65 70 75 80 Gly Glu Asn Val Thr Val Ala Gly Ser Arg Glu Ala Ala Thr Gly Ser 85 90 95 Ser Val Cys Arg Ser Gly Ser Thr Thr Gly Trp Arg Cys Gly Thr Ile 100 105 110 Arg Ser Lys Asp Gln Thr Val Arg Tyr Ile Glu Gly Thr Val Thr Gly 115 120 125 Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro 130 135 140 Trp Leu Thr Gly Ser Gln Gly Gln Gly Val Thr Ser Gly Gly Ser Gly 145 150 155 160 Asn Cys Thr Leu Gly Gly Val Thr Tyr Phe Gln Pro Leu Asn Pro Leu 165 170 175 Leu Ser His Phe Asp Leu Asp Leu Val Thr Gly 180 185 <210> 59 <211> 187 <212> PRT <213> Artificial Sequence <220> <223> Actinorugispora endophytica_F12Y <400> 59 Leu Ala Asn Val Ile Gly Gly Asn Ala Tyr Tyr Tyr Gly Gly Tyr Arg 1 5 10 15 Cys Ser Val Gly Phe Ser Val Arg His Ser Ser Gly Pro Gly Phe Ala 20 25 30 Thr Ala Gly His Cys Gly Asp Val Gly Thr Arg Thr Thr Ser Pro Thr 35 40 45 Gly Thr Ile Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val 50 55 60 Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn 65 70 75 80 Gly Ser Tyr Ile Thr Val Thr Gly Ser Ser Glu Ala Ala Asn Gly Ser 85 90 95 Ser Val Cys Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile 100 105 110 Gln Ser Lys Asn Gln Thr Val Asn Tyr Ala Glu Gly Ser Val Ala Gly 115 120 125 Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Ser 130 135 140 Trp Leu Thr Gly Thr Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly 145 150 155 160 Asn Cys Thr Trp Gly Gly Thr Thr Tyr Phe Gln Pro Ile Asn Pro Leu 165 170 175 Leu Ser Tyr Phe Asn Leu Thr Leu Val Thr Gly 180 185 <210> 60 <211> 187 <212> PRT <213> Artificial Sequence <220> <223> Actinorugispora endophytica_F12YN116D <400> 60 Leu Ala Asn Val Ile Gly Gly Asn Ala Tyr Tyr Tyr Gly Gly Tyr Arg 1 5 10 15 Cys Ser Val Gly Phe Ser Val Arg His Ser Ser Gly Pro Gly Phe Ala 20 25 30 Thr Ala Gly His Cys Gly Asp Val Gly Thr Arg Thr Thr Ser Pro Thr 35 40 45 Gly Thr Ile Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val 50 55 60 Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn 65 70 75 80 Gly Ser Tyr Ile Thr Val Thr Gly Ser Ser Glu Ala Ala Asn Gly Ser 85 90 95 Ser Val Cys Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile 100 105 110 Gln Ser Lys Asp Gln Thr Val Asn Tyr Ala Glu Gly Ser Val Ala Gly 115 120 125 Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Ser 130 135 140 Trp Leu Thr Gly Thr Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly 145 150 155 160 Asn Cys Thr Trp Gly Gly Thr Thr Tyr Phe Gln Pro Ile Asn Pro Leu 165 170 175 Leu Ser Tyr Phe Asn Leu Thr Leu Val Thr Gly 180 185 <210> 61 <211> 183 <212> PRT <213> Artificial Sequence <220> <223> Spinactinospora alkalitolerans_F12Y <400> 61 Phe Ala Asp Ile Ile Gly Gly Asn Ala Tyr Tyr Tyr Gly Ser Ser Arg 1 5 10 15 Cys Ser Ile Gly Phe Ala Val Gln Gly Gly Phe Val Thr Ala Gly His 20 25 30 Cys Gly Ser Thr Gly Thr Arg Thr Ser Ser Pro Ser Gly Thr Val Ala 35 40 45 Gly Ser Trp Phe Pro Gly Arg Asp Met Gly Trp Val Arg Thr Gly Ser 50 55 60 Gly Asp Thr Pro Arg Pro Trp Val Asn Asn Tyr Arg Gly Gly Tyr Val 65 70 75 80 Thr Val Ala Gly Ser Gln Glu Ala Gly Ile Gly Ser Ser Val Cys Arg 85 90 95 Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ser Lys Asn 100 105 110 Gln Thr Val Arg Tyr Ser Gln Gly Ser Val Tyr Gly Leu Thr Arg Thr 115 120 125 Ser Ala Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp Val Thr Gly 130 135 140 Asn Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Thr Trp 145 150 155 160 Gly Gly Thr Thr Tyr Phe Gln Pro Val Asn Pro Ile Leu Ser Gln Tyr 165 170 175 Gly Leu Arg Leu Val Thr Gly 180 <210> 62 <211> 183 <212> PRT <213> Artificial Sequence <220> <223> Spinactinospora alkalitolerans_F12YN116D <400> 62 Phe Ala Asp Ile Ile Gly Gly Asn Ala Tyr Tyr Tyr Gly Ser Ser Arg 1 5 10 15 Cys Ser Ile Gly Phe Ala Val Gln Gly Gly Phe Val Thr Ala Gly His 20 25 30 Cys Gly Ser Thr Gly Thr Arg Thr Ser Ser Pro Ser Gly Thr Val Ala 35 40 45 Gly Ser Trp Phe Pro Gly Arg Asp Met Gly Trp Val Arg Thr Gly Ser 50 55 60 Gly Asp Thr Pro Arg Pro Trp Val Asn Asn Tyr Arg Gly Gly Tyr Val 65 70 75 80 Thr Val Ala Gly Ser Gln Glu Ala Gly Ile Gly Ser Ser Val Cys Arg 85 90 95 Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ser Lys Asp 100 105 110 Gln Thr Val Arg Tyr Ser Gln Gly Ser Val Tyr Gly Leu Thr Arg Thr 115 120 125 Ser Ala Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp Val Thr Gly 130 135 140 Asn Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Thr Trp 145 150 155 160 Gly Gly Thr Thr Tyr Phe Gln Pro Val Asn Pro Ile Leu Ser Gln Tyr 165 170 175 Gly Leu Arg Leu Val Thr Gly 180 <210> 63 <211> 186 <212> PRT <213> Artificial Sequence <220> <223> Nocardiopsis composta_F12Y <400> 63 Phe Gly Asp Ile Val Gly Gly Asn Ala Tyr Tyr Tyr Gly Gly Ser Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Gln Gly Gly Phe Ala Thr Ala Gly His 20 25 30 Cys Gly Ser Gln Gly Thr Arg Val Thr Gly Gly Ala Gly Glu Ser Gly 35 40 45 Thr Val Ala Gly Ser Ile Phe Pro Gly Arg Asp Met Gly Trp Val Arg 50 55 60 Val Asn Ser Gly Trp Asn Pro Ser Pro Tyr Val Asn Asn Tyr Ser Gly 65 70 75 80 Gly Arg Val Leu Val Thr Gly Ser Gln Glu Ala Ser Val Gly Ala Ser 85 90 95 Val Cys Arg Ser Gly Ser Thr Thr Gly Trp Arg Cys Gly Thr Ile Gln 100 105 110 Ala Lys Asn Gln Thr Val Arg Tyr Pro Glu Gly Thr Val Asn Gly Leu 115 120 125 Thr Arg Thr Thr Ala Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp 130 135 140 Leu Ser Gly Asn Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn 145 150 155 160 Cys Ser Ser Gly Gly Thr Thr Phe Phe Gln Pro Leu Asn Pro Ile Leu 165 170 175 Ser Gln Trp Gly Leu Thr Leu Thr Thr Gly 180 185 <210> 64 <211> 186 <212> PRT <213> Artificial Sequence <220> <223> Nocardiopsis composta_F12YN116D <400> 64 Phe Gly Asp Ile Val Gly Gly Asn Ala Tyr Tyr Tyr Gly Gly Ser Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Gln Gly Gly Phe Ala Thr Ala Gly His 20 25 30 Cys Gly Ser Gln Gly Thr Arg Val Thr Gly Gly Ala Gly Glu Ser Gly 35 40 45 Thr Val Ala Gly Ser Ile Phe Pro Gly Arg Asp Met Gly Trp Val Arg 50 55 60 Val Asn Ser Gly Trp Asn Pro Ser Pro Tyr Val Asn Asn Tyr Ser Gly 65 70 75 80 Gly Arg Val Leu Val Thr Gly Ser Gln Glu Ala Ser Val Gly Ala Ser 85 90 95 Val Cys Arg Ser Gly Ser Thr Thr Gly Trp Arg Cys Gly Thr Ile Gln 100 105 110 Ala Lys Asp Gln Thr Val Arg Tyr Pro Glu Gly Thr Val Asn Gly Leu 115 120 125 Thr Arg Thr Thr Ala Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp 130 135 140 Leu Ser Gly Asn Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn 145 150 155 160 Cys Ser Ser Gly Gly Thr Thr Phe Phe Gln Pro Leu Asn Pro Ile Leu 165 170 175 Ser Gln Trp Gly Leu Thr Leu Thr Thr Gly 180 185 <210> 65 <211> 186 <212> PRT <213> Artificial Sequence <220> <223> Nocardiopsis potens_F12Y <400> 65 Phe Gly Asp Ile Val Gly Gly Asn Ala Tyr Tyr Tyr Gly Gly Ser Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Gln Gly Gly Phe Ala Thr Ala Gly His 20 25 30 Cys Gly Ser Gln Gly Thr Arg Val Thr Gly Gly Ala Gly Glu Ser Gly 35 40 45 Thr Val Ala Gly Ser Ile Phe Pro Gly Arg Asp Met Gly Trp Val Arg 50 55 60 Val Asn Ser Gly Trp Asn Pro Ser Pro Tyr Val Asn Asn Tyr Ser Gly 65 70 75 80 Gly Arg Val Leu Val Thr Gly Ser Gln Glu Ala Ser Val Gly Ala Ser 85 90 95 Ile Cys Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln 100 105 110 Ala Lys Asn Gln Thr Val Arg Tyr Pro Gln Gly Thr Val Asn Gly Leu 115 120 125 Thr Arg Thr Asn Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp 130 135 140 Ile Ser Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn 145 150 155 160 Cys Ser Thr Gly Gly Thr Thr Phe Tyr Gln Pro Ile Asn Pro Ile Leu 165 170 175 Ser Gln Trp Gly Leu Thr Leu Thr Thr Gly 180 185 <210> 66 <211> 186 <212> PRT <213> Artificial Sequence <220> <223> Nocardiopsis potens_F12YN116D <400> 66 Phe Gly Asp Ile Val Gly Gly Asn Ala Tyr Tyr Tyr Gly Gly Ser Arg 1 5 10 15 Cys Ser Ile Gly Phe Ser Val Gln Gly Gly Phe Ala Thr Ala Gly His 20 25 30 Cys Gly Ser Gln Gly Thr Arg Val Thr Gly Gly Ala Gly Glu Ser Gly 35 40 45 Thr Val Ala Gly Ser Ile Phe Pro Gly Arg Asp Met Gly Trp Val Arg 50 55 60 Val Asn Ser Gly Trp Asn Pro Ser Pro Tyr Val Asn Asn Tyr Ser Gly 65 70 75 80 Gly Arg Val Leu Val Thr Gly Ser Gln Glu Ala Ser Val Gly Ala Ser 85 90 95 Ile Cys Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln 100 105 110 Ala Lys Asp Gln Thr Val Arg Tyr Pro Gln Gly Thr Val Asn Gly Leu 115 120 125 Thr Arg Thr Asn Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp 130 135 140 Ile Ser Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn 145 150 155 160 Cys Ser Thr Gly Gly Thr Thr Phe Tyr Gln Pro Ile Asn Pro Ile Leu 165 170 175 Ser Gln Trp Gly Leu Thr Leu Thr Thr Gly 180 185 <210> 67 <211> 374 <212> PRT <213> Unknown <220> <223> Thermobifida cellulosilytica <400> 67 Met Asn Arg Pro Ser Thr Arg Arg Thr Val Arg Ala Leu Leu Thr Ala 1 5 10 15 Ala Leu Ala Ala Thr Ala Leu Thr Ala Pro Ala Ala Pro Ser Leu Ala 20 25 30 Gln Glu Ala Ser Gln Glu Ala Ala Leu Thr Arg Asp Leu Asp Leu Thr 35 40 45 Gly Thr Glu Val Ala Leu Leu Arg Ala Ala Glu Ser Glu Ala Met Asp 50 55 60 Arg Glu Glu Glu Leu Ser Ala Val Leu Gly Ser Asp Phe Gly Gly Val 65 70 75 80 Tyr Leu Ala Pro Glu Thr Gly Glu Val Thr Val Ala Val Thr Asp Pro 85 90 95 Ala Ala Val Pro Val Val Glu Gln Ser Gly Ala Thr Ala Gln Val Val 100 105 110 Thr Phe Gly Glu Thr Ala Leu Asn Asp Phe Val Asp Ser Leu Asn Ala 115 120 125 Val Ala Asp Arg Ala Asp Glu Gln Ile Thr Gly Trp Tyr Thr Asp Leu 130 135 140 Ala Ala Asp Thr Val Val Ile Thr Ala Phe Pro Gly Gly Ser Ala Ala 145 150 155 160 Ala Glu Glu Leu Ala Ala Leu Ala Gly Val Asp Glu Arg Ala Val Arg 165 170 175 Val Thr Glu Ser Ala Ala Arg Pro Gln Leu Phe Ala Asp Val Ile Gly 180 185 190 Gly Asn Pro Tyr Tyr Phe Gly Gly Tyr Arg Cys Ser Ile Gly Phe Ser 195 200 205 Val Arg Lys Gly Ser Asp Thr Gly Phe Ala Thr Ala Gly His Cys Gly 210 215 220 Glu Thr Gly Thr Leu Thr Arg Ser Pro Glu Gly Val Val Ala Gly Ser 225 230 235 240 Tyr Phe Pro Gly Arg Asp Met Gly Trp Val Arg Leu Thr Gly Ala Asp 245 250 255 Thr Val Thr Pro Leu Val Asn Arg Tyr Asp Gly Gly Thr Val Thr Val 260 265 270 Thr Gly Ser Gln Glu Ala Val Thr Gly Ser Ser Val Cys Arg Ser Gly 275 280 285 Ser Thr Thr Gly Trp Arg Cys Gly Ile Ile Gln Ser Lys Asn Gln Thr 290 295 300 Val Arg Tyr Ala Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala 305 310 315 320 Cys Ala Glu Ala Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln 325 330 335 Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly Gly 340 345 350 Ile Thr Tyr Phe Gln Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu 355 360 365 Glu Leu Val Thr Gly Ala 370 <210> 68 <211> 354 <212> PRT <213> Unknown <220> <223> Thermobifida halotolerans <400> 68 Met Val Ala Thr Ala Leu Thr Ala Ser Ala Thr Pro Ala Ser Ala Asp 1 5 10 15 Arg His Asp Ala Leu Lys Arg Asp Leu Gly Leu Thr Asp Ser Glu Val 20 25 30 Ala Arg Leu Arg Thr Ala Glu Thr Glu Ala Met Asp Arg Glu Ala Glu 35 40 45 Leu Arg Asp Thr Leu Gly Ser Asp Phe Gly Gly Val His Leu Asp Ala 50 55 60 Ala Ser Gly Glu Leu Thr Ile Ala Val Thr Asp Pro Glu Ala Val Pro 65 70 75 80 Thr Val Glu Arg Ala Gly Ala Asn Ala Glu Val Val Thr Phe Gly Glu 85 90 95 Ser Ala Leu Asn Gly Phe Val Asp Ser Leu Asn Ser Val Ala Asp Gln 100 105 110 Ala Asp Glu Gln Val Thr Gly Trp Tyr Ala Asp Ile Ala Asp Asp Ser 115 120 125 Val Val Ile Thr Val Arg Glu Gly Gly Thr Ala Ala Ala Glu Ala Leu 130 135 140 Val Ala Arg Ala Gly Val Asp Glu Arg Ala Val Arg Val Thr Lys Ser 145 150 155 160 Asp Glu Arg Pro Gln Leu Phe Thr Asp Ile Ile Gly Gly Asn Pro Tyr 165 170 175 Tyr Phe Asp Gly Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Arg Gly 180 185 190 Ser Glu Ser Gly Phe Ala Thr Ala Gly His Cys Gly Glu Glu Gly Thr 195 200 205 Glu Thr Ser Asp Pro Glu Gly Thr Val Ala Gly Ala Tyr Phe Pro Gly 210 215 220 Arg Asp Met Gly Trp Val Arg Ile Thr Asp Ala Asp Thr Val Thr Pro 225 230 235 240 Leu Val Asn Arg Tyr Asn Gly Glu Asn Val Thr Val Ala Gly Ser Arg 245 250 255 Glu Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ser Thr Thr Gly 260 265 270 Trp Arg Cys Gly Thr Ile Arg Ser Lys Asn Gln Thr Val Arg Tyr Ile 275 280 285 Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly 290 295 300 Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Gly Gln Gly Val 305 310 315 320 Thr Ser Gly Gly Ser Gly Asn Cys Thr Leu Gly Gly Val Thr Tyr Phe 325 330 335 Gln Pro Leu Asn Pro Leu Leu Ser His Phe Asp Leu Asp Leu Val Thr 340 345 350 Gly Ala <210> 69 <211> 383 <212> PRT <213> Unknown <220> <223> Actinorugispora endophytica <400> 69 Met Lys Arg Ser Ser Val Phe Arg Ala Leu Gly Gly Thr Ile Leu Thr 1 5 10 15 Ala Gly Leu Val Ile Thr Ala Ala Pro Phe Ala Ser Ala Ala Pro Val 20 25 30 His Thr Glu Thr Thr Pro Thr Ala Ala Glu Ala Gly Asp Gln Leu Ser 35 40 45 Ala Leu Lys Arg Asp Leu Gly Leu Ser Thr Ala Glu Val Glu Glu Leu 50 55 60 Gln Ala Ala Glu Ala Glu Ala Met Asp Val Glu Glu Gly Leu Arg Glu 65 70 75 80 Thr Leu Gly Ser Asp Phe Gly Gly Ala His Phe Asp Ile Asp Ser Gly 85 90 95 Glu Leu Thr Val Ser Val Thr Asp Ala Ala Ala Val Ser Thr Val Glu 100 105 110 Ala Ala Gly Ala Asn Ala Glu Val Val Asp Phe Gly Glu Pro Ala Leu 115 120 125 Asp Ala Ile Val Glu Asp Leu Asn Thr Val Ala Glu Glu Ala Asp Asp 130 135 140 Ser Val Thr Gly Trp Tyr Val Asp Thr Ala Asp Asp Ser Val Val Ile 145 150 155 160 Thr Val Leu Glu Gly Asp Thr Glu Ala Ala Glu Ala Leu Val Ala Glu 165 170 175 Ala Asp Val Asp Gly Lys Ala Val Arg Val Glu Glu Thr Thr Glu Gln 180 185 190 Pro Lys Leu Leu Ala Asn Val Ile Gly Gly Asn Ala Tyr Tyr Phe Gly 195 200 205 Gly Tyr Arg Cys Ser Val Gly Phe Ser Val Arg His Ser Ser Gly Pro 210 215 220 Gly Phe Ala Thr Ala Gly His Cys Gly Asp Val Gly Thr Arg Thr Thr 225 230 235 240 Ser Pro Thr Gly Thr Ile Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met 245 250 255 Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn 260 265 270 Arg Tyr Asn Gly Ser Tyr Ile Thr Val Thr Gly Ser Ser Glu Ala Ala 275 280 285 Asn Gly Ser Ser Val Cys Arg Ser Gly Ser Thr Thr Gly Trp His Cys 290 295 300 Gly Thr Ile Gln Ser Lys Asn Gln Thr Val Asn Tyr Ala Glu Gly Ser 305 310 315 320 Val Ala Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser 325 330 335 Gly Gly Ser Trp Leu Thr Gly Thr Gln Ala Gln Gly Val Thr Ser Gly 340 345 350 Gly Ser Gly Asn Cys Thr Trp Gly Gly Thr Thr Tyr Phe Gln Pro Ile 355 360 365 Asn Pro Leu Leu Ser Tyr Phe Asn Leu Thr Leu Val Thr Gly Ala 370 375 380 <210> 70 <211> 375 <212> PRT <213> Unknown <220> <223> Spinactinospora alkalitolerans <400> 70 Met Arg Lys Ser Pro Ile Ile Arg Ala Val Gly Gly Ala Ala Ile Thr 1 5 10 15 Phe Gly Leu Val Ile Ala Ala Ala Pro Phe Ala Ser Ala Asp Ser Gly 20 25 30 Ser Glu Thr Thr Ala Gly Ser Val Gly Gln Leu Gly Ala Met Gln Arg 35 40 45 Asp Leu Gly Leu Ser Ala Thr Glu Ala Thr Ala Leu Leu Asp Gln Glu 50 55 60 Glu Gln Ala Arg Thr Leu Glu Gly Glu Leu Arg Glu Thr Leu Gly Gly 65 70 75 80 Asp Phe Gly Gly Ala Val Phe Asp Ile Glu Ser Gly Glu Leu Thr Val 85 90 95 Ser Val Thr Asp Glu Asp Ala Val Asp Glu Val Arg Glu Ala Gly Ala 100 105 110 Glu Ala Glu Val Val Thr Tyr Gly Glu Gln Arg Leu Asp Ala Ile Val 115 120 125 Asp Asp Leu Asn Ala Thr Glu Asp Thr Ala Asp Glu Ser Val Thr Gly 130 135 140 Trp Tyr Val Asp Thr Ala Asp Asp Ser Val Val Val Thr Val Met Glu 145 150 155 160 Gly Glu Glu Ala Ala Ala Glu Lys Leu Ile Ala Thr Ala Asp Val Glu 165 170 175 Gly Thr Ala Val Arg Val Glu Glu Thr Thr Glu Gln Pro Glu Thr Phe 180 185 190 Ala Asp Ile Ile Gly Gly Asn Ala Tyr Tyr Pro Gly Ser Ser Arg Cys 195 200 205 Ser Ile Gly Phe Ala Val Gln Gly Gly Phe Val Thr Ala Gly His Cys 210 215 220 Gly Ser Thr Gly Thr Arg Thr Ser Ser Pro Ser Gly Thr Val Ala Gly 225 230 235 240 Ser Trp Phe Pro Gly Arg Asp Met Gly Trp Val Arg Thr Gly Ser Gly 245 250 255 Asp Thr Pro Arg Pro Trp Val Asn Asn Tyr Arg Gly Gly Tyr Val Thr 260 265 270 Val Ala Gly Ser Gln Glu Ala Gly Ile Gly Ser Ser Val Cys Arg Ser 275 280 285 Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ser Lys Asn Gln 290 295 300 Thr Val Arg Tyr Ser Gln Gly Ser Val Tyr Gly Leu Thr Arg Thr Ser 305 310 315 320 Ala Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp Val Thr Gly Asn 325 330 335 Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Thr Trp Gly 340 345 350 Gly Thr Thr Tyr Phe Gln Pro Val Asn Pro Ile Leu Ser Gln Tyr Gly 355 360 365 Leu Arg Leu Val Thr Gly Ala 370 375 <210> 71 <211> 376 <212> PRT <213> Unknown <220> <223> Nocardiopsis composta <400> 71 Met Arg Lys Ser Pro Tyr Ile Pro Leu Leu Gly Ala Ser Val Leu Ala 1 5 10 15 Leu Gly Met Ile Ala Ala Ser Pro Thr Ala Ala Ser Ala Asp Glu Ala 20 25 30 Thr Asp Ser Ser Pro Ala Arg Ala Leu Ala Ser Gly Leu Asp Met Ser 35 40 45 Thr Ala Gln Ala Ala Glu Leu Leu Asp Ala Glu Ala Gln Ala Arg Thr 50 55 60 Ala Glu Gln Glu Ala Arg Glu Leu Ala Gly Ala Ser Phe Ala Gly Ala 65 70 75 80 Val Phe Asp Ala Asp Thr Arg Lys Leu Thr Val Ser Val Thr Asp Ala 85 90 95 Ala Ala Ala Glu Ala Val Gln Ala Thr Gly Ala Glu Thr Arg Val Val 100 105 110 Glu Ala Ser Ala Asp Glu Leu Asp Ala Ala Val Ala Asp Leu Asn Ala 115 120 125 Glu Glu Arg Gly Leu Gly Ser Glu Ile Asp Gly Val Thr Gly Trp Tyr 130 135 140 Val Asp Gln Ala Ala Asn Glu Leu Val Val Thr Val Leu Asp Gly Glu 145 150 155 160 Thr Glu Ala Ala Glu Thr Leu Leu Asp Glu Ala Gly Val Asp Ser Val 165 170 175 Pro Val Arg Val Asp Gln Gly Ala Glu Gln Pro Glu Thr Phe Gly Asp 180 185 190 Ile Val Gly Gly Asn Ala Tyr Tyr Pro Gly Gly Ser Arg Cys Ser Ile 195 200 205 Gly Phe Ser Val Gln Gly Gly Phe Ala Thr Ala Gly His Cys Gly Ser 210 215 220 Gln Gly Thr Arg Val Thr Gly Gly Ala Gly Glu Ser Gly Thr Val Ala 225 230 235 240 Gly Ser Ile Phe Pro Gly Arg Asp Met Gly Trp Val Arg Val Asn Ser 245 250 255 Gly Trp Asn Pro Ser Pro Tyr Val Asn Asn Tyr Ser Gly Gly Arg Val 260 265 270 Leu Val Thr Gly Ser Gln Glu Ala Ser Val Gly Ala Ser Val Cys Arg 275 280 285 Ser Gly Ser Thr Thr Gly Trp Arg Cys Gly Thr Ile Gln Ala Lys Asn 290 295 300 Gln Thr Val Arg Tyr Pro Glu Gly Thr Val Asn Gly Leu Thr Arg Thr 305 310 315 320 Thr Ala Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp Leu Ser Gly 325 330 335 Asn Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser Ser 340 345 350 Gly Gly Thr Thr Phe Phe Gln Pro Leu Asn Pro Ile Leu Ser Gln Trp 355 360 365 Gly Leu Thr Leu Thr Thr Gly Ala 370 375 <210> 72 <211> 376 <212> PRT <213> Unknown <220> <223> Nocardiopsis potens <400> 72 Met Arg Lys Ser Pro Tyr Ile Ser Phe Leu Gly Ala Ser Ala Leu Ala 1 5 10 15 Leu Gly Met Ile Ala Ala Ser Pro Ala Ala Ala Ser Ala Asp Glu Ala 20 25 30 Ala Asp Thr Ser Pro Ala Glu Ala Leu Ala Ser Gly Leu Asp Met Ser 35 40 45 Ala Ser Gln Ala Ala Asp Leu Leu Asp Ala Glu Ala Glu Ala Arg Gly 50 55 60 Thr Glu Ala Glu Ala Arg Glu Ala Ala Gly Gly Ser Phe Ala Gly Ala 65 70 75 80 Val Phe Asp Ala Glu Ser Gln Val Leu Thr Val Ser Val Thr Asp Ala 85 90 95 Ala Ala Ala Glu Ala Val Glu Ala Thr Gly Ala Glu Thr Arg Val Val 100 105 110 Glu Ala Ser Glu Asp Glu Leu Asp Ser Ala Val Ser Asp Leu Asn Ala 115 120 125 Glu Glu Ser Ser Leu Gly Ser Ala Ile Glu Gly Val Thr Gly Trp Tyr 130 135 140 Val Asp Pro Ala Ala Asn Glu Val Val Val Thr Val Leu Asp Gly Glu 145 150 155 160 Thr Ala Ala Ala Glu Thr Leu Leu Asp Glu Ala Gly Val Asp Gly Val 165 170 175 Pro Val Arg Ile Asp Glu Gly Ala Glu Gln Pro Glu Thr Phe Gly Asp 180 185 190 Ile Val Gly Gly Asn Ala Tyr Tyr Pro Gly Gly Ser Arg Cys Ser Ile 195 200 205 Gly Phe Ser Val Gln Gly Gly Phe Ala Thr Ala Gly His Cys Gly Ser 210 215 220 Gln Gly Thr Arg Val Thr Gly Gly Ala Gly Glu Ser Gly Thr Val Ala 225 230 235 240 Gly Ser Ile Phe Pro Gly Arg Asp Met Gly Trp Val Arg Val Asn Ser 245 250 255 Gly Trp Asn Pro Ser Pro Tyr Val Asn Asn Tyr Ser Gly Gly Arg Val 260 265 270 Leu Val Thr Gly Ser Gln Glu Ala Ser Val Gly Ala Ser Ile Cys Arg 275 280 285 Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Lys Asn 290 295 300 Gln Thr Val Arg Tyr Pro Gln Gly Thr Val Asn Gly Leu Thr Arg Thr 305 310 315 320 Asn Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp Ile Ser Gly 325 330 335 Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser Thr 340 345 350 Gly Gly Thr Thr Phe Tyr Gln Pro Ile Asn Pro Ile Leu Ser Gln Trp 355 360 365 Gly Leu Thr Leu Thr Thr Gly Ala 370 375

Claims (15)

  1. 서열번호 54로 기재되는 아미노산 서열을 기준으로 12번 위치에 상응하는 아미노산의 타이로신(Y)으로의 치환을 포함하고, 서열번호 54로 기재되는 아미노산 서열과 70% 이상 100% 미만의 상동성 또는 동일성을 가지는 아미노산 서열을 포함하는, 세린 프로테아제 변이체.
  2. 삭제
  3. 제1항에 있어서, 상기 변이체는 서열번호 54로 기재되는 아미노산 서열과 75% 이상 100% 미만의 상동성 또는 동일성을 가지는, 세린 프로테아제 변이체.
  4. 삭제
  5. 삭제
  6. 제1항에 있어서, 상기 세린 프로테아제 변이체는 서열번호 71 또는 72로 기재되는 아미노산 서열을 기준으로 201번 위치에 상응하는 아미노산의 치환을 포함하는, 세린 프로테아제 변이체.
  7. 제1항에 있어서, 상기 세린 프로테아제 변이체는 서열번호 70으로 기재되는 아미노산 서열을 기준으로 203번 위치에 상응하는 아미노산의 치환을 포함하는, 세린 프로테아제 변이체.
  8. 제1항에 있어서, 상기 세린 프로테아제 변이체는 서열번호 70 내지 72 중 어느 하나로 기재되는 아미노산 서열과 적어도 60% 이상, 100% 미만의 서열 상동성을 가지는, 세린 프로테아제 변이체.
  9. 삭제
  10. 삭제
  11. 제1항, 제3항, 제6항, 제7항 및 제8항 중 어느 한 항의 프로테아제 변이체를 포함하는 조성물.
  12. 제1항, 제3항, 제6항, 제7항 및 제8항 중 어느 한 항의 세린 프로테아제 변이체를 코딩하는 폴리뉴클레오티드.
  13. 제12항의 폴리뉴클레오티드를 포함하는 벡터.
  14. 제1항, 제3항, 제6항, 제7항 및 제8항 중 어느 한 항의 세린 프로테아제 변이체; 상기 변이체를 코딩하는 폴리뉴클레오티드; 및 상기 폴리뉴클레오티드를 포함하는 벡터 중 1 이상을 포함하는, 숙주세포.
  15. 제1항, 제3항, 제6항, 제7항 및 제8항 중 어느 한 항의 세린 프로테아제 변이체; 및 이를 발현하는 미생물 중 하나 이상을 포함하는, 사료용 조성물.
KR1020210032885A 2021-03-12 2021-03-12 신규 세린 프로테아제 변이체 KR102613549B1 (ko)

Priority Applications (8)

Application Number Priority Date Filing Date Title
KR1020210032885A KR102613549B1 (ko) 2021-03-12 2021-03-12 신규 세린 프로테아제 변이체
CA3175414A CA3175414A1 (en) 2021-03-12 2022-03-11 Novel serine protease variant
CN202280004542.9A CN115698280A (zh) 2021-03-12 2022-03-11 新的丝氨酸蛋白酶变体
TW111108938A TW202237835A (zh) 2021-03-12 2022-03-11 新穎絲胺酸蛋白酶變異體
PCT/KR2022/003415 WO2022191653A1 (ko) 2021-03-12 2022-03-11 신규 세린 프로테아제 변이체
JP2022562328A JP2023521203A (ja) 2021-03-12 2022-03-11 新規セリンプロテアーゼ変異体
US17/997,455 US20230174964A1 (en) 2021-03-12 2022-03-11 Novel serine protease variant
EP22767549.3A EP4116416A4 (en) 2021-03-12 2022-03-11 NEW VARIANT OF SERINE PROTEASE

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210032885A KR102613549B1 (ko) 2021-03-12 2021-03-12 신규 세린 프로테아제 변이체

Publications (2)

Publication Number Publication Date
KR20220128171A KR20220128171A (ko) 2022-09-20
KR102613549B1 true KR102613549B1 (ko) 2023-12-13

Family

ID=83228190

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210032885A KR102613549B1 (ko) 2021-03-12 2021-03-12 신규 세린 프로테아제 변이체

Country Status (8)

Country Link
US (1) US20230174964A1 (ko)
EP (1) EP4116416A4 (ko)
JP (1) JP2023521203A (ko)
KR (1) KR102613549B1 (ko)
CN (1) CN115698280A (ko)
CA (1) CA3175414A1 (ko)
TW (1) TW202237835A (ko)
WO (1) WO2022191653A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116904428B (zh) * 2023-09-11 2024-01-02 中国农业科学院北京畜牧兽医研究所 一种改良高温碱性蛋白酶AprThc的稳定性的方法及突变体

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10619177B2 (en) 2014-12-01 2020-04-14 Novozymes A/S Method for producing a protein hydrolysate

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100534660B1 (ko) 2003-12-30 2005-12-08 주식회사 해찬들 단백질 분해효소 생성량이 증가된 메주의 제조방법 및 된장
KR100620092B1 (ko) 2004-12-16 2006-09-08 씨제이 주식회사 코리네박테리움 속 세포로부터 유래된 신규한 프로모터서열, 그를 포함하는 발현 카세트 및 벡터, 상기 벡터를포함하는 숙주 세포 및 그를 이용하여 유전자를 발현하는방법
US7618801B2 (en) * 2007-10-30 2009-11-17 Danison US Inc. Streptomyces protease
US9801398B2 (en) * 2012-01-26 2017-10-31 Novozymes A/S Use of polypeptides having protease activity in animal feed and detergents
AU2014214032A1 (en) * 2013-02-06 2015-07-09 Novozymes A/S Use of polypeptides having protease activity in animal feed
KR101632642B1 (ko) 2015-01-29 2016-06-22 씨제이제일제당 주식회사 신규한 프로모터 및 그의 용도
ES2907694T3 (es) 2016-08-31 2022-04-26 Cj Cheiljedang Corp Nuevo promotor y uso del mismo
CN110381746B (zh) * 2016-12-21 2023-12-01 杜邦营养生物科学有限公司 使用热稳定丝氨酸蛋白酶的方法
KR102316445B1 (ko) * 2019-11-29 2021-10-26 씨제이제일제당 주식회사 신규 세린 프로테아제 변이체

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10619177B2 (en) 2014-12-01 2020-04-14 Novozymes A/S Method for producing a protein hydrolysate

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NCBI, GenBank accession no. WP_067965505.1, S1 family peptidase [Nocardiopsis trehalosi] 2020.04.17

Also Published As

Publication number Publication date
WO2022191653A1 (ko) 2022-09-15
US20230174964A1 (en) 2023-06-08
TW202237835A (zh) 2022-10-01
JP2023521203A (ja) 2023-05-23
CA3175414A1 (en) 2022-09-15
CN115698280A (zh) 2023-02-03
EP4116416A4 (en) 2023-10-11
EP4116416A1 (en) 2023-01-11
KR20220128171A (ko) 2022-09-20

Similar Documents

Publication Publication Date Title
AU782372B2 (en) Subtilase variants having an improved wash performance on egg stains
KR20120051705A (ko) 형질 전환체 및 그의 제조 방법, 및 락트산의 제조 방법
CN111926042B (zh) 一种树突状细胞制剂及其应用
KR102613549B1 (ko) 신규 세린 프로테아제 변이체
KR102402604B1 (ko) 신규 세린 프로테아제 변이체
CN1836035B (zh) 改进的蛋白酶及其制备方法
KR101614679B1 (ko) 돼지 생식기 호흡기 증후군 바이러스의 키메릭 변이주
CN102002509A (zh) 一种大肠杆菌-枯草芽孢杆菌穿梭表达载体及其应用
KR101756338B1 (ko) L-시스테인 생산용 변이미생물 및 이를 이용한 l-시스테인의 제조방법
CN110944656A (zh) 编码人类fkrp蛋白的新型多核苷酸
CA2319096C (en) Method for treating acute intermittent porphyria (aip) and other porphyric diseases
US20030199077A1 (en) Subtilase variants having an improved wash performance on egg stains
CN113046369B (zh) 一种新型冠状病毒的mRNA疫苗
US5700665A (en) Method for the extraction of periplasmic proteins from prokaryotic microorganisms in the presence of arginine
CN109251897A (zh) 一种猪圆环病毒3型毒株及其制备方法和应用
CN114716520B (zh) 一种库德里阿兹威毕赤酵母三羧酸转运蛋白及其编码基因与应用
KR20220169517A (ko) 흰 반점 증후군 바이러스 외피 단백질을 발현하는 형질전환 미세조류를 유효성분으로 포함하는 흰 반점 증후군의 예방 또는 개선용 사료첨가제 조성물 및 이의 용도
KR102454110B1 (ko) ppGpp 생합성 관련 유전자 발현의 저해물질 탐색용 재조합 플라스미드 및 돌연변이 균주
CN111206024B (zh) 一种表达果胶酸内切水解酶的工程菌及其应用
CN110607267B (zh) 一种绵羊李斯特菌平衡致死系统、构建方法及应用
CN114907997B (zh) 薯蓣皂素合成菌株构建及应用
CN101880652A (zh) 表达猪干扰素(α、β或γ)的重组新城疫弱毒疫苗株
KR20120043657A (ko) 인간 혈액응고 7인자의 대량 생산 방법
CN111560392B (zh) miRNA表达载体及其应用
CN101870963A (zh) 表达狗干扰素(α、β或γ)的重组新城疫弱毒疫苗株

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right