KR20190088483A - 신규 엔도-β-N-아세틸글루코사미니다아제 - Google Patents

신규 엔도-β-N-아세틸글루코사미니다아제 Download PDF

Info

Publication number
KR20190088483A
KR20190088483A KR1020197015649A KR20197015649A KR20190088483A KR 20190088483 A KR20190088483 A KR 20190088483A KR 1020197015649 A KR1020197015649 A KR 1020197015649A KR 20197015649 A KR20197015649 A KR 20197015649A KR 20190088483 A KR20190088483 A KR 20190088483A
Authority
KR
South Korea
Prior art keywords
leu
ser
ala
gly
ile
Prior art date
Application number
KR1020197015649A
Other languages
English (en)
Other versions
KR102399639B1 (ko
Inventor
하나코 이토
야스노리 오노
겐스케 나카무라
Original Assignee
다이이찌 산쿄 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 다이이찌 산쿄 가부시키가이샤 filed Critical 다이이찌 산쿄 가부시키가이샤
Publication of KR20190088483A publication Critical patent/KR20190088483A/ko
Application granted granted Critical
Publication of KR102399639B1 publication Critical patent/KR102399639B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • C12N1/205Bacterial isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/005Glycopeptides, glycoproteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01096Mannosyl-glycoprotein endo-beta-N-acetylglucosaminidase (3.2.1.96)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/185Escherichia
    • C12R2001/19Escherichia coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/785Mucor

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Mycology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명은, 리조무코르 (Rhizomucor) 속의 진균으로부터 단리된 고온 조건하에서 활성을 유지하는 신규의 엔도-β-N-아세틸글루코사미니다아제, 그 다양한 변이 효소, 당해 효소를 코드하는 유전자, 재조합 플라스미드, 당해 플라스미드에 의해 형질 전환된 형질 전환체 등을 제공한다.

Description

신규 엔도-β-N-아세틸글루코사미니다아제
본 발명은, 고온 조건하에서 활성을 유지하는 엔도-β-N-아세틸글루코사미니다아제, 당해 효소를 코드하는 유전자, 재조합 플라스미드, 당해 플라스미드에 의해 형질 전환된 형질 전환체 등에 관한 것이다.
당 단백질은 동식물의 조직, 진핵 미생물의 세포막, 벽 등에 널리 존재하고 있다. 최근, 당 단백질의 당 사슬이, 세포의 분화, 암화, 세포간의 인식 등의 기구에 중요한 역할을 하고 있는 것이 밝혀지고 있고, 그 기구 해명을 위해서 당 사슬의 구조와 기능의 상관에 대하여 연구가 진행되고 있다. 신약 개발 연구에 있어서는, 항체 등 당 단백질에 포함되는 당 사슬을 균일한 구조의 당 사슬로 치환하는 당 사슬 리모델링이나, 펩티드나 저분자 화합물을 당 사슬 수식하는 등의 시도가 진행되고 있다. 이와 같은 신약 개발 연구에 있어서는, 천연에 존재하는 균일한 당 사슬을 갖는 당 단백질/당 펩티드로부터 엔도-β-N-아세틸글루코사미니다아제 등의 효소를 사용하여 잘라진 당 사슬이 사용되는 경우가 많다.
동물의 당 단백질에 포함되는 당 사슬의 대표적인 것으로서, 아스파라긴 측사슬에 결합하는 N 결합형 당 사슬을 들 수 있다. N 결합형 당 사슬은, 그 구조에 따라, 고만노오스형, 혼성형 및 복합형으로 분류되는데, 공통의 구조로서 환원 말단에 GlcNAc 가 2 개 연결된 키토비오스 구조를 갖는다. 엔도-β-N-아세틸글루코사미니다아제는, 이 키토비오스 구조 사이의 글리코시드 결합을 가수 분해하는 활성과 잘라낸 당 사슬을 특정한 구조를 갖는 억셉터에 결합시키는 당 전이 활성을 겸비하는 효소이다. 엔도-β-N-아세틸글루코사미니다아제는, 다양한 생물종으로부터 분리되어, 각각 상이한 기질 특이성을 가지고 있고, 목적에 따라 구분하여 사용되고 있다. 그 중에서 복합형 당 사슬을 기질로 하는 엔도-β-N-아세틸글루코사미니다아제로는 이하의 것이 보고되어 있다.
Endo-M 은, 무코르 히말리스 (Mucor hiemalis) 유래의 효소로서, 그 기질 특이성은 고만노오스형의 Man8GlcNAc2 에 대한 활성을 100 % 로 했을 때에, 복합형 2 분기 당 사슬 (agalacto biantennary PAsugar) 에 대하여 4.4 % 이다 (비특허문헌 1 : Fujita et al., (2004) Arch Biochem Biophy. 432 : p41 - 49). 동문헌에 있어서, Endo-M 의 대장균을 사용한 발현에 대해서는, 37 ℃ 에서의 발현 유도에서는 모두 불용성 응집체가 되고, 유도 온도를 20 ℃ 로 변경하면, 가용성 획분의 효소 활성이 약한 것이었기 때문에, 효모에 의한 발현을 검토했던 것이 보고되어 있고, 대장균에서의 적절한 발현은 어려운 것으로 생각되고 있었다. 또한, 40 ℃ 이상에서 실활하는 것이 알려져 있다.
Endo-Om 은, 효모인 오가테아 미누타 (Ogataea minuta) 유래의 효소 (특허문헌 1 : WO2013/051608호 또는 US2014-0313246호) 로서, 복합형 당 사슬을 기질로 하는 것, 가수 분해 반응에 있어서의 지적 온도는, 50 ℃ 라고 보고되어 있다. 효모 이외에서의 발현에 대해서는 알려져 있지 않다.
Endo-F2 및 Endo-F3 은, 엘리자베스킹기아 미리콜라 (Elizabethkingia miricola) 유래의 효소로서 (비특허문헌 2 : Tarentino AL et al., (1993) J Biol Chem. 268 : p9702 - 9708), Endo-F2 는 고만노오스형 및 2 분기 복합형 당 사슬을 가수 분해하지만, 혼성형 당 사슬의 가수 분해 활성은 없다. 한편, Endo-F3 은, 2 분기 또는 3 분기 복합형 당 사슬을 가수 분해하지만, 고만노오스형, 혼성형 당 사슬의 가수 분해 활성은 없다.
Endo-S 는, 스트렙토코커스 피오게네스 (Streptococcus pyogenes) 유래의 효소로서, 2 분기 복합형 당 사슬만을 가수 분해하지만, 고만노오스형, 혼성형 당 사슬의 가수 분해 활성은 없다 (비특허문헌 3 : Goodfellow JJ et al., (2012) J Am Chem Sci.134 : p8030 - 8033).
Endo-CE 는, 씨노랩디티스 엘레강스 (Caenorhabditis elegans) 유래의 효소로서, 고만노오스형 및 2 분기의 복합형 당 사슬을 가수 분해하지만, 혼성형 당 사슬을 절단할 수 있는지 여부는 불명하다 (비특허문헌 4 : Kato T et al., (2002) Glycobiology 12 : p581 - 587). 가수 분해 반응에 있어서의 지적 온도는, 20 ℃ 라고 보고되어 있다.
Endo-CC 는, 종래 알려져 있던 Endo-M 이나 Endo-Om 과 비교하여, 대장균에 있어서의 발현이 가능한 것으로 보고된 효소인데, 비특허문헌 5 (Y. Eshima et al., (2015) PLoS One.21 ; 10(7) : e0132859) 에 있어서는, 대장균에서의 발현량이 0.1 ㎎/250 ㎖ 배양 (= 0.4 ㎎/ℓ 배양) 으로서 보고되어 있다. 가수 분해 반응에 있어서의 지적 온도는, 35 ℃ 라고 보고되어 있다.
잘라낸 당 사슬을 의약품 원료로서 사용하는 경우, 반응 효율의 향상이나 잡균 혼입 방지의 관점에서 50 ℃ 정도의 고온에서 활성을 유지하는 효소가 요망되고 있다. 또한, 의약품의 원재료로서, 복수종의 유전자 재조합 재료가 사용되는 경우에, 숙주 생물종을 정렬함으로써, 의약품의 안전성의 문제가 저감되는 것으로 여겨지고 있다. 이와 같은 원재료의 숙주로서 대장균이 선택되는 경우가 많아, 대장균에서 일정량 이상의 생산능을 갖는 것이 바람직하다. 그러나, 공지된 복합형 당 사슬을 기질로 하는 엔도-β-N-아세틸글루코사미니다아제에 대하여 고온 조건에서 활성을 유지하고, 또한, 대장균에서 양호한 생산능을 나타내는 것은 알려져 있지 않았다.
호열성 진균의 일종인 리조무코르 푸실루스 (Rhizomucor pusillus (R. 푸실루스)) 는, 지적 생육 온도가 35 ∼ 45 ℃ 이고, 치즈 제조용 레닛의 생산균으로서 알려져 있다. R. 푸실루스의 게놈 서열에 대해서는, R. 푸실루스 CBS 183.67 주 유래의 서열 정보가 Genozymes Project (Concordia University) 의 데이터베이스 상에 공개되어 있다. 동데이터베이스에는, Endo-M 과 41.56 % 의 상동성을 가지는 유전자 및 거기에 코드되는 아미노산 서열 (서열 번호 7) 이 등록되어 있었지만, 활성에 관한 아노테이션은 기재되어 있지 않고, 지금까지 R. 푸실루스 유래의 엔도-β-N-아세틸글루코사미니다아제를 실제로 취득한 보고는 없다. 또한, 데이터베이스 상에서 엔도-β-N-아세틸글루코사미니다아제라고 추정된 서열 번호 7 의 아미노산 서열 (이하, 「공지 추정 서열」 이라고 한다) 은, 191 위치 ∼ 198 위치의 아미노산 서열이, Leu-Ala-Asn-Thr-Tyr-Tyr-Ile-Arg (LANTYYIR) 였다.
WO2013/051608호 또는 US2014-0313246호
Fujita et al., (2004) Arch Biochem Biophy. 432 : p41 - 49 Tarentino AL et al., (1993) J Biol Chem. 268 : p9702 - 9708 Goodfellow JJ et al., (2012) J Am Chem Sci. 134 : p8030 - 8033 Kato T et al., (2002) Glycobiology 12 : p581 - 587 Y. Eshima et al., (2015) PLoS One.21 ; 10(7) : e0132859
본 발명은, 대장균에 의해 생산이 가능한, 고온 조건하에서 복합형 당 사슬에 대한 가수 분해 활성을 유지하는 신규의 엔도-β-N-아세틸글루코사미니다아제를 제공하는 것을 목적으로 한다.
본 발명자들은, 상기 과제를 해결하기 위해서 예의 연구를 거듭한 결과, 리조무코르 푸실루스에 속하는 복수의 균주의 배양 상청이 고온 조건하에서 복합 당 사슬에 대하여 양호한 가수 분해 활성을 갖는 것, 당해 균주로부터 클로닝된 엔도-β-N-아세틸글루코사미니다아제가, 대장균을 사용한 산생계에서 양호한 발현 효율을 나타내고, 산생된 효소가 당해 가수 분해 활성을 유지하는 것을 알아내고, 더욱 연구를 진행시킴으로써, 본 발명을 완성하기에 이르렀다.
본 발명은, 이하의 발명을 제공한다.
(1) 이하의 (A) 및 (B) 의 특성을 갖는 폴리펩티드 ;
(A) 서열 번호 1 에 기재된 아미노산 서열과 75 % 이상의 동일성 및 95 % 이상의 유사성을 갖는 아미노산 서열을 포함하고, 또한, 서열 번호 7 의 아미노산 서열과는 상이한 아미노산 서열이다 ;
(B) 복합 당 사슬에 대한 가수 분해 활성 및/또는 당 전이 활성이, 45 ∼ 60 ℃ 의 어느 온도에서 최대 활성값의 40 % 이상을 나타낸다.
(2) 이하의 (A) 및 (B) 의 특성을 갖는 (1) 의 폴리펩티드 ;
(A) 서열 번호 1 에 기재된 아미노산 서열과 75 % 이상의 동일성 및 95 % 이상의 유사성을 갖는 아미노산 서열을 포함하고, 또한, 서열 번호 1 의 아미노산 번호 191 ∼ 195 의 아미노산 서열에 상당하는 아미노산 서열이, Leu-Ala-Lys-Leu-Leu (LAKLL) 이다 ;
(B) 복합 당 사슬에 대한 가수 분해 활성이, 45 ∼ 60 ℃ 의 어느 온도에서 최대 활성값의 40 % 이상을 나타낸다.
(3) 50 ℃에 있어서의 복합 당 사슬에 대한 가수 분해 활성이, 최대 활성값의 60 % 이상을 나타내는 것을 특징으로 하는, (1) 의 폴리펩티드.
(4) (A) 및 (B) 의 특성에 더하여, 추가로 (C) 대장균을 사용한 유전자 재조합 발현에 있어서, 10 ㎎/ℓ 배양 이상을 나타내는 것을 특징으로 하는, (1) ∼ (3) 의 어느 하나의 폴리펩티드.
(5) 서열 번호 1 의 아미노산 서열에 있어서, 아미노산 번호 54 ∼ 341 의 영역에 있어서의 서열 동일성이, 85 % 이상인 것을 특징으로 하는, (1) ∼ (4) 의 어느 하나의 폴리펩티드.
(6) D276, V223, W225, Y247 및 W248 의 아미노산 중 적어도 1 개가 유지되어 있는 것 (바람직하게는, 적어도 D276 이 유지되어 있는 것) 을 특징으로 하는 (1) ∼ (5) 의 어느 하나의 폴리펩티드.
(7) 서열 번호 1 의 아미노산 서열로 이루어지는 폴리펩티드, 또는, 서열 번호 1 의 아미노산 서열에 있어서, A128T, D333G, I434L, V460A, I527V, K569T, F610S 및 H626R 로 이루어지는 군에서 선택되는 적어도 1 개의 변이를 갖는 아미노산 서열로 이루어지는 폴리펩티드인 것을 특징으로 하는, (1) ∼ (3) 의 어느 하나의 폴리펩티드.
(8) 서열 번호 1 ∼ 6 의 어느 하나의 아미노산 서열로 이루어지는 것을 특징으로 하는, (1) 의 폴리펩티드.
(9) 특성 (A) 를 충족하는 아미노산 서열을 갖고, 서열 번호 23 에 나타나는 변이의 적어도 1 개를 갖는 것을 특징으로 하는, (1) ∼ (6) 의 어느 하나의 폴리펩티드.
(10) N172, D176, Y214, S216, L245, N246, T275, L306, F307 및 A310 에서 선택되는 적어도 1 개의 아미노산에 변이를 갖고, 증강된 당 사슬 전이 활성을 갖는 것을 특징으로 하는, (9) 의 폴리펩티드.
(11) 이하의 군에서 선택되는 적어도 1 개의 변이를 갖는 것을 특징으로 하는 (7) 의 폴리펩티드 ;
N172 가 Gln, Asp, Gly, Ala, Phe, Cys, His, Ile, Ser, Thr, Val 또는 Met 로 치환된 변이, D176 이 Arg 로 치환된 변이, Y214 가 Phe 로 치환된 변이, S216 이 Val 로 치환된 변이, L245 가 Ser 로 치환된 변이, N246 이 Asp 로 치환된 변이, T275 가 Ile 로 치환된 변이, F283 이 Ser 로 치환된 변이, L306 이 Ile 로 치환된 변이, F307 이 Tyr 로 치환된 변이, A310 이 Asp 로 치환된 변이, 및, E314 가 Gln 으로 치환된 변이.
(12) W278 이 Phe 또는 Tyr 로 치환된 변이를 갖는 것을 특징으로 하는 (9) ∼ (11) 의 어느 하나의 폴리펩티드. 더욱 구체적인 변이체로는, 서열 번호 1 ∼ 6 의 어느 아미노산 서열에 있어서, N172Q, N172D, W278F, N172Q/W278F, N172D/W278F, 또는, Y214/L306I/L307Y 의 변이를 갖는 것을 특징으로 하는 (11) 의 폴리펩티드.
(13) (1) ∼ (12) 의 어느 하나의 폴리펩티드를 코드하는 폴리뉴클레오티드.
(14) 서열 번호 8 ∼ 17 의 뉴클레오티드 번호 1 ∼ 2088 의 뉴클레오티드 서열, 및 서열 번호 18 ∼ 19 의 뉴클레오티드 번호 1 ∼ 2091 의 뉴클레오티드 서열의 어느 뉴클레오티드 서열을 갖는, (13) 의 폴리뉴클레오티드.
(15) (13) 또는 (14) 의 폴리뉴클레오티드를 포함하는 발현용 플라스미드.
(16) (15) 의 플라스미드로 형질 전환된 숙주 세포.
(17) 서열 번호 9, 11, 13, 15 혹은 17 의 뉴클레오티드 번호 1 ∼ 2088 의 뉴클레오티드 서열, 또는, 서열 번호 19 의 뉴클레오티드 번호 1 ∼ 2091 의 뉴클레오티드 서열, 을 포함하는 폴리뉴클레오티드를 포함하는 플라스미드로 형질 전환된 대장균인, (16) 의 숙주 세포.
(18) (16) 또는 (17) 의 숙주 세포를 배양하고, 얻어진 배양물로부터 (1) ∼ (12) 의 어느 폴리펩티드를 회수하는 공정을 포함하는, (1) ∼ (12) 의 어느 하나의 폴리펩티드의 제조 방법.
(19) (1) ∼ (12) 의 어느 하나의 폴리펩티드를 함유하는 시약.
본 발명의 신규의 엔도-β-N-아세틸글루코사미니다아제는, 50 ℃ 이상의 고온 반응 조건에 있어서 복합형 당 사슬에 대한 양호한 가수 분해 활성을 유지하기 때문에, 당해 효소를 이용한 의약품 제조에 있어서 박테리아의 증식을 방지하여, 높은 반응 효율을 기대할 수 있는 고온 조건하에서, 당 사슬을 안전 그리고 효율적으로 취득하는 것이 가능하다. 또한, 본 발명의 효소는, 대장균을 사용한 이종 발현계에 의해, 양호한 효소량에서의 생산이 가능하다. 의약품의 제조에 사용하는 경우에, 당해 효소 이외의 원재료 (생리 활성 펩티드/단백질, 다른 효소 등) 가 대장균에 의해 산생되어 있는 경우에, 생물 재료의 숙주 생물종을 정렬함으로써, 최종 제품의 안전성에 대한 원료의 숙주 생물종에 의한 영향의 평가가 용이해진다.
도 1 은 Endo-Rp 에 의한 SGP 를 기질로 한 가수 분해 반응의 모식도를 나타낸다.
도 2 는 SGP 의 효소 처리 전 용액 (위) 및 미정제 효소 처리액 (아래) 의, 분석 조건 A 에 의한 LC-MS 분석 결과의 차트이다. 3 ∼ 4 분에 검출되는 큰 피크는 SGP 를 나타내고, 4.5 ∼ 5 분 부근에 검출되는 피크는 SG(10) 을 나타낸다.
도 3 은 각종 R. 푸실루스 주 유래의 미정제 효소 (NBRC 9740 (△), NBRC 9741 (▲), NBRC 9742 (□) 및 NBRC 9743 (■)) 및 Endo-M (●) 의, SGP 에 대한 가수 분해 활성의 온도 의존성을 나타내는 그래프이다. X 축은 반응 온도 (℃), Y 축은 가수 분해율, 을 각각 나타낸다.
도 4 는 Endo-Rp 와 그 각종 호모로그, Endo-Rm, 및, 공지된 추정 서열의 아미노산 서열의 얼라이먼트를 나타낸다.
도 5 는 Endo-Rp (0), Endo-M (●), Endo-S (■) 및 Endo-Om (▲) 의, SGP 에 대한 가수 분해 활성의 시간 경과적 변화를 나타내는 그래프이다. X 축은 반응 개시 후의 경과 시간, Y 축은 가수 분해율을 나타낸다.
도 6 은 Endo-Rp 의 SGP 에 대한 가수 분해 활성의 온도 의존성을 나타내는 그래프이다. X 축은 반응 온도 (℃), Y 축은 가수 분해율, 을 각각 나타낸다.
도 7 은 Endo-Rp 의 SGP 에 대한 가수 분해 활성의 pH 의존성을 나타내는 그래프이다. X 축은 반응액의 pH 치, Y 축은 가수 분해율, 을 각각 나타낸다.
도 8 은 SGP 단독 (위) 및 SGP + 억셉터 ((GlcNAc-)Asn) (아래), 의 Endo-Rp 반응액의 LC-MS 분석 결과의 차트이다. 1 분 부근에 검출되는 큰 피크는 SGP 를 나타내고, 4 ∼ 5 분 부근에 검출되는 피크는 SG(10) 을 나타내고, 3 분 부근에 검출되는 피크는 (SG-)Asn 을 나타낸다.
도 9 는 Endo-Rp (○) 및 Endo-Rp N172Q (■) 의 당 전이 활성의 시간 경과적 변화를 나타내는 그래프이다. X 축은, 효소 반응 개시 후의 경과 시간 (시간), Y 축은 당 전이율 (%) 을 나타낸다.
이하에, 본 발명을 상세하게 설명한다.
본 발명은, 이하의 (A) 및 (B) 의 특성 ;
(A) 서열 번호 1 《Endo-Rp 아미노산 서열》 에 기재된 아미노산 서열과 75 % 이상의 동일성 및 95 % 이상의 유사성을 갖는 아미노산 서열을 포함하고, 또한, 서열 번호 7 의 아미노산 서열과 상이한 아미노산 서열이다 ;
(B) 복합형 당 사슬에 대한 가수 분해 활성 및/또는 당 전이 활성이, 45 ∼ 60 ℃ 의 범위에서 최대 활성값의 40 % 이상을 나타낸다 ;
을 갖는 폴리펩티드인 엔도-β-N-아세틸글루코사미니다아제를 제공한다.
본 발명에 있어서, 「복합형 당 사슬」 이란, 사람형 N 결합 당 사슬 중 하기 식 (I) 및 (II) 로 이루어지는 기본 구조를 갖는 당 사슬을 의미한다. 당해 당 사슬에 있어서, 환원 말단에 가까운 위치에 있는 만노오스 (β 만노오스) 로부터 분기된 2 개의 분기 사슬 (1-3 사슬, 1-6 사슬) 에 GlcNAc 를 갖는 구조로 되어 있고, 그 비환원 말단측에 있어서의 갈락토오스의 유무, 시알산의 유무, 추가로 이들 결합 이성이나 위치 이성을 포함하는 다채로운 구조를 갖는 것이다. 또한, 이 기본 구조를 갖는 한, 다른 분기 구조를 가지고 있어도 되고, 비환원 말단측의 당의 수산기의 일부 혹은 시알산의 카르보닐기에 대하여 화학적으로 수식을 가한 구조를 가지고 있어도 된다. 이와 같은 화학 수식된 복합형 당 사슬의 예로서, SGP 의 시알산의 디올을 산화 개열 후, 옥심화에 의해 수식한 SGP 가, Endo-M 의 기질이 되는 것이 보고되어 있다 (Org. Biomol. Chem, 2016, 14, 9501 - 9518).
[화학식 1]
Figure pct00001
[화학식 2]
Figure pct00002
대표적인 복합형 당 사슬로는, 계란의 노른자로부터 추출되는 시알릴글리코펩티드 (SGP : 하기 식 (III) 및 (IV)) 에 포함되는 당 사슬 부분 (SG) 을 들 수 있다. SGP 는, 조류의 노른자로부터 정제할 수 있지만, 정제된 SGP 가 시판되고 있고, 예를 들어 도쿄 화성 공업 (주) 등으로부터 구입할 수도 있다.
[화학식 3]
Figure pct00003
[화학식 4]
Figure pct00004
본 발명에 있어서, 「엔도-β-N-아세틸글루코사미니다아제」 란, 기질이 되는 당 사슬을 인식하고, 가수 분해 활성과 당 전이 활성을 겸비하는 효소이다. 천연형의 엔도-β-N-아세틸글루코사미니다아제는, 양방의 활성을 겸비하지만, 아미노산 서열을 개변함으로써, 그들의 활성을 조정하고, 어느 일방의 활성을 증강 또는 감약시킨 변이체나 어느 활성을 소실시킴으로써, 가수 분해 활성 또는 당 전이 활성만을 유지하는 효소를 제작할 수도 있다. 본 발명은, 천연형뿐만 아니라, 이들의 변이 효소도 포함한다.
본 발명의 효소가 갖는 가수 분해 활성은, 상기의 복합형 당 사슬의 환원 말단측의 2 개가 연속한 GlcNAc 로 이루어지는 코어 키토비오스에 포함되는 β1, 4 글리코시드 결합을 특이적으로 가수 분해하는 활성 (본 명세서에 있어서, 특별히 언급이 없는 한, 「가수 분해 활성」 이란, 이 활성을 의미한다) 이다. 예를 들어, SGP 를 기질로 한 엔도-β-N-아세틸글루코사미니다아제에 의한 가수 분해 반응에 있어서는, 도 1 에 나타내는 바와 같이, SG 의 환원 말단의 GlcNAc 를 제외한 구조로 이루어지는 SG(10) (하기 식 (V) 및 (VI) 의 구조) 이 생성된다.
[화학식 5]
Figure pct00005
[화학식 6]
Figure pct00006
당해 효소의 당 전이 활성은, 당으로서 GlcNAc 만을 갖는 분자 또는 비환원 말단에 GlcNAc 를 갖는 당 사슬을 포함하는 분자 (이하, 「억셉터 분자」 라고 한다) 에, 환원 말단에 GlcNAc 를 갖고 당 사슬 도너에서 유래하는 당 사슬의 환원 말단을 β1, 4 글리코시드 결합시키는 활성 (이하, 「당 전이 활성」 이라고 한다) 이다. 예를 들어, 하기 식 (VII) 의 구조를 갖는 (GlcNAc-)Asn 을 억셉터 분자, SGP 를 도너 분자로 한 당 전이 반응에 있어서는, 억셉터 분자의 GlcNAc 에 SGP 에서 유래하는 SG(10) 이 전이함으로써, 하기 식 (VIII) 로 나타내는 (SG-)Asn 이 생성된다. 동일하게, 하기 식 (IX) 의 구조를 갖는 GlcNAc-AcA 를 억셉터 분자, SGP 를 도너 분자로 한 당 전이 반응에 의해, 하기 식 (X) 에 나타내는 SG-A 가 생성된다.
[화학식 7]
Figure pct00007
[화학식 8]
Figure pct00008
[화학식 9]
Figure pct00009
[화학식 10]
Figure pct00010
<효소·아미노산 서열>
본 발명의 효소는, 상기의 특성을 갖는 것이면, 실시예에서 취득된 구체적인 서열의 효소에 한정되는 것이 아니고, 천연으로부터 분리된 효소여도 되고, 본 발명의 효소의 서열 정보에 기초하여 인위적으로 제작 또는 개변된 효소여도 된다. 천연으로부터 분리하는 경우, 그 분리원으로 하는 생물종은 특별히 한정되지 않지만, 바람직하게는 진균이고, 보다 바람직하게는 호열성 진균이고, 더욱 바람직하게는 리조무코르 (Rhizomucor) 속의 진균이고, 더욱 보다 바람직하게는 리조무코르 푸실루스 또는 리조무코르 미에헤이 (Rhizomucor miehei) 에 속하는 진균이다.
본 발명에 있어서, 호열성 진균인 리조무코르 푸실루스 (R. 푸실루스) 에 속하는 복수의 균주로부터, 본 특성을 갖는 엔도-β-N-아세틸글루코사미니다아제가 클로닝되어, 각각, R. 푸실루스 NBRC 9742 주에서 유래하는 효소를 Endo-Rp (아미노산 서열 ; 서열 번호 1, 균주 유래 핵산 서열 : 서열 번호 8), NBRC 9740 주에서 유래하는 효소를 Endo-Rp2 (아미노산 서열 : 서열 번호 2, 균주 유래 핵산 서열 : 서열 번호 10), NBRC 9741 주에서 유래하는 효소를 Endo-Rp3 (아미노산 서열 : 서열 번호 3, 균주 유래 핵산 서열 : 서열 번호 12), NBRC 9743 주에서 유래하는 효소를 Endo-Rp4 (아미노산 서열 : 서열 번호 4, 균주 유래 핵산 서열 : 서열 번호 14), 라고 명명하였다. 상기 서술한, R. 푸실루스의 균주는, 모두 NBRC 로부터 입수할 수 있고, 그 원산지는 모두 일본이다.
한편으로, R. 푸실루스의 게놈 공개주의 서열 정보에 기초하여, 엔도-β-N-아세틸글루코사미니다아제의 추정 아미노산 서열로서 공개되어 있던 서열 번호 7 의 아미노산 서열 (추정 핵산 서열 : 서열 번호 20) 에 대하여, 그 핵산 서열을 대장균 발현계에 최적화하여 대장균에서 발현시킨 결과, 효소의 발현을 거의 확인할 수 없고, 효소 활성도 매우 낮은 것이었다 (실시예 3). 이 서열 번호 7 의 아미노산 서열에서는, 서열 번호 1 의 193 번째의 Lys 에 상당하는 아미노산이 Asn-Thr-Tyr-Tyr-Ile-Arg 의 아미노산으로 치환된 서열 (도 4 참조) 이다. 이 서열 번호 7 의 193 ∼ 198 의 Asn-Thr-Tyr-Tyr-Ile-Arg 를 서열 번호 1 과 동일하게 Lys 로 치환한 아미노산 서열 (서열 번호 5) 로 이루어지는 Endo-Rp5 는 대장균에 있어서의 적절한 발현과 가수 분해 활성이 확인되고, 이 아미노산 서열을 갖는 효소를 Endo-Rp5 라고 명명하였다. 이것으로부터, 서열 번호 1 의 191 ∼ 195 번째에 상당하는 서열은, 본 발명의 효소의 특성에 있어서 매우 중요한 영역인 것으로 동정된다.
또한, R. 푸실루스의 유연종인 리조무코르 미에헤이 (R. 미에헤이) 의 공개되어 있는 게놈 정보 (R. 미에헤이 CAU432 주) 에 대하여, 본 발명에서 특정된 Endo-Rp 의 서열 정보에 기초하여 관련 서열을 특정하고, 해당하는 단백질을, 대장균 발현용으로 핵산 서열을 최적화하여 대장균에서 발현시킨 결과, 본 발명의 효소 활성을 갖는 효소가 일정량 산생되는 것이 확인되고, 이 효소를 Endo-Rm (아미노산 서열 : 서열 번호 6, 진균 유래 핵산 서열 : 서열 번호 18) 이라고 명명하였다.
Endo-Rp 와 그 호모로그인 Endo-Rp2, Endo-Rp3, Endo-Rp4 및 Endo-Rp5 의 아미노산 서열의 동일성은 99 % 이상이고, Endo-Rp2 는 서열 번호 1 에 A128T 및 K569T 의 변이를 갖는 호모로그이고, Endo-Rp3 은 서열 번호 1 에 D333G, I434L, I527V, K569T, F610S 및 H626R 의 변이를 갖는 호모로그이고, Endo-Rp4 는 서열 번호 1 에, V460A 및 K569T 의 변이를 갖는 호모로그이고, Endo-Rp5 는 서열 번호 1 에 K569T 의 변이를 갖는 호모로그이다. Endo-Rm 의 아미노산 서열은, 서열 번호 1 의 아미노산 서열과 96 % 의 유사성, 77 % 의 동일을 나타내는 것이다. 이 서열에 있어서 54 ∼ 340 번째의 영역에 있어서의 동일성은 높고 (동일성 : 89 %, 유사성 : 97 %)), 190 번째 내지 195 번째의 His-Leu-Ala-Lys-Leu-Leu (HLAKLL) 는 완전 동일하여, 본 발명의 효소의 특성 (A) 를 충족하는 것이다.
본 발명의 효소가 진균에서 유래하는 효소인 경우, 그 단백질은, 진균의 배양 상청 혹은 균체 파쇄액으로부터 단리한 것이어도 되고, 대장균, 효모 등의 이종 발현계를 사용하여 발현시킨 효소여도 된다. 공지된 엔도-β-N-아세틸글루코사미니다아제의 대부분은 대장균을 사용한 이종 발현계에서의 생산량이 적은 것이 알려져 있는 데에 반하여, 본 발명의 효소의 아미노산 서열은, 대장균을 사용한 발현계에 있어서 양호한 생산 효율을 나타낸다는 특성을 갖는다. 진균 유래의 단백질을 대장균에서 발현시키는 경우, 그 핵산 서열을 대장균 발현에 적합한 서열로 최적화하는 것이 일반적으로 실시된다. 이와 같은 최적화를 한 경우에도, 예를 들어 Endo-M N175Q (1 아미노산 변이체) 의 대장균에서의 생산량은, 3.7 ㎎/ℓ 배양이었다. 또한, Endo-CC 에서는 0.4 ㎎/ℓ 배양인 것이 보고되어 있다. 이에 반하여, 본 발명의 효소의 대장균에 있어서의 발현량은, 10 ㎎/ℓ 배양 이상 (바람직하게는, 12 ㎎/ℓ 배양 이상, 보다 바람직하게는 15 ㎎/ℓ 배양 이상으로, 종래의 효소보다 우수한 대장균에서의 생산 효율을 나타낸다. 실시예 4 의 공지 추정 서열 (서열 번호 7) 과 Endo-Rp5 (서열 번호 5) 의 대장균에서의 생산 효율의 결과가 나타내는 바와 같이, 이 특성은 아미노산 서열 (특히, 서열 번호 1 의 아미노산 번호 191 ∼ 195 를 포함하는 영역이고, 그 중에서도 192 ∼ 194 의 서열, 특히 193 번째의 Lys) 에 의해 부여되는 특성인 것으로 생각할 수 있다.
본 발명의 효소의 아미노산 서열은, 서열 번호 1 의 전체 길이 아미노산 서열과 75 % 이상의 동일성 및 95 % 이상의 유사성을 나타내는 아미노산 서열을 포함하고, 또한, 서열 번호 7 과 상이한 아미노산 서열 (바람직하게는, 서열 번호 1 의 아미노산 번호 193 에 상당하는 아미노산이 Lys (바람직하게는 아미노산 번호 192 ∼ 194 의 아미노산 서열에 상당하는 아미노산 서열이, Ala-Lys-Leu (AKL), 보다 바람직하게는 아미노산 번호 191 ∼ 195 의 아미노산 서열에 상당하는 아미노산 서열이, Leu-Ala-Lys-Leu-Leu (LAKLL))) 이다.
아미노산 서열의 동일성 (identity) 이란, 대응하는 아미노산이 완전하게 일치하는 아미노산을 동일한 아미노산으로 하여, 전체 길이 서열에 대한 아미노산의 일치 비율을 수치화한 것이다. 한편으로, 아미노산 서열의 유사성 (similarity) 이란, 대응하는 아미노산이 유사한 성질을 갖는 아미노산이면, 그 유사성을 고려하여, 2 개의 아미노산 서열의 관계성을 수치화하는 것이다. 본 발명에 있어서의 서열의 동일성 및 유사성은 서열 해석 소프트웨어인 GENETYX-SV/RC (주식회사 제네틱스 제조) 를 사용하여 산출되는 것으로, 이 알고리즘은, 당해 기술 분야에서 통상적으로 사용되는 것이다.
Endo-Rp 의 활성 도메인은, 결정 구조 해석이 실시되고 있는 Endo-A (Zhenlian Ling et al, Journal of Molecular Biology (2009), Vol.389, No.1, Pages 1 - 9) 와의 서열 비교로부터, 서열 번호 1 의 아미노산 번호 1 ∼ 374 의 영역인 것으로 추찰되었다. 실제, 본 발명의 효소 (Endo-Rp 1 ∼ 5, Endo-Rm) 의 아미노산 서열과 서열 번호 1 의 서열 동일성으로서, 전체 길이 서열의 비교에서는 75 % 이상이지만, 활성 도메인이라고 추측되는 영역 중의 서열 번호 1 의 아미노산 번호 54 ∼ 341 번째의 영역에 있어서의 동일성은 89 % 로 매우 높은 동일성을 나타냈다. 또한, 전체 길이의 아미노산 서열의 동일성으로서, 바람직하게는, 80 % 이상이고, 보다 바람직하게는 90 % 이상이고, 더욱 보다 바람직하게는 95 % 이상이고, 가장 바람직하게는 99 % 이상이다. 또한, 서열 번호 1 의 아미노산 번호 54 내지 341 의 영역의 동일성으로서, 바람직하게는 85 % 이상이고, 보다 바람직하게는 90 % 이상이고, 더욱 바람직하게는 95 % 이상이고, 더욱 보다 바람직하게는 98 % 이상이고, 가장 바람직하게는 이 영역의 아미노산 서열이 완전 동일하다.
본 명세서에 있어서, 분자 중에 포함되는 아미노산의 표기법은, 본 분야의 관례에 따라, 변이 지점을 나타내는 경우에는 야생형의 아미노산 (또는 핵산) 의 1 문자 표기와 그 번호 (예를 들어, 172 번째의 Asn 이면 「N172」) 에 의해 나타낸다. 또한, 변이에 대해서는, 야생형의 아미노산 (또는 핵산) 의 1 문자 표기, 그 번호 및 변이 후의 아미노산 (또는 핵산) 의 1 문자 표기 (예를 들어, 172 번째의 Asn 이 Gln 으로 치환된 변이는 「N172Q」) 에 의해 나타낸다. 또한, 변이를 갖는 특정한 변이체는, 분자명과 변이 (예를 들어, Endo-Rp 의 172 번째 Asn 이 Gln 으로 치환된 변이체는, 「Endo-Rp N172Q」) 에 의해 나타내고, 복수의 변이를 갖는 경우에는, 변이의 사이를 「/」 로 단락 짓는 형 (예를 들어, Endo-Rp N172Q 에 있어서, 278 번째의 Trp 가 Phe 로 치환된 추가 변이를 갖는 변이체는, 「Endo-Rp N172Q/W278F」) 라고 나타낸다.
본 발명의 효소는, 서열 번호 1 과 일정 이상의 동일성·유사성을 유지하는 한, 아미노산의 변이 (치환), 결실, 삽입 및/또는 부가가 일어나고 있어도 되지만, 적어도 서열 번호 1 에 있어서 서열 번호 7 의 193 ∼ 198 에 상당하는 서열이 Asn-Thr-Tyr-Tyr-Ile-Arg 와는 상이한 서열이고, 바람직하게는 서열 번호 1 의 193 번째 (바람직하게는 192 ∼ 194 번째, 보다 바람직하게는 191 ∼ 195 번째) 의 아미노산에 상당하는 부위가 서열 번호 1 과 완전 동일한 아미노산 서열을 갖는 것이다. 또한, 실시예 8 의 결과로부터, 서열 번호 1 의 D276 의 아미노산을 변이시킨 경우, 가수 분해 활성 및 당 전이 활성의 양방이 대략 소실하고, 또한, E126A, V223R, W225H, Y247F, W248N 의 각 변이체에 대해서는 양방의 활성이 대폭으로 감약하였다. 이것으로부터, 이들 아미노산에 대해서도 서열 번호 1 과 유사 또는 동일한 아미노산인 것이 바람직하다. 이와 같이 서열 번호 1 과 완전 동일한 아미노산 서열을 나타내는 영역은, 바람직하게는 아미노산 번호 118 ∼ 332 번째의 영역, 보다 바람직하게는 54 ∼ 341 번째의 영역이고, 더욱 바람직하게는 1 ∼ 374 번째의 영역이다.
본 발명의 효소에 있어서, 상기 서술한 서열 동일성/유사성을 유지하고, 상기 서술한 완전 동일 영역을 제외하고, 서열 번호 1 ∼ 6 의 아미노산 서열의 어떠한 영역에 있어서도, 수 지점 (바람직하게는 5 개 지점 이하, 보다 바람직하게는 3, 2 또는 1 개 지점) 에 있어서, 1 개 지점 당 몇 개 (바람직하게는 10 개 이하, 보다 바람직하게는 7 개 이하, 더욱 바람직하게는 5, 4, 3, 2 또는 1 개) 의 아미노산이 치환, 결실, 삽입 및/또는 부가하고 있어도 된다. 이와 같은 아미노산의 결실은, 예를 들어, 서열 번호 1 ∼ 6 의 어느 아미노산 서열의 N 말단 및/또는 C 말단으로부터 몇 개의 아미노산을 결실시킨 경우에도, 본 발명의 효소로서의 특성을 유지하는 폴리펩티드가 얻어지는 것을 생각할 수 있다. 특히, 서열 번호 1 의 375 보다 C 말단측의 영역은, 활성 도메인이 아니기 때문에, 많은 아미노산의 변경 (치환, 결실, 삽입 및/또는 부가) 이 허용된다. 또한, 아미노산의 부가에 대해서는, 서열 번호 1 ∼ 6 의 어느 아미노산 서열의 N 말단 및/또는 C 말단에 활성에 영향을 주지 않는 것이 알려져 있는 아미노산 또는 펩티드를 부가한 폴리펩티드를 들 수 있고, 이와 같은 부가 펩티드로는 단백 정제의 목적으로 부가되는 태그 펩티드 (His 태그, GST 태그 등) 를 들 수 있다.
본 발명의 효소에 있어서의 아미노산 변이의 위치로는, 적어도 서열 번호 23 에 있어서 Xaa 라고 표시되는 위치의 적어도 1 개에 변이를 갖는 효소가, 가수 분해 활성 및 당 전이 활성의 적어도 1 개를 유지하는 것이 확인되어 있다. 본 효소는, 서열 번호 1 의 아미노산 번호 1 ∼ 374 가 활성 도메인이라고 추측되지만, 공지된 Endo 효소의 구조 활성 상관의 지견, 및 본 발명의 개시 내용에 기초하여, 활성 도메인에 변이를 가지면서, 활성을 유지 또는 원하는 활성으로 튜닝된 변이체를 설계할 수 있다.
본 발명의 효소에 대해서는, 각종 호모로그의 결과로부터, 서열 번호 1 의 A128, D333, I434, V460, I527, K569, F610 및 H626 에 있어서, 아미노산의 치환이 허용된다. 또한, 실시예 8 에 나타내는 바와 같이, 활성 도메인의 아미노산을 치환한 많은 변이체가 제작되고, 그 대부분이 야생형 Endo-Rp 와 비교하여 겉보기의 활성은 저하했지만, 당 사슬 수식에 이용 가능한 정도의 일정한 가수 분해 활성 및/또는 당 전이 활성을 유지 (적어도, 어느 일방의 활성의 비활성값이 야생형 Endo-Rp 의 0.5 % 이상) 하는 것이 확인되어, 이 영역에 있어서도 일정한 아미노산 치환이 허용되는 것이 확인되었다. 구체적으로는, 이하의 아미노산 변이가 허용된다.
N172 는, 기질과 접촉하는 활성 잔기인 것으로 생각되지만, Trp, Arg 및 Tyr 이외의 아미노산으로의 치환이면, 활성이 유지되었기 때문에, 부피가 큰 구조의 측사슬을 갖는 아미노산 이외의 아미노산으로의 치환이 널리 허용된다. 또한, Gln, Asp 와 같은 극성이 높은 측사슬을 갖는 아미노산이나 Gly, Ala, Phe, Cys, His, Ile, Ser, Thr, Val, Met 등으로의 치환에 의해, 전이 활성 비율 (전이 활성/가수 분해 활성) 이 증강되는 것이 확인되었다.
D176 은, Arg 로 치환해도 활성이 유지되었기 때문에, 많은 아미노산으로의 치환을 허용하는 것으로 생각된다. 또한, Arg 로의 치환은 전이 활성 비율을 증강시킨 변이체의 제작에 유용하다.
Y214 는, Ala 와 같은 작은 측사슬의 아미노산에서는 양방의 활성이 크게 저하하기 때문에, 비교적 큰 구조의 측사슬을 갖는 아미노산을 허용한다. Phe 로의 치환은 전이 활성 비율을 증강시킨 변이체의 제작에 유용하다.
S216 은, 작은 측사슬을 갖는 아미노산 (바람직하게는, Ala 또는 Val) 으로 치환함으로써, 당 전이 활성을 유지하고, 가수 분해 활성을 저하시키기 때문에, 이들 변이는 전이 활성 비율을 증강시킨 변이체의 제작에 유용하다.
L245 는, Ser 로 치환해도 활성이 유지되었기 때문에, 많은 아미노산으로의 치환을 허용하는 것으로 생각된다. 또한, Ser 로의 치환은 전이 활성 비율을 증강시킨 변이체의 제작에 유용하다.
N246 은, 큰 변화를 잘 허용하지 않는 것으로 생각되지만 Asp 로의 치환에 의해 전이 활성을 유지한 채로 가수 분해 활성을 크게 저하시켰기 때문에, 이와 같은 변이는 전이 활성 비율을 증강시킨 변이체의 제작에 유용하다.
T275 는, Ile 로 치환해도 활성이 유지되었기 때문에, 많은 아미노산으로의 치환을 허용하는 것으로 생각된다. 또한, Ile 로의 치환은 전이 활성 비율을 증강시킨 변이체의 제작에 유용하다.
W278 은, 기질 당 사슬과의 소수적 상호 작용이 활성에 기여하는 것으로 생각되고 있고, Tyr, Phe, Ala, Leu, Ile 등의 소수성이 높은 측사슬을 갖는 아미노산을 허용하는 것으로 생각된다.
F283 은, Ser 로 치환해도 활성이 유지되었기 때문에, 많은 아미노산으로의 치환을 허용하는 것으로 생각된다. 또한, Ser 로의 치환은 전이 활성 비율을 증강시킨 변이체의 제작에 유용하다.
L306 은, Ile 로의 치환에 의해 크게 활성의 변동은 볼 수 없지만, 당 전이 활성을 유지하고, 가수 분해 활성을 저하시키는 경향을 볼 수 있었기 때문에, 전이 활성 비율을 증강시킨 변이체의 제작에 유용한 것으로 생각된다. 또한, 추측되는 입체 구조로부터, 부피가 큰 측사슬을 갖는 아미노산이나 하전한 측사슬의 아미노산은 바람직하지 않을 가능성이 있다.
F307 은, His, Tyr 등 다양한 아미노산을 허용하는 것으로 생각된다. 이 His, Tyr 로의 치환에 의해 당 전이 활성보다 가수 분해 활성을 크게 저하시키기 때문에, 전이 활성 비율을 증강한 변이체의 제작에 유용하다.
A310 은, 극성 잔기 또는 하전 잔기를 측사슬에 갖는 아미노산 (바람직하게는, Asp, Glu, Lys, Ser 등) 으로 치환함으로써, 당 전이 활성보다, 가수 분해 활성을 보다 크게 저하시키기 때문에, 이들 변이는, 전이 활성 비율을 증강한 변이체의 제작에 유용하다.
E314 는, Gln 으로 치환해도 큰 활성의 변동은 없어, 치환을 허용하는 것으로 생각된다.
아미노산의 치환/변이에 대하여, 바람직하게는, 본 발명의 특성 (A) 를 충족하고, 또한, 서열 번호 23 에 나타나는 변이 (서열 번호 1 의 A128, N172, D176, Y214, S216, L245, N246, T275, W278, F283, L306, F307, A310, E314, D333, I434, V460, I527, K569, F610 및 H626) 에서 선택되는 적어도 1 개 또는 복수의 아미노산에 있어서 치환을 갖는 아미노산 서열이고, 보다 바람직하게는 서열 번호 1 에 있어서 A128T (Rp2), D333G (Rp3), I434L (Rp3), V460A (Rp4), I527V (Rp3), K569T (Rp2-4), F610S (Rp3) 및 H626R (Rp3) 에서 선택되는 적어도 1 개의 변이를 갖는 아미노산 서열, 혹은, 그들 아미노산 서열에 있어서 추가로 N172, D176, Y214, S216, L245, N246, T275, W278, F283, L306, F307, A310 및 E314, 의 적어도 1 개의 아미노산에 변이를 갖는 아미노산 서열이고, 복수의 변이가 동시에 일어나고 있어도 되고, 모든 변이를 포함하는 것도 본 발명의 효소에 포함된다.
엔도-β-N-아세틸글루코사미니다아제는, 가수 분해 활성과 당 전이 활성을 겸비하기 때문에, 강한 가수 분해 활성을 유지하는 효소는, 전이 활성에 의해 억셉터 분자에 전이시킨 당 사슬도 기질로서 가수 분해하게 되기 때문에, 원하는 당 전이체를 적절히 취득할 수 없는 경우가 있다. 그 때문에, 당 사슬 수식 화합물의 합성에 있어서는, 이와 같은 전이형 변이 효소도 중요하다.
상기 서술한 바와 같이 서열 번호 1 의, N172, D176, Y214, S216, L245, N246, T275, F283, L306, F307, A310 및 E314 에 있어서의 변이의 몇 가지는, 본 발명의 효소의 당 전이 활성을 향상시키거나, 또는, 당 전이 활성과 비교하여 가수 분해 활성을 보다 크게 저하시키는 것이 확인되어 있다. 그 때문에, 이들 변이는 전이 활성 비율 (전이 활성/가수 분해 활성) 을 향상시킨 전이형 변이 효소를 설계하기 위해서 유용하고, 본 발명은 이와 같은 전이형 변이 효소도 제공한다. 구체적인 전이형 변이 효소에 있어서의 변이로는, 서열 번호 1 에 있어서, N172 가 Gln 또는 Asp 로 치환된 변이, D176 이 Arg 로 치환된 변이, Y214 가 Phe 로 치환된 변이, S216 이 Val 로 치환된 변이, L245 가 Ser 로 치환된 변이, T275 가 Ile 로 치환된 변이, W278 이 Phe 또는 Tyr 로 치환된 변이, F283 이 Ser 로 치환된 변이, L306 이 Ile 로 치환된 변이, F307 이 Tyr 로 치환된 변이, A310 이 Asp 로 치환된 변이, E314 가 Gln 으로 치환된 변이, 를 들 수 있다. 본 발명의 당 전이형 변이 효소에 채용되는 변이로는, 이들 중 적어도 1 개가 채용되어 있으면 되고, 단독의 변이여도 되고, 이들 변이를 복수 포함하는 다중 변이체여도 된다. 바람직한 변이체는, N172Q, N172D, W278F, N172Q/W278F, N172D/W278F, 또는, Y214/L306I/F307Y 이다.
<가수 분해 활성·당 전이 활성>
본 발명의 효소는, 복합형 당 사슬을 가수 분해 및/또는 당 전이하는 활성을 갖고, 그 활성은, 45 ∼ 60 ℃ 의 어느 온도에 있어서 최대 활성값의 40 % 이상을 나타낸다는 특성을 갖는다.
본 발명의 효소는, 다양한 복합형 당 사슬을 기질로 하여 가수 분해하는 활성을 갖는데, 효소를 특정하기 위한 지표로는, 이하의 방법에 의해, SGP 를 기질로 하여 가수 분해하여, SG(10) 을 산생하는 활성에 의해 평가된다.
가수 분해 반응은, 종농도 200 mM 의 칼륨인산 버퍼 (pH 6.25), 69 mM SGP, 및 0.02 μM 의 효소 (블랭크 (blank) 에는 동량의 버퍼를 첨가) 를 포함하는 반응액 (총용량 100 ㎕) 을 조제하고, 소정의 온도에서 18 시간 인큐베이트한다. 얻어진 반응액 및 블랭크액을 LC-MS 로 분석하여 SGP 및 SG(10) 을 정량하고, 이하의 식에 의해 가수 분해율 및 비활성을 산출한다.
[LC-MS 분석 조건 A]
MS 장치 : 6130 Quadrupole LC-MS (Agilent Technologies 사)
이온화 : ESI
모드 : 포지티브
HPLC : 1260 인피니티 LC (Agilent Technologies 사)
칼럼 : Inertsil ODS-3 3 ㎛ φ3.0 × 50 ㎜ (GL 사이언스사)
칼럼 온도 : 40 ℃
이동상 A : H2O + 0.1 % HCOOH
이동상 B : 아세토니트릴 + 0.1 % HCOOH
그래디언트 (이동상 B %) : 0 % (0 분), 10 % (5 분), 30 % (7 분)
유속 : 0.6 ㎖/분
[가수 분해율]
가수 분해율은, 이하의 식으로 산출된다.
가수 분해율 (%) = 반응 후의 SG(10) 농도 (M)/블랭크의 SGP 농도 (M) x 100
[비활성]
비활성은, 이하의 식으로 산출된다.
비활성 (μ㏖/분/㎍) = 생성된 SG(10) 량 (μ㏖)/반응 시간 (분)/효소량 (㎍)
본 발명의 효소는, 다양한 당 사슬 도너나 억셉터 분자를 인식하여 당 사슬을 전이시키는 활성을 갖는데, 효소를 특정하기 위한 지표로는, 이하의 방법에 의해, SGP 를 기질로 하여 당 사슬을 전이시켜 SG-A 를 산생하는 활성에 의해 평가된다.
전이 반응은, 종농도 1.6 M 의 칼륨인산 버퍼 (pH 6.25), 69 mM SGP, 690 mM GlcNAc-AcA 및 1.0 μM 의 효소 (블랭크에는 동량의 버퍼를 첨가) 를 포함하는 반응액 (총용량 30 ㎕) 을 조제하고, 소정의 온도에서 인큐베이트한다. 반응 1 시간, 2 시간, 4 시간, 8 시간, 24 시간, 48 시간, 및 96 시간의 반응액 및 블랭크액을 LC-MS 로 분석하여 SGP, SG(10) 및 SG-A 를 정량하고, 이하의 식에 의해 가수 분해율 및 비활성을 산출한다.
[LC-MS 분석 조건 B]
MS 장치 : 6130 Quadrupole LC-MS (Agilent Technologies 사)
이온화 : ESI
모드 : 포지티브
HPLC : 1260 인피니티 LC (Agilent Technologies 사)
칼럼 : Inertsil ODS-3 2 ㎛ φ2.1 × 50 ㎜ (GL 사이언스사)
칼럼 온도 : 40 ℃
이동상 A : H2O + 0.1 % HCOOH
이동상 B : 아세토니트릴 + 0.1 % HCOOH
그래디언트 (이동상 B %) : 0.8 % (0 분), 8 % (0.1 분), 8 % (5 분)
유속 : 0.7 ㎖/분
[전이율]
전이율은, 이하의 식으로 산출된다.
전이율 (%) = 반응 후의 SG-A 농도 (M)/블랭크의 SGP 농도 (M) x 100
[비활성]
비활성은, 이하의 식으로 산출된다.
비활성 (μ㏖/분/㎎) = 생성된 SG-A 량 (μ㏖)/반응 시간 (분)/효소량 (㎎)
본 발명의 효소는, 상기의 방법에 의한 가수 분해 활성 및/또는 당 전이 활성 측정을, 예를 들어 10 ℃ ∼ 70 ℃ 사이에서 적절히 온도를 변화 (예를 들어, 2, 3, 5 또는 10 ℃ 간격) 시켜 실시한 경우에 있어서, 모든 온도 조건에서 산출된 활성값의 최대치를 100 % 로 한 경우의, 45 ℃ ∼ 60 ℃ 에서의 어느 온도 (바람직하게는 50 ℃) 에 있어서의 상대 활성값이, 40 % 이상, 바람직하게는 50 % 이상, 보다 바람직하게는 60 % 이상, 더욱 바람직하게는 80 % 이상이고, 가장 바람직하게는 당해 온도 범위에 있어서 최대 활성값을 나타내는 것이다.
비활성은, 통상적으로는 효소의 지적 온도 조건에 있어서 측정된다. 본 발명의 효소는, 높은 비활성을 나타낸다. 예를 들어, Endo-Rp 는, 50 ℃ 에서 69 mM SGP 를 기질로 했을 때, 0.21 μ㏖/분/㎍ 의 비활성을 나타내고, 이것은 Endo-M 의 37 ℃ 에서의 비활성 (0.0071 μ㏖/분/㎍) 의 30 배라는 우수한 활성이다.
본 발명의 효소는, 본 명세서의 실시예에 구체적으로 기재된 효소 및 변이체에 한정되지 않고, 특성 (A) 및 (B) 를 충족하는 한, 다양한 폴리펩티드가 본 발명의 효소에 포함된다. 그 가수 분해 활성 및 당 전이 활성 중 적어도 어느 일방이, 서열 번호 1 의 아미노산 서열로 이루어지는 효소와 상기의 온도 조건에서 비교하여 일정 레벨 이상의 활성을 나타내는 것이면 되고, 바람직하게는 0.5 % 이상이고, 보다 바람직하게는 1 % 이상이고, 더욱 바람직하게는 5 % 이상이고, 더욱 보다 바람직하게는 10 % 이상이고, 가장 바람직하게는 30 % 이상이다.
<유전자>
본 발명은, 추가로 상기의 본 발명의 효소를 코드하는 핵산 서열을 갖는 유전자를 제공한다.
이들 유전자는, 본 효소의 유전자로서 R. 푸실루스 또는 R. 미에헤이의 유전자 정보에 기초하여, 자연계 (예를 들어, 호열성 진균, 바람직하게는 리조무코르 속의 진균, 보다 바람직하게는 R. 푸실루스 또는 R. 미에헤이) 로부터 클로닝할 수도 있다. 또한, 효소의 아미노산 서열에 기초하여, 공지된 유전자 공학적 수법에 따라, 재조합 유전자로서 제작할 수 있다.
본 발명의 효소를 코드하는 핵산 서열은, 서열 번호 1 에 기재된 아미노산 서열과 75 % 이상의 동일성 및 95 % 이상의 유사성을 갖는 아미노산 서열을 포함하고, 또한, 서열 번호 7 의 아미노산 서열과는 상이한 아미노산 서열인 폴리펩티드를 코드하는 서열이다. 이와 같은 핵산 서열의 예로는, 예를 들어, 서열 번호 8, 10, 12, 14, 16 또는 18 (종지 코돈 포함한다) 에 기재된, 진균 자체가 유지하는 핵산 서열이어도 된다. 또한, 효소의 아미노산 서열을 기초로, 예를 들어 GeneArt 스트링스 DNA 단편 (Thermo Fisher Scientific 사 제조) 를 이용하여, 대장균에서의 발현에 최적화된 핵산 서열을 갖는 핵산을 제작할 수 있다. 서열 번호 9, 11, 13, 15, 17 및 19 의 핵산 서열은, 각각 서열 번호 1 (Endo-Rp), 2 (Endo-Rp2), 3 (Endo-Rp3), 4 (Endo-Rp4), 5 (Endo-Rp5) 및 6 (Endo-Rm) 의 아미노산 서열을 기초로 설계된, C 말단에 His 태그 (Hisx6) 를 부가한 효소의 대장균에서의 발현용에 최적화된 핵산 서열이다. 이와 같은 핵산 서열을 참고로 함으로써, 예를 들어 서열 번호 23 의 아미노산 서열과 같은, 다양한 아미노산의 개변을 실시한 폴리펩티드를 대장균에서 효율적으로 발현시키는 핵산 서열을 설계할 수 있다.
본 발명의 효소를 코드하는 핵산 서열의 구체예로는, 서열 번호 8 ∼ 17 의 뉴클레오티드 번호 1 ∼ 2088 및 서열 번호 18 ∼ 19 의 뉴클레오티드 번호 1 ∼ 2091 (바람직하게는, Endo-Rp 또는 그 호모로그를 코드하는 서열 번호 8 ∼ 17 의 뉴클레오티드 번호 1 ∼ 2088) 의 어느 것에 기재된 핵산 서열과 80 % 이상, 바람직하게는 95 % 이상, 보다 바람직하게는 95 %, 더욱 바람직하게는 98 % 이상의 동일성을 나타내는 핵산 서열이고, 각 핵산 서열에 있어서의 570 ∼ 585 의 영역에 있어서는, Leu-Ala-Lys-Leu-Leu 를 코드하는 핵산, 을 들 수 있다.
<효소의 제조·정제>
본 발명은, 또한 상기의 본 발명의 효소를 코드하는 재조합 유전자를 포함하는 플라스미드나 발현 벡터 등의 유전자 구축물, 당해 유전자 구축물에 의해 형질 전환된 숙주 세포, 당해 숙주 세포의 배양물로부터 본 발명의 효소를 회수하는 공정을 포함하는, 본 발명의 효소의 제조 방법 등을 제공한다. 본 발명의 효소를 코드하는 유전자의 도입에 의해 형질 전환된 숙주 세포 (동물 세포, 식물 세포, 대장균, 효모 등, 단백질 산생에 통상적으로 사용되는 세포 등을 적절히 선택할 수 있다) 는, 세포의 종류에 따라 적절한 플라스미드/발현 벡터에 도입되고, 당해 플라스미드/발현 벡터에 의해 대상 세포를 형질 전환하고, 당해 형질 전환 세포를 적절한 조건하에서 배양하고, 그 배양물로부터 본 발명의 효소를 회수할 수 있다.
형질 전환을 위한 유전자 구축물의 제작에는, 통상적으로 유전자 공학의 분야에서 알려져 있는 벡터, 플라스미드를 발현시키는 세포종에 따라 선택하고, 공지된 수법에 따라서 구축할 수 있다. 예를 들어, 대장균으로 발현시킬 때, pET 벡터, pCold 벡터, pFLAG 벡터 등을 채용할 수 있지만, 이것에 한정되지 않는다.
대장균으로는, BL21 (DE3), Origami (DE3) 등을 들 수 있다.
본 발명의 효소를 산생시키기 위한 대장균의 배양 조건으로는, 예를 들어, 형질 전환한 균액을 100 ㎖ 플라스크 중의 25 ㎖ TB 배지 (50 ug/㎖ 카나마이신) 에 접종하고, 37 ℃ 에서 하룻밤 진탕 배양한다 (160 rpm, O/N). 이 전 배양액 20 ㎖ 를 2.5 ℓ 배플이 형성된 플라스크 중의 1 ℓ TB 배지 (50 ug/㎖ 카나마이신, 0.01 % 거품억제제 (antifoam) 204, 2 mM MgSO4) 에 식균하고, 37 ℃ 에서 진탕 배양 (200 rpm, 2 시간) 하고, 인큐베이터의 온도를 16 ℃ 로 낮추어 3 시간 배양한 후, 종농도 0.2 mM 이 되도록 IPTG 를 첨가하고, 24 시간 배양하는 등의 방법을 사용할 수 있지만, 이것에 한정되지 않는다. 배지로는, TB 배지 외에, LB 배지, M9 배지 등 일반적인 배지를 사용할 수 있다.
본 발명의 효소의 회수는, 당해 효소의 물성을 이용하여, 통상적인 정제 수법을 적절히 조합하여 실시하지만, 간편하게 회수하기 위해서, 미리 His 태그나 GST 등의 태그 펩티드를 효소에 연결시킨 형태로 발현시키도록, 유전자 구축물을 설계해 둠으로써, 당해 태그 펩티드의 친화성을 이용한 회수를 실시할 수 있다. 태그 펩티드는, 정제 후에 제거해도 되지만, 효소 활성에 영향이 없는 경우에는, 태그 팹티드를 연결시킨 채의 효소를, 가수 분해 등의 반응에 사용해도 된다. 본 발명의 효소에는, 이와 같은 태그 펩티드가 연결된 아미노산 서열을 갖는 효소를 포함하고, 그 구체예로는, 서열 번호 1 ∼ 6 의 아미노산 서열의 C 말단에, His 태그 (His x 6) 가 결합한 아미노산 서열이다.
본 발명의 효소는, 그 아미노산 서열의 특성 상, 대장균에 있어서의 산생 효율이 양호하다. 본 발명의 효소는, 상기 배양 조건을 사용한 대장균에서의 산생에 있어서, 1 ℓ 배양 당 2 ㎎ 이상의 발현 효율을 나타내지만, 바람직하게는 1 ℓ 배양 당 4 ㎎ 이상이고, 보다 바람직하게는 8 ㎎ 이상이고, 더욱 바람직하게는 12 ㎎ 이상이고, 더욱 보다 바람직하게는 15 ㎎ 이상이다.
실시예
이하, 실시예를 사용하여, 본 발명을 구체적으로 설명한다. 실시예에 나타낸 것은, 본 발명의 실시형태의 일례이고, 본 발명은 이것에 한정되는 것은 아니다.
본 명세서에 기재되어 있는 단백 농도는, 초미량 분광 광도계 NanoDrop1000 (Thermo Fisher Scientific 제조) 혹은 NanoDrop2000 (Thermo Fisher Scientific 제조) 을 사용하여 정량하였다.
본 실시예에 있어서, 효소의 엔도-β-N-아세틸글루코사미니다아제로서의 가수 분해 활성의 측정에 있어서, 반응액 중의 SGP 및 SG(10) 의 검출은 상기 서술한 LC-MS 분석 조건 A 를 채용하고, 상기 서술한 산출식에 의해 가수 분해율, 비활성을 산출하였다.
<실시예 1> R. 푸실루스 유래 엔도-β-N-아세틸글루코사미니다아제의 발견
R. 푸실루스 NBRC 9740, NBRC 9741, NBRC 9742, 및 NBRC 9743 주를 GSYFe 슬랜트 (5 % 글루코오스, 2 % 소이톤, 1 % 효소 추출물 (Yeast extract), 0.05 % FeSO4·7H2O, 1.5 % 한천 (agar)) 에 식균하고, 40 ℃ 에서 5 일간 배양하였다. 균체를 채취하고, 유리제 호모게나이저를 사용하여 2 ㎖ 의 100 mM 칼륨인산 버퍼 (pH 6.25) 중에서 파쇄 후, 필터 멸균한 것을 미정제 효소액으로 하였다.
미정제 효소액 50 ㎕ 에 SGP 3 ㎎ 을 첨가 (종농도 21 mM) 하고, 50 ℃ 에서 인큐베이트하였다. 반응액을 LC-MS 로 해석한 결과, SGP 의 소실과 SG(10) 의 생성이 확인되었기 (도 2) 때문에, R. 푸실루스 NBRC 9742 는 엔도-β-N-아세틸글루코사미니다아제를 갖는 것으로 생각되었다.
또한, 반응 온도를 변화시켜 가수 분해 반응을 실시하고, 각 샘플에 대하여, 가장 반응이 진행된 온도에 있어서의 활성을 100 % 로 하여 상대 활성을 산출하였다. 결과를 도 3 에 나타낸다. 비교 대상으로 사용한 Endo-M (도쿄 화성 공업 (주) 제조) 은 45 ℃ 에서 실활하고 있는 것에 반하여, R. 푸실루스 유래의 미정제 효소는 지적 온도가 55 ℃ 이상인 것을 확인할 수 있었다.
<실시예 2> R. 푸실루스 유래 엔도-β-N-아세틸글루코사미니다아제 유전자의 클로닝
이하의 방법에 의해, R. 푸실루스 NBRC 9742 주로부터 엔도-β-N-아세틸글루코사미니다아제 유전자의 클로닝 및 게놈 공개 서열로부터의 관련 서열의 추출을 실시하였다.
(1) 미생물로부터의 유전자 클로닝
먼저, R. 푸실루스 NBRC 9742 주를 GSYFe 슬랜트에 식균하고, 40 ℃ 에서 5 일간 배양하였다. 균체를 채취하고, 메탈 콘과 함께 스크루 캡이 형성된 2 ㎖ 마이크로 튜브에 넣고, -80 ℃ 에서 동결하였다. 동결한 샘플을 멀티 비드 쇼커 (야스이 기계사) 로 4 ℃ 로 냉각시키면서, 2,000 rpm, 온 타임 30 초, 오프 타임 30 초로 5 사이클 반복하여 균체를 파쇄하였다. 이 샘플로부터, NucleoSpin RNA Plant (마슈레이·나겔사) 및 Oligotex-dT30 <Super> mRNA Purification Kit (다카라 바이오사) 를 사용하여 mRNA 용액을 얻었다.
얻어진 mRNA 를 주형에, 프라이머 1 (서열 번호 22) 과 3'-Full RACE Core Set (다카라 바이오사) 를 사용하여 엔도-β-N-아세틸글루코사미니다아제를 코드하는 유전자를 증폭하고, pUC19 벡터에 클로닝하였다. 이 유전자는 종지 코돈을 포함하여 2091 염기 (서열 번호 8) 로 이루어지고, 696 아미노산 잔기 (서열 번호 1) 로 이루어지는 분자량 78,874 의 단백질을 코드하고 있고, 이 단백질을 Endo-Rp 라고 명명하였다.
동일하게 하여, R. 푸실루스 NBRC 9740, 9741, 및 9743 주로부터도 Endo-Rp 의 호모로그인 Endo-Rp2 (서열 번호 2 의 아미노산 서열), Endo-Rp3 (서열 번호 3 의 아미노산 서열) 및 Endo-Rp4 (서열 번호 4 의 아미노산 서열) 가 클로닝되었다. NBRC 9740 으로부터는 Endo-Rp2 만이 검출되었지만, NBRC 9741 로부터는, Endo-Rp2 및 Endo-Rp3 의 2 종류, NBRC 9743 으로부터는 Endo-Rp3 및 Endo-Rp4 의 2 종류의 서열이, 각각 검출되었다. 모두, Endo-Rp 와의 아미노산 서열의 동일성은 99 % 였다.
(2) 게놈 공개 서열과의 비교
Endo-Rp, Endo-Rp2, Endo-Rp3, 및 Endo-Rp4 의 서열과 Genozymes Project 의 데이터베이스에서 공개되어 있는 추정 서열을 비교한 결과, 서열 번호 1 의 193 번째의 Lys 에 상당하는 아미노산이, 서열 번호 7 에서는 Asn-Thr-Tyr-Tyr-Ile-Arg 로 치환되고, 단백의 길이가 상이하였다 (도 4). R. 푸실루스 NBRC 9742 주로부터 게놈 DNA 를 추출하고, Endo-Rp 유전자의 ORF 전체 길이 서열을 PCR 증폭하여 해석한 결과, 게놈 공개주의 추정 서열에서는 인트론의 예측 위치가 상이한 것이 시사되고, 이 때문에 상기의 아미노산 서열의 상이가 발생하고 있는 것으로 생각되었다.
또한, Endo-Rp 의 아미노산 서열을 사용하여, NCBI 의 데이터베이스에 대하여 BLAST 검색을 실시한 결과, 근연종인 리조무코르 미에헤이 CAU432 주의 게놈 서열 중에 대응하는 서열이 히트했기 때문에, 이 서열 정보로부터 엔도-β-N-아세틸글루코사미니다아제를 코드하는 것으로 생각되는 핵산 서열 (서열 번호 18), 및 아미노산 서열 (서열 번호 6) 을 특정하고, 이 아미노산 서열로 이루어지는 단백질을 Endo-Rm 이라고 명명하였다. Endo-Rp 와의 상동성은 67 % 였다.
<실시예 3> 대장균을 사용한 Endo-Rp 의 발현
실시예 2 에서 얻은 진균 유래의 엔도-β-N-아세틸글루코사미니다아제 유전자에 대하여 Thermo Fisher Scientific 사의 GeneArt 스트링스 DNA 단편을 이용하여, 대장균에서의 이종 발현용으로 최적화한 핵산 서열 (서열 번호 15) 을 설계하고, 당해 서열을 사용하여 Endo-Rp 의 C 말단에 6 × His 태그를 부가한 폴리펩티드를 코드하는 유전자를 제작하였다. 이것을 pET24b(+) 벡터에 클로닝하고, E. coli BL21 (DE3) 으로 형질 전환하였다. 형질 전환 후의 균액을 100 ㎖ 플라스크 중의 25 ㎖ TB 배지 (50 ㎍/㎖ 카나마이신) 에 접종하고, 37 ℃ 에서 하룻밤 진탕 배양을 실시하였다 (160 rpm, O/N). 이 전배양액 20 ㎖ 를 2.5 ℓ 배플이 형성된 플라스크 중의 1 ℓ TB 배지 (50 ㎍/㎖ 카나마이신, 0.01 % 거품억제제 204, 2 mM MgSO4) 에 식균하고, 37 ℃ 에서 진탕 배양하였다 (200 rpm, 2 시간). 인큐베이터의 온도를 16 ℃ 로 낮추어 3 시간 배양한 후, 종농도 0.2 mM 이 되도록 IPTG 를 첨가하고, 계속해서 24 시간 배양하였다.
집균한 균체를 100 ㎖ 의 바인딩 버퍼 (50 mM HEPES (pH 8.0), 0.5 M NaCl, 20 mM 이미다졸, 5 % 글리세롤) 에 현탁하고, 초음파 파쇄와 원심 분리를 실시한 상청을, Ni Sepharose 6 Fast Flow 및 HiLoad 16/60 Superdex 200 pg 칼럼 (GE 헬스케어사) 으로 정제하였다. 수량 (A280, 흡광 계수 환산) 은 16.9 ㎎/ℓ 배양이었다.
또한, Endo-Rp 호모로그 및 Endo-Rm 에 대해서도 동일하게 이종 발현을 실시하였다. Endo-Rp 의 호모로그로는 실시예 2 에서 동정된 효소에 더하여, 서열 번호 7 의 193 번째 내지 198 번째의 Asn-Thr-Tyr-Tyr-Ile-Arg 를 다른 호모로그와 동일한 Lys 잔기로 치환한 서열 (Endo-Rp5, 서열 번호 5) 의 발현에 대해서도 검토하였다. 대장균용으로 최적화한 Endo-Rm 유전자의 서열은, 서열 번호 6 의 아미노산 서열에 기초하여 GeneArt 스트링스 DNA 단편 (Thermo Fisher Scientific 사) 로 입수하였다 (서열 번호 20). 그 밖의 유전자는, PrimeSTAR Mutagenesis Basal Kit (다카라 바이오사) 의 표준 프로토콜에 따라 서열 번호 15 의 염기 서열을 포함하는 Endo-Rp 의 대장균 발현용 벡터에 변이를 도입함으로써 입수하였다 (Endo-Rp2 : 서열 번호 16, Endo-Rp3 : 서열 번호 17, Endo-Rp4 : 서열 번호 18, Endo-Rp5 : 서열 번호 19).
발현 유도는 상기 서술한 조건으로 실시하고, 본 배양만 500 ㎖ 배플이 형성된 플라스크 중의 100 ㎖ TB 배지로 실시하였다. 집균한 균체를 6 ㎖ 의 바인딩 버퍼에 현탁하고, 초음파 파쇄와 원심 분리를 실시한 상청을 His GraviTrap 칼럼 (GE 헬스케어사) 으로 정제하였다.
정제의 결과, 서열 번호 7 을 제외하고, SDS-PAGE 로 발현 단백의 밴드를 확인하였다. 각 단백의 수량은, Endo-Rp : 2.067 ㎎ (20.67 ㎎/ℓ 배양), Endo-Rp2 : 2.139 ㎎ (21.39 ㎎/ℓ 배양), Endo-Rp3 : 2.765 ㎎ (27.65 ㎎/ℓ 배양), Endo-Rp4 : 2.301 ㎎ (23.01 ㎎/ℓ 배양), Endo-Rp5 : 2.187 ㎎ (21.87 ㎎/ℓ 배양), Endo-Rm : 1.650 ㎎ (16.50 ㎎/ℓ 배양) 이었다.
<실시예 4> Endo-Rp 의 복합형 당 사슬에 대한 가수 분해 활성
실시예 3 에서 취득한 효소에 대하여, 상기 서술한 방법에 의해 가수 분해 활성을 측정하였다. 이 때, Endo-M (도쿄 화성 공업 (주) 제조), EndoS 및 Endo-Om 을 비교 대상으로 사용하였다.
종농도 200 mM 칼륨인산 버퍼 (pH 6.25), 69 mM SGP, 및 0.02 μM 의 효소를 포함하는 반응액 (총용량 100 ㎕) 을 조제하고, Endo-Rp 및 Endo-Om 을 포함하는 반응액은 50 ℃, Endo-M 및 Endo-S 를 포함하는 반응액은 37 ℃ 에서 인큐베이트하였다. 반응 1 시간, 2 시간, 6 시간, 12 시간, 18 시간, 및 24 시간의 반응액을 샘플링하고, 상기 서술한 분석 조건 A 로 LC-MS 분석하였다. 반응 수율의 시간 경과적 변화를 도 5 에 나타낸다. 비활성은 Endo-Rp : 0.21 μ㏖/분/㎍, Endo-M : 0.0071 μ㏖/분/㎍, Endo-S : 0.0022 μ㏖/분/㎍, Endo-Om : 0.060 μ㏖/분/㎍ 이었다. Endo-Rp 의 비활성은 Endo-M 의 30 배, Endo-S 의 100 배, Endo-Om 의 4 배로, 공지된 효소와 비교하여 SGP 에 대하여 매우 강한 가수 분해 활성을 갖는 것이 확인되었다.
또한, 실시예 3 에서 발현·정제한 Endo-Rp 호모로그에 대해서도 활성을 측정하였다. 종농도 200 mM 의 칼륨인산 버퍼 (pH 6.25), 69 mM SGP, 및 0.2 μM 의 효소를 포함하는 반응액 (총용량 30 ㎕) 을 조제하고, 50 ℃ 에서 1 시간 인큐베이트하였다. 1 시간 후의 가수 분해율은, Endo-Rp : 87 %, Endo-Rp2 : 91 %, Endo-Rp3 : 84 %, Endo-Rp4 : 79 %, Endo-Rp5 : 94 %, Endo-Rm : 23 % 이고, Endo-Rp2, Endo-Rp3, Endo-Rp4, Endo-Rp5 는, SGP 에 대하여, Endo-Rp 와 대략 동등한 가수 분해 활성을 갖는 것이 확인되었다.
<실시예 5> Endo-Rp 의 지적 반응 조건의 검토
Endo-Rp 의 지적 반응 온도 및 pH 를 검토하였다.
반응 온도의 검토는, 종농도 200 mM 의 칼륨인산 버퍼 (pH 6.25), 69 mM SGP, 및 0.02 μM 의 효소를 포함하는 반응액 (총용량 : 100 ㎕) 을 조제하고, 45, 50, 52, 55, 57, 60 및 63 ℃ 의 각 온도에서 18 시간 인큐베이트하고, 가수 분해율을 산출하였다. 결과를 도 6 에 나타낸다.
반응 pH 의 검토는, 종농도 200 mM 의 아세트산나트륨 버퍼 혹은 칼륨인산 버퍼, 69 mM SGP, 및 0.02 μM 의 효소를 포함하는, pH 4.5, 5.0, 5.5, 5.8, 6.0, 6.2, 6.5, 7.0, 및, 7.5 의 반응액 (용량 100 ㎕) 을 조제하고, 50 ℃ 에서 23 시간 인큐베이트하고, 가수 분해율을 산출하였다. 결과를 도 7 에 나타낸다.
이 검토의 결과, Endo-Rp 의 지적 반응 온도는 55 ℃ 부근, 지적 반응 pH 는 5.8 부근이었다.
<실시예 6> Endo-Rp 의 당 전이 활성
Endo-Rp 가 당 전이 활성을 갖는지, 이하와 같이 검토하였다.
종농도 1.6 M 의 칼륨인산 버퍼 (pH 6.25), 69 mM SGP, 690 mM (GlcNAc-) Asn (와타나베 화학 공업 (주) 제조) 및 0.1 μM 의 효소를 포함하는 반응액 (총용량 : 30 ㎕) 을 조제하고, 50 ℃ 에서 4 시간 인큐베이트하였다.
반응액을 하기의 조건으로 LC-MS 분석하였다.
MS 장치 : 6130 Quadrupole LC-MS (Agilent Technologies 사)
이온화 : ESI
모드 : 포지티브
HPLC : 1260 인피니티 LC (Agilent Technologies 사)
칼럼 : Inertsil ODS-3 2 ㎛ φ2.1 × 50 ㎜ (GL 사이언스사)
칼럼 온도 : 40 ℃
이동상 A : H2O + 0.1 % HCOOH
이동상 B : 아세토니트릴 + 0.1 % HCOOH
그래디언트 (이동상 B %) : 0.8 % (0 분), 2 % (5 분), 2 % (6 분)
유속 : 0.7 ㎖/분
결과를 도 8 에 나타낸다. 억셉터를 첨가하고 있지 않은 조건에서는, 도너인 SGP 와 가수 분해물인 SG(10) 의 피크만이 검출되었다. 억셉터로서 (GlcNAc-)Asn 을 첨가한 조건에서는, SG(10) 이외에 당 전이 반응 생성물인 (SG-)Asn 의 피크가 관측되었다. 이 결과로부터, Endo-Rp 는 당 전이 활성을 갖는 것이 확인되었다.
<실시예 7> Endo-Rp N172Q 의 제작
Endo-Rp 의 당 사슬 전이 활성을 유지한 채로 당 사슬 가수 분해 활성을 억제한 효소를 취득하기 위하여, 활성 중심인 172 번째의 아스파라긴 (N) 을 글루타민 (Q) 으로 치환한 N172Q 개변체를 제작하였다. N172Q 개변체는, 서열 번호 9 에 나타내는 Endo-Rp 를 코드하는 염기 서열에 있어서, 514 번째 내지 516 번째의 AAC 를 CAA 로 치환하고, 실시예 3 에 기재한 방법으로 조제하였다.
당 전이 활성의 평가는 다음과 같이 실시하였다. 종농도 1.6 M 의 칼륨인산 버퍼 (pH 6.25), 69 mM SGP, 690 mM (GlcNAc-)Asn 및 1.0 μM 의 효소를 포함하는 반응액 (총용량 : 30 ㎕) 을 조제하고, 50 ℃ 에서 인큐베이트하였다. 반응 20 분, 40 분, 1 시간, 2 시간, 4 시간, 8 시간, 20 시간, 24 시간, 및 48 시간의 반응액을 샘플링하고, 실시예 6 에 기재한 조건으로 LC-MS 분석하였다.
반응 수율의 시간 경과적 변화를 도 9 에 나타낸다. Endo-Rp WT 에서는 당 전이 반응 생성물인 (SG-)Asn 은 신속하게 가수 분해되는 데에 반하여, N172Q 개변체에서는 가수 분해가 억제되어, 양호한 수율로 (SG-)Asn 이 생성되는 것을 확인할 수 있었다.
<실시예 8> Endo-Rp 의 개변
Endo-Rp N172Q 개변체보다 당 사슬 전이 활성이 높은 효소를 취득하기 위하여, 개변 검토를 실시하였다. Endo-A (PDB ID : 3FHQ) 및 Endo-D (PBD ID : 2 W92) 의 구조에 기초하여, 표 1 에 나타내는 각종 변이체를 디자인하고, 그 SGP 에 대한 가수 분해 활성 및 당 전이 활성을 측정하였다.
당 전이 활성의 평가는 다음과 같이 실시하였다. 종농도 1.6 M 의 칼륨인산 버퍼 (pH 6.25), 69 mM SGP, 690 mM GlcNAc-AcA 및 1.0 μM 의 효소를 포함하는 반응액 (총용량 : 30 ㎕) 을 조제하고, 50 ℃ 에서 인큐베이트하였다. 반응 1 시간, 2 시간, 4 시간, 8 시간, 24 시간, 48 시간, 및 96 시간의 반응액을 샘플링하고, 상기 서술한 LC-MS 분석 조건 B 로 분석하였다.
가수 분해 활성의 평가는 다음과 같이 실시하였다. 종농도 1.6 M 칼륨인산 버퍼 (pH 6.25), 69 mM SG-A, 및 0.2 μM 의 효소를 포함하는 반응액 (총용량 20 ㎕) 을 조제하고, 50 ℃ 에서 인큐베이트하였다. 반응 1 시간, 2 시간, 4 시간, 8 시간, 24 시간, 48 시간, 및 72 시간의 반응액을 샘플링하고, 상기 서술한 LC-MS 분석 조건 B 로 분석하였다.
표 1 에, Endo-Rp 의 전이 및 가수 분해의 비활성을 100 으로 했을 때의, 각 개변체의 비활성 (가수 분해 및 당 전이) 의 상대치를 나타냈다. N172A, N172C, N172D, N172E, N172G, N172H, N172I, N172M, N172S, N172T, N172V, D176R, Y214F, S216V, L245S, N246D, T275I, F283S, L306I, F307Y, F307H, A310D, E314Q 의 변이를 도입한 개변체에서는, 전이 활성은 유지한 채로 가수 분해 활성이 억제되고, 전이 활성 비율 (전이 활성/가수 분해 활성 ; 표 중에서는, 전이/가수 분해비) 이 향상되어 있는 것이 확인되었다. 또한, W278F, W278Y 의 변이를 도입한 개변체에서는, 전이 활성과 가수 분해 활성이 모두 향상된 한편, 전이 활성 비율은 저하하였다.
[표 1-1]
Figure pct00011
[표 1-2]
Figure pct00012
[표 1-3]
Figure pct00013
SEQUENCE LISTING <110> DAIICHI SANKYO COMPANY LIMITED <120> Novel Endo-Beta, N-acetylglucosaminidase <130> FP1734 <150> JP2016-234808 <151> 2016-12-02 <160> 23 <170> PatentIn version 3.5 <210> 1 <211> 696 <212> PRT <213> Rhizomucor pusillus <400> 1 Met Pro Ser Leu Glu Leu Gln Gln Ala Ala Asp Thr Arg Leu Phe Glu 1 5 10 15 Ser Met Pro Leu Gln Thr Met Asn Glu Leu Gly Ser Trp Glu Pro Ser 20 25 30 Asn Ala Ser Arg Ala Asn Ile Ala Thr Ile Pro Leu His Gln Arg Ser 35 40 45 Asn Leu Asp Pro Ala Glu Pro Arg Leu Ile Val Thr His Asp Met Ala 50 55 60 Gly Gly Tyr Lys Glu Asp Ser Asn Ile Gln Gly Asn Thr Tyr Asp Thr 65 70 75 80 Ile Tyr Ser Cys Gln Tyr Trp Gln Tyr Val Asp Thr Phe Ile Tyr Phe 85 90 95 Ser His His Arg Val Thr Ile Pro Pro Val Asn Trp Ile Asn Ala Cys 100 105 110 His Arg Asn Gly Val Lys Thr Leu Gly Thr Phe Ile Val Glu Gly Ala 115 120 125 Ala Gly Met Phe Ala Leu Glu Arg Phe Val Tyr Gly Pro Glu Pro Gly 130 135 140 Gln Arg Asn Ser Trp Ser Pro Tyr Tyr Ala Asp Lys Leu Val Asp Ile 145 150 155 160 Ala Glu Phe Tyr Gly Phe Asp Gly Trp Leu Leu Asn Ile Glu Ser Asp 165 170 175 Phe Phe Pro Leu Tyr Arg Asn Pro Ser Leu Lys Ala Ile His Leu Ala 180 185 190 Lys Leu Leu Arg Tyr Leu Lys Asn Ala Met His Ala Arg Val Pro Gly 195 200 205 Ser Glu Ile Ile Trp Tyr Asp Ser Met Thr Thr Asn Gly Ser Val Gln 210 215 220 Trp Gln Asn Asn Ile Thr Pro Lys Asn Ser Ile Phe Phe Glu Ala Ala 225 230 235 240 Asp Gly Ile Phe Leu Asn Tyr Trp Trp Asn Ala Thr Val Pro Pro Leu 245 250 255 Ala Leu Gln Val Ala His Arg Leu Gly Arg Gln Gly Ser Asp Val Tyr 260 265 270 Phe Gly Thr Asp Val Trp Gly Arg Gly Thr Phe Gly Gly Gly Gly Phe 275 280 285 Asp Ser Tyr Leu Ala Val Gly Thr Ala Arg Ala Phe Lys Thr Ser Ser 290 295 300 Ala Leu Phe Gly Thr Ala Trp Ile Tyr Glu His Phe Gly Lys Lys Asp 305 310 315 320 Phe Glu Leu Met Asp Arg Leu Leu Trp Leu Gly Gly Asp Gln Ser Glu 325 330 335 Tyr Pro Ala Gln Glu Gly Glu Gln Asn Arg Thr Val Lys Val Thr Ser 340 345 350 His Leu Gly Arg His Pro Gly Ile Ala Asp Val Ser Pro Val Arg Ser 355 360 365 Ala Pro Gly Lys Thr Trp Phe Ala Thr Trp Phe Asp Arg Gly Tyr Gly 370 375 380 Thr Gly Phe Tyr Tyr Gln Gly Lys Lys Leu Leu Ser Gln Pro Trp Ser 385 390 395 400 His Leu Ser His Gln Ser Ile Pro Pro Asn Leu Ile Ala Arg Leu Gln 405 410 415 Arg Glu Glu Asn His Gly Leu Ser Tyr Phe Leu Ala Asp Asp Asp Ala 420 425 430 Tyr Ile Gly Gly Thr Ser Leu Leu Ile Ala Ala Glu Ile Thr Gln Glu 435 440 445 Arg Gln Leu Pro Leu Tyr Gln Leu Glu Tyr Asp Val Thr Glu Gly Cys 450 455 460 Glu Val Gln Phe Ile Tyr Lys Ser Pro Glu Pro Asp Met Gln Gly Lys 465 470 475 480 Ile Asp Ile Tyr Leu Asn Leu Gln Val Thr Asp Ile Leu Pro Asp Glu 485 490 495 Leu Ala Phe Tyr Trp Gln Asp Val Thr Asp Ala Ser Ser Gln Ala Asp 500 505 510 Ala Thr Thr Ala Met Arg Leu Tyr Leu Asn Glu Asn Thr Val Ile Tyr 515 520 525 Leu Lys Pro Ser Arg Lys Gln Glu Leu Ala Glu Gly Trp Leu Leu Cys 530 535 540 Ser Val Arg Val Pro Pro Thr Tyr Pro Leu Gly Ile Ala Thr Ile Lys 545 550 555 560 Glu Leu Gly Ile His Val Asp Gly Lys Glu Thr Val Leu Phe Arg Leu 565 570 575 Gly Leu Leu Thr Ile Ile Pro Leu Gly Asp Ala Pro Ser Ala Leu Ser 580 585 590 Arg Ile Thr Gln Val Gln Leu Gln Arg Asp Glu Asp Ile His Ser Lys 595 600 605 Cys Pro Ser Ser Ser Cys Glu Leu Trp Ala Thr Leu Ser Trp Met Met 610 615 620 Glu His Asn Ser Lys Glu Asp Trp Asp Gln Val Asp His Tyr Met Ile 625 630 635 640 Phe Phe Lys Asn Val Asp Ser Lys Ala Glu Pro Ile Phe Leu Gly Thr 645 650 655 Ser Phe Ser Thr Glu Tyr Arg Ile Ser Gly Leu Glu Ile Lys Lys His 660 665 670 Gly Asn Ser Ile Glu Ile Trp Ala Val Asn Arg Leu Gly Thr Val Ile 675 680 685 Ala Arg Gln Asp Ile Asp Ile Gln 690 695 <210> 2 <211> 696 <212> PRT <213> Rhizomucor pusillus <400> 2 Met Pro Ser Leu Glu Leu Gln Gln Ala Ala Asp Thr Arg Leu Phe Glu 1 5 10 15 Ser Met Pro Leu Gln Thr Met Asn Glu Leu Gly Ser Trp Glu Pro Ser 20 25 30 Asn Ala Ser Arg Ala Asn Ile Ala Thr Ile Pro Leu His Gln Arg Ser 35 40 45 Asn Leu Asp Pro Ala Glu Pro Arg Leu Ile Val Thr His Asp Met Ala 50 55 60 Gly Gly Tyr Lys Glu Asp Ser Asn Ile Gln Gly Asn Thr Tyr Asp Thr 65 70 75 80 Ile Tyr Ser Cys Gln Tyr Trp Gln Tyr Val Asp Thr Phe Ile Tyr Phe 85 90 95 Ser His His Arg Val Thr Ile Pro Pro Val Asn Trp Ile Asn Ala Cys 100 105 110 His Arg Asn Gly Val Lys Thr Leu Gly Thr Phe Ile Val Glu Gly Thr 115 120 125 Ala Gly Met Phe Ala Leu Glu Arg Phe Val Tyr Gly Pro Glu Pro Gly 130 135 140 Gln Arg Asn Ser Trp Ser Pro Tyr Tyr Ala Asp Lys Leu Val Asp Ile 145 150 155 160 Ala Glu Phe Tyr Gly Phe Asp Gly Trp Leu Leu Asn Ile Glu Ser Asp 165 170 175 Phe Phe Pro Leu Tyr Arg Asn Pro Ser Leu Lys Ala Ile His Leu Ala 180 185 190 Lys Leu Leu Arg Tyr Leu Lys Asn Ala Met His Ala Arg Val Pro Gly 195 200 205 Ser Glu Ile Ile Trp Tyr Asp Ser Met Thr Thr Asn Gly Ser Val Gln 210 215 220 Trp Gln Asn Asn Ile Thr Pro Lys Asn Ser Ile Phe Phe Glu Ala Ala 225 230 235 240 Asp Gly Ile Phe Leu Asn Tyr Trp Trp Asn Ala Thr Val Pro Pro Leu 245 250 255 Ala Leu Gln Val Ala His Arg Leu Gly Arg Gln Gly Ser Asp Val Tyr 260 265 270 Phe Gly Thr Asp Val Trp Gly Arg Gly Thr Phe Gly Gly Gly Gly Phe 275 280 285 Asp Ser Tyr Leu Ala Val Gly Thr Ala Arg Ala Phe Lys Thr Ser Ser 290 295 300 Ala Leu Phe Gly Thr Ala Trp Ile Tyr Glu His Phe Gly Lys Lys Asp 305 310 315 320 Phe Glu Leu Met Asp Arg Leu Leu Trp Leu Gly Gly Asp Gln Ser Glu 325 330 335 Tyr Pro Ala Gln Glu Gly Glu Gln Asn Arg Thr Val Lys Val Thr Ser 340 345 350 His Leu Gly Arg His Pro Gly Ile Ala Asp Val Ser Pro Val Arg Ser 355 360 365 Ala Pro Gly Lys Thr Trp Phe Ala Thr Trp Phe Asp Arg Gly Tyr Gly 370 375 380 Thr Gly Phe Tyr Tyr Gln Gly Lys Lys Leu Leu Ser Gln Pro Trp Ser 385 390 395 400 His Leu Ser His Gln Ser Ile Pro Pro Asn Leu Ile Ala Arg Leu Gln 405 410 415 Arg Glu Glu Asn His Gly Leu Ser Tyr Phe Leu Ala Asp Asp Asp Ala 420 425 430 Tyr Ile Gly Gly Thr Ser Leu Leu Ile Ala Ala Glu Ile Thr Gln Glu 435 440 445 Arg Gln Leu Pro Leu Tyr Gln Leu Glu Tyr Asp Val Thr Glu Gly Cys 450 455 460 Glu Val Gln Phe Ile Tyr Lys Ser Pro Glu Pro Asp Met Gln Gly Lys 465 470 475 480 Ile Asp Ile Tyr Leu Asn Leu Gln Val Thr Asp Ile Leu Pro Asp Glu 485 490 495 Leu Ala Phe Tyr Trp Gln Asp Val Thr Asp Ala Ser Ser Gln Ala Asp 500 505 510 Ala Thr Thr Ala Met Arg Leu Tyr Leu Asn Glu Asn Thr Val Ile Tyr 515 520 525 Leu Lys Pro Ser Arg Lys Gln Glu Leu Ala Glu Gly Trp Leu Leu Cys 530 535 540 Ser Val Arg Val Pro Pro Thr Tyr Pro Leu Gly Ile Ala Thr Ile Lys 545 550 555 560 Glu Leu Gly Ile His Val Asp Gly Thr Glu Thr Val Leu Phe Arg Leu 565 570 575 Gly Leu Leu Thr Ile Ile Pro Leu Gly Asp Ala Pro Ser Ala Leu Ser 580 585 590 Arg Ile Thr Gln Val Gln Leu Gln Arg Asp Glu Asp Ile His Ser Lys 595 600 605 Cys Pro Ser Ser Ser Cys Glu Leu Trp Ala Thr Leu Ser Trp Met Met 610 615 620 Glu His Asn Ser Lys Glu Asp Trp Asp Gln Val Asp His Tyr Met Ile 625 630 635 640 Phe Phe Lys Asn Val Asp Ser Lys Ala Glu Pro Ile Phe Leu Gly Thr 645 650 655 Ser Phe Ser Thr Glu Tyr Arg Ile Ser Gly Leu Glu Ile Lys Lys His 660 665 670 Gly Asn Ser Ile Glu Ile Trp Ala Val Asn Arg Leu Gly Thr Val Ile 675 680 685 Ala Arg Gln Asp Ile Asp Ile Gln 690 695 <210> 3 <211> 696 <212> PRT <213> Rhizomucor pusillus <400> 3 Met Pro Ser Leu Glu Leu Gln Gln Ala Ala Asp Thr Arg Leu Phe Glu 1 5 10 15 Ser Met Pro Leu Gln Thr Met Asn Glu Leu Gly Ser Trp Glu Pro Ser 20 25 30 Asn Ala Ser Arg Ala Asn Ile Ala Thr Ile Pro Leu His Gln Arg Ser 35 40 45 Asn Leu Asp Pro Ala Glu Pro Arg Leu Ile Val Thr His Asp Met Ala 50 55 60 Gly Gly Tyr Lys Glu Asp Ser Asn Ile Gln Gly Asn Thr Tyr Asp Thr 65 70 75 80 Ile Tyr Ser Cys Gln Tyr Trp Gln Tyr Val Asp Thr Phe Ile Tyr Phe 85 90 95 Ser His His Arg Val Thr Ile Pro Pro Val Asn Trp Ile Asn Ala Cys 100 105 110 His Arg Asn Gly Val Lys Thr Leu Gly Thr Phe Ile Val Glu Gly Ala 115 120 125 Ala Gly Met Phe Ala Leu Glu Arg Phe Val Tyr Gly Pro Glu Pro Gly 130 135 140 Gln Arg Asn Ser Trp Ser Pro Tyr Tyr Ala Asp Lys Leu Val Asp Ile 145 150 155 160 Ala Glu Phe Tyr Gly Phe Asp Gly Trp Leu Leu Asn Ile Glu Ser Asp 165 170 175 Phe Phe Pro Leu Tyr Arg Asn Pro Ser Leu Lys Ala Ile His Leu Ala 180 185 190 Lys Leu Leu Arg Tyr Leu Lys Asn Ala Met His Ala Arg Val Pro Gly 195 200 205 Ser Glu Ile Ile Trp Tyr Asp Ser Met Thr Thr Asn Gly Ser Val Gln 210 215 220 Trp Gln Asn Asn Ile Thr Pro Lys Asn Ser Ile Phe Phe Glu Ala Ala 225 230 235 240 Asp Gly Ile Phe Leu Asn Tyr Trp Trp Asn Ala Thr Val Pro Pro Leu 245 250 255 Ala Leu Gln Val Ala His Arg Leu Gly Arg Gln Gly Ser Asp Val Tyr 260 265 270 Phe Gly Thr Asp Val Trp Gly Arg Gly Thr Phe Gly Gly Gly Gly Phe 275 280 285 Asp Ser Tyr Leu Ala Val Gly Thr Ala Arg Ala Phe Lys Thr Ser Ser 290 295 300 Ala Leu Phe Gly Thr Ala Trp Ile Tyr Glu His Phe Gly Lys Lys Asp 305 310 315 320 Phe Glu Leu Met Asp Arg Leu Leu Trp Leu Gly Gly Gly Gln Ser Glu 325 330 335 Tyr Pro Ala Gln Glu Gly Glu Gln Asn Arg Thr Val Lys Val Thr Ser 340 345 350 His Leu Gly Arg His Pro Gly Ile Ala Asp Val Ser Pro Val Arg Ser 355 360 365 Ala Pro Gly Lys Thr Trp Phe Ala Thr Trp Phe Asp Arg Gly Tyr Gly 370 375 380 Thr Gly Phe Tyr Tyr Gln Gly Lys Lys Leu Leu Ser Gln Pro Trp Ser 385 390 395 400 His Leu Ser His Gln Ser Ile Pro Pro Asn Leu Ile Ala Arg Leu Gln 405 410 415 Arg Glu Glu Asn His Gly Leu Ser Tyr Phe Leu Ala Asp Asp Asp Ala 420 425 430 Tyr Leu Gly Gly Thr Ser Leu Leu Ile Ala Ala Glu Ile Thr Gln Glu 435 440 445 Arg Gln Leu Pro Leu Tyr Gln Leu Glu Tyr Asp Val Thr Glu Gly Cys 450 455 460 Glu Val Gln Phe Ile Tyr Lys Ser Pro Glu Pro Asp Met Gln Gly Lys 465 470 475 480 Ile Asp Ile Tyr Leu Asn Leu Gln Val Thr Asp Ile Leu Pro Asp Glu 485 490 495 Leu Ala Phe Tyr Trp Gln Asp Val Thr Asp Ala Ser Ser Gln Ala Asp 500 505 510 Ala Thr Thr Ala Met Arg Leu Tyr Leu Asn Glu Asn Thr Val Val Tyr 515 520 525 Leu Lys Pro Ser Arg Lys Gln Glu Leu Ala Glu Gly Trp Leu Leu Cys 530 535 540 Ser Val Arg Val Pro Pro Thr Tyr Pro Leu Gly Ile Ala Thr Ile Lys 545 550 555 560 Glu Leu Gly Ile His Val Asp Gly Thr Glu Thr Val Leu Phe Arg Leu 565 570 575 Gly Leu Leu Thr Ile Ile Pro Leu Gly Asp Ala Pro Ser Ala Leu Ser 580 585 590 Arg Ile Thr Gln Val Gln Leu Gln Arg Asp Glu Asp Ile His Ser Lys 595 600 605 Cys Ser Ser Ser Ser Cys Glu Leu Trp Ala Thr Leu Ser Trp Met Met 610 615 620 Glu Arg Asn Ser Lys Glu Asp Trp Asp Gln Val Asp His Tyr Met Ile 625 630 635 640 Phe Phe Lys Asn Val Asp Ser Lys Ala Glu Pro Ile Phe Leu Gly Thr 645 650 655 Ser Phe Ser Thr Glu Tyr Arg Ile Ser Gly Leu Glu Ile Lys Lys His 660 665 670 Gly Asn Ser Ile Glu Ile Trp Ala Val Asn Arg Leu Gly Thr Val Ile 675 680 685 Ala Arg Gln Asp Ile Asp Ile Gln 690 695 <210> 4 <211> 696 <212> PRT <213> Rhizomucor pusillus <400> 4 Met Pro Ser Leu Glu Leu Gln Gln Ala Ala Asp Thr Arg Leu Phe Glu 1 5 10 15 Ser Met Pro Leu Gln Thr Met Asn Glu Leu Gly Ser Trp Glu Pro Ser 20 25 30 Asn Ala Ser Arg Ala Asn Ile Ala Thr Ile Pro Leu His Gln Arg Ser 35 40 45 Asn Leu Asp Pro Ala Glu Pro Arg Leu Ile Val Thr His Asp Met Ala 50 55 60 Gly Gly Tyr Lys Glu Asp Ser Asn Ile Gln Gly Asn Thr Tyr Asp Thr 65 70 75 80 Ile Tyr Ser Cys Gln Tyr Trp Gln Tyr Val Asp Thr Phe Ile Tyr Phe 85 90 95 Ser His His Arg Val Thr Ile Pro Pro Val Asn Trp Ile Asn Ala Cys 100 105 110 His Arg Asn Gly Val Lys Thr Leu Gly Thr Phe Ile Val Glu Gly Ala 115 120 125 Ala Gly Met Phe Ala Leu Glu Arg Phe Val Tyr Gly Pro Glu Pro Gly 130 135 140 Gln Arg Asn Ser Trp Ser Pro Tyr Tyr Ala Asp Lys Leu Val Asp Ile 145 150 155 160 Ala Glu Phe Tyr Gly Phe Asp Gly Trp Leu Leu Asn Ile Glu Ser Asp 165 170 175 Phe Phe Pro Leu Tyr Arg Asn Pro Ser Leu Lys Ala Ile His Leu Ala 180 185 190 Lys Leu Leu Arg Tyr Leu Lys Asn Ala Met His Ala Arg Val Pro Gly 195 200 205 Ser Glu Ile Ile Trp Tyr Asp Ser Met Thr Thr Asn Gly Ser Val Gln 210 215 220 Trp Gln Asn Asn Ile Thr Pro Lys Asn Ser Ile Phe Phe Glu Ala Ala 225 230 235 240 Asp Gly Ile Phe Leu Asn Tyr Trp Trp Asn Ala Thr Val Pro Pro Leu 245 250 255 Ala Leu Gln Val Ala His Arg Leu Gly Arg Gln Gly Ser Asp Val Tyr 260 265 270 Phe Gly Thr Asp Val Trp Gly Arg Gly Thr Phe Gly Gly Gly Gly Phe 275 280 285 Asp Ser Tyr Leu Ala Val Gly Thr Ala Arg Ala Phe Lys Thr Ser Ser 290 295 300 Ala Leu Phe Gly Thr Ala Trp Ile Tyr Glu His Phe Gly Lys Lys Asp 305 310 315 320 Phe Glu Leu Met Asp Arg Leu Leu Trp Leu Gly Gly Asp Gln Ser Glu 325 330 335 Tyr Pro Ala Gln Glu Gly Glu Gln Asn Arg Thr Val Lys Val Thr Ser 340 345 350 His Leu Gly Arg His Pro Gly Ile Ala Asp Val Ser Pro Val Arg Ser 355 360 365 Ala Pro Gly Lys Thr Trp Phe Ala Thr Trp Phe Asp Arg Gly Tyr Gly 370 375 380 Thr Gly Phe Tyr Tyr Gln Gly Lys Lys Leu Leu Ser Gln Pro Trp Ser 385 390 395 400 His Leu Ser His Gln Ser Ile Pro Pro Asn Leu Ile Ala Arg Leu Gln 405 410 415 Arg Glu Glu Asn His Gly Leu Ser Tyr Phe Leu Ala Asp Asp Asp Ala 420 425 430 Tyr Ile Gly Gly Thr Ser Leu Leu Ile Ala Ala Glu Ile Thr Gln Glu 435 440 445 Arg Gln Leu Pro Leu Tyr Gln Leu Glu Tyr Asp Ala Thr Glu Gly Cys 450 455 460 Glu Val Gln Phe Ile Tyr Lys Ser Pro Glu Pro Asp Met Gln Gly Lys 465 470 475 480 Ile Asp Ile Tyr Leu Asn Leu Gln Val Thr Asp Ile Leu Pro Asp Glu 485 490 495 Leu Ala Phe Tyr Trp Gln Asp Val Thr Asp Ala Ser Ser Gln Ala Asp 500 505 510 Ala Thr Thr Ala Met Arg Leu Tyr Leu Asn Glu Asn Thr Val Ile Tyr 515 520 525 Leu Lys Pro Ser Arg Lys Gln Glu Leu Ala Glu Gly Trp Leu Leu Cys 530 535 540 Ser Val Arg Val Pro Pro Thr Tyr Pro Leu Gly Ile Ala Thr Ile Lys 545 550 555 560 Glu Leu Gly Ile His Val Asp Gly Thr Glu Thr Val Leu Phe Arg Leu 565 570 575 Gly Leu Leu Thr Ile Ile Pro Leu Gly Asp Ala Pro Ser Ala Leu Ser 580 585 590 Arg Ile Thr Gln Val Gln Leu Gln Arg Asp Glu Asp Ile His Ser Lys 595 600 605 Cys Pro Ser Ser Ser Cys Glu Leu Trp Ala Thr Leu Ser Trp Met Met 610 615 620 Glu His Asn Ser Lys Glu Asp Trp Asp Gln Val Asp His Tyr Met Ile 625 630 635 640 Phe Phe Lys Asn Val Asp Ser Lys Ala Glu Pro Ile Phe Leu Gly Thr 645 650 655 Ser Phe Ser Thr Glu Tyr Arg Ile Ser Gly Leu Glu Ile Lys Lys His 660 665 670 Gly Asn Ser Ile Glu Ile Trp Ala Val Asn Arg Leu Gly Thr Val Ile 675 680 685 Ala Arg Gln Asp Ile Asp Ile Gln 690 695 <210> 5 <211> 696 <212> PRT <213> Rhizomucor pusillus <400> 5 Met Pro Ser Leu Glu Leu Gln Gln Ala Ala Asp Thr Arg Leu Phe Glu 1 5 10 15 Ser Met Pro Leu Gln Thr Met Asn Glu Leu Gly Ser Trp Glu Pro Ser 20 25 30 Asn Ala Ser Arg Ala Asn Ile Ala Thr Ile Pro Leu His Gln Arg Ser 35 40 45 Asn Leu Asp Pro Ala Glu Pro Arg Leu Ile Val Thr His Asp Met Ala 50 55 60 Gly Gly Tyr Lys Glu Asp Ser Asn Ile Gln Gly Asn Thr Tyr Asp Thr 65 70 75 80 Ile Tyr Ser Cys Gln Tyr Trp Gln Tyr Val Asp Thr Phe Ile Tyr Phe 85 90 95 Ser His His Arg Val Thr Ile Pro Pro Val Asn Trp Ile Asn Ala Cys 100 105 110 His Arg Asn Gly Val Lys Thr Leu Gly Thr Phe Ile Val Glu Gly Ala 115 120 125 Ala Gly Met Phe Ala Leu Glu Arg Phe Val Tyr Gly Pro Glu Pro Gly 130 135 140 Gln Arg Asn Ser Trp Ser Pro Tyr Tyr Ala Asp Lys Leu Val Asp Ile 145 150 155 160 Ala Glu Phe Tyr Gly Phe Asp Gly Trp Leu Leu Asn Ile Glu Ser Asp 165 170 175 Phe Phe Pro Leu Tyr Arg Asn Pro Ser Leu Lys Ala Ile His Leu Ala 180 185 190 Lys Leu Leu Arg Tyr Leu Lys Asn Ala Met His Ala Arg Val Pro Gly 195 200 205 Ser Glu Ile Ile Trp Tyr Asp Ser Met Thr Thr Asn Gly Ser Val Gln 210 215 220 Trp Gln Asn Asn Ile Thr Pro Lys Asn Ser Ile Phe Phe Glu Ala Ala 225 230 235 240 Asp Gly Ile Phe Leu Asn Tyr Trp Trp Asn Ala Thr Val Pro Pro Leu 245 250 255 Ala Leu Gln Val Ala His Arg Leu Gly Arg Gln Gly Ser Asp Val Tyr 260 265 270 Phe Gly Thr Asp Val Trp Gly Arg Gly Thr Phe Gly Gly Gly Gly Phe 275 280 285 Asp Ser Tyr Leu Ala Val Gly Thr Ala Arg Ala Phe Lys Thr Ser Ser 290 295 300 Ala Leu Phe Gly Thr Ala Trp Ile Tyr Glu His Phe Gly Lys Lys Asp 305 310 315 320 Phe Glu Leu Met Asp Arg Leu Leu Trp Leu Gly Gly Asp Gln Ser Glu 325 330 335 Tyr Pro Ala Gln Glu Gly Glu Gln Asn Arg Thr Val Lys Val Thr Ser 340 345 350 His Leu Gly Arg His Pro Gly Ile Ala Asp Val Ser Pro Val Arg Ser 355 360 365 Ala Pro Gly Lys Thr Trp Phe Ala Thr Trp Phe Asp Arg Gly Tyr Gly 370 375 380 Thr Gly Phe Tyr Tyr Gln Gly Lys Lys Leu Leu Ser Gln Pro Trp Ser 385 390 395 400 His Leu Ser His Gln Ser Ile Pro Pro Asn Leu Ile Ala Arg Leu Gln 405 410 415 Arg Glu Glu Asn His Gly Leu Ser Tyr Phe Leu Ala Asp Asp Asp Ala 420 425 430 Tyr Ile Gly Gly Thr Ser Leu Leu Ile Ala Ala Glu Ile Thr Gln Glu 435 440 445 Arg Gln Leu Pro Leu Tyr Gln Leu Glu Tyr Asp Val Thr Glu Gly Cys 450 455 460 Glu Val Gln Phe Ile Tyr Lys Ser Pro Glu Pro Asp Met Gln Gly Lys 465 470 475 480 Ile Asp Ile Tyr Leu Asn Leu Gln Val Thr Asp Ile Leu Pro Asp Glu 485 490 495 Leu Ala Phe Tyr Trp Gln Asp Val Thr Asp Ala Ser Ser Gln Ala Asp 500 505 510 Ala Thr Thr Ala Met Arg Leu Tyr Leu Asn Glu Asn Thr Val Ile Tyr 515 520 525 Leu Lys Pro Ser Arg Lys Gln Glu Leu Ala Glu Gly Trp Leu Leu Cys 530 535 540 Ser Val Arg Val Pro Pro Thr Tyr Pro Leu Gly Ile Ala Thr Ile Lys 545 550 555 560 Glu Leu Gly Ile His Val Asp Gly Thr Glu Thr Val Leu Phe Arg Leu 565 570 575 Gly Leu Leu Thr Ile Ile Pro Leu Gly Asp Ala Pro Ser Ala Leu Ser 580 585 590 Arg Ile Thr Gln Val Gln Leu Gln Arg Asp Glu Asp Ile His Ser Lys 595 600 605 Cys Pro Ser Ser Ser Cys Glu Leu Trp Ala Thr Leu Ser Trp Met Met 610 615 620 Glu His Asn Ser Lys Glu Asp Trp Asp Gln Val Asp His Tyr Met Ile 625 630 635 640 Phe Phe Lys Asn Val Asp Ser Lys Ala Glu Pro Ile Phe Leu Gly Thr 645 650 655 Ser Phe Ser Thr Glu Tyr Arg Ile Ser Gly Leu Glu Ile Lys Lys His 660 665 670 Gly Asn Ser Ile Glu Ile Trp Ala Val Asn Arg Leu Gly Thr Val Ile 675 680 685 Ala Arg Gln Asp Ile Asp Ile Gln 690 695 <210> 6 <211> 697 <212> PRT <213> Rhizomucor miehei <400> 6 Met Pro Ser Leu Glu Leu Gln Gln Ala Val Asp Thr Arg Leu Phe Glu 1 5 10 15 Ser Thr Pro Leu Met Thr Met Asp Glu Leu Gly Ser Trp Asp Pro Ser 20 25 30 Asn Ala Leu Arg Ala Ser Ile Ala Thr Val Pro Leu His Pro Arg Pro 35 40 45 Ser Ile Asp Pro Thr Glu Pro Arg Leu Ile Val Thr His Asp Met Ala 50 55 60 Gly Gly Tyr Lys Glu Asp Phe Ser Ile Gln Gly Asn Ala Tyr Asp Thr 65 70 75 80 Val Tyr Thr Cys Gln Tyr Trp Gln Tyr Val Asp Ile Phe Ile Tyr Phe 85 90 95 Ser His His Arg Val Thr Ile Pro Pro Val Asn Trp Thr Asn Ala Cys 100 105 110 His Arg Asn Gly Val Lys Ser Leu Gly Thr Phe Ile Val Glu Gly Ala 115 120 125 Ala Gly Met Phe Ala Leu Glu Arg Phe Val Tyr Gly Pro Asn Pro Gly 130 135 140 Gln Arg Lys Ser Trp Ser Pro Tyr Tyr Ala Asp Lys Leu Val Asp Ile 145 150 155 160 Ala Glu Phe Tyr Gly Phe Asp Gly Trp Leu Ile Asn Ile Glu Ser Asp 165 170 175 Phe Phe Pro Leu Tyr Arg Ser Pro Ser Met Lys Ala Lys His Leu Ala 180 185 190 Lys Leu Leu Leu Tyr Leu Arg Asn Ala Met His Ala Arg Val Pro Gly 195 200 205 Ser Gln Ile Ile Trp Tyr Asp Ser Met Thr Thr Ser Gly Tyr Val Gln 210 215 220 Trp Gln Asn Asn Ile Thr Pro Gln Asn Glu Ile Phe Phe Glu Ala Ala 225 230 235 240 Asp Gly Ile Phe Leu Asn Tyr Trp Trp Asn Ala Thr Tyr Pro Pro Phe 245 250 255 Ala Met Gln Val Ala His Tyr Leu Gly Arg Gln Gly Ser Asp Val Tyr 260 265 270 Phe Gly Ser Asp Ile Trp Gly Arg Gly Thr Phe Gly Gly Gly Gly Phe 275 280 285 Asp Ser Tyr Leu Ala Val Ala Thr Ala Ser Ala Phe Lys Thr Ser Ser 290 295 300 Ala Leu Phe Gly Thr Ala Trp Thr Tyr Glu His Phe Glu Lys Lys Asp 305 310 315 320 Phe Glu Leu Met Asp Arg Leu Leu Trp Leu Gly Gly Asp Gln Ser Glu 325 330 335 Tyr Pro Ala Gln Ala Glu Gly Gln Glu Ser Ile Ala Lys Ser Gly Ser 340 345 350 Arg Leu Gly Arg His Pro Gly Ile Thr Asp Val Ala Ala Val Arg Ser 355 360 365 Ala Pro Gly Arg Arg Trp Phe Val Thr Trp Phe Asp Arg Gly His Gly 370 375 380 Thr Gly Phe Tyr His Gln Gly Lys Lys Leu Leu Ser Gln Pro Trp Ser 385 390 395 400 His Leu Ser His Gln Ser Ile Pro Pro Asn Leu Val Ala Arg Leu Gln 405 410 415 Arg Lys Glu Asp Asp Gly Val Ser Tyr Phe Leu Ala Asp Asp Asp Ala 420 425 430 Tyr Ile Gly Gly Thr Ser Leu Leu Ile Ala Ala Glu Gly Thr Gln Glu 435 440 445 Arg Gln Ile Pro Leu Tyr Gln Leu Asn Tyr Asp Ala Thr Asn Gly Cys 450 455 460 Glu Val Gln Phe Val Tyr Lys Ser Pro Glu Pro Asp Met Gln Ser Lys 465 470 475 480 Val Gln Ile Tyr Leu Asn Leu Arg Val Thr Asp Val Leu Pro Asp Glu 485 490 495 Leu Ala Tyr Tyr Trp His Asp Val Ala Ala Thr Ser Pro Gln Pro Gln 500 505 510 Ala Thr Thr Ala Ser Arg Leu Asn Ile Asn Glu Asp Thr Ser Val Tyr 515 520 525 Leu Asn Thr Ser Lys Thr Gln Glu Leu Ala Glu Gly Trp Val Leu Cys 530 535 540 Ser Val Arg Val Pro Ser Val His Pro Leu Gly Glu Ala Ala Ile Glu 545 550 555 560 Glu Leu Gly Ile Tyr Leu Asp Gly Thr Glu Asp Val Leu Phe Arg Leu 565 570 575 Gly Leu Leu Thr Ile Val Pro Tyr Thr Asp Thr Ser Ser Thr Leu Ala 580 585 590 Ser Lys Ile Thr His Ile Gln Leu Gln Arg Asp Ala Asp Val Ser Ser 595 600 605 Lys Cys Leu Ser Ser Ser Cys Glu Leu Trp Ala Thr Leu Ser Trp Met 610 615 620 Met Glu Ser Asn Ser Ser Glu Glu Trp Asn Gln Val Asp His Tyr Leu 625 630 635 640 Ile Ser Tyr Gly Asp Ile Asn Ala Asp Gly Ala Ala Thr Phe Leu Gly 645 650 655 Thr Thr Phe Thr Thr Glu Tyr Arg Ile Ser Gly Leu Glu Met Lys Asn 660 665 670 Asp Ile Asp Tyr Ile Gln Ile Ser Ala Val Ser Arg Leu Gly Asn Ile 675 680 685 Leu Ala Gln Gln Thr Ile Gly Ile Gln 690 695 <210> 7 <211> 701 <212> PRT <213> Artificial Sequence <220> <223> The assumed amino acid sequence derived from publicly availabe genomic DNA sequence of Rhizomucor pusillus strain CBS 183.67, which has been assumed to be endo-beta-N-acetylglucosaminidase. <400> 7 Met Pro Ser Leu Glu Leu Gln Gln Ala Ala Asp Thr Arg Leu Phe Glu 1 5 10 15 Ser Met Pro Leu Gln Thr Met Asn Glu Leu Gly Ser Trp Glu Pro Ser 20 25 30 Asn Ala Ser Arg Ala Asn Ile Ala Thr Ile Pro Leu His Gln Arg Ser 35 40 45 Asn Leu Asp Pro Ala Glu Pro Arg Leu Ile Val Thr His Asp Met Ala 50 55 60 Gly Gly Tyr Lys Glu Asp Ser Asn Ile Gln Gly Asn Thr Tyr Asp Thr 65 70 75 80 Ile Tyr Ser Cys Gln Tyr Trp Gln Tyr Val Asp Thr Phe Ile Tyr Phe 85 90 95 Ser His His Arg Val Thr Ile Pro Pro Val Asn Trp Ile Asn Ala Cys 100 105 110 His Arg Asn Gly Val Lys Thr Leu Gly Thr Phe Ile Val Glu Gly Ala 115 120 125 Ala Gly Met Phe Ala Leu Glu Arg Phe Val Tyr Gly Pro Glu Pro Gly 130 135 140 Gln Arg Asn Ser Trp Ser Pro Tyr Tyr Ala Asp Lys Leu Val Asp Ile 145 150 155 160 Ala Glu Phe Tyr Gly Phe Asp Gly Trp Leu Leu Asn Ile Glu Ser Asp 165 170 175 Phe Phe Pro Leu Tyr Arg Asn Pro Ser Leu Lys Ala Ile His Leu Ala 180 185 190 Asn Thr Tyr Tyr Ile Arg Leu Leu Arg Tyr Leu Lys Asn Ala Met His 195 200 205 Ala Arg Val Pro Gly Ser Glu Ile Ile Trp Tyr Asp Ser Met Thr Thr 210 215 220 Asn Gly Ser Val Gln Trp Gln Asn Asn Ile Thr Pro Lys Asn Ser Ile 225 230 235 240 Phe Phe Glu Ala Ala Asp Gly Ile Phe Leu Asn Tyr Trp Trp Asn Ala 245 250 255 Thr Val Pro Pro Leu Ala Leu Gln Val Ala His Arg Leu Gly Arg Gln 260 265 270 Gly Ser Asp Val Tyr Phe Gly Thr Asp Val Trp Gly Arg Gly Thr Phe 275 280 285 Gly Gly Gly Gly Phe Asp Ser Tyr Leu Ala Val Gly Thr Ala Arg Ala 290 295 300 Phe Lys Thr Ser Ser Ala Leu Phe Gly Thr Ala Trp Ile Tyr Glu His 305 310 315 320 Phe Gly Lys Lys Asp Phe Glu Leu Met Asp Arg Leu Leu Trp Leu Gly 325 330 335 Gly Asp Gln Ser Glu Tyr Pro Ala Gln Glu Gly Glu Gln Asn Arg Thr 340 345 350 Val Lys Val Thr Ser His Leu Gly Arg His Pro Gly Ile Ala Asp Val 355 360 365 Ser Pro Val Arg Ser Ala Pro Gly Lys Thr Trp Phe Ala Thr Trp Phe 370 375 380 Asp Arg Gly Tyr Gly Thr Gly Phe Tyr Tyr Gln Gly Lys Lys Leu Leu 385 390 395 400 Ser Gln Pro Trp Ser His Leu Ser His Gln Ser Ile Pro Pro Asn Leu 405 410 415 Ile Ala Arg Leu Gln Arg Glu Glu Asn His Gly Leu Ser Tyr Phe Leu 420 425 430 Ala Asp Asp Asp Ala Tyr Ile Gly Gly Thr Ser Leu Leu Ile Ala Ala 435 440 445 Glu Ile Thr Gln Glu Arg Gln Leu Pro Leu Tyr Gln Leu Glu Tyr Asp 450 455 460 Val Thr Glu Gly Cys Glu Val Gln Phe Ile Tyr Lys Ser Pro Glu Pro 465 470 475 480 Asp Met Gln Gly Lys Ile Asp Ile Tyr Leu Asn Leu Gln Val Thr Asp 485 490 495 Ile Leu Pro Asp Glu Leu Ala Phe Tyr Trp Gln Asp Val Thr Asp Ala 500 505 510 Ser Ser Gln Ala Asp Ala Thr Thr Ala Met Arg Leu Tyr Leu Asn Glu 515 520 525 Asn Thr Val Ile Tyr Leu Lys Pro Ser Arg Lys Gln Glu Leu Ala Glu 530 535 540 Gly Trp Leu Leu Cys Ser Val Arg Val Pro Pro Thr Tyr Pro Leu Gly 545 550 555 560 Ile Ala Thr Ile Lys Glu Leu Gly Ile His Val Asp Gly Thr Glu Thr 565 570 575 Val Leu Phe Arg Leu Gly Leu Leu Thr Ile Ile Pro Leu Gly Asp Ala 580 585 590 Pro Ser Ala Leu Ser Arg Ile Thr Gln Val Gln Leu Gln Arg Asp Glu 595 600 605 Asp Ile His Ser Lys Cys Pro Ser Ser Ser Cys Glu Leu Trp Ala Thr 610 615 620 Leu Ser Trp Met Met Glu His Asn Ser Lys Glu Asp Trp Asp Gln Val 625 630 635 640 Asp His Tyr Met Ile Phe Phe Lys Asn Val Asp Ser Lys Ala Glu Pro 645 650 655 Ile Phe Leu Gly Thr Ser Phe Ser Thr Glu Tyr Arg Ile Ser Gly Leu 660 665 670 Glu Ile Lys Lys His Gly Asn Ser Ile Glu Ile Trp Ala Val Asn Arg 675 680 685 Leu Gly Thr Val Ile Ala Arg Gln Asp Ile Asp Ile Gln 690 695 700 <210> 8 <211> 2091 <212> DNA <213> Rhizomucor pusillus <400> 8 atgccttcac tcgaactaca gcaagctgct gacacgagac ttttcgagtc tatgccactt 60 cagactatga atgagcttgg ttcttgggaa cctagcaatg cctcgcgagc caacattgca 120 actattcctt tgcatcagcg atccaatctt gatccggcag agccgcgctt gatcgtaact 180 cacgatatgg ctggaggcta caaggaagac tcaaatattc agggcaatac gtatgataca 240 atttatagct gtcaatattg gcaatatgtg gatactttta tctatttctc gcatcatcga 300 gttacgatac ctcctgtcaa ttggataaat gcatgccaca gaaacggtgt caaaacgcta 360 ggaacattca ttgtggaagg agctgcgggc atgtttgcct tggagagatt cgtctacgga 420 cctgagcctg gacagagaaa cagctggagc ccttactatg ctgataagct ggtggacata 480 gccgagtttt acggtttcga cggctggctg cttaacattg agagtgattt cttcccttta 540 tatcgaaatc cgtctctgaa agcgatccat ctagcaaagc tgctgcgata tctgaagaat 600 gcaatgcacg ccagagtgcc aggttcagag atcatctggt atgacagcat gacgacaaac 660 ggaagtgtgc agtggcaaaa caatatcacg cccaaaaatt ccatattttt tgaagctgca 720 gatggcatat ttttaaatta ttggtggaac gcgacggttc cgccgttggc tttgcaagta 780 gcacatcgtc taggacgtca aggatctgat gtatactttg gaacggatgt ttggggacga 840 ggaacattcg gtggtggcgg attcgattca tatctcgctg ttggcactgc gagggcattc 900 aaaacatcat ctgcgctttt cggcacagca tggatctatg agcattttgg gaagaaagat 960 tttgagctta tggatagact tttgtggtta ggtggtgatc aatcagaata tccagctcag 1020 gaaggagagc agaatcgcac agtaaaagtt acatcccatc ttggaagaca tcctggtatc 1080 gccgatgtgt caccggtgcg aagtgctcca gggaaaacat ggttcgcaac gtggtttgat 1140 agaggttacg gaacaggttt ctattatcag ggcaagaaac tattatcaca gccgtggtcg 1200 catttatcgc atcaatctat cccgccgaat cttatagcca gattacagag agaagaaaat 1260 cacggccttt cgtatttcct ggcagacgac gatgcataca tcgggggaac ttcgctgtta 1320 atagcagccg aaatcactca agaacgccaa ttgccgctct atcaactaga gtatgacgtt 1380 actgaaggct gcgaggtgca gtttatatac aagtctccgg aaccagatat gcaaggaaaa 1440 atagatatat atttgaactt gcaagttaca gacatactgc ctgatgagct agccttttac 1500 tggcaagatg ttacggatgc ttcctcccag gccgatgcaa cgacagccat gcgtttatat 1560 ctaaacgaaa acacagttat ttatctaaag ccgtccagga aacaagagct agccgaaggc 1620 tggttgctct gttccgtgcg tgtgccacct acttatccac ttggtatcgc aacgatcaag 1680 gaactaggga tccatgtgga tggtaaagaa acagtgctat ttaggctggg tctccttaca 1740 attatacccc ttggagatgc gccgtctgcg ctttccagaa ttacccaggt ccagcttcaa 1800 agggatgagg atatccatag taaatgtcca tcctcctcat gcgaactttg ggccacactc 1860 tcgtggatga tggaacacaa ctcaaaagag gactgggacc aggtcgatca ctatatgatt 1920 ttcttcaaaa atgttgattc caaggcagaa cctattttcc ttggcaccag cttcagtacc 1980 gagtacagaa tatcaggcct ggagatcaag aaacacggaa attccatcga gatatgggca 2040 gtaaatcgct taggaaccgt cattgcacgg caagacatcg atatccaata g 2091 <210> 9 <211> 2109 <212> DNA <213> Artificial Sequence <220> <223> Optimized DNA sequence for expression of Endo-Rp in E. coli <400> 9 atgccgagcc tggaactgca gcaggcagca gatacccgtc tgtttgaaag catgccgctg 60 cagaccatga atgaactggg tagctgggaa ccgagcaatg caagccgtgc aaatattgca 120 accattccgc tgcatcagcg tagcaatctg gatccggcag aaccgcgtct gattgttacc 180 catgatatgg caggcggtta taaagaagat agcaatattc agggcaacac ctatgatacc 240 atttatagct gtcagtattg gcagtatgtg gacaccttta tctattttag ccatcaccgt 300 gttaccattc ctccggttaa ttggattaat gcctgtcatc gtaatggtgt taaaaccctg 360 ggcaccttta ttgttgaagg tgcagcaggt atgtttgcac tggaacgttt tgtttatggt 420 ccggaaccgg gtcagcgtaa tagctggtca ccgtattatg cagataaact ggttgatatc 480 gccgagtttt atggttttga tggttggctg ctgaacatcg aaagcgattt ttttccgctg 540 tatcgtaatc cgagcctgaa agcaattcat ctggcaaaac tgctgcgcta tctgaaaaat 600 gcaatgcatg cacgtgttcc gggtagcgaa attatctggt atgatagcat gaccaccaat 660 ggtagcgttc agtggcagaa taacattacc ccgaaaaaca gcatcttttt tgaagcagcc 720 gatggcatct ttctgaatta ttggtggaat gcaaccgttc ctccgctggc actgcaggtt 780 gcacatcgtc tgggtcgtca gggtagtgat gtttattttg gcaccgatgt ttggggtcgt 840 ggcacctttg gtggtggtgg ctttgatagt tatctggcag ttggcaccgc acgtgcattt 900 aaaaccagca gcgcactgtt tggtacagca tggatttatg aacacttcgg caaaaaagac 960 ttcgaactga tggatcgtct gctgtggctg ggtggtgatc agagcgaata tccggcacaa 1020 gaaggtgaac agaatcgtac cgttaaagtt accagccatc tgggtcgcca tccgggtatt 1080 gcagatgtta gtccggttcg tagcgcaccg ggtaaaacct ggtttgcaac atggtttgat 1140 cgtggttatg gcaccggttt ctattatcag ggtaaaaaac tgctgagcca gccgtggtca 1200 catctgagcc atcagagcat tccgcctaat ctgattgcac gcctgcagcg tgaagaaaat 1260 catggcctga gctattttct ggcagatgat gatgcatata ttggtggcac cagcctgctg 1320 attgcagcag aaattaccca agaacgtcag ctgcctctgt atcagctgga atatgatgtt 1380 accgaaggtt gcgaagtgca gttcatctat aaaagccctg aaccggatat gcagggcaaa 1440 attgatatct atctgaatct gcaggttacc gatatcctgc cggatgaact ggcattttat 1500 tggcaggacg ttaccgatgc aagcagccag gcagatgcaa ccaccgcaat gcgtctgtat 1560 ctgaatgaaa ataccgtgat ttatctgaaa ccgagccgta aacaagaact ggcggaaggc 1620 tggctgctgt gtagcgttcg tgttccgcct acctatccgc tgggtattgc caccattaaa 1680 gaactgggca ttcatgtgga tggtaaagaa accgttctgt ttcgcctggg tctgctgacc 1740 attatcccgc tgggtgatgc accgagcgca ctgagccgta ttacccaggt tcagctgcaa 1800 cgtgatgaag atattcatag caaatgtccg agcagcagct gtgaactgtg ggcaaccctg 1860 agctggatga tggaacataa tagcaaagaa gattgggatc aggtcgatca ctacatgatc 1920 tttttcaaaa acgtggatag caaagccgaa ccgatttttc tgggcaccag ctttagcacc 1980 gaatatcgta ttagcggtct ggaaatcaaa aaacatggca acagcattga aatctgggca 2040 gttaatcgcc tgggcacagt tattgcacgt caggatattg atattcagca tcatcaccat 2100 caccattaa 2109 <210> 10 <211> 2091 <212> DNA <213> Rhizomucor pusillus <400> 10 atgccttcac tcgaactaca gcaagctgct gacacgagac ttttcgagtc tatgccactt 60 cagactatga atgagcttgg ttcttgggaa cctagcaatg cctcgcgagc caacattgca 120 actattcctt tgcatcagcg atccaatctt gatccggcag agccgcgctt gatcgtaact 180 cacgatatgg ctggaggcta caaggaagac tcaaatattc agggcaatac gtatgataca 240 atttatagct gtcaatattg gcaatatgtg gatactttta tctatttctc gcatcatcga 300 gttacgatac ctcctgtcaa ttggataaat gcatgccaca gaaacggtgt caaaacgcta 360 ggaacattca ttgtggaagg aactgcgggc atgtttgcct tggagagatt cgtctacgga 420 cctgagcctg gacagagaaa cagctggagc ccttactatg ctgataagct ggtggacata 480 gccgagtttt acggtttcga cggctggctg cttaacattg agagtgattt cttcccttta 540 tatcgaaatc cgtctctgaa agcgatccat ctagcaaagc tgctgcgata tctgaagaat 600 gcaatgcacg ccagagtgcc aggttcagag atcatctggt atgacagcat gacgacaaac 660 ggaagtgtgc agtggcaaaa caatatcacg cccaaaaatt ccatattttt tgaagctgca 720 gatggcatat ttttaaatta ttggtggaac gcgacggttc cgccgttggc tttgcaagta 780 gcacatcgtc taggacgtca aggatctgat gtatactttg gaacggatgt ttggggacga 840 ggaacattcg gtggtggcgg attcgattca tatctcgctg ttggcactgc gagggcattc 900 aaaacatcat ctgcgctttt cggcacagca tggatctatg agcattttgg gaagaaagat 960 tttgagctta tggatagact tttgtggtta ggtggtgatc aatcagaata tccagctcag 1020 gaaggagagc agaatcgcac agtaaaagtt acatcccatc ttggaagaca tcctggtatc 1080 gccgatgtgt caccggtgcg aagtgctcca gggaaaacat ggttcgcaac gtggtttgat 1140 agaggttacg gaacaggttt ctattatcag ggcaagaaac tattatcaca gccgtggtcg 1200 catttatcgc atcaatctat cccgccgaat cttatagcca gattacagag agaagaaaat 1260 cacggccttt cgtatttcct ggcagacgac gatgcataca tcgggggtac ttcgctgtta 1320 atagcagccg aaatcactca agaacgccaa ttgccgctct atcaactaga gtatgacgtt 1380 actgaaggct gcgaggtgca gtttatatac aagtctccgg aaccagatat gcaaggaaaa 1440 atagatatat atttgaactt gcaagttaca gacatactgc ctgatgagct agccttttac 1500 tggcaagatg ttacggatgc ttcctcccag gccgatgcaa cgacagccat gcgtttatat 1560 ctaaacgaaa acacagttat ttatctaaag ccgtccagga aacaagagct agccgaaggc 1620 tggttgctct gttccgtgcg tgtgccgcct acttatccac ttggtatcgc aacgatcaag 1680 gaactaggga tccatgtgga tggtacagaa acagtgctat ttaggctggg tctccttaca 1740 attatacccc ttggagatgc gccgtctgcg ctttccagaa ttacccaggt ccagcttcaa 1800 agggatgagg atatccatag taaatgtcca tcctcctcat gcgaactttg ggccacactc 1860 tcgtggatga tggaacacaa ctcaaaagag gactgggacc aggtcgatca ctatatgatt 1920 ttcttcaaaa atgttgattc caaggcagaa cctattttcc ttggcaccag cttcagtacc 1980 gagtacagaa tatcaggcct ggagatcaag aaacacggaa attccatcga gatatgggca 2040 gtaaatcgct taggaaccgt cattgcacgg caagacatcg atatccaata g 2091 <210> 11 <211> 2109 <212> DNA <213> Artificial Sequence <220> <223> Optimized DNA sequence for expression of Endo-Rp2 in E. coli <400> 11 atgccgagcc tggaactgca gcaggcagca gatacccgtc tgtttgaaag catgccgctg 60 cagaccatga atgaactggg tagctgggaa ccgagcaatg caagccgtgc aaatattgca 120 accattccgc tgcatcagcg tagcaatctg gatccggcag aaccgcgtct gattgttacc 180 catgatatgg caggcggtta taaagaagat agcaatattc agggcaacac ctatgatacc 240 atttatagct gtcagtattg gcagtatgtg gacaccttta tctattttag ccatcaccgt 300 gttaccattc ctccggttaa ttggattaat gcctgtcatc gtaatggtgt taaaaccctg 360 ggcaccttta ttgttgaagg taccgcaggt atgtttgcac tggaacgttt tgtttatggt 420 ccggaaccgg gtcagcgtaa tagctggtca ccgtattatg cagataaact ggttgatatc 480 gccgagtttt atggttttga tggttggctg ctgaacatcg aaagcgattt ttttccgctg 540 tatcgtaatc cgagcctgaa agcaattcat ctggcaaaac tgctgcgcta tctgaaaaat 600 gcaatgcatg cacgtgttcc gggtagcgaa attatctggt atgatagcat gaccaccaat 660 ggtagcgttc agtggcagaa taacattacc ccgaaaaaca gcatcttttt tgaagcagcc 720 gatggcatct ttctgaatta ttggtggaat gcaaccgttc ctccgctggc actgcaggtt 780 gcacatcgtc tgggtcgtca gggtagtgat gtttattttg gcaccgatgt ttggggtcgt 840 ggcacctttg gtggtggtgg ctttgatagt tatctggcag ttggcaccgc acgtgcattt 900 aaaaccagca gcgcactgtt tggtacagca tggatttatg aacacttcgg caaaaaagac 960 ttcgaactga tggatcgtct gctgtggctg ggtggtgatc agagcgaata tccggcacaa 1020 gaaggtgaac agaatcgtac cgttaaagtt accagccatc tgggtcgcca tccgggtatt 1080 gcagatgtta gtccggttcg tagcgcaccg ggtaaaacct ggtttgcaac atggtttgat 1140 cgtggttatg gcaccggttt ctattatcag ggtaaaaaac tgctgagcca gccgtggtca 1200 catctgagcc atcagagcat tccgcctaat ctgattgcac gcctgcagcg tgaagaaaat 1260 catggcctga gctattttct ggcagatgat gatgcatata ttggtggcac cagcctgctg 1320 attgcagcag aaattaccca agaacgtcag ctgcctctgt atcagctgga atatgatgtt 1380 accgaaggtt gcgaagtgca gttcatctat aaaagccctg aaccggatat gcagggcaaa 1440 attgatatct atctgaatct gcaggttacc gatatcctgc cggatgaact ggcattttat 1500 tggcaggacg ttaccgatgc aagcagccag gcagatgcaa ccaccgcaat gcgtctgtat 1560 ctgaatgaaa ataccgtgat ttatctgaaa ccgagccgta aacaagaact ggcggaaggc 1620 tggctgctgt gtagcgttcg tgttccgcct acctatccgc tgggtattgc caccattaaa 1680 gaactgggca ttcatgtgga tggtaccgaa accgttctgt ttcgcctggg tctgctgacc 1740 attatcccgc tgggtgatgc accgagcgca ctgagccgta ttacccaggt tcagctgcaa 1800 cgtgatgaag atattcatag caaatgtccg agcagcagct gtgaactgtg ggcaaccctg 1860 agctggatga tggaacataa tagcaaagaa gattgggatc aggtcgatca ctacatgatc 1920 tttttcaaaa acgtggatag caaagccgaa ccgatttttc tgggcaccag ctttagcacc 1980 gaatatcgta ttagcggtct ggaaatcaaa aaacatggca acagcattga aatctgggca 2040 gttaatcgcc tgggcacagt tattgcacgt caggatattg atattcagca tcatcaccat 2100 caccattaa 2109 <210> 12 <211> 2091 <212> DNA <213> Rhizomucor pusillus <400> 12 atgccttcac tcgaactaca gcaagctgct gacacgagac ttttcgagtc tatgccactt 60 cagactatga atgagcttgg ttcttgggaa cctagcaatg cctcgcgagc caacattgca 120 actattcctt tgcatcagcg atccaatctt gatccggcag agccgcgctt gatcgtaact 180 cacgatatgg ctggaggcta caaggaagac tcaaatattc agggcaatac gtatgataca 240 atttatagct gtcaatattg gcaatatgtg gatactttta tctatttctc gcatcatcga 300 gttacgatac ctcctgtcaa ttggataaat gcatgccaca gaaacggtgt caaaacgcta 360 ggaacattca tcgtggaagg agctgcgggc atgtttgcct tggagagatt cgtctacgga 420 cctgagcctg gacagagaaa cagctggagc ccttactatg ctgataagct ggtggacata 480 gccgagtttt acggtttcga cggctggctg cttaacattg agagtgattt cttcccttta 540 tatcgaaatc cgtctctgaa agcgatccat ctagcaaagc tgctgcgata tctgaagaat 600 gcaatgcacg ccagagtgcc aggttcagag atcatctggt atgacagcat gacgacaaac 660 ggaagtgtgc agtggcaaaa caatatcacg cccaaaaatt ccatattttt tgaagctgca 720 gatggcatat ttttaaatta ttggtggaac gcgacggttc cgccgttggc tttgcaagta 780 gcacatcgtc taggacgtca aggatctgat gtatactttg gaacggatgt ttggggacga 840 ggaacattcg gtggtggcgg attcgattca tatctcgctg ttggcactgc gagggcattc 900 aaaacatcat ctgcgctttt cggcacagca tggatctatg agcattttgg gaagaaagat 960 tttgagctta tggatagact tttgtggtta ggtggtggtc aatcagaata tccagctcag 1020 gaaggagagc agaatcgcac agtaaaagtt acatcccatc ttggaagaca tcctggtatc 1080 gccgatgtgt caccggtgcg aagtgctcca gggaaaacat ggttcgcaac gtggtttgat 1140 agaggttacg gaacaggttt ctattatcag ggcaagaaac tattatcaca gccgtggtcg 1200 catttatcgc atcaatctat cccgccgaat cttatagcca gattacagag agaagaaaat 1260 cacggccttt cgtatttcct ggcagacgac gatgcatacc tcgggggaac ttcgttgtta 1320 atagcagccg aaatcactca agaacgccaa ttgccgctct atcaactaga gtatgacgtt 1380 actgaaggct gcgaggtgca gtttatatac aagtctccgg aaccagatat gcaaggaaaa 1440 atagatatat atttgaactt gcaagttaca gacatactgc ctgatgagct agccttttac 1500 tggcaagatg ttacggatgc ttcctcccag gccgatgcaa cgacagccat gcgtttatat 1560 ctaaacgaaa acacagttgt ttatctaaag ccatccagga aacaagagct agccgaaggc 1620 tggttgctct gttccgtgcg tgtgccacct acttatccac ttggtatcgc aacgatcaag 1680 gaactaggga tccacgtgga cggtacagaa acagtgctat ttaggctggg tctccttaca 1740 attatacccc ttggagatgc gccgtctgcg ctttccagaa ttacccaggt ccagcttcaa 1800 agggatgagg atatccatag taaatgttca tcctcctcat gcgaactttg ggccacactc 1860 tcgtggatga tggaacgcaa ttcaaaagag gactgggacc aggtcgatca ctatatgatt 1920 ttcttcaaaa atgttgattc caaggcagaa cctattttcc ttggcaccag cttcagtacc 1980 gagtacagaa tatcaggcct ggagatcaag aaacacggaa attccatcga gatatgggca 2040 gtaaatcgct taggaaccgt cattgcacgg caagacatcg atatccaata g 2091 <210> 13 <211> 2109 <212> DNA <213> Artificial Sequence <220> <223> Optimized DNA sequence for expression of Endo-Rp3 in E. coli <400> 13 atgccgagcc tggaactgca gcaggcagca gatacccgtc tgtttgaaag catgccgctg 60 cagaccatga atgaactggg tagctgggaa ccgagcaatg caagccgtgc aaatattgca 120 accattccgc tgcatcagcg tagcaatctg gatccggcag aaccgcgtct gattgttacc 180 catgatatgg caggcggtta taaagaagat agcaatattc agggcaacac ctatgatacc 240 atttatagct gtcagtattg gcagtatgtg gacaccttta tctattttag ccatcaccgt 300 gttaccattc ctccggttaa ttggattaat gcctgtcatc gtaatggtgt taaaaccctg 360 ggcaccttta ttgttgaagg tgcagcaggt atgtttgcac tggaacgttt tgtttatggt 420 ccggaaccgg gtcagcgtaa tagctggtca ccgtattatg cagataaact ggttgatatc 480 gccgagtttt atggttttga tggttggctg ctgaacatcg aaagcgattt ttttccgctg 540 tatcgtaatc cgagcctgaa agcaattcat ctggcaaaac tgctgcgcta tctgaaaaat 600 gcaatgcatg cacgtgttcc gggtagcgaa attatctggt atgatagcat gaccaccaat 660 ggtagcgttc agtggcagaa taacattacc ccgaaaaaca gcatcttttt tgaagcagcc 720 gatggcatct ttctgaatta ttggtggaat gcaaccgttc ctccgctggc actgcaggtt 780 gcacatcgtc tgggtcgtca gggtagtgat gtttattttg gcaccgatgt ttggggtcgt 840 ggcacctttg gtggtggtgg ctttgatagt tatctggcag ttggcaccgc acgtgcattt 900 aaaaccagca gcgcactgtt tggtacagca tggatttatg aacacttcgg caaaaaagac 960 ttcgaactga tggatcgtct gctgtggctg ggtggtggtc agagcgaata tccggcacaa 1020 gaaggtgaac agaatcgtac cgttaaagtt accagccatc tgggtcgcca tccgggtatt 1080 gcagatgtta gtccggttcg tagcgcaccg ggtaaaacct ggtttgcaac atggtttgat 1140 cgtggttatg gcaccggttt ctattatcag ggtaaaaaac tgctgagcca gccgtggtca 1200 catctgagcc atcagagcat tccgcctaat ctgattgcac gcctgcagcg tgaagaaaat 1260 catggcctga gctattttct ggcagatgat gatgcatatc tgggtggcac cagcctgctg 1320 attgcagcag aaattaccca agaacgtcag ctgcctctgt atcagctgga atatgatgtt 1380 accgaaggtt gcgaagtgca gttcatctat aaaagccctg aaccggatat gcagggcaaa 1440 attgatatct atctgaatct gcaggttacc gatatcctgc cggatgaact ggcattttat 1500 tggcaggacg ttaccgatgc aagcagccag gcagatgcaa ccaccgcaat gcgtctgtat 1560 ctgaatgaaa ataccgtggt ctatctgaaa ccgagccgta aacaagaact ggcggaaggc 1620 tggctgctgt gtagcgttcg tgttccgcct acctatccgc tgggtattgc caccattaaa 1680 gaactgggca ttcatgtgga tggtaccgaa accgttctgt ttcgcctggg tctgctgacc 1740 attatcccgc tgggtgatgc accgagcgca ctgagccgta ttacccaggt tcagctgcaa 1800 cgtgatgaag atattcatag caaatgtagc agcagcagct gtgaactgtg ggcaaccctg 1860 agctggatga tggaacgtaa tagcaaagaa gattgggatc aggtcgatca ctacatgatc 1920 tttttcaaaa acgtggatag caaagccgaa ccgatttttc tgggcaccag ctttagcacc 1980 gaatatcgta ttagcggtct ggaaatcaaa aaacatggca acagcattga aatctgggca 2040 gttaatcgcc tgggcacagt tattgcacgt caggatattg atattcagca tcatcaccat 2100 caccattaa 2109 <210> 14 <211> 2091 <212> DNA <213> Rhizomucor pusillus <400> 14 atgccttcac tcgaactaca gcaagctgct gacacgagac ttttcgagtc tatgccactt 60 cagactatga atgagcttgg ttcttgggaa cctagcaatg cctcgcgagc caacattgca 120 actattcctt tgcatcagcg atccaatctt gatccggcag agccgcgctt gatcgtaact 180 cacgatatgg ctggaggcta caaggaagac tcaaatattc agggcaatac gtatgataca 240 atttatagct gtcaatattg gcaatatgtg gatactttta tctatttctc gcatcatcga 300 gttacgatac ctcctgtcaa ttggataaat gcatgccaca gaaacggtgt caaaacgcta 360 ggaacattca ttgtggaagg agctgcgggc atgtttgcct tggagagatt cgtctacgga 420 cctgagcctg gacagagaaa cagctggagc ccttactatg ctgataagct ggtggacata 480 gccgagtttt acggtttcga cggctggctg cttaacattg agagtgattt tttcccttta 540 tatcgaaatc cgtctctgaa agcgatccat ctagcaaagc tgctgcgata tctgaagaat 600 gcaatgcacg ccagagtgcc aggttcagag atcatctggt atgacagcat gacgacaaac 660 ggaagtgtgc agtggcaaaa caatatcacg cccaaaaatt ccatattttt tgaagctgca 720 gatggcatat ttttaaatta ttggtggaac gcgacggttc cgccgttggc tttgcaagta 780 gcacatcgtc taggacgtca aggatctgat gtatactttg gaacggatgt ttggggacga 840 ggaacattcg gtggtggcgg attcgattca tatctcgctg ttggcactgc gagggcattc 900 aaaacatcat ctgcgctttt cggcacagca tggatctatg agcattttgg gaagaaagat 960 tttgagctta tggatagact tttgtggtta ggtggtgatc aatcagaata tccagctcag 1020 gaaggagagc agaatcgcac agtaaaagtt acatcccatc ttggaagaca tcctggtatc 1080 gccgatgtgt caccggtgcg aagtgctcca gggaaaacat ggttcgcaac gtggtttgat 1140 agaggttacg gaacaggttt ctattatcag ggcaagaaac tattatcaca gccgtggtcg 1200 catttatcgc atcaatctat cccgccgaat cttatagcca gattacagag agaagaaaat 1260 cacggccttt cgtatttcct ggcagacgac gatgcataca tcgggggaac ttcgctgtta 1320 atagcagccg aaatcactca agaacgccaa ttgccgctct atcaactaga gtatgacgct 1380 actgaaggct gcgaggtgca gtttatatac aagtctccgg aaccagatat gcaaggaaaa 1440 atagatatat atttgaactt gcaagttaca gacatactgc ctgatgagct agccttttac 1500 tggcaagatg ttacggatgc ttcctcccag gccgatgcaa cgacagccat gcgtttatat 1560 ctaaacgaaa acacagttat ttatctaaag ccgtccagga aacaagagct agccgaaggc 1620 tggttgctct gttccgtgcg tgtgccacct acttatccac ttggtatcgc aacgatcaag 1680 gaactaggga tccatgtgga tggtacagaa acagtgctat ttaggctggg tctccttaca 1740 attatacccc ttggagatgc gccgtctgcg ctttccagaa ttacccaggt ccagcttcaa 1800 agggatgagg atatccatag taaatgtcca tcctcctcat gcgaactttg ggccacactc 1860 tcgtggatga tggaacacaa ctcaaaagag gactgggacc aggtcgatca ctatatgatt 1920 ttcttcaaaa atgttgattc caaggcagaa cctattttcc ttggcaccag cttcagtacc 1980 gagtacagaa tatcaggcct ggagatcaag aaacacggaa attccatcga gatatgggca 2040 gtaaatcgct taggaaccgt cattgcacgg caagacatcg atatccaata g 2091 <210> 15 <211> 2109 <212> DNA <213> Artificial Sequence <220> <223> Optimized DNA sequence for expression of Endo-Rp4 in E. coli <400> 15 atgccgagcc tggaactgca gcaggcagca gatacccgtc tgtttgaaag catgccgctg 60 cagaccatga atgaactggg tagctgggaa ccgagcaatg caagccgtgc aaatattgca 120 accattccgc tgcatcagcg tagcaatctg gatccggcag aaccgcgtct gattgttacc 180 catgatatgg caggcggtta taaagaagat agcaatattc agggcaacac ctatgatacc 240 atttatagct gtcagtattg gcagtatgtg gacaccttta tctattttag ccatcaccgt 300 gttaccattc ctccggttaa ttggattaat gcctgtcatc gtaatggtgt taaaaccctg 360 ggcaccttta ttgttgaagg tgcagcaggt atgtttgcac tggaacgttt tgtttatggt 420 ccggaaccgg gtcagcgtaa tagctggtca ccgtattatg cagataaact ggttgatatc 480 gccgagtttt atggttttga tggttggctg ctgaacatcg aaagcgattt ttttccgctg 540 tatcgtaatc cgagcctgaa agcaattcat ctggcaaaac tgctgcgcta tctgaaaaat 600 gcaatgcatg cacgtgttcc gggtagcgaa attatctggt atgatagcat gaccaccaat 660 ggtagcgttc agtggcagaa taacattacc ccgaaaaaca gcatcttttt tgaagcagcc 720 gatggcatct ttctgaatta ttggtggaat gcaaccgttc ctccgctggc actgcaggtt 780 gcacatcgtc tgggtcgtca gggtagtgat gtttattttg gcaccgatgt ttggggtcgt 840 ggcacctttg gtggtggtgg ctttgatagt tatctggcag ttggcaccgc acgtgcattt 900 aaaaccagca gcgcactgtt tggtacagca tggatttatg aacacttcgg caaaaaagac 960 ttcgaactga tggatcgtct gctgtggctg ggtggtgatc agagcgaata tccggcacaa 1020 gaaggtgaac agaatcgtac cgttaaagtt accagccatc tgggtcgcca tccgggtatt 1080 gcagatgtta gtccggttcg tagcgcaccg ggtaaaacct ggtttgcaac atggtttgat 1140 cgtggttatg gcaccggttt ctattatcag ggtaaaaaac tgctgagcca gccgtggtca 1200 catctgagcc atcagagcat tccgcctaat ctgattgcac gcctgcagcg tgaagaaaat 1260 catggcctga gctattttct ggcagatgat gatgcatata ttggtggcac cagcctgctg 1320 attgcagcag aaattaccca agaacgtcag ctgcctctgt atcagctgga atatgatgca 1380 accgaaggtt gcgaagtgca gttcatctat aaaagccctg aaccggatat gcagggcaaa 1440 attgatatct atctgaatct gcaggttacc gatatcctgc cggatgaact ggcattttat 1500 tggcaggacg ttaccgatgc aagcagccag gcagatgcaa ccaccgcaat gcgtctgtat 1560 ctgaatgaaa ataccgtgat ttatctgaaa ccgagccgta aacaagaact ggcggaaggc 1620 tggctgctgt gtagcgttcg tgttccgcct acctatccgc tgggtattgc caccattaaa 1680 gaactgggca ttcatgtgga tggtaccgaa accgttctgt ttcgcctggg tctgctgacc 1740 attatcccgc tgggtgatgc accgagcgca ctgagccgta ttacccaggt tcagctgcaa 1800 cgtgatgaag atattcatag caaatgtccg agcagcagct gtgaactgtg ggcaaccctg 1860 agctggatga tggaacataa tagcaaagaa gattgggatc aggtcgatca ctacatgatc 1920 tttttcaaaa acgtggatag caaagccgaa ccgatttttc tgggcaccag ctttagcacc 1980 gaatatcgta ttagcggtct ggaaatcaaa aaacatggca acagcattga aatctgggca 2040 gttaatcgcc tgggcacagt tattgcacgt caggatattg atattcagca tcatcaccat 2100 caccattaa 2109 <210> 16 <211> 2091 <212> DNA <213> Rhizomucor pusillus <400> 16 atgccttcac tcgaactaca gcaagctgct gacacgagac ttttcgagtc tatgccactt 60 cagactatga atgagcttgg ttcttgggaa cctagcaatg cctcgcgagc caacattgca 120 actattcctt tgcatcagcg atccaatctt gatccggcag agccgcgctt gatcgtaact 180 cacgatatgg ctggaggcta caaggaagac tcaaatattc agggcaatac gtatgataca 240 atttatagct gtcaatattg gcaatatgtg gatactttta tctatttctc gcatcatcga 300 gttacgatac ctcctgtcaa ttggataaat gcatgccaca gaaacggtgt caaaacgcta 360 ggaacattca ttgtggaagg agctgcgggc atgtttgcct tggagagatt cgtctacgga 420 cctgagcctg gacagagaaa cagctggagc ccttactatg ctgataagct ggtggacata 480 gccgagtttt acggtttcga cggctggctg cttaacattg agagtgattt cttcccttta 540 tatcgaaatc cgtctctgaa agcgatccat ctagcaaagc tgctgcgata tctgaagaat 600 gcaatgcacg ccagagtgcc aggttcagag atcatctggt atgacagcat gacgacaaac 660 ggaagtgtgc agtggcaaaa caatatcacg cccaaaaatt ccatattttt tgaagctgca 720 gatggcatat ttttaaatta ttggtggaac gcgacggttc cgccgttggc tttgcaagta 780 gcacatcgtc taggacgtca aggatctgat gtatactttg gaacggatgt ttggggacga 840 ggaacattcg gtggtggcgg attcgattca tatctcgctg ttggcactgc gagggcattc 900 aaaacatcat ctgcgctttt cggcacagca tggatctatg agcattttgg gaagaaagat 960 tttgagctta tggatagact tttgtggtta ggtggtgatc aatcagaata tccagctcag 1020 gaaggagagc agaatcgcac agtaaaagtt acatcccatc ttggaagaca tcctggtatc 1080 gccgatgtgt caccggtgcg aagtgctcca gggaaaacat ggttcgcaac gtggtttgat 1140 agaggttacg gaacaggttt ctattatcag ggcaagaaac tattatcaca gccgtggtcg 1200 catttatcgc atcaatctat cccgccgaat cttatagcca gattacagag agaagaaaat 1260 cacggccttt cgtatttcct ggcagacgac gatgcataca tcgggggaac ttcgctgtta 1320 atagcagccg aaatcactca agaacgccaa ttgccgctct atcaactaga gtatgacgtt 1380 actgaaggct gcgaggtgca gtttatatac aagtctccgg aaccagatat gcaaggaaaa 1440 atagatatat atttgaactt gcaagttaca gacatactgc ctgatgagct agccttttac 1500 tggcaagatg ttacggatgc ttcctcccag gccgatgcaa cgacagccat gcgtttatat 1560 ctaaacgaaa acacagttat ttatctaaag ccgtccagga aacaagagct agccgaaggc 1620 tggttgctct gttccgtgcg tgtgccacct acttatccac ttggtatcgc aacgatcaag 1680 gaactaggga tccatgtgga tggtacagaa acagtgctat ttaggctggg tctccttaca 1740 attatacccc ttggagatgc gccgtctgcg ctttccagaa ttacccaggt ccagcttcaa 1800 agggatgagg atatccatag taaatgtcca tcctcctcat gcgaactttg ggccacactc 1860 tcgtggatga tggaacacaa ctcaaaagag gactgggacc aggtcgatca ctatatgatt 1920 ttcttcaaaa atgttgattc caaggcagaa cctattttcc ttggcaccag cttcagtacc 1980 gagtacagaa tatcaggcct ggagatcaag aaacacggaa attccatcga gatatgggca 2040 gtaaatcgct taggaaccgt cattgcacgg caagacatcg atatccaata g 2091 <210> 17 <211> 2109 <212> DNA <213> Artificial Sequence <220> <223> Optimized DNA sequence for expression of Endo-Rp5 in E. coli <400> 17 atgccgagcc tggaactgca gcaggcagca gatacccgtc tgtttgaaag catgccgctg 60 cagaccatga atgaactggg tagctgggaa ccgagcaatg caagccgtgc aaatattgca 120 accattccgc tgcatcagcg tagcaatctg gatccggcag aaccgcgtct gattgttacc 180 catgatatgg caggcggtta taaagaagat agcaatattc agggcaacac ctatgatacc 240 atttatagct gtcagtattg gcagtatgtg gacaccttta tctattttag ccatcaccgt 300 gttaccattc ctccggttaa ttggattaat gcctgtcatc gtaatggtgt taaaaccctg 360 ggcaccttta ttgttgaagg tgcagcaggt atgtttgcac tggaacgttt tgtttatggt 420 ccggaaccgg gtcagcgtaa tagctggtca ccgtattatg cagataaact ggttgatatc 480 gccgagtttt atggttttga tggttggctg ctgaacatcg aaagcgattt ttttccgctg 540 tatcgtaatc cgagcctgaa agcaattcat ctggcaaaac tgctgcgcta tctgaaaaat 600 gcaatgcatg cacgtgttcc gggtagcgaa attatctggt atgatagcat gaccaccaat 660 ggtagcgttc agtggcagaa taacattacc ccgaaaaaca gcatcttttt tgaagcagcc 720 gatggcatct ttctgaatta ttggtggaat gcaaccgttc ctccgctggc actgcaggtt 780 gcacatcgtc tgggtcgtca gggtagtgat gtttattttg gcaccgatgt ttggggtcgt 840 ggcacctttg gtggtggtgg ctttgatagt tatctggcag ttggcaccgc acgtgcattt 900 aaaaccagca gcgcactgtt tggtacagca tggatttatg aacacttcgg caaaaaagac 960 ttcgaactga tggatcgtct gctgtggctg ggtggtgatc agagcgaata tccggcacaa 1020 gaaggtgaac agaatcgtac cgttaaagtt accagccatc tgggtcgcca tccgggtatt 1080 gcagatgtta gtccggttcg tagcgcaccg ggtaaaacct ggtttgcaac atggtttgat 1140 cgtggttatg gcaccggttt ctattatcag ggtaaaaaac tgctgagcca gccgtggtca 1200 catctgagcc atcagagcat tccgcctaat ctgattgcac gcctgcagcg tgaagaaaat 1260 catggcctga gctattttct ggcagatgat gatgcatata ttggtggcac cagcctgctg 1320 attgcagcag aaattaccca agaacgtcag ctgcctctgt atcagctgga atatgatgtt 1380 accgaaggtt gcgaagtgca gttcatctat aaaagccctg aaccggatat gcagggcaaa 1440 attgatatct atctgaatct gcaggttacc gatatcctgc cggatgaact ggcattttat 1500 tggcaggacg ttaccgatgc aagcagccag gcagatgcaa ccaccgcaat gcgtctgtat 1560 ctgaatgaaa ataccgtgat ttatctgaaa ccgagccgta aacaagaact ggcggaaggc 1620 tggctgctgt gtagcgttcg tgttccgcct acctatccgc tgggtattgc caccattaaa 1680 gaactgggca ttcatgtgga tggtaccgaa accgttctgt ttcgcctggg tctgctgacc 1740 attatcccgc tgggtgatgc accgagcgca ctgagccgta ttacccaggt tcagctgcaa 1800 cgtgatgaag atattcatag caaatgtccg agcagcagct gtgaactgtg ggcaaccctg 1860 agctggatga tggaacataa tagcaaagaa gattgggatc aggtcgatca ctacatgatc 1920 tttttcaaaa acgtggatag caaagccgaa ccgatttttc tgggcaccag ctttagcacc 1980 gaatatcgta ttagcggtct ggaaatcaaa aaacatggca acagcattga aatctgggca 2040 gttaatcgcc tgggcacagt tattgcacgt caggatattg atattcagca tcatcaccat 2100 caccattaa 2109 <210> 18 <211> 2094 <212> DNA <213> Rhizomucor miehei <400> 18 atgccctcac tcgaacttca gcaagccgtg gacacaagac tcttcgagtc aacaccactt 60 atgactatgg atgagcttgg ctcctgggat cctagcaatg ctttgcgagc cagcattgcg 120 acagttcctc tgcatccgcg accaagcatc gatccgacag aaccacgctt gattgtgaca 180 cacgatatgg caggaggcta caaggaagac tttagtattc agggcaatgc atatgacacc 240 gtttacacct gccaatattg gcaatacgtg gacattttta tctacttctc gcatcatcga 300 gttacgatac cacccgtaaa ctggacgaat gcttgccaca ggaacggtgt caaaagtctc 360 ggaacattta ttgttgaagg agcagcaggc atgtttgccc tggagaggtt cgtgtatggc 420 cctaaccctg ggcaaaggaa gagctggagc ccatattatg cagataagct agtggacatt 480 gccgaatttt atggtttcga tggatggttg atcaatattg aaagcgattt tttccctctg 540 tatcgaagcc cgtcaatgaa ggcgaaacat ttggcaaagc tgctgctata tctcaggaat 600 gctatgcatg ccagagtacc gggttcgcag atcatctggt atgacagcat gaccacaagt 660 ggatacgttc aatggcaaaa caatattaca cctcagaatg agatattctt tgaggctgcc 720 gatggtatat ttttgaatta ctggtggaat gcaacatacc caccttttgc catgcaggta 780 gcgcattatc tgggtcgcca aggatccgat gtatactttg gttctgacat ttggggacga 840 ggaacttttg gtggtggtgg cttcgattca tacctggcag ttgctaccgc gagtgctttt 900 aagacgtcat ctgcactttt cggcacagca tggacttatg aacattttga aaagaaggac 960 tttgagctga tggataggct actgtggtta ggcggtgatc aatcagagta tccagctcaa 1020 gcagaagggc aggaaagcat agcaaagtct gggtcgcgac tcggaagaca cccaggcatt 1080 accgatgtgg ctgcagttcg tagcgctcca ggtcgaagat ggtttgtaac ttggttcgat 1140 agaggacatg gaaccggttt ctatcatcaa ggaaagaaac tactatcaca accatggtcc 1200 catttgtctc atcaatctat accgcccaat ctcgtcgcca gactgcaaag gaaagaagat 1260 gacggcgttt cgtacttctt ggccgacgat gatgcttaca ttggaggaac gtctctatta 1320 atagcagcag agggtaccca agaacgtcag ataccacttt atcaactgaa ttatgacgcc 1380 acaaacggat gtgaagtgca gtttgtttat aagtccccag agccggatat gcaaagcaaa 1440 gtgcagatat atttgaacct cagagtgaca gatgttctac ctgacgaact cgcttactac 1500 tggcacgacg ttgcagctac ctctccccag cctcaggcaa caacagcctc gcgtttgaac 1560 atcaacgaag acaccagtgt ttatttgaat acttcgaaga cgcaagaatt ggcagaaggc 1620 tgggtgttgt gctccgttcg agtgccatct gttcacccgc taggcgaagc tgcaattgaa 1680 gaattaggaa tctatttgga cggaactgag gatgtgctgt tcagattggg gcttttgact 1740 atcgtgccct acacagatac gtcatctact cttgcaagca aaataactca catccagctt 1800 caaagggatg cagacgtcag cagtaaatgc ttatcatctt cgtgcgaact ctgggctacg 1860 ttatcctgga tgatggagtc gaattctagt gaggaatgga accaagtcga tcactatctc 1920 atttcctacg gagatatcaa tgctgatggt gcagctacat ttctcggtac tactttcact 1980 acagagtata ggatatcagg tctggagatg aagaatgaca tcgactatat ccaaatttcg 2040 gcagtgagcc gcctaggcaa tatacttgca cagcaaacga tcggcataca gtag 2094 <210> 19 <211> 2112 <212> DNA <213> Artificial Sequence <220> <223> Optimized DNA sequence for expression of Endo-Rm in E. coli <400> 19 atgccgagcc tggaactgca gcaggcagtt gatacccgtc tgtttgaaag cacaccgctg 60 atgaccatgg atgaactggg tagctgggat ccgagcaatg cactgcgtgc aagcattgca 120 accgttccgc tgcatccgcg tccgagcatt gatccgaccg aaccgcgtct gattgttacc 180 catgatatgg caggcggtta taaagaagat tttagcattc agggcaacgc ctatgatacc 240 gtttatacct gtcagtattg gcagtatgtg gacatcttta tctattttag ccatcaccgt 300 gttaccattc cgcctgttaa ttggaccaat gcatgtcatc gtaatggtgt taaaagcctg 360 ggcaccttta ttgttgaagg tgcagcaggt atgtttgcac tggaacgttt tgtttatggt 420 ccgaatccgg gtcagcgtaa aagctggtca ccgtattatg cagataaact ggttgatatc 480 gccgagtttt atggttttga tggttggctg attaacatcg agagcgattt ttttccgctg 540 tatcgtagcc cgagcatgaa agcaaaacat ctggcaaaac tgctgctgta tctgcgtaat 600 gcaatgcatg cccgtgttcc gggtagccag attatttggt atgatagcat gaccaccagt 660 ggttatgttc agtggcagaa taacattaca ccgcagaacg aaatcttttt tgaagcagcc 720 gatggcatct ttctgaatta ttggtggaat gcaacctatc cgccttttgc aatgcaggtt 780 gcacattatc tgggtcgtca gggtagtgat gtttattttg gtagcgatat ttggggtcgt 840 ggcacctttg gtggtggtgg ctttgatagt tatctggcag ttgcaaccgc aagcgcattt 900 aaaaccagca gcgcactgtt tggcaccgca tggacctatg aacattttga gaaaaaagac 960 ttcgagctga tggatcgtct gctgtggctg ggtggtgatc agagcgaata tccggcacag 1020 gcagaaggtc aagaaagcat tgccaaaagc ggtagccgtc tgggtcgcca tccgggtatt 1080 accgatgttg cagcagttcg tagcgcaccg ggtcgtcgtt ggtttgttac ctggtttgat 1140 cgtggtcatg gcaccggttt ttatcatcag ggtaaaaaac tgctgagcca gccgtggtca 1200 catctgagcc atcagagcat tcctccgaat ctggttgcac gtctgcagcg caaagaagat 1260 gacggcgtta gctattttct ggcagatgat gatgcatata ttggtggcac cagcctgctg 1320 attgcagcag aaggcaccca agaacgtcag attcctctgt atcagctgaa ttatgatgca 1380 accaatggtt gtgaagtgca gttcgtgtat aaaagtccgg aaccggatat gcagagcaaa 1440 gttcagattt atctgaatct gcgtgtgacc gatgttctgc cggatgagct ggcatattat 1500 tggcatgatg ttgccgcaac cagtccgcag ccgcaggcaa ccaccgcaag ccgtctgaat 1560 attaacgaag ataccagcgt gtatctgaac accagcaaaa cacaagaact ggccgaaggt 1620 tgggttctgt gtagcgttcg tgttccgagc gttcatccgc tgggtgaagc agcaattgaa 1680 gaactgggca tttatctgga tggcaccgaa gatgttctgt ttcgcctggg tctgctgacc 1740 attgttccgt ataccgatac cagcagcacc ctggcaagca aaatcaccca tattcagctg 1800 cagcgtgatg cagatgttag cagcaaatgt ctgagcagca gctgtgaact gtgggcaacc 1860 ctgagctgga tgatggaaag caatagcagc gaagaatgga atcaggtgga tcattatctg 1920 attagctatg gcgatattaa tgcagatggt gcagccacct ttctgggcac cacctttacc 1980 accgaatatc gtattagcgg tctggaaatg aaaaacgaca tcgattacat tcagattagc 2040 gcagttagtc gtctgggtaa tattctggcc cagcagacca ttggtattca gcatcatcac 2100 catcaccact aa 2112 <210> 20 <211> 2106 <212> DNA <213> Artificial Sequence <220> <223> The assumed DNA sequence derived from publicly availabe genomic DNA sequence of Rhizomucor pusillus strain CBS 183.67, which has been assumed to encode endo-beta-N-acetylglucosaminidase. <400> 20 atgccttcac tcgaactaca gcaagctgct gacacgagac ttttcgagtc tatgccactt 60 cagactatga atgagcttgg ttcttgggaa cctagcaatg cctcgcgagc caacattgca 120 actattcctt tgcatcagcg atccaatctt gatccggcag agccgcgctt gatcgtaact 180 cacgatatgg ctggaggcta caaggaagac tcaaatattc agggcaatac gtatgataca 240 atttatagct gtcaatattg gcaatatgtg gatactttta tctatttctc gcatcatcga 300 gttacgatac ctcctgtcaa ttggataaat gcatgccaca gaaacggtgt caaaacgcta 360 ggaacattca ttgtggaagg agctgcgggc atgtttgcct tggagagatt cgtctacgga 420 cctgagcctg gacagagaaa cagctggagc ccttactatg ctgataagct ggtggacata 480 gccgagtttt acggtttcga cggctggctg cttaacattg agagtgattt cttcccttta 540 tatcgaaatc cgtctctgaa agcgatccat ctagcaaata catattatat aaggctgctg 600 cgatatctga agaatgcaat gcacgccaga gtgccaggtt cagagatcat ctggtatgac 660 agcatgacga caaacggaag tgtgcagtgg caaaacaata tcacgcccaa aaattccata 720 ttttttgaag ctgcagatgg catattttta aattattggt ggaacgcgac ggttccgccg 780 ttggctttgc aagtagcaca tcgtctagga cgtcaaggat ctgatgtata ctttggaacg 840 gatgtttggg gacgaggaac attcggtggt ggcggattcg attcatatct cgctgttggc 900 actgcgaggg cattcaaaac atcatctgcg cttttcggca cagcatggat ctatgagcat 960 tttgggaaga aagattttga gcttatggat agacttttgt ggttaggtgg tgatcaatca 1020 gaatatccag ctcaggaagg agagcagaat cgcacagtaa aagttacatc ccatcttgga 1080 agacatcctg gtatcgccga tgtgtcaccg gtgcgaagtg ctccagggaa aacatggttc 1140 gcaacgtggt ttgatagagg ttacggaaca ggtttctatt atcagggcaa gaaactatta 1200 tcacagccgt ggtcgcattt atcgcatcaa tctatcccgc cgaatcttat agccagatta 1260 cagagagaag aaaatcacgg cctttcgtat ttcctggcag acgacgatgc atacatcggg 1320 ggaacttcgc tgttaatagc agccgaaatc actcaagaac gccaattgcc gctctatcaa 1380 ctagagtatg acgttactga aggctgcgag gtgcagttta tatacaagtc tccggaacca 1440 gatatgcaag gaaaaataga tatatatttg aacttgcaag ttacagacat actgcctgat 1500 gagctagcct tttactggca agatgttacg gatgcttcct cccaggccga tgcaacgaca 1560 gccatgcgtt tatatctaaa cgaaaacaca gttatttatc taaagccgtc caggaaacaa 1620 gagctagccg aaggctggtt gctctgttcc gtgcgtgtgc cacctactta tccacttggt 1680 atcgcaacga tcaaggaact agggatccat gtggatggta cagaaacagt gctatttagg 1740 ctgggtctcc ttacaattat accccttgga gatgcgccgt ctgcgctttc cagaattacc 1800 caggtccagc ttcaaaggga tgaggatatc catagtaaat gtccatcctc ctcatgcgaa 1860 ctttgggcca cactctcgtg gatgatggaa cacaactcaa aagaggactg ggaccaggtc 1920 gatcactata tgattttctt caaaaatgtt gattccaagg cagaacctat tttccttggc 1980 accagcttca gtaccgagta cagaatatca ggcctggaga tcaagaaaca cggaaattcc 2040 atcgagatat gggcagtaaa tcgcttagga accgtcattg cacggcaaga catcgatatc 2100 caatag 2106 <210> 21 <211> 2124 <212> DNA <213> Artificial Sequence <220> <223> Optimized DNA sequence for expression of the assumed amino acid sequence of SEQ ID NO:7 in E. coli <400> 21 atgccgagcc tggaactgca gcaggcagca gatacccgtc tgtttgaaag catgccgctg 60 cagaccatga atgaactggg tagctgggaa ccgagcaatg caagccgtgc aaatattgca 120 accattccgc tgcatcagcg tagcaatctg gatccggcag aaccgcgtct gattgttacc 180 catgatatgg caggcggtta taaagaagat agcaatattc agggcaacac ctatgatacc 240 atttatagct gtcagtattg gcagtatgtg gacaccttta tctattttag ccatcaccgt 300 gttaccattc ctccggttaa ttggattaat gcctgtcatc gtaatggtgt taaaaccctg 360 ggcaccttta ttgttgaagg tgcagcaggt atgtttgcac tggaacgttt tgtttatggt 420 ccggaaccgg gtcagcgtaa tagctggtca ccgtattatg cagataaact ggttgatatc 480 gccgagtttt atggttttga tggttggctg ctgaacatcg aaagcgattt ttttccgctg 540 tatcgtaatc cgagcctgaa agcaattcat ctggcaaaca cctattatat ccgtctgctg 600 cgctatctga aaaatgcaat gcatgcacgt gttccgggta gcgaaattat ctggtatgat 660 agcatgacca ccaatggtag cgttcagtgg cagaataaca ttaccccgaa aaacagcatc 720 ttttttgaag cagccgatgg catctttctg aattattggt ggaatgcaac cgttcctccg 780 ctggcactgc aggttgcaca tcgtctgggt cgtcagggta gtgatgttta ttttggcacc 840 gatgtttggg gtcgtggcac ctttggtggt ggtggctttg atagttatct ggcagttggc 900 accgcacgtg catttaaaac cagcagcgca ctgtttggta cagcatggat ttatgaacac 960 ttcggcaaaa aagacttcga actgatggat cgtctgctgt ggctgggtgg tgatcagagc 1020 gaatatccgg cacaagaagg tgaacagaat cgtaccgtta aagttaccag ccatctgggt 1080 cgccatccgg gtattgcaga tgttagtccg gttcgtagcg caccgggtaa aacctggttt 1140 gcaacatggt ttgatcgtgg ttatggcacc ggtttctatt atcagggtaa aaaactgctg 1200 agccagccgt ggtcacatct gagccatcag agcattccgc ctaatctgat tgcacgcctg 1260 cagcgtgaag aaaatcatgg cctgagctat tttctggcag atgatgatgc atatattggt 1320 ggcaccagcc tgctgattgc agcagaaatt acccaagaac gtcagctgcc tctgtatcag 1380 ctggaatatg atgttaccga aggttgcgaa gtgcagttca tctataaaag ccctgaaccg 1440 gatatgcagg gcaaaattga tatctatctg aatctgcagg ttaccgatat cctgccggat 1500 gaactggcat tttattggca ggacgttacc gatgcaagca gccaggcaga tgcaaccacc 1560 gcaatgcgtc tgtatctgaa tgaaaatacc gtgatttatc tgaaaccgag ccgtaaacaa 1620 gaactggcgg aaggctggct gctgtgtagc gttcgtgttc cgcctaccta tccgctgggt 1680 attgccacca ttaaagaact gggcattcat gtggatggta ccgaaaccgt tctgtttcgc 1740 ctgggtctgc tgaccattat cccgctgggt gatgcaccga gcgcactgag ccgtattacc 1800 caggttcagc tgcaacgtga tgaagatatt catagcaaat gtccgagcag cagctgtgaa 1860 ctgtgggcaa ccctgagctg gatgatggaa cataatagca aagaagattg ggatcaggtc 1920 gatcactaca tgatcttttt caaaaacgtg gatagcaaag ccgaaccgat ttttctgggc 1980 accagcttta gcaccgaata tcgtattagc ggtctggaaa tcaaaaaaca tggcaacagc 2040 attgaaatct gggcagttaa tcgcctgggc acagttattg cacgtcagga tattgatatt 2100 cagcatcatc accatcacca ttaa 2124 <210> 22 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> PCR primer for cloning of Endo-Rp gene <400> 22 atgccttcac tcgaactaca gcaagc 26 <210> 23 <211> 696 <212> PRT <213> Artificial Sequence <220> <223> Possible mutations in Endo-Rp amino acid sequence, which are confirmed to work in working examples. <220> <221> mutation <222> (128)..(128) <223> The position can be various amino acid, preferably Ala or Thr <220> <221> mutation <222> (172)..(172) <223> The position can be various amino acid, preferably Asn, Asp, Gln, Glu, Ala, Cys, His, Phe, Gly, Leu, Ile, Lys, Met, Pro, Ser, Thr or Val. <220> <221> mutation <222> (176)..(176) <223> The position can be various amino acid, preferably Asp or Arg. <220> <221> mutation <222> (214)..(214) <223> The position can be various amino acid with large side chain, preferably Tyr or Phe. <220> <221> mutation <222> (216)..(216) <223> The position can be various amino acid with small side chain, preferably Ser, Ala or Val. <220> <221> mutation <222> (245)..(245) <223> The position can be various amino acid, preferably Leu or Ser. <220> <221> mutation <222> (246)..(246) <223> The position can be various amino acid, preferably Asn or Asp. <220> <221> mutation <222> (275)..(275) <223> The position can be various amino acid, preferably Thr or Ile. <220> <221> mutation <222> (278)..(278) <223> The position can be various amino acid with hydrophobic side chain, preferably, Phe, Tyr, Ala, Leu or Ile. <220> <221> mutation <222> (283)..(283) <223> The position can be various amino acid, preferably Phe or Ser. <220> <221> mutation <222> (306)..(306) <223> The position can be various amino acid, preferably Leu or Ile. <220> <221> mutation <222> (307)..(307) <223> The position can be various amino acid, preferably Phe, Tyr or His. <220> <221> mutation <222> (310)..(310) <223> The position can be various amino acid with poler or charged side chain, preferably Asp, Glu, <220> <221> mutation <222> (314)..(314) <223> The position can be various amino acid, preferably Glu or Gln. <220> <221> mutation <222> (333)..(333) <223> The position can be various amino acid, preferably Asp or Gly. <220> <221> mutation <222> (434)..(434) <223> The position can be various amino acid, preferably Ile or Leu. <220> <221> mutation <222> (460)..(460) <223> The position can be various amino acid, preferably Val or Ala. <220> <221> mutation <222> (527)..(527) <223> The position can be various amino acid, preferably Ile or Val. <220> <221> mutation <222> (569)..(569) <223> The position an be various amino acid, preferably Lys or Thr <220> <221> mutation <222> (610)..(610) <223> The position can be various amino acid, preferably Phe or Ser. <220> <221> mutation <222> (626)..(626) <223> The position can be various amino acid, preferably His or Arg. <400> 23 Met Pro Ser Leu Glu Leu Gln Gln Ala Ala Asp Thr Arg Leu Phe Glu 1 5 10 15 Ser Met Pro Leu Gln Thr Met Asn Glu Leu Gly Ser Trp Glu Pro Ser 20 25 30 Asn Ala Ser Arg Ala Asn Ile Ala Thr Ile Pro Leu His Gln Arg Ser 35 40 45 Asn Leu Asp Pro Ala Glu Pro Arg Leu Ile Val Thr His Asp Met Ala 50 55 60 Gly Gly Tyr Lys Glu Asp Ser Asn Ile Gln Gly Asn Thr Tyr Asp Thr 65 70 75 80 Ile Tyr Ser Cys Gln Tyr Trp Gln Tyr Val Asp Thr Phe Ile Tyr Phe 85 90 95 Ser His His Arg Val Thr Ile Pro Pro Val Asn Trp Ile Asn Ala Cys 100 105 110 His Arg Asn Gly Val Lys Thr Leu Gly Thr Phe Ile Val Glu Gly Xaa 115 120 125 Ala Gly Met Phe Ala Leu Glu Arg Phe Val Tyr Gly Pro Glu Pro Gly 130 135 140 Gln Arg Asn Ser Trp Ser Pro Tyr Tyr Ala Asp Lys Leu Val Asp Ile 145 150 155 160 Ala Glu Phe Tyr Gly Phe Asp Gly Trp Leu Leu Xaa Ile Glu Ser Xaa 165 170 175 Phe Phe Pro Leu Tyr Arg Asn Pro Ser Leu Lys Ala Ile His Leu Ala 180 185 190 Lys Leu Leu Arg Tyr Leu Lys Asn Ala Met His Ala Arg Val Pro Gly 195 200 205 Ser Glu Ile Ile Trp Xaa Asp Xaa Met Thr Thr Asn Gly Ser Val Gln 210 215 220 Trp Gln Asn Asn Ile Thr Pro Lys Asn Ser Ile Phe Phe Glu Ala Ala 225 230 235 240 Asp Gly Ile Phe Xaa Xaa Tyr Trp Trp Asn Ala Thr Val Pro Pro Leu 245 250 255 Ala Leu Gln Val Ala His Arg Leu Gly Arg Gln Gly Ser Asp Val Tyr 260 265 270 Phe Gly Xaa Asp Val Xaa Gly Arg Gly Thr Xaa Gly Gly Gly Gly Phe 275 280 285 Asp Ser Tyr Leu Ala Val Gly Thr Ala Arg Ala Phe Lys Thr Ser Ser 290 295 300 Ala Xaa Xaa Gly Thr Xaa Trp Ile Tyr Xaa His Phe Gly Lys Lys Asp 305 310 315 320 Phe Glu Leu Met Asp Arg Leu Leu Trp Leu Gly Gly Xaa Gln Ser Glu 325 330 335 Tyr Pro Ala Gln Glu Gly Glu Gln Asn Arg Thr Val Lys Val Thr Ser 340 345 350 His Leu Gly Arg His Pro Gly Ile Ala Asp Val Ser Pro Val Arg Ser 355 360 365 Ala Pro Gly Lys Thr Trp Phe Ala Thr Trp Phe Asp Arg Gly Tyr Gly 370 375 380 Thr Gly Phe Tyr Tyr Gln Gly Lys Lys Leu Leu Ser Gln Pro Trp Ser 385 390 395 400 His Leu Ser His Gln Ser Ile Pro Pro Asn Leu Ile Ala Arg Leu Gln 405 410 415 Arg Glu Glu Asn His Gly Leu Ser Tyr Phe Leu Ala Asp Asp Asp Ala 420 425 430 Tyr Xaa Gly Gly Thr Ser Leu Leu Ile Ala Ala Glu Ile Thr Gln Glu 435 440 445 Arg Gln Leu Pro Leu Tyr Gln Leu Glu Tyr Asp Xaa Thr Glu Gly Cys 450 455 460 Glu Val Gln Phe Ile Tyr Lys Ser Pro Glu Pro Asp Met Gln Gly Lys 465 470 475 480 Ile Asp Ile Tyr Leu Asn Leu Gln Val Thr Asp Ile Leu Pro Asp Glu 485 490 495 Leu Ala Phe Tyr Trp Gln Asp Val Thr Asp Ala Ser Ser Gln Ala Asp 500 505 510 Ala Thr Thr Ala Met Arg Leu Tyr Leu Asn Glu Asn Thr Val Xaa Tyr 515 520 525 Leu Lys Pro Ser Arg Lys Gln Glu Leu Ala Glu Gly Trp Leu Leu Cys 530 535 540 Ser Val Arg Val Pro Pro Thr Tyr Pro Leu Gly Ile Ala Thr Ile Lys 545 550 555 560 Glu Leu Gly Ile His Val Asp Gly Xaa Glu Thr Val Leu Phe Arg Leu 565 570 575 Gly Leu Leu Thr Ile Ile Pro Leu Gly Asp Ala Pro Ser Ala Leu Ser 580 585 590 Arg Ile Thr Gln Val Gln Leu Gln Arg Asp Glu Asp Ile His Ser Lys 595 600 605 Cys Xaa Ser Ser Ser Cys Glu Leu Trp Ala Thr Leu Ser Trp Met Met 610 615 620 Glu Xaa Asn Ser Lys Glu Asp Trp Asp Gln Val Asp His Tyr Met Ile 625 630 635 640 Phe Phe Lys Asn Val Asp Ser Lys Ala Glu Pro Ile Phe Leu Gly Thr 645 650 655 Ser Phe Ser Thr Glu Tyr Arg Ile Ser Gly Leu Glu Ile Lys Lys His 660 665 670 Gly Asn Ser Ile Glu Ile Trp Ala Val Asn Arg Leu Gly Thr Val Ile 675 680 685 Ala Arg Gln Asp Ile Asp Ile Gln 690 695

Claims (19)

  1. 이하의 (A) 및 (B) 의 특성을 갖는 폴리펩티드 ;
    (A) 서열 번호 1 에 기재된 아미노산 서열과 75 % 이상의 동일성 및 95 % 이상의 유사성을 갖는 아미노산 서열을 포함하고, 또한, 서열 번호 7 의 아미노산 서열과는 상이한 아미노산 서열이다 ;
    (B) 복합 당 사슬에 대한 가수 분해 활성 및/또는 당 전이 활성이, 45 ∼ 60 ℃ 의 어느 온도에서 최대 활성값의 40 % 이상을 나타낸다.
  2. 제 1 항에 있어서,
    이하의 (A) 및 (B) 의 특성을 갖는, 폴리펩티드 ;
    (A) 서열 번호 1 에 기재된 아미노산 서열과 75 % 이상의 동일성 및 95 % 이상의 유사성을 갖는 아미노산 서열을 포함하고, 또한, 서열 번호 1 의 아미노산 번호 191 ∼ 195 의 아미노산 서열에 상당하는 아미노산 서열이, Leu-Ala-Lys-Leu-Leu (LAKLL) 이다 ;
    (B) 복합 당 사슬에 대한 가수 분해 활성이, 45 ∼ 60 ℃ 의 어느 온도에서 최대 활성값의 40 % 이상을 나타낸다.
  3. 제 1 항에 있어서,
    50 ℃ 에 있어서의 복합 당 사슬에 대한 가수 분해 활성이, 최대 활성값의 60 % 이상을 나타내는 것을 특징으로 하는, 폴리펩티드.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    (A) 및 (B) 의 특성에 더하여, 추가로 (C) 대장균을 사용한 유전자 재조합 발현에 있어서, 10 ㎎/ℓ 배양 이상을 나타내는 것을 특징으로 하는, 폴리펩티드.
  5. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
    서열 번호 1 의 아미노산 서열에 있어서, 아미노산 번호 54 ∼ 341 의 영역에 있어서의 서열 동일성이, 85 % 이상인 것을 특징으로 하는, 폴리펩티드.
  6. 제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
    D276, V223, W225, Y247 및 W248 의 아미노산 중 적어도 1 개가 유지되어 있는 것 (바람직하게는, 적어도 D276 이 유지되어 있는 것) 을 특징으로 하는, 폴리펩티드.
  7. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    서열 번호 1 의 아미노산 서열로 이루어지는 폴리펩티드, 또는, 서열 번호 1 의 아미노산 서열에 있어서, A128T, D333G, I434L, V460A, I527V, K569T, F610S 및 H626R 로 이루어지는 군에서 선택되는 적어도 1 개의 변이를 갖는 아미노산 서열로 이루어지는 폴리펩티드인 것을 특징으로 하는, 폴리펩티드.
  8. 제 1 항에 있어서,
    서열 번호 1 ∼ 6 의 어느 아미노산 서열로 이루어지는 것을 특징으로 하는, 폴리펩티드.
  9. 제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
    특성 (A) 를 충족하는 아미노산 서열을 갖고, 서열 번호 23 에 나타나는 변이의 적어도 1 개를 갖는 것을 특징으로 하는, 폴리펩티드.
  10. 제 9 항에 있어서,
    N172, D176, Y214, S216, L245, N246, T275, L306, F307 및 A310 에서 선택되는 적어도 1 개의 아미노산에 변이를 갖고, 증강된 당 사슬 전이 활성을 갖는 것을 특징으로 하는, 폴리펩티드.
  11. 제 7 항에 있어서,
    이하의 군에서 선택되는 적어도 1 개의 변이를 갖는 것을 특징으로 하는, 폴리펩티드 ;
    N172 가 Gln, Asp, Gly, Ala, Phe, Cys, His, Ile, Ser, Thr, Val 또는 Met 로 치환된 변이, D176 이 Arg 로 치환된 변이, Y214 가 Phe 로 치환된 변이, S216 이 Val 로 치환된 변이, L245 가 Ser 로 치환된 변이, N246 이 Asp 로 치환된 변이, T275 가 Ile 로 치환된 변이, F283 이 Ser 로 치환된 변이, L306 이 Ile 로 치환된 변이, F307 이 Tyr 로 치환된 변이, A310 이 Asp 로 치환된 변이, 및, E314 가 Gln 으로 치환된 변이.
  12. 제 9 항 내지 제 11 항 중 어느 한 항에 있어서,
    W278 이 Phe 또는 Tyr 로 치환된 변이를 갖는 것을 특징으로 하는, 폴리펩티드.
  13. 제 1 항 내지 제 12 항 중 어느 한 항에 기재된 폴리펩티드를 코드하는 폴리뉴클레오티드.
  14. 제 13 항에 있어서,
    서열 번호 8 ∼ 17 의 뉴클레오티드 번호 1 ∼ 2088 의 뉴클레오티드 서열, 및 서열 번호 18 ∼ 19 의 뉴클레오티드 번호 1 ∼ 2091 의 뉴클레오티드 서열의 어느 뉴클레오티드 서열을 갖는, 폴리뉴클레오티드.
  15. 제 13 항 또는 제 14 항에 기재된 폴리뉴클레오티드를 포함하는 발현용 플라스미드.
  16. 제 15 항에 기재된 플라스미드로 형질 전환된 숙주 세포.
  17. 제 16 항에 있어서,
    서열 번호 9, 11, 13, 15 혹은 17 의 뉴클레오티드 번호 1 ∼ 2088 의 뉴클레오티드 서열, 또는, 서열 번호 19 의 뉴클레오티드 번호 1 ∼ 2091 의 뉴클레오티드 서열, 을 포함하는 폴리뉴클레오티드를 포함하는 플라스미드로 형질 전환된 대장균인, 숙주 세포.
  18. 제 16 항 또는 제 17 항에 기재된 숙주 세포를 배양하고, 얻어진 배양물로부터 제 1 항 내지 제 12 항 중 어느 한 항에 기재된 폴리펩티드를 회수하는 공정을 포함하는, 제 1 항 내지 제 12 항 중 어느 한 항에 기재된 폴리펩티드의 제조 방법.
  19. 제 1 항 내지 제 12 항 중 어느 한 항에 기재된 폴리펩티드를 함유하는 시약.
KR1020197015649A 2016-12-02 2017-12-01 신규 엔도-β-N-아세틸글루코사미니다아제 KR102399639B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JPJP-P-2016-234808 2016-12-02
JP2016234808 2016-12-02
PCT/JP2017/043219 WO2018101454A1 (ja) 2016-12-02 2017-12-01 新規エンド-β-N-アセチルグルコサミニダーゼ

Publications (2)

Publication Number Publication Date
KR20190088483A true KR20190088483A (ko) 2019-07-26
KR102399639B1 KR102399639B1 (ko) 2022-05-18

Family

ID=62241756

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197015649A KR102399639B1 (ko) 2016-12-02 2017-12-01 신규 엔도-β-N-아세틸글루코사미니다아제

Country Status (10)

Country Link
US (1) US11208442B2 (ko)
EP (1) EP3550018B1 (ko)
JP (1) JP7068186B2 (ko)
KR (1) KR102399639B1 (ko)
CN (1) CN110036109A (ko)
AU (1) AU2017368597C1 (ko)
CA (1) CA3045596C (ko)
ES (1) ES2911522T3 (ko)
TW (1) TWI777992B (ko)
WO (1) WO2018101454A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021015601A1 (ko) 2019-07-22 2021-01-28 주식회사 엘지화학 이차전지 분리막 접힘 방지를 위한 분리막 실링 장치 및 실링 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013051608A1 (ja) 2011-10-03 2013-04-11 独立行政法人産業技術総合研究所 複合型糖鎖加水分解酵素
JP2016504920A (ja) * 2013-02-05 2016-02-18 セーホーエル.ハンセン アクティーゼルスカブ 脱グリコシル化ステップを介したタンパク質の改善された精製
WO2016136984A1 (ja) * 2015-02-26 2016-09-01 東京化成工業株式会社 エンドm変異体、及びn結合型糖鎖含有化合物又はn結合型糖鎖含有蛋白質の製造方法

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996019582A1 (en) * 1994-12-21 1996-06-27 Chr. Hansen A/S Microbially derived rennin having enhanced milk clotting activity and method of producing same
JP4160652B2 (ja) 1998-05-22 2008-10-01 キリンファーマ株式会社 エンド−β−N−アセチルグルコサミニダーゼ遺伝子
US7122665B2 (en) 2002-10-15 2006-10-17 Synta Pharmaceuticals Corp. Heterocyclic compounds
US20080058297A1 (en) 2003-05-29 2008-03-06 Synta Pharmaceuticals Corp. Heterocyclic Compounds For Preventing And Treating Disorders Associated With Excessive Bone Loss
GB2431156A (en) 2005-10-11 2007-04-18 Piramed Ltd 1-cyclyl-3-substituted- -benzenes and -azines as inhibitors of phosphatidylinositol 3-kinase
US20080233127A1 (en) 2007-03-21 2008-09-25 Wyeth Imidazolopyrimidine analogs and their use as pi3 kinase and mtor inhibitors
WO2009034386A1 (en) 2007-09-13 2009-03-19 Astrazeneca Ab Derivatives of adenine and 8-aza-adenine and uses thereof-796
US20110009403A1 (en) 2007-10-05 2011-01-13 S*Bio Pte Ltd. 2-morpholinylpurines as inhibitors of pi3k
CN104119336B (zh) 2007-10-05 2016-08-24 维拉斯通股份有限公司 嘧啶取代的嘌呤衍生物
JP5638955B2 (ja) 2007-10-26 2014-12-10 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft Pi3キナーゼ阻害剤として有用なプリン誘導体
EP2244709A4 (en) 2008-02-07 2012-02-29 Synta Pharmaceuticals Corp TOPICAL FORMULATIONS FOR THE TREATMENT OF PSORIASIS
WO2009146406A1 (en) 2008-05-30 2009-12-03 Genentech, Inc. Purine pi3k inhibitor compounds and methods of use
WO2010005558A2 (en) 2008-07-07 2010-01-14 Xcovery, Inc. Pi3k isoform selective inhibitors
TWI378933B (en) 2008-10-14 2012-12-11 Daiichi Sankyo Co Ltd Morpholinopurine derivatives
WO2010114494A1 (en) 2009-04-03 2010-10-07 S*Bio Pte Ltd 8-substituted-2-morpholino purines for use as pi3k and/or mtor inhibitors in the treatment of proliferative disorders
EP2451811A1 (en) 2009-05-27 2012-05-16 F. Hoffmann-La Roche AG Bicyclic indole-pyrimidine pi3k inhibitor compounds selective for p110 delta, and methods of use
CN102459272B (zh) 2009-05-27 2014-08-06 健泰科生物技术公司 对P110δ具有选择性的为PI3K抑制剂的二环嘧啶化合物和使用方法
US8288381B2 (en) 2009-11-12 2012-10-16 Genentech, Inc. N-9 substituted purine compounds, compositions and methods of use
JP5619429B2 (ja) 2010-01-28 2014-11-05 株式会社ジャパンディスプレイ 画像表示装置の駆動方法及び画像表示装置組立体の駆動方法
CA2802808A1 (en) 2010-07-14 2012-01-19 F. Hoffmann-La Roche Ag Purine compounds selective for pi3k p110 delta, and methods of use
EP2616469B1 (en) 2010-09-14 2016-10-26 Exelixis, Inc. 9h-purine compounds as pi3k-delta inhibitors and methods for their manufacture
NZ609448A (en) 2010-12-16 2015-07-31 Hoffmann La Roche Tricyclic pi3k inhibitor compounds and methods of use
PE20140293A1 (es) 2011-01-31 2014-03-19 Novartis Ag Novedosos derivados heterociclicos
KR20130116358A (ko) 2011-02-09 2013-10-23 에프. 호프만-라 로슈 아게 Pi3 키나아제 억제제로서 헤테로사이클릭 화합물
JP6752203B2 (ja) 2015-07-16 2020-09-09 第一三共株式会社 新規EndoS変異酵素

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013051608A1 (ja) 2011-10-03 2013-04-11 独立行政法人産業技術総合研究所 複合型糖鎖加水分解酵素
JP2016504920A (ja) * 2013-02-05 2016-02-18 セーホーエル.ハンセン アクティーゼルスカブ 脱グリコシル化ステップを介したタンパク質の改善された精製
WO2016136984A1 (ja) * 2015-02-26 2016-09-01 東京化成工業株式会社 エンドm変異体、及びn結合型糖鎖含有化合物又はn結合型糖鎖含有蛋白質の製造方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Biotechnol. Prog.,2015, vol.31, no.5, pp.1323-1330 *
Fujita et al., (2004) Arch Biochem Biophy. 432 : p41 - 49
Goodfellow JJ et al., (2012) J Am Chem Sci. 134 : p8030 - 8033
Kato T et al., (2002) Glycobiology 12 : p581 - 587
Tarentino AL et al., (1993) J Biol Chem. 268 : p9702 - 9708
Y. Eshima et al., (2015) PLoS One.21 ; 10(7) : e0132859

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021015601A1 (ko) 2019-07-22 2021-01-28 주식회사 엘지화학 이차전지 분리막 접힘 방지를 위한 분리막 실링 장치 및 실링 방법

Also Published As

Publication number Publication date
TWI777992B (zh) 2022-09-21
EP3550018A1 (en) 2019-10-09
AU2017368597A1 (en) 2019-06-13
ES2911522T3 (es) 2022-05-19
KR102399639B1 (ko) 2022-05-18
WO2018101454A1 (ja) 2018-06-07
CA3045596C (en) 2022-08-23
US11208442B2 (en) 2021-12-28
JPWO2018101454A1 (ja) 2019-10-24
AU2017368597B2 (en) 2023-12-14
CN110036109A (zh) 2019-07-19
EP3550018B1 (en) 2022-03-09
JP7068186B2 (ja) 2022-05-16
AU2017368597C1 (en) 2024-03-28
CA3045596A1 (en) 2018-06-07
TW201827454A (zh) 2018-08-01
US20190309028A1 (en) 2019-10-10
EP3550018A4 (en) 2020-05-27
AU2017368597A2 (en) 2019-10-10

Similar Documents

Publication Publication Date Title
JP6076349B2 (ja) ストレプトコッカス・ピオゲネス由来のエンドグリコシダーゼ及びその使用方法
CN109750011B (zh) 一种甘露糖6-磷酸磷酸酶及甘露糖生物制备方法
EP2929025B1 (en) Method for recombinant production of horseshoe crab factor c protein in protozoa
CN108103039B (zh) 一组岩藻糖基转移酶突变体及其筛选方法和应用
Tzelepis et al. Endo-β-N-acetylglucosamidases (ENGases) in the fungus Trichoderma atroviride: possible involvement of the filamentous fungi-specific cytosolic ENGase in the ERAD process
US8034597B2 (en) Microorganism-derived psychrophilic endonuclease
KR102399639B1 (ko) 신규 엔도-β-N-아세틸글루코사미니다아제
JP2013526840A (ja) 組み換えブチリルコリンエステラーゼおよびその切断型
JP5967725B2 (ja) 複合型糖鎖加水分解酵素
KR20120028304A (ko) 신규 단백질 및 그것을 코드하는 유전자
US20110020896A1 (en) Mutant dna polymerases and their genes
KR101998477B1 (ko) 클로스트리디움 스터코라리움 유래 엘-람노스 이성화효소 변이체 및 이를 이용한 알룰로스로부터 알로스의 생산 방법
KR101150506B1 (ko) 스트렙토코커스 뉴모니애 유래의 재조합베타-갈락토시다아제
JP4631436B2 (ja) メタロエンドペプチダーゼ
JP2002525120A (ja) ペプチジルプロリルシス−トランスイソメラーゼ
Powles et al. Motif-based evidence that a plastid translocon component acts like a rhomboid protease substrate in yeast mitochondria
JP2011223885A (ja) 新規なシチジン5’−モノホスホシアル酸合成酵素、それをコードする遺伝子およびその製造方法
US11932860B2 (en) Method for producing alkaline phosphatase, alkaline phosphatase obtained using said method, and vector and transformant for production thereof
WO2012014980A1 (ja) 新規酵素タンパク質、当該酵素タンパク質の製造方法及び当該酵素タンパク質をコードする遺伝子
JP5787335B2 (ja) アセチルコリンエステラーゼ遺伝子
WO2008066350A1 (en) A novel ditpase and genes encoding it
JP2009235042A (ja) DNA結合能をもつ高等植物のSpo11類縁タンパク質の調製法
KR20060111012A (ko) 남세균 시네코시스티스 속의 이소코리스메이트 합성효소유전자 및 이를 이용하여 코리스메이트로부터이소코리스메이트를 생합성하는 방법

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant