KR20210091217A - 분비형의 β-갈락토시다아제의 제조 방법 - Google Patents
분비형의 β-갈락토시다아제의 제조 방법 Download PDFInfo
- Publication number
- KR20210091217A KR20210091217A KR1020217017331A KR20217017331A KR20210091217A KR 20210091217 A KR20210091217 A KR 20210091217A KR 1020217017331 A KR1020217017331 A KR 1020217017331A KR 20217017331 A KR20217017331 A KR 20217017331A KR 20210091217 A KR20210091217 A KR 20210091217A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- gly
- leu
- thr
- ser
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/04—Polysaccharides, i.e. compounds containing more than five saccharide radicals attached to each other by glycosidic bonds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2468—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1) acting on beta-galactose-glycoside bonds, e.g. carrageenases (3.2.1.83; 3.2.1.157); beta-agarase (3.2.1.81)
- C12N9/2471—Beta-galactosidase (3.2.1.23), i.e. exo-(1-->4)-beta-D-galactanase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/14—Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01023—Beta-galactosidase (3.2.1.23), i.e. exo-(1-->4)-beta-D-galactanase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/645—Fungi ; Processes using fungi
- C12R2001/66—Aspergillus
- C12R2001/69—Aspergillus oryzae
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Mycology (AREA)
- Medicinal Chemistry (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
담자균 효모 유래의 비분비형의 β-갈락토시다아제 유전자를, 아스퍼질러스 오리제에 조립하고, 분비형의 β-갈락토시다아제를 산생시키는 것을 특징으로 하는 분비형의 β-갈락토시다아제의 제조 방법 및 이에 따라 제조된 β-갈락토시다아제를 이용한 갈락토올리고당의 제조 방법에 의해 갈락토올리고당의 제조가 용이해진다.
Description
본 발명은 갈락토올리고당의 제조에의 이용이 용이한 분비형의 β-갈락토시다아제의 제조 방법에 관한 것이다.
β-갈락토시다아제는 유당 등의 β-D-갈락토시드 결합을 가수분해하는 반응과 아울러, 갈락토실기 전이 반응도 촉매하는 것이 알려져 있고, 장 내에서 선택적으로 비피더스균을 증식시키는 갈락토올리고당의 제조에 사용되고 있다.
지금까지 본 출원인은 담자균 효모인 스포로볼로미세스 싱귤러리스의 고역가 변이주 유래의 β-갈락토시다아제를 이용해서 갈락토올리고당을 제조하는 기술을 보고하고 있다(특허문헌 1).
그러나, 이 기술에서 사용되는 β-갈락토시다아제는 비분비형(세포벽 결합성)이기 때문에, 이것을 산생하는 스포로볼로미세스 싱귤러리스의 균체를 포함하는 균체 농축액으로 하여 반응에 사용할 필요가 있다.
이 균체 농축액은 생균이므로 변질되기 쉽고, 게다가 균체를 농축한 것만으므로 비활성이 낮고, 갈락토올리고당 반응액에 균체 내용물이 누출해서 정제 코스트가 높게 되는 등의 문제도 있다.
본 발명의 과제는 상기 문제점을 해결한 갈락토올리고당의 제조에의 이용이 용이한 β-갈락토시다아제를 제조하는 방법을 제공한다.
본 발명자들은 상기 과제를 해결하기 위해서 예의 연구한 결과, 담자균 효모 유래의 비분비형의 β-갈락토시다아제 유전자를, 아스퍼질러스 오리제에 조립함으로써 분비형의 β-갈락토시다아제가 산생되는 것 및 이것이 갈락토올리고당의 제조에의 이용이 용이한 것을 발견하고, 본 발명을 완성시켰다.
즉, 본 발명은 담자균 효모 유래의 비분비형의 β-갈락토시다아제 유전자를, 아스퍼질러스 오리제에 조립하고, 분비형의 β-갈락토시다아제를 산생시키는 것을 특징으로 하는 분비형의 β-갈락토시다아제의 제조 방법이다.
또한, 본 발명은 서열 번호 7, 13, 19에 기재된 서열인 담자균 효모 유래의 비분비형의 β-갈락토시다아제 유전자이다.
또한, 본 발명은 담자균 효모 유래의 비분비형의 β-갈락토시다아제 유전자가 아스퍼질러스 오리제에 조립되고, 분비형의 β-갈락토시다아제를 산생시키는 것을 특징으로 하는 아스퍼질러스 오리제의 형질 전환체이다.
또한, 본 발명은 적어도 유당을 함유하는 기질에, 상기의 β-갈락토시다아제의 제조 방법으로 제조된 β-갈락토시다아제를 작용시키는 것을 특징으로 하는 갈락토올리고당의 제조 방법이다.
또한, 본 발명은 담자균 효모 유래의 비분비형의 β-갈락토시다아제 유전자를, 아스퍼질러스 오리제에 조립하고, 이것을 배양함으로써 얻어지는 분비형의 β-갈락토시다아제이다.
본 발명의 분비형의 β-갈락토시다아제의 제조 방법은 담자균 효모 유래의 비분비형의 β-갈락토시다아제를, 분비형으로서 얻을 수 있다.
그 때문에 본 발명의 분비형의 β-갈락토시다아제의 제조 방법으로 얻어지는 β-갈락토시다아제는 β-갈락토시다아제 활성이 높고, 열안정성도 높고, 또한 분리·정제가 용이하고, 갈락토올리고당의 제조에의 이용이 용이하게 된다.
도 1은 SsGal주를 사용한 SDS-PAGE 및 활성 측정의 결과를 나타내는 도면이다.
도 2는 SmGal주를 사용한 SDS-PAGE 및 활성 측정의 결과를 나타내는 도면이다.
도 3은 RmGal주를 사용한 SDS-PAGE 및 활성 측정의 결과를 나타내는 도면이다.
도 4는 SeGal주를 사용한 SDS-PAGE 및 활성 측정의 결과를 나타내는 도면이다.
도 5는 SsGal주를 사용한 SDS-PAGE 및 활성 측정(열실활)의 결과를 나타내는 도면이다.
도 6은 SmGal주를 사용한 SDS-PAGE 및 활성 측정(열실활)의 결과를 나타내는 도면이다.
도 7은 RmGal주를 사용한 SDS-PAGE 및 활성 측정(열실활)의 결과를 나타내는 도면이다.
도 8은 SeGal주를 사용한 SDS-PAGE 및 활성 측정(열실활)의 결과를 나타내는 도면이다.
도 9는 SeGal주와 친주(parent strain)를 사용한 열처리 후의 활성 측정의 결과를 나타내는 도면이다.
도 10은 SsGal주를 사용한 갈락토올리고당 제조에 있어서의 반응 시간과 용액 중의 당 조성을 나타내는 도면이다.
도 11은 SmGal주를 사용한 갈락토올리고당 제조에 있어서의 반응 시간과 용액 중의 당 조성을 나타내는 도면이다.
도 12는 SeGal주를 사용한 갈락토올리고당 제조에 있어서의 반응 시간과 용액 중의 당 조성을 나타내는 도면이다.
도 13은 SeGal주를 사용한 갈락토올리고당 제조에 있어서의 반응 시간과 용액 중의 당 조성을 나타내는 도면이다((a):70℃, (b):80℃).
도 14는 SeGal주를 사용한 갈락토올리고당 제조에 있어서의 반응 시간과 용액 중의 당 조성을 나타내는 도면이다((c):90℃).
도 2는 SmGal주를 사용한 SDS-PAGE 및 활성 측정의 결과를 나타내는 도면이다.
도 3은 RmGal주를 사용한 SDS-PAGE 및 활성 측정의 결과를 나타내는 도면이다.
도 4는 SeGal주를 사용한 SDS-PAGE 및 활성 측정의 결과를 나타내는 도면이다.
도 5는 SsGal주를 사용한 SDS-PAGE 및 활성 측정(열실활)의 결과를 나타내는 도면이다.
도 6은 SmGal주를 사용한 SDS-PAGE 및 활성 측정(열실활)의 결과를 나타내는 도면이다.
도 7은 RmGal주를 사용한 SDS-PAGE 및 활성 측정(열실활)의 결과를 나타내는 도면이다.
도 8은 SeGal주를 사용한 SDS-PAGE 및 활성 측정(열실활)의 결과를 나타내는 도면이다.
도 9는 SeGal주와 친주(parent strain)를 사용한 열처리 후의 활성 측정의 결과를 나타내는 도면이다.
도 10은 SsGal주를 사용한 갈락토올리고당 제조에 있어서의 반응 시간과 용액 중의 당 조성을 나타내는 도면이다.
도 11은 SmGal주를 사용한 갈락토올리고당 제조에 있어서의 반응 시간과 용액 중의 당 조성을 나타내는 도면이다.
도 12는 SeGal주를 사용한 갈락토올리고당 제조에 있어서의 반응 시간과 용액 중의 당 조성을 나타내는 도면이다.
도 13은 SeGal주를 사용한 갈락토올리고당 제조에 있어서의 반응 시간과 용액 중의 당 조성을 나타내는 도면이다((a):70℃, (b):80℃).
도 14는 SeGal주를 사용한 갈락토올리고당 제조에 있어서의 반응 시간과 용액 중의 당 조성을 나타내는 도면이다((c):90℃).
본 발명의 분비형의 β-갈락토시다아제의 제조 방법(이하, 「본 발명 제법」이라고 한다)은 담자균 효모 유래의 비분비형의 β-갈락토시다아제 유전자를, 아스퍼질러스 오리제에 조립하고, 분비형의 β-갈락토시다아제를 산생시키는 것이다.
본 발명 제법에 사용되는 담자균 효모 유래의 비분비형의 β-갈락토시다아제 유전자는 담자균 효모가 산생하는 비분비형의 β-갈락토시다아제를 코드하는 것이다. 여기서 비분비형이란 세포벽 결합성을 갖는 것이고, 이것은 활성 염색 등으로 확인할 수 있다.
또한, 비분비형의 β-갈락토시다아제를 산생하는 담자균 효모는 특별하게 한정되지 않지만, 예를 들면, 스포로볼로미세스 싱귤러리스(Sporobolomyces singularis) 등의 스포로볼로미세스속, 시로바시디움 매그넘(Sirobasidium magnum) 등의 시로바시디움속, 로도토룰라 미뉴타(Rodotorula minuta) 등의 로도토룰라속, 스테리그마토미세스 엘비아에(Sterigmatomyces elviae) 등의 스테리그마토미세스속, 크립토코쿠스 로렌티(Cryptococcus laurentii) 등의 크립토코쿠스속 등에 속하는 담자균 효모가 열거된다. 이들의 담자균 효모 중에서도 스포로볼로미세스 또는 스테리그마토미세스속에 속하는 것이 바람직하고, 스포로볼로미세스 싱귤러리스 또는 스테리그마토미세스· 엘비아에가 보다 바람직하다.
또한, 담자균 효모가 산생하는 비분비형의 β-갈락토시다아제를 코드하는 유전자로서는 우선, 상기한 비분비형의 β-갈락토시다아제를 산생하는 담자균 효모로부터 PCR 등의 상법을 따라서 클로닝된 유전자가 열거된다. 또한, 이 유전자는 상기한 바와 같이 해서 얻어진 유전자의 정보로부터, 숙주에 따라서 전 합성한 것이 바람직하다.
구체적으로는 이하의 유전자가 열거된다. 또한, 이 유전자에는 시그널 서열도 포함된다.
·서열 번호 1에 기재된 염기 서열로 이루어지는 스포로볼로미세스 싱귤러리스 유래의 β-갈락토시다아제 유전자(서열 중 1∼57번이 시그널 서열)
·서열 번호 7에 기재된 염기 서열로 이루어지는 시로바시디움 매그넘 유래의 β-갈락토시다아제 유전자(서열 중 1∼48번이 시그널 서열)
·서열 번호 13에 기재된 염기 서열로 이루어지는 로도토룰라 미뉴타 유래의 β-갈락토시다아제 유전자(서열 중 1∼57번이 시그널 서열)
·서열 번호 19에 기재된 염기 서열로 이루어지는 스테리그마토미세스 엘비아에 유래의 β-갈락토시다아제 유전자(서열 중 1∼57번이 시그널 서열)
또한, 상기 유전자의 바람직한 것으로서는 상기 각 담자균 효모의 시그널 서열을, 아스퍼질러스 오리제의 시그널 서열로 치환한 것이다. 아스퍼질러스 오리제의 시그널 서열로서는, 예를 들면, 아스퍼질러스 오리제의 α-아밀라아제(Taka-amylase:TAA)의 분비 시그널(TAA signal) 서열(Okazaki, F., Aoki, J., Tabuchi, S., Tanaka, T., Ogino, C., and Kondo, A., Efficient heterologous expression and secretion in Aspergillus oryzae of a llama variable heavy-chain antibody fragment V(HH) against EGFR. Appl Microbiol Biotechnol 96, 81-88(2012).), 리조퍼스 오리제의 리파아제의 분비 시그널(Hama, S., Tamalampudi, S., Shindo, N., Numata, T., Yamaji, H., Fukuda, H., and Kondo, A., Role of N-terminal 28-amino-acid region of Rhizopus oryzae lipase in directing proteins to secretory pathway of Aspergillus oryzae. Appl Microbiol Biotechnol 79, 1009-1018(2008)) 등이 열거된다. 이와 같은 시그널 서열의 치환은 상법을 따라서 행할 수 있다.
이와 같은 상기 각 담자균 효모의 시그널 서열을, 아스퍼질러스 오리제의 시그널 서열로 치환한 β-갈락토시다아제 유전자 중, 바람직한 것으로서는 이하의 유전자가 열거된다. 이들의 서열은 아스퍼질러스 오리제의 분비 시그널(TAA signal) 서열과 네이티브의 β-갈락토시다아제를 코드하는 서열로 이루어진다.
·서열 번호 3에 기재된 염기 서열로 이루어지는 β-갈락토시다아제 유전자(서열 중 1∼63번이 분비 시그널 서열)
·서열 번호 9에 기재된 염기 서열로 이루어지는 β-갈락토시다아제 유전자(서열 중 1∼63번이 분비 시그널 서열)
·서열 번호 15에 기재된 염기 서열로 이루어지는 β-갈락토시다아제 유전자(서열 중 1∼63번이 분비 시그널 서열)
·서열 번호 21에 기재된 염기 서열로 이루어지는 β-갈락토시다아제 유전자(서열 중 1∼63번이 분비 시그널 서열)
상기 유전자 중에서도, β-갈락토시다아제의 아미노산 서열을 변경하지 않는 범위 내에서 네이티브의 β-갈락토시다아제를 코드하는 서열의 코돈을 변경한 것이 바람직하다. 이러한 β-갈락토시다아제 유전자로서는 이하의 유전자가 열거된다. 이들의 서열은 아스퍼질러스 오리제의 분비 시그널(TAA signal) 서열과 β-갈락토시다아제의 아미노산 서열을 변경하지 않는 범위 내에서 네이티브의 β-갈락토시다아제를 코드하는 서열의 코돈을 변경한 서열로 이루어진다.
·서열 번호 5에 기재된 염기 서열로 이루어지는 β-갈락토시다아제 유전자(서열 중 1∼63번이 분비 시그널 서열)
·서열 번호 11에 기재된 염기 서열로 이루어지는 β-갈락토시다아제 유전자(서열 중 1∼63번이 분비 시그널 서열)
·서열 번호 17에 기재된 염기 서열로 이루어지는 β-갈락토시다아제 유전자(서열 중 1∼63번이 분비 시그널 서열)
·서열 번호 23에 기재된 염기 서열로 이루어지는 β-갈락토시다아제 유전자(서열 중 1∼63번이 분비 시그널 서열)
상기 유전자 중에서도 서열 번호 5, 11, 23에 기재된 염기 서열로 이루어지는 β-갈락토시다아제 유전자가 바람직하다.
본 발명 제법에 사용되는, 상기 β-갈락토시다아제 유전자를 조립하는 아스퍼질러스 오리제는 특별하게 한정되지 않지만, 예를 들면 ATP 설푸릴라아제 유전자(sC)- 및 질산 환원 효소 유전자(niaD)-의 아스퍼질러스 오리제 NS4주(National Research Institute of Brewing 우편번호 739-0046 히로시마켄 히가시히로시마시 카가미야마 3-7-1로부터 분양 가능), 아스퍼질러스 오리제 niaD300, 아스퍼질러스 오리제 RIB40, 아스퍼질러스 오리제 ATCC11488가 열거된다. 이들 중에서도 아스퍼질러스 오리제 NS4주가 바람직하다.
본 발명 제법에 있어서는, 상기 유전자를 아스퍼질러스 오리제에 조립하는 방법은 특별하게 한정되지 않지만, 예를 들면 상기 유전자를 상법으로 발현 벡터에 조립하면 된다. 발현 벡터의 종류는 특별하게 한정되지 않지만, 아스퍼질러스 오리제 유래의 발현 벡터가 바람직하고, 특히 아밀라아제계 유전자의 발현 제어에 관여하는 시스 엘리먼트(Region III)를 이용한 개량 프로모터(시스 엘리먼트 도입에 의한 Aspergillus oryzae 에노라제 프로모터의 개량, Tsuboi, H. et al., Biosci. Biotechnol. Biochem., 69, 206-208(2005))와, 번역 효율이 높은 5' UTR 서열을 포함하는 고발현 벡터(일본특허 제4413557호)가 바람직하다. 또한, 이들의 벡터에는 형질 전환체의 선택을 위해 암피실린 등의 항생 물질의 내성 유전자를 조립하거나, 마커로서 ATP설푸릴라아제 발현 카세트 등을 조립해도 된다.
상기 발현 벡터는 상기 문헌에 기재된 방법에 기초하여 조제해도 되고, 예를 들면, Ozeki Co., Ltd.(우편번호 663-8227 효고켄 니시노미야시 이마즈데자이케쵸 4-9)의 단백질 수탁 발현 서비스로 제작해도 상관없다.
상기 유전자를 발현 벡터에 조립한 후는 이것을 아스퍼질러스 오리제에 조립해서 형질 전환시킨다. 아스퍼질러스 오리제를 형질 전환시키는 방법은 특별하게 한정되지 않고, 예를 들면 프로토플라스트-PEG법, 일렉트로포레이션법 등의 상법으로 행하면 된다. 형질 전환을 행한 후는 상법에 따라서 적당하게, 세정, 선택, 집균 등을 행해도 된다.
이렇게 하여 담자균 효모 유래의 비분비형의 β-갈락토시다아제 유전자를, 아스퍼질러스 오리제에 조립하고, 분비형의 β-갈락토시다아제를 산생하는 아스퍼질러스 오리제의 형질 전환체를 얻을 수 있다. 이 형질 전환체에 대해서 적당하게, DPY 배지, CDD 배지 등에서 배양을 행함으로써 아스퍼질러스 오리제로부터 분비형의 β-갈락토시다아제가 산생된다.
상기에서 얻어지는 β-갈락토시다아제는 분비형이기 때문에, 정제는 예를 들면, 배양 후의 배양액을 여과, 원심분리 등해서 분리하고, 상청을 채취하는 것이어도 된다. 또한, 상청을 한외 여과막 등을 이용하여 농축하는 것도 가능하다. 이 β-갈락토시다아제는 β-갈락토시다아제의 활성이 높고, 열안정성도 높고, 불순물이 적다고 하는 특징이 있다.
이러한 분비형의 β-갈락토시다아제의 아미노산 서열의 바람직한 것으로서는 예를 들면, 이하와 같다.
·서열 번호 2에 기재된 아미노산 서열로 이루어지는 스포로볼로미세스 싱귤러리스 유래의 β-갈락토시다아제(서열 중 1∼575번)(서열 번호 4, 6에 기재된 아미노산 서열도 동일(서열 중 1∼575번))
·서열 번호 8에 기재된 아미노산 서열로 이루어지는 시로바시디움 매그넘 유래의 β-갈락토시다아제(서열 중 1∼685번)(서열 번호 10, 12에 기재된 아미노산서열도 동일(서열 중 1∼685번))
·서열 번호 14에 기재된 아미노산 서열로 이루어지는 로도토룰라 미뉴타 유래의 β-갈락토시다아제(서열 중 1∼581번)(서열 번호 16, 18에 기재된 아미노산 서열도 동일(서열 중 1∼581번))
·서열 번호 20에 기재된 아미노산 서열로 이루어지는 스테리그마토미세스 엘비아에 유래의 β-갈락토시다아제(서열 중 1∼581번)(서열 번호 22, 24에 기재된 아미노산 서열도 동일(서열 중 1∼581번))
상기 β-갈락토시다아제 중에서도, 서열 번호 2에 기재된 아미노산 서열로 이루어지는 스포로볼로미세스 싱귤러리스 유래의 β-갈락토시다아제, 서열 번호 8에 기재된 아미노산 서열로 이루어지는 시로바시디움 매그넘 유래의 β-갈락토시다아제, 서열 번호 20에 기재된 아미노산 서열로 이루어지는 스테리그마토미세스 엘비아에 유래의 β-갈락토시다아제가 바람직하다.
이 β-갈락토시다아제는 균체 외에 분비되어지는 것 외, β-갈락토시다아제의 활성이 장기 보존해도 저하하지 않고, 열안정성이나 보존성이 좋다고 하는 성질을 갖는다. 또한, β-갈락토시다아제의 활성은 후기하는 실시예에 기재된 방법에서 확인할 수 있다. 통상은 효율적으로 갈락토올리고당을 제조하기 위해서, 복수의 β-갈락토시다아제를 사용하는 경우가 있지만, 상기에서 얻어지는 β-갈락토시다아제는 단독으로도 효율적으로 갈락토올리고당을 제조할 수 있다.
상기에서 얻어진 β-갈락토시다아제는 종래 공지의 β-갈락토시다아제와 동일하게, 예를 들면 적어도 유당을 함유하는 기질에 β-갈락토시다아제를 작용시켜서 갈락토올리고당을 제조하는데 이용할 수 있다. 또한, 이 β-갈락토시다아제는 분비형이기 때문에, 갈락토올리고당의 제조 시에, 특히 균체의 제거 등을 행할 필요도 없다.
구체적으로, 적어도 유당을 함유하는 기질에, 상기에서 얻어진 β-갈락토시다아제를 작용시키기 위해서는, 적어도 유당을 함유하는 기질에 β-갈락토시다아제를 첨가하고, 소정의 온도를 유지하면 된다. β-갈락토시다아제의 첨가량은 특별하게 한정되지 않지만, 예를 들면 유당 100g에 대하여 1∼50U, 바람직하게는 5∼10U이다. 또한, 기질에 β-갈락토시다아제를 작용시키는 온도는 특별하게 한정되지 않지만, 30∼90℃, 바람직하게는 60∼90℃이고, 유지 시간은 적당하게 설정하면 된다. 적어도 유당을 함유하는 기질에는 갈락토실화되는 당류를 첨가해도 된다. 이러한 당류는 특별하게 한정되지 않고, 예를 들면 갈락토오스, 만노스, 리보오스, 크실로오스, 아라비노오스, 람노오스, N-아세틸글루코사민, α-메틸만노시드, α-메틸갈락토시드, α-메틸글루코시드, 2-데옥시글루코오스, 2-데옥시갈락토오스 등이 열거된다.
상기한 바와 같이 해서 제조되는 갈락토올리고당은 5당 이하의 갈락토올리고당, 특히 3당의 갈락토올리고당이 많이 포함된다.
또한, 상기한 바와 같이 해서 제조되는 갈락토올리고당은 그대로이어도 되지만, 일반적인 정제 방법을 이용하여 분리 정제해도 된다. 정제 방법에 특별히 제한은 없지만, 구체적으로는 이온 교환, 겔여과, 활성탄, 어피니티 크로마토그래피 등의 각종 크로마토그래피를 실시함으로써 정제할 수 있다.
이렇게 해서 얻어지는 갈락토올리고당은 유용한 식품 소재나 의약품 원료, 시약에 이용할 수 있다.
실시예
이하, 실시예를 들어서 본 발명을 상세하게 설명하지만, 본 발명은 이들 실시예에 전혀 한정되지 않는다.
이들 실시예에서 사용한 담자균 효모의 기탁 번호는 이하와 같다.
·스포로볼로미세스 싱귤러리스 ATCC 24193
·로도토룰라 미뉴타 CBS 319
·스테리그마토미세스 엘비아에 IFO 1843
·시로바시디움 매그넘 CBS 6803
ATCC: 10801 University Boulevard Manassas, VA 20110 USA
CBS: Uppsalalaan 8, 3584 CT, Utrecht, The Netherlands
IFO: 우편번호 532-8686 오사카키 요도가와쿠 주소혼마치 2-17-85
실시예 1
스포로볼로미세스 싱귤러리스 유래의 β-갈락토시다아제 유전자의 취득:
스포로볼로미세스 싱귤러리스의 β-갈락토시다아제 유전자를 문헌(Ishikawa, E., Sakai, T., Ikemura, H., Matsumoto, K., and Abe, H., Identification, cloning, and characterization of a Sporobolomyces singularis beta-galactosidase-like enzyme involved in galacto-oligosaccharide production. J Biosci Bioeng 99, 331-339(2005).)에 기초하여 얻었다(서열 번호 1). 이 유전자는 시그널 서열과 β-갈락토시다아제를 코드하는 서열로 이루어진다. 이 유전자의 시그널 서열을, 아스퍼질러스 오리제의 TAA signal 서열로 치환한 서열(서열 번호 3)을 컴퓨터 상에서 얻고, 또한 β-갈락토시다아제 유전자를, β-갈락토시다아제의 아미노산 서열을 변경하지 않는 범위 내에서 네이티브의 β-갈락토시다아제를 코드하는 서열의 코돈을 변경한 서열(서열 번호 5)을 얻었다(SsGal). 이 SsGal을 GenScript사에 위탁해 전 합성했다.
실시예 2
시로바시디움 매그넘 유래의 β-갈락토시다아제 유전자의 취득:
보존 영역으로부터 축중 프라이머(표 1)(서열 번호 25∼29)를 설계하고, Forward 2종류×Reverse 3종류, 합계 6개의 조합으로 RT-PCR로 부분 서열을 클로닝했다. 상기 부분 서열로부터, 5'RACE 및 3'RACE를 행하고, 완전 길이 cDNA를 취득했다.
상기 완전 길이 cDNA에 기초하여, 상류역의 개시 코돈(ATG)으부터 유추해서 시로바시디움 매그넘 유래의 β-갈락토시다아제 유전자를 얻었다(서열 번호 7). 이 유전자는 시그널 서열과 β-갈락토시다아제를 코드하는 서열로 이루어진다. 이 유전자의 시그널 서열을, 아스퍼질러스 오리제의 TAA signal 서열로 치환한 서열(서열 번호 9)을 컴퓨터 상에서 얻고, 또한 β-갈락토시다아제 유전자를, β-갈락토시다아제의 아미노산 서열을 변경하지 않은 범위 내에서 네이티브의 β-갈락토시다아제를 코드하는 서열의 코돈을 변경한 서열(서열 번호 11)을 얻었다(SmGal). 이 SmGal을 GenScript사에 위탁해 전 합성했다.
실시예 3
로도토룰라 미뉴타 유래의 β-갈락토시다아제 유전자의 취득:
로도토룰라 미뉴타의 β-갈락토시다아제 유전자를 시로바시디움 매그넘 유래의 β-갈락토시다아제 유전자와 같은 방법으로 얻었다(서열 번호 13). 이 유전자는 시그널 서열과 β-갈락토시다아제를 코드하는 서열로 이루어진다. 이 유전자의 시그널 서열을, 아스퍼질러스 오리제의 TAA signal 서열로 치환한 서열(서열 번호 15)을 컴퓨터 상에서 얻고, 또한 β-갈락토시다아제 유전자를, β-갈락토시다아제의 아미노산 서열을 변경하지 않은 범위 내에서 네이티브의 β-갈락토시다아제를 코드하는 서열의 코돈을 변경한 서열(서열 번호 17)을 얻었다(RmGal). 이 RmGal을 GenScript사에 위탁해서 전 합성했다.
실시예 4
스테리그마토미세스 엘비아에 유래의 β-갈락토시다아제 유전자의 취득:
스테리그마토미세스 엘비아에의 β-갈락토시다아제 유전자를 시로바시디움 매그넘 유래의 β-갈락토시다아제 유전자와 같은 방법으로 얻었다(서열 번호 19). 이 유전자는 시그널 서열과 β-갈락토시다아제를 코드하는 서열로 이루어진다. 이 유전자의 시그널 서열을, 아스퍼질러스 오리제의 TAA signal 서열로 치환한 서열(서열 번호 21)을 컴퓨터 상에서 얻고, 또한 β-갈락토시다아제 유전자를, β-갈락토시다아제의 아미노산 서열을 변경하지 않은 범위 내에서 네이티브의 β-갈락토시다아제를 코드하는 서열의 코돈을 변경한 서열(서열 번호 23)을 얻었다(SeGal). 이 SeGal을 GenScript사에 위탁해서 전 합성했다.
실시예 5
SsGal 형질 전환체의 취득:
실시예 1에서 얻은 SsGal을, Ozeki Co., Ltd.(우편번호 663-8227 효고켄 니시노미야시 이마즈데자이케쵸 4-9)의 단백질 수탁 발현 서비스에 보내고, 발현 벡터에 조립했다.
형질 전환용 숙주에는 아스퍼질러스 오리제 유래의 질산 환원 효소 유전자(niaD)-, ATP설푸릴라아제 유전자(sC)-주인 NS4주(National Research Institute of Brewing 우편번호 739-0046 히로시마켄 히가시히로시마시 카가미야마 3-7-1로부터 분양)를 사용하고, 이것에 통상의 프로토플라스트-PEG법으로 발현 벡터를 조립하고, 형질 전환체를 얻었다(SsGal주). 또한, 형질 전환체의 선발은 sC-의 형질의 상보에 의해 행했다.
실시예 6
SmGal 형질 전환체의 취득:
실시예 2에서 얻은 SmGal을 사용하는 것 이외는, 실시예 5와 동일하게 조립한 발현 벡터 및 형질 전환체를 얻었다(SmGal주).
실시예 7
RmGal 형질 전환체의 취득:
실시예 3에서 얻은 RmGal을 사용하는 것 이외는, 실시예 5와 동일하게 조립한 발현 벡터 및 형질 전환체를 얻었다(RmGal주).
실시예 8
SeGal 형질 전환체의 취득:
실시예 4에서 얻은 SeGal을 사용하는 것 이외는, 실시예 5와 동일하게 조립한 발현 벡터 및 형질 전환체를 얻었다(SeGal주).
실시예 9
형질 전환체에 의한 β-갈락토시다아제 산생 평가:
(1) 활성 측정
실시예 5∼8에서 얻은 각 형질 전환체 중, SsGal주는 CDD 배지(2% dextrin, 0.2% glucose, 0.2% NH4Cl, 0.002% KCl, 0.001% K2HPO4, 0.0005% MgSO4·7H2O, 2×10-5% CuSO4·5H2O, 1×10-5% FeSO4·7H2O, 1×10-6% ZnSO4·7H2O, 1×10-6% MnSO4·5H2O, 1×10-6% AlCl3, 200 mM MOPS-NaOH buffer pH 7.0)에서 30℃에서 144시간 배양했다(15mL/100mL 부피 삼각 플라스크 스케일). RmGal주는 2×DPY 배지(4% dextrin, 2% hipolypepton, 2% yeast extract, 1% KH2PO4, 0.1% MgSO4·7H2O)에서 30℃에서 144시간 배양했다(150mL/500mL 부피 긴 목 플라스크 스케일). SmGal주는 2×DPY 배지에서 30℃에서 168시간 배양했다(150mL/500mL 부피 긴 목 플라스크 스케일). SeGal주는 DPY 배지(2% dextrin, 1% hipolypepton, 1% yeast extract, 0.5% KH2PO4, 0.05% MgSO4·7H2O)에서 30℃에서 168시간 배양했다. 배양 상청을 회수해서 2×샘플 버퍼(125mM Tris-HCl(pH 6.8), 20% 글리세롤, 0.01% 브로모페놀블루, 4% SDS, 200 mM DTT)과 등량 혼합하고, 100℃, 10분 처리 후, SDS-PAGE(CBB 염색)에 제공했다.
또한, ONPG를 기질로 한 활성 측정을 이하의 방법을 따라서 실시했다. 50mM의 시트르산 인산 완충액(pH4.0)에 12.5mM이 되도록 2-니트로페닐-β-갈락토시드(ONPG)를 가한 용액을 조제했다. 이 용액 0.8mL에, 50mM의 시트르산 인산 완충액(pH4.0)에 420nm의 흡광도가 0.2∼0.8이 되도록 희석한 상기 β-갈락토시다아제를 함유하는 배양 상청 0.2mL을 첨가하고, 30℃에서 10분간 반응시켰다(시험액). 0.25M 탄산나트륨 용액 4mL을 더해서 반응을 정지 후, 원심 분리(3,000g, 10분)하고, 상청 중에 포함되는 유리된 2-니트로페놀량을 분광 광도계로 420nm의 흡광도를 측정해서 정량했다. 한편, 2-니트로페닐-β-갈락토시드 용액에 50mM의 시트르산 인산 완충액(pH4.0)을 더한 것을 시약 블랭크로ㅛ 하고, 미리 탄산나트륨 용액을 첨가해 두고, 상기 β-갈락토시다아제를 함유하는 배양 상청을 첨가·혼합함과 동시에 반응 정지·발색을 행한 것을 반응 초기액(맹검)으로 했다. 효소 활성 1단위(U)는 이 조건에서 1분간에 1마이크로몰의 2-니트로페놀을 유리하는 효소량으로 하고, 이하의 식으로 산출했다.
SDS-PAGE 및 활성 측정의 결과를 도 1∼4에 나타냈다. CBB 염색에 의해, RmGal주, SmGal주, SeGal주에는 친주에 없는 특이적인 밴드가 검출되고, 이것을 각각의 β-갈락토시다아제라 추정했다. SsGal주는 DPY 배지에서는 특이적인 밴드는 보이지 않았지만, CDD(pH 7.0) 배지에서 배양했을 때, 친주에는 없는 특이적인 밴드가 검출되고, 이것을 β-갈락토시다아제라 추정했다. 각 β-갈락토시다아제의 분비 산생성이 높게 되는 배양 조건을 검토했다. 그 결과, SsGal주는 CDD(pH 7.0) 배지에서 30℃에서 144시간, RmGal주는 2×DPY 배지에서 30℃에서 144시간, SmGal주는 2×DPY 배지에서 30℃에서 168시간, SeGal주는 DPY 배지에서 30℃에서 168시간의 조건에서 활성이 최대가 되었다. 또한, SsGal주, RmGal주, SmGal주, SeGal주의 산생성은 각각 약 200mg/L, 약 200mg/L, 약 200mg/L, 약 1g/L인 것으로 SDS-PAGE의 밴드의 농도로부터 추정했다.
(2) 카피수 추정
또한, 형질 전환체에 조립된 발현 카세트수의 추정을 리얼타임 PCR법으로 행했다.
PCR의 결과로부터, SsGal주, RmGal주, SmGal주는 1카피, SeGal주는 2카피 발현 카세트가 삽입된 주로 추정되었다.
(3) 열실활 시험
(1)에 기재한 배양 조건에서 배양한 각 형질 전환체와 친주(NS4주)의 배양액 1mL를, 40℃, 50℃, 60℃, 70℃, 80℃에서 1시간씩 인큐베이트하고, 효소 활성 측정 및 SDS-PAGE를 실시했다.
SDS-PAGE 및 활성 측정의 결과를 도 5∼8에 나타냈다. SsGal주는 40℃까지 활성을 유지하고 있었지만, 50℃에서 1시간 인큐베이트하면 활성이 약 70% 감소하고, 70℃에서 활성은 소실했다. 동일한 조건에서 배양한 친주의 활성은 60℃까지 미량으로 검출되고, 70℃에서 소실했다. RmGal주는 50℃까지 활성을 유지하고 있었지만, 60℃에서 1시간 인큐베이트하면 활성은 소실했다. 동일한 조건에서 배양한 친주의 활성은 70℃까지 검출되고, 80℃에서 소실했다. SmGal주는 50℃까지 활성을 유지하고 있었지만, 60℃에서 1시간 인큐베이트하면 활성이 약 20% 감소하고, 80℃에서 활성은 소실했다. 동일한 조건에서 배양한 친주의 활성은 70℃까지 검출되고, 80℃에서 소실했다. SeGal주는 70℃까지 활성을 유지하고 있었다. 80℃에서 1시간 인큐베이트하면 활성은 약 97% 감소했다. 동일한 조건에서 배양한 친주의 활성은 40℃까지 검출되고, 50℃에서 소실했다. 또한, SeGal에 관해서는 1시간보다도 보다 짧은 시간(5분, 10분, 20분)에서 80℃ 처리를 행했다. 그 결과, 80℃에서 5분간 처리함으로써 활성은 약 37% 감소하고, 20분간 처리함으로써 약 98% 감소했다. 또한, 활성 측정의 결과, 모두 40℃ 처리 및 50℃ 처리에서는 친주보다도 높은 활성을 나타냈다.
이상의 것으로부터, SeGal주는 고온에서도 활성을 유지할 수 있는 것이 확인되었다.
실시예 10
협잡 효소의 제거:
실시예 9의 (3)에서 나타내진 바와 같이, SeGal주는 고온에서도 활성을 유지할 수 있는 것이 확인되었다. 한편, SeGal주의 친주인 아스퍼질러스 오리제 유래의 협잡 효소에 대해서 실시예 9의 (3)과 마찬가지로 열실활 시험을 행한 바, 70℃의 열처리에 의해 불활성화할 수 있었다. 그 때문에 SeGal주가 산생하는 β-갈락토시다아제는 열처리에 의해, 정제를 할 수 있는 것이 확인되었다(도 9).
실시예 11
갈락토올리고당의 제조(1):
유당을 66%(w/v) 함유하는 용액 150mL에, 실시예 9에서 얻은 SsGal주, SmGal주, SeGal주의 배양 상청을 각각 10U에 상당하는 양을 첨가하고, 소정의 온도 및 소정의 시간 반응시켜, 갈락토올리고당을 제조했다. 당 조성과 양은 고속 액체크로마토그래피로 측정했다. 반응 시간과 용액 중의 당 조성을 도 10∼12에 나타냈다(도 10: SsGal주, 도 11: SmGal주, 도 12: SeGal주).
도면으로부터, SsGal주, SmGal주, SeGal주가 산생하는 β-갈락토시다아제에 의해, 유당으로부터 주로 3당의 갈락토올리고당을 제조할 수 있는 것을 확인했다.
또한, SsGal주가 산생하는 β-갈락토시다아제를 이용하여 갈락토올리고당을 제조한 경우에는 갈락토올리고당 함량이 56.0%, SmGal주가 산생하는 β-갈락토시다아제를 이용하여 갈락토올리고당을 제조한 경우에는 갈락토올리고당 함량이 66.7%, SeGal주가 산생하는 β-갈락토시다아제를 이용하여 갈락토올리고당을 제조한 경우에는 갈락토올리고당 함량이 68.5%이었다.
또한, 상기 β-갈락토시다아제는 분비형이므로, 갈락토올리고당을 제조 후, 균체의 처리를 행할 필요가 없고, 효율적으로 갈락토올리고당을 제조할 수 있었다.
실시예 12
갈락토올리고당의 제조(2):
유당을 66%(w/v) 함유하는 용액 150mL에, 실시예 9에서 얻은 SeGal주의 배양 상청을 1.0U에 해당하는 양을 첨가하고, 70℃, 80℃, 90℃ 및 소정의 시간 반응시켜, 갈락토올리고당을 제조했다. 당 조성과 양은 고속 액체크로마토그래피로 측정했다. 반응 시간과 용액 중의 당 조성을 도 13((a):70℃, (b):80℃), 도 14 ((c):90℃)에 나타냈다.
SeGal주 유래의 β-갈락토시다아제는 내열성이 높고, 70℃∼90℃에서 GOS 제조가 가능했다.
산업상의 이용 가능성
분비형의 β-갈락토시다아제의 제조 방법으로 얻어지는 β-갈락토시다아제는 분리·정제가 용이하고, 갈락토올리고당의 제조에 이용할 수 있다.
SEQUENCE LISTING
<110> Kabushiki Kaisha Yakult Honsha
<120> Method for producing secretory beta-galactosidase
<130> PF-190014-WO
<150> JP2018-212757
<151> 2018-11-13
<160> 29
<170> PatentIn version 3.5
<210> 1
<211> 1785
<212> DNA
<213> Sporobolomyces singularis
<220>
<221> CDS
<222> (1)..(1785)
<223> Inventor: Ishikawa, Eiji; Ikeda, Masakazu; Anbe, Minako; Hatano, Hiroshi
<220>
<221> sig_peptide
<222> (1)..(57)
<220>
<221> mat_peptide
<222> (58)..(1782)
<400> 1
atg atg ctg cat gcg gca ctg ctc gtt gcg ctc ccc tgc gtg gtt ctt 48
Met Met Leu His Ala Ala Leu Leu Val Ala Leu Pro Cys Val Val Leu
-15 -10 -5
gct cgt ccc gcc ggt gca gtt acc tac ccc ggt gcg att cca ctt agc 96
Ala Arg Pro Ala Gly Ala Val Thr Tyr Pro Gly Ala Ile Pro Leu Ser
-1 1 5 10
ttg acc agc aat tac gag acg ccg agt ccg acc gcc atc ccc ctg gag 144
Leu Thr Ser Asn Tyr Glu Thr Pro Ser Pro Thr Ala Ile Pro Leu Glu
15 20 25
ccg acc cca acg gcg acc gga acc gcc gaa ctt gat gcg ctc tgg aat 192
Pro Thr Pro Thr Ala Thr Gly Thr Ala Glu Leu Asp Ala Leu Trp Asn
30 35 40 45
ttg gtg gaa gca cag tac cct gtt cag acg gcg gct gtc acc acc ctg 240
Leu Val Glu Ala Gln Tyr Pro Val Gln Thr Ala Ala Val Thr Thr Leu
50 55 60
gtg acg gtg ccc gac gac tac aag ttt gaa gca gac cct cct tcc tat 288
Val Thr Val Pro Asp Asp Tyr Lys Phe Glu Ala Asp Pro Pro Ser Tyr
65 70 75
gct ctt gct ggc tac gag aca tca gaa att gcc ggc ttg aag ttc ccg 336
Ala Leu Ala Gly Tyr Glu Thr Ser Glu Ile Ala Gly Leu Lys Phe Pro
80 85 90
aag ggg ttc aag ttt ggc gtg gcc ggc gcg gct att caa gtg gaa ggc 384
Lys Gly Phe Lys Phe Gly Val Ala Gly Ala Ala Ile Gln Val Glu Gly
95 100 105
gca gcg aaa gca gag gga cga ggc cca tcc act tgg gat tac ttg tgc 432
Ala Ala Lys Ala Glu Gly Arg Gly Pro Ser Thr Trp Asp Tyr Leu Cys
110 115 120 125
cac cat tac gcg tcc aca cag tgc aac aac tat gat cct gac att acg 480
His His Tyr Ala Ser Thr Gln Cys Asn Asn Tyr Asp Pro Asp Ile Thr
130 135 140
acg aac cat tac tac ctt tac cct ctt gat ttc gcc cgg ctc cag cat 528
Thr Asn His Tyr Tyr Leu Tyr Pro Leu Asp Phe Ala Arg Leu Gln His
145 150 155
cta ggc atc aac acg tat tcg ttt tca atc tcc tgg act cgt ata tac 576
Leu Gly Ile Asn Thr Tyr Ser Phe Ser Ile Ser Trp Thr Arg Ile Tyr
160 165 170
cct ctg ggt gct ggc tac gtt aac gaa gcc ggt ttg gcg cat tac gac 624
Pro Leu Gly Ala Gly Tyr Val Asn Glu Ala Gly Leu Ala His Tyr Asp
175 180 185
gcg gta atc cac tcg gcc aag aag tac ggg ctg gag cct gtc gga aca 672
Ala Val Ile His Ser Ala Lys Lys Tyr Gly Leu Glu Pro Val Gly Thr
190 195 200 205
gta ttt cac tgg gac acc cct ctc agc ctc atg ctc aaa tat ggc gcg 720
Val Phe His Trp Asp Thr Pro Leu Ser Leu Met Leu Lys Tyr Gly Ala
210 215 220
tgg caa gat acc ggc gac cag atc gtt aaa gat ttc gtc aca tac gcc 768
Trp Gln Asp Thr Gly Asp Gln Ile Val Lys Asp Phe Val Thr Tyr Ala
225 230 235
acc acc gtc ttc aaa cga tac ggt aat gaa gtc aag acc tgg ttc acg 816
Thr Thr Val Phe Lys Arg Tyr Gly Asn Glu Val Lys Thr Trp Phe Thr
240 245 250
ttc aat gag cct cgc gtg ttc tgt tct caa aac agt ggc ctt ccc tat 864
Phe Asn Glu Pro Arg Val Phe Cys Ser Gln Asn Ser Gly Leu Pro Tyr
255 260 265
aac ctc acg tat cct gag gga atc aac tca act tca gcc gtc ttc cgg 912
Asn Leu Thr Tyr Pro Glu Gly Ile Asn Ser Thr Ser Ala Val Phe Arg
270 275 280 285
tgt act tat aac gtc ctg aaa gcc cat ggc cac gcg gtt aag gtt tac 960
Cys Thr Tyr Asn Val Leu Lys Ala His Gly His Ala Val Lys Val Tyr
290 295 300
cgg gat ctc gtt gcc agc gga acc att gct gct gga gag atc ggc ttc 1008
Arg Asp Leu Val Ala Ser Gly Thr Ile Ala Ala Gly Glu Ile Gly Phe
305 310 315
aag tcg gac gac aac tac cca atc cca gcg cgg ccc gga aac gcg gac 1056
Lys Ser Asp Asp Asn Tyr Pro Ile Pro Ala Arg Pro Gly Asn Ala Asp
320 325 330
gac gag gaa tcc gcc aaa cgt cac gaa gcg ttc cga atc gga atc ttt 1104
Asp Glu Glu Ser Ala Lys Arg His Glu Ala Phe Arg Ile Gly Ile Phe
335 340 345
gcc cag cca gtt tac gga aac ggc gac tat cct gat gta gta aaa gag 1152
Ala Gln Pro Val Tyr Gly Asn Gly Asp Tyr Pro Asp Val Val Lys Glu
350 355 360 365
acc gtt ggc gac atg ctg ccc gcc ctg acg gat gag gac aag ggc tac 1200
Thr Val Gly Asp Met Leu Pro Ala Leu Thr Asp Glu Asp Lys Gly Tyr
370 375 380
atc aag ggc agc ggc gac atc ttc gcc att gac ggt tac cgg acc gat 1248
Ile Lys Gly Ser Gly Asp Ile Phe Ala Ile Asp Gly Tyr Arg Thr Asp
385 390 395
atc tcg cat gcc gca ctg aat gga atc gcg aat tgc atc aga aac cag 1296
Ile Ser His Ala Ala Leu Asn Gly Ile Ala Asn Cys Ile Arg Asn Gln
400 405 410
tcg gac cct aac tgg cct gtt tgc gag gaa ggg tct gac ccg ttc gcc 1344
Ser Asp Pro Asn Trp Pro Val Cys Glu Glu Gly Ser Asp Pro Phe Ala
415 420 425
cac gta tac ccg tct ggt ttc gcc atc ggc cag tcc gcc gat ccg ctg 1392
His Val Tyr Pro Ser Gly Phe Ala Ile Gly Gln Ser Ala Asp Pro Leu
430 435 440 445
tcg tca tgg ctc gtc aac tcc gcc cca ttt att cgc gac cag ctg aag 1440
Ser Ser Trp Leu Val Asn Ser Ala Pro Phe Ile Arg Asp Gln Leu Lys
450 455 460
ttc ctc act caa acg tac ccg gca aag gga ggt att tac ttc agc gag 1488
Phe Leu Thr Gln Thr Tyr Pro Ala Lys Gly Gly Ile Tyr Phe Ser Glu
465 470 475
ttt ggg tgg gcc gag gat gcg gag tac gac cgc cag ctg ttg tac caa 1536
Phe Gly Trp Ala Glu Asp Ala Glu Tyr Asp Arg Gln Leu Leu Tyr Gln
480 485 490
atc acc tgg gac ggt ctt agg acc cag tat ctc act gac tac ctg tcc 1584
Ile Thr Trp Asp Gly Leu Arg Thr Gln Tyr Leu Thr Asp Tyr Leu Ser
495 500 505
caa ctc ctg ctc gcc gtc cat aag gat ggg att aat ctt cgc ggc gcg 1632
Gln Leu Leu Leu Ala Val His Lys Asp Gly Ile Asn Leu Arg Gly Ala
510 515 520 525
tta acc tgg agt ttc gtc gac aac tgg gaa tgg gga ctg ggg atg caa 1680
Leu Thr Trp Ser Phe Val Asp Asn Trp Glu Trp Gly Leu Gly Met Gln
530 535 540
cag aaa ttc gga ttc cag ttt gtc aat cag tcg gac cca gat ctc acc 1728
Gln Lys Phe Gly Phe Gln Phe Val Asn Gln Ser Asp Pro Asp Leu Thr
545 550 555
agg acc ttc aaa ctc tct gcg cac gct tac gct caa ttt ggt cgc aac 1776
Arg Thr Phe Lys Leu Ser Ala His Ala Tyr Ala Gln Phe Gly Arg Asn
560 565 570
cac ctc tga 1785
His Leu
575
<210> 2
<211> 594
<212> PRT
<213> Sporobolomyces singularis
<400> 2
Met Met Leu His Ala Ala Leu Leu Val Ala Leu Pro Cys Val Val Leu
-15 -10 -5
Ala Arg Pro Ala Gly Ala Val Thr Tyr Pro Gly Ala Ile Pro Leu Ser
-1 1 5 10
Leu Thr Ser Asn Tyr Glu Thr Pro Ser Pro Thr Ala Ile Pro Leu Glu
15 20 25
Pro Thr Pro Thr Ala Thr Gly Thr Ala Glu Leu Asp Ala Leu Trp Asn
30 35 40 45
Leu Val Glu Ala Gln Tyr Pro Val Gln Thr Ala Ala Val Thr Thr Leu
50 55 60
Val Thr Val Pro Asp Asp Tyr Lys Phe Glu Ala Asp Pro Pro Ser Tyr
65 70 75
Ala Leu Ala Gly Tyr Glu Thr Ser Glu Ile Ala Gly Leu Lys Phe Pro
80 85 90
Lys Gly Phe Lys Phe Gly Val Ala Gly Ala Ala Ile Gln Val Glu Gly
95 100 105
Ala Ala Lys Ala Glu Gly Arg Gly Pro Ser Thr Trp Asp Tyr Leu Cys
110 115 120 125
His His Tyr Ala Ser Thr Gln Cys Asn Asn Tyr Asp Pro Asp Ile Thr
130 135 140
Thr Asn His Tyr Tyr Leu Tyr Pro Leu Asp Phe Ala Arg Leu Gln His
145 150 155
Leu Gly Ile Asn Thr Tyr Ser Phe Ser Ile Ser Trp Thr Arg Ile Tyr
160 165 170
Pro Leu Gly Ala Gly Tyr Val Asn Glu Ala Gly Leu Ala His Tyr Asp
175 180 185
Ala Val Ile His Ser Ala Lys Lys Tyr Gly Leu Glu Pro Val Gly Thr
190 195 200 205
Val Phe His Trp Asp Thr Pro Leu Ser Leu Met Leu Lys Tyr Gly Ala
210 215 220
Trp Gln Asp Thr Gly Asp Gln Ile Val Lys Asp Phe Val Thr Tyr Ala
225 230 235
Thr Thr Val Phe Lys Arg Tyr Gly Asn Glu Val Lys Thr Trp Phe Thr
240 245 250
Phe Asn Glu Pro Arg Val Phe Cys Ser Gln Asn Ser Gly Leu Pro Tyr
255 260 265
Asn Leu Thr Tyr Pro Glu Gly Ile Asn Ser Thr Ser Ala Val Phe Arg
270 275 280 285
Cys Thr Tyr Asn Val Leu Lys Ala His Gly His Ala Val Lys Val Tyr
290 295 300
Arg Asp Leu Val Ala Ser Gly Thr Ile Ala Ala Gly Glu Ile Gly Phe
305 310 315
Lys Ser Asp Asp Asn Tyr Pro Ile Pro Ala Arg Pro Gly Asn Ala Asp
320 325 330
Asp Glu Glu Ser Ala Lys Arg His Glu Ala Phe Arg Ile Gly Ile Phe
335 340 345
Ala Gln Pro Val Tyr Gly Asn Gly Asp Tyr Pro Asp Val Val Lys Glu
350 355 360 365
Thr Val Gly Asp Met Leu Pro Ala Leu Thr Asp Glu Asp Lys Gly Tyr
370 375 380
Ile Lys Gly Ser Gly Asp Ile Phe Ala Ile Asp Gly Tyr Arg Thr Asp
385 390 395
Ile Ser His Ala Ala Leu Asn Gly Ile Ala Asn Cys Ile Arg Asn Gln
400 405 410
Ser Asp Pro Asn Trp Pro Val Cys Glu Glu Gly Ser Asp Pro Phe Ala
415 420 425
His Val Tyr Pro Ser Gly Phe Ala Ile Gly Gln Ser Ala Asp Pro Leu
430 435 440 445
Ser Ser Trp Leu Val Asn Ser Ala Pro Phe Ile Arg Asp Gln Leu Lys
450 455 460
Phe Leu Thr Gln Thr Tyr Pro Ala Lys Gly Gly Ile Tyr Phe Ser Glu
465 470 475
Phe Gly Trp Ala Glu Asp Ala Glu Tyr Asp Arg Gln Leu Leu Tyr Gln
480 485 490
Ile Thr Trp Asp Gly Leu Arg Thr Gln Tyr Leu Thr Asp Tyr Leu Ser
495 500 505
Gln Leu Leu Leu Ala Val His Lys Asp Gly Ile Asn Leu Arg Gly Ala
510 515 520 525
Leu Thr Trp Ser Phe Val Asp Asn Trp Glu Trp Gly Leu Gly Met Gln
530 535 540
Gln Lys Phe Gly Phe Gln Phe Val Asn Gln Ser Asp Pro Asp Leu Thr
545 550 555
Arg Thr Phe Lys Leu Ser Ala His Ala Tyr Ala Gln Phe Gly Arg Asn
560 565 570
His Leu
575
<210> 3
<211> 1791
<212> DNA
<213> Artificial Sequence
<220>
<223> Beta-galactosidase
<220>
<221> CDS
<222> (1)..(1791)
<220>
<221> sig_peptide
<222> (1)..(63)
<220>
<221> mat_peptide
<222> (64)..(1788)
<400> 3
atg atg gtc gcg tgg tgg tct cta ttt ctg tac ggc ctt cag gtc gcg 48
Met Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala
-20 -15 -10
gca cct gct ttg gct gcc ggt gca gtt acc tac ccc ggt gcg att cca 96
Ala Pro Ala Leu Ala Ala Gly Ala Val Thr Tyr Pro Gly Ala Ile Pro
-5 -1 1 5 10
ctt agc ttg acc agc aat tac gag acg ccg agt ccg acc gcc atc ccc 144
Leu Ser Leu Thr Ser Asn Tyr Glu Thr Pro Ser Pro Thr Ala Ile Pro
15 20 25
ctg gag ccg acc cca acg gcg acc gga acc gcc gaa ctt gat gcg ctc 192
Leu Glu Pro Thr Pro Thr Ala Thr Gly Thr Ala Glu Leu Asp Ala Leu
30 35 40
tgg aat ttg gtg gaa gca cag tac cct gtt cag acg gcg gct gtc acc 240
Trp Asn Leu Val Glu Ala Gln Tyr Pro Val Gln Thr Ala Ala Val Thr
45 50 55
acc ctg gtg acg gtg ccc gac gac tac aag ttt gaa gca gac cct cct 288
Thr Leu Val Thr Val Pro Asp Asp Tyr Lys Phe Glu Ala Asp Pro Pro
60 65 70 75
tcc tat gct ctt gct ggc tac gag aca tca gaa att gcc ggc ttg aag 336
Ser Tyr Ala Leu Ala Gly Tyr Glu Thr Ser Glu Ile Ala Gly Leu Lys
80 85 90
ttc ccg aag ggg ttc aag ttt ggc gtg gcc ggc gcg gct att caa gtg 384
Phe Pro Lys Gly Phe Lys Phe Gly Val Ala Gly Ala Ala Ile Gln Val
95 100 105
gaa ggc gca gcg aaa gca gag gga cga ggc cca tcc act tgg gat tac 432
Glu Gly Ala Ala Lys Ala Glu Gly Arg Gly Pro Ser Thr Trp Asp Tyr
110 115 120
ttg tgc cac cat tac gcg tcc aca cag tgc aac aac tat gat cct gac 480
Leu Cys His His Tyr Ala Ser Thr Gln Cys Asn Asn Tyr Asp Pro Asp
125 130 135
att acg acg aac cat tac tac ctt tac cct ctt gat ttc gcc cgg ctc 528
Ile Thr Thr Asn His Tyr Tyr Leu Tyr Pro Leu Asp Phe Ala Arg Leu
140 145 150 155
cag cat cta ggc atc aac acg tat tcg ttt tca atc tcc tgg act cgt 576
Gln His Leu Gly Ile Asn Thr Tyr Ser Phe Ser Ile Ser Trp Thr Arg
160 165 170
ata tac cct ctg ggt gct ggc tac gtt aac gaa gcc ggt ttg gcg cat 624
Ile Tyr Pro Leu Gly Ala Gly Tyr Val Asn Glu Ala Gly Leu Ala His
175 180 185
tac gac gcg gta atc cac tcg gcc aag aag tac ggg ctg gag cct gtc 672
Tyr Asp Ala Val Ile His Ser Ala Lys Lys Tyr Gly Leu Glu Pro Val
190 195 200
gga aca gta ttt cac tgg gac acc cct ctc agc ctc atg ctc aaa tat 720
Gly Thr Val Phe His Trp Asp Thr Pro Leu Ser Leu Met Leu Lys Tyr
205 210 215
ggc gcg tgg caa gat acc ggc gac cag atc gtt aaa gat ttc gtc aca 768
Gly Ala Trp Gln Asp Thr Gly Asp Gln Ile Val Lys Asp Phe Val Thr
220 225 230 235
tac gcc acc acc gtc ttc aaa cga tac ggt aat gaa gtc aag acc tgg 816
Tyr Ala Thr Thr Val Phe Lys Arg Tyr Gly Asn Glu Val Lys Thr Trp
240 245 250
ttc acg ttc aat gag cct cgc gtg ttc tgt tct caa aac agt ggc ctt 864
Phe Thr Phe Asn Glu Pro Arg Val Phe Cys Ser Gln Asn Ser Gly Leu
255 260 265
ccc tat aac ctc acg tat cct gag gga atc aac tca act tca gcc gtc 912
Pro Tyr Asn Leu Thr Tyr Pro Glu Gly Ile Asn Ser Thr Ser Ala Val
270 275 280
ttc cgg tgt act tat aac gtc ctg aaa gcc cat ggc cac gcg gtt aag 960
Phe Arg Cys Thr Tyr Asn Val Leu Lys Ala His Gly His Ala Val Lys
285 290 295
gtt tac cgg gat ctc gtt gcc agc gga acc att gct gct gga gag atc 1008
Val Tyr Arg Asp Leu Val Ala Ser Gly Thr Ile Ala Ala Gly Glu Ile
300 305 310 315
ggc ttc aag tcg gac gac aac tac cca atc cca gcg cgg ccc gga aac 1056
Gly Phe Lys Ser Asp Asp Asn Tyr Pro Ile Pro Ala Arg Pro Gly Asn
320 325 330
gcg gac gac gag gaa tcc gcc aaa cgt cac gaa gcg ttc cga atc gga 1104
Ala Asp Asp Glu Glu Ser Ala Lys Arg His Glu Ala Phe Arg Ile Gly
335 340 345
atc ttt gcc cag cca gtt tac gga aac ggc gac tat cct gat gta gta 1152
Ile Phe Ala Gln Pro Val Tyr Gly Asn Gly Asp Tyr Pro Asp Val Val
350 355 360
aaa gag acc gtt ggc gac atg ctg ccc gcc ctg acg gat gag gac aag 1200
Lys Glu Thr Val Gly Asp Met Leu Pro Ala Leu Thr Asp Glu Asp Lys
365 370 375
ggc tac atc aag ggc agc ggc gac atc ttc gcc att gac ggt tac cgg 1248
Gly Tyr Ile Lys Gly Ser Gly Asp Ile Phe Ala Ile Asp Gly Tyr Arg
380 385 390 395
acc gat atc tcg cat gcc gca ctg aat gga atc gcg aat tgc atc aga 1296
Thr Asp Ile Ser His Ala Ala Leu Asn Gly Ile Ala Asn Cys Ile Arg
400 405 410
aac cag tcg gac cct aac tgg cct gtt tgc gag gaa ggg tct gac ccg 1344
Asn Gln Ser Asp Pro Asn Trp Pro Val Cys Glu Glu Gly Ser Asp Pro
415 420 425
ttc gcc cac gta tac ccg tct ggt ttc gcc atc ggc cag tcc gcc gat 1392
Phe Ala His Val Tyr Pro Ser Gly Phe Ala Ile Gly Gln Ser Ala Asp
430 435 440
ccg ctg tcg tca tgg ctc gtc aac tcc gcc cca ttt att cgc gac cag 1440
Pro Leu Ser Ser Trp Leu Val Asn Ser Ala Pro Phe Ile Arg Asp Gln
445 450 455
ctg aag ttc ctc act caa acg tac ccg gca aag gga ggt att tac ttc 1488
Leu Lys Phe Leu Thr Gln Thr Tyr Pro Ala Lys Gly Gly Ile Tyr Phe
460 465 470 475
agc gag ttt ggg tgg gcc gag gat gcg gag tac gac cgc cag ctg ttg 1536
Ser Glu Phe Gly Trp Ala Glu Asp Ala Glu Tyr Asp Arg Gln Leu Leu
480 485 490
tac caa atc acc tgg gac ggt ctt agg acc cag tat ctc act gac tac 1584
Tyr Gln Ile Thr Trp Asp Gly Leu Arg Thr Gln Tyr Leu Thr Asp Tyr
495 500 505
ctg tcc caa ctc ctg ctc gcc gtc cat aag gat ggg att aat ctt cgc 1632
Leu Ser Gln Leu Leu Leu Ala Val His Lys Asp Gly Ile Asn Leu Arg
510 515 520
ggc gcg tta acc tgg agt ttc gtc gac aac tgg gaa tgg gga ctg ggg 1680
Gly Ala Leu Thr Trp Ser Phe Val Asp Asn Trp Glu Trp Gly Leu Gly
525 530 535
atg caa cag aaa ttc gga ttc cag ttt gtc aat cag tcg gac cca gat 1728
Met Gln Gln Lys Phe Gly Phe Gln Phe Val Asn Gln Ser Asp Pro Asp
540 545 550 555
ctc acc agg acc ttc aaa ctc tct gcg cac gct tac gct caa ttt ggt 1776
Leu Thr Arg Thr Phe Lys Leu Ser Ala His Ala Tyr Ala Gln Phe Gly
560 565 570
cgc aac cac ctc tga 1791
Arg Asn His Leu
575
<210> 4
<211> 596
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 4
Met Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala
-20 -15 -10
Ala Pro Ala Leu Ala Ala Gly Ala Val Thr Tyr Pro Gly Ala Ile Pro
-5 -1 1 5 10
Leu Ser Leu Thr Ser Asn Tyr Glu Thr Pro Ser Pro Thr Ala Ile Pro
15 20 25
Leu Glu Pro Thr Pro Thr Ala Thr Gly Thr Ala Glu Leu Asp Ala Leu
30 35 40
Trp Asn Leu Val Glu Ala Gln Tyr Pro Val Gln Thr Ala Ala Val Thr
45 50 55
Thr Leu Val Thr Val Pro Asp Asp Tyr Lys Phe Glu Ala Asp Pro Pro
60 65 70 75
Ser Tyr Ala Leu Ala Gly Tyr Glu Thr Ser Glu Ile Ala Gly Leu Lys
80 85 90
Phe Pro Lys Gly Phe Lys Phe Gly Val Ala Gly Ala Ala Ile Gln Val
95 100 105
Glu Gly Ala Ala Lys Ala Glu Gly Arg Gly Pro Ser Thr Trp Asp Tyr
110 115 120
Leu Cys His His Tyr Ala Ser Thr Gln Cys Asn Asn Tyr Asp Pro Asp
125 130 135
Ile Thr Thr Asn His Tyr Tyr Leu Tyr Pro Leu Asp Phe Ala Arg Leu
140 145 150 155
Gln His Leu Gly Ile Asn Thr Tyr Ser Phe Ser Ile Ser Trp Thr Arg
160 165 170
Ile Tyr Pro Leu Gly Ala Gly Tyr Val Asn Glu Ala Gly Leu Ala His
175 180 185
Tyr Asp Ala Val Ile His Ser Ala Lys Lys Tyr Gly Leu Glu Pro Val
190 195 200
Gly Thr Val Phe His Trp Asp Thr Pro Leu Ser Leu Met Leu Lys Tyr
205 210 215
Gly Ala Trp Gln Asp Thr Gly Asp Gln Ile Val Lys Asp Phe Val Thr
220 225 230 235
Tyr Ala Thr Thr Val Phe Lys Arg Tyr Gly Asn Glu Val Lys Thr Trp
240 245 250
Phe Thr Phe Asn Glu Pro Arg Val Phe Cys Ser Gln Asn Ser Gly Leu
255 260 265
Pro Tyr Asn Leu Thr Tyr Pro Glu Gly Ile Asn Ser Thr Ser Ala Val
270 275 280
Phe Arg Cys Thr Tyr Asn Val Leu Lys Ala His Gly His Ala Val Lys
285 290 295
Val Tyr Arg Asp Leu Val Ala Ser Gly Thr Ile Ala Ala Gly Glu Ile
300 305 310 315
Gly Phe Lys Ser Asp Asp Asn Tyr Pro Ile Pro Ala Arg Pro Gly Asn
320 325 330
Ala Asp Asp Glu Glu Ser Ala Lys Arg His Glu Ala Phe Arg Ile Gly
335 340 345
Ile Phe Ala Gln Pro Val Tyr Gly Asn Gly Asp Tyr Pro Asp Val Val
350 355 360
Lys Glu Thr Val Gly Asp Met Leu Pro Ala Leu Thr Asp Glu Asp Lys
365 370 375
Gly Tyr Ile Lys Gly Ser Gly Asp Ile Phe Ala Ile Asp Gly Tyr Arg
380 385 390 395
Thr Asp Ile Ser His Ala Ala Leu Asn Gly Ile Ala Asn Cys Ile Arg
400 405 410
Asn Gln Ser Asp Pro Asn Trp Pro Val Cys Glu Glu Gly Ser Asp Pro
415 420 425
Phe Ala His Val Tyr Pro Ser Gly Phe Ala Ile Gly Gln Ser Ala Asp
430 435 440
Pro Leu Ser Ser Trp Leu Val Asn Ser Ala Pro Phe Ile Arg Asp Gln
445 450 455
Leu Lys Phe Leu Thr Gln Thr Tyr Pro Ala Lys Gly Gly Ile Tyr Phe
460 465 470 475
Ser Glu Phe Gly Trp Ala Glu Asp Ala Glu Tyr Asp Arg Gln Leu Leu
480 485 490
Tyr Gln Ile Thr Trp Asp Gly Leu Arg Thr Gln Tyr Leu Thr Asp Tyr
495 500 505
Leu Ser Gln Leu Leu Leu Ala Val His Lys Asp Gly Ile Asn Leu Arg
510 515 520
Gly Ala Leu Thr Trp Ser Phe Val Asp Asn Trp Glu Trp Gly Leu Gly
525 530 535
Met Gln Gln Lys Phe Gly Phe Gln Phe Val Asn Gln Ser Asp Pro Asp
540 545 550 555
Leu Thr Arg Thr Phe Lys Leu Ser Ala His Ala Tyr Ala Gln Phe Gly
560 565 570
Arg Asn His Leu
575
<210> 5
<211> 1791
<212> DNA
<213> Artificial Sequence
<220>
<223> Beta-galactosidase
<220>
<221> CDS
<222> (1)..(1791)
<220>
<221> sig_peptide
<222> (1)..(63)
<220>
<221> mat_peptide
<222> (64)..(1788)
<400> 5
atg atg gtc gcg tgg tgg tct cta ttt ctg tac ggc ctt cag gtc gcg 48
Met Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala
-20 -15 -10
gca cct gct ttg gct gct ggc gcc gtc aca tac ccc gga gct att cca 96
Ala Pro Ala Leu Ala Ala Gly Ala Val Thr Tyr Pro Gly Ala Ile Pro
-5 -1 1 5 10
ctg tcc ctc aca agc aac tac gag aca cct tct cct acc gcc att cct 144
Leu Ser Leu Thr Ser Asn Tyr Glu Thr Pro Ser Pro Thr Ala Ile Pro
15 20 25
ttg gag cca act ccg act gca act gga acc gca gaa ctg gat gcg ctc 192
Leu Glu Pro Thr Pro Thr Ala Thr Gly Thr Ala Glu Leu Asp Ala Leu
30 35 40
tgg aac ctt gtc gaa gct cag tat ccc gtc caa acg gcc gca gtc acc 240
Trp Asn Leu Val Glu Ala Gln Tyr Pro Val Gln Thr Ala Ala Val Thr
45 50 55
acc ctc gtc acc gtc cct gac gac tac aag ttc gag gcc gat cct cct 288
Thr Leu Val Thr Val Pro Asp Asp Tyr Lys Phe Glu Ala Asp Pro Pro
60 65 70 75
agc tat gca ctc gca ggt tac gag act tcc gag att gcg gga ctg aag 336
Ser Tyr Ala Leu Ala Gly Tyr Glu Thr Ser Glu Ile Ala Gly Leu Lys
80 85 90
ttc ccc aaa ggt ttc aag ttc ggc gtt gct ggg gcc gcg att cag gtc 384
Phe Pro Lys Gly Phe Lys Phe Gly Val Ala Gly Ala Ala Ile Gln Val
95 100 105
gaa ggc gct gct aaa gcg gaa gga cgt ggg ccc tct aca tgg gat tac 432
Glu Gly Ala Ala Lys Ala Glu Gly Arg Gly Pro Ser Thr Trp Asp Tyr
110 115 120
ctc tgt cat cac tat gcc agc act cag tgc aac aac tac gat ccc gat 480
Leu Cys His His Tyr Ala Ser Thr Gln Cys Asn Asn Tyr Asp Pro Asp
125 130 135
atc acc acc aac cat tac tac ctc tac ccc ctc gat ttc gcg cgt ctt 528
Ile Thr Thr Asn His Tyr Tyr Leu Tyr Pro Leu Asp Phe Ala Arg Leu
140 145 150 155
caa cat ctg ggc atc aac acc tac tcc ttt tcc att tcc tgg acc cga 576
Gln His Leu Gly Ile Asn Thr Tyr Ser Phe Ser Ile Ser Trp Thr Arg
160 165 170
atc tac cct ctc ggc gcc ggt tac gtc aac gag gcc ggc ttg gca cac 624
Ile Tyr Pro Leu Gly Ala Gly Tyr Val Asn Glu Ala Gly Leu Ala His
175 180 185
tac gat gct gtc att cac tcc gcc aag aag tac gga ttg gag cca gtt 672
Tyr Asp Ala Val Ile His Ser Ala Lys Lys Tyr Gly Leu Glu Pro Val
190 195 200
ggc acg gtc ttt cac tgg gac act cct ctg tcg ctc atg ctt aag tac 720
Gly Thr Val Phe His Trp Asp Thr Pro Leu Ser Leu Met Leu Lys Tyr
205 210 215
ggg gcg tgg cag gat act ggt gat cag atc gtc aag gac ttt gtg acg 768
Gly Ala Trp Gln Asp Thr Gly Asp Gln Ile Val Lys Asp Phe Val Thr
220 225 230 235
tat gcc acg acc gtt ttc aag cgc tat ggt aac gag gtc aag aca tgg 816
Tyr Ala Thr Thr Val Phe Lys Arg Tyr Gly Asn Glu Val Lys Thr Trp
240 245 250
ttc aca ttc aac gag cca cgt gtc ttc tgc tcc cag aat tcc ggg ctt 864
Phe Thr Phe Asn Glu Pro Arg Val Phe Cys Ser Gln Asn Ser Gly Leu
255 260 265
ccg tac aac ctg acc tat cct gaa ggc atc aac tct act tct gcg gtg 912
Pro Tyr Asn Leu Thr Tyr Pro Glu Gly Ile Asn Ser Thr Ser Ala Val
270 275 280
ttc cgt tgc acg tac aac gtg ctt aag gct cat ggt cat gct gtc aaa 960
Phe Arg Cys Thr Tyr Asn Val Leu Lys Ala His Gly His Ala Val Lys
285 290 295
gtg tat cga gat ctt gtg gca tcg ggt aca atc gct gcc ggc gag atc 1008
Val Tyr Arg Asp Leu Val Ala Ser Gly Thr Ile Ala Ala Gly Glu Ile
300 305 310 315
ggc ttc aag agc gac gac aac tac ccg atc ccg gct cgg cct ggt aat 1056
Gly Phe Lys Ser Asp Asp Asn Tyr Pro Ile Pro Ala Arg Pro Gly Asn
320 325 330
gcc gac gac gag gag tcg gcc aag cgc cac gaa gca ttt cga atc ggc 1104
Ala Asp Asp Glu Glu Ser Ala Lys Arg His Glu Ala Phe Arg Ile Gly
335 340 345
atc ttc gcc cag cct gtg tat ggg aat ggt gac tat ccc gat gtg gtg 1152
Ile Phe Ala Gln Pro Val Tyr Gly Asn Gly Asp Tyr Pro Asp Val Val
350 355 360
aag gag acc gtg ggc gac atg ctc ccc gcc ctt acc gat gag gac aaa 1200
Lys Glu Thr Val Gly Asp Met Leu Pro Ala Leu Thr Asp Glu Asp Lys
365 370 375
ggt tac atc aag ggc tcg ggc gac atc ttc gcg att gac ggc tat cgg 1248
Gly Tyr Ile Lys Gly Ser Gly Asp Ile Phe Ala Ile Asp Gly Tyr Arg
380 385 390 395
act gac atc tcg cac gcg gct ctg aat ggc atc gca aac tgc att cgc 1296
Thr Asp Ile Ser His Ala Ala Leu Asn Gly Ile Ala Asn Cys Ile Arg
400 405 410
aat cag agc gac cct aac tgg ccg gtg tgt gaa gaa gga agc gat ccg 1344
Asn Gln Ser Asp Pro Asn Trp Pro Val Cys Glu Glu Gly Ser Asp Pro
415 420 425
ttt gcc cat gtg tat ccc tct ggc ttt gca att gga caa agc gct gat 1392
Phe Ala His Val Tyr Pro Ser Gly Phe Ala Ile Gly Gln Ser Ala Asp
430 435 440
cct ctg tct tct tgg ctc gtt aac tcc gct ccc ttc atc cga gat caa 1440
Pro Leu Ser Ser Trp Leu Val Asn Ser Ala Pro Phe Ile Arg Asp Gln
445 450 455
ctg aag ttc ctg acg caa acc tat cct gca aaa ggc ggc atc tac ttc 1488
Leu Lys Phe Leu Thr Gln Thr Tyr Pro Ala Lys Gly Gly Ile Tyr Phe
460 465 470 475
tcc gag ttt gga tgg gca gag gat gcg gaa tac gat cgg caa ctc ctt 1536
Ser Glu Phe Gly Trp Ala Glu Asp Ala Glu Tyr Asp Arg Gln Leu Leu
480 485 490
tac cag atc acc tgg gac ggg ctt cgc act cag tat ctc acc gat tac 1584
Tyr Gln Ile Thr Trp Asp Gly Leu Arg Thr Gln Tyr Leu Thr Asp Tyr
495 500 505
ctc tcc cag ctg ctg ttg gct gtg cat aag gat ggg atc aac ctt cgg 1632
Leu Ser Gln Leu Leu Leu Ala Val His Lys Asp Gly Ile Asn Leu Arg
510 515 520
ggc gca ttg acc tgg tct ttc gtg gac aac tgg gaa tgg ggt ctg ggc 1680
Gly Ala Leu Thr Trp Ser Phe Val Asp Asn Trp Glu Trp Gly Leu Gly
525 530 535
atg cag cag aag ttc gga ttc caa ttc gtc aat cag agc gat cca gac 1728
Met Gln Gln Lys Phe Gly Phe Gln Phe Val Asn Gln Ser Asp Pro Asp
540 545 550 555
ttg acc cgc aca ttc aag ctc agc gct cat gcg tat gcc cag ttc ggg 1776
Leu Thr Arg Thr Phe Lys Leu Ser Ala His Ala Tyr Ala Gln Phe Gly
560 565 570
cgc aat cac ctg taa 1791
Arg Asn His Leu
575
<210> 6
<211> 596
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 6
Met Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala
-20 -15 -10
Ala Pro Ala Leu Ala Ala Gly Ala Val Thr Tyr Pro Gly Ala Ile Pro
-5 -1 1 5 10
Leu Ser Leu Thr Ser Asn Tyr Glu Thr Pro Ser Pro Thr Ala Ile Pro
15 20 25
Leu Glu Pro Thr Pro Thr Ala Thr Gly Thr Ala Glu Leu Asp Ala Leu
30 35 40
Trp Asn Leu Val Glu Ala Gln Tyr Pro Val Gln Thr Ala Ala Val Thr
45 50 55
Thr Leu Val Thr Val Pro Asp Asp Tyr Lys Phe Glu Ala Asp Pro Pro
60 65 70 75
Ser Tyr Ala Leu Ala Gly Tyr Glu Thr Ser Glu Ile Ala Gly Leu Lys
80 85 90
Phe Pro Lys Gly Phe Lys Phe Gly Val Ala Gly Ala Ala Ile Gln Val
95 100 105
Glu Gly Ala Ala Lys Ala Glu Gly Arg Gly Pro Ser Thr Trp Asp Tyr
110 115 120
Leu Cys His His Tyr Ala Ser Thr Gln Cys Asn Asn Tyr Asp Pro Asp
125 130 135
Ile Thr Thr Asn His Tyr Tyr Leu Tyr Pro Leu Asp Phe Ala Arg Leu
140 145 150 155
Gln His Leu Gly Ile Asn Thr Tyr Ser Phe Ser Ile Ser Trp Thr Arg
160 165 170
Ile Tyr Pro Leu Gly Ala Gly Tyr Val Asn Glu Ala Gly Leu Ala His
175 180 185
Tyr Asp Ala Val Ile His Ser Ala Lys Lys Tyr Gly Leu Glu Pro Val
190 195 200
Gly Thr Val Phe His Trp Asp Thr Pro Leu Ser Leu Met Leu Lys Tyr
205 210 215
Gly Ala Trp Gln Asp Thr Gly Asp Gln Ile Val Lys Asp Phe Val Thr
220 225 230 235
Tyr Ala Thr Thr Val Phe Lys Arg Tyr Gly Asn Glu Val Lys Thr Trp
240 245 250
Phe Thr Phe Asn Glu Pro Arg Val Phe Cys Ser Gln Asn Ser Gly Leu
255 260 265
Pro Tyr Asn Leu Thr Tyr Pro Glu Gly Ile Asn Ser Thr Ser Ala Val
270 275 280
Phe Arg Cys Thr Tyr Asn Val Leu Lys Ala His Gly His Ala Val Lys
285 290 295
Val Tyr Arg Asp Leu Val Ala Ser Gly Thr Ile Ala Ala Gly Glu Ile
300 305 310 315
Gly Phe Lys Ser Asp Asp Asn Tyr Pro Ile Pro Ala Arg Pro Gly Asn
320 325 330
Ala Asp Asp Glu Glu Ser Ala Lys Arg His Glu Ala Phe Arg Ile Gly
335 340 345
Ile Phe Ala Gln Pro Val Tyr Gly Asn Gly Asp Tyr Pro Asp Val Val
350 355 360
Lys Glu Thr Val Gly Asp Met Leu Pro Ala Leu Thr Asp Glu Asp Lys
365 370 375
Gly Tyr Ile Lys Gly Ser Gly Asp Ile Phe Ala Ile Asp Gly Tyr Arg
380 385 390 395
Thr Asp Ile Ser His Ala Ala Leu Asn Gly Ile Ala Asn Cys Ile Arg
400 405 410
Asn Gln Ser Asp Pro Asn Trp Pro Val Cys Glu Glu Gly Ser Asp Pro
415 420 425
Phe Ala His Val Tyr Pro Ser Gly Phe Ala Ile Gly Gln Ser Ala Asp
430 435 440
Pro Leu Ser Ser Trp Leu Val Asn Ser Ala Pro Phe Ile Arg Asp Gln
445 450 455
Leu Lys Phe Leu Thr Gln Thr Tyr Pro Ala Lys Gly Gly Ile Tyr Phe
460 465 470 475
Ser Glu Phe Gly Trp Ala Glu Asp Ala Glu Tyr Asp Arg Gln Leu Leu
480 485 490
Tyr Gln Ile Thr Trp Asp Gly Leu Arg Thr Gln Tyr Leu Thr Asp Tyr
495 500 505
Leu Ser Gln Leu Leu Leu Ala Val His Lys Asp Gly Ile Asn Leu Arg
510 515 520
Gly Ala Leu Thr Trp Ser Phe Val Asp Asn Trp Glu Trp Gly Leu Gly
525 530 535
Met Gln Gln Lys Phe Gly Phe Gln Phe Val Asn Gln Ser Asp Pro Asp
540 545 550 555
Leu Thr Arg Thr Phe Lys Leu Ser Ala His Ala Tyr Ala Gln Phe Gly
560 565 570
Arg Asn His Leu
575
<210> 7
<211> 2106
<212> DNA
<213> Sirobasidium magnum
<220>
<221> CDS
<222> (1)..(2106)
<220>
<221> sig_peptide
<222> (1)..(48)
<220>
<221> mat_peptide
<222> (49)..(2103)
<400> 7
atg ttc aag ctt acc tct gtg ctg ttg ctg ctc ggt gca gct caa gca 48
Met Phe Lys Leu Thr Ser Val Leu Leu Leu Leu Gly Ala Ala Gln Ala
-15 -10 -5 -1
gct gtt cta aac cct cgt caa gct ggc agc ggt aat tcc act gcc agc 96
Ala Val Leu Asn Pro Arg Gln Ala Gly Ser Gly Asn Ser Thr Ala Ser
1 5 10 15
ggc tcg ata gcc ggc gat tcc act aga cca gcc acg aca tcc tcg gtc 144
Gly Ser Ile Ala Gly Asp Ser Thr Arg Pro Ala Thr Thr Ser Ser Val
20 25 30
gtc tca ccc tct gca gcc aga aac tcc act gcc gca gct act ggt aat 192
Val Ser Pro Ser Ala Ala Arg Asn Ser Thr Ala Ala Ala Thr Gly Asn
35 40 45
gct tct cgc aat gct act gcg aca ggt act gcc gtc gct aca gcc act 240
Ala Ser Arg Asn Ala Thr Ala Thr Gly Thr Ala Val Ala Thr Ala Thr
50 55 60
ggc ggg gtt aca gca gcc acg tcc act gga atg gcg gtg act tcc cct 288
Gly Gly Val Thr Ala Ala Thr Ser Thr Gly Met Ala Val Thr Ser Pro
65 70 75 80
gcc cag gga gcc ggt acc gga gtc ggt acc gca gcc gct gct acg acg 336
Ala Gln Gly Ala Gly Thr Gly Val Gly Thr Ala Ala Ala Ala Thr Thr
85 90 95
act acc gcc acg cct agc caa tcc gac ttt gat aat tgg gtc ctc acc 384
Thr Thr Ala Thr Pro Ser Gln Ser Asp Phe Asp Asn Trp Val Leu Thr
100 105 110
agt gga ttg cct acc atc acc act tca ttg atc agt acc aat ccc gat 432
Ser Gly Leu Pro Thr Ile Thr Thr Ser Leu Ile Ser Thr Asn Pro Asp
115 120 125
gcc att act ccg act gcc agt act tca gga ccg aag cct acg gtc acg 480
Ala Ile Thr Pro Thr Ala Ser Thr Ser Gly Pro Lys Pro Thr Val Thr
130 135 140
ttc agc tcg tac tcg gac caa gag ctg gag aat ctc tgg gac gac ttt 528
Phe Ser Ser Tyr Ser Asp Gln Glu Leu Glu Asn Leu Trp Asp Asp Phe
145 150 155 160
gtg gga caa gta caa caa cct cca ttc agc tat gtt cca gaa ccc caa 576
Val Gly Gln Val Gln Gln Pro Pro Phe Ser Tyr Val Pro Glu Pro Gln
165 170 175
aac ccc tat cct ctg cca aac acc cca cca tcc ctc tat cca gac tgg 624
Asn Pro Tyr Pro Leu Pro Asn Thr Pro Pro Ser Leu Tyr Pro Asp Trp
180 185 190
tac gtc aat tgc cct aca aag agt cta ccg ggg tac aaa ttc ccc aga 672
Tyr Val Asn Cys Pro Thr Lys Ser Leu Pro Gly Tyr Lys Phe Pro Arg
195 200 205
gga ttc ctg ttc ggc tgg gct aca gct gcg caa cag tgg gaa ggg gct 720
Gly Phe Leu Phe Gly Trp Ala Thr Ala Ala Gln Gln Trp Glu Gly Ala
210 215 220
gtc aag gcg gat ggt aag ggt cct agt atc tgg gac tgg gca agt aga 768
Val Lys Ala Asp Gly Lys Gly Pro Ser Ile Trp Asp Trp Ala Ser Arg
225 230 235 240
tac ccc ggc ttc atc gcg gac aac act act tct gat gtg gga gat ctg 816
Tyr Pro Gly Phe Ile Ala Asp Asn Thr Thr Ser Asp Val Gly Asp Leu
245 250 255
gga tat tac cta tac aaa gaa gat atg gca cgc ctc gct gcg ttg gga 864
Gly Tyr Tyr Leu Tyr Lys Glu Asp Met Ala Arg Leu Ala Ala Leu Gly
260 265 270
gga aac gtc tac tct ttc tcc atc ttc tgg act cgt atc ctc ccc ttt 912
Gly Asn Val Tyr Ser Phe Ser Ile Phe Trp Thr Arg Ile Leu Pro Phe
275 280 285
gcg gtc caa gga tcc ccc gtg aac caa aag gga gta gac ttt tat cgg 960
Ala Val Gln Gly Ser Pro Val Asn Gln Lys Gly Val Asp Phe Tyr Arg
290 295 300
gac ttg atc gat tat tgc tgg agt ttg ggt atc gag cct gtc gtg aca 1008
Asp Leu Ile Asp Tyr Cys Trp Ser Leu Gly Ile Glu Pro Val Val Thr
305 310 315 320
ctg ttc cac tgg gat aca cct tta gcg gtg caa ctg ctc tat gga gga 1056
Leu Phe His Trp Asp Thr Pro Leu Ala Val Gln Leu Leu Tyr Gly Gly
325 330 335
ttc gca agt gac aag atc att gat gat tat gtc aat tat gcc gaa acg 1104
Phe Ala Ser Asp Lys Ile Ile Asp Asp Tyr Val Asn Tyr Ala Glu Thr
340 345 350
gtg ttc act gcc tat aat ggc tcg gtt cac aaa tgg atc acc ttc aac 1152
Val Phe Thr Ala Tyr Asn Gly Ser Val His Lys Trp Ile Thr Phe Asn
355 360 365
gaa cca gta gta ttc tgc agc cag atg gct tct cct gtg aat tca aca 1200
Glu Pro Val Val Phe Cys Ser Gln Met Ala Ser Pro Val Asn Ser Thr
370 375 380
ctg ccc gaa ggg ttg aac agc acc aca tac cca tac aca tgt agc tac 1248
Leu Pro Glu Gly Leu Asn Ser Thr Thr Tyr Pro Tyr Thr Cys Ser Tyr
385 390 395 400
cat ctc acc ctg gct cac gcc aag acc gtc caa cga ttc aga gag ctc 1296
His Leu Thr Leu Ala His Ala Lys Thr Val Gln Arg Phe Arg Glu Leu
405 410 415
aac atc cag gga gag att gcg ctc aag tcg gac aac ttt aat ggt atc 1344
Asn Ile Gln Gly Glu Ile Ala Leu Lys Ser Asp Asn Phe Asn Gly Ile
420 425 430
cct tgg agg gaa ggg aat ccc gac gat gaa gaa gcc gtt gct agg cat 1392
Pro Trp Arg Glu Gly Asn Pro Asp Asp Glu Glu Ala Val Ala Arg His
435 440 445
tct gca tac cag att ggc atc ttt gcg gaa ccg ata tac aac act ggc 1440
Ser Ala Tyr Gln Ile Gly Ile Phe Ala Glu Pro Ile Tyr Asn Thr Gly
450 455 460
gac tgg cca gaa ctg atc aag aac gat ctt gga ccc gac atc ttg ccc 1488
Asp Trp Pro Glu Leu Ile Lys Asn Asp Leu Gly Pro Asp Ile Leu Pro
465 470 475 480
cga ttc acc gat gag cag atc cag atg atc aag ggt act gcc gac ttc 1536
Arg Phe Thr Asp Glu Gln Ile Gln Met Ile Lys Gly Thr Ala Asp Phe
485 490 495
ttt gcc att gat ggg tat cga gat ggc tgg gtc act gcc cca cct gct 1584
Phe Ala Ile Asp Gly Tyr Arg Asp Gly Trp Val Thr Ala Pro Pro Ala
500 505 510
gga gtg cag gct tgc gtg gcc aat atc agt gat ccc ctc tgg cct gtg 1632
Gly Val Gln Ala Cys Val Ala Asn Ile Ser Asp Pro Leu Trp Pro Val
515 520 525
tgc aat caa gtc aac ttc tac gac tct tct ccc gca ggt tgg gga atc 1680
Cys Asn Gln Val Asn Phe Tyr Asp Ser Ser Pro Ala Gly Trp Gly Ile
530 535 540
gga gcg ttt ggt aat tgg cct acc act ccc tgg ctg caa aac act tgg 1728
Gly Ala Phe Gly Asn Trp Pro Thr Thr Pro Trp Leu Gln Asn Thr Trp
545 550 555 560
caa ttt gtc cgg cca ttt ttg aaa gaa ttg act cag cag tac ccc acc 1776
Gln Phe Val Arg Pro Phe Leu Lys Glu Leu Thr Gln Gln Tyr Pro Thr
565 570 575
aaa ggt ggt atc tac ctc tcg gaa ttt ggc ttc tcc gaa cca ttc gag 1824
Lys Gly Gly Ile Tyr Leu Ser Glu Phe Gly Phe Ser Glu Pro Phe Glu
580 585 590
aac gag aaa aac ttc atc tac cag atc acg act gac ccg gga cgg gtg 1872
Asn Glu Lys Asn Phe Ile Tyr Gln Ile Thr Thr Asp Pro Gly Arg Val
595 600 605
gca tac ttt aac agt tac ctc ggt gaa gtg ctc ttg gcg atc aac gag 1920
Ala Tyr Phe Asn Ser Tyr Leu Gly Glu Val Leu Leu Ala Ile Asn Glu
610 615 620
gat gaa aca gat gtg aga ggg act ttt gga tgg agt ctt ttg gac aac 1968
Asp Glu Thr Asp Val Arg Gly Thr Phe Gly Trp Ser Leu Leu Asp Asn
625 630 635 640
ttt gag tgg aac tcg ggg ttg tcg act cgg ttc ggt gtc caa tat gtc 2016
Phe Glu Trp Asn Ser Gly Leu Ser Thr Arg Phe Gly Val Gln Tyr Val
645 650 655
gat tac aac agt cct acg ctc gaa agg acg ttc aag cgc tct gcg atc 2064
Asp Tyr Asn Ser Pro Thr Leu Glu Arg Thr Phe Lys Arg Ser Ala Ile
660 665 670
gag atg agc cag ttc tgg aac act cat cgt tgc gag gac tag 2106
Glu Met Ser Gln Phe Trp Asn Thr His Arg Cys Glu Asp
675 680 685
<210> 8
<211> 701
<212> PRT
<213> Sirobasidium magnum
<400> 8
Met Phe Lys Leu Thr Ser Val Leu Leu Leu Leu Gly Ala Ala Gln Ala
-15 -10 -5 -1
Ala Val Leu Asn Pro Arg Gln Ala Gly Ser Gly Asn Ser Thr Ala Ser
1 5 10 15
Gly Ser Ile Ala Gly Asp Ser Thr Arg Pro Ala Thr Thr Ser Ser Val
20 25 30
Val Ser Pro Ser Ala Ala Arg Asn Ser Thr Ala Ala Ala Thr Gly Asn
35 40 45
Ala Ser Arg Asn Ala Thr Ala Thr Gly Thr Ala Val Ala Thr Ala Thr
50 55 60
Gly Gly Val Thr Ala Ala Thr Ser Thr Gly Met Ala Val Thr Ser Pro
65 70 75 80
Ala Gln Gly Ala Gly Thr Gly Val Gly Thr Ala Ala Ala Ala Thr Thr
85 90 95
Thr Thr Ala Thr Pro Ser Gln Ser Asp Phe Asp Asn Trp Val Leu Thr
100 105 110
Ser Gly Leu Pro Thr Ile Thr Thr Ser Leu Ile Ser Thr Asn Pro Asp
115 120 125
Ala Ile Thr Pro Thr Ala Ser Thr Ser Gly Pro Lys Pro Thr Val Thr
130 135 140
Phe Ser Ser Tyr Ser Asp Gln Glu Leu Glu Asn Leu Trp Asp Asp Phe
145 150 155 160
Val Gly Gln Val Gln Gln Pro Pro Phe Ser Tyr Val Pro Glu Pro Gln
165 170 175
Asn Pro Tyr Pro Leu Pro Asn Thr Pro Pro Ser Leu Tyr Pro Asp Trp
180 185 190
Tyr Val Asn Cys Pro Thr Lys Ser Leu Pro Gly Tyr Lys Phe Pro Arg
195 200 205
Gly Phe Leu Phe Gly Trp Ala Thr Ala Ala Gln Gln Trp Glu Gly Ala
210 215 220
Val Lys Ala Asp Gly Lys Gly Pro Ser Ile Trp Asp Trp Ala Ser Arg
225 230 235 240
Tyr Pro Gly Phe Ile Ala Asp Asn Thr Thr Ser Asp Val Gly Asp Leu
245 250 255
Gly Tyr Tyr Leu Tyr Lys Glu Asp Met Ala Arg Leu Ala Ala Leu Gly
260 265 270
Gly Asn Val Tyr Ser Phe Ser Ile Phe Trp Thr Arg Ile Leu Pro Phe
275 280 285
Ala Val Gln Gly Ser Pro Val Asn Gln Lys Gly Val Asp Phe Tyr Arg
290 295 300
Asp Leu Ile Asp Tyr Cys Trp Ser Leu Gly Ile Glu Pro Val Val Thr
305 310 315 320
Leu Phe His Trp Asp Thr Pro Leu Ala Val Gln Leu Leu Tyr Gly Gly
325 330 335
Phe Ala Ser Asp Lys Ile Ile Asp Asp Tyr Val Asn Tyr Ala Glu Thr
340 345 350
Val Phe Thr Ala Tyr Asn Gly Ser Val His Lys Trp Ile Thr Phe Asn
355 360 365
Glu Pro Val Val Phe Cys Ser Gln Met Ala Ser Pro Val Asn Ser Thr
370 375 380
Leu Pro Glu Gly Leu Asn Ser Thr Thr Tyr Pro Tyr Thr Cys Ser Tyr
385 390 395 400
His Leu Thr Leu Ala His Ala Lys Thr Val Gln Arg Phe Arg Glu Leu
405 410 415
Asn Ile Gln Gly Glu Ile Ala Leu Lys Ser Asp Asn Phe Asn Gly Ile
420 425 430
Pro Trp Arg Glu Gly Asn Pro Asp Asp Glu Glu Ala Val Ala Arg His
435 440 445
Ser Ala Tyr Gln Ile Gly Ile Phe Ala Glu Pro Ile Tyr Asn Thr Gly
450 455 460
Asp Trp Pro Glu Leu Ile Lys Asn Asp Leu Gly Pro Asp Ile Leu Pro
465 470 475 480
Arg Phe Thr Asp Glu Gln Ile Gln Met Ile Lys Gly Thr Ala Asp Phe
485 490 495
Phe Ala Ile Asp Gly Tyr Arg Asp Gly Trp Val Thr Ala Pro Pro Ala
500 505 510
Gly Val Gln Ala Cys Val Ala Asn Ile Ser Asp Pro Leu Trp Pro Val
515 520 525
Cys Asn Gln Val Asn Phe Tyr Asp Ser Ser Pro Ala Gly Trp Gly Ile
530 535 540
Gly Ala Phe Gly Asn Trp Pro Thr Thr Pro Trp Leu Gln Asn Thr Trp
545 550 555 560
Gln Phe Val Arg Pro Phe Leu Lys Glu Leu Thr Gln Gln Tyr Pro Thr
565 570 575
Lys Gly Gly Ile Tyr Leu Ser Glu Phe Gly Phe Ser Glu Pro Phe Glu
580 585 590
Asn Glu Lys Asn Phe Ile Tyr Gln Ile Thr Thr Asp Pro Gly Arg Val
595 600 605
Ala Tyr Phe Asn Ser Tyr Leu Gly Glu Val Leu Leu Ala Ile Asn Glu
610 615 620
Asp Glu Thr Asp Val Arg Gly Thr Phe Gly Trp Ser Leu Leu Asp Asn
625 630 635 640
Phe Glu Trp Asn Ser Gly Leu Ser Thr Arg Phe Gly Val Gln Tyr Val
645 650 655
Asp Tyr Asn Ser Pro Thr Leu Glu Arg Thr Phe Lys Arg Ser Ala Ile
660 665 670
Glu Met Ser Gln Phe Trp Asn Thr His Arg Cys Glu Asp
675 680 685
<210> 9
<211> 2121
<212> DNA
<213> Artificial Sequence
<220>
<223> Beta-galactosidase
<220>
<221> CDS
<222> (1)..(2121)
<220>
<221> sig_peptide
<222> (1)..(63)
<220>
<221> mat_peptide
<222> (64)..(2118)
<400> 9
atg atg gtc gcg tgg tgg tct cta ttt ctg tac ggc ctt cag gtc gcg 48
Met Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala
-20 -15 -10
gca cct gct ttg gct gct gtt cta aac cct cgt caa gct ggc agc ggt 96
Ala Pro Ala Leu Ala Ala Val Leu Asn Pro Arg Gln Ala Gly Ser Gly
-5 -1 1 5 10
aat tcc act gcc agc ggc tcg ata gcc ggc gat tcc act aga cca gcc 144
Asn Ser Thr Ala Ser Gly Ser Ile Ala Gly Asp Ser Thr Arg Pro Ala
15 20 25
acg aca tcc tcg gtc gtc tca ccc tct gca gcc aga aac tcc act gcc 192
Thr Thr Ser Ser Val Val Ser Pro Ser Ala Ala Arg Asn Ser Thr Ala
30 35 40
gca gct act ggt aat gct tct cgc aat gct act gcg aca ggt act gcc 240
Ala Ala Thr Gly Asn Ala Ser Arg Asn Ala Thr Ala Thr Gly Thr Ala
45 50 55
gtc gct aca gcc act ggc ggg gtt aca gca gcc acg tcc act gga atg 288
Val Ala Thr Ala Thr Gly Gly Val Thr Ala Ala Thr Ser Thr Gly Met
60 65 70 75
gcg gtg act tcc cct gcc cag gga gcc ggt acc gga gtc ggt acc gca 336
Ala Val Thr Ser Pro Ala Gln Gly Ala Gly Thr Gly Val Gly Thr Ala
80 85 90
gcc gct gct acg acg act acc gcc acg cct agc caa tcc gac ttt gat 384
Ala Ala Ala Thr Thr Thr Thr Ala Thr Pro Ser Gln Ser Asp Phe Asp
95 100 105
aat tgg gtc ctc acc agt gga ttg cct acc atc acc act tca ttg atc 432
Asn Trp Val Leu Thr Ser Gly Leu Pro Thr Ile Thr Thr Ser Leu Ile
110 115 120
agt acc aat ccc gat gcc att act ccg act gcc agt act tca gga ccg 480
Ser Thr Asn Pro Asp Ala Ile Thr Pro Thr Ala Ser Thr Ser Gly Pro
125 130 135
aag cct acg gtc acg ttc agc tcg tac tcg gac caa gag ctg gag aat 528
Lys Pro Thr Val Thr Phe Ser Ser Tyr Ser Asp Gln Glu Leu Glu Asn
140 145 150 155
ctc tgg gac gac ttt gtg gga caa gta caa caa cct cca ttc agc tat 576
Leu Trp Asp Asp Phe Val Gly Gln Val Gln Gln Pro Pro Phe Ser Tyr
160 165 170
gtt cca gaa ccc caa aac ccc tat cct ctg cca aac acc cca cca tcc 624
Val Pro Glu Pro Gln Asn Pro Tyr Pro Leu Pro Asn Thr Pro Pro Ser
175 180 185
ctc tat cca gac tgg tac gtc aat tgc cct aca aag agt cta ccg ggg 672
Leu Tyr Pro Asp Trp Tyr Val Asn Cys Pro Thr Lys Ser Leu Pro Gly
190 195 200
tac aaa ttc ccc aga gga ttc ctg ttc ggc tgg gct aca gct gcg caa 720
Tyr Lys Phe Pro Arg Gly Phe Leu Phe Gly Trp Ala Thr Ala Ala Gln
205 210 215
cag tgg gaa ggg gct gtc aag gcg gat ggt aag ggt cct agt atc tgg 768
Gln Trp Glu Gly Ala Val Lys Ala Asp Gly Lys Gly Pro Ser Ile Trp
220 225 230 235
gac tgg gca agt aga tac ccc ggc ttc atc gcg gac aac act act tct 816
Asp Trp Ala Ser Arg Tyr Pro Gly Phe Ile Ala Asp Asn Thr Thr Ser
240 245 250
gat gtg gga gat ctg gga tat tac cta tac aaa gaa gat atg gca cgc 864
Asp Val Gly Asp Leu Gly Tyr Tyr Leu Tyr Lys Glu Asp Met Ala Arg
255 260 265
ctc gct gcg ttg gga gga aac gtc tac tct ttc tcc atc ttc tgg act 912
Leu Ala Ala Leu Gly Gly Asn Val Tyr Ser Phe Ser Ile Phe Trp Thr
270 275 280
cgt atc ctc ccc ttt gcg gtc caa gga tcc ccc gtg aac caa aag gga 960
Arg Ile Leu Pro Phe Ala Val Gln Gly Ser Pro Val Asn Gln Lys Gly
285 290 295
gta gac ttt tat cgg gac ttg atc gat tat tgc tgg agt ttg ggt atc 1008
Val Asp Phe Tyr Arg Asp Leu Ile Asp Tyr Cys Trp Ser Leu Gly Ile
300 305 310 315
gag cct gtc gtg aca ctg ttc cac tgg gat aca cct tta gcg gtg caa 1056
Glu Pro Val Val Thr Leu Phe His Trp Asp Thr Pro Leu Ala Val Gln
320 325 330
ctg ctc tat gga gga ttc gca agt gac aag atc att gat gat tat gtc 1104
Leu Leu Tyr Gly Gly Phe Ala Ser Asp Lys Ile Ile Asp Asp Tyr Val
335 340 345
aat tat gcc gaa acg gtg ttc act gcc tat aat ggc tcg gtt cac aaa 1152
Asn Tyr Ala Glu Thr Val Phe Thr Ala Tyr Asn Gly Ser Val His Lys
350 355 360
tgg atc acc ttc aac gaa cca gta gta ttc tgc agc cag atg gct tct 1200
Trp Ile Thr Phe Asn Glu Pro Val Val Phe Cys Ser Gln Met Ala Ser
365 370 375
cct gtg aat tca aca ctg ccc gaa ggg ttg aac agc acc aca tac cca 1248
Pro Val Asn Ser Thr Leu Pro Glu Gly Leu Asn Ser Thr Thr Tyr Pro
380 385 390 395
tac aca tgt agc tac cat ctc acc ctg gct cac gcc aag acc gtc caa 1296
Tyr Thr Cys Ser Tyr His Leu Thr Leu Ala His Ala Lys Thr Val Gln
400 405 410
cga ttc aga gag ctc aac atc cag gga gag att gcg ctc aag tcg gac 1344
Arg Phe Arg Glu Leu Asn Ile Gln Gly Glu Ile Ala Leu Lys Ser Asp
415 420 425
aac ttt aat ggt atc cct tgg agg gaa ggg aat ccc gac gat gaa gaa 1392
Asn Phe Asn Gly Ile Pro Trp Arg Glu Gly Asn Pro Asp Asp Glu Glu
430 435 440
gcc gtt gct agg cat tct gca tac cag att ggc atc ttt gcg gaa ccg 1440
Ala Val Ala Arg His Ser Ala Tyr Gln Ile Gly Ile Phe Ala Glu Pro
445 450 455
ata tac aac act ggc gac tgg cca gaa ctg atc aag aac gat ctt gga 1488
Ile Tyr Asn Thr Gly Asp Trp Pro Glu Leu Ile Lys Asn Asp Leu Gly
460 465 470 475
ccc gac atc ttg ccc cga ttc acc gat gag cag atc cag atg atc aag 1536
Pro Asp Ile Leu Pro Arg Phe Thr Asp Glu Gln Ile Gln Met Ile Lys
480 485 490
ggt act gcc gac ttc ttt gcc att gat ggg tat cga gat ggc tgg gtc 1584
Gly Thr Ala Asp Phe Phe Ala Ile Asp Gly Tyr Arg Asp Gly Trp Val
495 500 505
act gcc cca cct gct gga gtg cag gct tgc gtg gcc aat atc agt gat 1632
Thr Ala Pro Pro Ala Gly Val Gln Ala Cys Val Ala Asn Ile Ser Asp
510 515 520
ccc ctc tgg cct gtg tgc aat caa gtc aac ttc tac gac tct tct ccc 1680
Pro Leu Trp Pro Val Cys Asn Gln Val Asn Phe Tyr Asp Ser Ser Pro
525 530 535
gca ggt tgg gga atc gga gcg ttt ggt aat tgg cct acc act ccc tgg 1728
Ala Gly Trp Gly Ile Gly Ala Phe Gly Asn Trp Pro Thr Thr Pro Trp
540 545 550 555
ctg caa aac act tgg caa ttt gtc cgg cca ttt ttg aaa gaa ttg act 1776
Leu Gln Asn Thr Trp Gln Phe Val Arg Pro Phe Leu Lys Glu Leu Thr
560 565 570
cag cag tac ccc acc aaa ggt ggt atc tac ctc tcg gaa ttt ggc ttc 1824
Gln Gln Tyr Pro Thr Lys Gly Gly Ile Tyr Leu Ser Glu Phe Gly Phe
575 580 585
tcc gaa cca ttc gag aac gag aaa aac ttc atc tac cag atc acg act 1872
Ser Glu Pro Phe Glu Asn Glu Lys Asn Phe Ile Tyr Gln Ile Thr Thr
590 595 600
gac ccg gga cgg gtg gca tac ttt aac agt tac ctc ggt gaa gtg ctc 1920
Asp Pro Gly Arg Val Ala Tyr Phe Asn Ser Tyr Leu Gly Glu Val Leu
605 610 615
ttg gcg atc aac gag gat gaa aca gat gtg aga ggg act ttt gga tgg 1968
Leu Ala Ile Asn Glu Asp Glu Thr Asp Val Arg Gly Thr Phe Gly Trp
620 625 630 635
agt ctt ttg gac aac ttt gag tgg aac tcg ggg ttg tcg act cgg ttc 2016
Ser Leu Leu Asp Asn Phe Glu Trp Asn Ser Gly Leu Ser Thr Arg Phe
640 645 650
ggt gtc caa tat gtc gat tac aac agt cct acg ctc gaa agg acg ttc 2064
Gly Val Gln Tyr Val Asp Tyr Asn Ser Pro Thr Leu Glu Arg Thr Phe
655 660 665
aag cgc tct gcg atc gag atg agc cag ttc tgg aac act cat cgt tgc 2112
Lys Arg Ser Ala Ile Glu Met Ser Gln Phe Trp Asn Thr His Arg Cys
670 675 680
gag gac tag 2121
Glu Asp
685
<210> 10
<211> 706
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 10
Met Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala
-20 -15 -10
Ala Pro Ala Leu Ala Ala Val Leu Asn Pro Arg Gln Ala Gly Ser Gly
-5 -1 1 5 10
Asn Ser Thr Ala Ser Gly Ser Ile Ala Gly Asp Ser Thr Arg Pro Ala
15 20 25
Thr Thr Ser Ser Val Val Ser Pro Ser Ala Ala Arg Asn Ser Thr Ala
30 35 40
Ala Ala Thr Gly Asn Ala Ser Arg Asn Ala Thr Ala Thr Gly Thr Ala
45 50 55
Val Ala Thr Ala Thr Gly Gly Val Thr Ala Ala Thr Ser Thr Gly Met
60 65 70 75
Ala Val Thr Ser Pro Ala Gln Gly Ala Gly Thr Gly Val Gly Thr Ala
80 85 90
Ala Ala Ala Thr Thr Thr Thr Ala Thr Pro Ser Gln Ser Asp Phe Asp
95 100 105
Asn Trp Val Leu Thr Ser Gly Leu Pro Thr Ile Thr Thr Ser Leu Ile
110 115 120
Ser Thr Asn Pro Asp Ala Ile Thr Pro Thr Ala Ser Thr Ser Gly Pro
125 130 135
Lys Pro Thr Val Thr Phe Ser Ser Tyr Ser Asp Gln Glu Leu Glu Asn
140 145 150 155
Leu Trp Asp Asp Phe Val Gly Gln Val Gln Gln Pro Pro Phe Ser Tyr
160 165 170
Val Pro Glu Pro Gln Asn Pro Tyr Pro Leu Pro Asn Thr Pro Pro Ser
175 180 185
Leu Tyr Pro Asp Trp Tyr Val Asn Cys Pro Thr Lys Ser Leu Pro Gly
190 195 200
Tyr Lys Phe Pro Arg Gly Phe Leu Phe Gly Trp Ala Thr Ala Ala Gln
205 210 215
Gln Trp Glu Gly Ala Val Lys Ala Asp Gly Lys Gly Pro Ser Ile Trp
220 225 230 235
Asp Trp Ala Ser Arg Tyr Pro Gly Phe Ile Ala Asp Asn Thr Thr Ser
240 245 250
Asp Val Gly Asp Leu Gly Tyr Tyr Leu Tyr Lys Glu Asp Met Ala Arg
255 260 265
Leu Ala Ala Leu Gly Gly Asn Val Tyr Ser Phe Ser Ile Phe Trp Thr
270 275 280
Arg Ile Leu Pro Phe Ala Val Gln Gly Ser Pro Val Asn Gln Lys Gly
285 290 295
Val Asp Phe Tyr Arg Asp Leu Ile Asp Tyr Cys Trp Ser Leu Gly Ile
300 305 310 315
Glu Pro Val Val Thr Leu Phe His Trp Asp Thr Pro Leu Ala Val Gln
320 325 330
Leu Leu Tyr Gly Gly Phe Ala Ser Asp Lys Ile Ile Asp Asp Tyr Val
335 340 345
Asn Tyr Ala Glu Thr Val Phe Thr Ala Tyr Asn Gly Ser Val His Lys
350 355 360
Trp Ile Thr Phe Asn Glu Pro Val Val Phe Cys Ser Gln Met Ala Ser
365 370 375
Pro Val Asn Ser Thr Leu Pro Glu Gly Leu Asn Ser Thr Thr Tyr Pro
380 385 390 395
Tyr Thr Cys Ser Tyr His Leu Thr Leu Ala His Ala Lys Thr Val Gln
400 405 410
Arg Phe Arg Glu Leu Asn Ile Gln Gly Glu Ile Ala Leu Lys Ser Asp
415 420 425
Asn Phe Asn Gly Ile Pro Trp Arg Glu Gly Asn Pro Asp Asp Glu Glu
430 435 440
Ala Val Ala Arg His Ser Ala Tyr Gln Ile Gly Ile Phe Ala Glu Pro
445 450 455
Ile Tyr Asn Thr Gly Asp Trp Pro Glu Leu Ile Lys Asn Asp Leu Gly
460 465 470 475
Pro Asp Ile Leu Pro Arg Phe Thr Asp Glu Gln Ile Gln Met Ile Lys
480 485 490
Gly Thr Ala Asp Phe Phe Ala Ile Asp Gly Tyr Arg Asp Gly Trp Val
495 500 505
Thr Ala Pro Pro Ala Gly Val Gln Ala Cys Val Ala Asn Ile Ser Asp
510 515 520
Pro Leu Trp Pro Val Cys Asn Gln Val Asn Phe Tyr Asp Ser Ser Pro
525 530 535
Ala Gly Trp Gly Ile Gly Ala Phe Gly Asn Trp Pro Thr Thr Pro Trp
540 545 550 555
Leu Gln Asn Thr Trp Gln Phe Val Arg Pro Phe Leu Lys Glu Leu Thr
560 565 570
Gln Gln Tyr Pro Thr Lys Gly Gly Ile Tyr Leu Ser Glu Phe Gly Phe
575 580 585
Ser Glu Pro Phe Glu Asn Glu Lys Asn Phe Ile Tyr Gln Ile Thr Thr
590 595 600
Asp Pro Gly Arg Val Ala Tyr Phe Asn Ser Tyr Leu Gly Glu Val Leu
605 610 615
Leu Ala Ile Asn Glu Asp Glu Thr Asp Val Arg Gly Thr Phe Gly Trp
620 625 630 635
Ser Leu Leu Asp Asn Phe Glu Trp Asn Ser Gly Leu Ser Thr Arg Phe
640 645 650
Gly Val Gln Tyr Val Asp Tyr Asn Ser Pro Thr Leu Glu Arg Thr Phe
655 660 665
Lys Arg Ser Ala Ile Glu Met Ser Gln Phe Trp Asn Thr His Arg Cys
670 675 680
Glu Asp
685
<210> 11
<211> 2121
<212> DNA
<213> Artificial Sequence
<220>
<223> Beta-galactosidase
<220>
<221> CDS
<222> (1)..(2121)
<220>
<221> sig_peptide
<222> (1)..(63)
<220>
<221> mat_peptide
<222> (64)..(2118)
<400> 11
atg atg gtc gcg tgg tgg tct cta ttt ctg tac ggc ctt cag gtc gcg 48
Met Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala
-20 -15 -10
gca cct gct ttg gct gcg gtg ctc aac cca cgc cag gct ggc tct gga 96
Ala Pro Ala Leu Ala Ala Val Leu Asn Pro Arg Gln Ala Gly Ser Gly
-5 -1 1 5 10
aac tct act gcc tct ggg tcc att gct ggc gac tcg aca cgc ccg gct 144
Asn Ser Thr Ala Ser Gly Ser Ile Ala Gly Asp Ser Thr Arg Pro Ala
15 20 25
acg acc tct tcg gtt gtc tcc cct tcc gca gcc cga aac tcc act gcc 192
Thr Thr Ser Ser Val Val Ser Pro Ser Ala Ala Arg Asn Ser Thr Ala
30 35 40
gcc gcc acg ggt aat gct tcc cgc aac gct acg gcc acc gga aca gcc 240
Ala Ala Thr Gly Asn Ala Ser Arg Asn Ala Thr Ala Thr Gly Thr Ala
45 50 55
gtt gcc act gcc acg ggc ggc gtt acg gcg gca acg tcc acg ggc atg 288
Val Ala Thr Ala Thr Gly Gly Val Thr Ala Ala Thr Ser Thr Gly Met
60 65 70 75
gct gtt acg tct ccc gct cag ggt gcc gga acg ggt gtt ggc acc gcc 336
Ala Val Thr Ser Pro Ala Gln Gly Ala Gly Thr Gly Val Gly Thr Ala
80 85 90
gca gcc gca aca aca acg acg gca acg ccc tct caa tcc gac ttc gac 384
Ala Ala Ala Thr Thr Thr Thr Ala Thr Pro Ser Gln Ser Asp Phe Asp
95 100 105
aac tgg gtg ctc acg tcg ggg ctc ccc aca atc aca act agc ctg atc 432
Asn Trp Val Leu Thr Ser Gly Leu Pro Thr Ile Thr Thr Ser Leu Ile
110 115 120
tcg aca aac cct gac gcc att acc cca acc gca tct acc tcg gga ccc 480
Ser Thr Asn Pro Asp Ala Ile Thr Pro Thr Ala Ser Thr Ser Gly Pro
125 130 135
aaa cca acg gtt acc ttc tcc tcc tac tct gat cag gag ttg gag aat 528
Lys Pro Thr Val Thr Phe Ser Ser Tyr Ser Asp Gln Glu Leu Glu Asn
140 145 150 155
ctg tgg gac gac ttt gtc ggg cag gtt cag cag cct ccg ttc tcg tat 576
Leu Trp Asp Asp Phe Val Gly Gln Val Gln Gln Pro Pro Phe Ser Tyr
160 165 170
gtt cca gaa ccc caa aac ccg tac cca ttg ccc aac acc cca ccg tct 624
Val Pro Glu Pro Gln Asn Pro Tyr Pro Leu Pro Asn Thr Pro Pro Ser
175 180 185
ctc tac ccc gac tgg tac gtc aat tgt ccc acc aag agc ttg cct ggt 672
Leu Tyr Pro Asp Trp Tyr Val Asn Cys Pro Thr Lys Ser Leu Pro Gly
190 195 200
tac aag ttc cct cga ggc ttc ctc ttc ggt tgg gcg acg gct gcg caa 720
Tyr Lys Phe Pro Arg Gly Phe Leu Phe Gly Trp Ala Thr Ala Ala Gln
205 210 215
cag tgg gag ggg gct gtg aaa gct gac ggc aaa gga cca tcc atc tgg 768
Gln Trp Glu Gly Ala Val Lys Ala Asp Gly Lys Gly Pro Ser Ile Trp
220 225 230 235
gac tgg gcc tcc cga tat ccg ggc ttc atc gcc gat aac acc aca tcg 816
Asp Trp Ala Ser Arg Tyr Pro Gly Phe Ile Ala Asp Asn Thr Thr Ser
240 245 250
gac gtg ggc gac ttg ggc tac tac ttg tac aag gag gat atg gct cgt 864
Asp Val Gly Asp Leu Gly Tyr Tyr Leu Tyr Lys Glu Asp Met Ala Arg
255 260 265
ctc gcc gcc ctc ggc ggc aat gtg tat tcc ttt tcc atc ttc tgg acg 912
Leu Ala Ala Leu Gly Gly Asn Val Tyr Ser Phe Ser Ile Phe Trp Thr
270 275 280
cga att ctg ccg ttc gca gtg caa ggt tct ccg gtc aat cag aag ggt 960
Arg Ile Leu Pro Phe Ala Val Gln Gly Ser Pro Val Asn Gln Lys Gly
285 290 295
gtt gac ttc tac cgg gac ctg atc gat tac tgt tgg agc ctt ggt atc 1008
Val Asp Phe Tyr Arg Asp Leu Ile Asp Tyr Cys Trp Ser Leu Gly Ile
300 305 310 315
gaa ccg gtc gtc aca ttg ttc cac tgg gat act ccg ttg gca gtg caa 1056
Glu Pro Val Val Thr Leu Phe His Trp Asp Thr Pro Leu Ala Val Gln
320 325 330
ctg ctc tat gga ggt ttc gcc tcg gac aag atc atc gac gac tac gtc 1104
Leu Leu Tyr Gly Gly Phe Ala Ser Asp Lys Ile Ile Asp Asp Tyr Val
335 340 345
aac tac gcc gaa acc gtg ttc aca gcg tac aac ggt tcg gtc cat aag 1152
Asn Tyr Ala Glu Thr Val Phe Thr Ala Tyr Asn Gly Ser Val His Lys
350 355 360
tgg atc acc ttc aac gag cca gtt gtg ttc tgt tcc caa atg gca tcg 1200
Trp Ile Thr Phe Asn Glu Pro Val Val Phe Cys Ser Gln Met Ala Ser
365 370 375
cca gtg aat agc acg ctg cca gag ggg ttg aac tcg acc acc tac ccc 1248
Pro Val Asn Ser Thr Leu Pro Glu Gly Leu Asn Ser Thr Thr Tyr Pro
380 385 390 395
tat acg tgc tcg tac cat ctg acc ctt gcg cac gcg aag acc gtg caa 1296
Tyr Thr Cys Ser Tyr His Leu Thr Leu Ala His Ala Lys Thr Val Gln
400 405 410
cgg ttc cgt gag ctc aac atc cag ggg gag att gcc ttg aag agc gat 1344
Arg Phe Arg Glu Leu Asn Ile Gln Gly Glu Ile Ala Leu Lys Ser Asp
415 420 425
aac ttc aac ggc att ccg tgg cgg gag gga aac cct gat gat gaa gag 1392
Asn Phe Asn Gly Ile Pro Trp Arg Glu Gly Asn Pro Asp Asp Glu Glu
430 435 440
gct gtc gcc cga cat tct gcc tat cag atc gga atc ttc gca gaa cct 1440
Ala Val Ala Arg His Ser Ala Tyr Gln Ile Gly Ile Phe Ala Glu Pro
445 450 455
atc tac aac act ggt gat tgg ccg gag ctg atc aag aac gat ctg ggg 1488
Ile Tyr Asn Thr Gly Asp Trp Pro Glu Leu Ile Lys Asn Asp Leu Gly
460 465 470 475
ccg gat atc ttg ccc cgc ttc act gat gaa cag atc cag atg atc aag 1536
Pro Asp Ile Leu Pro Arg Phe Thr Asp Glu Gln Ile Gln Met Ile Lys
480 485 490
ggg acc gct gat ttc ttc gcg atc gat ggt tac cgt gac ggc tgg gtc 1584
Gly Thr Ala Asp Phe Phe Ala Ile Asp Gly Tyr Arg Asp Gly Trp Val
495 500 505
aca gca cca cct gct ggt gtc caa gct tgc gtg gcg aac atc tct gat 1632
Thr Ala Pro Pro Ala Gly Val Gln Ala Cys Val Ala Asn Ile Ser Asp
510 515 520
ccg ttg tgg ccc gtg tgt aac cag gtc aac ttc tac gat tcg agc ccg 1680
Pro Leu Trp Pro Val Cys Asn Gln Val Asn Phe Tyr Asp Ser Ser Pro
525 530 535
gcc ggt tgg gga att ggc gca ttt ggt aac tgg cca act act ccg tgg 1728
Ala Gly Trp Gly Ile Gly Ala Phe Gly Asn Trp Pro Thr Thr Pro Trp
540 545 550 555
ctt cag aac aca tgg cag ttt gtc cgc ccg ttt ctc aag gag ctt act 1776
Leu Gln Asn Thr Trp Gln Phe Val Arg Pro Phe Leu Lys Glu Leu Thr
560 565 570
cag caa tac cca acg aag ggg ggt atc tac ctc tcc gaa ttc ggt ttc 1824
Gln Gln Tyr Pro Thr Lys Gly Gly Ile Tyr Leu Ser Glu Phe Gly Phe
575 580 585
tcg gag ccc ttt gag aac gaa aag aac ttc atc tac caa atc aca aca 1872
Ser Glu Pro Phe Glu Asn Glu Lys Asn Phe Ile Tyr Gln Ile Thr Thr
590 595 600
gac ccc ggc cgg gtg gcc tac ttc aac agc tat ctg ggg gaa gtg ctc 1920
Asp Pro Gly Arg Val Ala Tyr Phe Asn Ser Tyr Leu Gly Glu Val Leu
605 610 615
ttg gcc atc aac gaa gat gag acg gac gtc cgc ggt act ttc gga tgg 1968
Leu Ala Ile Asn Glu Asp Glu Thr Asp Val Arg Gly Thr Phe Gly Trp
620 625 630 635
tct ctt ctc gac aac ttc gag tgg aac tct gga ctg agc aca cga ttc 2016
Ser Leu Leu Asp Asn Phe Glu Trp Asn Ser Gly Leu Ser Thr Arg Phe
640 645 650
ggg gtc cag tat gtg gac tac aac tcc cct acg ctt gaa cgg acc ttc 2064
Gly Val Gln Tyr Val Asp Tyr Asn Ser Pro Thr Leu Glu Arg Thr Phe
655 660 665
aag cgc tct gcg atc gaa atg tcc cag ttc tgg aac acg cat cgt tgc 2112
Lys Arg Ser Ala Ile Glu Met Ser Gln Phe Trp Asn Thr His Arg Cys
670 675 680
gag gac taa 2121
Glu Asp
685
<210> 12
<211> 706
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 12
Met Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala
-20 -15 -10
Ala Pro Ala Leu Ala Ala Val Leu Asn Pro Arg Gln Ala Gly Ser Gly
-5 -1 1 5 10
Asn Ser Thr Ala Ser Gly Ser Ile Ala Gly Asp Ser Thr Arg Pro Ala
15 20 25
Thr Thr Ser Ser Val Val Ser Pro Ser Ala Ala Arg Asn Ser Thr Ala
30 35 40
Ala Ala Thr Gly Asn Ala Ser Arg Asn Ala Thr Ala Thr Gly Thr Ala
45 50 55
Val Ala Thr Ala Thr Gly Gly Val Thr Ala Ala Thr Ser Thr Gly Met
60 65 70 75
Ala Val Thr Ser Pro Ala Gln Gly Ala Gly Thr Gly Val Gly Thr Ala
80 85 90
Ala Ala Ala Thr Thr Thr Thr Ala Thr Pro Ser Gln Ser Asp Phe Asp
95 100 105
Asn Trp Val Leu Thr Ser Gly Leu Pro Thr Ile Thr Thr Ser Leu Ile
110 115 120
Ser Thr Asn Pro Asp Ala Ile Thr Pro Thr Ala Ser Thr Ser Gly Pro
125 130 135
Lys Pro Thr Val Thr Phe Ser Ser Tyr Ser Asp Gln Glu Leu Glu Asn
140 145 150 155
Leu Trp Asp Asp Phe Val Gly Gln Val Gln Gln Pro Pro Phe Ser Tyr
160 165 170
Val Pro Glu Pro Gln Asn Pro Tyr Pro Leu Pro Asn Thr Pro Pro Ser
175 180 185
Leu Tyr Pro Asp Trp Tyr Val Asn Cys Pro Thr Lys Ser Leu Pro Gly
190 195 200
Tyr Lys Phe Pro Arg Gly Phe Leu Phe Gly Trp Ala Thr Ala Ala Gln
205 210 215
Gln Trp Glu Gly Ala Val Lys Ala Asp Gly Lys Gly Pro Ser Ile Trp
220 225 230 235
Asp Trp Ala Ser Arg Tyr Pro Gly Phe Ile Ala Asp Asn Thr Thr Ser
240 245 250
Asp Val Gly Asp Leu Gly Tyr Tyr Leu Tyr Lys Glu Asp Met Ala Arg
255 260 265
Leu Ala Ala Leu Gly Gly Asn Val Tyr Ser Phe Ser Ile Phe Trp Thr
270 275 280
Arg Ile Leu Pro Phe Ala Val Gln Gly Ser Pro Val Asn Gln Lys Gly
285 290 295
Val Asp Phe Tyr Arg Asp Leu Ile Asp Tyr Cys Trp Ser Leu Gly Ile
300 305 310 315
Glu Pro Val Val Thr Leu Phe His Trp Asp Thr Pro Leu Ala Val Gln
320 325 330
Leu Leu Tyr Gly Gly Phe Ala Ser Asp Lys Ile Ile Asp Asp Tyr Val
335 340 345
Asn Tyr Ala Glu Thr Val Phe Thr Ala Tyr Asn Gly Ser Val His Lys
350 355 360
Trp Ile Thr Phe Asn Glu Pro Val Val Phe Cys Ser Gln Met Ala Ser
365 370 375
Pro Val Asn Ser Thr Leu Pro Glu Gly Leu Asn Ser Thr Thr Tyr Pro
380 385 390 395
Tyr Thr Cys Ser Tyr His Leu Thr Leu Ala His Ala Lys Thr Val Gln
400 405 410
Arg Phe Arg Glu Leu Asn Ile Gln Gly Glu Ile Ala Leu Lys Ser Asp
415 420 425
Asn Phe Asn Gly Ile Pro Trp Arg Glu Gly Asn Pro Asp Asp Glu Glu
430 435 440
Ala Val Ala Arg His Ser Ala Tyr Gln Ile Gly Ile Phe Ala Glu Pro
445 450 455
Ile Tyr Asn Thr Gly Asp Trp Pro Glu Leu Ile Lys Asn Asp Leu Gly
460 465 470 475
Pro Asp Ile Leu Pro Arg Phe Thr Asp Glu Gln Ile Gln Met Ile Lys
480 485 490
Gly Thr Ala Asp Phe Phe Ala Ile Asp Gly Tyr Arg Asp Gly Trp Val
495 500 505
Thr Ala Pro Pro Ala Gly Val Gln Ala Cys Val Ala Asn Ile Ser Asp
510 515 520
Pro Leu Trp Pro Val Cys Asn Gln Val Asn Phe Tyr Asp Ser Ser Pro
525 530 535
Ala Gly Trp Gly Ile Gly Ala Phe Gly Asn Trp Pro Thr Thr Pro Trp
540 545 550 555
Leu Gln Asn Thr Trp Gln Phe Val Arg Pro Phe Leu Lys Glu Leu Thr
560 565 570
Gln Gln Tyr Pro Thr Lys Gly Gly Ile Tyr Leu Ser Glu Phe Gly Phe
575 580 585
Ser Glu Pro Phe Glu Asn Glu Lys Asn Phe Ile Tyr Gln Ile Thr Thr
590 595 600
Asp Pro Gly Arg Val Ala Tyr Phe Asn Ser Tyr Leu Gly Glu Val Leu
605 610 615
Leu Ala Ile Asn Glu Asp Glu Thr Asp Val Arg Gly Thr Phe Gly Trp
620 625 630 635
Ser Leu Leu Asp Asn Phe Glu Trp Asn Ser Gly Leu Ser Thr Arg Phe
640 645 650
Gly Val Gln Tyr Val Asp Tyr Asn Ser Pro Thr Leu Glu Arg Thr Phe
655 660 665
Lys Arg Ser Ala Ile Glu Met Ser Gln Phe Trp Asn Thr His Arg Cys
670 675 680
Glu Asp
685
<210> 13
<211> 1803
<212> DNA
<213> Rodotorula minuta
<220>
<221> CDS
<222> (1)..(1803)
<220>
<221> sig_peptide
<222> (1)..(57)
<220>
<221> mat_peptide
<222> (58)..(1800)
<400> 13
atg gtc atc ctg cgc cac acg gta cta gcg gca gcg gtc gtc cag atc 48
Met Val Ile Leu Arg His Thr Val Leu Ala Ala Ala Val Val Gln Ile
-15 -10 -5
gcc ctc ggg gct ccg cag ttt agc ccc aca gtc aat acg gaa ggt atc 96
Ala Leu Gly Ala Pro Gln Phe Ser Pro Thr Val Asn Thr Glu Gly Ile
-1 1 5 10
att cca att tcg gag cgc cct tcg cct aca caa tct tcg tcg tcc agc 144
Ile Pro Ile Ser Glu Arg Pro Ser Pro Thr Gln Ser Ser Ser Ser Ser
15 20 25
gga ccc gtg att cca gct ggc tca tat gtc tcc gac ttt gat gcc agc 192
Gly Pro Val Ile Pro Ala Gly Ser Tyr Val Ser Asp Phe Asp Ala Ser
30 35 40 45
gga ctt gca aac tta tgg agc caa gtc gaa gta gac ata cct gtc gag 240
Gly Leu Ala Asn Leu Trp Ser Gln Val Glu Val Asp Ile Pro Val Glu
50 55 60
tct cca agg att tct gcc gta cct cct ctc aac aaa acg ttc agt gtt 288
Ser Pro Arg Ile Ser Ala Val Pro Pro Leu Asn Lys Thr Phe Ser Val
65 70 75
ccg aaa act cca gtc ctg ccc aac tcc ctg cag gat cac ctt cca aaa 336
Pro Lys Thr Pro Val Leu Pro Asn Ser Leu Gln Asp His Leu Pro Lys
80 85 90
gat gtc aaa gca ccc gaa ggc ttt gca tgg ggc gtg gcc tcc gtt gct 384
Asp Val Lys Ala Pro Glu Gly Phe Ala Trp Gly Val Ala Ser Val Ala
95 100 105
cag cag tac gag ggt gcc gtc aaa gca gat gga cga gga cca tct cat 432
Gln Gln Tyr Glu Gly Ala Val Lys Ala Asp Gly Arg Gly Pro Ser His
110 115 120 125
tgg gat ttc ctt tgc cat aga aac cct tcc agc tgc aca aac tac acc 480
Trp Asp Phe Leu Cys His Arg Asn Pro Ser Ser Cys Thr Asn Tyr Thr
130 135 140
agt gat atc act gat ctt ggc cgt tac tac tat aag aat gac ttg gca 528
Ser Asp Ile Thr Asp Leu Gly Arg Tyr Tyr Tyr Lys Asn Asp Leu Ala
145 150 155
cga atg gct gcc atg ggt ata act cac tac tca ttt tca gtg agc tgg 576
Arg Met Ala Ala Met Gly Ile Thr His Tyr Ser Phe Ser Val Ser Trp
160 165 170
acc aga gtt gtg cca ttc ggc aag aag ggc agt cca gtc agc aac gaa 624
Thr Arg Val Val Pro Phe Gly Lys Lys Gly Ser Pro Val Ser Asn Glu
175 180 185
ggc ctc gac tat tac gaa gat atc tgc aag acg gct ttg agc ttt gga 672
Gly Leu Asp Tyr Tyr Glu Asp Ile Cys Lys Thr Ala Leu Ser Phe Gly
190 195 200 205
atc aag cct gtc att act tta ttc cac tgg gat act cct gcc aac tta 720
Ile Lys Pro Val Ile Thr Leu Phe His Trp Asp Thr Pro Ala Asn Leu
210 215 220
ctc ttc gaa tat gga ggt ttc ctc aac ggg aca atc gta gat gac tac 768
Leu Phe Glu Tyr Gly Gly Phe Leu Asn Gly Thr Ile Val Asp Asp Tyr
225 230 235
tac tat tat gca gat ata gta ttc aga aga cta ggc aaa tat gcc gaa 816
Tyr Tyr Tyr Ala Asp Ile Val Phe Arg Arg Leu Gly Lys Tyr Ala Glu
240 245 250
acc ttc ttc acc ttc aat gag cct cgt gta tac tgc agc gag tat act 864
Thr Phe Phe Thr Phe Asn Glu Pro Arg Val Tyr Cys Ser Glu Tyr Thr
255 260 265
ggt cct ccg ttc gat gcc tat tac gaa cgc tat ggg ctg aat tct agc 912
Gly Pro Pro Phe Asp Ala Tyr Tyr Glu Arg Tyr Gly Leu Asn Ser Ser
270 275 280 285
act gca cca tat ccc tgc tcg tac aat ctg ctc cga gcc cat ggt gcc 960
Thr Ala Pro Tyr Pro Cys Ser Tyr Asn Leu Leu Arg Ala His Gly Ala
290 295 300
gca gtc ggc agg tat cgt gcc ctg gtc aaa gaa ggc agc atc aaa tct 1008
Ala Val Gly Arg Tyr Arg Ala Leu Val Lys Glu Gly Ser Ile Lys Ser
305 310 315
ggt gaa atc gca ttc aaa aac gac gat agt tac cag cta cct caa aat 1056
Gly Glu Ile Ala Phe Lys Asn Asp Asp Ser Tyr Gln Leu Pro Gln Asn
320 325 330
cca gac tct gac gcc gac aag cga gct gca aaa cgc cac ttc gac ttc 1104
Pro Asp Ser Asp Ala Asp Lys Arg Ala Ala Lys Arg His Phe Asp Phe
335 340 345
tac atc ggc ata ttc tcg caa ccc gta tac ggc aac ggc tac tat ccc 1152
Tyr Ile Gly Ile Phe Ser Gln Pro Val Tyr Gly Asn Gly Tyr Tyr Pro
350 355 360 365
gaa acc gtc cgg aac aca att tca gag cgc ttc ctc cca gag ttc acc 1200
Glu Thr Val Arg Asn Thr Ile Ser Glu Arg Phe Leu Pro Glu Phe Thr
370 375 380
gca gcc gag cgc gaa caa att cag gga tca gcg gac ttc tac gcc atc 1248
Ala Ala Glu Arg Glu Gln Ile Gln Gly Ser Ala Asp Phe Tyr Ala Ile
385 390 395
gac ggt tat agg acg aat atc gca agc gct gct ccc aat ggt att gac 1296
Asp Gly Tyr Arg Thr Asn Ile Ala Ser Ala Ala Pro Asn Gly Ile Asp
400 405 410
gcg tgc ttg aga aac gct agt gat ccc aac tgg cca gtt tgc cag gac 1344
Ala Cys Leu Arg Asn Ala Ser Asp Pro Asn Trp Pro Val Cys Gln Asp
415 420 425
aac agt aac aca ggc caa tac gct act ctt gag gga ttc gca ttg gga 1392
Asn Ser Asn Thr Gly Gln Tyr Ala Thr Leu Glu Gly Phe Ala Leu Gly
430 435 440 445
cct cct gca gat ccc aac gcg aat tgg cta tac aac act gca cct tac 1440
Pro Pro Ala Asp Pro Asn Ala Asn Trp Leu Tyr Asn Thr Ala Pro Tyr
450 455 460
ctg cgt tac caa ttc aaa gtt ctg aaa gag aac ttc aat tac aag aag 1488
Leu Arg Tyr Gln Phe Lys Val Leu Lys Glu Asn Phe Asn Tyr Lys Lys
465 470 475
atc tac ttg acg gaa ttc ggc ttt gca gaa cct ttt agc tat ttg cga 1536
Ile Tyr Leu Thr Glu Phe Gly Phe Ala Glu Pro Phe Ser Tyr Leu Arg
480 485 490
cag gat ctg tat gca ttg ctg tat gac act gat cgc act gca tat tat 1584
Gln Asp Leu Tyr Ala Leu Leu Tyr Asp Thr Asp Arg Thr Ala Tyr Tyr
495 500 505
caa gac tat cta gcg cag tgc atg ctg gct atc aaa gaa gat ggc atc 1632
Gln Asp Tyr Leu Ala Gln Cys Met Leu Ala Ile Lys Glu Asp Gly Ile
510 515 520 525
cct ctt gct ggt gtt ttc gca tgg tca ttt gtt gat aac ttc gaa tgg 1680
Pro Leu Ala Gly Val Phe Ala Trp Ser Phe Val Asp Asn Phe Glu Trp
530 535 540
ggt tcc ggt ctt gag cag aga ttt gga atg caa tat gtc aac tac acc 1728
Gly Ser Gly Leu Glu Gln Arg Phe Gly Met Gln Tyr Val Asn Tyr Thr
545 550 555
gat ccg gat ctc cca cga acc ttc aag ctt tct ttc ctg gca tat cgt 1776
Asp Pro Asp Leu Pro Arg Thr Phe Lys Leu Ser Phe Leu Ala Tyr Arg
560 565 570
gat ttc atc aaa aac cac aaa aag tga 1803
Asp Phe Ile Lys Asn His Lys Lys
575 580
<210> 14
<211> 600
<212> PRT
<213> Rodotorula minuta
<400> 14
Met Val Ile Leu Arg His Thr Val Leu Ala Ala Ala Val Val Gln Ile
-15 -10 -5
Ala Leu Gly Ala Pro Gln Phe Ser Pro Thr Val Asn Thr Glu Gly Ile
-1 1 5 10
Ile Pro Ile Ser Glu Arg Pro Ser Pro Thr Gln Ser Ser Ser Ser Ser
15 20 25
Gly Pro Val Ile Pro Ala Gly Ser Tyr Val Ser Asp Phe Asp Ala Ser
30 35 40 45
Gly Leu Ala Asn Leu Trp Ser Gln Val Glu Val Asp Ile Pro Val Glu
50 55 60
Ser Pro Arg Ile Ser Ala Val Pro Pro Leu Asn Lys Thr Phe Ser Val
65 70 75
Pro Lys Thr Pro Val Leu Pro Asn Ser Leu Gln Asp His Leu Pro Lys
80 85 90
Asp Val Lys Ala Pro Glu Gly Phe Ala Trp Gly Val Ala Ser Val Ala
95 100 105
Gln Gln Tyr Glu Gly Ala Val Lys Ala Asp Gly Arg Gly Pro Ser His
110 115 120 125
Trp Asp Phe Leu Cys His Arg Asn Pro Ser Ser Cys Thr Asn Tyr Thr
130 135 140
Ser Asp Ile Thr Asp Leu Gly Arg Tyr Tyr Tyr Lys Asn Asp Leu Ala
145 150 155
Arg Met Ala Ala Met Gly Ile Thr His Tyr Ser Phe Ser Val Ser Trp
160 165 170
Thr Arg Val Val Pro Phe Gly Lys Lys Gly Ser Pro Val Ser Asn Glu
175 180 185
Gly Leu Asp Tyr Tyr Glu Asp Ile Cys Lys Thr Ala Leu Ser Phe Gly
190 195 200 205
Ile Lys Pro Val Ile Thr Leu Phe His Trp Asp Thr Pro Ala Asn Leu
210 215 220
Leu Phe Glu Tyr Gly Gly Phe Leu Asn Gly Thr Ile Val Asp Asp Tyr
225 230 235
Tyr Tyr Tyr Ala Asp Ile Val Phe Arg Arg Leu Gly Lys Tyr Ala Glu
240 245 250
Thr Phe Phe Thr Phe Asn Glu Pro Arg Val Tyr Cys Ser Glu Tyr Thr
255 260 265
Gly Pro Pro Phe Asp Ala Tyr Tyr Glu Arg Tyr Gly Leu Asn Ser Ser
270 275 280 285
Thr Ala Pro Tyr Pro Cys Ser Tyr Asn Leu Leu Arg Ala His Gly Ala
290 295 300
Ala Val Gly Arg Tyr Arg Ala Leu Val Lys Glu Gly Ser Ile Lys Ser
305 310 315
Gly Glu Ile Ala Phe Lys Asn Asp Asp Ser Tyr Gln Leu Pro Gln Asn
320 325 330
Pro Asp Ser Asp Ala Asp Lys Arg Ala Ala Lys Arg His Phe Asp Phe
335 340 345
Tyr Ile Gly Ile Phe Ser Gln Pro Val Tyr Gly Asn Gly Tyr Tyr Pro
350 355 360 365
Glu Thr Val Arg Asn Thr Ile Ser Glu Arg Phe Leu Pro Glu Phe Thr
370 375 380
Ala Ala Glu Arg Glu Gln Ile Gln Gly Ser Ala Asp Phe Tyr Ala Ile
385 390 395
Asp Gly Tyr Arg Thr Asn Ile Ala Ser Ala Ala Pro Asn Gly Ile Asp
400 405 410
Ala Cys Leu Arg Asn Ala Ser Asp Pro Asn Trp Pro Val Cys Gln Asp
415 420 425
Asn Ser Asn Thr Gly Gln Tyr Ala Thr Leu Glu Gly Phe Ala Leu Gly
430 435 440 445
Pro Pro Ala Asp Pro Asn Ala Asn Trp Leu Tyr Asn Thr Ala Pro Tyr
450 455 460
Leu Arg Tyr Gln Phe Lys Val Leu Lys Glu Asn Phe Asn Tyr Lys Lys
465 470 475
Ile Tyr Leu Thr Glu Phe Gly Phe Ala Glu Pro Phe Ser Tyr Leu Arg
480 485 490
Gln Asp Leu Tyr Ala Leu Leu Tyr Asp Thr Asp Arg Thr Ala Tyr Tyr
495 500 505
Gln Asp Tyr Leu Ala Gln Cys Met Leu Ala Ile Lys Glu Asp Gly Ile
510 515 520 525
Pro Leu Ala Gly Val Phe Ala Trp Ser Phe Val Asp Asn Phe Glu Trp
530 535 540
Gly Ser Gly Leu Glu Gln Arg Phe Gly Met Gln Tyr Val Asn Tyr Thr
545 550 555
Asp Pro Asp Leu Pro Arg Thr Phe Lys Leu Ser Phe Leu Ala Tyr Arg
560 565 570
Asp Phe Ile Lys Asn His Lys Lys
575 580
<210> 15
<211> 1809
<212> DNA
<213> Artificial Sequence
<220>
<223> Beta-galactosidase
<220>
<221> CDS
<222> (1)..(1809)
<220>
<221> sig_peptide
<222> (1)..(63)
<220>
<221> mat_peptide
<222> (64)..(1806)
<400> 15
atg atg gtc gcg tgg tgg tct cta ttt ctg tac ggc ctt cag gtc gcg 48
Met Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala
-20 -15 -10
gca cct gct ttg gct gct ccg cag ttt agc ccc aca gtc aat acg gaa 96
Ala Pro Ala Leu Ala Ala Pro Gln Phe Ser Pro Thr Val Asn Thr Glu
-5 -1 1 5 10
ggt atc att cca att tcg gag cgc cct tcg cct aca caa tct tcg tcg 144
Gly Ile Ile Pro Ile Ser Glu Arg Pro Ser Pro Thr Gln Ser Ser Ser
15 20 25
tcc agc gga ccc gtg att cca gct ggc tca tat gtc tcc gac ttt gat 192
Ser Ser Gly Pro Val Ile Pro Ala Gly Ser Tyr Val Ser Asp Phe Asp
30 35 40
gcc agc gga ctt gca aac tta tgg agc caa gtc gaa gta gac ata cct 240
Ala Ser Gly Leu Ala Asn Leu Trp Ser Gln Val Glu Val Asp Ile Pro
45 50 55
gtc gag tct cca agg att tct gcc gta cct cct ctc aac aaa acg ttc 288
Val Glu Ser Pro Arg Ile Ser Ala Val Pro Pro Leu Asn Lys Thr Phe
60 65 70 75
agt gtt ccg aaa act cca gtc ctg ccc aac tcc ctg cag gat cac ctt 336
Ser Val Pro Lys Thr Pro Val Leu Pro Asn Ser Leu Gln Asp His Leu
80 85 90
cca aaa gat gtc aaa gca ccc gaa ggc ttt gca tgg ggc gtg gcc tcc 384
Pro Lys Asp Val Lys Ala Pro Glu Gly Phe Ala Trp Gly Val Ala Ser
95 100 105
gtt gct cag cag tac gag ggt gcc gtc aaa gca gat gga cga gga cca 432
Val Ala Gln Gln Tyr Glu Gly Ala Val Lys Ala Asp Gly Arg Gly Pro
110 115 120
tct cat tgg gat ttc ctt tgc cat aga aac cct tcc agc tgc aca aac 480
Ser His Trp Asp Phe Leu Cys His Arg Asn Pro Ser Ser Cys Thr Asn
125 130 135
tac acc agt gat atc act gat ctt ggc cgt tac tac tat aag aat gac 528
Tyr Thr Ser Asp Ile Thr Asp Leu Gly Arg Tyr Tyr Tyr Lys Asn Asp
140 145 150 155
ttg gca cga atg gct gcc atg ggt ata act cac tac tca ttt tca gtg 576
Leu Ala Arg Met Ala Ala Met Gly Ile Thr His Tyr Ser Phe Ser Val
160 165 170
agc tgg acc aga gtt gtg cca ttc ggc aag aag ggc agt cca gtc agc 624
Ser Trp Thr Arg Val Val Pro Phe Gly Lys Lys Gly Ser Pro Val Ser
175 180 185
aac gaa ggc ctc gac tat tac gaa gat atc tgc aag acg gct ttg agc 672
Asn Glu Gly Leu Asp Tyr Tyr Glu Asp Ile Cys Lys Thr Ala Leu Ser
190 195 200
ttt gga atc aag cct gtc att act tta ttc cac tgg gat act cct gcc 720
Phe Gly Ile Lys Pro Val Ile Thr Leu Phe His Trp Asp Thr Pro Ala
205 210 215
aac tta ctc ttc gaa tat gga ggt ttc ctc aac ggg aca atc gta gat 768
Asn Leu Leu Phe Glu Tyr Gly Gly Phe Leu Asn Gly Thr Ile Val Asp
220 225 230 235
gac tac tac tat tat gca gat ata gta ttc aga aga cta ggc aaa tat 816
Asp Tyr Tyr Tyr Tyr Ala Asp Ile Val Phe Arg Arg Leu Gly Lys Tyr
240 245 250
gcc gaa acc ttc ttc acc ttc aat gag cct cgt gta tac tgc agc gag 864
Ala Glu Thr Phe Phe Thr Phe Asn Glu Pro Arg Val Tyr Cys Ser Glu
255 260 265
tat act ggt cct ccg ttc gat gcc tat tac gaa cgc tat ggg ctg aat 912
Tyr Thr Gly Pro Pro Phe Asp Ala Tyr Tyr Glu Arg Tyr Gly Leu Asn
270 275 280
tct agc act gca cca tat ccc tgc tcg tac aat ctg ctc cga gcc cat 960
Ser Ser Thr Ala Pro Tyr Pro Cys Ser Tyr Asn Leu Leu Arg Ala His
285 290 295
ggt gcc gca gtc ggc agg tat cgt gcc ctg gtc aaa gaa ggc agc atc 1008
Gly Ala Ala Val Gly Arg Tyr Arg Ala Leu Val Lys Glu Gly Ser Ile
300 305 310 315
aaa tct ggt gaa atc gca ttc aaa aac gac gat agt tac cag cta cct 1056
Lys Ser Gly Glu Ile Ala Phe Lys Asn Asp Asp Ser Tyr Gln Leu Pro
320 325 330
caa aat cca gac tct gac gcc gac aag cga gct gca aaa cgc cac ttc 1104
Gln Asn Pro Asp Ser Asp Ala Asp Lys Arg Ala Ala Lys Arg His Phe
335 340 345
gac ttc tac atc ggc ata ttc tcg caa ccc gta tac ggc aac ggc tac 1152
Asp Phe Tyr Ile Gly Ile Phe Ser Gln Pro Val Tyr Gly Asn Gly Tyr
350 355 360
tat ccc gaa acc gtc cgg aac aca att tca gag cgc ttc ctc cca gag 1200
Tyr Pro Glu Thr Val Arg Asn Thr Ile Ser Glu Arg Phe Leu Pro Glu
365 370 375
ttc acc gca gcc gag cgc gaa caa att cag gga tca gcg gac ttc tac 1248
Phe Thr Ala Ala Glu Arg Glu Gln Ile Gln Gly Ser Ala Asp Phe Tyr
380 385 390 395
gcc atc gac ggt tat agg acg aat atc gca agc gct gct ccc aat ggt 1296
Ala Ile Asp Gly Tyr Arg Thr Asn Ile Ala Ser Ala Ala Pro Asn Gly
400 405 410
att gac gcg tgc ttg aga aac gct agt gat ccc aac tgg cca gtt tgc 1344
Ile Asp Ala Cys Leu Arg Asn Ala Ser Asp Pro Asn Trp Pro Val Cys
415 420 425
cag gac aac agt aac aca ggc caa tac gct act ctt gag gga ttc gca 1392
Gln Asp Asn Ser Asn Thr Gly Gln Tyr Ala Thr Leu Glu Gly Phe Ala
430 435 440
ttg gga cct cct gca gat ccc aac gcg aat tgg cta tac aac act gca 1440
Leu Gly Pro Pro Ala Asp Pro Asn Ala Asn Trp Leu Tyr Asn Thr Ala
445 450 455
cct tac ctg cgt tac caa ttc aaa gtt ctg aaa gag aac ttc aat tac 1488
Pro Tyr Leu Arg Tyr Gln Phe Lys Val Leu Lys Glu Asn Phe Asn Tyr
460 465 470 475
aag aag atc tac ttg acg gaa ttc ggc ttt gca gaa cct ttt agc tat 1536
Lys Lys Ile Tyr Leu Thr Glu Phe Gly Phe Ala Glu Pro Phe Ser Tyr
480 485 490
ttg cga cag gat ctg tat gca ttg ctg tat gac act gat cgc act gca 1584
Leu Arg Gln Asp Leu Tyr Ala Leu Leu Tyr Asp Thr Asp Arg Thr Ala
495 500 505
tat tat caa gac tat cta gcg cag tgc atg ctg gct atc aaa gaa gat 1632
Tyr Tyr Gln Asp Tyr Leu Ala Gln Cys Met Leu Ala Ile Lys Glu Asp
510 515 520
ggc atc cct ctt gct ggt gtt ttc gca tgg tca ttt gtt gat aac ttc 1680
Gly Ile Pro Leu Ala Gly Val Phe Ala Trp Ser Phe Val Asp Asn Phe
525 530 535
gaa tgg ggt tcc ggt ctt gag cag aga ttt gga atg caa tat gtc aac 1728
Glu Trp Gly Ser Gly Leu Glu Gln Arg Phe Gly Met Gln Tyr Val Asn
540 545 550 555
tac acc gat ccg gat ctc cca cga acc ttc aag ctt tct ttc ctg gca 1776
Tyr Thr Asp Pro Asp Leu Pro Arg Thr Phe Lys Leu Ser Phe Leu Ala
560 565 570
tat cgt gat ttc atc aaa aac cac aaa aag tga 1809
Tyr Arg Asp Phe Ile Lys Asn His Lys Lys
575 580
<210> 16
<211> 602
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 16
Met Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala
-20 -15 -10
Ala Pro Ala Leu Ala Ala Pro Gln Phe Ser Pro Thr Val Asn Thr Glu
-5 -1 1 5 10
Gly Ile Ile Pro Ile Ser Glu Arg Pro Ser Pro Thr Gln Ser Ser Ser
15 20 25
Ser Ser Gly Pro Val Ile Pro Ala Gly Ser Tyr Val Ser Asp Phe Asp
30 35 40
Ala Ser Gly Leu Ala Asn Leu Trp Ser Gln Val Glu Val Asp Ile Pro
45 50 55
Val Glu Ser Pro Arg Ile Ser Ala Val Pro Pro Leu Asn Lys Thr Phe
60 65 70 75
Ser Val Pro Lys Thr Pro Val Leu Pro Asn Ser Leu Gln Asp His Leu
80 85 90
Pro Lys Asp Val Lys Ala Pro Glu Gly Phe Ala Trp Gly Val Ala Ser
95 100 105
Val Ala Gln Gln Tyr Glu Gly Ala Val Lys Ala Asp Gly Arg Gly Pro
110 115 120
Ser His Trp Asp Phe Leu Cys His Arg Asn Pro Ser Ser Cys Thr Asn
125 130 135
Tyr Thr Ser Asp Ile Thr Asp Leu Gly Arg Tyr Tyr Tyr Lys Asn Asp
140 145 150 155
Leu Ala Arg Met Ala Ala Met Gly Ile Thr His Tyr Ser Phe Ser Val
160 165 170
Ser Trp Thr Arg Val Val Pro Phe Gly Lys Lys Gly Ser Pro Val Ser
175 180 185
Asn Glu Gly Leu Asp Tyr Tyr Glu Asp Ile Cys Lys Thr Ala Leu Ser
190 195 200
Phe Gly Ile Lys Pro Val Ile Thr Leu Phe His Trp Asp Thr Pro Ala
205 210 215
Asn Leu Leu Phe Glu Tyr Gly Gly Phe Leu Asn Gly Thr Ile Val Asp
220 225 230 235
Asp Tyr Tyr Tyr Tyr Ala Asp Ile Val Phe Arg Arg Leu Gly Lys Tyr
240 245 250
Ala Glu Thr Phe Phe Thr Phe Asn Glu Pro Arg Val Tyr Cys Ser Glu
255 260 265
Tyr Thr Gly Pro Pro Phe Asp Ala Tyr Tyr Glu Arg Tyr Gly Leu Asn
270 275 280
Ser Ser Thr Ala Pro Tyr Pro Cys Ser Tyr Asn Leu Leu Arg Ala His
285 290 295
Gly Ala Ala Val Gly Arg Tyr Arg Ala Leu Val Lys Glu Gly Ser Ile
300 305 310 315
Lys Ser Gly Glu Ile Ala Phe Lys Asn Asp Asp Ser Tyr Gln Leu Pro
320 325 330
Gln Asn Pro Asp Ser Asp Ala Asp Lys Arg Ala Ala Lys Arg His Phe
335 340 345
Asp Phe Tyr Ile Gly Ile Phe Ser Gln Pro Val Tyr Gly Asn Gly Tyr
350 355 360
Tyr Pro Glu Thr Val Arg Asn Thr Ile Ser Glu Arg Phe Leu Pro Glu
365 370 375
Phe Thr Ala Ala Glu Arg Glu Gln Ile Gln Gly Ser Ala Asp Phe Tyr
380 385 390 395
Ala Ile Asp Gly Tyr Arg Thr Asn Ile Ala Ser Ala Ala Pro Asn Gly
400 405 410
Ile Asp Ala Cys Leu Arg Asn Ala Ser Asp Pro Asn Trp Pro Val Cys
415 420 425
Gln Asp Asn Ser Asn Thr Gly Gln Tyr Ala Thr Leu Glu Gly Phe Ala
430 435 440
Leu Gly Pro Pro Ala Asp Pro Asn Ala Asn Trp Leu Tyr Asn Thr Ala
445 450 455
Pro Tyr Leu Arg Tyr Gln Phe Lys Val Leu Lys Glu Asn Phe Asn Tyr
460 465 470 475
Lys Lys Ile Tyr Leu Thr Glu Phe Gly Phe Ala Glu Pro Phe Ser Tyr
480 485 490
Leu Arg Gln Asp Leu Tyr Ala Leu Leu Tyr Asp Thr Asp Arg Thr Ala
495 500 505
Tyr Tyr Gln Asp Tyr Leu Ala Gln Cys Met Leu Ala Ile Lys Glu Asp
510 515 520
Gly Ile Pro Leu Ala Gly Val Phe Ala Trp Ser Phe Val Asp Asn Phe
525 530 535
Glu Trp Gly Ser Gly Leu Glu Gln Arg Phe Gly Met Gln Tyr Val Asn
540 545 550 555
Tyr Thr Asp Pro Asp Leu Pro Arg Thr Phe Lys Leu Ser Phe Leu Ala
560 565 570
Tyr Arg Asp Phe Ile Lys Asn His Lys Lys
575 580
<210> 17
<211> 1809
<212> DNA
<213> Artificial Sequence
<220>
<223> Beta-galactosidase
<220>
<221> CDS
<222> (1)..(1809)
<220>
<221> sig_peptide
<222> (1)..(63)
<220>
<221> mat_peptide
<222> (64)..(1806)
<400> 17
atg atg gtc gcg tgg tgg tct cta ttt ctg tac ggc ctt cag gtc gcg 48
Met Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala
-20 -15 -10
gca cct gct ttg gct gcg cca cag ttc tcg cca aca gtc aac acc gaa 96
Ala Pro Ala Leu Ala Ala Pro Gln Phe Ser Pro Thr Val Asn Thr Glu
-5 -1 1 5 10
ggc atc atc ccc atc agc gag cgg cca agc ccg aca cag agc tcc tct 144
Gly Ile Ile Pro Ile Ser Glu Arg Pro Ser Pro Thr Gln Ser Ser Ser
15 20 25
tct tct ggg ccc gtg atc cca gcg ggt tcc tat gtc agc gac ttc gat 192
Ser Ser Gly Pro Val Ile Pro Ala Gly Ser Tyr Val Ser Asp Phe Asp
30 35 40
gcc agc ggg ttg gcg aac ctt tgg tcg cag gtt gaa gtg gac att ccg 240
Ala Ser Gly Leu Ala Asn Leu Trp Ser Gln Val Glu Val Asp Ile Pro
45 50 55
gtt gag tct cca cgc att tcg gcc gtt cct ccg ctg aac aag acc ttc 288
Val Glu Ser Pro Arg Ile Ser Ala Val Pro Pro Leu Asn Lys Thr Phe
60 65 70 75
tcg gtt ccg aag act cca gtt ctc ccc aat tcg ctt caa gac cat ctg 336
Ser Val Pro Lys Thr Pro Val Leu Pro Asn Ser Leu Gln Asp His Leu
80 85 90
ccc aag gat gtg aaa gct cct gag ggc ttt gcc tgg gga gtg gcg tcc 384
Pro Lys Asp Val Lys Ala Pro Glu Gly Phe Ala Trp Gly Val Ala Ser
95 100 105
gtg gca cag caa tac gag ggc gca gtc aaa gca gac gga cga ggc cct 432
Val Ala Gln Gln Tyr Glu Gly Ala Val Lys Ala Asp Gly Arg Gly Pro
110 115 120
tct cac tgg gac ttc ctg tgc cat cgc aac ccc tcc tct tgt acc aac 480
Ser His Trp Asp Phe Leu Cys His Arg Asn Pro Ser Ser Cys Thr Asn
125 130 135
tac acc tct gac atc act gat ctg ggc cgc tac tac tac aag aac gat 528
Tyr Thr Ser Asp Ile Thr Asp Leu Gly Arg Tyr Tyr Tyr Lys Asn Asp
140 145 150 155
ctc gcc cgt atg gcc gca atg ggg atc act cac tac tcc ttt tcg gtg 576
Leu Ala Arg Met Ala Ala Met Gly Ile Thr His Tyr Ser Phe Ser Val
160 165 170
tct tgg acc cga gtt gtc ccc ttc ggc aag aag ggt tcg cct gtt tcc 624
Ser Trp Thr Arg Val Val Pro Phe Gly Lys Lys Gly Ser Pro Val Ser
175 180 185
aac gag gga ttg gac tac tac gag gac atc tgc aag act gcc ctc tct 672
Asn Glu Gly Leu Asp Tyr Tyr Glu Asp Ile Cys Lys Thr Ala Leu Ser
190 195 200
ttc ggc atc aag ccc gtc atc acg ctg ttc cac tgg gat acc ccg gca 720
Phe Gly Ile Lys Pro Val Ile Thr Leu Phe His Trp Asp Thr Pro Ala
205 210 215
aac ctc ctg ttt gag tat gga ggt ttc ctc aat ggc acg atc gtc gat 768
Asn Leu Leu Phe Glu Tyr Gly Gly Phe Leu Asn Gly Thr Ile Val Asp
220 225 230 235
gac tac tac tac tac gcc gac att gtc ttc cgg cgg ttg ggc aag tac 816
Asp Tyr Tyr Tyr Tyr Ala Asp Ile Val Phe Arg Arg Leu Gly Lys Tyr
240 245 250
gcg gag acg ttc ttc acg ttc aac gag cca cgc gtc tac tgc agc gag 864
Ala Glu Thr Phe Phe Thr Phe Asn Glu Pro Arg Val Tyr Cys Ser Glu
255 260 265
tac act ggt cct ccc ttc gat gcc tac tac gag cga tac ggc ctc aac 912
Tyr Thr Gly Pro Pro Phe Asp Ala Tyr Tyr Glu Arg Tyr Gly Leu Asn
270 275 280
tcc tcg act gcc cca tac cct tgt tcg tac aac ctt ttg cgc gct cat 960
Ser Ser Thr Ala Pro Tyr Pro Cys Ser Tyr Asn Leu Leu Arg Ala His
285 290 295
ggc gcc gct gtc ggg cga tac cgc gcc ctt gtc aag gag ggc tcc atc 1008
Gly Ala Ala Val Gly Arg Tyr Arg Ala Leu Val Lys Glu Gly Ser Ile
300 305 310 315
aag tcc ggt gag att gcg ttc aag aac gat gac agc tat cag ctt cct 1056
Lys Ser Gly Glu Ile Ala Phe Lys Asn Asp Asp Ser Tyr Gln Leu Pro
320 325 330
cag aat cct gat tcc gat gca gac aaa cgg gca gca aaa cgt cac ttt 1104
Gln Asn Pro Asp Ser Asp Ala Asp Lys Arg Ala Ala Lys Arg His Phe
335 340 345
gac ttc tac atc ggg atc ttc tcc caa ccg gtt tac gga aat ggg tac 1152
Asp Phe Tyr Ile Gly Ile Phe Ser Gln Pro Val Tyr Gly Asn Gly Tyr
350 355 360
tac ccg gaa aca gtg cgt aac aca atc tcc gaa cgc ttc ctg cct gag 1200
Tyr Pro Glu Thr Val Arg Asn Thr Ile Ser Glu Arg Phe Leu Pro Glu
365 370 375
ttc acc gct gct gaa cgc gag cag att cag ggt agc gcc gac ttc tac 1248
Phe Thr Ala Ala Glu Arg Glu Gln Ile Gln Gly Ser Ala Asp Phe Tyr
380 385 390 395
gcg atc gat gga tat cgg acc aac atc gca tct gca gcc ccg aat ggg 1296
Ala Ile Asp Gly Tyr Arg Thr Asn Ile Ala Ser Ala Ala Pro Asn Gly
400 405 410
att gac gct tgc ttg cgt aac gct agc gac cct aac tgg ccg gtg tgc 1344
Ile Asp Ala Cys Leu Arg Asn Ala Ser Asp Pro Asn Trp Pro Val Cys
415 420 425
caa gac aac tcg aac aca ggc cag tat gcc acc ctg gaa ggt ttt gca 1392
Gln Asp Asn Ser Asn Thr Gly Gln Tyr Ala Thr Leu Glu Gly Phe Ala
430 435 440
ttg ggg cct ccc gca gac cca aat gcc aac tgg ctg tac aac acg gcg 1440
Leu Gly Pro Pro Ala Asp Pro Asn Ala Asn Trp Leu Tyr Asn Thr Ala
445 450 455
ccg tat ctc cga tac caa ttc aag gtc ttg aag gag aac ttc aac tac 1488
Pro Tyr Leu Arg Tyr Gln Phe Lys Val Leu Lys Glu Asn Phe Asn Tyr
460 465 470 475
aag aag atc tac ctg acc gaa ttc ggg ttt gct gag cct ttc tcc tat 1536
Lys Lys Ile Tyr Leu Thr Glu Phe Gly Phe Ala Glu Pro Phe Ser Tyr
480 485 490
ctg cgc caa gac ctg tat gcg ctt ctc tac gat act gat cga acc gct 1584
Leu Arg Gln Asp Leu Tyr Ala Leu Leu Tyr Asp Thr Asp Arg Thr Ala
495 500 505
tac tac cag gat tac ctg gcg cag tgc atg ctg gcc atc aag gag gac 1632
Tyr Tyr Gln Asp Tyr Leu Ala Gln Cys Met Leu Ala Ile Lys Glu Asp
510 515 520
ggt atc cca ttg gcc ggc gtc ttt gct tgg tcc ttc gtt gac aac ttc 1680
Gly Ile Pro Leu Ala Gly Val Phe Ala Trp Ser Phe Val Asp Asn Phe
525 530 535
gag tgg ggt tcg gga ttg gaa cag cgc ttt ggc atg cag tat gtg aac 1728
Glu Trp Gly Ser Gly Leu Glu Gln Arg Phe Gly Met Gln Tyr Val Asn
540 545 550 555
tac acc gac ccc gac ttg ccc cgc aca ttc aag ctc tcc ttt ctc gcc 1776
Tyr Thr Asp Pro Asp Leu Pro Arg Thr Phe Lys Leu Ser Phe Leu Ala
560 565 570
tat cgg gac ttc atc aag aac cac aag aag taa 1809
Tyr Arg Asp Phe Ile Lys Asn His Lys Lys
575 580
<210> 18
<211> 602
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 18
Met Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala
-20 -15 -10
Ala Pro Ala Leu Ala Ala Pro Gln Phe Ser Pro Thr Val Asn Thr Glu
-5 -1 1 5 10
Gly Ile Ile Pro Ile Ser Glu Arg Pro Ser Pro Thr Gln Ser Ser Ser
15 20 25
Ser Ser Gly Pro Val Ile Pro Ala Gly Ser Tyr Val Ser Asp Phe Asp
30 35 40
Ala Ser Gly Leu Ala Asn Leu Trp Ser Gln Val Glu Val Asp Ile Pro
45 50 55
Val Glu Ser Pro Arg Ile Ser Ala Val Pro Pro Leu Asn Lys Thr Phe
60 65 70 75
Ser Val Pro Lys Thr Pro Val Leu Pro Asn Ser Leu Gln Asp His Leu
80 85 90
Pro Lys Asp Val Lys Ala Pro Glu Gly Phe Ala Trp Gly Val Ala Ser
95 100 105
Val Ala Gln Gln Tyr Glu Gly Ala Val Lys Ala Asp Gly Arg Gly Pro
110 115 120
Ser His Trp Asp Phe Leu Cys His Arg Asn Pro Ser Ser Cys Thr Asn
125 130 135
Tyr Thr Ser Asp Ile Thr Asp Leu Gly Arg Tyr Tyr Tyr Lys Asn Asp
140 145 150 155
Leu Ala Arg Met Ala Ala Met Gly Ile Thr His Tyr Ser Phe Ser Val
160 165 170
Ser Trp Thr Arg Val Val Pro Phe Gly Lys Lys Gly Ser Pro Val Ser
175 180 185
Asn Glu Gly Leu Asp Tyr Tyr Glu Asp Ile Cys Lys Thr Ala Leu Ser
190 195 200
Phe Gly Ile Lys Pro Val Ile Thr Leu Phe His Trp Asp Thr Pro Ala
205 210 215
Asn Leu Leu Phe Glu Tyr Gly Gly Phe Leu Asn Gly Thr Ile Val Asp
220 225 230 235
Asp Tyr Tyr Tyr Tyr Ala Asp Ile Val Phe Arg Arg Leu Gly Lys Tyr
240 245 250
Ala Glu Thr Phe Phe Thr Phe Asn Glu Pro Arg Val Tyr Cys Ser Glu
255 260 265
Tyr Thr Gly Pro Pro Phe Asp Ala Tyr Tyr Glu Arg Tyr Gly Leu Asn
270 275 280
Ser Ser Thr Ala Pro Tyr Pro Cys Ser Tyr Asn Leu Leu Arg Ala His
285 290 295
Gly Ala Ala Val Gly Arg Tyr Arg Ala Leu Val Lys Glu Gly Ser Ile
300 305 310 315
Lys Ser Gly Glu Ile Ala Phe Lys Asn Asp Asp Ser Tyr Gln Leu Pro
320 325 330
Gln Asn Pro Asp Ser Asp Ala Asp Lys Arg Ala Ala Lys Arg His Phe
335 340 345
Asp Phe Tyr Ile Gly Ile Phe Ser Gln Pro Val Tyr Gly Asn Gly Tyr
350 355 360
Tyr Pro Glu Thr Val Arg Asn Thr Ile Ser Glu Arg Phe Leu Pro Glu
365 370 375
Phe Thr Ala Ala Glu Arg Glu Gln Ile Gln Gly Ser Ala Asp Phe Tyr
380 385 390 395
Ala Ile Asp Gly Tyr Arg Thr Asn Ile Ala Ser Ala Ala Pro Asn Gly
400 405 410
Ile Asp Ala Cys Leu Arg Asn Ala Ser Asp Pro Asn Trp Pro Val Cys
415 420 425
Gln Asp Asn Ser Asn Thr Gly Gln Tyr Ala Thr Leu Glu Gly Phe Ala
430 435 440
Leu Gly Pro Pro Ala Asp Pro Asn Ala Asn Trp Leu Tyr Asn Thr Ala
445 450 455
Pro Tyr Leu Arg Tyr Gln Phe Lys Val Leu Lys Glu Asn Phe Asn Tyr
460 465 470 475
Lys Lys Ile Tyr Leu Thr Glu Phe Gly Phe Ala Glu Pro Phe Ser Tyr
480 485 490
Leu Arg Gln Asp Leu Tyr Ala Leu Leu Tyr Asp Thr Asp Arg Thr Ala
495 500 505
Tyr Tyr Gln Asp Tyr Leu Ala Gln Cys Met Leu Ala Ile Lys Glu Asp
510 515 520
Gly Ile Pro Leu Ala Gly Val Phe Ala Trp Ser Phe Val Asp Asn Phe
525 530 535
Glu Trp Gly Ser Gly Leu Glu Gln Arg Phe Gly Met Gln Tyr Val Asn
540 545 550 555
Tyr Thr Asp Pro Asp Leu Pro Arg Thr Phe Lys Leu Ser Phe Leu Ala
560 565 570
Tyr Arg Asp Phe Ile Lys Asn His Lys Lys
575 580
<210> 19
<211> 1785
<212> DNA
<213> Sterigmatomyces elviae
<220>
<221> CDS
<222> (1)..(1785)
<220>
<221> sig_peptide
<222> (1)..(57)
<220>
<221> mat_peptide
<222> (58)..(1782)
<400> 19
atg ctt gtc gga ctt gct ttg act gct ctg tta ggt gcc act cgt tat 48
Met Leu Val Gly Leu Ala Leu Thr Ala Leu Leu Gly Ala Thr Arg Tyr
-15 -10 -5
gtt ggc gca atc cct gct ttc cca atc act cca gat ttg gct ggt ggg 96
Val Gly Ala Ile Pro Ala Phe Pro Ile Thr Pro Asp Leu Ala Gly Gly
-1 1 5 10
ctg gag tct gtg acc aac act cag acc tcg ctc cct tca gcg agc gct 144
Leu Glu Ser Val Thr Asn Thr Gln Thr Ser Leu Pro Ser Ala Ser Ala
15 20 25
gtg tcg tcg ccc tat aat caa gat gca ctc gac aag ctg tgg gct gag 192
Val Ser Ser Pro Tyr Asn Gln Asp Ala Leu Asp Lys Leu Trp Ala Glu
30 35 40 45
gtc gaa aaa gac att cca gtc gag aca cca agc atc tcc agc gtt gtt 240
Val Glu Lys Asp Ile Pro Val Glu Thr Pro Ser Ile Ser Ser Val Val
50 55 60
cca gta aac aac agc ttt gcg gtc ccc aaa acc cct act ctg ccc cga 288
Pro Val Asn Asn Ser Phe Ala Val Pro Lys Thr Pro Thr Leu Pro Arg
65 70 75
tct ctt cag gat cat gct acc agt ggc cgc aaa ttc ccc aaa ggc ttc 336
Ser Leu Gln Asp His Ala Thr Ser Gly Arg Lys Phe Pro Lys Gly Phe
80 85 90
aag ttt ggt gtc gcc acc gcc gat cag cag tat gaa ggt gcc gtc aag 384
Lys Phe Gly Val Ala Thr Ala Asp Gln Gln Tyr Glu Gly Ala Val Lys
95 100 105
gct gat ggc cgt ggc ccc tct cac tgg gat tac ctt tgc cat cgt ctc 432
Ala Asp Gly Arg Gly Pro Ser His Trp Asp Tyr Leu Cys His Arg Leu
110 115 120 125
cca cag caa tgc aac aac tac acc tca gac atc act gac ctt ggt cgc 480
Pro Gln Gln Cys Asn Asn Tyr Thr Ser Asp Ile Thr Asp Leu Gly Arg
130 135 140
tac tat tat aag caa gat atc gca cga atc aag gcc atg gga gta aac 528
Tyr Tyr Tyr Lys Gln Asp Ile Ala Arg Ile Lys Ala Met Gly Val Asn
145 150 155
act gta tca ctc acc ctt tct tgg tca cgt atc aag ccc ttc ggc acg 576
Thr Val Ser Leu Thr Leu Ser Trp Ser Arg Ile Lys Pro Phe Gly Thr
160 165 170
gcc gat agt cct gtc agc aaa gaa gga ctc caa ttt tac gat gac ttt 624
Ala Asp Ser Pro Val Ser Lys Glu Gly Leu Gln Phe Tyr Asp Asp Phe
175 180 185
atc aac gag ctc atc gat aat ggc atc gaa cca gtc gtc acc ctg ttc 672
Ile Asn Glu Leu Ile Asp Asn Gly Ile Glu Pro Val Val Thr Leu Phe
190 195 200 205
cat tgg agt aca cca ctc aat ctg gtg ttc gaa tac ggg gcc ttc ctt 720
His Trp Ser Thr Pro Leu Asn Leu Val Phe Glu Tyr Gly Ala Phe Leu
210 215 220
aat ggc agc tcg gtt gaa gat ttc gct agc tat gct aag ctt gtt ttt 768
Asn Gly Ser Ser Val Glu Asp Phe Ala Ser Tyr Ala Lys Leu Val Phe
225 230 235
gag cat ttc ggt gac aga gta acc aca ttc ctt act ttc aac gag cct 816
Glu His Phe Gly Asp Arg Val Thr Thr Phe Leu Thr Phe Asn Glu Pro
240 245 250
cgt gta tac tgc tcc gaa tac act ggc gag cct ttt aat gat tat tgg 864
Arg Val Tyr Cys Ser Glu Tyr Thr Gly Glu Pro Phe Asn Asp Tyr Trp
255 260 265
cac ttt gga ggt ccc aac atc aat gcc acg acc gct ccc tat cct tgc 912
His Phe Gly Gly Pro Asn Ile Asn Ala Thr Thr Ala Pro Tyr Pro Cys
270 275 280 285
acc tat aac att tta aaa gca cac gga cgt gcc gtt caa gaa tac aga 960
Thr Tyr Asn Ile Leu Lys Ala His Gly Arg Ala Val Gln Glu Tyr Arg
290 295 300
gca ctg gtc aac agt gga aag atc aag aaa ggt gaa gtc gca att aaa 1008
Ala Leu Val Asn Ser Gly Lys Ile Lys Lys Gly Glu Val Ala Ile Lys
305 310 315
aac gac gat agt tat ccc gtg cca gtc aac cca gac tcc gaa gcc gat 1056
Asn Asp Asp Ser Tyr Pro Val Pro Val Asn Pro Asp Ser Glu Ala Asp
320 325 330
gta gaa gcg gcc aag cga cac ttc gat ttc tac att ggc att ttc agt 1104
Val Glu Ala Ala Lys Arg His Phe Asp Phe Tyr Ile Gly Ile Phe Ser
335 340 345
cag cct att tac ggt gat gga aag ttc cca gac acc gtt aga aac acc 1152
Gln Pro Ile Tyr Gly Asp Gly Lys Phe Pro Asp Thr Val Arg Asn Thr
350 355 360 365
atc tcc act gaa ttc ctg cca tac ctc acc gat gat gag aaa gcc atg 1200
Ile Ser Thr Glu Phe Leu Pro Tyr Leu Thr Asp Asp Glu Lys Ala Met
370 375 380
att aaa gga agt ggt gac ttt ttc gcc ata gac gca tat cga acc aac 1248
Ile Lys Gly Ser Gly Asp Phe Phe Ala Ile Asp Ala Tyr Arg Thr Asn
385 390 395
ctt gca aga gct gcg ccc aat ggc atc caa gcc tgc gta gct aac atc 1296
Leu Ala Arg Ala Ala Pro Asn Gly Ile Gln Ala Cys Val Ala Asn Ile
400 405 410
tcg gat ccc aat tgg cct gta tgc caa gac aac agc cct gaa gga caa 1344
Ser Asp Pro Asn Trp Pro Val Cys Gln Asp Asn Ser Pro Glu Gly Gln
415 420 425
tac caa acc atg gat ggc ttt gct ttc ggt ccc ccg gca gac ccc aac 1392
Tyr Gln Thr Met Asp Gly Phe Ala Phe Gly Pro Pro Ala Asp Pro Asn
430 435 440 445
gct gca tgg cta tat gac acc agc ttc aag ttg cgc tac cag ctt aag 1440
Ala Ala Trp Leu Tyr Asp Thr Ser Phe Lys Leu Arg Tyr Gln Leu Lys
450 455 460
aca ctc aaa gag gca ttc aac tat gac aag atc tac atc tca gag ttt 1488
Thr Leu Lys Glu Ala Phe Asn Tyr Asp Lys Ile Tyr Ile Ser Glu Phe
465 470 475
gga ttt gct cgg cct tac gaa tac ctc tac cct tac ggc ttc gac gtc 1536
Gly Phe Ala Arg Pro Tyr Glu Tyr Leu Tyr Pro Tyr Gly Phe Asp Val
480 485 490
ctg tac gac aca gac cgt gcc att tac tac caa gac tac atg gct gag 1584
Leu Tyr Asp Thr Asp Arg Ala Ile Tyr Tyr Gln Asp Tyr Met Ala Glu
495 500 505
gcc ttg gat gcc att cat gac gac ggc att cct ctg gct ggt gtc ttt 1632
Ala Leu Asp Ala Ile His Asp Asp Gly Ile Pro Leu Ala Gly Val Phe
510 515 520 525
gct tgg tcc ttc gtt gac aat ttc gaa tgg gct tcc ggt ctt gaa cag 1680
Ala Trp Ser Phe Val Asp Asn Phe Glu Trp Ala Ser Gly Leu Glu Gln
530 535 540
cga ttc ggc atg cag ttc gtg aac tac acg aca ctg gaa aga gag tac 1728
Arg Phe Gly Met Gln Phe Val Asn Tyr Thr Thr Leu Glu Arg Glu Tyr
545 550 555
aag ctc tcc ttc ctg ctt tat cgt gac ttc att gaa aac cac agt tgc 1776
Lys Leu Ser Phe Leu Leu Tyr Arg Asp Phe Ile Glu Asn His Ser Cys
560 565 570
gaa gat taa 1785
Glu Asp
575
<210> 20
<211> 594
<212> PRT
<213> Sterigmatomyces elviae
<400> 20
Met Leu Val Gly Leu Ala Leu Thr Ala Leu Leu Gly Ala Thr Arg Tyr
-15 -10 -5
Val Gly Ala Ile Pro Ala Phe Pro Ile Thr Pro Asp Leu Ala Gly Gly
-1 1 5 10
Leu Glu Ser Val Thr Asn Thr Gln Thr Ser Leu Pro Ser Ala Ser Ala
15 20 25
Val Ser Ser Pro Tyr Asn Gln Asp Ala Leu Asp Lys Leu Trp Ala Glu
30 35 40 45
Val Glu Lys Asp Ile Pro Val Glu Thr Pro Ser Ile Ser Ser Val Val
50 55 60
Pro Val Asn Asn Ser Phe Ala Val Pro Lys Thr Pro Thr Leu Pro Arg
65 70 75
Ser Leu Gln Asp His Ala Thr Ser Gly Arg Lys Phe Pro Lys Gly Phe
80 85 90
Lys Phe Gly Val Ala Thr Ala Asp Gln Gln Tyr Glu Gly Ala Val Lys
95 100 105
Ala Asp Gly Arg Gly Pro Ser His Trp Asp Tyr Leu Cys His Arg Leu
110 115 120 125
Pro Gln Gln Cys Asn Asn Tyr Thr Ser Asp Ile Thr Asp Leu Gly Arg
130 135 140
Tyr Tyr Tyr Lys Gln Asp Ile Ala Arg Ile Lys Ala Met Gly Val Asn
145 150 155
Thr Val Ser Leu Thr Leu Ser Trp Ser Arg Ile Lys Pro Phe Gly Thr
160 165 170
Ala Asp Ser Pro Val Ser Lys Glu Gly Leu Gln Phe Tyr Asp Asp Phe
175 180 185
Ile Asn Glu Leu Ile Asp Asn Gly Ile Glu Pro Val Val Thr Leu Phe
190 195 200 205
His Trp Ser Thr Pro Leu Asn Leu Val Phe Glu Tyr Gly Ala Phe Leu
210 215 220
Asn Gly Ser Ser Val Glu Asp Phe Ala Ser Tyr Ala Lys Leu Val Phe
225 230 235
Glu His Phe Gly Asp Arg Val Thr Thr Phe Leu Thr Phe Asn Glu Pro
240 245 250
Arg Val Tyr Cys Ser Glu Tyr Thr Gly Glu Pro Phe Asn Asp Tyr Trp
255 260 265
His Phe Gly Gly Pro Asn Ile Asn Ala Thr Thr Ala Pro Tyr Pro Cys
270 275 280 285
Thr Tyr Asn Ile Leu Lys Ala His Gly Arg Ala Val Gln Glu Tyr Arg
290 295 300
Ala Leu Val Asn Ser Gly Lys Ile Lys Lys Gly Glu Val Ala Ile Lys
305 310 315
Asn Asp Asp Ser Tyr Pro Val Pro Val Asn Pro Asp Ser Glu Ala Asp
320 325 330
Val Glu Ala Ala Lys Arg His Phe Asp Phe Tyr Ile Gly Ile Phe Ser
335 340 345
Gln Pro Ile Tyr Gly Asp Gly Lys Phe Pro Asp Thr Val Arg Asn Thr
350 355 360 365
Ile Ser Thr Glu Phe Leu Pro Tyr Leu Thr Asp Asp Glu Lys Ala Met
370 375 380
Ile Lys Gly Ser Gly Asp Phe Phe Ala Ile Asp Ala Tyr Arg Thr Asn
385 390 395
Leu Ala Arg Ala Ala Pro Asn Gly Ile Gln Ala Cys Val Ala Asn Ile
400 405 410
Ser Asp Pro Asn Trp Pro Val Cys Gln Asp Asn Ser Pro Glu Gly Gln
415 420 425
Tyr Gln Thr Met Asp Gly Phe Ala Phe Gly Pro Pro Ala Asp Pro Asn
430 435 440 445
Ala Ala Trp Leu Tyr Asp Thr Ser Phe Lys Leu Arg Tyr Gln Leu Lys
450 455 460
Thr Leu Lys Glu Ala Phe Asn Tyr Asp Lys Ile Tyr Ile Ser Glu Phe
465 470 475
Gly Phe Ala Arg Pro Tyr Glu Tyr Leu Tyr Pro Tyr Gly Phe Asp Val
480 485 490
Leu Tyr Asp Thr Asp Arg Ala Ile Tyr Tyr Gln Asp Tyr Met Ala Glu
495 500 505
Ala Leu Asp Ala Ile His Asp Asp Gly Ile Pro Leu Ala Gly Val Phe
510 515 520 525
Ala Trp Ser Phe Val Asp Asn Phe Glu Trp Ala Ser Gly Leu Glu Gln
530 535 540
Arg Phe Gly Met Gln Phe Val Asn Tyr Thr Thr Leu Glu Arg Glu Tyr
545 550 555
Lys Leu Ser Phe Leu Leu Tyr Arg Asp Phe Ile Glu Asn His Ser Cys
560 565 570
Glu Asp
575
<210> 21
<211> 1791
<212> DNA
<213> Artificial Sequence
<220>
<223> Beta-galactosidase
<220>
<221> CDS
<222> (1)..(1791)
<220>
<221> sig_peptide
<222> (1)..(63)
<220>
<221> mat_peptide
<222> (64)..(1788)
<400> 21
atg atg gtc gcg tgg tgg tct cta ttt ctg tac ggc ctt cag gtc gcg 48
Met Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala
-20 -15 -10
gca cct gct ttg gct atc cct gct ttc cca atc act cca gat ttg gct 96
Ala Pro Ala Leu Ala Ile Pro Ala Phe Pro Ile Thr Pro Asp Leu Ala
-5 -1 1 5 10
ggt ggg ctg gag tct gtg acc aac act cag acc tcg ctc cct tca gcg 144
Gly Gly Leu Glu Ser Val Thr Asn Thr Gln Thr Ser Leu Pro Ser Ala
15 20 25
agc gct gtg tcg tcg ccc tat aat caa gat gca ctc gac aag ctg tgg 192
Ser Ala Val Ser Ser Pro Tyr Asn Gln Asp Ala Leu Asp Lys Leu Trp
30 35 40
gct gag gtc gaa aaa gac att cca gtc gag aca cca agc atc tcc agc 240
Ala Glu Val Glu Lys Asp Ile Pro Val Glu Thr Pro Ser Ile Ser Ser
45 50 55
gtt gtt cca gta aac aac agc ttt gcg gtc ccc aaa acc cct act ctg 288
Val Val Pro Val Asn Asn Ser Phe Ala Val Pro Lys Thr Pro Thr Leu
60 65 70 75
ccc cga tct ctt cag gat cat gct acc agt ggc cgc aaa ttc ccc aaa 336
Pro Arg Ser Leu Gln Asp His Ala Thr Ser Gly Arg Lys Phe Pro Lys
80 85 90
ggc ttc aag ttt ggt gtc gcc acc gcc gat cag cag tat gaa ggt gcc 384
Gly Phe Lys Phe Gly Val Ala Thr Ala Asp Gln Gln Tyr Glu Gly Ala
95 100 105
gtc aag gct gat ggc cgt ggc ccc tct cac tgg gat tac ctt tgc cat 432
Val Lys Ala Asp Gly Arg Gly Pro Ser His Trp Asp Tyr Leu Cys His
110 115 120
cgt ctc cca cag caa tgc aac aac tac acc tca gac atc act gac ctt 480
Arg Leu Pro Gln Gln Cys Asn Asn Tyr Thr Ser Asp Ile Thr Asp Leu
125 130 135
ggt cgc tac tat tat aag caa gat atc gca cga atc aag gcc atg gga 528
Gly Arg Tyr Tyr Tyr Lys Gln Asp Ile Ala Arg Ile Lys Ala Met Gly
140 145 150 155
gta aac act gta tca ctc acc ctt tct tgg tca cgt atc aag ccc ttc 576
Val Asn Thr Val Ser Leu Thr Leu Ser Trp Ser Arg Ile Lys Pro Phe
160 165 170
ggc acg gcc gat agt cct gtc agc aaa gaa gga ctc caa ttt tac gat 624
Gly Thr Ala Asp Ser Pro Val Ser Lys Glu Gly Leu Gln Phe Tyr Asp
175 180 185
gac ttt atc aac gag ctc atc gat aat ggc atc gaa cca gtc gtc acc 672
Asp Phe Ile Asn Glu Leu Ile Asp Asn Gly Ile Glu Pro Val Val Thr
190 195 200
ctg ttc cat tgg agt aca cca ctc aat ctg gtg ttc gaa tac ggg gcc 720
Leu Phe His Trp Ser Thr Pro Leu Asn Leu Val Phe Glu Tyr Gly Ala
205 210 215
ttc ctt aat ggc agc tcg gtt gaa gat ttc gct agc tat gct aag ctt 768
Phe Leu Asn Gly Ser Ser Val Glu Asp Phe Ala Ser Tyr Ala Lys Leu
220 225 230 235
gtt ttt gag cat ttc ggt gac aga gta acc aca ttc ctt act ttc aac 816
Val Phe Glu His Phe Gly Asp Arg Val Thr Thr Phe Leu Thr Phe Asn
240 245 250
gag cct cgt gta tac tgc tcc gaa tac act ggc gag cct ttt aat gat 864
Glu Pro Arg Val Tyr Cys Ser Glu Tyr Thr Gly Glu Pro Phe Asn Asp
255 260 265
tat tgg cac ttt gga ggt ccc aac atc aat gcc acg acc gct ccc tat 912
Tyr Trp His Phe Gly Gly Pro Asn Ile Asn Ala Thr Thr Ala Pro Tyr
270 275 280
cct tgc acc tat aac att tta aaa gca cac gga cgt gcc gtt caa gaa 960
Pro Cys Thr Tyr Asn Ile Leu Lys Ala His Gly Arg Ala Val Gln Glu
285 290 295
tac aga gca ctg gtc aac agt gga aag atc aag aaa ggt gaa gtc gca 1008
Tyr Arg Ala Leu Val Asn Ser Gly Lys Ile Lys Lys Gly Glu Val Ala
300 305 310 315
att aaa aac gac gat agt tat ccc gtg cca gtc aac cca gac tcc gaa 1056
Ile Lys Asn Asp Asp Ser Tyr Pro Val Pro Val Asn Pro Asp Ser Glu
320 325 330
gcc gat gta gaa gcg gcc aag cga cac ttc gat ttc tac att ggc att 1104
Ala Asp Val Glu Ala Ala Lys Arg His Phe Asp Phe Tyr Ile Gly Ile
335 340 345
ttc agt cag cct att tac ggt gat gga aag ttc cca gac acc gtt aga 1152
Phe Ser Gln Pro Ile Tyr Gly Asp Gly Lys Phe Pro Asp Thr Val Arg
350 355 360
aac acc atc tcc act gaa ttc ctg cca tac ctc acc gat gat gag aaa 1200
Asn Thr Ile Ser Thr Glu Phe Leu Pro Tyr Leu Thr Asp Asp Glu Lys
365 370 375
gcc atg att aaa gga agt ggt gac ttt ttc gcc ata gac gca tat cga 1248
Ala Met Ile Lys Gly Ser Gly Asp Phe Phe Ala Ile Asp Ala Tyr Arg
380 385 390 395
acc aac ctt gca aga gct gcg ccc aat ggc atc caa gcc tgc gta gct 1296
Thr Asn Leu Ala Arg Ala Ala Pro Asn Gly Ile Gln Ala Cys Val Ala
400 405 410
aac atc tcg gat ccc aat tgg cct gta tgc caa gac aac agc cct gaa 1344
Asn Ile Ser Asp Pro Asn Trp Pro Val Cys Gln Asp Asn Ser Pro Glu
415 420 425
gga caa tac caa acc atg gat ggc ttt gct ttc ggt ccc ccg gca gac 1392
Gly Gln Tyr Gln Thr Met Asp Gly Phe Ala Phe Gly Pro Pro Ala Asp
430 435 440
ccc aac gct gca tgg cta tat gac acc agc ttc aag ttg cgc tac cag 1440
Pro Asn Ala Ala Trp Leu Tyr Asp Thr Ser Phe Lys Leu Arg Tyr Gln
445 450 455
ctt aag aca ctc aaa gag gca ttc aac tat gac aag atc tac atc tca 1488
Leu Lys Thr Leu Lys Glu Ala Phe Asn Tyr Asp Lys Ile Tyr Ile Ser
460 465 470 475
gag ttt gga ttt gct cgg cct tac gaa tac ctc tac cct tac ggc ttc 1536
Glu Phe Gly Phe Ala Arg Pro Tyr Glu Tyr Leu Tyr Pro Tyr Gly Phe
480 485 490
gac gtc ctg tac gac aca gac cgt gcc att tac tac caa gac tac atg 1584
Asp Val Leu Tyr Asp Thr Asp Arg Ala Ile Tyr Tyr Gln Asp Tyr Met
495 500 505
gct gag gcc ttg gat gcc att cat gac gac ggc att cct ctg gct ggt 1632
Ala Glu Ala Leu Asp Ala Ile His Asp Asp Gly Ile Pro Leu Ala Gly
510 515 520
gtc ttt gct tgg tcc ttc gtt gac aat ttc gaa tgg gct tcc ggt ctt 1680
Val Phe Ala Trp Ser Phe Val Asp Asn Phe Glu Trp Ala Ser Gly Leu
525 530 535
gaa cag cga ttc ggc atg cag ttc gtg aac tac acg aca ctg gaa aga 1728
Glu Gln Arg Phe Gly Met Gln Phe Val Asn Tyr Thr Thr Leu Glu Arg
540 545 550 555
gag tac aag ctc tcc ttc ctg ctt tat cgt gac ttc att gaa aac cac 1776
Glu Tyr Lys Leu Ser Phe Leu Leu Tyr Arg Asp Phe Ile Glu Asn His
560 565 570
agt tgc gaa gat taa 1791
Ser Cys Glu Asp
575
<210> 22
<211> 596
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 22
Met Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala
-20 -15 -10
Ala Pro Ala Leu Ala Ile Pro Ala Phe Pro Ile Thr Pro Asp Leu Ala
-5 -1 1 5 10
Gly Gly Leu Glu Ser Val Thr Asn Thr Gln Thr Ser Leu Pro Ser Ala
15 20 25
Ser Ala Val Ser Ser Pro Tyr Asn Gln Asp Ala Leu Asp Lys Leu Trp
30 35 40
Ala Glu Val Glu Lys Asp Ile Pro Val Glu Thr Pro Ser Ile Ser Ser
45 50 55
Val Val Pro Val Asn Asn Ser Phe Ala Val Pro Lys Thr Pro Thr Leu
60 65 70 75
Pro Arg Ser Leu Gln Asp His Ala Thr Ser Gly Arg Lys Phe Pro Lys
80 85 90
Gly Phe Lys Phe Gly Val Ala Thr Ala Asp Gln Gln Tyr Glu Gly Ala
95 100 105
Val Lys Ala Asp Gly Arg Gly Pro Ser His Trp Asp Tyr Leu Cys His
110 115 120
Arg Leu Pro Gln Gln Cys Asn Asn Tyr Thr Ser Asp Ile Thr Asp Leu
125 130 135
Gly Arg Tyr Tyr Tyr Lys Gln Asp Ile Ala Arg Ile Lys Ala Met Gly
140 145 150 155
Val Asn Thr Val Ser Leu Thr Leu Ser Trp Ser Arg Ile Lys Pro Phe
160 165 170
Gly Thr Ala Asp Ser Pro Val Ser Lys Glu Gly Leu Gln Phe Tyr Asp
175 180 185
Asp Phe Ile Asn Glu Leu Ile Asp Asn Gly Ile Glu Pro Val Val Thr
190 195 200
Leu Phe His Trp Ser Thr Pro Leu Asn Leu Val Phe Glu Tyr Gly Ala
205 210 215
Phe Leu Asn Gly Ser Ser Val Glu Asp Phe Ala Ser Tyr Ala Lys Leu
220 225 230 235
Val Phe Glu His Phe Gly Asp Arg Val Thr Thr Phe Leu Thr Phe Asn
240 245 250
Glu Pro Arg Val Tyr Cys Ser Glu Tyr Thr Gly Glu Pro Phe Asn Asp
255 260 265
Tyr Trp His Phe Gly Gly Pro Asn Ile Asn Ala Thr Thr Ala Pro Tyr
270 275 280
Pro Cys Thr Tyr Asn Ile Leu Lys Ala His Gly Arg Ala Val Gln Glu
285 290 295
Tyr Arg Ala Leu Val Asn Ser Gly Lys Ile Lys Lys Gly Glu Val Ala
300 305 310 315
Ile Lys Asn Asp Asp Ser Tyr Pro Val Pro Val Asn Pro Asp Ser Glu
320 325 330
Ala Asp Val Glu Ala Ala Lys Arg His Phe Asp Phe Tyr Ile Gly Ile
335 340 345
Phe Ser Gln Pro Ile Tyr Gly Asp Gly Lys Phe Pro Asp Thr Val Arg
350 355 360
Asn Thr Ile Ser Thr Glu Phe Leu Pro Tyr Leu Thr Asp Asp Glu Lys
365 370 375
Ala Met Ile Lys Gly Ser Gly Asp Phe Phe Ala Ile Asp Ala Tyr Arg
380 385 390 395
Thr Asn Leu Ala Arg Ala Ala Pro Asn Gly Ile Gln Ala Cys Val Ala
400 405 410
Asn Ile Ser Asp Pro Asn Trp Pro Val Cys Gln Asp Asn Ser Pro Glu
415 420 425
Gly Gln Tyr Gln Thr Met Asp Gly Phe Ala Phe Gly Pro Pro Ala Asp
430 435 440
Pro Asn Ala Ala Trp Leu Tyr Asp Thr Ser Phe Lys Leu Arg Tyr Gln
445 450 455
Leu Lys Thr Leu Lys Glu Ala Phe Asn Tyr Asp Lys Ile Tyr Ile Ser
460 465 470 475
Glu Phe Gly Phe Ala Arg Pro Tyr Glu Tyr Leu Tyr Pro Tyr Gly Phe
480 485 490
Asp Val Leu Tyr Asp Thr Asp Arg Ala Ile Tyr Tyr Gln Asp Tyr Met
495 500 505
Ala Glu Ala Leu Asp Ala Ile His Asp Asp Gly Ile Pro Leu Ala Gly
510 515 520
Val Phe Ala Trp Ser Phe Val Asp Asn Phe Glu Trp Ala Ser Gly Leu
525 530 535
Glu Gln Arg Phe Gly Met Gln Phe Val Asn Tyr Thr Thr Leu Glu Arg
540 545 550 555
Glu Tyr Lys Leu Ser Phe Leu Leu Tyr Arg Asp Phe Ile Glu Asn His
560 565 570
Ser Cys Glu Asp
575
<210> 23
<211> 1791
<212> DNA
<213> Artificial Sequence
<220>
<223> Beta-galactosidase
<220>
<221> CDS
<222> (1)..(1791)
<220>
<221> sig_peptide
<222> (1)..(63)
<220>
<221> mat_peptide
<222> (64)..(1788)
<400> 23
atg atg gtc gcg tgg tgg tct cta ttt ctg tac ggc ctt cag gtc gcg 48
Met Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala
-20 -15 -10
gca cct gct ttg gct att ccc gct ttc cca atc act ccc gat ttg gcc 96
Ala Pro Ala Leu Ala Ile Pro Ala Phe Pro Ile Thr Pro Asp Leu Ala
-5 -1 1 5 10
gga ggc ctg gaa agc gtc aca aac acc caa acg tcc ctc cca tct gct 144
Gly Gly Leu Glu Ser Val Thr Asn Thr Gln Thr Ser Leu Pro Ser Ala
15 20 25
tcc gct gtt tcc agc ccg tac aac caa gac gct ctt gat aag ctg tgg 192
Ser Ala Val Ser Ser Pro Tyr Asn Gln Asp Ala Leu Asp Lys Leu Trp
30 35 40
gca gag gtt gag aag gat atc ccc gtt gaa aca cca tcc atc agc tct 240
Ala Glu Val Glu Lys Asp Ile Pro Val Glu Thr Pro Ser Ile Ser Ser
45 50 55
gtg gtg ccc gtg aac aac tcc ttc gcc gtg cct aag acg ccg acc ctc 288
Val Val Pro Val Asn Asn Ser Phe Ala Val Pro Lys Thr Pro Thr Leu
60 65 70 75
ccg cgc tcc ctg cag gat cat gct act tcg ggg cgg aag ttc cca aaa 336
Pro Arg Ser Leu Gln Asp His Ala Thr Ser Gly Arg Lys Phe Pro Lys
80 85 90
ggg ttc aag ttc gga gtt gcc act gcg gac cag cag tac gaa ggc gcc 384
Gly Phe Lys Phe Gly Val Ala Thr Ala Asp Gln Gln Tyr Glu Gly Ala
95 100 105
gtc aag gcc gac ggc cgc ggg ccg agc cac tgg gat tac ctg tgc cac 432
Val Lys Ala Asp Gly Arg Gly Pro Ser His Trp Asp Tyr Leu Cys His
110 115 120
cgg ctg cct cag caa tgc aac aac tac acc tct gac atc act gac ttg 480
Arg Leu Pro Gln Gln Cys Asn Asn Tyr Thr Ser Asp Ile Thr Asp Leu
125 130 135
gga cgt tac tac tac aag cag gat atc gcc cgg atc aag gcc atg ggc 528
Gly Arg Tyr Tyr Tyr Lys Gln Asp Ile Ala Arg Ile Lys Ala Met Gly
140 145 150 155
gtg aat act gtc tcg ctt acc ctg agc tgg tcg cgc atc aag ccc ttt 576
Val Asn Thr Val Ser Leu Thr Leu Ser Trp Ser Arg Ile Lys Pro Phe
160 165 170
ggc act gct gac tcg cct gtt tcg aag gag ggt ttg cag ttc tac gat 624
Gly Thr Ala Asp Ser Pro Val Ser Lys Glu Gly Leu Gln Phe Tyr Asp
175 180 185
gac ttc atc aac gaa ctc att gac aat gga atc gag cct gtt gtg aca 672
Asp Phe Ile Asn Glu Leu Ile Asp Asn Gly Ile Glu Pro Val Val Thr
190 195 200
ctc ttc cat tgg tct acc cct ctg aat ctg gtg ttt gag tac ggt gcc 720
Leu Phe His Trp Ser Thr Pro Leu Asn Leu Val Phe Glu Tyr Gly Ala
205 210 215
ttt ctc aac ggc agc agc gtg gaa gac ttt gcg tcc tat gca aag ctg 768
Phe Leu Asn Gly Ser Ser Val Glu Asp Phe Ala Ser Tyr Ala Lys Leu
220 225 230 235
gtc ttc gaa cac ttt ggg gac cgc gtg aca acc ttc ctt acc ttc aac 816
Val Phe Glu His Phe Gly Asp Arg Val Thr Thr Phe Leu Thr Phe Asn
240 245 250
gag ccg cgt gtg tac tgc agc gag tat acg ggc gaa ccc ttc aac gac 864
Glu Pro Arg Val Tyr Cys Ser Glu Tyr Thr Gly Glu Pro Phe Asn Asp
255 260 265
tac tgg cat ttc ggt gga ccg aac atc aac gca acg acc gca ccc tat 912
Tyr Trp His Phe Gly Gly Pro Asn Ile Asn Ala Thr Thr Ala Pro Tyr
270 275 280
cca tgc acg tac aac atc ctt aag gcg cat ggg cga gct gtt cag gag 960
Pro Cys Thr Tyr Asn Ile Leu Lys Ala His Gly Arg Ala Val Gln Glu
285 290 295
tat cgg gct ctg gtc aac tcg ggg aag atc aag aag ggt gaa gtt gca 1008
Tyr Arg Ala Leu Val Asn Ser Gly Lys Ile Lys Lys Gly Glu Val Ala
300 305 310 315
atc aag aac gat gac tcc tac cct gtg ccc gtt aac cca gac tct gaa 1056
Ile Lys Asn Asp Asp Ser Tyr Pro Val Pro Val Asn Pro Asp Ser Glu
320 325 330
gca gat gtt gaa gct gcg aaa cga cat ttc gac ttc tac atc ggc atc 1104
Ala Asp Val Glu Ala Ala Lys Arg His Phe Asp Phe Tyr Ile Gly Ile
335 340 345
ttc tcg cag ccc atc tat ggc gat ggc aag ttc cct gat acc gtc cgc 1152
Phe Ser Gln Pro Ile Tyr Gly Asp Gly Lys Phe Pro Asp Thr Val Arg
350 355 360
aac aca atc agc aca gaa ttc ctg cct tac ctc act gat gac gag aag 1200
Asn Thr Ile Ser Thr Glu Phe Leu Pro Tyr Leu Thr Asp Asp Glu Lys
365 370 375
gcc atg atc aag ggt tcc ggc gac ttc ttc gca atc gat gct tac cgc 1248
Ala Met Ile Lys Gly Ser Gly Asp Phe Phe Ala Ile Asp Ala Tyr Arg
380 385 390 395
acc aac ctt gct cga gct gct cca aac gga atc cag gcc tgt gtt gcc 1296
Thr Asn Leu Ala Arg Ala Ala Pro Asn Gly Ile Gln Ala Cys Val Ala
400 405 410
aac atc tcg gat ccg aat tgg ccg gtc tgt caa gac aac agc cct gaa 1344
Asn Ile Ser Asp Pro Asn Trp Pro Val Cys Gln Asp Asn Ser Pro Glu
415 420 425
ggg cag tat cag acg atg gat ggc ttt gcc ttt ggc cca cca gcg gac 1392
Gly Gln Tyr Gln Thr Met Asp Gly Phe Ala Phe Gly Pro Pro Ala Asp
430 435 440
cct aac gcg gcg tgg ctc tac gac acg agc ttc aag ctg cgg tat cag 1440
Pro Asn Ala Ala Trp Leu Tyr Asp Thr Ser Phe Lys Leu Arg Tyr Gln
445 450 455
ctt aag act ctc aaa gag gcc ttc aac tac gac aag atc tac atc agc 1488
Leu Lys Thr Leu Lys Glu Ala Phe Asn Tyr Asp Lys Ile Tyr Ile Ser
460 465 470 475
gaa ttc ggt ttc gcc cga ccc tat gag tat ctg tat ccc tat ggt ttt 1536
Glu Phe Gly Phe Ala Arg Pro Tyr Glu Tyr Leu Tyr Pro Tyr Gly Phe
480 485 490
gac gtt ctc tat gac aca gac cga gct atc tac tac cag gac tac atg 1584
Asp Val Leu Tyr Asp Thr Asp Arg Ala Ile Tyr Tyr Gln Asp Tyr Met
495 500 505
gcc gag gca ctg gat gct atc cac gac gat ggt att cca ttg gcg ggt 1632
Ala Glu Ala Leu Asp Ala Ile His Asp Asp Gly Ile Pro Leu Ala Gly
510 515 520
gtg ttc gct tgg tcc ttc gtc gac aac ttc gaa tgg gcg tcc ggc ctt 1680
Val Phe Ala Trp Ser Phe Val Asp Asn Phe Glu Trp Ala Ser Gly Leu
525 530 535
gag caa cgc ttt ggc atg cag ttc gtc aac tac aca acc ctc gag cgc 1728
Glu Gln Arg Phe Gly Met Gln Phe Val Asn Tyr Thr Thr Leu Glu Arg
540 545 550 555
gag tac aag ctc tct ttc ctg ctg tat cgt gat ttc atc gag aat cat 1776
Glu Tyr Lys Leu Ser Phe Leu Leu Tyr Arg Asp Phe Ile Glu Asn His
560 565 570
agc tgc gag gat taa 1791
Ser Cys Glu Asp
575
<210> 24
<211> 596
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 24
Met Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala
-20 -15 -10
Ala Pro Ala Leu Ala Ile Pro Ala Phe Pro Ile Thr Pro Asp Leu Ala
-5 -1 1 5 10
Gly Gly Leu Glu Ser Val Thr Asn Thr Gln Thr Ser Leu Pro Ser Ala
15 20 25
Ser Ala Val Ser Ser Pro Tyr Asn Gln Asp Ala Leu Asp Lys Leu Trp
30 35 40
Ala Glu Val Glu Lys Asp Ile Pro Val Glu Thr Pro Ser Ile Ser Ser
45 50 55
Val Val Pro Val Asn Asn Ser Phe Ala Val Pro Lys Thr Pro Thr Leu
60 65 70 75
Pro Arg Ser Leu Gln Asp His Ala Thr Ser Gly Arg Lys Phe Pro Lys
80 85 90
Gly Phe Lys Phe Gly Val Ala Thr Ala Asp Gln Gln Tyr Glu Gly Ala
95 100 105
Val Lys Ala Asp Gly Arg Gly Pro Ser His Trp Asp Tyr Leu Cys His
110 115 120
Arg Leu Pro Gln Gln Cys Asn Asn Tyr Thr Ser Asp Ile Thr Asp Leu
125 130 135
Gly Arg Tyr Tyr Tyr Lys Gln Asp Ile Ala Arg Ile Lys Ala Met Gly
140 145 150 155
Val Asn Thr Val Ser Leu Thr Leu Ser Trp Ser Arg Ile Lys Pro Phe
160 165 170
Gly Thr Ala Asp Ser Pro Val Ser Lys Glu Gly Leu Gln Phe Tyr Asp
175 180 185
Asp Phe Ile Asn Glu Leu Ile Asp Asn Gly Ile Glu Pro Val Val Thr
190 195 200
Leu Phe His Trp Ser Thr Pro Leu Asn Leu Val Phe Glu Tyr Gly Ala
205 210 215
Phe Leu Asn Gly Ser Ser Val Glu Asp Phe Ala Ser Tyr Ala Lys Leu
220 225 230 235
Val Phe Glu His Phe Gly Asp Arg Val Thr Thr Phe Leu Thr Phe Asn
240 245 250
Glu Pro Arg Val Tyr Cys Ser Glu Tyr Thr Gly Glu Pro Phe Asn Asp
255 260 265
Tyr Trp His Phe Gly Gly Pro Asn Ile Asn Ala Thr Thr Ala Pro Tyr
270 275 280
Pro Cys Thr Tyr Asn Ile Leu Lys Ala His Gly Arg Ala Val Gln Glu
285 290 295
Tyr Arg Ala Leu Val Asn Ser Gly Lys Ile Lys Lys Gly Glu Val Ala
300 305 310 315
Ile Lys Asn Asp Asp Ser Tyr Pro Val Pro Val Asn Pro Asp Ser Glu
320 325 330
Ala Asp Val Glu Ala Ala Lys Arg His Phe Asp Phe Tyr Ile Gly Ile
335 340 345
Phe Ser Gln Pro Ile Tyr Gly Asp Gly Lys Phe Pro Asp Thr Val Arg
350 355 360
Asn Thr Ile Ser Thr Glu Phe Leu Pro Tyr Leu Thr Asp Asp Glu Lys
365 370 375
Ala Met Ile Lys Gly Ser Gly Asp Phe Phe Ala Ile Asp Ala Tyr Arg
380 385 390 395
Thr Asn Leu Ala Arg Ala Ala Pro Asn Gly Ile Gln Ala Cys Val Ala
400 405 410
Asn Ile Ser Asp Pro Asn Trp Pro Val Cys Gln Asp Asn Ser Pro Glu
415 420 425
Gly Gln Tyr Gln Thr Met Asp Gly Phe Ala Phe Gly Pro Pro Ala Asp
430 435 440
Pro Asn Ala Ala Trp Leu Tyr Asp Thr Ser Phe Lys Leu Arg Tyr Gln
445 450 455
Leu Lys Thr Leu Lys Glu Ala Phe Asn Tyr Asp Lys Ile Tyr Ile Ser
460 465 470 475
Glu Phe Gly Phe Ala Arg Pro Tyr Glu Tyr Leu Tyr Pro Tyr Gly Phe
480 485 490
Asp Val Leu Tyr Asp Thr Asp Arg Ala Ile Tyr Tyr Gln Asp Tyr Met
495 500 505
Ala Glu Ala Leu Asp Ala Ile His Asp Asp Gly Ile Pro Leu Ala Gly
510 515 520
Val Phe Ala Trp Ser Phe Val Asp Asn Phe Glu Trp Ala Ser Gly Leu
525 530 535
Glu Gln Arg Phe Gly Met Gln Phe Val Asn Tyr Thr Thr Leu Glu Arg
540 545 550 555
Glu Tyr Lys Leu Ser Phe Leu Leu Tyr Arg Asp Phe Ile Glu Asn His
560 565 570
Ser Cys Glu Asp
575
<210> 25
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> F1 primer
<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (27)..(27)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (30)..(30)
<223> n is a, c, g, or t
<400> 25
gccggcgcgg ctathcargt ngarggngcn 30
<210> 26
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> F2 primer
<220>
<221> misc_feature
<222> (9)..(9)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (18)..(18)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (30)..(30)
<223> n is a, c, g, or t
<400> 26
gtcaagacnt ggttyacntt yaaygarccn 30
<210> 27
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> R1 primer
<220>
<221> misc_feature
<222> (19)..(19)
<223> n is a, c, g, or t
<400> 27
ctcggcccac ccraaytcns wraartadat 30
<210> 28
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> R2 primer
<220>
<221> misc_feature
<222> (16)..(16)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (22)..(22)
<223> n is a, c, g, or t
<400> 28
ccattcccar ttrtcnacra answcca 27
<210> 29
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> C-R70 primer
<220>
<221> misc_feature
<222> (10)..(10)
<223> n is a, c, g, or t
<400> 29
gacgaggccn swrttccayt craarttrtc 30
Claims (12)
- 담자균 효모 유래의 비분비형의 β-갈락토시다아제 유전자를, 아스퍼질러스 오리제에 조립하고, 분비형의 β-갈락토시다아제를 산생시키는 것을 특징으로 하는 분비형의 β-갈락토시다아제의 제조 방법.
- 제 1 항에 있어서,
담자균 효모가 스포로볼로미세스속, 시로바시디움속, 로도토룰라속 또는 스테리그마토미세스속에 속하는 것인 분비형의 β-갈락토시다아제의 제조 방법. - 제 1 항 또는 제 2 항에 있어서,
담자균 효모 유래의 비분비형의 β-갈락토시다아제 유전자가 시그널 서열과 β-갈락토시다아제를 코드하는 서열로 이루어지는 것인 β-갈락토시다아제의 제조 방법. - 제 3 항에 있어서,
담자균 효모 유래의 비분비형의 β-갈락토시다아제 유전자의 시그널 서열이 아스퍼질러스 오리제의 시그널 서열인 β-갈락토시다아제의 제조 방법. - 제 3 항 또는 제 4 항에 있어서,
β-갈락토시다아제를 코드하는 서열이 β-갈락토시다아제의 아미노산 서열을 변경하지 않는 범위 내에서 네이티브의 β-갈락토시다아제를 코드하는 서열의 코돈을 변경한 것인 β-갈락토시다아제의 제조 방법. - 제 3 항에 있어서,
시그널 서열과 β-갈락토시다아제를 코드하는 서열이 서열 번호 1, 7, 13, 19에 기재된 서열인 β-갈락토시다아제의 제조 방법. - 제 3 항 또는 제 4 항에 있어서,
시그널 서열과 β-갈락토시다아제를 코드하는 서열이 서열 번호 3, 9, 15, 21에 기재된 서열인 β-갈락토시다아제의 제조 방법. - 제 5 항에 있어서,
시그널 서열과 β-갈락토시다아제를 코드하는 서열이 서열 번호 5, 11, 17, 23에 기재된 서열인 β-갈락토시다아제의 제조 방법. - 서열 번호 7, 13, 19에 기재된 서열인 담자균 효모 유래의 비분비형의 β-갈락토시다아제 유전자.
- 담자균 효모 유래의 비분비형의 β-갈락토시다아제 유전자가 아스퍼질러스 오리제에 조립되고, 분비형의 β-갈락토시다아제를 산생하는 것을 특징으로 하는 아스퍼질러스 오리제의 형질 전환체.
- 적어도 유당을 함유하는 기질에, 제 1 항 내지 제 8 항 중 어느 한 항에 기재된 β-갈락토시다아제의 제조 방법으로 제조된 β-갈락토시다아제를 작용시키는 것을 특징으로 하는 갈락토올리고당의 제조 방법.
- 담자균 효모 유래의 비분비형의 β-갈락토시다아제 유전자를, 아스퍼질러스 오리제에 조립하고, 이것을 배양함으로써 얻어지는 분비형의 β-갈락토시다아제.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JPJP-P-2018-212757 | 2018-11-13 | ||
JP2018212757 | 2018-11-13 | ||
PCT/JP2019/043629 WO2020100706A1 (ja) | 2018-11-13 | 2019-11-07 | 分泌型のβ-ガラクトシダーゼの製造方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210091217A true KR20210091217A (ko) | 2021-07-21 |
Family
ID=70730777
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217017331A KR20210091217A (ko) | 2018-11-13 | 2019-11-07 | 분비형의 β-갈락토시다아제의 제조 방법 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20220002771A1 (ko) |
EP (1) | EP3882353A4 (ko) |
JP (2) | JPWO2020100706A1 (ko) |
KR (1) | KR20210091217A (ko) |
CN (1) | CN112969798A (ko) |
AU (1) | AU2019380861A1 (ko) |
SG (1) | SG11202104572PA (ko) |
TW (1) | TW202039822A (ko) |
WO (1) | WO2020100706A1 (ko) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006223268A (ja) | 2005-02-21 | 2006-08-31 | Yakult Honsha Co Ltd | ガラクトシル2糖類の製造法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07236480A (ja) * | 1994-03-01 | 1995-09-12 | Ajinomoto Co Inc | 新規β−ガラクトシダーゼ及びその製造方法 |
AU1996101A (en) * | 1999-12-30 | 2001-07-16 | Novozymes A/S | Fungal extracellular fam35 beta-galactosidases |
US7063962B2 (en) * | 2001-07-20 | 2006-06-20 | Novozymes A/S | DNA sequences for regulating transcription |
WO2003070957A2 (en) * | 2002-02-20 | 2003-08-28 | Novozymes A/S | Plant polypeptide production |
JP4413557B2 (ja) | 2003-02-28 | 2010-02-10 | 大関株式会社 | 糸状菌を用いたタンパク質の効率的製造法 |
CN101864439A (zh) * | 2009-04-17 | 2010-10-20 | 天津医科大学 | β-葡萄糖苷酶同工酶BglA蛋白及其用途 |
EP3399032A4 (en) * | 2015-12-29 | 2019-08-14 | Amano Enzyme Inc. | NOVEL BETA GALACTOSIDASE |
-
2019
- 2019-11-07 US US17/293,189 patent/US20220002771A1/en active Pending
- 2019-11-07 CN CN201980074026.1A patent/CN112969798A/zh active Pending
- 2019-11-07 EP EP19885568.6A patent/EP3882353A4/en active Pending
- 2019-11-07 JP JP2020555578A patent/JPWO2020100706A1/ja active Pending
- 2019-11-07 WO PCT/JP2019/043629 patent/WO2020100706A1/ja unknown
- 2019-11-07 SG SG11202104572PA patent/SG11202104572PA/en unknown
- 2019-11-07 AU AU2019380861A patent/AU2019380861A1/en active Pending
- 2019-11-07 KR KR1020217017331A patent/KR20210091217A/ko unknown
- 2019-11-12 TW TW108140977A patent/TW202039822A/zh unknown
-
2024
- 2024-03-05 JP JP2024033065A patent/JP2024052986A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006223268A (ja) | 2005-02-21 | 2006-08-31 | Yakult Honsha Co Ltd | ガラクトシル2糖類の製造法 |
Also Published As
Publication number | Publication date |
---|---|
WO2020100706A1 (ja) | 2020-05-22 |
EP3882353A1 (en) | 2021-09-22 |
US20220002771A1 (en) | 2022-01-06 |
TW202039822A (zh) | 2020-11-01 |
JPWO2020100706A1 (ja) | 2021-09-30 |
SG11202104572PA (en) | 2021-06-29 |
CN112969798A (zh) | 2021-06-15 |
EP3882353A4 (en) | 2022-10-12 |
JP2024052986A (ja) | 2024-04-12 |
AU2019380861A1 (en) | 2021-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100878968B1 (ko) | 비피도박테륨에서 단리한 베타-갈락토시다제 | |
Schlösser et al. | The Streptomyces ATP-binding component MsiK assists in cellobiose and maltose transport | |
Ohtsu et al. | Thermostable β-galactosidase from an extreme thermophile, Thermus sp. A4: enzyme purification and characterization, and gene cloning and sequencing | |
KR100601333B1 (ko) | 아가레이즈 및 그의 유전자 | |
EP1975237B1 (en) | Beta-fructofuranosidase variants and uses thereof | |
CN109880813B (zh) | 一种具有低聚半乳糖合成能力的β-葡萄糖苷酶及其表达菌株和应用 | |
US7709240B2 (en) | AMP deaminase originating streptomyces and utilization thereof | |
AU784466B2 (en) | Cyclic depsipeptide synthases, genes thereof and mass production system of cyclic depsipeptide | |
KR20210091217A (ko) | 분비형의 β-갈락토시다아제의 제조 방법 | |
US5637491A (en) | Dextranase enzyme, method for its production and DNA encoding the enzyme | |
CN111549007A (zh) | 一种转氨酶tsta、制备方法和应用 | |
JP2000175698A (ja) | ピラノースオキシダーゼを含有するピラノース測定用試薬 | |
US20020068349A1 (en) | Gene encoding recombinant trehalose phosphorylase, vector containing the gene, transformant transformed by the gene, and method for producing recombinant trehalose phosphorylase with the use of transformant | |
JP2002085078A (ja) | アルカリセルラーゼ遺伝子 | |
JP2001054381A (ja) | 超耐熱性キチナーゼ | |
KR101834493B1 (ko) | 신규 베타-만노시다제 및 이의 생산방법 | |
WO2020090734A1 (ja) | マルトトリオース生成アミラーゼ | |
Aida et al. | Comparative studies of β-1, 3-glucanase A1 and B of Bacillus circulans WL-12: purifications and enzymatic properties | |
JPH09505989A (ja) | 菌類からのα‐1,4‐グルカンリアーゼ、その精製、遺伝子クローニングおよび微生物での発現 | |
US6284510B1 (en) | β-fructofuranosidase gene | |
CN118076740A (zh) | 改良型β-呋喃果糖苷酶 | |
KR101132396B1 (ko) | 잔토모나스 유래의 신규 엔도글루카나제 | |
JP2001046075A (ja) | 耐塩性グルタミナーゼ遺伝子 | |
WO1998006832A1 (fr) | Protopectinase | |
JP2000245480A (ja) | 好熱性アミノペプチダーゼ |