KR20140018851A - N-아세틸글루코사미닐트랜스퍼라제 활성을 갖는 융합 효소 - Google Patents

N-아세틸글루코사미닐트랜스퍼라제 활성을 갖는 융합 효소 Download PDF

Info

Publication number
KR20140018851A
KR20140018851A KR1020137016445A KR20137016445A KR20140018851A KR 20140018851 A KR20140018851 A KR 20140018851A KR 1020137016445 A KR1020137016445 A KR 1020137016445A KR 20137016445 A KR20137016445 A KR 20137016445A KR 20140018851 A KR20140018851 A KR 20140018851A
Authority
KR
South Korea
Prior art keywords
acetylglucosaminyltransferase
host cell
protein
recombinant protein
catalytic domain
Prior art date
Application number
KR1020137016445A
Other languages
English (en)
Inventor
야리 나튜넨
앤 카네르파
유카 힐투넨
마르쿠 살로헤이모
헤리 비스카리
앤 후스코넨
Original Assignee
노파르티스 인터내셔널 파마슈티칼 리미티드
글리코스 핀란드 오이
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노파르티스 인터내셔널 파마슈티칼 리미티드, 글리코스 핀란드 오이 filed Critical 노파르티스 인터내셔널 파마슈티칼 리미티드
Publication of KR20140018851A publication Critical patent/KR20140018851A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/005Glycopeptides, glycoproteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01101Alpha-1,3-mannosyl-glycoprotein 2-beta-N-acetylglucosaminyltransferase (2.4.1.101)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01143Alpha-1,6-mannosyl-glycoprotein 2-beta-N-acetylglucosaminyltransferase (2.4.1.143)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Mycology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Botany (AREA)
  • Virology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Cell Biology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은 N-아세틸글루코사미닐트랜스퍼라제 활성을 갖는 재조합 단백질에 관한 것이다. 본 발명은 또한 이러한 재조합 단백질을 함유하는 숙주 세포를 제공하는 단계 및 이러한 재조합 단백질이 발현되도록 상기 숙주 세포를 배양하는 단계를 포함하는, 복합 N-글리칸을 제조하는 방법에 관한 것이기도 하다.

Description

N-아세틸글루코사미닐트랜스퍼라제 활성을 갖는 융합 효소{FUSION ENZYMES HAVING N-ACETYLGLUCOSAMINYLTRANSFERASE ACTIVITY}
CROSS - REFERENCE TO RELATED APPLICATION
[0001] 이 출원은 2010년 11월 24일 출원된 미국 가특허출원 No. 61/417,144에 기초한 우선권 주장 출원으로서 상기 출원은 그 내용 전체가 본 발명에 참조 병합되었다.
ASCII 텍스트 파일 형태의 서열목록 제출
[0002] ASCII 텍스트 파일로 제출되는 하기 제출물의 내용은 본 발명에 그 전체가 참조된 것이다: 서열목록의 컴퓨터 판독가능 형태 (CRF). (파일명: 619672001040SEQLIST.txt, 기록일자: 2011년 11월 22일, 크기: 305 KB)
기술분야
[0003] 본 발명은 N-글리칸의 제조에 유용한 조성물 및 방법에 관한 것이다
[0004] 적절한 단백질 폴딩과 기능을 위해서는 종종 단백질의 번역후 변형이 필요하다. 흔한 단백질 변형은 세포질 세망 중의 발생기 폴리펩타이드에 올리고당(글리칸)을 부가하여 당단백질을 형성시키는, 글리코실화라고 알려진 공정이다. N-글리코실화는 치료 목적으로 사용되는 재조합 단백질을 생산하는데 있어 특히 중요하다. 표준 원핵생물 발현계는 이러한 변형에 필요한 적절한 기구를 가지고 있지 않기 때문에, 이러한 치료 단백질을 생산하기 위해서는 대안적인 발현계를 사용하여야만 한다. 효모와 진균은 간단한 배지에서 대규모로 용이하게 성장할 수 있어, 생산 단가가 저렴하기 때문에, 단백질을 발현하기 위한 매력적인 선택지이다. 뿐만 아니라, 효모와 진균 세포 뿐만 아니라 포유동물이나 곤충 세포와 같은 보다 복잡한 진핵생물 세포의 비교적 간단한 유전자 메이크업을 조작하기 위한 도구를 이용할 수 있다 (De Pourcq et al., Appl Microbiol Biotechnol, 87(5):1617-31).
[0005] 진균 세포와 포유류 세포는 만노스(8)N-아세틸글루코사민(2) (Man8GlcNAc2)의 형성을 결과시키는 글리코실화의 초기 단계에서 공통적인 단계들을 공유한다. 그러나, 이 프로세스의 후기 단계에서는 상당한 차이점들이 존재한다. 예를 들어, 효모에서는, 만노실트랜스퍼라제 및 만난 폴리머라제에 의해 Man8GlcNAc2에 부가적인 만노스 서브유닛이 부가되어 고만노스형 N-글리칸이 얻어진다. 이와 대조적으로, 만노스 당은 인간 Man8GlcNAc2로부터 제거되어 Man5GlcNAc2가 얻어지고, 효소 N-아세틸글루코사미닐트랜스퍼라제 I (GnTI), 만노시다제 II (Mns II), 및 N-아세틸글루코사미닐트랜스퍼라제 II (GnTII)가 관여하는 3가지 연속 반응이 후속적으로 일어나서 Man5GlcNAc2가 GlcNAc2Man3GlcNAc2로 전환된다.
[0006] 포유류 세포와 진균 세포 간의 글리코실화 프로세스의 이러한 차이점은 진균 세포에서의 글리코실화 포유류 단백질의 발현에 도전하게 만드는데, 이는, 인간에 있어서는 고만노스형 N-글리칸을 갖는 당단백질이 치료적 용도로 적합하지 않기 때문이다 (De Pourcq et al., 2010; Wildt and Gerngross, Nature Reviews Microbiology, 3: 119-128). 그 결과, 효모와 진균종이 재조합 인간 단백질을 발현할 수 있도록 이들에 있어서의 글리코실화 경로를 재조작하려는 시도가 행하여졌다. 효모 또는 진균 세포의 글리코엔지니어링의 일반적인 접근법은 고만노스형 N-글리칸의 생성과 연관된 내인성 유전자를 파괴하는 것이었다. 이러한 유전자 파괴는 서로 다른 종으로부터의 글리코시다제 및 글리코실트랜스퍼라제 및/또는 내인성 만노시다제의 과발현과 연계될 수 있다 (Chiba et al., 1998, J Biol Chem 273: 26298-304; Kainz et al., 2008, Appl Environ Microbiol 74: 1076-86; Maras et al., 1997, Euro J Biochem 249: 701-07; Maras et al., 1999, Febs Letters 452: 365-70; Hamilton et al., 2003, Science 301: 1244-6; De Pourcq et al., 2010). 그러나, 비포유동물 세포에서의 글리코실화 단백질 생성은 여전히 복잡하고도 비용 소모적인 유전자 조작을 필요로 하므로 목적하는 당단백질 생산에는 비효율적일 수 있다.
[0007] 따라서, 비포유동물 세포에서 복합 N-글리칸을 발현하는 보다 간단하고도 효율적인 시스템이 이 기술분야에서 요망되고 있다.
발명의 개요
[0008] 본 발명에 따라 N-아세틸글루코사미닐트랜스퍼라제 활성을 갖는 재조합 단백질을 포함하는 조성물이 개시된다. 또한, 복합 N-글리칸의 제조방법 및Man3GlcNAc2 글리칸의 제조방법도 설명된다.
[0009] 따라서, 일 측면은 N-아세틸글루코사미닐트랜스퍼라제 활성을 갖는 재조합 단백질에 관한 것으로, 여기서 상기 재조합 단백질은 N-아세틸글루코사민의 말단의 Manα3 잔기로의 전달을 촉매하고 N-아세틸글루코사민의 수용체 글리칸(acceptor glycan)의 말단 Manα6 잔기로의 전달을 촉매하며, 상기 재조합 단백질은 2 이상의 상이한 효소들로부터의 촉매 도메인을 함유하는 것이다. 특정 구체예에서, 상기 수용체 글리칸은 아미노산, 펩타이드 또는 폴리펩타이드로부터 선택된 분자에 결합된다. 특정 구체예에서, 상기 분자는 이종(heterologous) 폴리펩타이드이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 수용체 글리칸은 Man3이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 재조합 단백질은 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인 및 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 함유하는 융합 단백질이다. 특정 구체예에서, N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인 및 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인은 인간 효소로부터 유래한다. 특정 구체예에서, N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인은 SEQ ID NO: 1의 아미노산 잔기 105-445와 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 포함한다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인은 SEQ ID NO: 21의 아미노산 잔기 30-447와 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 포함한다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인은 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인의 N-말단이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인은 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인의 N-말단이다.
[0010] 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 재조합 단백질은 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인과 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인 사이에 스페이서를 더 함유한다. 특정 구체예에서, 스페이서는 스템 도메인(stem domain)으로부터의 서열을 함유한다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 스페이서는 길이가 적어도 5, 적어도 10, 적어도 15, 적어도 20, 적어도 30, 적어도 40, 또는 적어도 50 아미노산이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 스페이서는 SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO: 122, 및 SEQ ID NO: 124로부터 선택된 서열을 함유한다. 특정 구체예에서, 스페이서는 SEQ ID NO: 118, SEQ ID NO: 120, 및 SEQ ID NO: 124로부터 선택된 서열을 함유한다. 특정 구체예에서, 스페이서는 SEQ ID NO: 120 또는 SEQ ID NO: 124로부터 선택된 서열을 함유한다. 특정 구체예에서, 스페이서는 SEQ ID NO: 124의 서열을 함유한다.
[0011] 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 재조합 단백질은 촉매 도메인의 N-말단 엔드에 링크된 표적화 펩타이드를 더 함유한다. 특정 구체예에서, 표적화 펩타이드는 스템 도메인을 함유한다. 특정 구체예에서, 스템 도메인은 N-아세틸글루코사미닐트랜스퍼라제 I 효소 또는 N-아세틸글루코사미닐트랜스퍼라제 II 효소로부터 유래한다. 특정 구체예에서, N-아세틸글루코사미닐트랜스퍼라제 I 효소 및 N-아세틸글루코사미닐트랜스퍼라제 II 효소는 인간의 효소이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 스템 도메인은 만노시다제, 만노실트랜스퍼라제, 글리코실트랜스퍼라제, 2형 골지 단백질, MNN2, MNN4, MNN6, MNN9, MNN10, MNS1, KRE2, VAN1, 또는 OCH1으로부터 선택된 단백질이다. 특정 구체예에서, 단백질은 아크레모니움, 아스퍼질러스, 아우레오바시디움, 크립토코쿠스, 크리소스포리움 , 크리소스포리움 루크노웬스, 필리바시디움 , 푸사리움, 지베렐라, 휴미콜라, 마그나포르테, 뮤코, 미셀리오프토라 , 미로테슘, 네오칼리마스틱스 , 뉴로스포라, 페실로마이세스 , 피니실륨, 피로마이세스, 쉬조필룸, 탈라로마이세스 , 써모아스쿠 스, 틸라비아 , 톨리포클라디움, 또는 트리코더마로부터 선택된 생물로부터 유래한다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 표적화 펩타이드는 Kre2 표적화 펩타이드이다. 특정 구체예에서, 표적화 펩타이드는 막투과 도메인을 함유한다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 표적화 펩타이드는 스템 도메인의 N-말단 엔드에 링크된 막투과 도메인을 더 함유한다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 막투과 도메인은 N-아세틸글루코사미닐트랜스퍼라제 I 효소 또는 N-아세틸글루코사미닐트랜스퍼라제 II 효소로부터 유래한다. 특정 구체예에서, N-아세틸글루코사미닐트랜스퍼라제 I 효소 및 N-아세틸글루코사미닐트랜스퍼라제 II 효소는 인간 효소이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 막투과 도메인은 만노시다제, 만노실트랜스퍼라제, 글리코실트랜스퍼라제, 2형 골지 단백질, MNN2, MNN4, MNN6, MNN9, MNN10, MNS1, KRE2, VAN1, 또는 OCH1으로부터 선택된 단백질로 유래한다. 특정 구체예에서, 단백질은 아크레모니움, 아스퍼질러스, 아우레오바시디움, 크립토코쿠스, 크리소스포리움 , 크리소스포리움 루크노웬스, 필리바시디움 , 푸사리움, 지베렐라 , 휴미콜라, 마그나포르테, 뮤코, 미셀리오프토라 , 미로테슘, 네오칼리마스틱스 , 뉴로스포라, 페실로마이세스, 피니실륨, 피로마이세스 , 쉬조필룸, 탈라로마이세스 , 써모아스쿠스 , 틸라비아 , 톨리포클라디움, 또는 트리코더마로부터 선택된 생물로부터 유래한다. 특정 구체예에서, 표적화 펩타이드는 세포질 도메인을 함유한다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 표적화 펩타이드는 스템 도메인의 N-말단 엔드에 링크된 세포질 도메인을 더 함유한다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 표적화 펩타이드는 막투과 도메인의 N-말단 엔드에 링크된 세포질 도메인을 더 함유한다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 세포질 도메인은 N-아세틸글루코사미닐트랜스퍼라제 I 효소 또는 N-아세틸글루코사미닐트랜스퍼라제 II 효소로부터 유래한다. 특정 구체예에서, N-아세틸글루코사미닐트랜스퍼라제 I 효소 및 N-아세틸글루코사미닐트랜스퍼라제 II 효소는 인간 효소이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 세포질 도메인은 만노시다제, 만노실트랜스퍼라제, 글리코실트랜스퍼라제, 2형 골지 단백질, MNN2, MNN4, MNN6, MNN9, MNN10, MNS1, KRE2, VAN1, 또는 OCH1으로부터 선택된 단백질로부터 유래한다. 특정 구체예에서, 단백질은 아크레모니움, 아스퍼질러스, 아우레오바시디움, 크립토코쿠스, 크리소스포리움 , 크리소스포리움 루크노웬스, 필리바시디움 , 푸사리움, 지베렐라, 휴미콜라, 마그나포르테, 뮤코, 미셀리오프토라 , 미로테슘, 네오칼리마스틱스 , 뉴로스포라, 페실로마이세스 , 피니실륨, 피로마이세스 , 쉬조필룸, 탈라로마이세스 , 써모아스쿠스, 틸라비아 , 톨리포클라디움 또는 트리코더마.로부터 선택된 생물로부터 유래한다.
[0012] 또 다른 측면은 인간 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인 및 인간 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인 (여기서 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인은 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인의 N-말단에 위치한다), 촉매 도메인들 사이에 위치하는 인간 N-아세틸글루코사미닐트랜스퍼라제 I 스템 도메인으로부터의 서열을 함유하는 스페이서 서열,N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인의 N-말단에 위치하는 표적화 펩타이드 (여기서 표적화 펩타이드는 인간 N-아세틸글루코사미닐트랜스퍼라제 II로부터의 세포질 도메인, 막투과 도메인, 및 스템 도메인을 함유하는 것이다)를 함유하는 재조합 단백질을 포함한다. 또 다른 측면은 SEQ ID NO: 95와 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 함유하는 재조합 단백질을 포함한다.
[0013] 또 다른 측면은 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인 및 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인 (여기서, N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인은 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인의 N-말단에 위치한다); 촉매 도메인들 사이에 위치하는 스페이서 (여기서, 스페이서는 SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO: 122, 및 SEQ ID NO: 124로부터 선택된 서열을 함유한다); 및 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인의 N-말단에 위치하는 표적화 펩타이드 (여기서 표적화 펩타이드는 인간 N-아세틸글루코사미닐트랜스퍼라제 II로부터 유래하는 세포질 도메인, 막투과 도메인, 및 스템 도메인을 함유한다)을 함유하는 재조합 단백질에 관한 것이다. 특정 구체예에서, 스페이서는 SEQ ID NO: 118, SEQ ID NO: 120, 및 SEQ ID NO: 124로부터 선택된 서열을 함유한다. 특정 구체예에서, 스페이서는 SEQ ID NO: 120 또는 SEQ ID NO: 124의 서열을 함유한다. 특정 구체예에서, 스페이서는 SEQ ID NO: 124의 서열을 함유한다.
[0014] 또 다른 측면은 저술한 구체예들 중 어느 하나의 재조합 단백질을 코딩하는 분리된 폴리뉴클레오타이드에 관한 것이다. 또 다른 측면은 프로모터에 작동적으로 링크된 전술한 구체예의 분리된 폴리뉴클레오타이드를 함유하는 발현 벡터에 관한 것이다. 특정 구체예에서, 프로모터는 연속(constitutive) 프로모터이다. 특정 구체예에서, 프로모터는 유도(inducible) 프로모터이다. 특정 구체예에서, 프로모터는 gpdA, cbh1, 아스퍼질러스 오리제 TAKA 아밀라제, 리조뮤코 미에헤이 아스파틱 프로테이나제, 아스퍼질러스 나이거 중성 알파-아밀라제, 아스퍼질러스 나이거 산 안정성 알파-아밀라제, 아스퍼질러스 나이거 글루코아밀라제 (glaA), 아스퍼질러스 아와모리 glaA, 리조뮤코 미에헤이 리파제, 아스퍼질러스 오리제 알칼라인 프로테아제, 아스퍼질러스 오리제 트리오스 포스페이트 이소머라제, 아스퍼질러스 니둘란스 아세트아미다제, 아스퍼질러스 오리제 아세트아미다제, 푸사리움 옥시스포룸 트립신-유사 프로테아제, 진균성 엔도 α-L-아라비노스 (abnA), 진균성 α-L-아라비노퓨라노시다제 (abfA), 진균성 α-L-아라비노퓨라노시다제 B (abfB), 진균성 자일라나제 (xlnA), 진균성 피타제, 진균성 ATP-신쎄타제, 진균성 서브유닛 9 (oliC), 진균성 트리오스 포스페이트 이소머라제 (tpi), 진균성 알코올 데히드로게나제 (adhA), 진균성 α-아밀라제 (amy), 진균성 아밀로글루코시다제 (glaA), 진균성 아세트아미다제 (amdS), 진균성 글리세랄데히드-3-포스페이트 데히드로게나제 (gpd), 효모 알코올 데히드로게나제, 효모 알코올 옥시다제, 효모 락타제, 효모 3-포스포글리세레이트 키나제, 효모 트리오스포스페이트 이소머라제, 세균성 α-아밀라제, 세균성 Spo2, 또는 SSO로부터 선택된 유전자로부터 유래한다. 또 다른 측면은 전술한 구체예들 중 어느 하나의 발현 벡터를 함유하는 숙주 세포에 관한다.
[0015] 또 다른 측면은 재조합 단백질을 코딩하는 분리된 폴리뉴클레오타이드를 숙주 세포 내로 도입하는 단계, 재조합 단백질이 발현되도록 상기 숙주 세포를 배양하는 단계를 포함하는, 전술한 구체예들 중 어느 하나의 재조합 단백질을 생산하기 위한 방법에 관한 것이다. 특정 구체예에서, 이 방법은 숙주 세포로부터 재조합 단백질을 정제하는 단계를 더 포함한다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 숙주 세포는 진균 세포이다. 특정 구체예에서, 진균 세포는 효모 또는 사상 진균으로부터 선택된다.
[0016] 또 다른 측면은 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인과 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 함유하는 융합 단백질을 코딩하는 폴리뉴클레오타이드를 함유하는 숙주 세포를 제공하는 단계, 및 상기 융합 단백질이 발현되도록 숙주 세포를 배양하는 단계 (여기서 상기 융합 단백질은 N-아세틸글루코사민이 말단 Manα3 잔기로 전달되는 것을 촉매하고 N-아세틸글루코사민이 수용체 글리칸의 말단 Manα6 잔기로 전달되는 것을 촉매하여 복합 N-글리칸을 생산한다)를 포함하는, 복합 N-글리칸의 제조방법에 관한다. 특정 구체예에서, 복합 N-글리칸은 아미노산, 펩타이드, 또는 폴리펩타이드로부터 선택된 분자에 결합된다. 특정 구체예에서, 상기 분자는 이종 폴리펩타이드이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 수용체 글리칸은 Man3dlek. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 복합 N-글리칸은 GlcNAcβ2Manα3(GlcNAcβ2Manα6)Manβ4GlcNAcβ4GlcNAc이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 숙주 세포는 진핵세포(eukaryotic cell)이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 숙주 세포는 진균 세포이다. 특정 구체예에서, 진균 세포는 S. 세레비지아에 , K. 락티스 , P. 파스토리스 , H. 폴리 모르파, C. 알비칸스 , 쉬조사카로마이세스 , 또는 야로위아.로부터 선택된 효모 세포이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 진균 세포는 트리코더마 sp ., 아크레모늄 , 아스퍼질러스, 아우레오바시디움, 크립토코쿠스, 크리소스포리움 , 크리소스포리움 루크노웬스, 필리바시디움 , 푸사리움, 지베렐라 , 마그나포르테, 뮤코, 미셀리오프토라 , 미로테슘, 네오칼리마스틱스 , 뉴로스포라, 페실로마이세스 , 피니실륨, 피로마이세스 , 쉬조필룸, 탈라로마이세스 , 써모아스쿠스 , 틸라비아 , 또는 톨리포클라디움으로부터 선택된 사상 진균 세포이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 숙주 세포는 UDP-GlcNAc 트랜스포터를 코딩하는 폴리뉴클레오타이드를 더 함유한다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 숙주 세포는 돌리킬-P-Man:Man(5)GlcNAc(2)-PP-돌리킬 만노실트랜스퍼라제의 활성 수준이 야생형 숙주 세포에서의 활성 수준에 비해 더 낮다. 특정 구체예에서, 숙주 세포는 야생형 숙주 세포에 비해 alg3 유전자의 발현 수준이 더 낮다. 특정 구체예에서, alg3 유전자는 숙주 세포로부터 결실된다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 숙주 세포는 야생형 숙주 세포에 비해 α-1,6-만노실트랜스퍼라제의 활성 수준이 더 낮다. 특정 구체예에서, 숙주 세포는 야생형 숙주 세포에 비해 och1 유전자의 발현 수준이 더 낮다. 특정 구체예에서, och1 유전자는 숙주 세포로부터 결실된다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 숙주 세포는 α-1,2-만노시다제를 코딩하는 폴리뉴클레오타이드를 더 함유한다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 숙주 세포는 β-1,4-갈락토실트랜스퍼라제를 코딩하는 폴리뉴클레오타이드를 더 함유한다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 숙주 세포는 시알릴트랜스퍼라제를 코딩하는 폴리뉴클레오타이드를 더 함유한다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 숙주 세포에서의 돌리킬-P-Man:Man(5)GlcNAc(2)-PP-돌리킬 만노실트랜스퍼라제의 활성 수준은 야생형 트리코더마 세포에서의 활성 수준에 비해 더 감소된 것이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 숙주 세포는 효모 또는 진균 세포로서 이들 효모 또는 진균 세포에서의 돌리킬-P-Man:Man(5)GlcNAc(2)-PP-돌리킬 만노실트랜스퍼라제의 활성 수준과 알파-1,6-만노실트랜스퍼라제의 활성 수준은 야생형 효모 세포에서의 활성 수준보다 더 감소된 수준이며, α-1,2-만노시다제를 코딩하는 폴리뉴클레오타이드를 더 함유하는 것이다.
[0017] 또 다른 측면은 야생형 숙주 세포에서의 발현 수준에 비해 alg3 유전자의 발현 수준이 더 낮고, N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인을 코딩하는 제1 폴리뉴클레오타이드 및 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 코딩하는 제2 폴리뉴클레오타이드를 함유하는 트리코더마 숙주 세포를 제공하는 단계 및 상기 숙주 세포를 배양하여 복합 N-글리칸을 생산하는 단계를 포함하여 이루어지는 복합 N-글리칸의 생산방법에 관한 것이다.
[0018] 또 다른 측면은 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인 및 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 함유하는 융합 단백질, 수용체 글리칸, 및 N-아세틸글루코사민 공여체(donor)를 완충액에서 함께 인큐베이션시키는 단계 (여기서, 상기 융합 단백질은 N-아세틸글루코사민이 말단 Manα3 잔기로 전달되는 것과 N-아세틸글루코사민이 수용체 글리칸의 말단 Manα6 잔기로 전달되는 것을 촉매하여 복합 N-글리칸을 생산한다)를 포함하는, 복합 N-글리칸의 생산방법에 관한 것이다. 특정 구체예에서, 수용체 글리칸은 아미노산, 펩타이드, 또는 폴리펩타이드로부터 선택된 분자에 결합된다. 특정 구체예에서, 상기 분자는 이종 폴리펩타이드이다. 특정 구체예에서, 수용체 글리칸은 Man3이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, N-아세틸글루코사민 공여체는 UDP-GlcNAc 트랜스포터이다.
[0019] 또 다른 측면은 alg3 및 Man3GlcNAc2의 돌연변이를 함유하는 사상 진균 세포에 관한 것으로서, 여기서 상기 Man3GlcNAc2는 상기 세포에 의해 분비되는 중성 N-글리칸의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 100% (mol%)를 함유한다. 중성 N-글리칸은 아미노산, 펩타이드, 및 폴리펩타이드로부터 선택된 분자에 결합될 수 있다. 특정 구체예에서, alg3의 돌연변이는 alg3의 결실이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 상기 세포는 트리코더마 리세이 세포이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 사상 진균 세포는 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인를 코딩하는 제1 폴리뉴클레오타이드 및 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 코딩하는 제2 폴리뉴클레오타이드를 더 함유한다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 사상 진균 세포는 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인 및 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 함유하는 융합 단백질을 코딩하는 폴리뉴클레오타이드를 더 함유한다.
[0020] 또 다른 측면은 야생형 숙주 세포에서의 활성 수준에 비해 감소된 수준의 만노실트랜스퍼라제 활성 수준을 갖는 숙주 세포를 제공하는 단계 및 상기 숙주 세포를 배양하여 Man3GlcNAc2 글리칸을 생산하는 단계를 포함하는 Man3GlcNAc2 글리칸의 생산방법에 관한 것으로서, 여기서 Man3GlcNAc2 글리칸은 상기 숙주 세포에 의해 분비된 중성 N-글리칸의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 100% (mol%)를 함유하는 것인 방법에 관한 것이다. 중성 N-글리칸은 아미노산, 펩타이드, 및 폴리펩타이드로부터 선택된 분자에 결합될 수 있다. 특정 구체예에서, Man3GlcNAc2 글리칸은 이종 폴리펩타이드에 결합된다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 만노실트랜스퍼라제는 돌리킬-P-Man:Man(5)GlcNAc(2)-PP-돌리킬 만노실트랜스퍼라제이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 숙주 세포에서의 alg3 유전자의 발현 수준은 야생형 숙주 세포에서의 발현 수준에 비해 더 감소된 것이다. 특정 구체예에서, alg3 유전자는 숙주 세포로부터 결실된다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 숙주 세포는 트리코더마 세포이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 숙주 세포에서의 알파-1,6-만노실트랜스퍼라제의 활성은 야생형 숙주 세포에서의 활성 수준에 비해 감소된 것이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 숙주 세포는 α-1,2-만노시다제를 코딩하는 내인성(endogenous) 폴리뉴클레오타이드를 함유한다.
[0021] 또 다른 측면은 alg3 유전자의 발현 수준이 야생형 사상 진균 세포에서의 발현 수준보다 감소된 것인 사상 진균 세포에 관한 것으로, 여기서 상기 사상 진균 세포는 전술한 구체예들 중 어느 하나의 재조합 단백질을 함유하는 것이다. 특정 구체예에서, alg3 유전자는 돌연변이를 함유한다. 좋기로는, 재조합 단백질은 N-아세틸글루코사미닐트랜스퍼라제 활성을 갖는 것이며, 여기서 상기 재조합 단백질은 N-아세틸글루코사민이 말단 Manα3 잔기로 전달되는 것과 N-아세틸글루코사민이 수용체 글리칸의 말단 Manα6 잔기로 전달되는 것을 촉매하며, 여기서 상기 재조합 단백질은 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인 및 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 함유하는 융합 단백질이다. 특정 구체예에서, alg3 유전자의 돌연변이는 alg3 유전자의 결실이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 융합 단백질는 프로모터에 작동적으로 링크된 폴리뉴클레오타이드에 의해 코딩된다. 특정 구체예에서, 프로모터는 유도 프로모터이다. 특정 구체예에서, 유도 프로모터는 cbh1 프로모터이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 사상 진균 세포는 UDP-GlcNAc 트랜스포터를 코딩하는 폴리뉴클레오타이드를 더 함유한다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 사상 진균은 야생형 사상 진균 세포에서의 활성 수준에 비해 더 감소된 α-1,6-만노실트랜스퍼라제의 활성 수준을 갖는다. 특정 구체예에서, 사상 진균에서의 och1 유전자의 발현 수준은 야생형 사상 진균 세포에서의 발현 수준에 비해 더 감소된 수준이다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 사상 진균 세포는 α-1,2-만노시다제를 코딩하는 폴리뉴클레오타이드를 더 함유한다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 사상 진균 세포는 β-1,4-갈락토실트랜스퍼라제를 코딩하는 폴리뉴클레오타이드를 더 함유한다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 사상 진균 세포는 시알릴트랜스퍼라제를 코딩하는 폴리뉴클레오타이드를 더 함유한다. 전술한 구체예들과 병합될 수 있는 특정 구체예에서, 사상 진균 세포는 트리코더마 sp ., 아크레모늄 , 아스퍼질러스, 아우레오바시디움, 크립토코쿠스, 크리소스포리움 , 크리소스포리움 루크노웬스, 필리바시디움 , 푸 사리움, 지베렐라 , 마그나포르테, 뮤코, 미셀리오프토라 , 미로테슘, 네오칼리마스틱스 , 뉴로스포라, 페실로마이세스 , 피니실륨, 피로마이세스 , 쉬조필룸, 탈라로마이세스, 써모아스쿠스 , 틸라비아 , 및 톨리포클라디움으로부터 선택된다.
발명의 상세한 설명
[0064] 본 발명은 N-아세틸글루코사미닐트랜스퍼라제 활성을 갖는 재조합 단백질에 관한 것으로서, 여기서 상기 재조합 단백질은 N-아세틸글루코사민 (GlcNAc)이 말단 수용체 글리칸의 Manα3 잔기로 전달되는 것과 N-아세틸글루코사민이 말단 Manα6 잔기로 전달되는 것을 촉매하며, 여기서 상기 재조합 단백질은 적어도 2 종의 다른 효소로부터 유래된 촉매 도메인을 함유하는 것이다.
[0065] 몇몇 구체예에서, 본 발명의 재조합 단백질은 2개의 촉매 도메인을 포함하는데, 여기서 그 중 하나의 촉매 도메인은 N-아세틸글루코사미닐트랜스퍼라제 I (GnTI) 활성 (예컨대, 말단 Manα3 잔기와 반응한다)을 갖고, 다른 촉매 도메인은 N-아세틸글루코사미닐트랜스퍼라제 II (GnTII) 활성 (예컨대, 말단 Manα6 잔기와 반응한다)을 갖는다.
[0066] 몇몇 구체예에서, 본 발명의 재조합 단백질은 기본적으로 순차적으로 일어나는 반응을 촉매한다. 예를 들어, 본 발명의 재조합 단백질은 먼저 GlcNAc가 말단 Manα3-잔기로 전달되는 것을 촉매한 다음, GlcNAc가 수용체 글리칸의 말단 Manα6-잔기로 전달되는 것을 촉매한다. 일 구체예에서, 기본적으로 순서대로 일어나는 반응은 역순으로 일어나는 반응에 비해 적어도 10배, 적어도 20배, 적어도 30배, 적어도 40배, 적어도 50배, 적어도 60배, 적어도 70배, 적어도 80배, 적어도 90배, 또는 적어도 100배 더 효율적이다. 특정 구체예에서, 순차 반응이라 함은 만일GlcNAc가 말단 Manα3-잔기로 아직 전달되지 않았을 경우, 기본적으로 또는 절대적으로 어떠한 GlcNAc도 말단 Manα6-잔기로 전달되지 못함을 의미하는 것이다. 특별한 구체예에서, 수용체 글리칸은 GlcNAcβ2Manα3-브랜치를 함유한다.
[0067] 몇몇 구체예에서, 재조합 단백질은 임의로 분지형(branched) 수용체 글리칸 중의 Manα3 및 Manα6 잔기들 모두와 특이적으로 반응하지만, 다른 Manα-구조와는 반응하지 않는다. 예컨대, Manα-단당류는 Manα벤질 및/또는 ManαSer/Thr-펩타이드와 컨쥬게이트한다. 비실질적인 반응성은 좋기로는, 말단 Manα3 및 Manα6 잔기와 0.1 mM 수용체 글리칸 농도와의 반응시의 Vmax 의 10% 미만, 8% 미만, 6% 미만, 4% 미만, 2% 미만, 1% 미만, 또는 0.1% 미만인 것이 바람직하다. 특별한 구체예에서, 재조합 단백질은 수용체 글리칸의 말단 Manα3 (좋기로는 GnTI 반응) 및 말단 Manα6 잔기 (좋기로는 GnTII 반응으로서)과 실제로 유사한 반응성을 갖는다. 좋기로는 동일 조건 하에서 다른 촉매 활성에 비해 반응 효율 면에서 촉매 활성이 10배, 5배, 3배 또는 2배 이상 차이가 나지 않는 것이 바람직하다.
[0068] 특별한 구체예에서, GlcNAc의 말단 Manα3 및 Manα6으로의 전달은 Man3 글리칸의 적어도 10%, 적어도 25%, 적어도 50%, 적어도 70%, 적어도 90%, 또는 적어도 95%를 2개의 말단 GlcNAcs를 갖는 글리칸으로 전환되도록 한다. 이 반응의 효율성은 후술하는 실시예 란에서 시험관 분석과 생체내 분석을 통해 측정가능하다. GlcNAc 전달의 효율성은 실시예에 설명된 바와 같이 기본적으로 측정되거나 또는 0.1 mM 수용체 농도 및 최대 공여체 농도에서의 최대 반응속도 Vmax로서 측정될 수 있다. 특별한 구체예에서, 반응 효율성은 아미노산, 펩타이드, 또는 폴리펩타이드에 결합된 Man3 수용체 글리칸을 이용하여 측정된다.
[0069] 본 발명은 또한 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인 및 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 함유하는 융합 단백질을 코딩하는 핵산을 함유하는 숙주 세포를 제공하는 단계 및 융합 단백질이 발현되도록 상기 숙주 세포를 배양하는 단계를 포함하는, 복합 N-글리칸의 제조방법에 관한 것이기도 하며, 여기서, 상기 융합 단백질은 N-아세틸글루코사민이 수용체 글리칸의 말단 Manα3 잔기로 전달되는 것과 N-아세틸글루코사민이 말단 Manα6 잔기로 전달되는 것을 촉매하여 복합 N-글리칸을 제조하는 것이다.
[0070] 본 발명은 또한 야생형 사상 진균 세포에서의 발현 수준에 비해 alg3 유전자의 발현 수준이 감소되고, 본 발명의 재조합 단백질을 함유하는 것인 사상 진균 세포에 관한 것이기도 하다.
정의
[0071] 본 발명에서, "재조합 단백질"은 재조합 핵산으로부터 생산된 모든 단백질을 의미한다. 본 발명에서 "재조합 핵산"이라 함은 다음 명제들 중 적어도 하나는 참인 것인, 핵산들의 폴리머를 의미한다: (a) 핵산 서열이 주어진 숙주 세포에 대해 외래이다 (즉, 자연적으로 발견되는 것이 아니다); (b) 서열이 주어진 숙주 세포에서 자연적으로 발견될 수는 있지만, 다소 부자연스러운 (예컨대 예상보다 많음) 양으로 존재하거나 또는 자연적인 발현 수준에 비해 더 많이 또는 덜 발현된다; 또는 (c) 핵산 서열이 자연에서는 서로에게 동일한 관계로 발견되지 않는 2종 이상의 서브 서열을 포함한다. 예컨대, (c)의 경우, 재조합 핵산 서열은 무관한 유전자들로부터 2종 이상의 서열을 가짐으로 해서 새로운 기능성 핵산이 결과된다. 또 다른 예에서, 재조합 핵산 서열은 자연에서는 서로 인접하여 발견되지 않는 프로모터 서 열과 유전자-코딩 서열을 함유할 것이다.
[0072] 본 발명에서 "N-아세틸글루코사미닐트랜스퍼라제 활성"이라 함은 N-아세틸글루코사미닐 잔기 (GlcNAc)를 수용체 글리칸에 전달하는 효소의 활성을 의미한다. 일반적으로, 이 활성을 갖는 효소들은 N-아세틸글루코사미닐트랜스퍼라제 (GlcNAc 트랜스퍼라제)이다. 특정 구체예에서, GlcNAc 트랜스퍼라제는 진핵생물 기원이다. 특정 구체예에서, GlcNAc 트랜스퍼라제는 GlcNAc-잔기의 1 위치에서 말단 만노스 잔기들로의 β-결합을 형성하는 포유동물의 효소이다. 특정 구체예에서, GlcNAc 트랜스퍼라제는 β2-결합된 GlcNAc-잔기(들)을 글리칸, 특히 N-링크된 글리칸의 2-위치 말단 만노스 잔기들로 전달하는 β2-N-아세틸글루코사미닐트랜스퍼라제이다. 특정 구체예에서, β2-GlcNAc 트랜스퍼라제는 GnTI 활성 및 GnTII 활성을 갖는 효소이다. GnTI 활성은 GlcNAc 잔기를 Manα3 브랜치에 전달한다. Manα3 브랜치는 예컨대 Man3GlcNAc2 또는 Man3 또는 Man5GlcNAc2 또는 Man5와 같이 N-링크된 글리칸 코어 구조의 Manα3(R-Manα6)Manβ-브랜치일 수 있다. GnTI 효소는 포유류 효소, 식물 효소, 또는 하등 진핵생물 효소일 수 있다. GnTII 활성은 GlcNAc 잔기를 Manα6-브랜치, 예컨대 N-링크된 글리칸 코어 구조의 Manα6(GlcNAcβ2Manα3)Manβ-브랜치에 전달한다. 이러한 Manα6-브랜치의 일례는 GlcNAc1Man3GlcNAc2이다.
[0073] 본 발명에서, "N-아세틸글루코사민"이라 함은 N-아세틸글루코사민 잔기 (GlcNAc)를 의미한다. GlcNAc는 글리칸 구조의 일부일 수 있다. 아민기는 위치 2에 존재하고, D-배열을 나타내며, 잔기로서 피라노스 구조를 갖는다. 이것은 2-아세트아미도-2-데옥시-D-글루코피라노스 (D-GlcpNAc)라고도 칭해질 수 있다. GlcNAc는 또한 자유 환원 단당류일 수도 있다(즉, 글리칸의 일부가 아니라).
[0074] 본 발명에서, "Man"이라 함은 만노스 잔기를 가리킨다. "말단 Manα3" 또는 "말단 Manα6" 잔기라 함은 비환원성 엔드 말단 잔기가 다른 단당류 잔기 또는 잔기들에 의해 치환되지 않은 만노스를 의미한다.
[0075] 본 발명에서, "글리칸"은 아미노산, 펩타이드, 폴리펩타이드, 지질 또는 환원 엔드 컨쥬게이트와 같은 캐리어에 링크될 수 있는 올리고당을 의미한다. 특정 구체예에서, 본 발명은 아스파라긴 잔기 (Asn) 의 측쇄 아미드 질소에 N- 결합에 의해 -Asn-Xxx-Ser/Thr-와 같은 폴리펩타이드 N-글리코실화 부위에 컨쥬게이트된 N-링크된 글리칸에 관한 것으로, 여기서 Xxx는 Pro를 제외한 모든 아미노산 잔기일 수 있다. 본 발명은 또한돌리콜-포스포-올리고당 (Dol-P-P-OS) 전구체 지질 구조의 일부로서 의 글리칸에 관한 것으로서, 상기 전구체 지질 구조는 진핵세포의 세포질 세망 내의 N-링크된 글리칸의 전구체이다. 전구체 올리고당은 그들의 환원 엔드가 돌리콜 지질 상의 2개의 포스페이트 잔기에 링크된다. 예컨대, α3-만노실트랜스퍼라제 Alg3은 N-글리칸의 Dol-P-P-올리고당 전구체를 변형시킨다. 일반적으로, 본 발명에 설명된 글리칸 구조는 다른 단당류 잔기 또는 잔기들에 의해 비환원성 잔기가 변형되지 않는 말단 글리칸 구조이다.
[0076] 본 발명에서, "당단백질(glycoprotein)"이라 함은 글리칸에 결합된 펩타이드 또는 폴리펩타이드를 가리킨다. 글리칸은 공동번역 또는 번역후 변형 형태로 펩타이드 또는 폴리펩타이드에 결합될 수 있다.
[0077] 본 발명에서, "당지질(glycolipid)"이라 함은 글리칸에 결합된 지질을 가리키며 글리세로당지질, 글리코스핑고지질, 및 글리코실포스파티딜이노시톨이 여기에 속한다.
[0078] 본 발명의 개시를 통해, 당지질과 탄수화물 명명법은 기본적으로 IUPAC-IUB Commission on Biochemical Nomenclature의 권고에 따랐다 (예컨대 Carbohydrate Res. 1998, 312, 167; Carbohydrate Res. 1997, 297, 1; Eur. J. Biochem. 1998, 257, 29). It is assumed that Gal(갈락토스), Glc(글루코스), GlcNAc (N-아세틸글루코사민), GalNAc (N-아세틸갈락토사민), Man (만노스), 및 Neu5Ac는 D-배열, L-배열의 Fuc이고, 모든 단당류 유닛은 피라노스 형태 (D-Galp, D-Glcp, D-GlcpNAc, D-GalpNAc, D-Manp, L-Fucp, D-Neup5Ac)인 것으로 추정된다. 아민기는 GalNAc 또는 GlcNAc의 2-위치 상의 천연 갈락토스 및 글루코사민에 대한 정의와 같다. 글리코시드 결합은 부분적으로는 더 짧거나 부분적으로 더 긴 명명법으로 나타나며, 시알산 SA/Neu5X-잔기의 결합 α3 및 α6은 각각 α2-3 및 α2-6과 같고, 육탄당 단당류 잔기 α1-3, α1-6, β1-2, β1-3, β1-4, 및 β1-6은 각각α3, α6, β2, β3, β4, 및 β6로 약칭할 수 있다. 락토사민은 II형 N-아세틸락토사민, Galβ4GlcNAc, 및/또는 I형 N-아세틸락토사민을 가리킨다. Galb3GlcNAc 및 시알산(SA)은 N-아세틸뉴라민산 (Neu5Ac), N-글리콜릴뉴라민산 (Neu5Gc), 또는 Neu5X의 유도체를 비롯한 그 밖의 천연 시알산을 가리킨다. 시알산은 NeuNX 또는 Neu5X로서 표시되며, 여기서 X는 좋기로는 Ac 또는 Gc이다. 때로, Neu5Ac/Gc/X는 NeuNAc/NeuNGc/NeuNX로 칭해질 수도 있다.
본 발명의 재조합 단백질
[0079] 본 발명은 N-아세틸글루코사미닐트랜스퍼라제 활성을 갖는 재조합 단백질에 관한 것으로서, 여기서 상기 재조합 단백질은 N-아세틸글루코사민의 말단 Manα3 잔기로의 전달을 촉매하고 N-아세틸글루코사민의 수용체 클리칸의 말단 Manα6 잔기로의 전달을 촉매하는 것이다. 본 발명의 재조합 단백질로는 N-아세틸글루코사미닐트랜스퍼라제 활성을 갖는 전장 단백질, N-아세틸글루코사미닐트랜스퍼라제 활성을 갖는 단백질의 단편, N-아세틸글루코사미닐트랜스퍼라제 활성을 갖는 촉매 도메인, 및 N-아세틸글루코사미닐트랜스퍼라제 활성을 갖는 융합 단백질을 들 수 있으나 이에 한정되지 않는다. 본 발명의 단일(single) 재조합 단백질은 N-아세틸글루코사민의 두 가지 전달 모두를 촉매하는 능력이 있다. N-아세틸글루코사민의 말단 Manα3 잔기로의 전달은 N-아세틸글루코사민의 말단 Manα6 잔기로의 전달 전 또는 전달 후에 일어날 수 있다. 또는, 이러한 전달은 동시에 일어날 수도 있다.
[0080] 수용체 글리칸은 아미노산, 펩타이드, 또는 폴리펩타이드와 같은 분자에 결합될 수 있다. 특정 구체예에서, 아미노산은 아스파라긴 잔기이다. 아스파라긴 잔기는 측쇄 아미드(생물학적인 포유류 폴리펩타이드 N-글리칸 결합 구조)로부터의 아미노글리코시드 결합 중에 포함될 수 있으며 디펩타이드, 올리고펩타이드, 또는 폴리펩타이드와 같은 펩타이드 사슬의 일부일 수도 있다. 글리칸은 환원 GlcNAc 또는 Man의 N-, O-, 또는 C-링크된, 좋기로는 글리코시드, 유도체와 같은 환원 엔드 유도체일 수 있으며, 예컨대 아미노산, 알킬, 헤테로알킬, 아실, 알킬옥시, 아릴, 아릴알킬, 또는 헤테로아릴알킬로 이루어진 군으로부터 선택된 구조에 링크된 특정 글리칸을 갖는 스페이서 또는 말단 유기 잔기일 수 있다. 스페이서는 또한 다가 캐리어 또는 고체상에 링크될 수도 있다. 특정 구체예에서, 알킬-함유 구조로는 메틸, 에틸, 프로필, 및 C4-C26 알킬, 지질 예컨대 글리세롤지질, 인지질, 돌리콜-인지질 및 세라마이드 및 유도체를 들 수 있다. 환원 엔드(reducing end)는 또한 환원성 아민화에 의해 유도화되어 2차 아민 결합 또는 유도체 구조화될 수도 있다. 특정 캐리어로는 (폴리)펩타이드와 같은 바이폴리- 또는 올리고머, (다)당류, 예컨대 덱스트란, 셀룰로스, 아밀로스 또는 글리코사미노글리칸, 및 기타의 유기 폴리머 또는 올리고머 예컨대 플라스틱 예컨대 폴리에틸렌, 폴리프로필렌 폴리아미드(예컨대 나일론 또는 폴리스티렌), 폴리아크릴아미드 및 폴리락트산, 덴드리머 예컨대 PAMAM, Starburst 또는 Starfish 덴드리머, 또는 폴리리신 및 폴리알킬글리콜 예컨대 폴리에틸렌 글리콜(PEG)를 들 수 있다 고체상( solid phases)로는 마이크로타이터 웰, 실리카 입자, 유리, 금속(강철, 금 및 은 등), 폴리머 비드 예컨대 폴리스티렌 또는 레진 비드, 폴리락트산 비드, 다당류 비드 또는 유기 스페이서를 함유하는 마그네틱 비드를 들 수 있다.
[0081] 특정 구체예에서, 수용체 글리칸은 이종 폴리펩타이드에 결합된다. 본 발명에서, "펩타이드" 및 "폴리펩타이드"는 복수개의 연속적으로 중합된 아미노산 잔기들을 포함하는 아미노산 서열이다. 본 발명의 목적상, 일반적으로, 펩타이드는 50개 이하의 아미노산 잔기를 포함하는 분자이고 폴리펩타이드는 50개가 넘는 아미노산 잔기를 포함하는다. 펩타이드 또는 폴리펩타이드는 변형된 아미노산 잔기들, 코돈에 의해 코딩되지 않은 자연발생적인 아미노산 잔기들 및 비자연발생적인 아미노산 잔기들을 포함할 수 있다. 본 발명에서 "단백질"은 펩타이드 또는 폴리펩타이드의 크기일 수 있다. "이종 폴리펩타이드"라는 용어는 주어진 숙주 세포에서 자연적으로 발견되지 않거나 주어진 숙주 세포에 내인성이 아닌 폴리펩타이드를 가리킨다. 특정 구체예에서, 이종 폴리펩타이드는 치료용 단백질(therapeutic protein)이다. 치료용 단백질에는 예컨대 모노클로날 항체, 에리쓰로포이에틴, 인터페론, 성장 호르몬, 효소 또는 응혈인자가 포함될 수 있다. 예컨대, 수용체 글리칸은 리툭시맙과 같은 치료용 단백질에 결합될 수 있다.
수용체 글리칸
[0082] 특정 구체예에서, 수용체 글리칸의 구조는 다음식, [R1]yMan α3([R2]zMan α6)Man{β4GlcNAc(Fucax)n[β4GlcNAc]m}q으로 나타낼 수 있으며, 여기서 q, y, z, n 및 m은 0 또는 1; x는 임의의 퓨코스 잔기의 링크 위치 3 또는 6이고; R1은 GlcNAc, 좋기로는 GlcNAcβ2; 및 R2는 분지상 구조 Manα3(Manα6)이며, 단 z가 1이면, y는 0이고 z가 0이면, y는 0 또는 1이다. ( )는 레귤러 N- 글리칸 코어 구조 중의 브랜치를 정의하는 것으로서 존재 또는 부재할 수 있다. [ ] 및 { }는 글리칸 구조의 일부로서 선형 서열 중에 존재 또는 부재할 수 있다. z가 0이고 y가 0이면 상기 구조는 Man3 글리칸이며, z가 0이고 y가 1이면 상기 주노는 GlcNAcMan3 글리칸이다. y가 0이고 z가 1이면, 상기 글리칸은 Man5 글리칸이다. 수용체 글리칸은 Asn 잔기에 베타-글리코시드 결합될 수 있으며, 좋기로는 환원 엔드 GlcNAc로부터 결합되는 것이 바람직하다. 일 구체예에서 수용체 글리칸은 폴리펩타이드 링크된 N-글리칸인데, 여기서 m 및 q는 1이고, 수용체 구조는 [R1]yMan α3([R2]zMan α6)Manβ4GlcNAc(Fucax)nβ4GlcNAc의 유도체를 함유한다. 임의의 유도체에는 GlcNAc 또는 자일로스와 같은 단당류 잔기들에 의한 치환이 포함된다.
[0083] 수용체 글리칸은 Man3, GlcNAcMan3, 또는 Man5일 수 있다. 특정 구체예에서, 수용체 글리칸은 Man3 또는 GlcNAcMan3이다. Man3은 Manα3 또는 Manα6 잔기들 중 적어도 1개를 포함하는 트리만노실 글리칸이며 좋기로는 Manα3(Manα6)Man과 같은 분지형 올리고당인 것이 바람직하다. 기타 특정한 Man3 올리고당으로는 Manα3(Manα6)Manβ, Manα3(Manα6)Manβ4GlcNAc, 및 폴리펩타이드-링크된 Manα3(Manα6)Manβ4GlcNAcβ4GlcNAc을 들 수 있다. 또한, 숙주 세포에 따라, 글리칸은 예컨대 Manα3(Manα6)Manβ4GlcNAcβ4(Fucax)nGlcNAc (여기서 x는 3 또는 6이고 n은 0 또는 1이다)와 같이 Manβ 및/또는 GlcNAc 잔기들 중에 Fuc, Xyl 또는 GlcNAc를 함유할 수 있으며, 또는 Man3GlcNAc2 (n은 0) 및 Man3GlcNAc2Fuc (n은 1)와 같이, 말단 만노스 구조 및 환원 엔드 조성을 나타내기도 한다. 특정 구체예에서, 특히 폴리펩타이드-결합 구조를 갖는 경우, Man3 구조는 Manα3(Manα6)Manβ4GlcNAcβ4(Fuca6)nGlcNAc이다. 특정 구체예에서, 폴리펩타이드-링크된 GlcNAcMan3 구조는 GlcNAcβ2Manα3(Manα6)Manβ4GlcNAcβ4(Fuca6)nGlcNAc이며, 단당류 조성 GlcNAcMan3GlcNAc2 (n은 0) 및 GlcNAcMan3GlcNAc2Fuc (n은 1)로도 설명된다. 특정 구체예에서, 폴리펩타이드-링크된 Man5 구조는 Manα3{Manα3(Manα6)Manα6}Manβ4GlcNAcβ4(Fuca6)nGlcNAc이고, 여기서 { } 및 ( )는 브랜치를 나타내고 n은 0 또는 1을 나타내며, 단당류 조성식 Man5GlcNAc2 (n은 0) 및 Man5GlcNAc2Fuc (n은 1)으로도 표시된다.
[0084] 따라서, 특정 Man3 글리칸은 다음 식, Manα3(Manα6)Manβ4GlcNAc(Fucax)nβ4GlcNAc에 따른 구조를 가지며, 여기서 n은 0 또는 1로서 그 분자의 일부가 존재 또는 부재함을 나타내며, x는 3 또는 6을 나타내고 ( )는 상기 구조 중의 브랜치를 정의하는 것이다. 수용체 글리칸이 Man3인 본 발명의 구체예에서, 재조합 단백질은 N-아세틸글루코사민이 Man3의 말단 Manα3 및 Manα6으로 전달되는 것을 촉매하므로, GlcNAc2Man3, GlcNAcβ2Manα3(GlcNAcβ2Manα6)Manβ4GlcNAcβ4(Fucax)nGlcNAc (여기서 n은 0 또는 1이다)가 결과되며, 이것은 단당류 조성식 GlcNAc2Man3GlcNAc2 (n은 0) 및 GlcNAc2Man3GlcNAc2Fuc (n은 1)로도 설명된다.
[0085] 수용체 글리칸이 Man5인 본 발명의 구체예에서, 재조합 단백질은 N-아세틸글루코사민이 Man5의 말단 Manα3으로 전달되는 것을 촉매한다. 2개의 만노스가 GlcNAcMan5로부터 제거되어(예컨대, 만노시다제 II에 의해) GlcNAcMan3이 형성되면, 재조합 단백질은 N-아세틸글루코사민의 말단 Manα6으로의 전달을 촉매함에 따라, GlcNAc2Man3이 결과된다 (이것은 구조식 GlcNAcβ2Manα3(GlcNAcβ2Manα6)Manβ4GlcNAcβ4(Fucax)nGlcNA을 가지며, 여기서 n은 0 또는 1이고, 항체에 결합 될 경우 G0으로도 칭해짐).
N- 아세틸글루코사미닐트랜스퍼라제 촉매 도메인을 함유하는 융합 단백질
[0086] 특정 구체예에서, 본 발명의 재조합 단백질은 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인 및 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 함유하는 융합 단백질이다. "융합 단백질"이라는 용어는 이종 아미노산에 링크된 단백질 또는 폴리펩타이드를 함유하는 모든 단백질 또는 폴리펩타이드를 칭한다.
[0087] N-아세틸글루코사미닐트랜스퍼라제 I (GlcNAc-TI; GnTI; EC 2.4.1.101)은 반응 UDP -N-아세틸-D-글루코사민 + 3-(알파-D-만노실)-β-D-만노실-R <=> UDP + 3-(2-(N-아세틸-β-D-글루코사미닐)-알파-D-만노실)-β-D-만노실-R을 촉매하는데, 여기서 R은 글리칸 수용체 중 N-링크된 올리고당의 잔부(remainder)를 나타낸다. N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인은 이 반응을 촉매할 수 있는 N-아세틸글루코사미닐트랜스퍼라제 I 효소의 여하한 일부분이다. 다양한 생명체로부터의 N-아세틸글루코사미닐트랜스퍼라제 I 효소의 아미노산 서열이 SEQ ID NOs: 1-19에 수록되어 있다. 부가적인 GnTI 효소는 글리코실트랜스퍼라제 패밀리 13 중의 CAZy 데이터베이스에 수록되어 있다. (cazy.org/GT13_all). 효소적으로 특징지어지는 종으로는 A. 탈리아나 AAR78757.1 (US6 653 459), C. 엘레간스 AAD03023.1 (Chen S. et al J. Biol.Chem 1999;274(1):288-97), D. 멜라노가스터 AAF57454.1 (Sarkar ' Schachter Biol Chem. 2001 Feb;382(2):209-17); C. 그리세우스 AAC52872.1 (Puthalakath H. et al J. Biol.Chem 1996 271(44):27818-22); H. 사피엔스 AAA52563.1 (Kumar R. et al Proc Natl Acad Sci U S A. 1990 Dec;87(24):9948-52); M. 아우라투스 AAD04130.1 (Opat As et al Biochem J. 1998 Dec 15;336 (Pt 3):593-8), (유도화 돌연변이의 예를 포함한다, 토끼, O. 쿠니쿨루 AAA31493.1 (Sarkar M et al. Proc Natl Acad Sci U S A. 1991 Jan 1;88(1):234-8)을 들 수 있다. 특징적인 활성 효소의 또 다른 예는 cazy.org/GT13_characterized.에서 찾아볼 수 있다. 토끼의 GnTI의 촉매 도메인의 3D 구조는 Unligil UM et al. EMBO J. 2000 Oct 16;19(20):5269-80에서 X-선 결정학에 의해 정의되었다. GnTI의 Protein Data Bank (PDB) 구조는 1FO8, 1FO9, 1FOA, 2AM3 , 2AM4, 2AM5, 및 2APC이다. 특정 구체예에서, N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인은 인간 N-아세틸글루코사미닐트랜스퍼라제 I 효소 (SEQ ID NO: 1), 또는 그의 변이체들로부터 유래한다. 특정 구체예에서, N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인은 SEQ ID NO: 1의 아미노산 잔기 84-445와 아미노산 잔기와 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 함유한다. 몇몇 구체예에서, 보다 짧은 서열을 촉매 도메인으로서 이용할 수 있다 (예컨대 인간 효소의 아미노산 잔기 105-445 또는 토끼 효소의 아미노산 잔기 107-447; Sarkar et al. (1998) Glycoconjugate J 15:193-197). GnTI 촉매 도메인으로서 사용될 수 있는 부가적인 서열로는 인간 효소의 아미노산 30 내지 105로부터의 아미노산 잔기 또는 아미노산 잔기 30 내지 105 사이에서 시작하여 인간 효소의 아미노산 약 445까지 계속되는 C-말단 스템 도메인, 또는 다른 GnTI의 대응하는 동종 서열 또는 그의 촉매적 활성 변이체 또는 돌연변이체를 들 수 있다. 촉매 도메인은 예컨대 스템 도메인, 막투과 도메인, 또는 세포질 도메인의 전부 또는 일부와 같이 효소의 N-말단의 일부를 포함할 수 있다.
[0088] 본 발명에서, "세포질"은 세포의 세포질과 상호반응하는 단백질의 일부를 가리키는데 사용된다.
[0089] N-아세틸글루코사미닐트랜스퍼라제 II (GlcNAc-TII; GnTII; EC 2.4.1.143)는 반응 UDP -N-아세틸-D-글루코사민 + 6-(알파-D-만노실)-β-D-만노실-R <=> UDP + 6-(2-(N-아세틸-β-D-글루코사미닐)-알파-D-만노실)-β-D-만노실-R을 촉매하는데, 여기서 R은 글리칸 수용체 중 N-링크된 올리고당의 잔부이다. N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인은 이 반응을 촉매할 수 있는 N-아세틸글루코사미닐트랜스퍼라제 II 효소의 여하한 일부분이다. 다양한 생명체로부터 기원하는 N-아세틸글루코사미닐트랜스퍼라제 II 효소의 아미노산 서열들이 SEQ ID NOs: 20-33에 기재되어 있다. 특정 구체예에서, N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인은 인간 N-아세틸글루코사미닐트랜스퍼라제 II 효소 (SEQ ID NO: 20)로부터 유래한다. 부가적인 GnTII 종이 글리코실트랜스퍼라제 패밀리 16의 CAZy 데이터베이스에 기재되어 있다(cazy.org/GT16_all). 효소적으로 특징적인 종에는 GnTII of C. 엘레간스, D. 멜라노가스터 , 호모 사피엔스, 라투스 노르베기구스 , 수스 스크로파 (cazy.org/GT16_characterized)가 포함된다. 특정 구체예에서, N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인은 SEQ ID NO: 21의 아미노산 잔기 약 30 내지 약 447과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 포함한다. 이 촉매 도메인은 스템 도메인, 막투과 도메인, 또는 세포질 도메인의 전부 또는 일부와 같은 효소의 N-말단 부분을 포함할 수 있다.
[0090] 특정 구체예에서, N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인은 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인에 대해 N-말단이다. 다른 ㄱ구체예에서, N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인은 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인에 대해 N-말단이다. "N-말단(N-terminal)"이라는 용어는 레퍼런스 세트의 아미노산 잔기에 비해 유리 아민기(-NH2) 가 있는 아미노산에 의해 종결된 폴리펩타이드의 엔드에 근접한 아미노산 잔기 세트의 위치를 가리키는 것이다.
스페이서( Spacers )
[0091] 본 발명의 특정 구체예에서, 재조합 단백질은 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인과 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인 사이에 스페이서를 함유한다. "스페이서"라는 용어는 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인과 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 이격시키는 연속적인 아미노산 서열이면 어느 것이든 가리키는 것으로서, 스페이서는 따라서 촉매 도메인의 효소 기능에는 아무런 영향도 미치지 않는다. 일반적으로, 스페이서는 그 길이가 적어도 5, 적어도 10, 적어도 15, 적어도 20, 적어도 30, 적어도 40, 또는 적어도 50개의 아미노산이다. 특정 구체예에서, 스페이서는 스템 도메인으로부터의 서열을 함유한다. "스템 도메인"은 글리코실트랜스퍼라제나 글리코실 히드롤라제와 같은 천연 효소의 막투과 도메인에 인접 위치한 단백질 도메인 또는 그의 단편을 가리키는 것으로서, 임의로 ER/골지체에서 효소를 유지시키기 위해 또는 효소를 유지하는것을 돕기 위해 효소를 표적화하는 역할을 한다. 스템 도메인은 일반적으로 소수성 막투과 도메인에 이은 첫번째 아미노산으로부터 시작하여 촉매 도메인에서 종결된다. 스템 도메인의 비제한적인 예로는 인간 GnTI의 스템 도메인, 인간 GnTII의 아미노산 잔기 약 30 내지 약 83 또는 약 30 내지 약 105, 또는 T. 리세이 KRE2의 또는 아미노산 잔기약 26 내지 약 106 또는 약 26 내지 약 83을 들 수 있다. 스페이서가 스템 도메인으로부터의 서열을 함유하는 특정 구체예에서, 스페이서는 인간 GnTI 서열 (SEQ ID NO: 34)의 아미노산 30-83을 포함한다. 다른 구체예에서, 스페이서는 SEQ ID NOs: 35-38에 기재된 서열들을 포함할 수 있다.
[0092] 적절한 스페이서의 또 다른 비제한적인 예로는 플렉시블 스페이서 3XG4S (SEQ ID NO: 118), 플렉시블 스페이서 2XG4S (SEQ ID NO: 120), T. 리세이 CBHI (SEQ ID NO: 122)의 스페이서; 및 T. 리세이 EGIV 셀룰라제 (SEQ ID NO: 124)의 스페이서를 들 수 있다.
[0093] 특정 구체예에서, 스페이서의 길이는 GnT1의 스템 도메인의 길이와 대략 동일하다. 특정 구체예에서, 그 길이는 약 74개의 아미노산 잔기, 플러스 또는 마이너스 약 37개의 아미노산이다. 예컨대, 스페이서 길이는 약 30개 아미노산 내지 약 110개 아미노산, 또는 약 35개 아미노산 내지 약 100개 아미노산이거나, 또는 본 발명에서 예시되는 바와 같이, 플러스 또는 마이너스 2, 3, 4, 또는 5개 아미노산이다. 일 구체예에서 스페이서 길이는 GnT1의 트렁케이트형 스템 도메인에 해당하며, 예컨대, 아미노산 25 내지 아미노산 104 사이, 또는 아미노산 30 내지 아미노산 101 사이에서 시작하여 GnT1 스템 도메인의 말단에까지 이른다. 특정 구체예에서, 스페이서는 인간 GnT1의 스템 도메인의 일부를 포함할 수 있으며, 아미노산 70 내지 아미노산 87 (SEQ ID NO: 34의 넘버링에 따름) 사이, 또는 아미노산 76 내지 아미노산 104 사이에 위치한 아미노산으로부터 시작하거나, 또는 아미노산 30, 35, 40, 45, 50, 60, 70, 73, 74, 75, 76, 80, 83, 84, 85, 86, 87, 100, 101, 102, 103, 또는 104로부터 시작하여, 인간 GnT1 스템 도메인의 말단에서 끝난다. 다른 구체예에서, 스페이서는 이종 스페이서 펩타이드를 포함할 수 있고, 여기에는 진균 스페이서 펩타이드 및/또는 반복적 올리고머 스페이서 펩타이드가 포함될 수 있다..
[0094] 일반적으로, 스페이서는 특정 배열없이 연장된 펩타이드이며 높은 신축성(flexibility) (예컨대, Gly 및 Ala), 소수성 (예컨대, Ser 및 Thr), 및 임의로 배열 회피를 위해 Pro를 함유한다. 스페이서는 글리코실화될 수 있다. 특정 구체예에서 스페이서는 진균성 O-만노실화를 포함하여 O-글리코실화된다. 특정 구체예에서 스페이서는 내인성 진균성, 사상 진균성, 또는 트리코더마 스페이서 펩타이드, 예컨대 단백질 도메인을 자연적으로 이격시키는 스페이서이다. 스페이서는 사상 진균(예컨대, T. 리세이)와 같은 진균의 분비된 또는 셀룰로스 분해 효소로부터 유래된 것이거나 또는 그의 단편일 수 있고 또는 스페이서 및/또는 그의 단편의 멀티머 또는 돌연변이된 유사체 또는 등가물일 수 있다. 천연의 진균성 스페이서는 다이머 또는 올리고머형 프롤린 및/또는 글리신 및/또는 세린 및/또는 쓰레오닌, 및/또는 Ser, Thr, Gly, Pro 또는 Ala 또는 이들의 여하한 조합으로부터 선택된 복수개의 아미노산 잔기를 함유할 수 있다. 특정 구체예에서, 스페이서는 Ser, Thr, Gly, Pro 또는 Ala로부터 선택된 1-10 또는 1-5개의 아미노산 잔기들 및 임의로 음하전된 잔기 Glu 또는 Asp 또는 양하전된 잔기 Lys 또는 Arg로부터 선택된 하전된 아미노산 잔기들을 함유하는 반복적인 올리고머이다. 특정 구체예에서 하전된 잔기들은 음하전된 잔기이다. 특정 구체예에서 상기 모노머는 다이머 또는 올리고머형 아미노산 잔기, 및/또는 Ser, Thr, Gly, Pro 및 Ala로부터 선택된 복수개의 단일 아미노산 잔기를 함유한다 . 특정 구체예에서 올리고머는 Ser, Thr, Gly, Pro 및 Ala로부터 선택된 단일 잔기 및 글리신의 올리고머 또는 다이머의 모노머를 함유한다. 특정 구체예에서, 잔기는 Ser 또는 Thr이다. 특정 구체예에서 잔기는 Ser이다. 특정 구체예에서, 반복적인 스페이서의 서열은 {(Yyy)nXxx}m인데 여기서 n은 2 내지 10, m은 2 내지 10이고, Xxx 및 Yyy는 Ser, Thr, Gly, Pro 및 Ala로부터 선택되며, 단, Xxx 및 Yyy는 동일한 아미노산 잔기가 아니다. 특정 구체예에서 반복적인 스페이서는 {(Gly)nXxx}m이고 여기서 n은 2 내지 10, m은 2 내지 10이며, Xxx는 Ser, Thr, Gly, Pro 및 Ala로부터 선택된다. 특정 구체예에서 Xxx는 Ser 또는 Thr이다. 특정 구체예에서 Xxx는 Ser이다.
표적화 펩타이드( Targeting Peptides )
[0095] 특정 구체예에서, 본 발명의 재조합 단백질은 촉매 도메인에 링크된 표적화 도메인을 포함한다. 본 발명에서 "링크된(linked)"이라는 표현은 폴리펩타이드의 경우 아미노산 잔기들의 2개 폴리머 또는 폴리뉴클레오타이드의 경우 뉴클레오타이드의 2개 폴리머가 서로 직접적으로 인접하여 커플링된 상태 또는 동일 폴리펩타이드 또는 폴리뉴클레오타이드 내에 존재하지만 개재(invervening) 아미노산 잔기나 뉴클레오타이드에 의해 이격되어 있는 상태를 의미한다. 본 발명에서 "표적화 펩타이드"라 함은, 재조합 단백질을 숙주세포 내의 세포질 세망(ER) 또는 골지체(골지)로 국소화시킬 수 있는 재조합 단백질의 여하한 수의 연속 아미노산 잔기를 가리킨다. 표적화 펩타이드는 촉매 도메인에 대해 N-말단 또는 C-말단일 수 있다. 특정 구체예에서, 표적화 펩타이드는 만노시다제 II 효소와 같은 ER 또는 골지 성분에 대한 결합을 제공한다. 다른 구체예에서, 표적화 펩타이드는 ER 또는 골지 막에 대해 직접적인 결합을 제공한다.
[0096] 표적화 펩타이드의 구성 성분들은 ER 또는 골지체 중에 보통 존재하는 여하한 효소로부터 유래할 수 있다. 이러한 효소로는 만노시다제, 만노실트랜스퍼라제, 글리코실트랜스퍼라제, 2형 골지 단백질, 및 MNN2, MNN4, MNN6, MNN9, MNN10, MNS1, KRE2, VAN1, 및 OCH1 효소를 들 수 있다. 이러한 효소는 효모나 진균 종 예컨대 아크레모니움, 아스퍼질러스, 아우레오바시디움, 크립토코쿠스, 크리소스포리 움, 크리소스포리움 루크노웬스, 필로바시디움, 푸사리움, 지베렐라, 휴미콜라, 마그나포르테, 뮤코, 미셀리오프토라 , 미로테슘, 네오칼리마스틱스 , 뉴로스포라, 페실로마이세스 , 피니실륨, 피로마이세스 , 쉬조필룸, 탈라로마이세스 , 써모아스쿠스 , 틸라 비아, 톨리포클라디움, 및 트리코더마로부터 유래될 수 있다. 이러한 효소의 서열은 GenBank 서열 데이터베이스에서 찾을 수 있다.
[0097] 특정 구체예에서 표적화 펩타이드는 재조합 단백질의 촉매 도메인들 중 하나와 동일한 효소 및 생명체로부터 유래한다. 예컨대, 만일 재조합 단백질이 인간 GnTII 촉매 도메인을 포함하면, 그 재조합 단백질의 표적화 펩타이드는 인간 GnTII 효소로부터 유래한다. 다른 구체예에서, 표적화 펩타이드는 재조합 단백질의 촉매 도메인과는 다른 효소 및/또는 생명체로부터 유래한다.
[0098] 본 발명의 재조합 단백질을 표적화하는데 이용될 수 있는, ER 또는 골지로 단백질을 표적화시키는데 이용가능한 다양한 표적화 펩타이드의 예로는 다음을 들 수 있다: 갈락토실트랜스퍼라제에 융합된 Kre2/Mnt1 N-말단 펩타이드 (Schwientek, JBC 1996, 3398), 만노시다제를 효모의 ER에 국소화시켜 Man5를 생산하기 위한 HDEL (Chiba, JBC 1998, 26298-304; Callewaert, FEBS Lett 2001, 173-178), GnTI 촉매 도메인에 융합된 OCH1 표적화 펩타이드 (Yoshida et al, Glycobiology 1999, 53-8), α2-만노시다제에 융합된 Mns1의 효모 N-말단 펩타이드 (Martinet et al, Biotech Lett 1998, 1171), GnTI 또는 β4GalT의 촉매 도메인에 링크된 Kre2 의 N-말단 부분 (Vervecken, Appl. Environ Microb 2004, 2639-46),Wildt 및 Gerngross의 문헌 (Nature Rev Biotech 2005, 119)에서 검토된 다양한 접근법, 아스퍼질러스 니둘란스 중의 전장 GnTI (Kalsner et al, Glycocon. J 1995, 360-370), 아스퍼질러스 오리제 중의 전장 GnTI (Kasajima et al, Biosci Biotech Biochem 2006, 2662-8), 아스퍼질러스C. 엘레간스 GnTI 에 융합된 효모 Sec12 국소화 구조의 일부분 (Kainz et al 2008), 아스퍼질러스 중 인간 GnTI 에 융합된 효모 Mnn9의 N-말단 부분( Kainz et al 2008), 인간 GnTI에 융합된 아스퍼질러스 Mnn10의 N-말단 부분 (Kainz et al, Appl. Environ Microb 2008, 1076-86), 및T. 리세이 중 전장 인간 GnTI (Maras et al, FEBS Lett 1999, 365-70).
[0099] 특정 구체예에서 표적화 펩타이드는 SEQ ID NO: 115 또는 SEQ ID NO: 116의 아미노산 서열을 갖는 Kre2/Mnt1(즉, Kre2) 표적화 펩타이드이다.
[00100] 표적화 펩타이드로서 사용될 수 있는 서열들의 추가 예를 하기 표 1에 나타내었다.
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
[00101] 단백질들 중 하나가 특징화되지 않은 서열을 유일한 표적화 펩타이드로서 함유하는 경우, 숙주 세포의 글리코실화 경로에서 단백질을 발현시켜 글리칸 생합성의 세포질 국소화를 참조로 생산된 글리칸을 측정하거나 (예컨대 Schwientek JBC 1996 3398에서와 같이), 또는 표적화 펩타이드와 융합된 형광 리포터 단백질을 발현시켜 면역형광법에 의해 또는 골지체의 세포질막을 분획화에 의해 골지체 중 단백질의 국소화를 분석하여 단백질의 국소화를 측정함으로써, 특징화되지 않은 서열의 표적화 단백질로서의 이용성을 검사할 수 있다.
[00102] 표적화 펩타이드는 스템 도메인을 포함할 수 있다. 특정 구체예에서, 스템 도메인은 N-아세틸글루코사미닐트랜스퍼라제 I 효소 또는 N-아세틸글루코사미닐트랜스퍼라제 II 효소로부터 유래한다. 특히 특정 구체예에서, 스템 도메인은 인간 N-아세틸글루코사미닐트랜스퍼라제 I 효소 또는 인간 N-아세틸글루코사미닐트랜스퍼라제 II 효소로부터 유래한다. 인간 N-아세틸글루코사미닐트랜스퍼라제 I 효소로부터 유래하는 스템 도메인에 대응하는 서열은 SEQ ID NO: 34이다. 인간 N-아세틸글루코사미닐트랜스퍼라제 II 효소로부터 유래하는 스템 도메인에 대응하는 서열은 SEQ ID NO: 20의 잔기 30-85이다.
[0103] 표적화 펩타이드는 막투과 도메인을 포함할 수 있다. "막투과 도메인(transmembrane domain)"은 막 중에서 3차원 구조로 열역학적으로 안정하게 존재하는 아미노산 잔기의 서열을 말한다. 표적화 펩타이드가 스템 도메인 역시도 포함하는 구체예에서, 막투과 도메인은 스템 도메인에 대해 N-말단이다. 특정 구체예에서, 막투과 도메인은 N-아세틸글루코사미닐트랜스퍼라제 I 효소 또는 N-아세틸글루코사미닐트랜스퍼라제 II 효소로부터 유래한다. 특히 특정 구체예에서, 막투과 도메인은 인간 N-아세틸글루코사미닐트랜스퍼라제 I 효소 또는 인간 N-아세틸글루코사미닐트랜스퍼라제 II 효소로부터 유래한다. 인간 N-아세틸글루코사미닐트랜스퍼라제 I 효소로부터 유래하는 막투과 도메인에 대응하는 서열은 SEQ ID NO: 1의 잔기 7-29이다. 인간 N-아세틸글루코사미닐트랜스퍼라제 II 효소로부터 유래하는 막투과 도메인에 대응하는 서열은 SEQ ID NO: 20의 잔기 10-29이다.
[00104] 표적화 펩타이드는 세포질 도메인을 포함할 수 있다. "세포질 도메인(cytoplasmic domain)"이라는 용어는 세포질 혼경에서 3차원 구조로서 열역학적으로 안정한 아미노산 서열을 가리킨다. 표적화 펩타이드가 스템 도메인 역시도 포함하는 구체예에서, 세포질 도메인은 막투과 도메인에 대해 N-말단이다. 특정 구체예에서, 세포질 도메인은 N-아세틸글루코사미닐트랜스퍼라제 I 효소 또는 N-아세틸글루코사미닐트랜스퍼라제 II 효소ㄹ부터 유래한다. 특히 특정 구체예에서, 세포질 도메인은 인간 N-아세틸글루코사미닐트랜스퍼라제 I 효소 또는 인간 N-아세틸글루코사미닐트랜스퍼라제 II 효소로부터 유래한다. 인간 N-아세틸글루코사미닐트랜스퍼라제 I 효소로부터 유래하는 세포질 도메인에 대응하는 서열은 SEQ ID NO: 1의 잔기 1-6이다. 인간 N-아세틸글루코사미닐트랜스퍼라제 II 효소로부터 유래하는 세포질 도메인에 대응하는 서열은 SEQ ID NO: 20의 잔기 1-9이다.
[00105] 특정 구체예에서, 재조합 단백질은 인간 GnTI 촉매 도메인에 대하여 N-말단인 인간 GnTII 촉매 도메인을 포함하며 상기 촉매 도메인들 간에 인간 GnTI 스템 도메인을 함유하는 스페이서 서열을 갖는다. 이 구체예에서, 재조합 단백질은 인간 GnTII로부터 세포질, 막투과 및 스템 도메인과 함께 GnTII 촉매 도메인에 N-말단인 표적화 단백질도 포함한다. 이 구체예에서 재조합 단백질의 서열은 SEQ ID NO: 95와 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일하며, 이 구체예의 재조합 단백질을 코딩하는 가능한 cDNA는 SEQ ID NO: 96이다.
[00106] 다른 구체예에서, 재조합 단백질은 스페이서 서열과 함께 인간 GnTI 촉매 도메인에 대해 N- 말단인 인간 GnTII 촉매 도메인을 함유한다. 스페이서 서열은 SEQ ID NOs: 118, 120, 122, 또는 124와 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 함유할 수 있으나 이들로 한정되지 않는다. 이 구체예에서, 재조합 단백질은 또한 인간 GnTII로부터 세포질, 막투과 및 스템 도메인과 함께 GnTII 촉매 도메인에 N-말단인 표적화 단백질도 포함한다. 따라서, 특정 구체예에서, 재조합 단백질의 서열은 SEQ ID NOs: 119, 121, 123, 및 125로부터 선택된 서열과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일하다. 특정 구체예에서, SEQ ID NO: 119의 재조합 단백질을 코딩하는 가능한 cDNA 서열은 SEQ ID NO: 141이다. 다른 구체예에서, SEQ ID NO: 121의 재조합 단백질을 코딩하는 가능한 cDNA 서열은 SEQ ID NO: 139이다. 또 다른 구체예에서, SEQ ID NO: 123의 재조합 단백질을 코딩하는 가능한 cDNA 서열은 SEQ ID NO: 143이다. 또 다른 구체예에서 SEQ ID NO: 125의 재조합 단백질을 코딩하는 가능한 cDNA 서열은 SEQ ID NO: 145이다.
본 발명의 재조합 단백질의 생산
[00107] 본 발명의 또 다른 측면은 본 발명의 재조합 단백질로을 코딩하는 분리된 폴리뉴클레오타이드이다. 본 발명에서 "폴리뉴클레오타이드," "핵산 서열," "핵산의 서열" 및 이들의 변이체에 관한 용어는 폴리데옥시리보뉴클레오타이드 (2-데옥시-D-리보스를 포함한다), 폴리리보뉴클레오타이드 (D-리보스를 포함한다), 퓨린 또는 피리미딘 염기의 N-글리코사이드인 기타 유형의 폴리뉴클레오타이드, 및 비뉴클레오타이드 백본을 함유하는 기타 폴리머에 대한 것에 일반적이며, 단, 상기 폴리머들은 DNA및 RNA에서 발견되는 것과 같이, 베이스 페어링과 베이스 스탱킹을 가능케 하는 배열로 뉴클레오베이스들을 함유하는 것이다. 따라서, 이들 용어들은 핵산 서열 변형의 공지 유형을 포함하며, 예컨대, 자연발생적인 뉴클레오타이드 1개 이상을 유사체로 치환하는 것; 예컨대 비하전 결합을 갖는 것 (예컨대 메틸 포스포네이트, 포스포트리에스테르, 포스포라미데이트, 카바메이트 등), 음하전 결합을 갖는 것 (예컨대 포스포로티오에이트, 포스포로디티오에이트 등) 및 양하전된 결합을 갖는 것 (예컨대 아미노알킬포스포로아미데이트, 아미노알킬포스포트리에스테르) 와 같은 뉴클레오타이드간( inter-nucleotide) 변형; 예컨대 단백질 (뉴클리아제, 독소, 항체, 시그널 펩타이드, 폴리-L-리신 등을 포함한다)과 같은 부속 모이어티(pendant moieties)를 함유하는 것; 인터컬레이터 (예컨대 아크리딘, 소랄렌 등)를 갖는 것; 및 킬레이터 (예컨대 금속, 방사능 금속, 붕소, 산화성 금속 등)을 갖는 것이 이에 속한다. 본 발명에서, 뉴클레오타이드 및 폴리뉴클레오타이드의 기호는 IUPAC-IUB Commission of Biochemical Nomenclature (Biochem. 9:4022, 1970)의 권고대로 표시한다.
[00108] 분리된 폴리뉴클레오타이드의 서열은 당업자에게 공지인 적절한 방법, 예컨대 직접 화학합성 또는 클로닝에 의해 제조한다. 직접 화학합성의 경우, 핵산 폴리머의 생성은 대체로 3'-차단 및 5'-차단된 뉴클레오타이드 모노머를 성장하는 뉴클레오타이드 사슬의 말단 5'-히드록실기에 순차적으로 부가하는 것을 포함하며, 여기서 각각의 부가는 대체로 포스포트리에스터, 포스포아미다이트 등과 같은 인 유도체인 부가되는 모노머의 3--위치에 성장중인 사슬의 말단 5'-히드록실기를 친핵성 어택함으로써 실시되는 것이다. 이러한 방법론은 당업자에게 공지이며 관련 텍스트와 문헌 [예컨대, Matteucci et al., (1980) Tetrahedron Lett 21:719-722; 미국특허 Nos. 4,500,707; 5,436,327; 및 5,700,637]에 설명되어 있다. 또한, 목적하는 서열은 적절한 제한효소를 이용하여 DNA를 스플리팅시키고 겔 전기영동을 이용하여 단편을 분리한 다음 원하는 핵산 서열을 당업에게 공지인 기술을 이용하여 겔로부터 회수함으로써 분리해낼 수 있다. 예컨대 폴리머라제 연쇄반응(PCR; 예컨대 미국특허 No. 4,683,195) 참조.
[00109] 본 발명의 각각의 폴리뉴클레오타이드는 발현 벡터 내로 병합될 수 있다. "발현 벡터" 또는 "벡터"라 함은 숙주세포를 형질도입, 형질전환 또는 감염시 킴으로써 숙주 세포에 대해 자연적이지 않은 핵산 및/또는 단백질을 발현시키거나 숙주세포에 자연적이지 않은 방식으로 그러한 핵산 및/또는 단백질을 발현시키는 화합물 및/또는 조성물을 가리킨다. "발현 벡터"는 숙주 세포에 의해 발현될 핵산 (대체로 RNA 또는 DNA) 서열을 함유한다. 필요에 따라, 발현 벡터는 또한 바이러스, 리포좀, 단백질 코팅 등과 같이 숙주 세포 내로 핵산을 유입시키는데 도움이 되는 물질들도 포함한다. 본 발명에 사용할만한 것으로 고려할 수 있는 발현 벡터는 특정의 또는 요구되는 여하한 작동 요소와 함께, 핵산 서열 내로 삽입가능한 것들을 들 수 있다. 또한, 발현 벡터는 숙주 세포 내로 전달되어 숙주 세포 내에서 복제할 수 있는 것이어야 한다. 어떤 발현 벡터들은 플라스미드, 특히 잘 문서화된 제한효소 자리를 갖고 핵산 서열의 전사에 필요한 작동 요소들을 함유한다. 이러한 플라스미드 및 기타 발현 벡터들은 당업자에게 잘 알려져 있다.
[00110] 개개 폴리뉴클레오타이드의 병합(incorporation)은 공지 방법, 예컨대 플라스미드와 같은 발현벡터 중의 특이적인 위치를 절단하기 위해 제한효소 (예컨대 BamHI, EcoRI, HhaI, XhoI, XmaI, 등등)를 사용하는 것에 의해 달성될 수 있다.제한효소는 절단된 발현 벡터의 말단에 상보적인 서열을 갖는 말단을 갖거나 말단을 갖도록 합성된 폴리뉴클레오타이드에 어닐링될 수 있는 단일가닥 말단들(ends)을 생성한다. 어닐링은 적절한 효소 예컨대 DNA 리가제를 이용하여 수행된다. 당업자들에게 익히 알려진 바와 같이, 발현 벡터와 목적하는 폴리뉴클레오타이드는 양자 모두 동일한 제한효소에 의해 절단됨으로 해서, 발현 벡터의 말단과 폴리뉴클레오타이드의 말단은 상호 상보적이다. 이에 더해, DNA 링커를 이용하여 핵산 서열을 발현 벡터 내로 링크시키는 것을 용이하게 할 수 있다.
[00111] 일련의 개개 폴리뉴클레오타이드들 역시도 당업자에게 잘 알려진 방법을 이용하여 조합시킬 수 있다 (예컨대, 미국특허 No. 4,683,195).
[00112] 예컨대, 목적하는 폴리뉴클레오타이드 각각을 별도의 PCR로 초기 생성할 수 있다. 그 후, 특이적인 프라이머들을 설계하여 PCR 생성물의 말단들이 상보적인 서열을 함유하도록 한다. PCR 생성물이 혼합, 변성 및 재어닐링되면, 그들의 3' 말단의 맷칭 서열을 갖는 가닥들이 오버랩되어 서로 프라이머로서 작용할 수 있다. DNA 폴리머라제에 의한 이러한 오버랩의 연장에 의해 오리지날 서열들이 함께 "스플라이스"된 분자가 생성된다. 이러한 방식으로, 일련의 개개 폴리뉴클레오타이드들이 함께 "스프라이스"된 후 숙주 세포 내로 동시에 형질도입될 수 있다. 따라서, 복수개의 폴리뉴클레오타이드 각각의 발현이 실현된다.
[00113] 개별적인 폴리뉴클레오타이드, 또는 "스플라이스"된 폴리뉴클레오타이드들은 이어서 발현 벡터 내로 병합된다. 본 발명은 발현 벡터 내로 폴리뉴클레오타이드를 병합시키는 방법에 관하여는 어떠한 제한도 두지 않는다. 당업자들은 폴리뉴클레오타이드를 발현 벡터 내로 병합시키는데 필요한 단계들을 숙지할 것이다. 전형적인 발현 벡터는 목적하는 폴리뉴클레오타이드에 선행하는 1개 이상의 조절 대역, 리보좀 결합 부위, 예컨대 길이가 3-9 뉴클레오타이드이고 대장균의 개시 코돈의 3-11 뉴클레오타이드 상류에 위치하는 뉴클레오타이드 서열을 함유한다. 예컨대 Shine 및 Dalgarno (1975) Nature 254(5495):34-38 and Steitz (1979) Biological Regulation 및 Development (ed. Goldberger, R. F.), 1:349-399 (Plenum, New York) 참조.
[00114] 본 발명에서 "작동적으로 링크된" 이라는 용어는 컨트롤 서열이 폴리펩타이드의 발현을 지시하도록, 컨트롤 서열이 DNA 서열 또는 폴리뉴클레오타이드의 코딩 서열에 상대적으로 적절한 위치에 놓인 배열을 의미한다.
[00115] 조절 대역의 예로는 프로모터 및 오퍼레이터를 함유하는 대역을 들 수 있다. 프로모터는 목적하는 폴리뉴클레오타이드 또는 폴리펩타이드를 코딩하는 폴리뉴클레오타이드의 일부에 작동적으로 링크되어, RNA 폴리머라제 효소를 통해 폴리뉴클레오타이드, EH는 폴리펩타이드를 코딩하는 폴리뉴클레오타이드의 일부의 전사를 개시한다. 오퍼레이터는 리프레서 단백질이 결합할 수 있는 단백질-결합 도메인을 함유하는, 프로모터에 인접한 핵산 서열이다. 리프레서 단백질이 부재하면, 전사는 프로모터를 통해 개시된다. 존재할 경우, 오퍼레이터의 단백질-결합 도메인에 특이적인 레프레서 단백질은 오퍼레이터에 결합하고, 그에 따라 전사를 억제한다. 이러한 방식으로, 대응하는 리프레서 단백질의 존부 및 특정 조절 대역에 기초하여 전사 조절이 이루어진다. 예로는 락토스 프로모터(Lad 리프레서 단백질은 락토스와 접촉되면, 배열 변형을 일으켜, Lad 리프레서 단백질이 오퍼레이터에 결합하는 것을 방지한다) 및 트립토판 프로모터 (트립토판과 컴플렉스를 형성하면, TrpR 리프레서 단백질이 오퍼레ㅣ터와 결합하는 배열을 가지며, 트리보판 부재시에는, TrpR 리프레서 단백질이 오퍼레이터에 결합하지 않는 배열을 갖는다)를 들 수 있다. 또 다른 예는 tac 프로모터 (de Boer et al., (1983) Proc Natl Acad Sci USA 80(1):21-25 참조)이다. 당업자라면 잘 알고 있는 바와 같이, 이들 및 기타의 조절 대역들을 본 발명에 이용할 수 있으며, 본 발명이 이들 측면으로 한정되는 것은 아니다.
[00116] 본 발명의 재조합 단백질을 코딩하는 분리된 폴리뉴클레오타이드에 대한 링크를 위한 특정 프로모터의 예로는 다음의 유전자로부터의 프로모터가 포함된다: gpdA, cbh1, 아스퍼질러스 오리제 TAKA 아밀라제, 리조뮤코 미에헤이 아스파틱 프로테나제, 아스퍼질러스 나이거 중성 알파-아밀라제, 아스퍼질러스 나이거 acid stable 알파-아밀라제, 아스퍼질러스 나이거 글루코아밀라제 (glaA), 아스퍼질러스 아와모리 glaA, 리조뮤코 미에헤이 리파제, 아스퍼질러스 오리제 알칼라인 프로테아제, 아스퍼질러스 오리제 트리오스 포스페이트 이소머라제, 아스퍼질러스 니둘란 아세트아미다제, 아스퍼질러스 오리제 아세트아미다제, 푸사리움 옥시스포룸 트립신-유사 프로테아제, 진균성 엔도 α-L-아라비노스 (abnA), 진균성 α-L-아라비노퓨라노시다제 (abfA), 진균성 α-L-아라비노퓨라노시다제 B (abfB), 진균성 자일라나제 (xlnA), 진균성 phytase, 진균성 ATP-신쎄타제, 진균성 서브유닛 9 (oliC), 진균성 트리오스 포스페이트 이소머라제 (tpi), 진균성 알코올 데히드로게나제 (adhA), 진균성 α-아밀라제 (amy), 진균성 아밀로글루코시다제 (glaA), 진균성 아세트아미다제 (amdS), 진균성 글리세랄데히드-3-포스페이트 데히드로게나제 (gpd), 효모 알코올 데히드로게나제, 효모 락타제, 효모 3-포스포글리세레이트 키나제, 효모 트리오스포스페이트 이소머라제, 세균성 α-아밀라제, 세균성 Spo2, 및 SSO. 특정 구체예에서, 본 발명의 재조합 단백질를 코딩하는 분리된 폴리뉴클레오타이드는 연속 프로모터에 작동적으로 링크된다. 다른 구체예에서, 본 발명의 재조합 단백질을 코딩하는 분리된 폴리뉴클레오타이드는 유도(inducible) 프로모터에 작동적으로 링크된다. 특정한 바람직한 구체예에서, 유도 프로모터는 cbh1 유전자로부터 유래한다.
[00117] 비록 적절한 발현 벡터를 이용하여 목적하는 서열을 병합시킬 수 있으나, 쉽게 이용가능한 발현 벡터의 비제한적인 예로 pSClOl, pBR322, pBBRlMCS-3, pUR, pEX, pMRlOO, pCR4, pBAD24, pUC19; 박테리오파지, 예컨대 Ml 3 파지 및 λ파지를 들 수 있다. 물론, 이러한 발현 벡터들은 특정 숙주 세포에만 적합할 수 있다. 당업자들은 그러나 통상적인 실험을 통해 주어진 숙주 세포에 어떤 특정한 발현 벡터가 적합할지를 쉽게 결정할 수 있다. 예컨대, 발현 벡터를 숙주 세포 내로 도입한 다음 벡터 내에 함유된 서열의 발현 및 생존능을 모니터링한다. 이에 더해, 발현 벡터 및 특정 숙주 세포에 대한 이들의 적합성을 설명하는 적절한 교과서와 문헌을 참조할 수도 있다.
[00118] 본 발명의 또 다른 측면은 본 발명의 재조합 단백질을 코딩하는 분리된 폴리뉴클레오타이드를 함유하는 발현 벡터를 함유하는 숙주 세포에 관한 것이다. 본 발명에서 "숙주 세포"라 함은 재조합 DNA 또는 RNA의 삽입을 통해 형질전환될 수 있는 살아있는 생물학적 세포를 말한다. 따라서, 본 발명에서 숙주 세포는 원핵생물 (예컨대 진정세균(eubacteria) 계의 생물) 세포이거나 진핵생물의 세포일 수 있다. 당업자라면 잘 이해하는 바와 같이, 진핵세포는 막에 결합된 핵이 없는 반면, 진핵 세포는 막-결합된 핵을 갖는다. 특정 구체예에서, 본 발명의 재조합 단백질 생산에 사용되는 숙주 세포들은 효모나 사상 진균과 같은 진균 세포이다. 다른 구체예에서, 숙주 세포는 포유류 세포이다. 이러한 세포는 인간 세포일 수도, 비인간 세포일 수도 있다.
[00119] 본 발명의 또 다른 측면은 본 발명의 재조합 단백질을 제조하는 방법을 포함한다. 이 방법은 재조합 단백질을 코딩하는 분리된 폴리뉴클레오타이드를 숙주 세포 내로 도입하는 단계 및 재조합 단백질이 발현되도록 숙주 세포를 배양하는 단계를 포함한다. 이 방법은 또한 숙주 세포로부터 재조합 단백질을 정제하는 단계를 더 포함할 수도 있다.
[00120] 본 발명의 재조합 단백질을 생산하는 방법은 본 발명의 재조합 폴리뉴클레오타이드를 함유하는 발현 벡터를 숙주 세포 내로 도입 또는 전달하는 것을 포함할 수 있다. 발현 벡터를 숙주 세포 내로 전달하기 위한 이러한 방법은 당업자에게 잘 알려져 있다. 예컨대, 발현 벡터로 대장균을 형질전환시키기 위한 한가지 방법은, 발현 벡터를 칼슘 침전물을 통해 도입시키는, 칼슘 클로라이드 처리를 포함한다. 다른 염, 예컨대 칼슘 포스페이트 역시도 다음의 유사한 공정에 따라 이용가능하다. 이에 더해, 전기영동 (즉, 핵산 서열로의 세포의 침투성을 증가시키기 위해 전기를 가하는 것)을 이용하여 숙주 세포를 형질전환시킬 수도 있다. 또한, 핵산 서열의 마이크로인젝션은 숙주 세포를 형질도입하는 능력을 제공한다. 지질 컴플렉스, 리포좀 및 덴드리머와 같은 다른 수단 역시도 이용가능하다. 당업자들은 이들 및 기타 방법을 이용하여 목적하는 서열로 숙주 세포를 형질도입시킬 수 있다.
[00121] 벡터는 자가 복제 벡터, 즉 염색체외 엔터티로서 존재하는 벡터일 수 있으며, 이들의 복제는 예컨대 플라스미드, 염색체외 요소, 미니크로모좀, 또는 인공 염색체와 같은 염색체 복제와 독립적이다. 벡터는 자가-복제를 확실하게 하는 수단을 함유할 수 있다. 또는, 벡터는 숙주 내로 도입될 경우, 게놈 내로 병합하여 이것이 병합된 염색체(들)과 함께 복제될 수도 있다. 또한, 단일 벡터 또는 플라스미드 또는 숙주의 게놈 내로 도입하고자 하는 총 DNA를 함RP 함유하는 2 이상의 벡터나 플라스미드, 또는 트랜스포존 역시도 사용가능하다.
[00122] 벡터는 형질전환된 숙주의 선택을 용이하게 해주는 선택 마커를 1개 이상 함유할 수 있다. 선택 마커는 그 생성물이 예컨대 바이오사이드 또는 바이러스 내성이거나, 중금속 내성, 포토트로피, 또는 옥소트로프 등인 유전자이다. 세균 세포의 선택은 amp, gpt, neo, 및 hyg 유전자과 같은 유전자에 의해 부여된 항미생물 내성에 기초할 수 있다.
[00123] 효모 숙주용으로 적합한 마커는 예컨대, ADE2, HIS3, LEU2, LYS2, MET3, TRP1, 및 URA3이다. 사상 진균 숙주에 사용가능한 적합한 마커의 비제한적인 예로는 amdS (아세트아미다제), argB (오르니틴 카바모일트랜스퍼라제), bar (포스피노트리신 아세틸트랜스퍼라제), hph (하이그로마이신 포스포트랜스퍼라제), niaD (니트레이트 리덕타제), pyrG (오로티딘 5'-포스페이트 데카복실라제), sC (설페이트 아데닐트랜스퍼라제), 및 trpC (안트라닐레이트 신타제), 및 이들의 균등물을 들 수 있다. 아스퍼질러스에 사용가능한 것의 예로는 아스퍼질러스 니둘란스 또는 아스 퍼질러스 오리제의 amdS 및 pyrG 유전자와 스트렙토마이세스 하이그로스코피쿠스의 bar 유전자를 들 수 있다. 트리코더마에 사용가능한 것으로는 bar, pyr4, 및 amdS를 들 수 있다.
[0124] 벡터는 숙주의 게놈 내로 벡터를 통합시킬 수 있거나 또는 게놈과 독립적으로 세포 내에서 벡터를 자가 복제시키는 것을 가능케 하는 요소(들)을 함유할 수 있다.
[00125] 숙주 게놈 내로의 통합을 위해, 벡터는 상동 또는 비상동 재조합에 의한 게놈 내로의 벡터의 통합을 위한 벡터의 다른 요소들 또는 유전자 서열에 의존할 수 있다. 또는 벡터는 숙주 게놈 내로 상동 재조합에 의한 직접 통합을 위해 부가적인 뉴클레오타ㅣㅇ드 서열을 함유할 수 있다. 부가적인 뉴클레오타이드 서열은 벡터로 하여금 염색체(들) 중에서 정확한 위치(들)에서 숙주 게놈 내로 통합될 수 있게 해준다. 정확한 위치에서의 통합 가능성을 증가시키기 위해, 통합 요소들은 핵산을 충분한 수로, 예컨대 상동 재조합 확률을 증가시키기 위해 대응하는 효적 서열과 고도로 상동성인 핵산들을 충분한 수로, 예컨대 100 내지 10,000 염기쌍, 좋기로는 400 내지 10,000 염기쌍, 및 가장 좋기로는 800 내지 10,000 염기쌍으로 함유할 수 있다. 통합 요소들은 숙주 게놈 내의 표적 서열과 상동성인 서열이면 어느 것이든 함유할 수 있다. 뿐만 아니라, 통합 요소들은 뉴클레오타이드 서열을 코딩할수도, 코딩하지 않을 수도 있다. 이와 달리, 벡터는 비상동성 재조합에 의해 숙주 게놈 내로 통합될 수 있다.
[00126] 자가 복제를 위해, 벡터는 문제의 숙주 중에서 벡터를 자가복제 시킬 수 있는 복제 원점(origin)을 더 포함할 수 있다. 복제 원점은 세포 내에서 기능하는 자가 복제를 매개하는 플라스미드 레플리케이터이면 어느 것이든 무방하다. "복제 원점" 또는 "플라스미드 레플리케이터라는 용어는 플라스미드 또는 벡터가 생체내에서 복제할 수 있게 해주는 서열로서 정의된다. 효모 숙주에서 사용하기 위한 복제 원점의 예는 2 마이크론 복제 원점, ARS1, ARS4, ARS1 및 CEN3의 조합, 및 ARS4 및 CEN6의 조합이다. 사상 진균 세포에 유용한 복제 원점의 예는 AMA1 및 ANS1 (Gems et al., 1991; Cullen et al., 1987; WO 00/24883)이다. WO 00/24883에 설명된 방법에 따라, AMA1 유전자의 분리 및 유전자를 포함하는 벡터 또는 플라스미드의 구축을 달성할 수 있다.
[00127] 다른 숙주에 있어서, 형질전환 절차는 예컨대 클루베로마이세스의 경우, Jeremiah D. Read, et al., Applied and Environmental Microbiology, Aug. 2007, p. 5088-5096, 지모모나스의 경우 Osvaldo Delgado, et al., FEMS Microbiology Letters 132, 1995, 23-26, 피키아 스티피티스의 경우 미국특허 7,501,275, 및 클로스트리듐의 경우 WO 2008/040387에서 찾아볼 수 있다.
[00128] 2 카피 이상의 유전자를 숙주 내로 삽입하여 유전자 산물의 생성을 증가시킬 수 있다. 유전자 카피 수의 증가는 적어도 1개의 부가적인 유전자 카피를 숙주 게놈 내로 통합시키거나 또는 뉴클레오타이드 서열과 함께 증폭가능한 선택 마커 유전자를 포함시켜 세포가 선택가능한 마커 유전자의 증가된 카피를 함유하도록 함으로써 적절한 선택가능한 제제 존재 하에 세포를 배양시켜, 유전자의 부가적인 카피가 선택되도록 함으로써 달성될 수 있다.
[00129] 본 발명의 재조합 발현 벡터를 구축하기 위하여 전술한 요소들을 접합시키는데 사용되는 공정은 당업자에게 잘 알려져 있다 (예컨대, Sambrook et al., 1989, 상기문헌).
[00130] 숙주 세포는 적어도 1개의 발현 벡터에 의해 형질전환된다. 오직 1개의 발현 벡터만 사용된 경우 (중간체 부가 없이), 벡터는 필요한 핵산 서열을 모두 함유할 것이다.
[00131] 일단 숙주 세포가 발현 벡터에 의해 형질전환되면, 숙주 세포를 성장하도록 한다. 본 발명의 방법은 세포 내의 재조합 핵산이 발현되도록 숙주 세포를 배양하는 것을 포함할 수 있담. 미생물 숙주에 있어서, 이 프로세스는 세포를 적절한 배지에서 배양하는 것을 수반한다. 일반적으로, 세포는 적절한 배지에서 35℃에서 성장한다. 본 발명에서 특정 성장 배지는 예컨대 흔히 시판되는 배지 예컨대 Luria-Bertani (LB) 브로쓰, Sabouraud Dextrose (SD) 브로쓰 또는 효모 배지 (YM) 브로쓰를 들 수 있다. 기타 규정되거나 합성 성장 배지 역시도 사용 가능하며 특정 숙주 세포를 성장시키기 위한 적절한 배지는 미생물학 또는 발효학 분야의 당업자에게 잘 알려져 있다. 미생물 성장을 위한 온도 범위 및 기타 조건은 기술 분야에 공지이다 (예컨대, Bailey 및 Ollis 1986 참조).
[00132] 숙주 세포로부터 본 발명의 재조합 단백질을 정제하는 방법은 기술 분야에 잘 알려져 있다 (see E. L. V. Harris and S. Angel, Eds. (1989) Protein Purification Methods: Practical Approach, IRL Press, Oxford, England). 이러한 방법의 비제한적인 예로는 예비 디스크-겔 전기영동, 등전 포커싱, 고성능 액체 크로마토그래피(HPLC), 역상 HPLC, 겔 여과, 이온 교환 및 분별 크로마토그래피 및 역전류 부포, 및 이들의 조합을 들 수 있다. 특정 구체예에서, 재조합 단백질은 정제를 용이하게 하기 위해 부가적인 서열 태그를 지닌다. 이러한 마커로는 에피토프 태그와 단백질 태그를 들 수 있다. 에피토프 태그의 비제한적인 예로는 c-myc, 헤마글루티닌(HA), 폴리히스티딘(6x-HIS), GLU-GLU, 및 DYKDDDDK (FLAG) (SEQ ID NO: 117) 에피토프 ㅌ태그를 들 수 있다. 에피토프 태그는 여러가지 수립된 방법에 의해 펩타이드에 부가될 수 있다. 에피토프 태그의 DNA 서열을 PCR 증폭에서 사용되는 프라이머를 통해 또는 올리고뉴클레오타이드로서 재조합 단백질을 코딩하는 서열 내로 삽입할 수 있다. 별법으로, 펩타이드-코딩 서열을 에피토프 태그와의 융합물을 만드는 특정 벡터 내로 클로닝시킬 수 있다; 예컨대 pRSET 벡터 (Invitrogen Corp., San Diego, Calif.). 단백질 태그의 비제한적인 예로는 글루타치온-S-트랜스퍼라제 (GST), 녹색 형광 단백질(GFP), 및 말토스 결합 단백질(MBP)을 들 수 있다. 단백질 태그는 수개의 공지 방법에 의해 펩타이드 또는 폴리펩타이드에 결합된다. 한가지 접근법에서, 폴리펩타이드 또는 펩타이드의 코딩 서열은 폴리펩타이드 또는 펩타이드 및 목적하는 단백질 태그 사이의 융합을 형성하는 벡터 내로 클로닝될 수 있다. 적절한 ㅂx터의 비제한적인 예로는 예시된 플라스미드, pGEX (Amersham Pharmacia Biotech, Inc., Piscataway, N.J.), pEGFP (CLONTECH Laboratories, Inc., Palo Alto, Calif.), 및 pMAL.TM. (New England BioLabs, Inc., Beverly, Mass.)를 들 수 있다. 발현 후, 에피토프 또는 단백질-태그된 폴리펩타이드 또는 펩타이드를 적절한 고상 매트릭스 상에서 크로마토그래피에 의해 숙주 세포의 조질의 용해물(crude lysate) 로부터 정제할 수 있다. 몇몇 경우에 있어서, 정제 후 에피토프 또는 단백질 태그 (즉, 프로테아제 분해를 통해서)를 제거하는 것이 바람직할 수 있다.
복합 글리칸의 제조 방법
[00133] 본 발명의 또 다른 측면은 Another aspect of invention includes methods of producing 복합 N-글리칸, including steps of providing 숙주 세포, where 숙주 세포 contains 폴리뉴클레오타이드 encoding 융합 단백질 comprising N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인 및 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 포함하는 융합 단백질을 코딩하는 폴리뉴클레오타이드를 함유하는 숙주 세포를 제공하는 단계 및 융합 단백질이 발현되도록 상기 숙주 세포를 배양하는 단계를 포함하는 복합 N-글리칸의 제조방법에 관한 것으로서, 여기서 상기 융합 단백질은 N-아세틸글루코사민이 수용체 글리칸의 말단 Manα3 잔기로 전달되는 것과 N-아세틸글루코사민이 말단 Manα6 잔기로 전달되는 것을 촉매하여 복합 N-글리칸을 생산하는 것이다. 특정 구체예에서, 이 측면은 트리코더마 세포에서 인간-유사 N-글리칸을 생산하는 방법을 포함한다..
[00134] 본 발명에서, "복합 N-글리칸"이라는 용어는 말단 GlcNAc2Man3 구조를 포함하는 N-글리칸을 가리킨다.
[00135] 복합 N-글리칸은 다음 식 [GlcNAcβ2]zMan α3([GlcNAcβ2]wMan α6)Man{β4GlcNAcβ(Fucax)n[4GlcNAc]m}p, (여기서 n, m, 및 p는 0 또는 1으로서 그 분자의 일부의 존재 또는 부재를 나타내고, 단 m이 0이면 n은 0이고 (푸코스는 GlcNAc에 링크된 브랜치임), x는 3 또는 6이며, 여기서 ( )는 구조 내의 브랜치를 정의하고, [ ]는 선형 서열 중에 존재 또는 부재하는 글리칸 구조의 일부를 정의하는 것이며, z 및 w는 0 또는 1이다)을 갖는 글리칸을 포함한다. 좋기로는 w 및 z는 1이다. 특정 구체예에서, 복합 N-글리칸으로는 GlcNAcβ2Manα3(GlcNAcβ2Manα6)Manβ4GlcNAcβ4GlcNAc, GlcNAcβ2Manα3(Manα6)Manβ4GlcNAcβ4GlcNAc, GlcNAcβ2Manα3(GlcNAcβ2Manα6)Manβ4GlcNAcβ4(Fuca6)GlcNAc, GlcNAcβ2Manα3(Manα6)Manβ4GlcNAcβ4(Fuca6)GlcNAc, 및 Manα3(Manα6)Manβ4GlcNAcβ4GlcNAc을 들 수 있다. 특정 구체예에서, 복합 N-글리칸은 비-푸코실화된 GlcNAcMan3, GlcNAc2Man3, 및 또는 Man3이다.
[00136] 특정 구체예에서, 복합 N-글리칸의 제조방법은 서로 다른 글리칸들의 혼합물을 생성한다. 복합 N-글리칸은 이러한 글리칸 혼합물의 적어도 1%, 적어도 3%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 50%, 또는 적어도 75% 또는이상을 구성할 수 있다.
[00137] 수용체 글리칸, 및 따라서 복합 N-글리칸은 수용체 글리칸은 아미노산, 펩타이드, 또는 폴리펩타이드와 같은 분자에 결합될 수 있다. 특정 구체예에서, 아미노산 유도체는 아스파라긴 잔기이다. 아스파라긴 잔기는 측쇄 아미드(생물학적인 포유류 폴리펩타이드 N-글리칸 결합 구조)로부터의 아미노글리코시드 결합 중에 포함될 수 있으며 디펩타이드, 올리고펩타이드, 또는 폴리펩타이드와 같은 펩타이드 사슬의 일부일 수도 있다. 글리칸은 환원 GlcNAc 또는 Man의 N-, O-, 또는 C-링크된, 좋기로는 글리코시드, 유도체와 같은 환원 엔드 유도체일 수 있으며, 예컨대 아미노산, 알킬, 헤테로알킬, 아실, 알킬옥시, 아릴, 아릴알킬, 및 헤테로아릴알킬로 이루어진 군으로부터 선택된 구조에 링크된 특정 글리칸을 갖는 스페이서 또는 말단 유기 잔기일 수 있다. 스페이서는 또한 다가 캐리어 또는 고체상에 링크될 수도 있다. 특정 구체예에서, 알킬-함유 구조로는 메틸, 에틸, 프로필, 및 C4-C26 알킬, 지질 예컨대 글리세롤지질, 인지질, 돌리콜-인지질 및 세라마이드 및 유도체를 들 수 있다. 환원 엔드(reducing end)는 또한 환원성 아민화에 의해 유도화되어 2차 아민 결합 또는 유도체 구조화될 수도 있다. 특정 캐리어로는 (폴리)펩타이드와 같은 바이폴리- 또는 올리고머, (다)당류, 예컨대 덱스트란, 셀룰로스, 아밀로스 또는 글리코사미노글리칸, 및 기타의 유기 폴리머 또는 올리고머 예컨대 플라스틱 예컨대 폴리에틸렌, 폴리프로필렌 폴리아미드(예컨대 나일론 또는 폴리스티렌), 폴리아크릴아미드 및 폴리락트산, 덴드리머 예컨대 PAMAM, Starburst 또는 Starfish 덴드리머, 또는 폴리리신 및 폴리알킬글리콜 예컨대 폴리에틸렌 글리콜(PEG)를 들 수 있다 고체상( solid phases)로는 마이크로타이터 웰, 실리카 입자, 유리, 금속(강철, 금 및 은 등), 폴리머 비드 예컨대 폴리스티렌 또는 레진 비드, 폴리락트산 비드, 다당류 비드 또는 유기 스페이서를 함유하는 마그네틱 비드를 들 수 있다.
[0138] 특정 구체예에서, 수용체 글리칸은 이종 폴리펩타이드에 결합된다. 특정 구체예에서, 이종 폴리펩타이드는 치료용 단백질(therapeutic protein)이다. 치료용 단백질에는 예컨대 모노클로날 항체, 에리쓰로포이에틴, 인터페론, 성장 호르몬, 효소 또는 응혈인자가 포함될 수 있으며, 인간 또는 동물 치료에 유용할 수 있다. 예컨대, 수용체 글리칸은 리툭시맙과 같은 치료용 단백질에 결합될 수 있다.
[00139] 수용체 글리칸은 "본 발명의 재조합 단백질"이라 명명된 섹션에 설명된 수용체 글리칸일 수 있다.
[00140] 특정 구체예에서, 수용체 글리칸은 Man5일 수 있다. 이러한 구체예에서, Man5를 발현하는 T. 리세이 균주는 무작위 통합 또는 표적화 통합을 이용하여 Man5 글리코실화에 영향을 미치지 않는 것으로 알려진 공지 부위로, GnTII/GnTI 융합 효소에 의해 형질전환된다. GlcNAcMan5을 생산하는 균주들이 선택된다. 선택된 균주들은 Man5 구조를 분해할 수 있는 만노시다제 II형 만노시다제의 촉매 도메인에 의해 추가로 형질전환되어 GlcNAcMan3을 생성한다. 특정 구체예에서 만노시다제 II형 효소는 글리코사이드 히드롤라제 패밀리 38에 속한다 (cazy.org/GH38_all.html). 특징화된 효소는 cazy.org/GH38_characterized.html에 수록된 효소들을 포함한다. 특히 유용한 효소들은 당단백질을 분해하는 골지형 효소, 예컨대 α-만노시다제 II (Man2A1;Manα2)의 것들이다. 이러한 효소의 예로는 인간 효소 AAC50302, D. 멜라노가스터 효소 (Van den Elsen J.M. et al (2001) EMBO J. 20: 3008-3017), PDB-레퍼런스 1HTY에 따른 3D 구조, 및 PDB에서 촉매 도메인과 함께 참조된 기타의 것들을 들 수 있다. 세포질 발현에 있어서, 만노시다제의 촉매 도메인은 일반적으로 N-말단 표적화 펩타이드와 함께 융합되거나 동물 또는 식물의 만노시다제 II 효소의 내인성 동물 또는 식물 골지 표적화 구조에 의해 발현된다. 만노시다제 II형 만노시다제의 촉매 도메인에 의한 형질전환 후, GlcNAc2Man3을 효과적으로 생산하는 균주가 선택된다.
숙주 세포
[00141] 복합 N-글리칸을 생산하는 방법은 숙주 세포를 제공하는 제1 단계를 포함한다. 본 발명에서는 핵산 서열에 의해 형질전환된 후에도 살아있는 한, 숙주세포로서 원핵세포든 진핵세포든 관계없이 모두 이용가능하다. 좋기로는, 숙주 세포는 필요한 핵산 서열의 형질도입, 재조합 단백질의 후속 발현 또는 결과적인 중간체에 의해 악영향을 받지 않는 것이 바람직하다. 적절한 진핵 세포의 비제한적인 예로는 진균, 식물, 곤충 또는 포유류 세포를 들 수 있다.
[00142] 특정 구체예에서, 숙주는 진균 균주이다. 본 발명에서 "진균(Fungi)"이라 함은 아스코미코타(Asmycota), 바시디오미코타(Basidiomycota), 키트리디오미코타(Chytridiomycot) 및 지고미코타(Zygomycota) (Hawksworth et al., In, Ainsworth 및 Bisby's Dictionary of Fungi, 8th edition, 1995, CAB International, University Press, Cambridge, UK의 정의에 따름) 및 우우미코타(Oomycota) (Hawksworth et al., 1995, 상기문헌 page 171에서 인용한 바와 같음) 및 모든 영양포자성 진균 (Hawksworth et al., 1995, 상기문헌)을 포함한다.
[00143] 특정 구체예에서, 진균 숙주는 효모 균주이다. 본 발명에서 "효모"는 자낭포자생성 효모 (Endomycetales), 담자포자 효모 및 불완전 진균(Blastomycetes) 에 속하는 효모를 포함한다. 효모의 분류는 장래 달라질 수 있기 때문에, 본 발명의 목적 상 효모는 Biology 및 Activities of Yeast (Skinner, F. A., Passmore, S. M., and Davenport, R. R., eds, Soc. App. Bacteriol. Symposium Series No. 9, 1980)의 설명에 따르기로 한다.
[00144] 특정 구체예에서, 효모 숙주는 캔디다, 한세눌라 , 클루베로마이세 , 피키아, 사카로마이세스 , 쉬조사카로마이세스 , 또는 야로위아 균주이다.
[00145] 특정 구체예에서, 효모 숙주는 사카로마이세스 세레비지아에 , 클루 베로마이세스 락티스 , 피키아 파스토리스 , 캔디다 알비칸스 , 한세눌라 폴리모르파 , 쉬조사카로마이세스, 또는 야로위아이다.
[00146] 또 다른 특정 구체예에서, 진균성 숙주 세포는 사상 진균 균주이다. "사상 진균(Filamentous fungi)"에는 유미코타(Eumycota) 및 우우미코타(Oomycota) (Hawksworth et al., 1995, 상기문헌의 정의에 따름)의 모든 사상 형태가 포함된다. 사상 진균은 일반적으로 균사 벽이 키틴, 셀룰로스, 글루칸, 키토산, 만난 및 기타 복합 다당류로 구성됨을 특징으로 한다. 영양 성장(vegetative growth)은 균사 신장에 의하며 및 탄소 이화는 절대 호기성이다. 이와 대조적으로 사카로마 이세스 세레비지아에와 같은 효모에 의한 영향 서장은 단세포 엽상체의 발아에 의하며 탄소 이화는 발효성일 수 있다.
[00147] 사상 진균 숙주 세포는 예컨대, 아크레모니움 , 아스퍼질러스 , 푸사 리움, 휴미콜라 , 뮤코 , 미셀리오프토라 , 뉴로스포라 , 페니실륨, 스키탈리디움 , 라비아, 톨리포클라디움, 또는 트리코더마 균주이다.
[00148] 특정 구체예에서, 사상 진균 숙주 세포는 트리코더마 sp ., 아크레모늄 , 아스퍼질러스, 아우레오바시디움, 크립토코쿠스, 크리소스포리움 , 크리소스포리움 루크노웬스, 필리바시디움 , 푸사리움, 지베렐라 , 마그나포르테, 뮤코, 미셀리오프토라 , 미로테슘, 네오칼리마스틱스 , 뉴로스포라, 페실로마이세스 , 피니실륨, 피로마이세스 , 쉬조필룸, 탈라로마이세스 , 써모아스쿠스 , 틸라비아 , 또는 톨리포클 라디움 균주이다.
[00149] 특정 구체예에서, 숙주 세포는 포유류 세포이다. 이러한 세포는 인간 또는 비인간 유래일 수 있다.
[00150] 또 다른 특정 구체예에서, 숙주 세포는 원핵생물 유래이며, 특정 구체예에서, 원핵생물은 대장균, 바실러스 서브틸리스 , 지모모나스 모빌리스, 클로스트리듐 sp ., 클로스트리듐 피토퍼멘탄스 , 클로스트리듐 써모셀룸 , 클로스트리듐 베이제링키이, 클로스트리듐 아세토부틸리쿰 (무렐라 써모아세티카), 써모안에어로박 테리움 사카롤리티쿰 또는 클렙시엘라 옥시토카이다. 다른 구체예에서, 원핵생물 숙주 세포는 카복시도셀라 sp., 코리네박테리움 글루타미쿰 , 엔테로박테리아세아 , ㅇ어위니아 크리산테미 , 락토바실러스 sp., 페디오코쿠스 아시딜라티치 , 로도슈도모나 캡술라타 , 스트렙토코쿠스 락티스 , 비브리오 푸르니시이 , 비브리오 푸르니시이 M1, 칼디셀룰로시룹토 사카롤리티쿠스 또는 잔토모나스 캄페스트리스이다. 다른 구체예에서, 숙주 세포는 시아노박테리아이다. 세균 숙주 세포의 부가적인 예로는 스케리치아, 엔테로박터, 아조토박터 , 어위니아 , 바실러스 , 슈도모나스, 클렙시엘 라, 프로테우스, 살모넬라, 세라티아, 시겔라 , 리조비아 , 비트레오실라 , 시네코쿠스 , 시네 코시스티스 및 파라코쿠스 분류에 속하는 것들을 들 수 있다.
[00151] 복합 N-글리칸을 제조하기 위한 본 발명의 방법에서, 상기 방법은 융합 단백질이 발현되도록 숙주 세포를 배양하는 단계를 포함한다. 미생물 숙주에서, 이 프로세스는 세포를 적절한 배지에서 배양하는 것을 수반한다. 일반적으로, 세포는 적절한 배지에서 35℃에서 성장한다. 본 발명에서 특정 성장 배지는 예컨대 흔히 시판되는 배지 예컨대 Luria-Bertani (LB) 브로쓰, Sabouraud Dextrose (SD) 브로쓰 또는 효모 배지 (YM) 브로쓰를 들 수 있다. 기타 규정되거나 합성 성장 배지 역시도 사용 가능하며 특정 숙주 세포를 성장시키기 위한 적절한 배지는 미생물학 또는 발효학 분야의 당업자에게 잘 알려져 있다. 미생물 성장을 위한 온도 범위 및 기타 조건은 기술 분야에 공지이다 (예컨대, Bailey 및 Ollis 1986 참조). 특정 구체예에서, 세포 배양의 pH는 3.5 내지 7.5, 4.0 내지 7.0, 4.5 내지 6.5, 5 내지 5.5의 범위, 또는 5.5이다.
[00152] 복합 N-글리칸을 제조하기 위한 본 발명의 방법에 사용되는 숙주 세포는 "본 발명의 재조합 단백질" 섹션에 설명된 바와 같이 본 발명의 재조합 단백질을 코딩하는 폴리뉴클레오타이드를 함유한다. 특정 구체예에서, 숙주 세포는 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인 및 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 포함하는 융합 단백질을 코딩하는 폴리뉴클레오타이드를 함유하며, 여기서 융합 단백질은 N-아세틸글루코사민이 말단 Manα3 잔기로 전달되는 것과 N-아세틸글루코사민이 수용체 글리칸의 말단 Manα6 잔기로 전달되는 것을 촉매하여 복합 N-글리칸을 생산한다.
[00153] 특정 구체예에서, 숙주 세포는 UDP-GlcNAc 트랜스포터를 코딩하는 폴리뉴클레오타이드를 함유한다. UDP-GlcNAc 트랜스포터를 코딩하는 폴리뉴클레오타이드는 숙주 세포에서 내인성 (즉, 자연적으로 존재)이거나 또는 숙주 세포에 대해 이질적인 것일 수 있다.
[00154] 특정 구체예에서, 숙주 세포는 α-1,2-만노시다제를 코딩하는 폴리뉴클레오타이드를 함유한다. α-1,2-만노시다제를 코딩하는 폴리뉴클레오타이드는 숙주 세포에 내인성이거나 또는 숙주 세포에 대해 이질적인 것일 수 있다. 이 폴리뉴클레오타이드들은 특히 엑소-α-2-만노시다제를 분해시키지 않고 골지체로부터 ER로 전달된 고만노스 글리칸을 발현하는 숙주 세포에서 특히 유용하다. α-1,2-만노시다제는 글리코시드 히드롤라제 패밀리 47 (cazy.org/GH47_all.html)에 속하는 만노시다제 I형 효소일 수 있다. 특정 구체예에서 α-1,2-만노시다제는 cazy.org/GH47_characterized.html에 수록된 효소이다. 특히, α-1,2-만노시다제는 may be ER형 효소 that cleaves glyco단백질 such as 효소 in subfamily of ER α-만노시다제 I EC 3.2.1.113 효소의 서브패밀리의 효소와 같이 당단백질을 분해시키는 ER형 효소일 수 있다. 이러한 효소의 예로는 인간 α-2-만노시다제 1B (AAC26169),포유류 ER 만노시다제들의 조합, 또는 α-1,2-만노시다제 (MDS1)와 같은 사상 진균 (T. 리세이 AAF34579; Maras M et al J Biotech. 77, 2000, 255)를 들 수 있다. 세포질 발현의 경우 만노시다제의 촉매 도메인은 일반적으로 표적화 펩타이드, 예컨대 HDEL, KDEL, 또는 ER의 일부 또는 초기 골지 단백질과 융합되거나, 또는 동식물 만노시다제 I 효소의 내인성 ER 표적화 구조에 의해 발현된다.
[00155] 특정 구체예에서, 숙주 세포는 갈락토실트랜스퍼라제를 코딩하는 폴리뉴클레오타이드를 함유한다. 갈락토실트랜스퍼라제는 β-링크된 갈락토실 잔기들을 말단 N-아세틸글루코사미닐 잔기로 전달한다. 특정 구체예에서 갈락토실트랜스퍼라제는 β-4-갈락토실트랜스퍼라제이다. 일반적으로, β-4-갈락토실트랜스퍼라제는CAZy 글리코실트랜스퍼라제 패밀리 7에 속하며 (cazy.org/GT7_all.html), β-N-아세틸글루코사미닐-글리코펩타이드 β-1,4-갈락토실트랜스퍼라제 (EC 2.4.1.38)을 포함하는데, 이것은 N-아세틸락토사민 신타제 (EC 2.4.1.90)으로도 알려져 있다. 유용한 서브패밀리는 β4-GalT1, β4-GalT-II, -III, -IV, -V, 및 -VI, 예컨대 포유류 또는 인간 β4-GalTI 또는 β4GalT-II, -III, -IV, -V, 및 -VI 또는 그의 조합이다. β4-GalT1, β4-GalTII, 또는 β4-GalTIII은 GlcNAcMan3, GlcNAc2Man3, 또는 GlcNAcMan5과 같은 N-글리칸 상에서 말단 GlcNAcβ2-구조를 갈락토실화하는데 특히 유용하다 (Guo S. et al. Glycobiology 2001, 11:813-20). 촉매 영역의 3차원 구조는 공지이며 (예컨대 (2006) J.Mol.Biol. 357: 1619-1633), 및 그 구조는 PDB 데이터베이스에 코드 2FYD가 부여되어 표시되어 있다. CAZy 데이터베이스는 특정 효소의 예를 포함한다. 특징화된 효소들은 cazy.org/GT7_characterized.html에 CAZy 데이터베이스에도 수록되어 있다. 유용한 β4GalT 효소의 예로는β4GalT1, 예컨대 소의 Bos taurus 효소 AAA30534 .1 (Shaper N.L. et al Proc. Natl. Acad. Sci. U.S.A. 83 (6), 1573-1577 (1986)), 인간 효소 (Guo S. et al. Glycobiology 2001, 11:813-20), 및 무스 무스쿨루스 효소 AAA37297 (Shaper, N.L. et al. 1998 J. Biol. Chem. 263 (21), 10420-10428); β4GalTII 효소 예컨대 인간 β4GalTII BAA75819.1, 차이니즈 햄스터 크리세툴루스 그리세우스 AAM77195, Mus musculus 효소 BAA34385, 및 일본 Medaka 피쉬 오리지아스 라티페스 BAH36754; 및 β4GalTIII 효소 예컨대 인간 β4GalTIII BAA75820.1, 차이니즈 햄스터 크리세툴루스 그리세우스 AAM77196 및 Mus musculus 효소 AAF22221를 들 수 있다.
[0156] 갈락토실트랜스퍼라제는 숙주 세포의 세포질에서 발현될 수 있다. Schwientek J.Biol. Chem 1996 3398에 설명된 Kre2 펩타이드와 같은 이종 표적화 펩타이드를 사용할 수 있다. 갈락토실트랜스퍼라제를 발현하는데 사용가능한 프로모터에는 gpd와 같은 연속 프로모터, 내인성 글리코실화 효소 및 예컨대 골지체 또는 ER에서 N-글리칸을 합성하는 만노실트랜스퍼라제와 같은 글리코실트랜스퍼라제의 프로모터, 및 cbh1 프로모터와 같은 고수율 내인성 단백질의 유도 프로모터가 포함된다.
[00157] 숙주 세포가 갈락토실트랜스퍼라제를 코딩하는 폴리뉴클레오타이드를 포함하는 본 발명의 특정 구체예에서는 숙주 세포가 UDP-Gal 및/또는 UDP-Gal 트랜스포터를 코딩하는 폴리뉴클레오타이드도 함유한다. 숙주 세포가 갈락토실트랜스퍼라제를 코딩하는 폴리뉴클레오타이드를 포함하는 본 발명의 특정 구체예에서, 락토스는 숙주 세포 배양시 글루코스 대신 탄소원으로서 사용될 수 있다. 배양 배지는 pH가 4.5 내지 7.0 또는 5.0 내지 6.5 범위일 수 있다. 숙주 세포가 갈락토실트랜스퍼라제를 코딩하는 폴리뉴클레오타이드 및 UDP-Gal 및/또는 UDP-Gal 트랜스포터를 코딩하는 폴리뉴클레오타이드를 함유하는 본 발명의 특정 구체예에서, Mn2+, Ca2+ 또는 Mg2+와 같은 2가 양이온을 세포 배양 배지에 부가할 수 있다.
[00158] 특정 구체예에서, 숙주 세포는 시알릴트랜스퍼라제를 코딩하는 폴리뉴클레오타이드를 함유한다. 시알릴트랜스퍼라제는 α3- 또는 α6-링크된 시알산, 예컨대 Neu5Ac을 갈락토실화된 복합 글리칸의 말단 Gal에 전달한다. 적절한 시알릴트랜스퍼라제의 예는 글리코실화 단백질 패밀리 29에서 찾아볼 수 있다 (cazy.org/GT29.html). 유용한 α3- 또는 α6-시알릴트랜스퍼라제는 특정 서브패밀리 ST6Gal-I를 갖는 β-갈락토시드 α-2,6-시알릴트랜스퍼라제 (EC 2.4.99.1), 및 β-갈락토시드 α-2,3-시알릴트랜스퍼라제 (EC 2.4.99.4)와 가능한 교차활성을 갖는 N-아세틸아세토사미니드 α-2,3-시알릴트랜스퍼라제 (EC 2.4.99.6)이다. α3-시알릴트랜스퍼라제의 유용한 서브타입에는 ST3Gal-III 및 ST3Gal-IV가 포함된다. 이들의 어떤 효소적으로 특징화된 종들은 CAZy 데이터베이스의 글리코실화 효소에 특징화되어 수록되어 있다 (cazy.org/GT29_characterized.html). α3- 또는 α6-링크된 시알릴트랜스퍼라제를 코딩하는 폴리뉴클레오타이드는 숙주 세포에 내인성이거나 또는 숙주 세포에 이질적인 것일 수 있다. 숙주 세포에서의 시알릴화는 특히 진균, 식물, 선충/기생충 또는 곤충 세포에서 CMP-Neu5Ac와 같은 공여체 CMP-시알산을 합성하는 효소를 발현하는데 필요할 수 있다.
[00159] 숙주 세포는 다양한 내인성 효소들의 활성 수준이 증가되었거나 감소되었을 수 있다. 감소된 활성 수준은 내인성 효소의 활성을 억제제, 항체 등으로 억제함으로써 제공될 수 있다. 특정 구체예에서, 숙주 세포는 여러 방식으로 유전자 변형되어 다양한 내인성 효소들의 활성을 증감시킬 수 있다. "유전자 변형된(Genetically modified)"이라는 용어는 폴리펩타이드를 증가된 수준, 감소된 수준으로 발현하는 거나 돌연변이 형태인 원핵 또는 진핵 숙주 생물을 만드는데 사용되는 모든 재조합 DNA 또는 RNA 방법을 칭한다. 달리 설명하면, 숙주 세포를 재조합 폴리뉴클레오타이드 분자로 형질감염, 형질전환 또는 형질도입함으로써, 세포로 하여금, 목적하는 단백질의 발현을 변경시키도록 하는 것이다.
[00160] 유전자 발현, 유전자 기능 또는 유전자 산물 (즉, 그 유전자가 코딩하는 단백질)의 기능의 감소를 초래하는 유전자 변형은 불활성화(완전 또는 부분), 결실, 간섭, 차단, 사일런싱 또는 하향조절 또는 유전자 발현의 감쇠라고 칭할 수 있다. 예컨대, 이러한 유전자가 코딩하는 단백질 기능을 감소시키는 유전자의 유전자 변형은, 그 유전자의 완전 결실 (즉 그 유전자가 존재하지 않고 따라서 단백질이 존재하지 않음), 단백질의 불완전 번역 또는 무번역을 초래하는 유전자의 돌연변이 (예컨대 단백질이 발현되지 않음) 또는 단백질의 본래 기능을 감소 또는 폐지시키는 유전자의 돌연변이 (예컨대 효소활성 또는 작용이 감소되거나 부재하는 단백질이 발현됨)의 결과일 수 있다. 보다 구체적으로, 여기서 논의된 단백질의 활성을 감소시킨다 함은 일반적으로 단백질의 발현 및/또는 기능(생물학적 활성) 감소를 야기하는, 문제의 숙주 세포에서의 모든 유전자 변형을 칭하며, 단백질의 활성 감소 (예컨대 감소된 촉매작용), 단백질의 발현 감소 또는 제거 뿐 아니라 단백질의 억제 또는 분해 증가도 포함한다. 예컨대, 본 발명의 단백질의 작용 또는 활성은 단백질 생산을 차단 또는 감소하거나, 단백질 작용을 감소시키거나 또는 단백질 작용을 억제함으로써 감소될 수 있다. 이들 변형 중 몇몇을 조합하는 것도 가능하다. 단백질의 생산을 차단 또는 감소시키는 것은 단백질을 코딩하는 유전자를 성장 배지 중 유도 화합물의 존재를 필요로 하는 프로모터의 존재 하에 단백질을 코딩하는 유전자를 두는 것을 포함할 수 있다. 배지로부터 인듀서를 고갈시키도록 조건을 설정함으로써, 단백질을 코딩하는 유전자 발현 (및 따라서 단백질 합성도)이 턴오프될 수 있다. 단백질의 작용을 차단 또는 감소시키는 것은 또한 미국특허 No. 4,743,546에 설명된 것과 유사한 제거 기술 접근법을 이용하는 것을 포함할 수 있다. 이 접근법을 이용하기 위해, 목적하는 단백질을 코딩하는 유전자를, 게놈으로부터 유전자를 특이적으로 그리고 조절적으로 제거할 수 있는 특이적 유전자 서열들 사이에 클로닝시킨다. 제거는 예컨대 미국특허 No. 4,743,546에서와 같이, 또는 다른 물리 또는 영양학적 시그널에 의해, 배양체의 배양 온도를 쉬프트시킴으로써 촉발될 수 있다.
[00161] 일반적으로, 본 발명에 따라, 돌연변이 또는 변형된 단백질의 주어진 특성 (예컨대 효소 활성)의 증감이 동일 생명체로부터 (동일 소스 또는 친서열로부터) 유도된 단백질의 야생형 (즉, 보통의, 변형되지 않은 것)과 동일한 특성을 참조로 od하고, 이를 동일 또는 균등 조건 하에서 측정 또는 수립한다. 마찬가지로, 유전적으로 변형된 숙주 세포의 특정의 증감 (예컨대 단백질의 발현 및/E는 생물학적 활성 또는 생성물의 생성)을 동일하거나 균등한 조건 하에서 동일종 및 좋기로는 동일 균주의 야생형 숙주 세포의 동일 특징을 참조로 실시한다. 이러한 조건은 단백질 활성 (예컨대 발현 또는 생물학적 활성) 또는 숙주 세포의 기타 특징이 측정되는 분석 또는 배양 조건 (예컨대 배지 성분, 온도, pH 등) 뿐만 아니라, 사용된 분석의 종류, 평가되는 숙주 세포 등을 포함한다. 전술한 바와 같이, 균등 조건은 유사하지만 반드시 동일할 필요는 없으며 (예컨대 조건의 몇몇 보존적 변화는 관용될 수 있음), 동일 조건 하에서 만들어진 비교예에 비해 생물학적 활성 또는 효소 발현 또는 세포 성장에 미치는 효과를 실제로 변화시키지 않는 그러한 조건이다.
[00162] 좋긴로는, 주어진 단백질 (예컨대 효소)의 활성이 증감되도록 유전자 변형된 숙주 세포는 야생형 숙주 세포에서의 야생형 단백질의 활성에 비해, 그 단백질의 활성 또는 작용(예컨대 발현, 생산 및/또는 생물학적 활성)이 각각 증가 또는 감소된 것으로서, 적어도 약 5%, 및 더욱 좋기로는 적어도 약 10%, 및 더욱 좋기로는 적어도 약 15%, 및 더욱 좋기로는 적어도 약 20%, 및 더욱 좋기로는 적어도 약 25%, 및 더욱 좋기로는 적어도 약 30%, 및 더욱 좋기로는 적어도 약 35%, 및 더욱 좋기로는 적어도 약 40%, 및 더욱 좋기로는 적어도 약 45%, 및 더욱 좋기로는 적어도 약 50%, 및 더욱 좋기로는 적어도 약 55%, 및 더욱 좋기로는 적어도 약 60%, 및 더욱 좋기로는 적어도 약 65%, 및 더욱 좋기로는 적어도 약 70%, 및 더욱 좋기로는 적어도 약 75%, 및 더욱 좋기로는 적어도 약 80%, 및 더욱 좋기로는 적어도 약 85%, 및 더욱 좋기로는 적어도 약 90%, 및 더욱 좋기로는 적어도 약 95%, 또는 5% 와 100% 사이의 모든 정수 백분율 (예컨대, 6%, 7%, 8%, etc.)만큼 증감된 것이다. 분리된 변형 핵산 분자 또는 단백질을 야생형 핵산 분자 또는 단백질과 직접 비교함으로써 동일한 차이들이 확인된다 (예컨대 생체내에서와 비교되도록 비교가 시험관내에서 행해진 경우).
[00163] 본 발명의 또 다른 측면에서, 주어진 단백질 (예컨대 효소)의 활성을 증가 또는 감소시키는 유전자 변형을 갖는, 유전자 변형된 숙주 세포는 야생형 숙주 세포에서 야생형 단백질의 활성에 비해, 그 단백질의 활성 또는 작용 (예컨대 발현, 생산 및/또는 생물학적 활성)이 각각 적어도 약 2배, 및 더욱 좋기로는 적어도 약 5배, 및 더욱 좋기로는 적어도 약 10배, 및 더욱 좋기로는 약 20배, 및 더욱 좋기로는 적어도 약 30배, 및 더욱 좋기로는 적어도 약 40배, 및 더욱 좋기로는 적어도 약 50배, 및 더욱 좋기로는 적어도 약 75배, 및 더욱 좋기로는 적어도 약 100배, 및 더욱 좋기로는 적어도 약 125배, 및 더욱 좋기로는 적어도 약 150배, 또는 적어도 2배로부터 시작하여 가능한 모든 정수배 만큼 (예컨대 3배, 4배, 5배, 6배, 등)증가 또는 감소된 것이다.
[00164] 특정 구체예에서, 숙주 세포는 야생형 숙주 세포에서의 활성 수준에 비해 감소된 돌리킬-P-Man:Man(5)GlcNAc(2)-PP-돌리킬 만노실트랜스퍼라제의 활성 수준을 갖는다. 돌리킬-P-Man:Man(5)GlcNAc(2)-PP-돌리킬 만노실트랜스퍼라제 (EC 2.4.1.130)는 알파-D-만노실 잔기를 돌리킬-포스페이트 D-만노스로부터 막지질-링크된 올리고당으로 전달해준다. 일반적으로, 돌리킬-P-Man:Man(5)GlcNAc(2)-PP-돌리킬 만노실트랜스퍼라제 효소는 alg3 유전자에 의해 코딩된다. 특정 구체예에서, 숙주 세포서의 alg3 유전자 발현 수준은 야생형 숙주세포에서 발현되는 수준보다 rkat된 수준이다. 특정 구체예에서, alg3 유전자는 숙주 세포로부터 결실된다.
[00165] 특정 구체예에서, 숙주 세포에서의 알파-1,6-만노실트랜스퍼라제의 활성 수준은 야생형 숙주 세포에서의 활성 수준보다 더 감소된 것이다. 알파-1,6-만노실트랜스퍼라제 (EC 2.4.1.232)는 알파-D-만노실 잔기를 GDP-만노스로부터 단백질-링크된 올리고당 내로 전달하여, 골지체에서 알파-(1->6)-D-만노실-D-만노스 결합을 개시하는 신장을 형성한다. 일반적으로, 알파-1,6-만노실트랜스퍼라제 효소는 och1 유전자에 의해 코딩된다. 특정 구체예에서, 숙주 세포에서의 och1 유전자 발현 수준은 야생형 숙주 세포에서의 발현 수준보다 더 감소된 수준이다. 특정 구체예에서, och1 유전자는 숙주 세포로부터 결실된다.
[00166] 특정 구체예에서, 숙주 세포는 감소된 수준의 프로테아제 활성을 갖는다. 특정 구체예에서, 다양한 프로테아제를 코딩하는 유전자들이 숙주 세포로부터 결실된다. 이들 유전자의 예로는 pep1(아스퍼질러스 중 pepA) 과 같은 프로테아제 및 셀로비오히드롤라제1 (cbh1) 과 같은 셀룰로분해 효소를 코딩하는 유전자를 들 수 있다.
[00167] 특정 구체예에서, 숙주 세포는 상동 재조합의 효율을 증가시키기 위해, 비상동성 엔드 조이닝 (NHEJ)에 관련된 단백질 활성이 감소될 수 있다. 특정 구체예에서, 이들 단백질을 코딩하는 유전자들은 숙주 세포로부터 결실된다. 이들 유전자 및 이들의 상동체의 예로는 예컨대 Ninomiya et al. 2004, Ishibashi et al. 2006, Villalba et al. 2008, 및 Mizutani et al. 2008에 설명된 것과 같은 Ku70, Ku80, Lig4, Rad50, Xrs2, Sir4, Lifl, 또는 Neil을 들 수 있으나 이에 한정되지 않는다.
[00168] 복합 N-글리칸의 제조방법의 특정 구체예에서, 숙주 세포는 트리코 더마 세포인데 이것은 야생형 트리코더마 세포에서의 활성 수준에 비해 더 감소된 돌리킬-P-Man:Man(5)GlcNAc(2)-PP-돌리킬 만노실트랜스퍼라제 수준을 갖는다.
[00169] 복합 N-글리칸의 제조방법의 또 다른 특정 구체예에서, 숙주 세포는 돌리킬-P-Man:Man(5)GlcNAc(2)-PP-돌리킬 만노실트랜스퍼라제의 활성과 알파-1,6-만노실트랜스퍼라제의 활성이 야생형 효모 세포에서의 활성 수준보다 더 감소된 수준이고, α-1,2-만노시다제를 코딩하는 폴리뉴클레오타이드를 더 포함한다.
복합 N- 글리칸의 생산을 위한 시험관내 방법
[00170] 또 다른 측면에서, 본 발명은 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인 및 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 함유하는 융합 단백질, 수용체 글리칸, 및 N-아세틸글루코사민 공여체(donor)를 완충액에서 함께 인큐베이션시키는 단계 (여기서, 상기 융합 단백질은 N-아세틸글루코사민이 말단 Manα3 잔기로 전달되는 것과 N-아세틸글루코사민이 수용체 글리칸의 말단 Manα6 잔기로 전달되는 것을 촉매하여 복합 N-글리칸을 생산한다)를 포함하는, 복합 N-글리칸의 생산방법에 관한 것이다. 특정 구체예에서, 수용체 글리칸은 아미노산, 펩타이드, 또는 폴리펩타이드로부터 선택된 분자에 결합된다. 특정 구체예에서, 수용체 글리칸은 이종 폴리펩타이드에 결합된다. 특정 구체예에서, 수용체 글리칸은 Man3이다. 특정 구체예에서 N-아세틸글루코사민 공여체는 UDP-GlcNAc 트랜스포터이다. 일반적으로 완충액은 Mn2 +, Ca2 +, 또는 Mg2 +와 같은 2가 양이온을 1 μM 내지 100 mM, 100 μM 내지 50 mM, 또는 0.1 mM 내지 25 mM의 농도로 함유한다. N-아세틸글루코사민 공여체는 일반적으로 수용체 글리칸 상의 반응성 수용체 부위에 비해 몰 과량, 예컨대 1.1- 100배 과량으로 사용된다. 수용체 글리칸의 농도는 일반적으로 1 μM 내지 100 mM, 100 μM 내지 50 mM, 또는 1 내지 25 mM이다. 수용체 글리칸이 폴리펩타이드에 결합되는 경우, 고분자량으로 인해 그 농도 범위는 최저가 된다. 반응 구성성분의 농도는 완충액 중의 그들의 용해도에 기초하여 조정될 수 있다. 효소 활성의 양(유닛)을 조절하여 합리적인 반응 시간 내에 반응을 실현하도록 할 수 있다. 합리적인 반응시간이란 대체로 수분 내지 수일이다. 특정 구체예에서 반응 시간은 약 05 시간 내지 1일 또는 1 내지 6 시간이다.
[00171] 유용한 완충액은 pH 범위가 약 5 내지 8.5, 5.5. to 8.0, 또는 6.0 및 7.5인 RIS, HEPES, MOPS와 같이 융합 단백질에 적합한 완충액이다. 일반적으로 TRIS, HEPES, 또는 MOPS 완충액의 농도는 pH 유지를 위해 5 내지 150 mM, 10-100 mM, 또는 10-60 mM으로 조정될 것이다. 이 반응은 NaCl과 같은 염 10-200 mM 및/또는 글리코실화가능한 단백질 (예컨대, 순수한 비글리코실화 또는 비수용체 글리칸 함유 알부민)을 첨가함으로써 최적화될 수 있다. 특정 구체예에서 시험관내 반응은 세포배양 배지에서 실시되도록 조정된다. 포스페이트 완충액을 이용하여 반응속도를 감소시킬 수 있다.
Man 3 GlcNAc 2 글리칸 생산을 위한 세포 및 방법
[00172] 또 다른 측면에서, 본 발명은 Man3GlcNAc2 및 alg3의 돌연변이를 함유하는 사상 진균 세포를 제공하는데, 여기서 Man3GlcNAc2는 세포가 분비하는 중성 N-글리칸의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 100% (mol%)를 포함한다. 중성 N-글리칸은 아미노산, 펩타이드 또는 폴리펩타이드에 결합될 수 있다. alg3 유전자는 전체 alg3 유전자의 점 돌연변이 또는 결실과 같은, 기술 분야에 알려진 공지 수단에 의해 돌연변이될 수 있다. 좋기로는, alg3 단백질의 기능은 alg3의 돌연변이에 의해 감소 또는 제거되는 것이 바람직하다. 사상 진균 세포는 아크레모니움, 아스퍼질러스 , 아우레오바시디움 , 크립토코쿠스, 크리소스포리움 , 크리소스포리움 루크노웬스, Filibasidium , 푸사리움 , 지베렐라 , 휴 미콜라 , 마그나포르테, 뮤코 , 미셀리오프토라 , 미로테슘 , 네오칼리마스틱스 , 뉴로스포라 , 페실로마이세스 , 피니실륨 , 피로마이세스 , 쉬조필룸 , 스키탈리디움, 탈라 로마이세스, 써모아스쿠스 , 틸라비아 , 톨리포클라디움, 또는 트리코더마 세포일 수 있다. 특정 구체예에서, 사상 진균 세포는 T. 리세이 세포이다. 특정 구체예에서, 사상 진균 세포는 본 발명의 여하한 재조합 단백질을 코딩하는 1 이상의 폴리뉴클레오타이드를 더 함유한다. 예컨대, 사상 진균 세포는 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인을 코딩하는 제1 폴리뉴클레오타이드 및 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 코딩하는 제2 폴리뉴클레오타이드을 더 함유할 수 있다. 별법으로, 사상 진균 세포는 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인 및 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인.을 포함하는 융합 단백질을 코딩하는 폴리뉴클레오타이드를 더 함유할 수 있다.
[00173] 또 다른 측면에서, 본 발명은 숙주 세포에서 Man3GlcNAc2 글리칸을 생산하는 방법을 제공하며, 이 방법은 만노실트랜스퍼라제의 활성 수준이 야생형 숙주세포에서의 활성 수준에 비해 감소된 것인 숙주 세포를 제공하는 단계 및 Man3GlcNAc2 글리칸을 생산하도록 숙주 세포를 배양하는 단계를 포함하여 이루어지며, 여기서 Man3GlcNAc2 글리칸은 숙주 세포에 의해 분비된 중성 N-글리칸의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 100% (mol%)를 구성한다.
[00174] Man3GlcNAc2 글리칸은 아미노산, 펩타이드, 또는 폴리펩타이드와 같은 분자에 결합될 수 있다. 특정 구체예에서, 아미노산은 아스파라긴 잔기이다. 아스파라긴 잔기는 측쇄 아미드(생물학적인 포유류 폴리펩타이드 N-글리칸 결합 구조)로부터의 아미노글리코시드 결합 중에 포함될 수 있으며 디펩타이드, 올리고펩타이드, 또는 폴리펩타이드와 같은 펩타이드 사슬의 일부일 수도 있다. 글리칸은 환원 GlcNAc 또는 Man의 N-, O-, 또는 C-링크된, 좋기로는 글리코시드, 유도체와 같은 환원 엔드 유도체일 수 있으며, 예컨대 아미노산, 알킬, 헤테로알킬, 아실, 알킬옥시, 아릴, 아릴알킬, 또는 헤테로아릴알킬로 이루어진 군으로부터 선택된 구조에 링크된 특정 글리칸을 갖는 스페이서 또는 말단 유기 잔기일 수 있다. 스페이서는 또한 다가 캐리어 또는 고체상에 링크될 수도 있다. 특정 구체예에서, 알킬-함유 구조로는 메틸, 에틸, 프로필, 및 C4-C26 알킬, 지질 예컨대 글리세롤지질, 인지질, 돌리콜-인지질 및 세라마이드 및 유도체를 들 수 있다. 환원 엔드(reducing end)는 또한 환원성 아민화에 의해 유도화되어 2차 아민 결합 또는 유도체 구조화될 수도 있다. 특정 캐리어로는 (폴리)펩타이드와 같은 바이폴리- 또는 올리고머, (다)당류, 예컨대 덱스트란, 셀룰로스, 아밀로스 또는 글리코사미노글리칸, 및 기타의 유기 폴리머 또는 올리고머 예컨대 플라스틱 예컨대 폴리에틸렌, 폴리프로필렌 폴리아미드(예컨대 나일론 또는 폴리스티렌), 폴리아크릴아미드 및 폴리락트산, 덴드리머 예컨대 PAMAM, Starburst 또는 Starfish 덴드리머, 또는 폴리리신 및 폴리알킬글리콜 예컨대 폴리에틸렌 글리콜(PEG)를 들 수 있다 고체상( solid phases)로는 마이크로타이터 웰, 실리카 입자, 유리, 금속(강철, 금 및 은 등), 폴리머 비드 예컨대 폴리스티렌 또는 레진 비드, 폴리락트산 비드, 다당류 비드 또는 유기 스페이서를 함유하는 마그네틱 비드를 들 수 있다.
[00175] 특정 구체예에서, Man3GlcNAc2 글리칸은 이종 폴리펩타이드에 결합된다. 특정 구체예에서, 이종 폴리펩타이드는 치료용 펩타이드이다. 단백질에는 예컨대 모노클로날 항체, 에리쓰로포이에틴, 인터페론, 성장 호르몬, 효소 또는 응혈인자가 포함될 수 있으며, 인간 또는 동물 치료에 유용할 수 있다. 예컨대, Man3GlcNAc2 글리칸은 리툭시맙과 같은 치료용 단백질에 결합될 수 있다. 일반적으로 Man3GlcNAc2 글리칸을 더 변형시켜 복합 글리칸이 되도록 할 수 있다. 이러한 변형은 숙주 세포에서 생체내로 또는 시험관내 방법으로 일어날 수 있다.
[00176] 특정 구체예에서, 만노실트랜스퍼라제는 돌리킬-P-Man:Man(5)GlcNAc(2)-PP-돌리킬 만노실트랜스퍼라제이다. 일반적으로, 돌리킬-P-Man:Man(5)GlcNAc(2)-PP-돌리킬 만노실트랜스퍼라제 효소는 alg3 유전자에 의해 코딩된다. 특정 구체예에서, 숙주 세포는 alg3 유전자의 발현 수준이 야생형 숙주 세포에서의 발현 수준에 비해 감소된 발현 수준을 갖는다. 특정 구체예에서, alg3 유전자는 숙주 세포로부터 결실된다. SEQ ID NOs: 97 및 98은 T. 리세이에서 alg3 유전자의 핵산 서열과 아미노산을 각각 제공하는 것이다.
[00177] 특정 구체예에서, 숙주 세포에서의 알파-1,6-만노실트랜스퍼라제의 활성 수준은 야생형 숙주 세포에서의 활성 수준에 비해 감소된 수준이다. 일반적으로, 알파-1,6-만노실트랜스퍼라제 효소는 och1 유전자에 의해 코딩된다. 특정 구체예에서, 숙주 세포는 α-1,2-만노시다제를 코딩하는 내인성 폴리뉴클레오타이드를 함유한다.
[00178] 특정 구체예에서, 숙주 세포는 트리코더마 세포이며, 특정 구체예에서, 숙주 세포는 트리코더마 리세이 세포이다.
본 발명의 사상 진균 세포
[00179] 또 다른 측면에서, 본 발명은 본 발명의 alg3 유전자의 발현 수준이 야생형 사상 진균 세포 중에서의 alg3 유전자의 발현 수준에 비해 감소된 수준을 갖는 것인 사상 진균 세포를 제공하며, 여기서 상기 사상 진균 세포는 "본 발명의 재조합 단백질" 섹션에 설명된 바와 같은 본 발명의 재조합 단백질도 함유하는 것이다. 예컨대, 특정 구체예에서 사상 진균 세포는 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인 및 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 포함하는 융합 단백질을 코딩하는 폴리뉴클레오타이드를 더 함유한다. 융합 단백질의 발현은 폴리뉴클레오타이드에 작동적으로 링크된 프로모터에 의해 조절될 수 있다. 프로모터는 연속 프로모터 또는 유도 프로모터일 수 있다. 특정의 바람지한 구체예에서, 프로모터는 cbh1 유도 프로모터와 같은 유도 프로모터이다.
[00180] 또 다른 측면에서, 본 발명은 본 발명의 alg3 유전자의 발현 수준이 야생형 사상 진균 세포 중에서의 alg3 유전자의 발현 수준에 비해 감소된 수준을 갖는 것인 사상 진균 세포를 제공하며, 여기서 상기 사상 진균 세포는 재조합 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인을 코딩하는 제1 폴리뉴클레오타이드와 재조합 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 코딩하는 제2 폴리뉴클레오타이드 역시도 함유한다. 이러한 구체예에서, 재조합 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인의 발현은 제1 폴리뉴클레오타이드에 작동적으로 링크된 프로모터에 의해 조절되며 재조합 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인의 발현은 제2 폴리뉴클레오타이드에 작동적으로 링크된 프로모터에 의해 조절된다. 프로모터는 연속 프로모터 또는 유도 프로모터일 수 있다. 특정 바람직한 구체예에서, 프로모터는 유도 프로모터, 예컨대 cbh1 유도 프로모터이다.
[00181] 다른 구체예에서, 단일 폴리뉴클레오타이드는 재조합 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인과 재조합 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 모두 코딩할 수 있음으로 해서 이들은 별도의 폴리펩타이드들로서 발현된다. 이러한 구체예에서, 폴리뉴클레오타이드는 폴리뉴클레오타이드로부터 각각의 촉매 도메인의 별도 번역을 가능케 하는 내부 리보좀 유입 부위를 함유할 수 있다. 이러한 구체예에서, 재조합 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인의 발현은 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인을 코딩하는 폴리뉴클레오타이드의 일부에 작동적으로 링크된 프로모터에 의해 제어되며 재조합 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인의 발현은 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 코딩하는 폴리뉴클레오타이드의 일부에 작동적으로 링크된 프로모터에 의해 제어된다. 프로모터는 연속 프로모터 또는 유도 프로모터일 수 있다. 특정의 바람직한 구체예에서, 프로모터는 유도 프로모터, 예컨대 cbh1 유도 프로모터이다.
[00182] 본 발명에 기재된 바와 같이, N-아세틸글루코사미닐트랜스퍼라제 I (GlcNAc-TI; GnTI; EC 2.4.1.101)은 반응 UDP-N-아세틸-D-글루코사민 + 3-(알파-D-만노실)-β-D-만노실-R <=> UDP + 3-(2-(N-아세틸-β-D-글루코사미닐)-알파-D-만노실)-β-D-만노실-R을 촉매하며, 여기서 R은 글리칸 수용체에서 N-링크된 올리고당의 잔부를 나타낸다. N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인은 이 반응을 촉매할 수 있는 N-아세틸글루코사미닐트랜스퍼라제 I 효소의 여하한 일부분일 수 있다. 다양한 생명체로부터의 N-아세틸글루코사미닐트랜스퍼라제 I 효소에 대한 아미노산 서열을 SEQ ID NOs: 1-19에 나타내었다. 부가적인 GnTI 효소는 CAZy 데이터베이스의 글리코실트랜스퍼라제 패밀리 13에 수록되어 있다 (cazy.org/GT13_all). 효소적으로 특징지어지는 종으로는 A. 탈리아나 AAR78757.1 (US6 653 459), C. 엘레간스 AAD03023.1 (Chen S. et al J. Biol.Chem 1999;274(1):288-97), D. 멜라노가스터 AAF57454.1 (Sarkar ' Schachter Biol Chem. 2001 Feb;382(2):209-17); C. 그리세우스 AAC52872.1 (Puthalakath H. et al J. Biol.Chem 1996 271(44):27818-22); H. 사피엔스 AAA52563.1 (Kumar R. et al Proc Natl Acad Sci U S A. 1990 Dec;87(24):9948-52); M. 아우라투스 AAD04130.1 (Opat As et al Biochem J. 1998 Dec 15;336 (Pt 3):593-8), (유도화 돌연변이의 예를 포함한다, 토끼, O. 쿠니쿨루스 AAA31493.1 (Sarkar M et al. Proc Natl Acad Sci U S A. 1991 Jan 1;88(1):234-8)을 들 수 있다. 특징적인 활성 효소의 또 다른 예는 cazy.org/GT13_characterized.에서 찾아볼 수 있다. 토끼의 GnTI의 촉매 도메인의 3D 구조는 Unligil UM et al. EMBO J. 2000 Oct 16;19(20):5269-80에서 X-선 결정학에 의해 정의되었다. GnTI의 Protein Data Bank (PDB) 구조는 1FO8, 1FO9, 1FOA, 2AM3 , 2AM4, 2AM5, 및 2APC이다. 특정 구체예에서, N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인은 인간 N-아세틸글루코사미닐트랜스퍼라제 I 효소 (SEQ ID NO: 1), 또는 그의 변이체들로부터 유래한다. 특정 구체예에서, N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인은 SEQ ID NO: 1의 아미노산 잔기 84-445와 아미노산 잔기와 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 함유한다. 몇몇 구체예에서, 보다 짧은 서열을 촉매 도메인으로서 이용할 수 있다 (예컨대 인간 효소의 아미노산 잔기 105-445 또는 토끼 효소의 아미노산 잔기 107-447; Sarkar et al. (1998) Glycoconjugate J 15:193-197). GnTI 촉매 도메인으로서 사용될 수 있는 부가적인 서열로는 인간 효소의 아미노산 30 내지 105로부터의 아미노산 잔기 또는 아미노산 잔기 30 내지 105 사이에서 시작하여 인간 효소의 아미노산 약 445까지 계속되는 C-말단 스템 도메인, 또는 다른 GnTI의 대응하는 동종 서열 또는 그의 촉매적 활성 변이체 또는 돌연변이체를 들 수 있다. 촉매 도메인은 예컨대 스템 도메인, 막투과 도메인, 또는 세포질 도메인의 전부 또는 일부와 같이 효소의 N-말단의 일부를 포함할 수 있다.
[00183] 본 발명에서 개시된 바와 같이, N-아세틸글루코사미닐트랜스퍼라제 II (GlcNAc-TII; GnTII; EC 2.4.1.143)는 반응 UDP-N-아세틸-D-글루코사민 + 6-(알파-D-만노실)-β-D-만노실-R <=> UDP + 6-(2-(N-아세틸-β-D-글루코사미닐)-알파-D-만노실)-β-D-만노실-R을 촉매하는데, 여기서 R은 글리칸 수용체 중 N-링크된 올리고당의 잔부이다. N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인은 이 반응을 촉매할 수 있는 N-아세틸글루코사미닐트랜스퍼라제 II 효소의 여하한 일부분이다. 다양한 생명체로부터 기원하는 N-아세틸글루코사미닐트랜스퍼라제 II 효소의 아미노산 서열들이 SEQ ID NOs: 20-33에 기재되어 있다. 특정 구체예에서, N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인은 인간 N-아세틸글루코사미닐트랜스퍼라제 II 효소 (SEQ ID NO: 20) 또는 그의 변이체로부터 유래한다. 부가적인 GnTII 종이 글리코실트랜스퍼라제 패밀리 16의 CAZy 데이터베이스에 기재되어 있다(cazy.org/GT16_all). 효소적으로 특징적인 종에는 GnTII of C. 엘레간스, D. 멜라노가스터 , 호모 사피엔스, 라투스 노르베기구스, 수스 스크로파 (cazy.org/GT16_characterized)가 포함된다. 특정 구체예에서, N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인은 SEQ ID NO: 21의 아미노산 잔기 약 30 내지 약 447과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 포함한다. 이 촉매 도메인은 스템 도메인, 막투과 도메인, 또는 세포질 도메인의 전부 또는 일부와 같은 효소의 N-말단 부분을 포함할 수 있다.
[00184] 사상 진균 세포가 본 발명의 융합 단백질을 함유하는 구체예에서, 융합 단백질은 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인과 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인 사이에 스페이서를 더 함유할 수 있다. "스페이서" 섹션에 설명된 본 발명의 스페이서이면 어느 것이든 사용가능하다. 특정한 바람직한 구체예에서, 스페이서는 EGIV 스페이서, 2xG4S 스페이서, 3xG4S 스페이서, 또는 CBHI 스페이서이다. 다른 구체예에서, 스페이서는 스템 도메인으로부터의 서열을 함유한다.
[00185] ER/골지 발현에 있어서 N-아세틸글루코사미닐트랜스퍼라제 I 및/또는 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인은 일반적으로 표적화 펩타이드 또는 ER 또는 골지 단백질의 일부와 융합되거나, 또는 동식물의 N-아세틸글루코사미닐트랜스퍼라제 효소의 내인성 ER 표적화 구조에 의하여 발현된다. 특정한 바람직한 구체예에서, N-아세틸글루코사미닐트랜스퍼라제 I 및/또는 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인은 "표적화 펩타이드" 섹션에 설명된 본 발명의 표적화 펩타이드이면 어느 것이든 함유한다. 좋기로는 표적화 펩타이드는 촉매 도메인의 N-말단 엔드에 링크된다. 몇몇 구체예에서, 표적화 펩타이드는 "표적화 펩타이드" 섹션에 설명된 본 발명의 스템 도메인이면 어느 것이든 함유한다. 특정의 바람직한 구체예에서, 표적화 펩타이드는 Kre2 표적화 펩타이드이다. 다른 구체예에서, 표적화 펩타이드는 스템 도메인의 N-말단 엔드에 링크된 세포질 도메인 또는 스템 도메인의 N-말단 엔드에 링크된 막투과 도메인을 더 함유한다. 표적화 펩타이드가 막투과 도메인을더 함유하는 구체예에서, 표적화 펩타이드는 막투과 도메인의 N-말단 엔드에 링크된 세포질 도메인을 더 함유할 수 있다.
[00186] 본 발명의 alg3 유전자의 발현 수준은 적절한 공지 방법, 예컨대 alg3 유전자를 돌연변이시키는 방법에 의해 감소될 수 있으나 이러한 방법으로 한정되는 것은 아니다. alg3은 예컨대 전체 alg3 유전자.의 점 돌연변이 또는 결실에 의해 돌연변이될 수 있다. 좋기로는 alg3 단백질의 기능은 alg3의 돌연변이에 의해 감소 또는 제거되는 것이 바람직하다. alg3 유전자는 돌리킬-P-Man:Man(5)GlcNAc(2)-PP-돌리킬 알파-1,3-만노실트랜스퍼라제를 코딩한다. 본 명세서에 개시된 바와 같이, 본 발명의 돌리킬-P-Man:Man(5)GlcNAc(2)-PP-돌리킬 만노실트랜스퍼라제는 알파-D-만노실 잔기를 돌리킬-포스페이트 D-만노스로부터 막지질-링크된 올리고당 내로 전달한다.
[00187] 특정 구체예에서, 사상 진균 세포는 UDP-GlcNAc 트랜스포터를 코딩하는 폴리뉴클레오타이드를 함유할 수 있다. UDP-GlcNAc 트랜스포터를 코딩하는 폴리뉴클레오타이드 는 사상 진균 세포에 내인성 (즉 자연적으로 존재함)일 수도 있고 또는 사상 진균 세포에 대해 이질적일 수도 있다.
[00188] 다른 구체예에서, 사상 진균 세포는 "숙주 세포" 섹션에서 설명된 바와 같이 본 발명의 α-1,2-만노시다제를 코딩하는 폴리뉴클레오타이드를 함유할 수도 있다. α-1,2-만노시다제를 코딩하는 폴리뉴클레오타이드는 사상 진균 세포에 내인성이거나 또는 사상 진균 세포에 대해 이질적인 것일 수 있다. 이 폴리뉴클레오타이드들은 특히 엑소-α-2-만노시다제를 분해시키지 않고 골지체로부터 ER로 전달된 고만노스 글리칸을 발현하는 사상 진균 세포에서 특히 유용하다. 세포질 발현의 경우 만노시다제의 촉매 도메인은 일반적으로 표적화 펩타이드, 예컨대 HDEL, KDEL, 또는 ER의 일부 또는 초기 골지 단백질과 융합되거나, 또는 동식물 만노시다제 I 효소의 내인성 ER 표적화 구조에 의해 발현된다.
[00189] 또 다른 구체예에서, 사상 진균 세포는 "숙주 세포" 섹션에서 설명된 바와 같은 본 발명의 갈락토실트랜스퍼라제를 코딩하는 폴리뉴클레오타이드를 함유한다. 갈락토실트랜스퍼라제는 β-링크된 갈락토실 잔기들을 말단 N-아세틸글루코사미닐 잔기에 전달한다. 특정 구체예에서 갈락토실트랜스퍼라제는 β-4-갈락토실트랜스퍼라제이다. 갈락토실트랜스퍼라제는 사상 진균의 세포질에서 발현될 수 있다. 이종의 표적화 펩타이드, 예컨대 Schwientek J.Biol. Chem 1996 3398에 설명된 바와 같은 Kre2 펩타이드가 이용될 수 있다. 갈락토실트랜스퍼라제의 발현에 사용될 수 있는 프로모터로는 gpd와 같은 연속 프로모터, 내인성 글리코실화 효소 및 예컨대 골지체 또는 ER에서 N-글리칸을 합성하는 만노실트랜스퍼라제와 같은 글리코실트랜스퍼라제의 프로모터, 및 cbh1 프로모터와 같은 고수율 내인성 단백질의 유도 프로모터가 포함된다. 숙주 세포가 갈락토실트랜스퍼라제를 코딩하는 폴리뉴클레오타이드를 포함하는 본 발명의 구체예에서 숙주 세포는 UDP-Gal 및/또는 UDP-Gal 트랜스포터를 코딩하는 폴리뉴클레오타이드도 함유한다. 사상 진균 세포가 갈락토실트랜스퍼라제를 코딩하는 폴리뉴클레오타이드를 포함하는 본 발명의 특정 구체예에서, 락토스는 숙주 세포 배양시 글루코스 대신 탄소원으로서 사용될 수 있다. 배양 배지는 pH가 4.5 내지 7.0 또는 5.0 내지 6.5 범위일 수 있다. 사상 진균 세포가 갈락토실트랜스퍼라제를 코딩하는 폴리뉴클레오타이드 및 UDP-Gal 및/또는 UDP-Gal 트랜스포터를 코딩하는 폴리뉴클레오타이드를 함유하는 본 발명의 특정 구체예에서, Mn2+, Ca2+ 또는 Mg2+와 같은 2가 양이온을 세포 배양 배지에 부가할 수 있다.
[00190] 다른 구체예에서, 사상 진균 세포는 "숙주 세포" 섹션에 설명된 바와 같이 본 발명의 시알릴트랜스퍼라제를 코딩하는 폴리뉴클레오타이드도 함유할 수 있다. 시알릴트랜스퍼라제는 α3- 또는 α6-링크된 시알산, 예컨대 Neu5Ac을 갈락토실화된 복합 글리칸의 말단 Gal에 전달한다. α3- 또는 α6-링크된 시알릴트랜스퍼라제를 코딩하는 폴리뉴클레오타이드는 사상 진균 세포에 내인성이거나 또는 사상 진균 세포에 이질적인 것일 수 있다. 사상 진균 세포에서의 시알릴화는 특히 진균, 식물, 선충/기생충 또는 곤충 세포에서 CMP-Neu5Ac와 같은 공여체 CMP-시알산을 합성하는 효소를 발현하는데 필요할 수 있다.
[00191] 이에 더해, 사상 진균 세포는 다양한 부가적인 내인성 효소의 활성보다 증가 또는 감소된 수준을 가질 수 있다. 감소된 활성 수준은 내인성 효소의 활성을 억제제, 항체 등으로 억제함으로써 제공될 수 있다. 특정 구체예에서, 사상 진균 세포는 여러 방식으로 유전자 변형되어 다양한 내인성 효소들의 활성을 증감시킬 수 있다. 1종 이상의 내인성 효소의 활성을 증가 또는 감소시키기 위해 사상 진균 세포를 유전자 변형하는 방법은 기술 분야에 잘 알려져 있으며, 비제한적인 예로서 "숙주 세포" 섹션에 설명된 방법들이 이에 포함된다. 특정 구체예에서, 사상 진균 세포는 알파-1,6-만노실트랜스퍼라제의 활성 수준이 야생형 사상 진균 세포에서의 수준에 비해 감소된 수준을 갖는다. 골지체 중의 알파-1,6-만노실트랜스퍼라제 (EC 2.4.1.232)는 신장 개시 알파-D-만노실 잔기를 GDP-만노스로부터 단백질-링크된 올리고당 내로 전달하여, 알파-(1->6)-D-만노실-D-만노스 결합을 형성한다. 일반적으로, 알파-1,6-만노실트랜스퍼라제 효소는 och1 유전자에 의해 코딩된다. 특정 구체예에서, 사상 진균 세포에서의 och1 유전자 발현 수준은 야생형 사상 진균 세포에서의 발현 수준보다 더 감소된 수준이다. 특정 구체예에서, och1 유전자는 사상 진균 세포로부터 결실된다.
[00192] 사상 진균 세포는 예컨대, 아크레모니움, 아스퍼질러스 , 아우레오바시디움 , 크립토코쿠스, 크리소스포리움 , 크리소스포리움 루크노웬스, 필리바시디움 , 푸사리움 , 지베렐라, 휴미콜라 , 마그나포르테, 뮤코 , 미셀리오프토라 , 미로테슘 , 네오칼리마스틱스 , 뉴로스포라 , 페실로마이세스 , 피니실륨 , 피로마이세스 , 쉬조필룸 , 스키탈리디움, 탈라로마이세스 , 써모아스쿠스 , 틸라비아 , 톨리포클라디움, 또는 트리코더마 세포일 수 있다. 특정 구체예에서, 사상 진균 세포는 T. 리세이 세포이다.
본 발명의 방법에 의해 생산된 복합 N- 글리칸을 함유하는 의약 조성물
[00193] 다른 측면에서, 본 발명은 본 발명의 방법에 의해 생산된 이종 분자에 결합된 1종 이상의 복합 N-글리칸 약학적으로 허용가능한 담체와 함께 함유하는 예컨대 의약 조성물과 같은 조성물을 제공한다. 본 발명의 의약 조성물은 또한 병용 치료법으로 투여될 수 있다, 즉 다른 약물과 조합적으로 투여될 수 있다. 예컨대, 병용 치료법은 적어도 1종의 다른 치료제와 조합된 본 발명에 따른 이종 분자에 결합된 복합 N-글리칸을 포함할 수 있다.
[00194] 본 발명에서, "약학적으로 허용가능한 담체"에는 생리학적으로 공용가능한 용매, 분산매질, 코팅, 항균 및 항진균제, 등장화제 및 흡수지연제 등이 포함된다. 좋기로는 담체는 정맥내, 근육내, 피하, 비경구, 척수내 또는 표피 투여 (예컨대 주사 또는 주입)에 적합한 것이 바람직하다. 투여 경로에 따라 활성 화합물, 즉 본 발명에 따라 이종 분자에 결합된 복합 N-글리칸을, 어떤 재료로 코팅함으로써 화합물을 불활성화시킬 수도 있는 산의 작용 또는 기타 자연 조건으로부터 화합물을 보호할 수도 있다.
[00195] 본 발명의 의약 조성물은 1종 이상의 약학적으로 허용가능한 염을 포함할 수 있다. "약학적으로 허용가능한 염"이란 모화합물의 요망되는 생물학적 활성은 유지하면서 어떠한 바람직하지 못한 독성 효과도 부여하지 않는 염을 의미한다 (예컨대 Berge, S.M., et al. (1977) J. Pharm. Sci. 66:1-19 참조). 이러한 염의 예로는 비독성 무기산, 예컨대 염산, 질산, 인산, 황산, 브롬화수소산, 요오드화수소산, 포스포러스 등 뿐만 아니라 비독성 유기산, 예컨대 지방족 모노- 및 디카르복실산, 페닐-치환된 알칸산, 히드록시 알칸산, 방향족 산, 지방족 및 방향족 술폰산 등을 들 수 있다. 염기 부가염에는 알칼리토금속, 예컨대 나트륨, 칼륨, 마그네슘, 칼슘 등 뿐만 아니라 비독성 유기 아민, 예컨대 N,N'-디벤질에틸렌디아민, N-메틸글루카민, 클로로프로카인, 콜린, 디에탄올아민, 에틸렌디아민, 프로카인 등이 포함된다.
[00196] 본 발명의 의약 조성물은 약학적으로 허용가능한 항산화제도 포함할 수 있다. 약학적으로 허용가능한 항산화제의 예로는: (1) 수용성 항산화제 예컨대 아스코르브산, 시스테인 염산염, 소듐 바이술페이트, 메타바이술파이트, 소듐 술파이트 등; (2) 지용성 항산화제, 예컨대 아스코르빌 팔미테이트, 부틸화된 히드록시아니솔(BHA), 부틸화된 히드록시톨루엔(BHT), 레시틴, 프로필 갈레이트, 알파-토코페롤 등; 및 (3) 금속 킬레이트화제, 예컨대 시트르산, 에틸렌디아민 테트라아세트산(EDTA), 소르비톨, ㅌ타타르타르산, 인산 등을 들 수 있다.
[00197] 본 발명의 의약 조성물에 사용될 수 있는 적절한 수성 및 비수성 담체의 예로는 물, 에탄올, 폴리올 (예컨대 글리세롤, 프로필렌 글리콜, 폴리에틸렌 글리콜 등), 및 이들의 적절한 혼합물, 식물성 오일 예컨대 올리브유 및 주사가능한 유기 에스테르, 예컨대 에틸 올리에이트를 들 수 있다. 적절한 유동성은 예컨대 레시틴과 같은 코팅재를 사용학, 분산물의 경우 요구되는 입도를 유지함으로써, 그리고 계면활성제를 사용함으로써 유지시킬 수 있다.
[00197] 이러한 조성물은 또한 보존제, 습윤제, 유화제 및 분산제와 같은 아쥬반트 역시도 함유할 수 있다. 미생물의 존재를 예방하는 것은 살균 공정 및 다양한 항균 및 항진균제, 예컨대 파라벤, 클로로부탄올, 페놀 소르브산 등을 사용하는 것에 의해 달성될 수 있다. 또한 설탕, 염화나트륨 등과 같은 등장화제를 조성물에 포함시키는 것도 요망될 수 있다. 이에 더해, 알루미늄 모노스테아레이트 및 젤라틴과 같은 흡수 지연제를 포함시킴으로써 주사가능한 의약 형태의 흡수를 연장시킬 수도 있다.
[00199] 약학적으로 허용가능한 담체는 멸균 주사용액 또는 분산액의 즉석 제조를 위해 멸균 수용액 또는 분산액 및 멸균 파우더를 포함한다. 이러한 매질 및 약학적 활성 물질의 사용은 기술 분야에 공지이다. 활성 화합물과 혼용할 수 없는 통상적인 매질 또는 제제를 제외하고, 다른 것들은 모두 본 발명의 의약 조성물에 사용될 수 있을 것으로 상정한다. 보조 활성 화합물 역시도 조성물 내로 혼입될 수 있다.
[00200] 치료용 조성물은 대체로 멸균되어야 하며 제조 및 보관 조건에서 안정하여야 한다. 이 조성물은 용액, 마이크로에멀젼, 리포좀 또는 고약물 농도에 적합한 기타 정연한 구조로 조성될 수 있다. 담체는 예컨대 물, 에탄올, 폴리올(예컨대, 글리세롤, 프로필렌 글리콜, 및 액상 폴리에틸렌 글리콜 등), 및 이들의 적절한 혼합물을 함유하는 용매 또는 분산 매질일 수 있다. 예컨대 레시틴과 같은 코팅재를 사용하고, 분산의 경우 요구되는 입도를 조절함으로써 그리고 계면활성제를 사용함으로써, 적절한 유동성을 유지시킬 수 있다. 많은 경우, 설탕, 다가 알코올 예컨대 만니톨, 소르비톨 또는 염화나트륨과 같은 등장화제를 조성물에 포함시키는 것이 바람직할 것이다. 예컨대 모노스테아레이트 염 및 젤라틴과 같이 흡수를 지연시키는 물질을 조성물에 포함시킴으로써 주사가능한 조성물의 흡수를 연장시킬 수 있다.
[00201] 요구량의 활성 화합물을 전술한 성분들과 조합하여 적절한 용매 중에 혼입시킨 다음, 멸균 마이크로여과시킴으로써 멸균 주사용액을 제조할 수 있다. 일반적으로, 분산물은 활성 화합물을 기본 분산 매질 및 전술한 기타 필요 성분들을 함유하는 멸균 비히클 내로 혼입하여 얻는다. 멸균 주사용액 제조를 위한 멸균 분말의 경우, 특정 제조방법은 진공 건조 및 동결건조(냉동건조)시켜 활성성분의 분말 플러스 목적하는 부가 성분을 앞서 멸균-여과된 용액으로부터 생산하는 것이다.
[00202] 담체 물질과 조합하여 단일 투여 제형을 만들 수 있는 활성성분의 양은 치료 대상자 및 특정 투여 경로에 따라 달라진다. 담체 물질과 조합되어 단일 투여 제형을 생성할 수 있는 활성 성분의 양은 일반적으로 치료효과를 발생시키는 조성물의 양이 될 것이다. 일반적으로, 100 퍼센트를 기준으로, 이 양은 활성 성분 약 0.01 퍼센트 내지 약 99 퍼센트, 좋기로는 약학적으로 허용가능한 담체와 조합된 활성 성분 약 0.1 퍼센트 내지 약 70 퍼센트, 가장 좋기로는 약 1 퍼센트 내지 약 30 퍼센트 범위가 될 것이다.
[00203] 최적의 원하는 반응 (예컨대 치료 반응)을 얻기 위해 투여 요법을 조정한다. 예컨대, 단일 볼루스를 투여하거나, 경시적으로 수차례 나누어 투여하거나 또는 치료 상황의 긴급성에 따라 투여량을 비례적으로 증감시킬 수 있다. 투여 용이성 및 투여 균일성을 위해 단일 투여 제형으로 비경구 조성물을 조성하는 것이 특히 바람직하다. 본 발명에 사용되는 투여 단위 형태라 함은 치료 대상자에게 단위 투여형태로 적합한 물리적으로 불연속적인 단위(유닛)을 의미하는 것으로서, 각 단위는 목적하는 치료 효과를 발생시키는 것으로 계산된 활성 화합물의 소정량을 요구되는 약학적 담체와 함께 함유한다. 본 발명의 투여 단위 형태에 대한 상세는 (a) 달성하고자 하는 특정 치료 효과 및 활성 화합물의 독특한 특성, 및 (b) 개체에 있어서 치료 감수성을 위해 활성 화합물과 같은 조제 분야에 내재적인 한계에 직접 의존하거나 좌우된다.
[00204] 이종 분자, 특히 이종 분자가 항체인 경우, 이종 분자에 결합된 복합 N-글리칸의 투여를 위해, 투여량 범위는 약 0.0001 내지 100 mg/kg, 및 더욱 일반적으로는 0.01 to 5 mg/kg 숙주 체중이다. 예컨대, 투여량은 0.3 mg/kg 체중, 1 mg/kg 체중, 3 mg/kg 체중, 5 mg/kg 체중 또는 10 mg/kg 체중 또는 1-10 mg/kg 범위이다. 예시적인 치료법은 주1회, 2주마다 1회, 3주마다 1회, 4주마다 1회, 월 1회, 3개월에 1회 또는 3 내지 6개월에 1회 투여하는 것이다. 이종 항체에 결합된 복합 N-글리칸의 특정한 투여 요법은 정맥 투여를 통해 1 mg/kg 체중 또는 3 mg/kg 체중의 양으로 투여하는 것이며, 항체는 다음 투여 스케쥴 중 어느 하나를 이용하여 주어진다: (i) 4주마다 1회씩 총 6회 투여한 다음 3개월마다 1회 투여; (ii) 3주일마다 1회 투여; (iii) 3 mg/kg 체중으로 1회 투여 후 1 mg/kg 체중으로 3주일마다 1회 투여.
[00205] 별법으로, 본 발명에 따라 이종 분자에 결합된 복합 N-글리칸을 서방형 포뮬레이션으로서 투여할 수 있으며, 이 경우 덜 자주 투여해도 된다. 투여량과 투여 빈도는 환자 내에서 투여된 물질의 반감기에 따라 달라진다. 일반적으로 인간 항체의 반감기가 가장 길며, 그 다음으로 인간화 항체, 키메라 항체 및 비인간 항체의 순서이다. 투여량 및 투여 빈도는 처리가 예방용인지 치료용인지에 따라서도 달라질 수 있다. 예방을 위한 적용시에는, 비교적 낮은 투여량을 장기간에 걸쳐 비교적 덜 잦은 간격으로 투여한다. 어떤 환자들은 죽을 때까지 이러한 처치를 지속하기도 한다. 치료를 위한 적용시에는, 질병의 진행이 둔화 또는 종결될 때까지 및 좋기로는 환자에 있어서 질병 증상이 부분적으로 또는 전적으로 완화된 것으로 나타날 때까지 비교적 높은 투여량을 비교적 단기간 동안 투여한다.
[00206] 본 발병의 의약 조성물 중 활성 성분의 실제 투여 수준은, 환자에게 유독하지 않으면서, 투여 모드, 조성물, 특정 환자에 대한 목적하는 치료 반응을 얻는데 효과적인 활성 성분의 양이 얻어지도록 변화시킬 수 있다. 선택된 투여량 수준은 사용된 본 발명의 특정 조성물 또는 그의 에스테르, 염 또는 아미드의 활성, 투여 경로, 투여 시기, 사용된 특정 화합물의 배출속도, 치료 기간, 사용된 특정 조성물과 조합적으로 사용된 기타 약물, 화합물 및/또는 물질, 치료 환자의 연령, 성별, 체중, 상태, 일반적인 건강 상태 및 과거 의료기록 등 의료 분야에 잘 알려진 인자들에 따라 달라질 것이다.
[00207] 본 발명의 면역글로불린의 "치료적 유효 투여량"은 좋기로는 질병 증상의 위중도 감소, 질병 증상이 없는 기간의 증가 및 빈도 증가, 또는 질병으로 인한 고통에 기인하는 손상 또는 장애의 방지를 결과시키는 것이 바람직하다. 예를 들어, 종양 치료의 경우, "치료적 유효 투여량"은 좋기로는 세포 성장 또는 종양 성장을 미처리 대상자에 비해 적어도 약 20%, 더욱 좋기로는 적어도 약 40%까지, 더더욱 좋기로는 적어도 약 60%까지, 및 더더욱 좋기로는 적어도 약 80%까지 억제시키는 것이다. 종양 성장을 억제하는 화합물의 능력은 동물 모델계에서 평가가능하며 이로부터 인간 종양에서의 효능을 추정할 수 있다. 별법으로, 조성물의 이 특성을 당업자에게 공지인 분석법에 의해 예컨대 시험관내 억제와 같은 화합물의 능력을 시험함으로써 평가할 수 있다. 치료용 화합물의 치료적 유효량은 종양 크기를 감소시키거나 또는 대상자에 있어서 증상을 완화시킬 수 있다. 당업자들은 대상의 크기, 대상자 증상의 위중도 및 선택된 특정 조성물 또는 투여 경로와 같은 인자들에 기초하여 결정될 수 있을 것이다.
[00208] 본 발명의 조성물은 기술분야에 공지인 다양한 방법들을 1가지 이상 이용하여 1 이상의 투여 경로를 통해 투여될 수 있다. 당업자들에게 잘 알려진 바와 같이, 투여 경로 및/또는 투여 방식은 원하는 결과에 따라 달리하게 된다. 본 발명의 결합 모이어티의 경우 특정 투여 경로는 정맥내, 근육내, 피내, 복강내, 피하, 척수내 또는 기타 비경구 투여경로, 예컨대 주사 또는 주입에 의한 것을 포함한다. 본 발명에서 "비경구 투여"라 함은 장내 또는 국소 투여를 제외한 투여방식을 의미하는 것으로, 대개 주사에 의하며 예컨대 정맥내, 근육내, 동맥내, 경막내, 캡슐내, 안구내, 심장내, 피내, 복강내, 기관경유, 피하(subcutaneous), 피하(subcuticular), 관절내, 피막하, 지주막하, 척주내, 경막외 및 인트라스터날 주사 및 주입 경로로 투여하는 것이다.
[00209] 별법으로, 본 발명에 따라 이종 분자에 결합된 복합 N-글리칸은 비경구용 경로 예컨대 국소, 진피내 또는 점막 경로, 예컨대 비내, 구강내, 질내, 직장내, 설하 또는 국소 투여 경로를 통해 투여될 수 있다.
[00210] 활성 화합물은 화합물의 급속 방출을 방지하는 담체와 함께 예컨대 서방형 포뮬레이션과 같은 형태로 제제화될 수 있으며, 여기에는 임플란트, 경피용 팻치 및 마이크로캡슐화된 전달계가 포함된다. 예컨대 에틸렌 비닐 아세테이트, 폴리안하이드라이드, 폴리글리콜산, 콜라겐, 폴리오르토에스테르 및 폴리락트산과 같은 생분해성, 생체적합성 폴리머가 사용될 수 있다. 이러한 포뮬레이션의 제조를 위한 만은 방법이 특허되거나 또는 당업자에게 알려져 있다. 예컨대 문헌 [Sustained and Controlled Release Drug Delivery Systems, J.R. Robinson, ed., Marcel Dekker, Inc., New York, 1978] 참조.
[00211] 치료용 조성물을 기술 분야에 공지인 의료 장치를 이용하여 투여할 수 있다. 예컨대, 특정 구체예에서, 본 발명의 치료용 조성물은 예컨대 미국특허 Nos. 5,399,163; 5,383,851; 5,312,335; 5,064,413; 4,941,880; 4,790,824; 또는 4,596,556에 개시된 바와 같은 무침 피하 주사 장치를 이용하여 투여될 수 있다. 공지 임플란트 및 본 발명에 유용한 모듈의 예로는: 조절된 속도로 의약을 분배하기 위한 이식가능한 마이크로-주입 펌프를 개시하고 있는 미국특허 No. 4,487,603; 피부를 통해 약물을 투여하는 치료 장치를 개시하고 있는 미국특허 No. 4,486,194; 정확한 주입 속도로 약물을 전달하기 위한 의료용 주입 펌프를 개시하고 있는 미국특허 No. 4,447,233; 연속적인 약물 전달을 위한 이식가능한 유동성 변동 주입 장치를 개시하고 있는 미국특허 No. 4,447,224; 다실 구획을 갖는 삼투압 약물 전달계를 개시하고 있는 미국특허 No. 4,439,196; 및 삼투 약물 전달계를 개시하고 있는 미국특허 No. 4,475,196를 들 수 있다.
[00212] 특정 구체예에서, 본 발명에 따른 이종 분자에 결합된 복합 N-글리칸의 용도는 치료용 항체를 이용하여 치료될 수 있는 질병의 치료를 위한 것이다.
[00213] 특정 구체예를 참조로 본 발명을 설명하였으나, 전술한 설명은 설명목적을 위하여 제공된 것일 뿐 본 발명의 범위가 이것으로 한정되는 것은 아니다. 본 발명의 범위 내에서 다른 측면, 장점 및 변형이 가능함이 당업자에게 명백하게 인식될 수 있을 것이다.
[00214] 본 발명을 더욱 구체적으로 설명하기 위하여 하기 실시예를 참조로 본 발명을 설명하나, 본 발명의 범위가 이들 실시예로 한정되는 것은 아니다.
[0022] 도 1은 T. 리세이 균주 M44, M81, M84, M109, M110, M131, M132, M133, M134, 및 M124에 대한 평균 글리코실화의 중성 N-글리칸의 질량분석 프로파일을 나타낸 도면이다.
[0023] 도 2는 모노포스포릴화된 Man7Gn2의 단편화 분석을 도시한 도면이다. 모노포스포릴화된 Man7Gn2의 오직 한가지 예시적인 구조만을 도시하였다.
[0024] 도 3은 T. 리세이 균주 M44, M81, M84, M109, M110, M131, M132, M133, M134, 및 M124에 대한 평균 글리코실화의 산성 N-글리칸의 질량분석 프로파일을 나타낸 도면이다.
[0025] 도 4는 발효기에서 131.4 시간 동안 배양된 (페드 뱃치) T. 리세이 균주 M44의 중성 (a) 및 산성 (b) N-글리칸 프로파일을 나타낸 도면이다.
[0026] 도 5는 T. 리세이 배양 배지의 중성 (a) 및 산성 (b) N-글리칸의 질량분석 프로파일을 나타낸 도면이다.
[0027] 도 6은 T. 리세이 M44 분비된 단백질의 막 블롯을 도시한 것이다.
[0028] 도 7은 발효기에서 배양된 T. 리세이 M44의 분석된 단백질 밴드를 예시한 도면이다. 단백질의 글리코실화는 T. 리세이에서의 평균 글리코실화와 유의적으로 다르지 않았다. 이 스펙트럼은 마이너 베이스라인 시그널에 초점을 맞춘 것으로서, 스펙트럼의 메이저 시그널은 다른 시그널에 비해 정량적이지 않았다.
[0029] 도 8은 친균주 및 alg3 프로브를 갖는 Alg3 녹아웃 균주로부터의 DNA의 서던 블롯을 나타낸 도면이다.
[0030] 도 9A는 예측된 제한효소 분해 산물 크기를 갖는 pTTv38 구조물 섹션의 제한효소 개열지도를 도시한 도면이다. 도 9B는 EcoRI + PvuI (E + P) 또는 KpnI + NheI (K + N)로 절단한 Alg3 녹아웃 균주 및 친균주로부터의 게놈 DNA의 서던 블롯을 나타낸 도면이다. 대조군 DNA는 NotI으로 절단한 pTTv38 plasmid DNA였다. 블롯을 AmdS 프로브로 프로빙하였다.
[0031] 도 10은 중성 N-글리칸의 MADLI 분석 결과를 나타낸 도면이다. 파트 A는 친균주 M124를 나타낸다. 파트 B는 Alg3 녹아웃 4A를 도시한 것이다. 사각형은 N-아세틸글루코사민을, 동그라미는 만노스를 나타내며, 단 하나의 표지된 글루코스를 예외로 한다.
[0032] 도 11은 4A Alg3 녹아웃 균주로부터의 Man3Gn2의 단편화 분석결과를 나타낸 도면이다.
[0033] 도 12는 Alg3 녹아웃 균주 4A (파트 A) 및 친 주 M124 (파트 B)로부터의 Hex5Gn2의 단편화 분석결과를 나타낸 도면이다. 상자 표시된 시그널은 Alg3 녹아웃 균주로부터의 이성질체로서만 존재한다.
[0034] 도 13은 α-만노시다제 절단 후 Alg3 녹아웃 균주 4A로부터의 중성 N-글리칸을 나타낸 도면이다.
[0035] 도 14는 액체 크로마토그래피를 이용하여 Alg3 녹아웃 균주로부터 2개의 메이저 글리칸을 분리하는 것을 도시한 도면이다.
[0036] 도 15는 Hex3HexNAc2 (파트 A) 및 Hex6HexNAc2 (파트 B) 분획의 양성자 NMR 스펙트럼을 나타낸 도면이다. 크리오프로브가 장착된 Varian Unity INOVA 600 MHz 분광기를 이용하여 40℃에서 스펙트럼을 수집하였다.
[0037] 도 16은 친균주 M124 (파트 A) 및 Alg3 녹아웃 균주 4A (B)의 산성 분획을 나타낸 도면이다. 2개의 포스페이트 유닛을 갖는 N-글리칸에 별표를 표시하였다.
[0038] 도 17은 플라스크에서 5일간 배양된 T. 리세이 Alg3 녹아웃 균주 4A의 상등액으로부터의 중성 N-글리칸을 나타낸 도면이다.
[0039] 도 18은 발효기에서 10일간 배양된 T. 리세이 Alg3 녹아웃 균주 4A의 상등액으로부터의 중성 N-글리칸을 나타낸 도면이다.
[0040] 도 19는 GnTI 반응 혼합물의 MALDI 스펙트럼을 나타낸 도면이다. GnTI은 수용체의 54%를 HexNAc을 한개 더 갖는 생성물로 전환시켰다.
[0041] 도 20은 GnTII 발현의 웨스턴 블롯 분석 결과를 나타낸 도면이다. 샘플들을 12% SDS-PAGE 겔에서 시험하여 니트로셀룰로스 막 상에 블로팅시켰다. 마우스 α-HIS 모노클로날 항체를 이용하여 막 상에서 히스티딘-태그된 GnTII를 검출하였다. 좌측의 숫자는 마커 단백질의 분자량(kDa)이다.
[0042] 도 21은 GnTII 반응 혼합물의 MALDI 스펙트럼을 도시한 것이다. 수용체(m/z 913.340)의 83%가 생성물(m/z 1136.433)로 변환되었다..
[0043] 도 22는 GnTI/GnTII 융합 단백질에 대해 관찰된 GnTI 활성을 나타낸 도면이다.
[0044] 도 23은 alg3 위치로의 표적화에 의해 수득된 GnTI/GnTII T. 리세이 형질전환주에 존재하는 N-글리칸dmfm 나타내는 도면이다.
[0045] 도 24는 GnTII/GnTI 융합 단백질의 효소활서어 테스트로부터 정제된 반응 혼합물의 MALDI 스펙트럼을 나타낸 도면이다..
[0046] 도 25는 β1-2,3,4,6-N-아세틸글루코사미니다제 반응 혼합물의 스펙트럼을 나타낸 도면이다.
[0047] 도 26은 β1-4GalT 반응 혼합물의 MALDI 스펙트럼을 나타낸 도면이다.
[0048] 도 27은 제3일 (A), 제5일 (B) 및 제7일 (C 및 D)에 있어서 T. 리세이 M127 pTTv110 형질전환주 (alg3 위치에 있어서 gnt II/I)의 상등액 단백질로부터 관찰된 N-글리칸의 다이아그램이다. 클론 17A은 제7일에 대부분의 G0를 생산하였다. (E)는 진탕 플라스크에서 7일간 배양시킨 T. 리세이 균주 M127 GnT II/I 형질전환주 클론 17A로부터의 상등액 단백질의 N-글리칸의 질량 스펙트럼이다. 별표 표시된 시그널은 배양 배지로부터 기원한 것이다.
[0049] 도 28은 T. 리세이 M202 GnT II/I 형질전환주 클론 (A) 9A-1 및 (B) 31A-1 (이들 두가지 모두 대두 트립신 억제제와 함께 배양됨)로부터의 리툭시맙의 중성 N-글리칸 및 (C) 대두 트립신 억제제 존재 하에 진탕 플라스크에서 5일간 배양된 T. 리세이 균주M202 GnT II/I 형질전환주 클론 9A-1로부터 정제된 리툭시맙의 중성 N-글리칸의 질량 스펙트럼을 나타낸 도면이다.
[0050] 도 29는 스페이서 변형된 GnTII/GnTI 융합 반응 혼합물의 MALDI 스펙트럼을 나타낸 도면이다. 파트 (A)는 GnTII/GnTI with 3xG4S 스페이서 변형된 반응 혼합물의 경우를 나타낸다. 수용체의 36%가 HexNAcs를 2개 더 갖는 생성물로 전환되었다. 파트 (B)는 2xG4S 스페이서 변형된 반응 혼합물의 경우를 나타낸다. 수용체의 38%가 HexNAcs를 2개 더 갖는 생성물로 전환되었다. Hex3HexNAc2의 [M+Na]+ -시그널에 대한 계산된 m/z 값은 어떤 스펙트럼에서도 검출되지 않았는데 이는 모든 GnTI 생성물이 직접 Hex3HexNAc3 (calc. m/z 1136.318)로 전환되었기 때문이다.
[0051] 도 30은 GnTII/I 스페이서 변이체 세포 펠렛 (A) 및 상등액 (B)의 웨스턴 블롯을 도시한 도면이다. 레인 1 .GnTII 양성 대조군, 2 GY3 목(mock) 균주, 3.GY7-2 야생형 GnTII/I, 4.GY32-5 3xG4S 스페이서, 5. GY32-9 3xG4S 스페이서, 6.GY33-7 2xG4S 스페이서, 7.GY33-8 2xG4S 스페이서, 8.GY49-3 CBHI 스페이서 및 9.GY50-10 EGIV 스페이서.
[0052] 도 31은 상등액으로부터의 야생형 GnTII/I 및 스페이서 변이체들의 GnT 활성을 나타내며 (A)3일 후 및 (B) 4일후의 프로테아제 억제제 존재하에서 발현 경과를 나타낸다. x축은 샘플의 아이덴티티 (wt = 야생형, _1, _2 = 스페이서 변이체의 패럴랠 클론)를 나타내고, y축은 형성된 생성물의 백분율을 나타낸다 (GnTI 및 GnTII 반응 생성물을 함께 한데 합함).
[0053] 도 32는 상등액, 세포 및 용해물 중 GnTII/I 융합 단백질 (야생형 스페이서 있음)의 GnT 활성을 나타낸 도면이다. GnTI 및 GnTII 생성물을 한데 합하였다.
[0054] 도 33은 (A) 상등액, (B) 세포 및 (C) 용해물 중 GnTII/I 야생형 및 스페이서 변이체의 GnT 활성을 나타낸 도면이다.
[0055] 도 34는 제5일에 친균주 M124와 GnT1 형질전환주의 중성 N-글리칸의 예시적인 스펙트럼을 나타낸 도면이다. Gn 첨가 시그널 (m/z 1460)에 화살표 표시하였다. (pTTv11는 cbh1 프로모터, pTTv13는 gpdA 프로모터).
[0056] 도 35는 제3일 및 제5일에 있어서 4가지 양성 GNT1 형질전환주에 있어서 Man5 및 Gn1Man5의 양을 나타낸 도면이다. 정량화는 내부 칼리브런트(Hex2HexNAc4, 2 pmol)에 대하여 실시하였다 .
[0057] 도 36은 내부 칼리브런트 (NeuAcHex4HexNAc2, 0.5 pmol.)에 대한 친균주 M124 균주 및 GnT1 형질전환주의 포스포릴화된 N-글리칸의 스펙트럼을 나타낸 도면이다. GnT1 생성물에 화살표 표시하였다.
[0058] 도 37은 제5일에 여러가지 GnTII 균주/클론의 중성 N-글리칸의 다이아그램을 나타낸 도면이다. 파트 (A)는 pTTv140 클론을 나타낸다. 파트 (B)는 pTTv142 클론을 나타낸다. 파트 (C)는 pTTv143 클론을 나타낸다. 파트 (D)는 pTTv141 클론을 나타낸다.
[0059] 도 38은 제3, 5, 및 7일에 친균주 M198 및 여러가지 GnTII 균주/클론의 중성 N-글리칸을 예시한 도면이다. 파트 (A)는 클론 1-117A를 나타낸다. 파트 (B)는 s 클론 3-11A를 나타낸다. 파트 (C)는 클론 30A를 나타낸다. 파트 (D)는 친균주 M198을 나타낸다.
[0060] 도 39는 T. 리세이 친균주 M198과 GnTII 클론 3-17A의 분리된 단백질의 막을 나타낸 도면이다. 50 kDA 단백질에 화살표 표시하였다.
[0061] 도 40은 친균주 M198 (A)와 GnTII 클론 3-17A(B)의 총 분비 단백질 대 개별 분비된 단백질(들)의 컬럼 다이아그램을 나타낸 도면이다.
[0062] 도 41은 제3일 내지 제7일에 발효기 배양된 GnTII 균주 M329 및 제5일에 진탕 플라스크 배양된 균주 M329의 컬럼 다이아그램이다.
[0063] 도 42는 T. 리세이 ALG3 및 ALG3 상동체의 복수개 아미노산 서열 정렬도를 나타낸 것이다.
실시예 1 - 글리코엔지니어링을 위항 숙주 균주 선택
[00215] 이 실시예의 목적은 글리코엔지니어링을 위한 최적의 T. 리세이 균주들을 동정하기 위한 것이다. 최적 균주는 Man5 N-글리칸을 다량으로 그리고 산성 글리칸을 소량 생산한다.
샘플
[00216] M44 (VTT-D-00775; Selinheimo et al., FEBS J. 2006, 273(18): 4322-35), M81, M84, M109, M110, M131, M132, M133, M134 및 M124 (M44의 mus53-결실돈 균주)를 비롯한 여러가지 T. 리세이 균주들을 분석하였다. 진탕 플라스크 배지에서 각각 10개의 균주들을 성장시켰다. 3가지 서로 다른 시점, 즉: 제3일, 제5일 및 제7일에 샘플을 채취하였다. 상등액 (분비된 단백질)과 세포 펠렛을 모두 수집하여 글리칸 분석을 실시할 때까지 -20℃에서 보관하였다.
[00217] N-글리칸을 분비된 단백질로부터 지시된 시점에서 분리한 다음 매트릭스-보조형 레이저 탈착/이온화-타임-오브-플라이트(MALDI-TOF) 글리칸 프로파일링을 실시하였다. 제5일 시점으로부터의 세포 펠렛을 N-글리칸 프로파일링시켰다. 총 80개의 샘플 (중성 상등액 분획과 산성 상등액 분획 각 30개씩, 및 중성- 및 산성 펠렛 분획 각 10개씩)을 분석하였다.
[00218] 진탕 플라스크와 발효기 배양 간의 글리칸 프로파일의 차이점을 평가하기 위해, 균주 M44에 대해서는 뱃치 및 페드-뱃치형 발효기 배양도 실시하였다. 글리칸 분석을 위해, 3가지 서로 다른 시점으로부터의 샘플들을 총 12개 샘플 (6개의 중성 분획 및 6개의 산성 분획)을 분석하였다. 대조군으로서, 배양 배지를 분석하였다.
질량 분석법
[00219] Bruker Ultraflex TOF/TOF 인스트루먼트 (Bruker Daltonics, Germany)를 이용하여 MALDI-TOF 질량분석법을 실시하였다. 중성 N-글리칸이 양이온 리플렉터 모드에서 [M + Na]+ 이온으로서 검출되었고, 산성 N-글리칸은 음이온 선형 모드 [M-H]- 이온으로서 검출되었다. 중성 N-글리칸 성분들의 상대적인 몰 풍부성을 그들이 스펙트럼에 있어서의 상대적인 시그널 강도에 기초하여 분석하였다. 제시된 글리칸 프로파일 중 결과적인 글리칸 시그널을 100%로 정규화하여 샘플끼리 비교하였다.
단백질-특이적인 글리코실화 방법
[00220] 발효기-배양된 샘플로부터의 단백질을 SDS-PAGE 로 분리하고 PVDF 막에 블로팅시켰다. 목적하는 단백질 밴드를 절제하고, PNGase F를 이용하여 효소 방출에 의해 N-글리칸을 방출시켰다.
T. 리세이 균주의 중성 N- 글리칸 프로파일
[00221] 목적하는 Man5 구조가 [M+Na]+ 시그널로서 도 1에 제시된 질량 스펙트럼에서 m/z 값 1257.4로서 관찰될 수 있다. 분석된 T. 리세이 균주이 중성 글리콘은 주요 중성 글리칸 종으로서 Man5 또는 Man8을 갖는 것으로 밝혀졌다 (표 2 중 H5N2 및 H8N2).
Figure pct00006
[0222] 몇몇 산성 N-글리칸들이 중성 N-글리칸 분획에서 관찰되었다. 이것은 아마도 포스포릴화된 글리칸의 특이적 특성, 예컨대 포스포디에스테르 구조의 존재, 또는 이 연구에 이용된 실험 조건 하에서 중성 분획에 산성 종의 누출을 유도한 포스포글리칸의 기타 특성에 기인한 것일 것이다. 대응하는 구조를 체크하기 위해, 목적하는 시그널을 MS/MS 분석하였다. MS/MS 분석 모드로 Bruker Ultraflex TOF/TOF를 이용하여 글리칸의 질량분석 단편화를 수행하였다 (도 2). 글리칸은 과메틸화(permethylated)되지 않았으므로, MS/MS 데이터에 기초해서 확정적인 구조 결정은 얻을 수 없었다.
T. 리세이 균주의 산성 N- 글리칸 프로파일
[00223] 글리코엔지니어링 목적상 균주들이 산성 N-글리칸을 최소량으로 갖는 것이 유용하였다. 따라서, 스크리닝에 사용된 균주들로부터 산성 N-글리칸 프로파일을 분석하였다. 분석된 균주들의 산성 N-글리칸 스펙트럼을 도 3 및 하기 표 3에 나타내었다.
Figure pct00007
발효기 배양된 균주 M44 로부터의 N- 글리칸 프로파일
[00224] 혹시 상이한 발효 조건이 그의 글리칸 프로파일을 변화시킬 수 있는지를 알아보기 위하여 균주 M44를 발효기에서 배양시켰다. 발효기(뱃치; 41:10, 88:45 및 112:50 시간s, 및 페드 뱃치; 45:50, 131:40 및 217:20 시간)에서 배양된 샘플에 대해 N-글리칸 분석을 실시하고 이를 진탕 플라스크 배양의 경우와 비교하였다. 발효기에서 배양된 T. 리세이 균주 M44의 분비된 단백질의 중성 및 산성 N-글리칸을 도 4에 도시하였다. 플라스크 및 발효기 배양으로부터의 N-글리칸 백분율을 서로 비교하여 하기 표 4에 나타내었다
Figure pct00008
진탕 플라스크 배양 배지의 N- 글리칸 분석
[00225] 대조군 실험으로서, T. 리세이의 배양 배지 (진균과 접촉시키지 않음)를 분석하였다. 도 5a는 중성 N-글리칸 분석을 나타내는데 여기서는 어떠한 N-글리칸도 발견되지 않았다. 배지에 사용된 식물성 재료로부터 유도되었음직한 육탄당 올리고머의 마이너 시그널만이 기저선 위로 관찰가능하였다. 도 5b (산성 글리칸)에서는 N-글리칸에 대응하는 시그널이 일체 관찰되지 않았다.
분비된 단백질의 N- 글리코실화
[00226] 개별적으로 분비된 단백질들 간에 글리코실화에 변동이 있는지 체크하기 위해, 발효 배양 상등액으로부터의 샘플을 SDS-PAGE로 분리하고 PVDF 막에 블로팅하였다. 이어서 선택된 밴드들의 N-글리칸을 막효소 방출시 탈착시켰다. 결과를 도 6 및 7에 나타내었다.
결과: 중성 글리칸
[00227] 이 연구의 목적은 다량의 Man5 N-글리칸 소량의 산성 글리칸을 갖는 글리코엔지니어링을 위한 T. 리세이 균주를 동정하기 위한 것이었다. 질량분석 스펙트럼 분석에서 메인 피크로서 Man5를 갖는 균주들은 보다 높은 내인성 α-1,2-만노시다제 활성을 가질 수 있다. T. 리세이 N-글리코실화에 대한 배경 정보에 기초할 때, Man5의 가능성 있는 구조는 Manα3[Manα3(Manα6)Manα6]Manβ4GlcNAcβ4GlcNAc이다 (Salovuori et al. 1987; Stals et al. Glycobiology 14, 2004, page 725).
[00228] 몇몇 균주들은 H8N2를 메이저 중성 글리코폼으로서 함유하였다. 문헌에 기초할 때 이 글리코폼은 Glcα3Manα2Manα2Man5 구조일 가능성이 가장 높았다 (Stals et al. Glycobiology 14, 2004, page 725). 이들 균주들에서의 글루코시다제 결핍은 글리칸의 보다 작은 글리코폼 형태로의 분해를 방지한다.
[00229] 몇몇 균주에서, 산성 N-글리칸이 중성 스펙트럼에서 관찰되었다. 이 상황은 아마도 산성 N-글리칸의 비율이 더 높거나 또는 산성 글리칸으로부터 중성 글리칸의 분리가 일어나는 동안 중성 분획 내로 특정 구조들이 누출된데 기인한 것을 수 있다.
[00230] 균주들의 글리칸 프로파일은 진탕 플라스크에서의 경우와 비교할 때 발효기에서 배양될 경우, 글리코엔지니어링에 좀 더 유리하였다. 발효기-배양된 샘플로부터의 개별적인 단백질의 글리코실화는 평균 글리코실화로부터 유의적으로 차이나지 않았다. 분석된 모든 단백질들은 주요 글리코폼으로서 Man5를 함유하였다. 이러한 관찰은 모든 분비된 단백질이 유사한 글리칸 프로세싱을 거쳤음을 시사하는 것이었다. 따라서 분비된 단백질의 대다수는 T. 리세이 숙주 세포에 의해 유사하게 글리코실화된 것으로 보이며, 이는 포유류 세포의 경우에서 항상 그렇지는 않은 것과 대비된다.
산성 글리칸
[00231] N-글리칸의 포스포릴화는 글리코엔지니어링에 있어 대체로 요망되는 것이 아닌데, 이는 말단 포스페이트 잔기가 항체를 비롯한 보통 치료용 단백질에는 존재하지 않기 때문이다. 이 규칙의 몇가지 예외는 리포좀 글리코실화 스토리지 장애에 사용되는 몇 안되는 특수 단백질의 경우이다. N-글리칸의 포스포릴화는 진균에서 단백질-특이적일 수 있다. 동물에서, 만노스 포스포릴화는 보존된 리조좀 표적화 시그널이다.
[00232] 오늘날까지 T. 리세이 N-글리칸의 설페이트화에 대하여는 어떠한 보고도 없었다. 따라서, 이 보고에서 말하는 산성 구조는 포스포릴화된 글리칸인 듯 하다.
[00233] 플라스크 배양에서와 같이 T. 리세이가 낮은 pH 값에서 배양되는 경우 포스포릴화가 더 흔한데, 이는 낮은 pH 스트레스와 균사 파괴와 관련이 있을 수 있다 (Stals et al., 2004, Glycobiology 14:713-724). 이 연구에서는 플라스크 배양 샘플과 발효기 배양 샘플 간에 명확한 차이점이 관찰되었다. 진탕 플라스크 배양 샘플에서는 모두 포스포릴화된 산성 N-글리칸이 관찰되었다. 발효기 샘플 중에서의 산성 N-글리칸의 양은 검출한계 미만이었거나 또는 더 높은 pH로 인해, 글리칸의 유의적인 포스포릴화가 일어나지 않았을 것으로 여겨진다. N-글리칸 총량에 대한 산성 N-글리칸의 비율은 이 연구에 사용된 방법으로 검정할 수 없었는데, 이는 중성 및 산성 글리칸 종들 간에 이온화 효율이 서로 다르기 때문이었다.
[00234] 포스포릴화 수준을 측정하기 위해, N-글리칸을, 뱃치 및 페드 뱃치 발효기에서 배양된 10 ㎍의 T. 리세이 분비 단백질로부터 N-글리카나제에 의해 방출시켰다. 단백질 농도를 스탠다드로서 BSA를 이용하여 브래드포드-기반법에 따라 측정하였다. MALDI-TOF 분석에 앞서서 산성 N-글리칸 샘플에 1 pmol의 스탠다드 분자 NeuAcHex4HexNAc2를 첨가하였다. 주요 글리코폼 (발효기의 경우 Hex7HexNAc2P 및 플라스크 배양의 경우 Hex6-8HexNAc2P)의 양은 배지의 pH를 저하시켰을 때, 플라스크 배양의 분비 단백질 160 pmol/10 ㎍, 뱃치 배양시 분비 단백질의 경우 0.9 pmol/10 ㎍, 그리고 페드 뱃치 배양의 분비 단백질의 경우 0.6 pmol/10 ㎍이었다. 중성 N-글리칸의 양을, MALDI-TOF 분석에 앞서서, 중성 N-글리칸 샘플에 첨가된 10 pmol의 스탠다드 글리칸 Hex2HexNAc4을 이용하여 측정하였다. 메이저 글리코폼 Hex5HexNAc2의 양은 87 뱃치 및 페드-뱃치 배양시 87 pmol/10 ㎍ 분비 단백질이었고 플라스크 배양시 145 pmol/10 ㎍ 분비 단백질이었다. 따라서, N-글리칸 총량에 대한 산성 N-글리칸의 비율은 뱃치 배양시 1%, 페드-뱃치 배양시 0.7% 그리고 플라스크 배양시 52%였다. 정량은 MALDI-TOF 데이터를 이용한 시그널 강도 비교에만 기초하여 행하였다.
[00235] N-글리칸은 산성 분획에서 더 컸다. 이것은 아마도 인이 하나의 헥소스 유닛과 함께 글리칸 백본에 부착되는 포스포-만노실화 반응에 기인한 것일 수 있다. 산성 스펙트럼에서 몇몇 디포스포릴화된 구조가 나타났다. 이 설명은 T. 리 세이 에서 발견된 포스포릴화된 글리칸에 대하여 이전에 간행된 데이터와 일치하는 것이다 (Stals et al. 2004, Glycobiology 14:725-737). 발효기에서 배양된 경우, 산성 N-글리칸의 비율은 매우 낮아 검출 한계 미만이었다.
[00236] T. 리세이 배양 배지의 N-글리칸 스펙트럼은 T. 리세이 N-글리콤이 식물성 물질 함유 배지로부터 유래된 글리칸에 의해 오염되지 않았음을 보여주었다.
[00237] 결국, 여러가지 T. 리세이 균주들의 N-글리칸 분석 결과 균주 M44, M109, M131, M132 및 M124에서의 메이저 글리코폼은 Man5 또는 Manα3[Manα3(Manα6)Manα6]Manβ4GlcNAcβ4GlcNAc인 것으로 밝혀졌다. Man5-생산 균주에서 마이너 성분으로서 H8N2를 포함하는 글루코스의 가능한 존재가 고려되었다. 2종의 균주 (M109 및 M131)는 H8N2를 H7N2보다 더 대량 함유하였다. H8N2의 이러한 풍부성은 부분적인 글루코시다제 결핍을 가리키는 것이었다.
[00238] 균주 M44는 포스포릴화 글리칸을 거의 함유하지 않았다. m/z 1521 및 m/z 1683에서 시그널로서 중성 글리칸 분획 중에 관찰된 산성 글리칸 누출은 균주 M131, M109, M132 및 M124로부터의 샘플에서 관찰되었는데, 이는 보다 높은 포스포릴화 수준과 잠재적인 포스포디에스테르 구조의 존재를 시사하는 것이었다.
[00239] 이 연구의 목적은 Man5Gn2 구조의 생산량이 최대이고 산성 (포스포릴화된) N-글리칸은 낮은 수준으로 생산하는 균주를 밝히는 것이었다. 가장 우수한 균주는 pH-조절된 진탕 플라스크 배양 조건 하에서 80%가 넘는 Man5를 나타냈다. 가장 우수한 균주는 또한 디-포스포릴화 글리칸을 감소된 생산 및/또는 보다 많은 포스포릴화 구조를 가졌다 (표 3 참조)
실시예 2 - Alg3 -결핍 트리코더마 균주의 생성
벡터 구축 및 균주 생성
[00240] ALG3 만노실트랜스퍼라제를 코딩하는 유전자를 트리코더마 리세이 게놈 서열에서 동정하였다. alg3 유전자의 1000 bp 5' 및 3' 플랭킹 대역 단편 사이에 아세트아미다제 선택 마커를 삽입하기 위해 붕괴 구조 (disruption construct)를 설계하였다. 플랭킹 대역 단편을 PCR로 증폭시키고 사카로마이세스 세레비지아에에서 상동 재조합 클로닝함으로써 구조물을 만들었다. 붕괴 카세트를 분해에 의해 그의 백본 벡터로부터 방출시켜 T. 리세이 균주 M124 내로 형질전환시켰다. 형질전환주를 아세트아미다제 배지에서 선별하고 구조물의 5' 플랭킹 대역 단편 외부의 정방향 프라이머와 AmdS 선택 마커 내부의 역방햐야 프라이머를 이용하여 PCR에 의해 스크리닝하였다.
형질전환주의 스크리닝
[00241] 62개의 스크리닝된 형질전환들 중 58개가 alg3 위치로 구조물을 ㅅ삽입하는데 기대할만한 크기의 PCR 생성물을 제공하였다. 9개의 PCR-포지티브 형질전환주를 정제하여 단포자 배양체를 통해 단핵 클론이 되도록 정제하고 이로부터 포자 현탁액을 마들었다. 이 9개의 클론들을 서던 하이브리다이제이션을 이용하여 붕괴 카세트의 정확한 삽입 여부에 대해 분석하였다. 친균주와 9개의 클론으로부터의 EcoRI-분해된 ㄱ-게놈 DNAfmf 표준 혼성화 조건 하에서alg3 프로브와 혼성화시켰다. 모균주로부터의 DNA와 혼성화되었으나 클론으로부터의 DNA와는 혼성화하지 않은 프로브들은 alg3 이 성공적으로 결실되었음을 가리키는 것이다(도 8).
[00242] 서던 하이브리다이제이션에 의해 AmdS 프로브를 이용하여 추가 분석을 실시하였다. 결실 카세트 내에 AmdS 유전자를 포함시키고 형질전환주로부터의 DNA중에서 검출가능할 것으로 예상하였으나 친균주로부터의 DNA에서는 그렇지 않았다. 친균주 M124 및 9개의 형질전환주로부터의 게놈 DNA를 EcoRI + PvuI (E + P) 및 KpnI + NheI (K + N)로 분해시켰다. alg3-AmdS 결실 카세트를 지니는 NotI 절단된 플라스미드를 양성 대조군으로서 이용하였다. 이 프로브는 양성 대조군으로부터의 예상된 ~ 2.7 kb 단편(AmdS)을 인식하였으나 친균주와 혼성화하지 않았다. 모든 형질전환주들은 예상된 시그널 (E + P에 대해 1.6 + 2.8 kb 및 K + N에 대해 1.7 + 3.4 kb , 도 9B에 화살표 표시됨)을 나타내었는데 이는 결실 카세트가 정확히 통합되었음을 가리키는 것이다. 클론 11A 및 15A 역시도 몇몇 부가적인 단편들의 하이브리다이제이션을 나타내었는데 이는 결실 카세트가 게놈 내로 비특이적으로 통합되었음을 시사하는 것이다 (도 9B).
N- 글리칸 분석학
[00243] 5개의 상이한 Alg3 녹아웃 균주 (4A, 5A, 6A, 10A 및 16A) 및 친균주 M124의 진탕 플라스크 배양체를 N-글리칸에 대하여 분석하였다. 제 3, 5, 7, 및 9일 시점에서 샘플들을 채취하였다. 모든 배양체는 듀플리킷으로 성장시켰다.
[00244] 모든 시점으로부터 무작위적으로 선택된 녹아웃 균주 (4A)로부터의 분비 단백질의 단백질 농도를 BSA 스탠다드 곡선에 대해 브래드포드-기반 분석법을 이용하여 측정하였다. 최고 단백질 농도는 제5일에 검출되었다. 따라서, 제5일에 샘플을 모든 5종의 녹아웃 균주들에 대한 N-글리카나 분석에 사용하였다. 듀플리킷 배양체를 비롯하여 모든 샘플들을 3회 분석하였다. N-글리칸 분석에 10 ㎍을 이용하였다. 중성 및 산성 N-글리칸 양자 모두를 MALDI-TOF로 분석하였다.
친균주 M124 중의 메이저 글리코폼은 Man5Gn2였다. 모든 Alg3 녹아웃 균주에서 메이저 글리코폼은 Man3이었다 (도 10). 친균주 M124에서는 Man3이 발견되지 않았다. 상이한 Alg3 녹아웃 균주에 있어서 Man3의 양은 pH 강하가 허여된 진탕 배양체에 있어서 49.7% - 55.2% 범위였다. Hex6Gn2가 친균주에서 증가하였다. 관찰된 중성 N-글리칸 시그널의 백분율로서 시그널 강도를 하기 표 5에 나타내었다.
Figure pct00009
[00246] 각 글리코폼의 상이한 이성질체의 존재는 MALDI MS 분석으로 관찰되지 않았으므로, 추가로 탠덤 질량분석을 수행하였다. 먼저, Man3 및 Hex5Gn2 구조를 조사하였다. Man3의 경우 Man3 구조가 분지형인지 선형인지를 탐문하였다. 이 분석을 위해, 이들 두가지 구조물을 모두 함유하는 샘플을 과메틸화시키고 제조자 지침에 따라 Bruker Ultraflex III TOF/TOF 장비를 이용하여 질량분석 단편화를 이용하여 ㅂ부분석하였다. (도 11 및 도 12).
[00247] 이어서, Hex6Gn2 구조의 비환원 엔드 상의 육탄당 유닛이 만노스인지 또는 글루코스인지를 결정한다. 모든 녹아웃 균주와 친균주에 대해 알파-만노시다제 분해를 실시하였다 (도 13). α-만노스는 분해하지만 β-만노스는 백본으로부터 그대로 남겨두는 잭 빈(Jack bean) 만노시다제를 이용하였다. 결과적인 구조는 Man1Gn2인 것으로 예상되었다.
[00248] MALDI에서의 저분자량 범위 효과로 인해, Man1GlcNAc2 글리칸의 상대 강도는 다소 감소되었으며, 이것은 Hex6의 상대량의 소폭 증가를 설명해준다. α-만노시다제 절단 후, Man3 및 Man4 글리코폼이 사라졌다. Man2 구조는 관찰되지 않았다. 그러나, Hex6 (m/z 1419)은 절단되지 않았는데 (표 6) 이는 구조의 비환원 엔드 상에 글루코스 유닛이 존재함을 가리키는 것이다. 몇몇 비절단가능한 Hex5 역시도 존재하였으며, 입체공간적으로 방해된 Hex6의 Man6-브랜치를 제거하는 약한 반응에 의해 생성된 것으로 추정되었다.
Figure pct00010
[00249] Alg3 녹아웃 균주에서 발견된 상이한 구조들의 최중 분석을 위해, 대규모 PNGase F 분해를 Alg3 녹아웃 균주 4A에 대해 수행하였다. 2종의 메이저 글리칸들을 HPLC로 정제하여 (도 14) 및 NMR로 분석하였다 (도 15).
[00250] 도 15A에 제시된 데이터에 기초하여, Hex3HexNAc2 종은 명확히 Manα1-3(Manα1-6)Manβ1-4GlcNAcβ1-4GlcNAc인 것으로 동정되었다. Manα3 및 Manα6 H-1 유닛들은 각각 5.105 및 4.914 ppm에서 공명하였다. Manβ4 H-2 유닛은 4.245 ppm에서 관찰되었다. 이 시그널은 이웃하는 Manα 3-OH 치환으로 인해 매우 특징적이었다. 코어 GlcNAc 유닛의 N-아세틸기 -CH3 시그널은 2.038 및 2.075에서 관찰되었다. 이들 값들은 슈가베이스-데이터베이스의 5당류에 대해 보고된 값과 잘 일치하였다 (www.boc.chem.uu.nl/sugabase/sugabase.html). 뿐만 아니라, 동일한 실험 조건에서, 시판되는 Manα1-3(Manα1-6)Manβ1-4GlcNAcβ1-4GlcNAc (Glycoseparations, Inc.)에 대해 양성자-NMR-스펙트럼을 측정하자, 거의 동일한 화학 쉬프트가 관찰되었다.
[00251] Hex6HexNAc2 성분의 NMR 스펙트럼을 도 15B에 도시하였다. 이 데이터는 이 성분이 8당류(octasaccharide) Glcα1-3Manα1-2Manα1-2Manα1-3(Manα1-6)Manβ1-4GlcNAcβ1-4GlcNAc를 나타냄을 시사하는 것이다. 글루코스 유닛이 존재한다는 것은 전형적인 αGlc 2.4 Hz 커플링을 보여주는 5.255 시그널로부터 자명하였다. 모든 Man 시그널은 수평방향의 H-2 배열로 인해 일반적으로 < 1 Hz 커플링을 보인다. 슈가베이스 데이터에 비해 약간의 차이가 관찰되었는데 (표 7), 이는 본 NMR 측정시 사용된 온도가 상이한 탓일 수 있다 (40℃ vs. 26℃).
Figure pct00011
[00252] 마지막으로, 무작위적으로 녹아웃된 균주 4A의 N-글리칸 프로파일을 여러 시점 (제3, 5, 7 및 9일)에서 분석하였다. 진탕 플라스크 배양체의 pH는 출발시점에서이었고 4.8이었고 끝나는 시점에서 2.6이었다. 듀플리킷 배양체의 매시점으로부터 3벌의 샘플을 분석하였다. 듀플리킷 양자 모두에서, pH 강하로 인해 Man3Gn2 시그널의 상대량이 성장 시간의 함수로서 감소된 것으로 관찰되었다. 그러나, Hex6Gn2 시그널의 양은 성장 시간의 함수로서 증가하였다 (표 8).
Figure pct00012
[00253] 클론 4A 중 Man3의 백분율과 관련하여 이들 2개의 분석물 (표 4 및 7) 간의 차이점이 주목되었다. 이 차이점은 분석 과정의 차이에 기인한 것일 수 있었다. 냉동-해동 사이클(들) 후 불균질 배양 배지 단백질 제제에 어떤 책임이 있는 것으로 관찰되었는데 이는 글리칸 및/또는 단백질 분해에 기인하는 듯하며, 크기가 큰 글리칸의 양을 감소시키는 결과를 초래하였다. 표 5의 데이터 생성은 부가적인 냉동-해동 사이클을 포함하였다.
[00254] 산성 N-글리칸 분획 역시도 MALDI에 의해 분석하였다 (도 16). 친균주 M124에 있어서 상이한 산성 화합물들이 풍부하다는 것은 모든 Alg3 녹아웃 균주의 경우와 달랐는데, 그 중에서도 산성 분획은 매우 유사한 것으로 보였다.
[00255] 친균주 중의 메이저 글리칸은 H6N2P1, H7N2P1 및 H8N2P1이었다. Alg3 녹아웃에서 더 작은 글리칸으로 사이즈가 쉬프트 된 것은: H5N2P1, H6N2P1 및 H4N2P1였다. 이에 더해, 디포스포릴화된 글리칸은 친균주에서 보다 풍부하였다. 이것은 포스포릴화된 만노스를 글리칸에 결합시키는 특정 효소에 대한 적절한 ㄱ기깆기지질이 결여되었기 때문일 수 있다. 포스포릴화된 만노스는 다른 만노스 잔기들에 의해 더 신장될 수 있다. 포스포릴화는 발효 조건 하에서 생산된 친균주 M124의 글리칸에서는 실제로 존재하지 않았다..
발효기 및 진탕 플라스크 성장 샘플의 비교
[00256] Alg3 녹아웃 균주 (형질전환주 4A)를 락토스 및 소비된 곡물 추출물 배지상에서 뱃치 발효로 성장시켰다. 배지는 60 g/l 락토스에 소비된 곡물 추출물이 혼합된 것으로 접종 후 부피는 7 리터 (발효기 작동 bio01616)였다. 다른 배지 성분들은 KH2PO4 및 (NH4)2SO4이었다. 배지의 pH를 5.5 내지 5.8 사이로 조절하였다. 바이오매스와 배양체 상등액 샘플을 발효기 작동중 채취하여 -20℃에서 보관하였다. 가능한 RNA 분석을 위해 균사 샘플 역시도 수집하여 액체 질소에서 즉시 냉동하고 -70℃로 동결시켰다. 이러한 발효 전과정에서 수집된 샘플들을 N-글리칸 조성에 대하여 분석하였다. N-글리칸 분석을 발효기 작동 bio01616)으로 수행하고 제5일 시점에서 형질전환주 4A의 진탕 플라스크 배양체로부터 샘플을 채취하였다 (도 17 및 18). 진탕 플라스크 배양체 중의 메인 시그널은 Man3 (59%)이었다. 발효기 배양체의 경우, 메인 ㅅ시식시그널은 Man3 (85%)이었으며, Hex6의 비율은 8%로 감소하였다.
결론
[00257] Alg3 녹아웃은 예상된 Man3 글리코폼을 50% 이상 생산하여 성공적이었다. Manα3(Manα6)Manβ-의 원하는 분지상 구조를 분획화 질량분석법 및 NMR 분광법으로 검정하였다.
[00258] Alg3 녹아웃의 다른 생성물에는 Man4 (만노스-함유 마이너 생성물), Hex5 (도 13에 도시된 바와 같이 Hex6의 분해산물) 및 2번째로 많은 성분인 Hex6이 포함된다. Hex6 성분은 만노시다제 내성에 의해 말단 Glc를 함유하고, Glcα3Man-말단을 포함하는 특이적인 NMR 시그널을 갖는 것으로 특징지어졌다. 이 글리칸 구조는 말단 Glc의 양을 감소시킴으로써 더 최적화될 수 있을 것으로 여겨졌는데, 이는 말단 Glc가 분자의 Manα6-아암(arm) 상에 만노스가 없는 글리칸의 경우 글루코시다제 II의 준최적 효능을 일으킬 가능성이 높기 때문이다. 발효 조건의 부가적인 최적화에 의해서도 말단 Glc 양을 저하시킬 수 있다.
[00259] 이 데이터는 아스퍼질러스 (Kainz et al., Appl Environ Microb. 2008 1076-86) 및 P. 파스토리스 (Davidson et al., Glycobiology 2004, 399-407)에서의 Alg3 녹아웃에 대한 앞선 데이터에 비해, T. 리세이 Alg3 녹아웃에서 더 우수한 글리코실화가 결과됨을 가리키는 것이다. Kainz et al. 및 Davidson et al의 연구에서도, 이와 유사하거나 더 높은 Hex6 대응 생성물 수준이 보고된 바 있다. 이 연구들은 또한 P. 파스토리스에 의해 생산된 세포유형-특이적인 글리칸, α2-만노스, OCH1 생성물 및 보다 큰 크기와 관련한 부가적인 문제점에 관하여도 보고하고 있다. 결론적으로, T. 리세이 Alg3 녹아웃의 N-글리칸 분석 결과, 녹아웃 균주들 중의 메이저 글리코폼은 포유류 유형의 N-글리칸의 효율적인 생산에 있어서, 요구되는 출발점인 Man3Gn2임인 것으로 나타났다.
실시예 3 - 개별적인 GnTI GnTII 효소의 정제 및 활성
[00260] 인간 GnTI 및 GnTII (N-아세틸글루코사미닐트랜스퍼라제 I 및 N-아세틸글루코사미닐트랜스퍼라제 II)를 이들의 수용체 특이성 및 활성을 연구하기 위해, 피키아 파스토리스에서 가용성의 분비된 단백질로서 발현시켰다.
P. 파스토리스에서의 생산을 위한 GnTI 구조물의 생성
[00261] 인간 GnTI (P26572) 서열을 전장 서열로서 수득하고 이를 트리코더 리세이 과발현 벡터 내로 서브클로닝시켰다. 효소 연구를 위해 피키아 파스토리 에서 단백질의 분비된 형태를 생성시키기 위해, 인간 GnTI의 가용성 부분을 코딩하는 단백질 코딩 서열(CDS)을 pBLARG-SX 발현 벡터 내로 클로닝시켰다. 클로닝 공정 동안, 프레임의 5' 말단에 His 태그를 코딩하는 서열을 부가하여 트렁크형 단백질의 N-말단에서 태그를 수득하였다. 이 서열을 서열 분석을 통해 검정하였다. 얻어진 벡터 pTTg5를 선형화시키고 P. 파스토리스 GY190 세포로 전기영동에 의해 형질전환시켜 균주 GY4를 얻었다. Arg+ 형질전환주를 선택하여 PCR로 스크리닝시켰다. 통합 플라스미드를 함유하는 GY4 클론들을 단백질 발현에 대해 시험하였다.
가용성 GnTI 의 발현 및 정제
[00262] 가용성 GnTI을 발현하는 P. 파스토리스 균주 GY4를 BMGY 배지 (1% 효모 추출물, 2% 펩톤, 100 mM 인산칼륨 pH 6.0, 1.34% 효모 질소 베이스, 4 x 10-5% 바이오틴, 1% 글리세롤) 중에서 +30℃에서 OD600 2-6이 될 때까지, 밤새 진탕 배양시켰다. 이어서 세포들을 원심분리에 의해 수확하고 BMMY 배지 (BMGY와 유사하나, 1% 글리세롤 대신 0.5% 메탄올이 첨가됨)에서 OD600 값이 1이 될 때까지 재현탁시켰다. 배양체를 배플형 플라스크에 넣고 +16℃의 진탕 인큐베이터로 되돌려 보냈다. 매 24시간 마다 100% 메탄올을 최종 농도가 0.5%가 될 때까지 첨가하여 인덕션을 유지시켰다. 발현 배양체 샘플 1 ml를 인덕션 후 제0, 24, 48 및 72 시간에서 채취하고 세포 펠렛과 상등액 두가지 모두를 분석을 위해 보관하였다. 인덕션 3일 후, 전배양체로부터의 세포들을 원심분리에 의해 수확하고 GnTI의 추가 정제를 위해 상등액을 수집하였다.
활성 분석을 위한 조질의 GnTI 샘플 제조
[00263] 가용성 His-태그된 GnTI을 함유하는 피키아 파스토리스 세포 배양체를 농도 및 완충액 교환에 의해 활성 분석을 위해 가공하였다. 요약하면, 세포를 50 ml 팔콘 튜브에서 펠렛화시켜 상등액을 수집함으로써 MeOH로 인덕션시킨지 3일 후에 (에펜도르프 5810R, 3220 rcf, +4℃에서 5분) 진탕 플라스크 배양체로부터 P. 파스토리스 상등액 40 ml를 수확하였다. 이어서 상등액을 Millipore Amicon Ultracel 30K 농축기를 이용하여 순차 원심분리 (에펜도르프 5810R 또는 이와 필적할만한 것, 3220 rcf, +4℃에서 10분)시켜 < 2.5 ml로 농축시켰다. 농축물의 부피를 100 mM MES, pH 6.1을 이용하여 2.5 ml로 조정하였다. 농축물을 PD-10 겔 여과 컬럼 (GE Healthcare 17-0851-01)에 의해 완충액 교환시켰다. 컬럼을 먼저 100 mM MES, pH 6.1으로 평형시킨 다음 샘플(2.5 ml)을 첨가하고, 유동물은 폐기하고 2.25 ml의 MES 완충액으로 용리시켜 수집하였다. 마지막으로, Millipore Biomax 30K 농축기(에펜도르프 ppendorf 5417, 12 000 rcf, +4℃에서 5분)를 이용하여 500 ㎕의 용리액을 100 ㎕로 농축시키고 이를 활성 분석에 직접 사용하였다.
GnTI 효소의 활성 분석
[00264] GnTI 활성 분석시 Manα1-6(Manα1-3)Manβ1-4GlcNAc (Man3Gn)를 GnTI에 대한 수용체로서 사용하였다. 실온에서 총 부피 10 ㎕ 중 100 mM MES, pH 6.1 중 0.1 mM 수용체 Man3GlcNAc, 20 mM UDP-GlcNAc, 50 mM GlcNAc, 100 mM MnCl2, 0.5% BSA 및 8 ㎕ GnTI 을 함유하는 반으으 혼합물을 인큐베이션함으로써 GnTI 반응을 수행하였다. 100℃에서 5분간 반응물을 인큐베이션시킴으로써 반응을 중단시켰다.
[00265] GnTI 활성 분석과 병행하여, 조질의 효소 제제 중에서의 가능한 HexNAc'ase 활성을 제어하였다. HexNAc'ase에 대한 기질로서 GlcNAcβ1-2Manα1-6(GlcNAcβ1-2Manα1-3)Manβ1-4GlcNAcβ1-4GlcNAc-Asn (= Gn2Man3Gn2-Asn)을 사용하였다. Man3Gn 및 UDP-GlcNAc 대신 100 pmol의 Gn2Man3Gn2-Asn을 첨가한 것을 제외하고, GnTI에서와 유사한 방식으로 반응을 수행하였다. HexNAc'ase 활성은 검출되지 않았다.
[00266] HyperSep 96-웰 Vacuum Manifold, Thermo Scientific 상에서 순차적으로 Hypersep C18 (100 mg, Thermo Scientific, cat no: 60300-428) 및 Hypercarb (10 mg/96웰 플레이트/1 PKG, cat no 60302-606) 크로마토그래피를 수행함으로써 반으으 혼합물을 MALDI 분석을 n이해 정제하였다. 300 ㎕ EtOH 및 300 ㎕ MQ 물을 이용하여, Hypersep C18을 제조한 다음, 수집 플레이트를 받치고 샘플을 로딩하여 150 ㎕ MQ 물로 용리시켰다. 300 ㎕ MeOH 및 300 ㎕ MQ 물을 이용하여 Hypercarb를 제조하였다. Hypersep C18로부터의 용리액을 로딩시키고 150 ㎕ 0.5 M NH4Ac로 염을 제거한 다음 2 x 300 ㎕ MQ 물을 이용하여 웰들을 세척하였다. GnTI 반응 산물을 150 ㎕ 25% ACN로 용리시키고, HexNAc'ase 반응 생성물을 25% ACN 및 0.05% TFA로 용리시켰다. 샘플들을 Speedvac에서 건조시켰다.
[00267] 매트릭스-보조된 레이저-탈착-이온화 타임-오브-라이트 (MALDI-TOF) 질량 분석법 (MS)을 Bruker Ultraflex TOF/TOF 인스트루먼트 (Bruker Daltonics, Germany)를 이용하여 수행하였다. 수용체 사카라이드와 생성물이 양이온 리플렉터 모드에서 [M+Na]+ 이온으로서 검출되었다. Hex3HexNAc1 및 Hex3 HexNAc2의 [M+Na]+ -시그널에 대한 계산된 m/z 값은 각각 733.238 및 933.318이었다. 수용체 및 생성물의 백분율 비율을 Hex3HexNAc1 Hex3 HexNAc2에 대응하는 시그널로부터 계산하였다 (도 19).
P. 파스토리스 중에서의 생산을 n이한 GnTII 구조물의 생성
[00268] 인간 GnTII를 코딩하는 뉴클레오타이드 서열을, 각각 KpnI 및 EcoRI 제한효소 자리를 함유하는 프라이머인 GP3 및 GP13을 이용하여 PCR-증폭시켰다. EcoRI/KpnI-절단된 PCR 단편을 유사하게 절단된 pBLARG-SX 클로닝 벡터에 접합시켰다. 서열 검정 후, 최종 구조물을 P. 파스토리스 균주 GS190에 형절진환시켜 균주 GY22를 얻었다. 포지티브 효모 형질전환주를 PCR에 의해 스크리닝하였다. +16℃ 및 at +30℃에서 메탄올-유도형 AOX1 프로모터의 조절 하에 GnTII의 발현에 관하여 2개의 클론 (도 20에는 오직 하나만 도시함)을 검사하였다.
가용성 GnTII 의 발현
[00269] 웨스턴 블롯 분석에 의하면 (도 20), P. 파스토리스 균주 GY22는 가용성 재조합 GnTII 효소fmf 생산하였다. GnTII의 계산된 분자량은 49049.0 Da이고 2개의 예상된 N-글리코실화 부위를 가졌다. 이 재조합 GnTII는 +16℃에서 배양 배지내로 분비되었다 (레인 9). +30℃에서 성장될 경우, 재조합 GnTII가 세포 내부로 구속되었다 (레인 4)
가용성 GnTII 의 활성 분석
[00270] 가용성 His-태그된 GnTII를 함유하는 P. 파스토리스 세포 배양체 를 전술한 GnTI에 대해 설명된 바와 같이 활성 분석을 위해 가공하였다. 세포 배양체를 원심분리하여, 상등액을 수확 및 농축하고, 100 mM MES, pH 6.1으로의 완충액 교환을 수행하여, 얻어진 샘플을 활성 검사 전에 추가로 농축시켰다.
[00271] 활성 분석을 GnTI의 경우와 유사하게 수행하였다. GnMan3Gn을 GnTII 수용체로서 사용하였다.
[00272] 100 mM MES, pH 6.1 중 GnTII 반응을 0.1 mM 수용체 GnMan3Gn, 20 mM UDP-GlcNAc, 50 mM GlcNAc, 100 mM MnCl2, 0.5% BSA, 및 GnTII의 존재 하에 수행하였다. 전술한 GnTI의 경우에 설명된 바와 같이, 진공 매니폴드 상 96-웰 플레이트 상에서 순차적인 Hypersep C18 및 Hypercarb 크로마토그래피에 의해, MALDI-TOF MS 분석을 ㅇ우위한 반응 혼합물의 정제를 수행하였다.
[00273] MALDI-TOF MS를 Bruker Ultraflex TOF/TOF 인스트루먼트 (Bruker Daltonics, Germany)를 이용하여 수행하였다. 수용체 사카라이드 및 생성물이 양이온 리플렉터 모드에서 [M + Na]+ 이온으로서 검출되었다. 반응 말기 생성물과 수용체의 비율을 이들의 시그널 강도로부터 계산하였다 (GlcNAc를 한번 부가한 경우 GnMan3Gn 수용체 및 생성물의 [M+Na]+ 시그널은 각각 933.318 및 1136.397이었다).
[00274] GnTII를 생산하는 P. 파스토리스의 배양을 반복하여 상등액으로부터 GnTII 농축물 (60x)을 제조하고 그 활성을 전술한 방법에 따라 측정하였다. 2.5h, 5h, 및 오버나이트 시점에서의 샘플의 MALDI 스펙트럼을 각각 생성물에 대해 변환하였다. 최대 반응에 근접한 값은 2.5시간 후에 도달되었다.
[00275] 이에 더해, 조질의 GnTII 샘플을 제조하고, 활성 분석을 조질의 GnTI 샘플에 대해 전술한 바와 같이 실시하였다. 반응 혼합물을 밤새 인큐베이션하고, 정제하여 MALDI 분석을 실시하였다. MALDI 스펙트럼으로부터 GnTII 활성이 나타났다 (도 21). 이 조질의 GnTII 샘플에서는 HexNAc'ase 활성이 검출되지 않았다.
[00276] 전술한 GnTII 활성 분석에 사용된 GnTII 수용체 합성을 위해 사용된 방법은 다음과 같았다. GnTI 샘플을 전술한 바와 같이 P. 파스토리스 배양 배지로부터 제조하였다. 이 GnTI 샘플은 높은 GnTI 활성을 나타내었으므로,약 40 nmol의 Man3Gn을 GnMan3Gn로 전환시키는데 이것을 이용할 수 있었다. 0.5 mM Man3Gn, 20 mM UDP-GlcNAc, 50 mM GlcNAc, 100 mM MnCl2, 0.5% BSA, 및 GnTI 샘플의 존재 하에 반응을 수행하였다. 반응 혼합물을 실온에서 3일간 인큐베이션하였다. ~ 1% 샘플을 Hypercarb 크로마토그래피로 정제하여 MALDI 분석하였다. MALDI 스펙트럼에 의하면 GnTI 반응은 거의 모든 Man3Gn 수용체를 GnMan3Gn 생성물로 전환시켰다. 수용체의 오직 2.8%만이 변환되지 않았다.
실시예 4 - GnTI / GnTII 융합 단백질
GnTI / GnTII 발현 구조물의 생성
[00277] 인프레임 융합 부위 (정지 코돈이 제거되고 GnTII 서열과 오버랩된, GnTI을 함유하는 자연발생적인 AleI 제한효소 자리로부터의 짧은 서열)을 함유하는 5'-말단에서 65-mer 융합 프라이머 및 SpeI 또는 NdeI 제한효소 자리를 함유하는 GnTIIdp 상동성인 3'말단 프라이머를 이용하여 1313 bp GnTII 단편을 증폭시킴으로써 재조합 GnTI/II 융합 단백질을 구축하였다. 이 융합 자리는 cbh1 프로모터 (AleI/NdeI로 클로닝) 의 조절 하에 야생형 GnTI을 이용하거나 또는 gpd 프로모터 (AleI/SpeI로 클로닝)의 조절 하에 야생형 GnTI를 이용하여 T. 리세이 과발현 벡터에 융합 단편을 직접 클로닝하는 것을 가능케 해준다. 고성능 융합 폴리머라제(Finnzymes)와 스탠다드 증폭 및 클로닝 공정을 이용하였다. 발현 벡터로부터 직접 시퀀싱하여 서열을 검정하였다. 얻어진 벡터를 이용하여 T. 리세이 중의 막투과 단백질로서 융합체를 발현시켰다.
[00278] 융합 단백질의 기능에 대한 정보를 더 알아내기 위하여, 융합 GnTI/II 단백질을 P. 파스토리스 중의 가용성 단백질로서도 발현시켰다. 효소학 연구를 위한 단백질 생산을 위해 이 단백질의 가용성 부분을 코딩하는 GnTI/II 융합체의 CDS를 pBLARG-SX 발현 벡터 내로 클로닝하였다. 클로닝 공정 중, His 태그 코딩 서열을 프레임의 5'-말단에 부가하여 트렁크형 단백질의 N-말단에서 태그를 수득하였다. 이 서열을 시퀀싱 분석에 의해 검정하였다. 얻어진 벡터를 선형화시키고 P. 파스토리스 균주 GS190에 전기영동에 의해 형질전환시켜 균주 GY6를 수득하였다. Arg+ 형질전환주를 선택하여 PCR에 의해 스크리닝하였다. 통합된 플라스미드를 함유하는 P. 파스토리 클론들을 단백질 발현에 대해 시험하였다.
P. 파스토리스 중에 생산된 가용성 GnTI / II 의 정제
[00279] P. 파스토리스 중의 발현 정제 공정을 재조합 GnTI 단백질에 대해 전술한 바와 같이 수행하였다.
GnTI / II 융합 단백질의 효소 활성 테스트
[00280] 활성 assays were carried out as described above for GnTI assays using Man3Gn 올리고당 as 수용체 및 UDP-GlcNAc donor. products of reaction were analyzed by MALDI- TOF mass spectrometry. Only GnTI 활성 was observed for GnTI/GnTII 융합 단백질 (도 22).
랜덤 통합에 의해 GnTI / GnTII 구조물을 이용한 T. 리세이의 형질전환
[00281] gpdA 프로모터를 이용하여 키메라 인간 GnTI/GnTII 플라스미드를 ㄹ랜덤 통합에 의해 T. 리세이 M124 균주 내로 공동-형질전환시켰다. 아세트아미다제 마커 유전자를 함유하는 플라스미드를 공동-형질전환시킴으로써 선택을 수행하였다. 20개의 PCR 포지티브 형질전환주를 단핵 클론이 되도록 정제하고 글리칸 분석을 위해 진탕 플라스크 배양으로 성장시켰다. 모든 형질전환주와 친균주 M124를 4% 락토스 및 2% 소비된 곡물 추출물이 보강된 pH 4.8의 트리코더마 최소 배지 (TrMM)에서 배양하였다. 상등액 및 균사체 샘플을 제3, 5 및 7일에 수집하고 분석시까지 냉동 보관하였다. 이에 더해, 대조군으로서, T. 리세이를 랜덤 통합에 의해 GnTI 구조물로 형질전환시켰다.
랜덤 통합에 의해 수득된 T. 리세이 GnTI / GnTII 구조물의 글리칸 분석
[00282] 3가지 서로 다른 시점 (제3, 5 및 7일)에서 T. 리세이 균주 M124 GnTI/GnTII 형질전환주로부터의 20개의 서로 다른 클론들을 분석하였다. 2개의 친균주 M124 균주로부터의 샘플을 대조건으로서 분석하였다. SDS 변성없는 N-글리카나제 반응을 96-웰 플레이트에서 5㎍의 상등액 단백질에 대해 3회 수행하였다. 상등액의 단백질 농도를 브래드포드-기반 분석 (Bio-Rad Quick Start Bradford Protein Assay)에 의해 측정하였다. 중성 및 산성 N-글리칸 두가지 모두에 대해 MALDI-TOF MS 분석을 실시하였다. gpdA 프로모터를 이용한 GnTI 형질전환주 클론에서 뿐 아니라, 어떤 시점에든, 어떤 클론의 GnTI/GnTII 구조물을 이용한 경우에도, Go 산물은 검출되지 않았다.
표적 통합에 의한 GnTI / GnTII 구조물을 이용한 T. 리세이의 형질전환
[00283] alg3 위치 통합을 위해 아세트아미다제 마커 유전자와 5'- 및 3'-플랭킹 서열 부위를 함유하는 벡터 pTTv38 백본 내로 키메라 GnTI/GnTII 서열을 서브클로닝시켰다. 절단 단편으로서 T. 리세이 M124 균주 내로 벡터를 형질전환시켰다. 이 형질전환으로부터, alg3 위치 내로의 정확한 통합을 ㄴ나타내는 PCR 단편들을 생성하는 18개의 PCR 포지티브 형질전환주가 검출되었다. 이들 형질전환주들을 단일 포자 정제 단계 후 진탕 플라스크에서 배양하여 후술하는 바와 같이 분석하였다.
alg3 위치로의 표적화에 의해 수득된 T. 리세이 GnTI / GnTII 균주의 글리칸 분석
[00284] 3가지 다른 시점 (제3, 5 및 7일)에 Δalg3 T. 리세이 GnTI/GnTII 형질전환주의 10가지 다른 클론의 상등액 샘플을 수득하였다. 클론들을 2종의 서로 다른 배지 조성을 갖는 진탕 플라스크에서 배양하였다. 2% 소비된 곡물 ㅊ추출물, 4% 락토스, 및 K-프탈레이트 완충액을 함유하고 pH 5.5인 TrMM을 모든 클론에 대하여 사용하고, 이와 병행하여, 2% 소비된 곡물 추출물, 4% 락토스, 1% 카사미노산, 및 K-프탈레이트 완충액이 함유된 pH 5.5의 TrMM을 클론들 중 5개에 대해 사용하였다. 7일간 배양하되: 처음 5일은 +28℃에서; 제6일과 제7일은 +24℃에서 배양하였다.
[00285] 96-웰 플레이트에서 5 ㎍의 상등액 단백질에 대해 N-글리칸 분석을 3회 실시하였다. 샘플들을 제 3, 5, 및 7일에 분석하였다. 상등액의 단백질 농도를 스탠다드로서 BSA를 이용하여 브래드포드-기반 분석(Bio-Rad Quick Start Bradford Protein Assay)에 의해 측정하였다. 중성 및 산성 N-글리칸 모두 MALDI-TOF MS에 의해 분석하였다.
[00286] 글리코폼 G0의 검출가능한 양이 모든 클론에서 발견되었다. 클론 201A는 1.2%의 Gn2Man3를 함유하여 가장 많은 양을 함유하였다 (도 23 및 표 9). 이에 더해, 이 특정 클론에서의 Hex6의 양은 가장 적었다. 1% 카사미노산이 첨가된 두번째 배지는 어떠한 여분의G0/GlcNAcβ2Manα3(GlcNAcβ2Manα6)Manβ4GlcNAcβ4GlcNAcβ도 생산하지 않았다. 제3일 및 제7일의 샘플 결과는 기본적으로 제5일 샘플의 결과와 동일하였다.
Figure pct00013
실시예 5 - GnTII / GnTI 융합 단백질
GnTII / GnTI 발현 구조물의 생성
[00287] PCR 오버랩 기술을 적용하여 GnTII/GnTI 융합 발현 구조물을 얻었다. 융합 부위에서 50 bp 인-프레임 오버랩을 함유하는 프라이머를 이용하여 GnTII 및 GnTI 템플레이트로부터 융합 단편들을 개별적으로 증폭시켰다. 단편들을 ㅇ아악아가로스 겔로부터 정제하여 표준 공정에 따라 융합 구조물의 증폭을 위해 PCR 템플레이트로서 사용하였다. 융합 구조물을 ApaI/SpeI 제한효소 자리가 있는 벡터 내로 클로닝시켰다. 얻어진 구조물을 시퀀싱 분석에 의해 검정하였다. 표적 단백질의 N-말단에 His 태그가 있는 P. 파스토리스에서 GnTII/GnTI의 가용성 형태를 발현시키기 위한 벡터를 제조하였다. 이 벡터는 GnTI/II 융합 구조물에 대해 전술한 것과 유사한 방식으로 형성되었다.
P. 파스토리스에서 생산된 가용성 GnTII / GnTI 의 정제
[00288] P. 파스토리스에서의 발현 및 정제 공정을 재조합 GnTI 단백질에 ㄷ대해 전술한 바와 같이 수행하였다.
GnTII / GnTI 융합 단백질의 효소 활성 테스트
[00289] 수용체로서 Man3Gn 올리고당을 이용하여 GnTI에 대해 전술한 바와 같이 활성 분석을 수행하였다. GnTII/GnTI으로부터의 정제된 반응 혼합물의 MALDI 스펙트럼 결과 2개의 GlcNAcβ-잔기들이 수용체로 전달된 것으로 나타났다 (도 24).
Figure pct00014
β-N- 아세틸글루코사미니다제에 의한 특징화
[00290] GnTII/GnTI 활성 반응에서 형성된 혼합물을 스트렙토코쿠스 뉴모니 아에로부터의 β1-2,3,4,6-N-아세틸글루코사미니다제로 처리하였다. 전달된 β-링크된 GlcNAc 잔기들 두개 모두가 절단되었는지를 MALDI MS 분석을 이용하여 검사하였다.(도 25).
β1-4 GalT 에 의한 갈락토실화
[00291] GnTII/GnTI 활성 반응 중에 형성된 혼합물을 우유로부터의 β1-4GalT로 처리하였다. β1-4GalT은 생성물 혼합물 중의 말단 GlcNAc 잔기들을 갈락토실화할 것으로 예상되었다. β1-4GalT 반응 혼합물의 MALDI 스펙트럼에 의하면, 두가지 생성물 모두 갈락토실화되었다. 2개의 갈락토스들이 Gn2Man3Gn 생성물에 전달되었으며, 이는 GlcNAc 잔기들이 링크되어 만노스 브랜치들을 분리시켰음을 시사하는 ㄱ것이다 (도 26).
랜덤 통합에 의해 GnTII / GnTI 구조물을 이용한 T. 리세이의 형질전환
[00292] 키메라 GnTII/GnTI 서열을 설계하여 gpdA 프로모터를 함유하는 벡터 내로 클로닝하였다. 플라스미드 서열 검정 후, 이것을 하이그로마이신 마커 유전자를 이용하여 T. 리세이 M124 균주 내로 공동-형질전환시켰다. 13개의 PCR 포지티브 형질전환주가 동정되었다. 모든 포지티브 형질전환주와 친균주 M124를 4% 락토스 및 2% 소비된 곡물 추출물이 함유된 pH 4.8의 TrMM에서 배양하였다. 이에 더해, 7개의 형질전환주와 친균주를 4% 락토스, 2% 소비된 곡물 추출물, 및 1% 카사미노산을 함유하고, 100 mM PIPPS (피페라진 1,4-비스-2-프로판술폰산)으로 완충된 pH 5.5의 TrMM에서 배양하였다. 상등액과 균사체 샘플을 제3, 5, 및 7일에 수집하여 냉동보관하고 글리칸 구조에 대해 분석하였다. 또한 GnTII/GnTI 서열을 cbh1 프로모터를 함유하는 플라스미드 내로 클로닝하였다. 이에 더해, 대조군으로서, T. 세이를 랜덤 통합에 의해 GnTI 구조물로 형질전환시켰다.
글리칸 랜덤 통합에 의해 수득된 T. 리세이 GnTII / GnTI 균주의 글리칸 분석
[00293] 2가지 서로 다른 배지에서 배양된 T. 리세이 균주M124 GnTII/GnTI 형질전환주 및 친균주 M124 균주의 156개 상등액 샘플을 분석하였다. 제1 배지는 2% 소비된 곡물 추출물 및 4% 락토스이 보강된 pH 4.8의 TrMM 배지였고, 제2 배지는 2% 소비된 곡물 추출물, 4% 락토스, 100 mM PIPPS, 및 1% 카사미노산이 보강되고 pH 5.5인 TrMM 배지였다. 세포들을 제3, 5 및 7일에 두가지 유형 모두의 배지에서 성장시켰다.
[00294] 제3일 및 제5일 시점에서 얻은 샘플의 5㎍ 상등액 단백질에 대해 96-웰 플레이트에서 SDS 변성없는 N-글리카나제 반응을 3회 실시하였다. 표품으로서 BSA를 이용하여 상등액의 단백질 농도를 브래드포드-기반 분석 (Bio Rad Quick Start Bradford Protein Assay)에 의해 측정하였다. 중성 및 산성 N-글리칸 양쪽 모두를 MALDI-TOF MS에 의해 분석하였다.
[00295] 제3일 및 제5일에 얻은 클론의 어느 것에서도 예측된 GnTII/GnTI 생성물의 징후가 관찰되지 않았다. 이에 더해, 랜덤 통합에 의해 생성된 gpdA 프로모터를 이용한 GnTI 및 GnTI/II 형질전환주로부터 어떠한 생성물도 관찰되지 않았다.
표적화 통합에 의한 GnTII / GnTI 구조물을 이용한 T. 리세이의 형질전환
[00296] cbh1 프로모터의 조절 하에 키메라 GnTII/GnTI 서열을 갖는 벡터를, pyr4 유전자 루프아웃 마커를 갖도록 제조하여 이를 표적화 통합을 위해 alg3 플랭킹 대역들 사이의 백본 벡터 내로 서브클로닝시켰다. PmeI-절단된 발현 카세트를 T. 리세이 균주 M127 (M124의 pyr4 - 균주) 내로 형질전환시켰다. 플레이트 선별 후, 클론들을 PCR-스크리닝하고 단일 포자를 통해 정제하였다. 글리칸 분석용 재료를 수득하기 위해, 전술한 바와 같이 진탕 플라스크 배양을 실시하였다. M127 형질전환주 내의 alg3 위치 내로 정확히 통합된 것으로 나타난 5개의 PCR 포지티브 형질전환주들을, 40 g/l 락토스, 20 g/l 소비된 곡물 추출물, 및 100 mM PIPPS이 보강된 pH 5.5의 TrMM 함유 배지에서 +28℃에서 7일간 300 ml 부피로 배양하였다. 세균 오염을 방지하기 위해, 접종시 플라스크 내로 100 mg/l 암피실린을 첨가하였다. 글리칸 분석을 위한 샘플을 제 3, 5 및 7일에 수집하였다.
alg3 위치로의 표적화에 의해 수득된 T. 리세이 GnTII / GnTI 균주의 글리칸 분석
[00297] 5 ㎍의 상등액 단백질에 대해, T. 리세이 균주 M124 (대조군)의 상등액 샘플, M127 GnTII/GnTI 형질전환주의 5가지 상이한 클론들, 및 대조군 배지 샘플을 96-웰 플레이트에서 3벌 제조하였다. 상등액의 단백질 농도를 표품으로서 BSA를 이용하여 브래드포드-기반 분석 (Bio-Rad Quick Start Bradford Protein Assay)에 의해 측정하였다. 설명된 바와 같이, 그러나 SSDS 변성없이 PNGase F 반응을 수행하였다. 방출된 N-글리칸을 먼저 Hypersep C-18로 정제한 다음 Hypersep Hypercarb (두가지 모두 Thermo Scientific사 제품)에 의해 정제하여 중성 및 산성 N-글리칸을 분리하였다. 이들 두가지 정제 모두를 96-웰 포맷으로 실시하였다. 중성 N-글리칸을 MALDI-TOF MS에 의해 분석하였다.
[00298] T. 리세이 M127 GnTII/GnTI 형질전환주로부터의 중성 N-글리칸의 비율을 pyr4 포지티브인 것을 제외하고 M127과 동일한 균주인 균주 M124로부터의 비율과 비교하였다. 5개의 GnTII/GnTI 형질전환주 중 4개가 모든 시점(3, 5 및 7일)에서 메인 글리코폼으로서 G0을 생산하였다. 클론 46A 만이 G0 네가티브였다 (도 27). 모든 시점에서 Man3Gn의 비율은 모든 클론에서 작았지만, hex6의 비율은 여전히 상당히 컸다. 제7일에, 클론 17A는 다른 클론들에 비해 G0을 가장 많이 생산하였고 Hex6은 가장 적게 생산하였다 (도 27). GnTII/GnTI 형질전환주들 중 4개의 클론들이 진탕 플라스크 조건 하 제5일에 글리코폼 G0의 약 40%를 생산하였다 (도 27). pH가 조절된 발효 조건은 G0 생성물의 양을 증가시켰으며 alg3 녹아웃에서 Hex6의 양은 감소하였다.
[00299] 배지 샘플 중, 일련의 식물형 N-글리칸이 관찰되었으나, G0에 대응하는 시그널은 관찰되지 않았다.
표적화 통합에 의한 GnTII / GnTI 구조물을 이용한 리툭시맙 -생산 T. 리세이의
형질전환
[00300] "표적화 통합에 의한 GnTII/GnTI 구조물을 이용한 T. 리세이의 형질전환"이라는 섹션에 설명된 발현 카세트를 T. 리세이 균주 M279 (균주 M202의 pyr4 - 균주) 내로 형질전환시켰다. M124에서 pep1 프로테아제를 결실시키고 리툭시맙 중쇄 및 경쇄 (with Kex2 절단 부위가 있음)를 도입함으로써 M202를 수득하였다. 플레이트 선택 후, 클론들을 PCR-스크리닝하고 단일 포자를 통해 정제하였다. 글리칸 분석요요 재료를 얻기 위해, "표적화 통합에 의한 GnTII/GnTI 구조물을 이용한 T. 리세이의 형질전환"이라는 섹션에 설명된 바와 같이 진탕 플라스크 배양을 수행하고, 이에 더해, 몇몇 배양 배지를 0.3 mg/ml 대두 트립신 억제제 (SBTI) 및 1% 카사미노산으로 보강하였다. 먼저 SBTI를 접종시 첨가한 다음 제3일-제6일에 매일 첨가하였다. 동결시키기 전에 PMSF 및 펩스타틴 A를 모든 샘플에 첨가하였다.
alg3 위치로의 표적화에 의해 수득된 리툭시맙 -생산 T. 리세이 GnTII / GnTI
균주의 글리칸 분석
[00301] SBTI 존재 하에 제5일의 상등액 샘플로부터 단백질 G 친화 크로마토그래피에 의해 리툭시맙을 정제하고 SBTI 부재 하에 제5일 및 제7일 샘플을 정제하였다. PNGase F 반응을 변성 단백질 ~ 10μg에 대해 수행하였다. 방출된 N-글리칸을 먼저 Hypersep C-18로 정제한 다음 Hypersep Hypercarb (두가지 모두 Thermo Scientific 제품)으로 정제하여, 여기서 중성 및 산성 글리칸을 분리하였다. 정제 단계는 96-웰 포맷으로 수행하였다. 중성 및 산성 N-글리칸을 MALDI-TOF MS에 의해 분석하였다. GnTII/GnTI 형질전환주 클론들 중 2개 즉, 9A-1 및 31A-1는 각각 ~30% 및 ~24%로 G0 글리코폼을 생산하였다. 그러나, 여전히 상당량의 Hex6 및 GnMan3가 관찰되었다 (도 28). 다른 클론들로부터의 리툭시맙은 G0을 거의 또는 전혀 함유하지 않았다.
스페이서의 최적화
[00302] GnTII/GnTI 융합 단백질에 대한 일련의 스페이서 변형을 구축하였다. 이들 변이체들을 피키아에서 생산하여 효소 안정성 및 활성을 위해 시험관내에서 연구하였다.
[00303] GnTII/GnTI 융합 단백질을 클로닝하기 위한 재료 및 방법은 전술한 바와 같다. PCR 오버랩핑 전략을 이용하여 T45 서열을 2개 부분에서 증폭시켰다. 우선, 단편을 GP13 5' 프라이머 및 GP93 3' 프라이머로 증폭시키고 제2 단편을 GP92 5' 프라이머 및 GP2 3' 프라이머로 증폭시켰다. 증폭은 공급자가 제공한 표준 조건 하에서 Phusion 고성능 PCR 폴리머라제 (Finnzymes)를 이용하여 실시하였다. 사이클링 조건은 다음과 같았다: 98℃에서 30초간 초기 변성시키고, 98℃에서 5초간 변성시킨 다음, 65℃에서 30초간 어닐링시키고, 72℃에서 45초 동안 신장(extension)시키고, 20회 반복하고, 마지막으로 72℃에서 20분간 신장시킨다. 얻어진 PCR 산물을 Fermentas GeneJET 겔 추출 키트를 이용하여 아가로스 겔로부터 정제하였다. 오버랩핑된 변형 서열을 갖는 이들 단편들을 프라이머 없이 표주누 조건 하에서 동일한 반응 혼합물에서 조합시켰다. 10회의 어닐링/신장 사이클을 다음과 같이 수행하였다: 98℃에서 30초간 초기 변성시키고, 98℃에서 5초간 변성시킨 다음, 65℃에서 30초간 어닐링시키고, 72℃에서 45초간 신장시키고, 10회 반복하고 마지막으로 72℃에서 20분간 신장시킨다. 프라이머 GP13 (5') 및 GP2 (3')를 첨가하고, 20회 증폭 사이클에 대해 전술한 바와 같이 사이클링을 계속하였다. 증폭된 T45 단편을, 표준 프로토콜에 따라 EcoRI/KpnI (New England Biolabs)으로 절단된, Fermentas 유전자JET PCR 정제 키트를 이용하여 정제시키고, 이를 EcoRI/KpnI 절단된 효모 발현 벡터 pBLARG-SX 내로 클로닝 시켰다. 얻어진 백터를 프라이머s 3'AOX, 5'AOX, GP9, GP37, GP38 및 GP122를 이용하여 시퀀싱하였다. 서열은 정확한 것으로 밝혀졌다.
[00304] 이 결과적인 플라스미드를 3xG4S 스페이서 변형을 위한 템플레이트로서 사용하였다. T46 서열의 클로닝을 T45에 대해 전술한 바와 같이 수행하였다. GP13 5'-프라이머 및 GP95 3'-프라이머를 제1 단편 합성에 이용하고, GP94 5'-프라이머 및 GP2 3'-프라이머를 제2 단편 합성에 이용하였다. 증폭을 위해 단편들을 결합시키고 프라이머 GP13 (5') 및 GP2 (3')를 첨가하였다. 이어서 증폭된 단편 T46을 EcoRI/KpnI으로 절단하고 효모 발현 벡터 pBLARG-SX 내로 클로닝하였다. 얻어진 벡터를 전술한 프라이머로 시퀀싱하였으며, 그 서열은 정확한 것으로 밝혀졌다.
[00305] 셀룰라제-관련된 천연 스페이서를 유사한 PCR 오버랩 방법에 의해 구축하였다. CBHI-관련 스페이서를 이용하여, 최초 단편을 GP13 5'-프라이머 및 GP107 3'-프라이머로 증폭시켰다. 제2 단편을 GP108 5'-프라이머 및 GP2 3'-프라이머로 증폭시켰다 (표 11). EGIV-관련 스페이서를 이용하여, 제1 단편을 GP13 5'프라이머 및 GP109 3'프라이머로 증폭시켰다. 제2 단편을 GP110 5'-프라이머 및 GP2 3'-프라이머로 증폭시켰다 (표 11). 두가지 경우 모두에 있어서, PCR 산물을 아가로스 겔로부터 정제, 조합시키고 서열 T50 및 T51을 증폭시키기 위한 다음 PCR 반응에서 템플레이트로서 사용하였다. 이어서 T50 및 T51 PCR 생성물을 EcoRI/KpnI으로 절단하고 효모 발현 벡터 pBLARG-SX 내로 클로닝하였다.
[00306] 모든 PCR 증폭을 고성능 Phusion 폴리머라제 (Finnzymes)를 이용하여 실시하였다. 프라이머 (표 11)를 MWG Operon사로부터 주문하였다. 상업 서비스로서 DNA Sequencing Laboratory of Institute of Biotechnology, University of Helsinki를 이용하여 시퀀싱을 수행하였다.
Figure pct00015
[00307] 스페이서 변형된 (3xG4S 및 2xG4S) GnTII/GnTI 융합 효소들을 실시예 3의 GnTIdp 대해 설명된 것과 유사한 방식으로 농도 및 완충액 교환에 의해 활성 분석할 수 있도록 프로세싱하였다. 활성 분석을 Man3Gn 수용체를 이용하여 수행하고 반응 혼합물을 GnTI 활성 분석에서 설명된 바와 같이 정제하였다. MALDI 분석 역시 GnTI 반응 혼합물에 대해 설명한 바와 같이 실시하였으나, 단, 이에 더해 GnTII 생성물, Hex3HexNAc3,의 형성이 후속되었다. Hex3HexNAc3의 [M+Na]+ 시그널에 대하여 산출된 m/z 값은 1136.318이었다 (도 29).
스페이서 변이체
[00308] GnTII/I 스페이서 변이체를 GnTII/I 융합 단백질의 야생형 스페이서 서열로부터 변형시켰다. 변형된 스페이서를 표 12에 나타내었다. 모든 4개의 스페이서 변이체 균주 (GY32, GY33, GY49, 및 GY50), 야생형 GnTII/I 융합 균주 (GY7-2), 및 목(mock) 균주 (GY3)가 프로테아제 억제제와 함께 +16℃에서 발현되었다. 균주들을 60 ml의 BMGY-배지 중 +30℃, 220 rpm에서 밤새(o/n) 접종하였다. 오버나잇 배양체를 펠렛화시키고 세포를 60 ml의 BMMY-배지에 재현탁시켰다. 프로테아제 억제제, 1 mM EDTA, 1.5 μM 펩스타틴 (Sigma) 및 1 완전 EDTA가 없는 프로테아제 억제제 칵테일 정제(Roche)를 MeOH 유도 개시와 동시에 배양체에 첨가하고 그 후 하루 1회 첨가하였다. 25 ml 샘플을 제3일과 제4일에 배양체로부터 취하여 상등액 샘플을 농축 튜브 (Millipore)를 이용하여 농축시키고 완충액을 PD-10 컬럼에서 100 mM MES pH 6.1로 교환하여 최종 50배로 농축시켰다. 야생형 세포 펠렛 (3차)를 제외하고 세포 펠렛을 500 ㎕의 1xPBS에 재현탁시키고, 야생형 세포 펠렛은 500 ㎕의 100 mM MES pH 6.1 및 완전 (EDTA 없음) 억제제 칵테일에 재현탁시켰다.
[00309] 3xG4S 스페이서를 함유하는 GnTII/GnTI 융합 단백질의 아미노산 서열을 SEQ ID NO: 119에 나타내었다. 3xG4S 스페이서를 함유하는 GnTII/GnTI 융합 단백질의 뉴클레오타이드 서열을 SEQ ID NO: 141에 나타내었다. 2xG4S 스페이서를 함유하는 GnTII/GnTI 융합 단백질의 아미노산 서열을 SEQ ID NO: 121에 나타내었다. 2xG4S 스페이서를 함유하는 GnTII/GnTI 융합 단백질의 뉴클레오타이드 서열을 SEQ ID NO: 139에 나타내었다. CBHI 스페이서을 함유하는 GnTII/GnTI 융합 단백질의 아미노산 서열을 SEQ ID NO: 123에 나타내었다. CBHI 스페이서를 함유하는 GnTII/GnTI 융합 단백질의 뉴클레오타이드 서열을 SEQ ID NO: 143에 나타내었다. EGIV 스페이서를 함유하는 GnTII/GnTI 융합 단백질의 아미노산 서열을 SEQ ID NO: 125에 나타내었다. EGIV 스페이서를 함유하는 GnTII/GnTI 융합 단백질의 뉴클레오타이드 서열을 SEQ ID NO: 145에 나타내었다.
[00310] 세포 현탁액 200 ㎕ 샘플을 원심분리 반복에 의해 세척하고 완전(EDTA 무함유) 억제제 칵테일과 함께 100 mM MES pH 6.1에 재현탁시켰다. 200 ㎕의 세척된 세포 샘플을 제공하고, 50 ㎕ 유리 비드 및 2 ㎕ Triton X-100을 첨가하여 비드 비터에 6분간 넣어둠으로써 세포 용해물을 제조하였다. 50x 농축된 P. 파스 토리스 배양 상등액, 세포 샘플 및 세포 용해물의 GnTI 활성 분석을 전술한 바와 같이 수행하였다.
Figure pct00016
[00311] 제3일로부터의 50x 농축된 배양 상등액 및 세포 펠렛의 웨스턴 블롯 분석 결과를 도 30에 나타내었다. CBHI 스페이서 변이체 (GY49)는 세포 펠렛 샘플로부터 강한 시그널을 제공하였으나 상등액으로부터는 그렇지 않았다. EGIV 스페이서 변이체 (GY50)가 상등액으로부터 검출되었으나 오직 희미한 시그널만이 얻어졌을 뿐이다. 상등액 샘플로부터의 희미한 시그널은 야생형 GnTII/I 융합 균주 (GY7-2) 및 2xG4S 스페이서 변이체 균주 GY33-7 및 GY33-8의 경우에도 수득되었다 (도 30).
[00312] 이어서 스페이서 변이체를 함유하는 GnTII/I 융합 단백질의 활성을 야생형 스페이서를 함유하는 GnTII/I 융합 단백질의 활성과 비교하였다.
[00313] 상등액 중의 융합 GnTII /I 활성. GnTI 기질 Man3Gn을 제공하고 반응 생성물 GnMan3Gn은 융합 단백질의 GnTII 활성을 위한 수용체로서 작용하였다. 활성 분석용 샘플을 발현 페이즈 3일 및 4일 후에 실시하였다. 도 31은 야생형 스페이서 또는 스페이서 변이체 중 어느 하나를 함유하는 GnTII/I 융합 단백질의 활성 분석 결과를 도시한 것이다. 억제제 (1,5 μM 펩스타틴 A, 1 mM EDTA, 1 정제/50 ml의 완전 EDTA 무함유 프로테아제 억제제 칵테일 정제) 존재 하에 샘플 배양을 실시하였다. 간편성을 위해, GnTI 및 GnTII 반응 산물을 함께 첨가하였다. 모든 활성 ㅂ분석 샘플은 GnTI 산물 GnMan3Gn을 소량 (< 5%)으로만 함유하였는데, 이는 GnTII 활성이 GnMan3Gn를 Gn2Man3Gn로 활성적으로 변환시켰음을 가리키는 것이다.
[00314] 모든 4개의 스페이서 변이체들은 비록 클론마다, 그리고 배양일마다 약간의 차이는 있으나, GnT 활성을 나타내었다. 2xG4S (클론_1), 3xG4S (클론_1 및 클론_2), 또는 EGIV 스페이서 변이체를 함유하는 GnTII/I 융합 단백질은 야생형 스페이서에 비해 더 높은 활성을 나타내었다 (도 31). CBHI 스페이서 변이체를 함유하는 GnTII/I 융합 단백질은 야생형 스페이서를 갖는 효소에 필적할만한 활성으르 나타내었다 (도 31). 2xG4S 변이체 (클론_2)를 함유하는 GnTII/I 융합 단백질은 야생형 스페이서를 갖는 효소보다 활성이 낮았다 (도 31). 제4일의 샘플은 제3일의 샘플보다 활성이 더 높았으나, 단 제3일에 더 높은 활성을 나타낸 3xG4S 스페이서 변이체를 함유하는 GnTII/I 융합 단백질은 예외였다 (도 31). EGIV 스페이서 변이체를 함유하는 GnTII/I 융합 단백질은 제4일에 최고의 활성을 나타냈다 (도 31).
[00315] 세포 및 세포 용해물 중 융합 GnTII /I 활성. 야생형 스페이서를 갖는 GnTII/I 융합 단백질을 함유하는 세포로부터의 세포, 세포 용해물 및 상등액 샘플에 대한 활성 분석 결과 용해물 샘플이 가장 높은 활성을 갖는 것으로 나타났다 (도 32). 두번째로 높은 활성은 세포 표면에서 나타났으며, 가장 낮은 활성은 상등액 샘플에서 ㄱ관찰되었다 (도 32). 따라서, GnTII/I 융합 단백질의 대부분은 세포 또는 세포 표면 상에 위치하고, 소량만이 분비된 것으로 보인다.
[00316] 야생형 스페이서나 스페이서 변이체를 갖는 GnTII/I 융합 단백질을 함유하는 세포의 GnT 활성을 도 33에 나타내었다. 500 ㎕ PBS 중의 스페이서 변이체 및 완전 EDTA 무함유 억제제 칵테일과 함께 500 ㎕의 100 mM MES, pH 6,1에 세포들을 재현탁하고 세포 및 용해물의 활성 시험을 상기와 같이 수행하였다.
[00317] 도 33에 도시된 바와 같이, 스페이서 변이체를 함유하는 GnTII/I 융합 단백질들은 상등액보다 세포에서 더 높은 GnTII/I 활성을 나타내었다. 용해물에서, 효소들은 불활성인 것으로 나타났다. 이러한 활성 결핍은 방출된 프로테아제의 작용에 기인한 것으로 믿어진다. CBHI 스페이서 변이체를 함유하는 GnTII/I 융합 단백질은 세포와 용해물에서 높은 활성을 나타냈는데(도 33), 이것은 세포 펠렛 샘플에서 보다 높은 시그널을 보이는 웨스턴 블롯 분석 (도 30)과 관련있는 것이다.
[00318] 토론. 상등액에서, 2xG4S 및 3xG4S 스페이서 변이체를 함유하는 GnTII/I 융합 단백질은 야생형 스페이서를 함유하는 GnTII/I 융합 단백질보다 더 높은 활성을 가진 반면, CBHI 스페이서 변이체는 야생형 스페이서를 함유하는 GnTII/I 융합 단백질에 대하여 필적할만한 활성을 가졌다. 뿐만 아니라, EGIV 스페이서 변이체를 함유하는 GnTII/I 융합 단백질은 최고의 GnT 활성을 나타내었다. 제3일의 샘플에 대한 웨스턴 블롯 분석 결과는 제4일의 활성 결과와 어느 정도 연관성이 있다. 웨스턴 블롯 분서거 결과 야생형, 2xG4S 및 EGIV 클론 2가지 모두의 상등액 샘플에 있어서 희미한 밴드가 나타났다. 다음의 순서로 활성이 검출되었다: EGIV > 2xG4S (클론_1) > 3xG4S (클론_2) > 3xG4S (클론_1) = CBHI = 야생형 = 2xG4S (클론_2).
[00319] 야생형 스페이서를 함유하는 GnTII/융합 단백질의 상등액, 세포 및 세포 용해물 샘플 중 GnTII/I 융합 단백질 활성의 측정 결과 대부분의 활성은 세포와 관련이 있으며 이보다 적은 양이 분비된 것으로 나타났다. 이것은 웨스턴 블롯 분석에서 상등액 분획보다 세포 분획에서 왜 훨씬 더 많은 His-태그된 GnTII/I 시그널이 관찰되었는지를 설명해주는 것으로 믿어진다.
[00320] 완전 EDTA 무함유 억제제 정제에 의한 세린 및 시스테인 프로테아제의 억제, EDTA에 의한 메탈로프로테나제의 억제 및 펩스타틴 A에 의한 아스파르트 프로테아제의 억제는, GnTII/I 융합 단백질의 수율을 향상시켰다. 세린 프로테아제 억제제의 사용에 대한 이러한 관찰은 Salamin et al. (Appl . Environ . Microbiol ., 76 (2010) 4269-4276)등의 연구와 일치하는데, 상기 연구는 P. 파스토리스 배지 중 세린 종류 프로테아제 활성이 PMSF에 의해 완전히 억제되었음을 보여준다. 이에 더해, Vad et al. (J. Biotechnol . 116 (2005) 251-260)은 사카로마이세스 세레비지아에 단백질 디술파이드 이소머라제의 공동 발현과 조합하여 10 mM EDTA의 존재 하에 P. 파스토리스 에서 고유한 인간 부갑상선 호르몬 300 mg/l에대한 높은 생산율을 보고하고 있다.
[00321] 4개의 스페이서 변이체를 각각 함유하는 모든 GnTII/I 융합 단백질은 GnTII/I 활성을 가졌으며 2xG4S 및 EGIV 스페이서 변이체를 갖는 효소의 활성은 야생형 스페이서를 함유하는 GnTII/I 융합 단백질보다 더 높은 활성을 가졌다.
실시예 6 - 수용체 글리칸으로서 Man5르르 갖는 융합 단백질의 용도
Man5 형 N- 글리코실화된 리툭시맙 -발현 T. 리세이 균주의 구축
[00322] 천연 리툭시맙 서열은 잘 조화된 코돈이다. 합성된 리툭시맙 경쇄 및 중쇄를 함유하는 오리지날 플라스키드를 생성한다. 효모 상동성 재조합을 이용하여 클로닝하는 것이 가능하도록, 중쇄의 경우 발현 벡터 pHHO1 (아세트아미다제 선택 마커, 통합을 위해 cbh1 플랭크를 cbh1 위치로)의 경우처럼 또는 경쇄의 경우pHHO2 (하이그로마이신 선택 마커, egl1 위치로의 통합을 위한 egl1 플랭크)의 경우와 같이 40-뉴클레오타이드 오버래핑 서열들을 이용하여 항체 사슬 및 CBHI 융합 단백질을 설계하였다.
[00323] 수득된 유전자 플라스미드를 대장균으로 형질전환시킨다. DNA를 조제하고, 합성 유전자들을 절단하여 플라스미드 백본으로부터 분리한다. CBHI 융합 단백질 및 중쇄 또는 경쇄와 함께 T. 리세이 발현 벡터 상에서 효모 상동성 재조합에 의해 발현 벡터들을 구축한다. 재조합 플라스미드를 효모로부터 레스큐하여 대장균 내로 형질전환시킨다. PCR 스크리닝 후, 정확한 클론들을 분리 및 시퀀싱한다. 발현 카세트 단편을 절단하고 플라스미드 백본으로부터 분리하여 중쇄 구조물용 약 10.2 kb, 단편과 경쇄 구조물용 약 10.8 kb 단편을 얻는다. 중쇄 및 경쇄 단편들을 T. 리세이 균주 M124 내로 형질전환한다. 형질전환주들을 하이그로마이신 내성과 유일한 질소원으로서 아세트아미드 상에서 성장하는 능력에 대해 선별한다. 형질전환주들을 2회 연속 라운드 동안 이중 선택 배지 위에 스트리킹하고 게놈 내로의 발현 구조물의 통합에 대해 PCR로 시험하였다.
리툭시맙 항체를 발현하는 T. 리세이 균주 내로 GnTII /I 탠덤 효소 및
만노시다제 II 의 도입
[00324] 재조합 GnTII/I을 M124와 같은 Man5-생산 균주에 도입하는 것에 더해, GnTII/I 가 수용체 분자로서 GlcNAcMan3을 이용할 수 있기 위해서는 GlcNAcMan5 글리칸 구조물로부터의 2개의 만노스를 더 제거할 필요가 있다. GnTII/I 융합 단백질에 대한
[00325] 전술한 실시예에 설명된 GnTII/I 발현 카세트는 기본적으로 전술한 방법을 이용하여, 예컨대 T. 리세이cbh2 위치로 표적화될 수 있다. GnTII/I 융합 단백질에 대한 GlcNAcMan3 수용체 분자를 생성하기 위해, 만노시다제 II 활성을 전술한 바와 같은 형질전환을 이용하여 균주에 도입한다.
[00326] 만노시다제를 발현시키기 위한 프로모터를 이용하여 소망되는 만노시다제-함유 발현 카세트를 설계함으로써 리툭시맙 항체-발현 M124 균주에 만노시다제 II 활성을 도입한다. 유용한 프로모터는 gpdA 또는 cbh1로부터의 것들이다. 랜덤 통합에 이어 가장 적합한 발현 수준으로 균주를 스크리닝함으로써 만노시다제 II 활성이 형질전환될 수 있다. 발현 카세트를 적절한 선택 마커 유전자와 링크시키거나 선택 마커를 별개 발현 카세트로서 공동-형질전환시킨다. 형질전환은 전술한 방법에 따라 수행한다.
[00327] T. 리세이 세포질, 막투과 및 스템 도메인, 또는 KRE2의 표적화 펩타이드로부터 만노시다제 II 융합 구조물을 유도시켜 인간 만노시다제 II의 N-말단 아미노산 결실부에 인-프레임 접합시킬 수 있다. 코딩된 이 융합 단백질은 KRE2 표적화 펩타이드 서열에 의해 ER/골지체 내에 위치하면서 그의 만노시다제 촉매 도메인 활성을 유지하며, GlcNAcMan5GlcNAc2을 GlcNAcMan3GlcNAc2이 되도록 가수분해시킬 수 있다. 특정 구체예에서, 전장 인간 만노시다제 II를 M124 균주에서 발현시킬 수 있다.
[00328] KRE2 표적화 펩타이드는 KRE2의 아미노산 잔기 약 1 내지 약 106 또는 약 1 내지 약 83을 포함한다.
Kre2 aa 1-106
MASTNARYVRYLLIAFFTILVFYFVSNSKYEGVDLNKGTFTAPDSTKTTPKPPATGDAKDFPLALTPNDPGFNDLVGIAPGPRMNATFVTLARNSDVWDIARSIRQ (SEQ ID NO: 115)
Kre2 aa 1-83
MASTNARYVRYLLIAFFTILVFYFVSNSKYEGVDLNKGTFTAPDSTKTTPKPPATGDAKDFPLALTPNDPGFNDLVGIAPGPR (SEQ ID NO: 116)
[00329] 전술한 만노시다제 II 구조물을 이용하여 트리코더마를 형질전환시킨 후, 트리코더마 균주들을 선택하여, 2 연속 라운드 동안 선택 배지 상에 스트리킹하고 게놈 내로의 발현 구조물의 통합 여부를 PCR로 테스트한다. 이어서, Man5를 생산하고, GnTII/I 융합 단백질, 만노시다제 II, 및 리툭시맙 항체를 발현하는 트리코더마 균주들의 선택된 형질전환주를 진탕 플라스크 조건 또는 발효기 조건 하에 배양하여 전술한 바와 같이 글리칸 함량에 대해 분석한다.
실시예 7 - T. 리세이에서 GnTI GnTII 의 발현
무작위 혼입 ( integration )에 의한 GnTI 컨스트럭트를 이용한 T. 리세이 M124 의 형질 전환
[00330] 코돈 최적화된 인간 GntIT. 리세이 M124 균주에 형질 전환시켰다. GntI 유전자를 2 가지 상이한 프로모터 : (1) cbh1 유전자의 유도 프로모터; 및 (2) gpdA 유전자의 구조적 발현 프로모터의 조절을 받는 벡터에 클로닝하였다. 상기 2 가지 프로터의 조절 하에 GntI을 포함하는 벡터를 각각 아세트아미다제 또는 하이그로마이신 내성 마커 유전자 중 하나를 포함하는 플라스미드를 갖는 T. 리세이 M124 균주 내로 동시 형질 전환시켰다.
[00331] gpdA 프로모터하의 GntI을 갖고 아세트아마이드 선별된 34 개의 형질전환주를 PCR로 스크리닝하였고, 모두 GntI 양성이었다. cbh1 프로모터하의 GntI을 갖고 아세트아마이드 선별된 형질전환주에 대하여, 26 개 중 19 개가 GntI 컨스트럭트에 관하여 PCR-양성이었다. 또한, cbh1 프로모터하의 GntI을 갖고 하이그로마이신 선별된 5 개의 균주에 대하여 개시 DNA 추출을 수행하였다. 이들 균주들 모두는 PCR-양성이었다. 25 개의 gpdA 프로모터 형질전환주 및 cbh1 프로모터 형질전환주 (14+5) 모두를 단핵 클론으로 정제하여 스포어 (spore) 현택액을 제조하였다.
[00332] 개시 분석 목적을 위하여, 23 개의 gpdA 프로모터 형질전환주 및 19 개의 cbh1 프로모터 형질전환주 (14 개는 아세트아마이드 선별로 생장 및 5 개는 하이그로마이신 선별로 생장), 및 모균주 M124를 2% 스펜트 그레인 추출물 및 4% 락토스로 보충된 50 ml 트리코더마 최소 배지의 250 ml 진탕 플라스크에서 배양하였다. 균주들의 생장을 pH 측정으로 모니터링하였다. 샘플들 (상등액 및 균사)을 제3일, 제5일 및 제7일에 모아 글리칸 구조 분석용으로 사용될 때까지 동결 보관하였다.
무작위 혼입에 의하여 얻은 T. 리세이 GnTI 균주의 글리칸 분석
[00333] 모든 상등액 샘플의 단백질 농도를 표준으로서 BSA를 사용하는 브래드포드계 분석 (BioRad Quickstart Bradford Protein Assay)으로 측정하였다. N-글리칸 분석용 샘플의 분비 단백질 함량을 5 ㎍ 또는 10 ㎍으로 맞추었다. 상등액 단백질 5 ㎍에 대하여는 96-웰 플레이트상에서, 또는 상등액 단백질 10 ㎍에 대하여는 1.5 ml 튜브에서 N-글리칸 분석을 수행하였다. 모든 N-글리칸 분석을 3 회 반복하여 수행하였다. 중성 및 산성 N-글리칸 양자 모드에 대하여 MALDI-TOF MS 분석을 하였다.
[00334] 4 가지 GnT1 형질전환주에서 생성된 GnT1 생성물 Gn1Hex5 (제3일 및 제5일의) 및 생성된 산성 N-글리칸의 보다 정확한 측정량을 얻기 위하여 MALDI 스펙트럼을 공지의 글리칸에 대하여 찍었다 (spiked). 중성 및 산성 N-글리칸에 대하여, 각각 질량값 1177 Da의 2 pmol/스펙트럼 Hex2HexNAc4의 내부 검량 및 질량값 1362 Da의 0.5 pmol 모노시알릴화 Hex4HexNAc2의 내부 검량이 사용되었다. 3 회 반복으로 분석을 수행하였다.
[00335] 어떠한 gpdA 프로모터 형질전환주에서도 GnT1 생성물이 관찰되지 않았다. 그러나, 8 개의 cbhI 프로모터 형질전환주가 GnT1 생성물 Gn1Man5를 생성하였고 (도 34 및 35, 및 표 13); 5 개는 하이그로마이신 선별, 3 개는 아세트아마이드 선별된 것이다.
Figure pct00017
[00336] GnT1 생성물 Gn1Man6P1, Gn1Man7P1, 및 Gn1Man8P1 또한 모든 양성 형질전환주의 인산화된 N-글리칸에서 발견되었다. 인산화 N-글리칸량은 GnT1 형질전환주에서 증가하였고, 그 프로파일은 가장 강한 신호를 갖는 Man7P1 또는 Man8P1으로, 더 큰 N-글리칸에 편중되었다 (모균주 M124에서는 Man6P1) (도 36).
[00337] 8 개의 GnT1 형질전환주가 Gn1Man5 구조를 생산하였다. Gn1Man5은 클론 39에 가장 풍부하였다. 그러나, 최선의 클론은 클론 8로 나타났는데, 이것은 두번째로 높은 수준의 Gn1Man5를 생성했지만, Man5 및 Gn1Man5의 분율이 높았다 (도 35). cbhI 프로모터하의 GnTI을 포함하는 클론 8을 균주 M198로 명명하고, 이어지는 분석을 위하여 선별하였다.
표적화된 혼입에 의한 GnTII 컨스트럭트를 이용한 T. 리세이 M198 균주의 형질 전환
[00338] 5 개의 GnTII-포함 벡터를 제작하였다 (표 14). 상기 벡터들 중 2 개는 천연의 포유류 골지 표적화 펩타이드를 GNTII 내에 포함하였다. 다른 3 개의 벡터에서는, 포유류 표적화 펩타이드가 T. 리세이 MNT1 (α-1,2-만노실트랜스퍼라제) 표적화 펩타이드에 의하여 대체되었다. 5 개의 모든 벡터는 cbh1 프로모터 또는 gpdA 프로모터 중 하나, 및 pyr4 루프-아웃 마커를 포함하였다. 게다가, 5 개의 모든 벡터들은 alg3 로 혼입되도록 표적화 되었으므로, alg3 유전자가 결실되었다. cbh1 프로모터하의 MNT1/GnTII 컨스트럭트 에서는, 2 가지 상이한 크기의 GnTII 서열 결실이 시험되었다.
Figure pct00018
[00339] pTTv144 벡터를 제외한 이들 벡터를, PmeI 단편으로서. 최선의 py4 - 음성 GnTI 생산 균주 M198 (M319) 내로 형질 전환시켰다. 형질전환주를 단핵 클론으로 정제하여 PCR 스크리닝하였다. 그 후, 이어지는 분석을 위하여 양 말단 모두에 정확한 혼입을 나타낸 클론들을 선별하였다.
[00340] 제조된 GNTII-발현 균주들의 생장 특징을 연구하기 위하여, 대량 진탕 플라스크 배양체를 준비하였다. 진탕 플라스크 배양체를 2 개의 별개 뱃치로 준비하였다. 제1 뱃치는 pTTv140, pTTv142, 및 pTTv143를 포함하였다. 제2 뱃치는pTTv141를 포함하였다. 모균주 M198를 대조군 균주로 사용하였다. pH 5.5의 40 g/l 락토스, 20 g/l 스펜트 그레인 추출물, 및 100 mM PIPPS로 보충된 TrMM 배지에서 세포를 생장시켰다. 컨스트럭트당 5 개의 형질전환주가 배양되었다. pTTv140, pTTv142, 및 pTTv143 배양체가 제3일, 제5일, 제7일 및 제9일에 채취되었다. pTTv141 배양체를 제3일, 제5일, 제7일 및 제10일에 채취하였다. 각 샘플의 pH 및 세포 건조 중량을 ㅊ측정하고 배양 상등액 샘플을 글리칸 구조 분석을 위하여 사용하였다.
T. 리세이 M198 균주의 alg3 좌를 표적화한 GnTII 에 의하여 얻어지는 T. 리세이 균주의 글리칸 분석
[00341] pTTv140 벡터 (천연 표적화 펩타이드 cbhI 프로모터를 포함), pTTv142 벡터 (MNT1 표적화 펩타이드, GNTII 74 aa N-말단 결실, 및 cbhI 프로모터를 포함), pTTv143 벡터 (MNT1 표적화 펩타이드, GNTII 110 aa N-말단 결실, 및 cbhI 프로모터를 포함), 및 pTTv141 벡터 (표적화 펩타이드 및 gpdA 프로모터를 포함)를 포함하는 5 개의 상이한 클론들이 분석되었다.
[00342] 제5일의 샘플에 대하여 N-글리칸 분석이 3 회 반복으로 준비되었고 5 μg의 상등액 단백질에 대하여 96-웰 플레이트에서 제3일 및 제7일 샘플에 대한 N-글리칸 분석은 2 회 반복으로 준비되었다. 상등액의 단백질 농도를 BSA를 표준으로 하여 브래드포드계 분석 (BioRad Quickstart Bradford Protein Assay)으로 측정하였다. 개시된 바와 같이 PNGase F 반응이 수행되었다. 해리되는 N-글리칸을 우선 Hypersep C-18 100 mg으로 정제한 후 Hypersep Hypercarb 10 mg으로 정제하였는데 ( 양자 모두 Thermo Scientific), 이로써 중성 및 산성 글리칸이 분리되었다. 2 가지 정제 모두 96-웰 포맷으로 수행되었다. 중성 N-글리칸을 MALDI-TOF MS 분석하였다.
[00343] GnTII로 형질 전환된 4 가지 상이한 균주들의 N-글리칸을 분석하였다. pTTv140 벡터로 형질 전환되었으므로, 천연의 표적화 펩타이드 및 cbhI 프로모터를 포함하는 클론 1-117A는 약 40%의 G0 및 약 13%의 Hex6를 생산하였다 (도 37A). pTTv143 벡터로 형질 전환되었으므로 MNT1 표적화 펩타이드, GnTII 110 aa N-말단 결손, 및 cbhI 프로모터를 포함하는 클론들은 약 10%의 G0를 생산하였다 (도 37C). gbdA 프로모터를 포함하는 클론 3B는 약 28%의 G0 및 약 19%의 Hex6를 생산하였다 (도 37D).
[00344] 또한, pTTv140, pTTv141, 및 pTTv142 벡터들을 포함하는 대표적인 클론들의 글리코실화 패턴은 시간의 함수로서 안정함을 보여주었다 (도 38).
단백질 특이적 글리코실화
[00345] 글리코실화에 있어서 단백질 특이적 변화를 분석하기 위하여, pTTv142 벡터를 포함하는 클론 3-17A 및 모균주 M198로부터의 샘플을 SDS-PAGE로 분리하고 PVDF 멤브레인에 블롯팅하였다. 목적한 단백질 밴드 (M198의 4 개 밴드 및 3-17A 클론의 4 개 밴드)를 오려내고, PNGase F를 이용하여 온-멤브레인 (on-membrane) 효소 분리하여 분리하였다 (도 39).
[00346] 탈착 및 정제된 중성 N-글리칸을 MALDI-TOF MS를 이용하여 분석하였다. 분비된 총단백질의 글리코실화 패턴은 M198 모균주의 50 kDa 단리 단백질과 유사하였다 (도 40). 가장 작은 크기의 단백질 밴드는 디글리코실화되어 있었다.
[00347] GnTII 클론 3-17A에서, 그들의 배지 기원을 확인시키는 통상적이지 않은 대부분의 시그널은 사라졌다. 게다가, 클론 3-17A의 글리코실화 패턴은 분비된 총단백질의 글리칸 패턴과 상이하였다 (도 40B). 클론 3-17A의 G0량은 약 35 내지 36%였다 (도 40B).
GnTII 균주의 발효조 배양
[00348] GnTII 균주 1-117A M329 (pTTv140 벡터를 포함)의 발효조 배양은 TrMM pH 5.5 + 2% 스펜트 그레인 추출물 + 6% 락토스 + 0.5% KH2PO4 + 0.5% (NH4)2SO4 +28℃ (pH 5.5)에서 발효되었다. 제3일에 채취한 샘플에 대하여 상기 "단백질 특이적 글리코실화" 섹션에 기재된 5 ㎍의 분비 단백질에 대한 N-글리칸 분석을 3 회 반복하여 수행하였다. 제3일에 G0의 양은 약 48%였고 Hex6의 양은 약 19%였다 (도 41).
실시예 8 -T. 리세이 ALG3 호몰로그
무작위 혼입에 의한 GnTI 컨스트럭트를 이용한 T. 리세이 M124 의 형질 전환
[00349] 다른 생물로부터 T. 리세이 ALG3 상동체를 동정하였다. 이들 상동체를 T. 리세이 외의 사상 진균 세포에 대한 ALG3 결손 컨스트럭트를 설계하는 데 사용할 수 있다. ALG3 상동체들이 표 15에 나열되어 있다. T. 리세이 ALG3 및 ALG3 상동체들의 다수 아미노산 서열 얼라인먼트가 도 42에 나타나 있다.
Figure pct00019
실시예 9 - GnTII / GnTI 융합 단백질 변이체
GnTII / GnTI 발현 컨스트럭트의 제조
[00350] 유도 프로모터 cbh1에 의하여 조절되고 4 가지 스페이서 변이체 중 하나를 포함하는 재조합 GnTI/II 융합 단백질이 실시예 4 및 5에 개시된 바와 같이 제작한다. 4 가지 스페이서 변이체는 2xG4S 스페이서, 3xG4S 스페이서, CBHI 스페이서, 및 EGIV 스페이서이다.
[00351] 간단히, 융합 위치에서 50 bp 프레임 오버랩되는 프라이머를 이용, GnTII 및 GnTI 주형으로부터 융합 단편을 각각 분리하여 증폭한다. 단편들을 아가로오스 겔로부터 정제하여 표준 방법에 따른 융합 컨스트럭트 증폭의 PCR 주형으로 사용한다. 융합 컨스트럭트를 ApaI/SpeI 제한효소 위치를 이용하여 유도 프로모터 cbh1의 조절하의 벡터로 클로닝한다. 또한, GNTII 도메인 내 천연 포유류 골지 표적화 펩타이드는 T. 리세이 MNT1 (α-1,2-만노실트랜스퍼라제) 표적화 펩타이드로 대체된다.
[00352] 융합 단백질에 2xG4S 스페이서 변이체를 도입하기 위하여, PCR 오버랩 전략을 이용하여 T45 서열은 두 부분으로 증폭된다. 첫째, 한 단편은 AKT1-6-1 5' 프라이머 (GGTACCGGGCCCACTGCGCATCATGCGCTTCCGAATCTACAAGCG (SEQ ID NO: 146)) GP93 3' 프라이머로 증폭되었고, 제2 단편은 GP92 5' 프라이머 및 AKT1-6-4 3' 프라이머 (GGCGCGCCACTAGTCTAATTCCAGCTGGGATCATAGCC (SEQ ID NO: 147))로 증폭된다. 증폭은, 제조자가 제공한 표준 조건에서 Phusion high-fidelity PCR 폴리머라제 (Finnzymes)를 이용하여 수행된다. 사이클 조건은 실시예 5에 나타나 있다. PCR 결과물을 아가로오스 겔로부터 정제하고 오버랩되고 변형된 서열을 갖는 단편들을 프라이머가 없는 표준 조건의 동일한 반응 혼합물로 배합한다. 실시예 5에 나타낸 대로, 10 회의 어닐링/익스텐션 사이클을 수행한다. 프라이머s AKT1-6-1 (5') 및 AKT1-6-4 (3')를 첨가하고, 실시예 5에 개시된 대로 20 회의 증폭 사이클을 계속한다. 그 후, 증폭된 T45 단편을 정제하고, ApaI/SpeI (New England Biolabs)로 소화시켜 트리코더마 리세이 발현 벡터 내로 클로닝한다. 그 후, 클로닝된 단편을 적절한 프라이머 세트로 서열분석하여 검증하고, 제조된 서열을 2xG4S 프로모터 포함 및 alg3 표적화하는 T. 리세이 발현 벡터 컨스트럭트 제작용으로 사용한다.
[00353] 플라스미드 결과물을 3xG4S 스페이서 변형의 주형으로 사용한다. T46 서열의 클로닝은 T45에 대하여 상기 기술한 대로 수행된다. AKT1-6-1 5'-프라이머 및 GP95 3'-프라이머가 제1 단편 합성용으로 사용되고, GP94 5'-프라이머 및 AKT1-6-4 3'-프라이머가 제2 단편 합성용으로 사용된다. 단편들은 조합되어 프라이머 AKT1-6-1 (5') 및 AKT1-6-4 (3')가 증폭용으로 첨가된다. 증폭 단편 T46은 그 후, ApaI/SpeI으로 소화, 트리코더마 리세이 발현 벡터 내로 클로닝된다. 그 후, 클로닝된 단편을 적절한 프라이머 세트로 서열분석하여 검증하고, 제조된 서열을 3xG4S 프로모터 포함 및 alg3 표적화하는 T. 리세이 발현 벡터 컨스트럭트 제작용으로 사용한다.
[00354] CBHI 및 EGIV 스페이서가 유사한 PCR 오버랩 방법으로 제작된다. CBHI 스페이서에 대하여, 제1 단편은 AKT1-6-1 5'-프라이머 및 GP107 3'-프라이머로 증폭된다. 제2 단편은 GP108 5'-프라이머 및 AKT1-6-4 3'-프라이머로 증폭된다 (표 11). EGIV 스페이서에 대하여, 제1 단편은 AKT1-6-1 5'프라이머 및 GP109 3'프라이머로 증폭된다. 제2 단편은 GP110 5'-프라이머 및 AKT1-6-4 3'-프라이머로 증폭된다 (표 11). 2 가지 경우 모두에 있어서, PCR 결과물은 아가로오스 겔로부터 정제, 조합되어 서열 T50 및 T51를 증폭하기 위한 다음 PCR 반응의 주형으로 사용된다. T50 및 T51 PCR 결과물은 그 후, ApaI/SpeI으로 소화되어 트리코더마 리세이 발현 벡터 내로 클로닝된다. 그 후, 클로닝된 단편을 적절한 프라이머 세트로 서열분석하여 검증하고, 제조된 서열을 CBHI 또는 EGIV 프로모터 중 하나를 포함 및 alg3 표적화하는 T. 리세이 발현 벡터 컨스트럭트 제작용으로 사용한다.
[00355] 모든 PCR 증폭은 high-fidelity Phusion 폴리머라제 (Finnzymes)를 이용하여 이루어진다. 프라이머 (표 11)는 MWG Operon에 주문한다. 시퀀싱은 상업적인 서비스로서 DNA Sequencing Laboratory of Institute of Biotechnology, University of Helsinki에 의하여 수행된다.
[00356] 전술된 키메라 GnTII/GnTI 서열, 이것은 스페이서 변이체 (2xG4S, 3xG4S, CBHI, 및 EGIV)를 포함한다,을 갖는 트리코더마 리세이 발현 벡터는 cbh1 프로모터의 조절하에서 백본의 표적화 혼입을 위하여 pyr4 유전자 루프아웃 마커 및 alg3 인접 부위 단편을 포함하여 서브클로닝되고 컨스트럭트화된다. 발현 카세트는 T. 리세이 균주 M279 (M202의 pyr4 - 균주) 내로 형질 전환된다. 플레이트 선별 후, 클론들은 PCR 스크리닝되고 단일 스포어로 정제된다. 글리칸 분석 재료를 얻기 위하여, 전술한대로 진탕 플라스크 배양이 수행된다.
리툭시맙 항체를 발현하는 T. 리세이 균주에의 GnTII /I 융합 단백질 변이체 도입
[00357] 실시예 5에 개시된 리툭시맙-발현 T. 리세이 균주 M279에 재조합 GnTII/I 융합 단백질 변이체를 도입한다.
[00358] 간단히, cbh1 프로모터 조절하의 GnTII/GnTI 융합 단백질, MNTI 표적화 펩타이드, pyr4 루프-아웃 마커 및 4 가지 스페이서 변이체 각각을 포함하는 벡터는, 표적화 혼입을 위하여 alg3 인접 영역 단편들 사이로 백본 벡터 내 서브클로닝되므로 alg3 유전자를 결손시킨다. PmeI-소화된 발현 카세트가 T. 리세이 균주 M279 (pyr4 - 균주) 내로 형질 전환된다. 플레이트 선별 후, 클론들은 PCR 스크리닝되고 단일 스포어로 정제된다.
alg3 좌로 표적화함으로써 얻어지는 리툭시맙 -생산 T. 리세이 GnTII / GnTI 변이체 균주에 대한 글리칸 분석
[00359] 글리칸 분석을 위한 재료를 얻기 위하여, 실시예 5에 기술된 것과 같이 진탕 플라스크 배양을 수행하고, 또한 일부 배양 배지를 0.3 mg/ml 대두 트립신 억제제 (SBTI) 및 1% 카사미노산으로 보충한다. 우선, SBTI을 접종시에 첨가한 후, 제3일~제6일에 매일 첨가한다. 동결 전 모든 샘플에 PMSF 및 펩스타틴을 첨가한다.
[00360] SBTI을 함유한 제5일의 상등액 샘플 및 SBTI를 함유하지 않는 제5일 및 제7일의 샘플로부터, 단백질 G 친화 크로마토그래피로 리툭시맙을 정제한다. 변성 단백질 ~ 10 μg에 대하여 PNGase F 반응을 수행한다. 해리된 N-글리칸을 먼저 Hypersep C-18로 정제한 후, Hypersep Hypercarb (양자 모두 Thermo Scientific로부터 구득)로 정제하는데, 여기서 중성 및 산성 N-글리칸이 분리된다. 리툭시맙 항체상에 G0 글리코폼이 존재하는지 시험하기 위하여 중성 및 산성 N-글리칸을 MALDI-TOF MS 분석한다.
SEQUENCE LISTING <110> Novartis International Pharmaceutical Ltd Glykos Finland Oy NATUNEN, Jari KANERVA, Anne HILTUNEN, Jukka SALOHEIMO, Markku VISKARI, Heli HUUSKONEN, Anne <120> FUSION ENZYMES <130> 61967-20010.40 <140> Not Yet Assigned <141> Concurrently Herewith <150> US 61/417,144 <151> 2010-11-24 <160> 147 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 445 <212> PRT <213> Homo sapiens <400> 1 Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Leu 1 5 10 15 Phe Val Ala Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro 20 25 30 Ala Pro Gly Arg Pro Pro Ser Val Ser Ala Leu Asp Gly Asp Pro Ala 35 40 45 Ser Leu Thr Arg Glu Val Ile Arg Leu Ala Gln Asp Ala Glu Val Glu 50 55 60 Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Gly Asp Ala Leu Ser 65 70 75 80 Ser Gln Arg Gly Arg Val Pro Thr Ala Ala Pro Pro Ala Gln Pro Arg 85 90 95 Val Pro Val Thr Pro Ala Pro Ala Val Ile Pro Ile Leu Val Ile Ala 100 105 110 Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu His Tyr 115 120 125 Arg Pro Ser Ala Glu Leu Phe Pro Ile Ile Val Ser Gln Asp Cys Gly 130 135 140 His Glu Glu Thr Ala Gln Ala Ile Ala Ser Tyr Gly Ser Ala Val Thr 145 150 155 160 His Ile Arg Gln Pro Asp Leu Ser Ser Ile Ala Val Pro Pro Asp His 165 170 175 Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg Trp Ala 180 185 190 Leu Gly Gln Val Phe Arg Gln Phe Arg Phe Pro Ala Ala Val Val Val 195 200 205 Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe Arg Ala 210 215 220 Thr Tyr Pro Leu Leu Lys Ala Asp Pro Ser Leu Trp Cys Val Ser Ala 225 230 235 240 Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ala Ser Arg Pro Glu 245 250 255 Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu Leu Leu 260 265 270 Ala Glu Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Lys Ala Phe Trp 275 280 285 Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Gln Gly Arg Ala Cys Ile 290 295 300 Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly Val Ser 305 310 315 320 His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu Asn Gln 325 330 335 Gln Phe Val His Phe Thr Gln Leu Asp Leu Ser Tyr Leu Gln Arg Glu 340 345 350 Ala Tyr Asp Arg Asp Phe Leu Ala Arg Val Tyr Gly Ala Pro Gln Leu 355 360 365 Gln Val Glu Lys Val Arg Thr Asn Asp Arg Lys Glu Leu Gly Glu Val 370 375 380 Arg Val Gln Tyr Thr Gly Arg Asp Ser Phe Lys Ala Phe Ala Lys Ala 385 390 395 400 Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala Gly Tyr 405 410 415 Arg Gly Ile Val Thr Phe Gln Phe Arg Gly Arg Arg Val His Leu Ala 420 425 430 Pro Pro Pro Thr Trp Glu Gly Tyr Asp Pro Ser Trp Asn 435 440 445 <210> 2 <211> 445 <212> PRT <213> Pan troglodytes <400> 2 Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Leu 1 5 10 15 Phe Val Ala Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro 20 25 30 Ala Pro Gly Arg Pro Pro Ser Val Ser Ala Leu Asp Asp Asp Pro Ala 35 40 45 Ser Leu Thr Arg Glu Val Ile Arg Leu Ala Gln Asp Ala Glu Val Glu 50 55 60 Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Gly Asp Ala Leu Ser 65 70 75 80 Ser Gln Arg Gly Arg Val Pro Thr Ala Ala Pro Pro Ala Gln Pro Arg 85 90 95 Val Pro Val Thr Pro Ala Pro Ala Val Ile Pro Ile Leu Val Ile Ala 100 105 110 Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu His Tyr 115 120 125 Arg Pro Ser Ala Glu Leu Phe Pro Ile Ile Val Ser Gln Asp Cys Gly 130 135 140 His Glu Glu Thr Ala Gln Ala Ile Ala Ser Tyr Gly Ser Ala Val Thr 145 150 155 160 His Ile Arg Gln Pro Asp Leu Ser Ser Ile Ala Val Pro Pro Asp His 165 170 175 Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg Trp Ala 180 185 190 Leu Gly Gln Val Phe Arg Gln Phe Gly Phe Pro Ala Ala Val Val Val 195 200 205 Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe Gln Ala 210 215 220 Thr Tyr Pro Leu Leu Lys Ala Asp Pro Ser Leu Trp Cys Val Ser Ala 225 230 235 240 Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ala Ser Arg Pro Glu 245 250 255 Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu Leu Leu 260 265 270 Ala Glu Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Lys Ala Phe Trp 275 280 285 Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Gln Gly Arg Ala Cys Ile 290 295 300 Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly Val Ser 305 310 315 320 His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu Asn Gln 325 330 335 Gln Phe Val His Phe Thr Gln Leu Asp Leu Ser Tyr Leu Gln Arg Glu 340 345 350 Ala Tyr Asp Arg Asp Phe Leu Ala Arg Val Tyr Gly Ala Pro Gln Leu 355 360 365 Gln Val Glu Lys Val Arg Thr Asn Asp Arg Lys Glu Leu Gly Glu Val 370 375 380 Arg Val Gln Tyr Thr Gly Arg Asp Ser Phe Lys Ala Phe Ala Lys Ala 385 390 395 400 Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala Gly Tyr 405 410 415 Arg Gly Ile Val Thr Phe Gln Phe Arg Gly Arg Arg Val His Leu Ala 420 425 430 Pro Pro Pro Thr Trp Glu Gly Tyr Asp Pro Ser Trp Asn 435 440 445 <210> 3 <211> 445 <212> PRT <213> Pongo abelii <400> 3 Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Leu 1 5 10 15 Phe Val Ala Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro 20 25 30 Ala Pro Gly Arg Pro Pro Ser Val Ser Ala Leu Asp Asp Asp Pro Ala 35 40 45 Ser Leu Thr Arg Glu Val Ile Arg Leu Ala Gln Asp Ala Glu Val Glu 50 55 60 Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Gly Asp Ala Leu Trp 65 70 75 80 Ser Gln Arg Gly Arg Val Pro Thr Pro Ala Leu Pro Ala Gln Pro Arg 85 90 95 Val Pro Ala Thr Pro Ala Pro Ala Val Ile Pro Ile Leu Val Ile Ala 100 105 110 Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu Gln Tyr 115 120 125 Arg Pro Ser Ala Glu Leu Phe Pro Ile Ile Val Ser Gln Asp Cys Gly 130 135 140 His Glu Glu Thr Ala Gln Ala Ile Ala Ser Tyr Gly Ser Ala Val Thr 145 150 155 160 His Ile Arg Gln Pro Asp Leu Ser Ser Ile Ala Val Pro Pro Asp His 165 170 175 Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg Trp Ala 180 185 190 Leu Gly Gln Ile Phe Gln Arg Phe Arg Phe Pro Ala Ala Val Val Val 195 200 205 Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe Gln Ala 210 215 220 Thr Tyr Pro Leu Leu Lys Ala Asp Pro Ser Leu Trp Cys Val Ser Ala 225 230 235 240 Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ala Ser Lys Pro Glu 245 250 255 Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu Leu Leu 260 265 270 Ala Glu Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Lys Ala Phe Trp 275 280 285 Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Lys Gly Arg Ala Cys Ile 290 295 300 Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly Val Ser 305 310 315 320 His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu Asn Gln 325 330 335 Gln Phe Val His Phe Thr Gln Leu Asp Leu Ser Tyr Leu Gln Arg Glu 340 345 350 Ala Tyr Asp Arg Asp Phe Leu Ala Arg Val Tyr Gly Ala Pro Gln Leu 355 360 365 Gln Val Glu Lys Val Arg Thr Asn Asp Arg Lys Glu Leu Gly Glu Val 370 375 380 Arg Val Gln Tyr Thr Gly Arg Asp Ser Phe Lys Ala Phe Ala Lys Ala 385 390 395 400 Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala Gly Tyr 405 410 415 Arg Gly Ile Val Thr Phe Gln Phe Arg Gly Arg Arg Val His Leu Ala 420 425 430 Pro Pro Pro Thr Trp Glu Gly Tyr Asp Pro Ser Trp Asn 435 440 445 <210> 4 <211> 445 <212> PRT <213> Macaca mulatta <400> 4 Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Leu 1 5 10 15 Phe Val Ala Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro 20 25 30 Ala Pro Gly Arg Pro Pro Ser Val Ser Ala Leu Asn Asp Asp Pro Ala 35 40 45 Ser Leu Thr Arg Glu Val Ile Arg Leu Ala Gln Asp Ala Glu Val Glu 50 55 60 Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Gly Asp Ala Leu Trp 65 70 75 80 Ser Gln Arg Gly Arg Val Pro Thr Ala Gly Pro Pro Ala Gln Pro His 85 90 95 Val Pro Val Thr Pro Ala Pro Ala Val Ile Pro Ile Leu Val Ile Ala 100 105 110 Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu His Tyr 115 120 125 Arg Pro Ser Ala Glu Arg Phe Pro Ile Ile Val Ser Gln Asp Cys Gly 130 135 140 His Glu Glu Thr Ala Gln Ala Ile Ala Ser Tyr Gly Ser Ala Val Thr 145 150 155 160 His Ile Arg Gln Pro Asp Leu Ser Ser Ile Ala Val Pro Pro Asp His 165 170 175 Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg Trp Ala 180 185 190 Leu Gly Gln Val Phe His Arg Phe Arg Phe Pro Ala Ala Val Val Val 195 200 205 Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe Gln Ala 210 215 220 Thr Tyr Pro Leu Leu Lys Ala Asp Pro Ser Leu Trp Cys Val Ser Ala 225 230 235 240 Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ser Gly Lys Pro Glu 245 250 255 Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu Leu Leu 260 265 270 Ala Glu Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Lys Ala Phe Trp 275 280 285 Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Lys Gly Arg Ala Cys Ile 290 295 300 Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly Val Ser 305 310 315 320 His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu Asn Gln 325 330 335 Gln Phe Val His Phe Thr Gln Leu Asp Leu Ser Tyr Leu Gln Arg Glu 340 345 350 Ala Tyr Asp Arg Asp Phe Leu Ala Arg Val Tyr Ala Ala Pro Gln Leu 355 360 365 Gln Val Glu Lys Val Arg Thr Asn Asp Arg Lys Glu Leu Gly Glu Val 370 375 380 Arg Val Gln Tyr Thr Gly Arg Asp Ser Phe Lys Ala Phe Ala Lys Ala 385 390 395 400 Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala Gly Tyr 405 410 415 Arg Gly Ile Val Thr Phe Gln Phe Arg Gly Arg Arg Val His Leu Ala 420 425 430 Pro Pro Pro Thr Trp Glu Gly Tyr Asp Pro Ser Trp Asn 435 440 445 <210> 5 <211> 447 <212> PRT <213> Cricetulus griseus <400> 5 Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Leu 1 5 10 15 Phe Val Gly Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro 20 25 30 Ala Pro Gly Arg Pro Pro Ser Asp Ser Ala Ile Asp Asp Asp Pro Ala 35 40 45 Ser Leu Thr Arg Glu Val Phe Arg Leu Ala Glu Asp Ala Glu Val Glu 50 55 60 Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Arg Glu His His Ala 65 70 75 80 Leu Trp Arg Gln Arg Trp Lys Val Pro Thr Val Ala Pro Pro Ala Trp 85 90 95 Pro Arg Val Pro Ala Thr Pro Ser Pro Ala Val Ile Pro Ile Leu Val 100 105 110 Ile Ala Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu 115 120 125 His Tyr Arg Pro Ser Ala Glu His Phe Pro Ile Ile Val Ser Gln Asp 130 135 140 Cys Gly His Glu Glu Thr Ala Gln Val Ile Ala Ser Tyr Gly Ser Ala 145 150 155 160 Val Thr His Ile Arg Gln Pro Asp Leu Ser Asn Ile Ala Val Pro Pro 165 170 175 Asp His Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg 180 185 190 Trp Ala Leu Gly Gln Ile Phe Asn Lys Phe Lys Phe Pro Ala Ala Val 195 200 205 Val Val Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe 210 215 220 Gln Ala Thr Tyr Pro Leu Leu Arg Thr Asp Pro Ser Leu Trp Cys Val 225 230 235 240 Ser Ala Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ser Ser Lys 245 250 255 Pro Glu Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu 260 265 270 Leu Met Ala Glu Leu Trp Thr Glu Leu Glu Pro Lys Trp Pro Lys Ala 275 280 285 Phe Trp Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Lys Gly Arg Ala 290 295 300 Cys Ile Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly 305 310 315 320 Val Ser His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu 325 330 335 Asn Gln Gln Phe Val Ser Phe Thr Gln Leu Asp Leu Ser Tyr Leu Gln 340 345 350 Arg Glu Ala Tyr Asp Arg Asp Phe Leu Ala Arg Val Tyr Ser Ala Pro 355 360 365 Leu Leu Gln Val Glu Lys Val Arg Thr Asn Asp Gln Lys Glu Leu Gly 370 375 380 Glu Val Arg Val Gln Tyr Thr Ser Arg Asp Ser Phe Lys Ala Phe Ala 385 390 395 400 Lys Ala Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala 405 410 415 Gly Tyr Arg Gly Val Val Thr Phe Gln Phe Arg Gly Arg Arg Val His 420 425 430 Leu Ala Pro Pro Gln Thr Trp Glu Gly Tyr Asp Pro Ser Trp Asn 435 440 445 <210> 6 <211> 447 <212> PRT <213> Rattus norvegicus <400> 6 Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Ile 1 5 10 15 Phe Val Gly Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro 20 25 30 Ala Pro Gly Arg Leu Pro Ser Asp Ser Ala Leu Gly Asp Asp Pro Ala 35 40 45 Ser Leu Thr Arg Glu Val Ile His Leu Ala Glu Asp Ala Glu Ala Glu 50 55 60 Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Lys Glu His Tyr Ser 65 70 75 80 Leu Trp Arg Gln Arg Trp Arg Val Pro Thr Val Ala Pro Pro Ala Trp 85 90 95 Pro Arg Val Pro Gly Thr Pro Ser Pro Ala Val Ile Pro Ile Leu Val 100 105 110 Ile Ala Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu 115 120 125 His Tyr Arg Pro Ser Ala Glu His Phe Pro Ile Ile Val Ser Gln Asp 130 135 140 Cys Gly His Glu Glu Thr Ala Gln Val Ile Ala Ser Tyr Gly Thr Ala 145 150 155 160 Val Thr His Ile Arg Gln Pro Asp Leu Ser Asn Ile Ala Val Gln Pro 165 170 175 Asp His Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg 180 185 190 Trp Ala Leu Gly Gln Ile Phe Asn Lys Phe Lys Phe Pro Ala Ala Val 195 200 205 Val Val Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe 210 215 220 Gln Ala Thr Tyr Pro Leu Leu Lys Ala Asp Pro Ser Leu Trp Cys Val 225 230 235 240 Ser Ala Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ser Ser Lys 245 250 255 Pro Glu Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu 260 265 270 Leu Leu Ala Asp Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Lys Ala 275 280 285 Phe Trp Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Lys Gly Arg Ala 290 295 300 Cys Ile Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly 305 310 315 320 Val Ser His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu 325 330 335 Asn Gln Gln Phe Val Pro Phe Thr Gln Leu Asp Leu Ser Tyr Leu Gln 340 345 350 Arg Glu Ala Tyr Asp Arg Asp Phe Leu Ala Gln Val Tyr Gly Ala Pro 355 360 365 Gln Leu Gln Val Glu Lys Val Arg Thr Asn Asp Arg Lys Glu Leu Gly 370 375 380 Glu Val Arg Val Gln Tyr Thr Ser Arg Asp Ser Phe Lys Ala Phe Ala 385 390 395 400 Lys Ala Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala 405 410 415 Gly Tyr Arg Gly Ile Val Thr Phe Gln Phe Arg Gly Arg Arg Val His 420 425 430 Leu Ala Pro Pro Glu Thr Trp Asn Gly Tyr Asp Pro Ser Trp Asn 435 440 445 <210> 7 <211> 447 <212> PRT <213> Mus musculus <400> 7 Met Leu Lys Lys Gln Thr Ala Gly Leu Val Leu Trp Gly Ala Ile Ile 1 5 10 15 Phe Val Gly Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro 20 25 30 Ala Pro Gly Arg Leu Pro Ser Asp Ser Ala Leu Gly Asp Asp Pro Ala 35 40 45 Ser Leu Thr Arg Glu Val Ile His Leu Ala Glu Asp Ala Glu Ala Glu 50 55 60 Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Lys Glu His Tyr Ala 65 70 75 80 Leu Trp Arg Gln Arg Trp Arg Val Pro Thr Val Ala Pro Pro Ala Trp 85 90 95 Pro Arg Val Pro Val Thr Pro Ser Pro Val Gln Ile Pro Ile Leu Val 100 105 110 Ile Ala Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu 115 120 125 His Tyr Arg Pro Ser Ala Glu Arg Phe Pro Ile Ile Val Ser Gln Asp 130 135 140 Cys Gly His Glu Glu Thr Ala Gln Val Ile Ala Ser Tyr Gly Thr Ala 145 150 155 160 Val Thr His Ile Arg Gln Pro Asp Leu Ser Asn Ile Ala Val Gln Pro 165 170 175 Asp His Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg 180 185 190 Trp Ala Leu Gly Gln Ile Phe Asn Lys Phe Lys Phe Pro Ala Ala Val 195 200 205 Val Val Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe 210 215 220 Gln Ala Thr Tyr Pro Leu Leu Arg Thr Asp Pro Ser Leu Trp Cys Val 225 230 235 240 Ser Ala Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ser Ser Lys 245 250 255 Pro Glu Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu 260 265 270 Leu Leu Ala Asp Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Lys Ala 275 280 285 Phe Trp Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Lys Gly Arg Ala 290 295 300 Cys Ile Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly 305 310 315 320 Val Ser His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu 325 330 335 Asn Gln Gln Phe Val Pro Phe Thr Gln Leu Asp Leu Ser Tyr Leu Gln 340 345 350 Gln Glu Ala Tyr Asp Arg Asp Phe Leu Ala Gln Val Tyr Gly Ala Pro 355 360 365 Gln Leu Gln Val Glu Lys Val Arg Thr Asn Asp Gln Lys Glu Leu Gly 370 375 380 Glu Val Arg Val Gln Tyr Thr Ser Arg Asp Ser Phe Lys Ala Phe Ala 385 390 395 400 Lys Ala Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala 405 410 415 Gly Tyr Arg Gly Ile Val Thr Phe Gln Phe Arg Gly Arg Arg Val His 420 425 430 Leu Ala Pro Pro Gln Thr Trp Thr Gly Tyr Asp Pro Ser Trp Asn 435 440 445 <210> 8 <211> 447 <212> PRT <213> Oryctolagus cuniculus <400> 8 Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Leu 1 5 10 15 Phe Val Ala Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro 20 25 30 Val Pro Ser Arg Leu Pro Ser Asp Asn Ala Leu Asp Asp Asp Pro Ala 35 40 45 Ser Leu Thr Arg Glu Val Ile Arg Leu Ala Gln Asp Ala Glu Val Glu 50 55 60 Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Arg Glu His His Ala 65 70 75 80 Leu Trp Ser Gln Arg Trp Lys Val Pro Thr Ala Ala Pro Pro Ala Gln 85 90 95 Pro His Val Pro Val Thr Pro Pro Pro Ala Val Ile Pro Ile Leu Val 100 105 110 Ile Ala Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu 115 120 125 His Tyr Arg Pro Ser Ala Glu Leu Phe Pro Ile Ile Val Ser Gln Asp 130 135 140 Cys Gly His Glu Glu Thr Ala Gln Val Ile Ala Ser Tyr Gly Ser Ala 145 150 155 160 Val Thr His Ile Arg Gln Pro Asp Leu Ser Asn Ile Ala Val Gln Pro 165 170 175 Asp His Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg 180 185 190 Trp Ala Leu Gly Gln Ile Phe His Asn Phe Asn Tyr Pro Ala Ala Val 195 200 205 Val Val Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe 210 215 220 Gln Ala Thr Tyr Pro Leu Leu Lys Ala Asp Pro Ser Leu Trp Cys Val 225 230 235 240 Ser Ala Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ser Ser Lys 245 250 255 Pro Glu Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu 260 265 270 Leu Leu Ala Glu Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Lys Ala 275 280 285 Phe Trp Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Lys Gly Arg Ala 290 295 300 Cys Val Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly 305 310 315 320 Val Ser His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu 325 330 335 Asn Gln Gln Phe Val Pro Phe Thr Gln Leu Asp Leu Ser Tyr Leu Gln 340 345 350 Gln Glu Ala Tyr Asp Arg Asp Phe Leu Ala Arg Val Tyr Gly Ala Pro 355 360 365 Gln Leu Gln Val Glu Lys Val Arg Thr Asn Asp Arg Lys Glu Leu Gly 370 375 380 Glu Val Arg Val Gln Tyr Thr Gly Arg Asp Ser Phe Lys Ala Phe Ala 385 390 395 400 Lys Ala Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala 405 410 415 Gly Tyr Arg Gly Ile Val Thr Phe Leu Phe Arg Gly Arg Arg Val His 420 425 430 Leu Ala Pro Pro Gln Thr Trp Asp Gly Tyr Asp Pro Ser Trp Thr 435 440 445 <210> 9 <211> 447 <212> PRT <213> Mesocricetus auratus <400> 9 Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Ile 1 5 10 15 Phe Val Gly Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro 20 25 30 Ala Pro Gly Arg Pro Pro Leu Asp Ser Ala Leu Asp Asp Asp Pro Ala 35 40 45 Ser Leu Thr Arg Glu Val Ile Arg Leu Ala Glu Asp Ala Glu Val Glu 50 55 60 Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Arg Glu His His Thr 65 70 75 80 Leu Trp Asn Gln Arg Trp Lys Val Pro Thr Val Ala Pro Pro Ala Trp 85 90 95 Pro Arg Val Pro Val Thr Pro Ser Pro Pro Val Ile Pro Ile Leu Val 100 105 110 Ile Ala Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu 115 120 125 His Tyr Arg Pro Ser Ala Glu His Phe Pro Ile Ile Val Ser Gln Asp 130 135 140 Cys Gly His Glu Glu Thr Ala Gln Val Ile Ala Ser Tyr Gly Ser Ala 145 150 155 160 Val Thr His Ile Arg Gln Pro Asp Leu Ser Asn Ile Ala Val Gln Pro 165 170 175 Asp His Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg 180 185 190 Trp Ala Leu Gly Gln Ile Phe Asn Lys Phe Lys Phe Pro Ala Ala Val 195 200 205 Val Val Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe 210 215 220 Gln Ala Thr Tyr Pro Leu Leu Arg Thr Asp Pro Ser Leu Trp Cys Val 225 230 235 240 Ser Ala Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ser Ser Lys 245 250 255 Pro Glu Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu 260 265 270 Leu Leu Ala Glu Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Lys Ala 275 280 285 Phe Trp Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Lys Gly Arg Ala 290 295 300 Cys Ile Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly 305 310 315 320 Val Ser His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu 325 330 335 Asn Gln Gln Phe Val Ser Phe Thr Gln Leu Asp Leu Ser Tyr Leu Gln 340 345 350 Arg Glu Ala Tyr Asp Arg Asp Phe Leu Ala Arg Val Tyr Gly Ala Pro 355 360 365 Leu Leu Gln Val Glu Lys Val Arg Thr Asn Asp Gln Lys Glu Leu Gly 370 375 380 Glu Val Arg Val Gln Tyr Thr Ser Arg Asp Ser Phe Lys Ala Phe Ala 385 390 395 400 Lys Ala Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala 405 410 415 Gly Tyr Arg Gly Ile Val Thr Phe Gln Phe Arg Gly Arg Arg Val His 420 425 430 Leu Ala Pro Pro Arg Ser Trp Glu Gly Tyr Asp Pro Ser Trp Thr 435 440 445 <210> 10 <211> 445 <212> PRT <213> Ailuropoda melanoleuca <400> 10 Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Leu 1 5 10 15 Phe Val Ala Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro 20 25 30 Ser Pro Gly Arg Leu Pro Ser Glu Ser Ala Leu Asp Asp Asp Pro Ala 35 40 45 Val Leu Thr Arg Glu Val Ile Arg Leu Ala Glu Asp Ala Glu Val Glu 50 55 60 Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Arg Glu His His Ala 65 70 75 80 Arg Trp Ser Gln Arg Trp Arg Ala Pro Thr Ala Thr Val Pro Ala Pro 85 90 95 Ala Pro Ala Ser Asn Ala Pro Ala Val Ile Pro Ile Leu Val Ile Ala 100 105 110 Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu His Tyr 115 120 125 Arg Pro Ser Ala Glu His Phe Pro Ile Ile Val Ser Gln Asp Cys Gly 130 135 140 His Glu Glu Thr Ala Gln Val Ile Ala Ser Tyr Gly Ser Ala Val Thr 145 150 155 160 His Ile Arg Gln Pro Asp Leu Ser Ser Ile Ala Val Pro Pro Asp His 165 170 175 Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg Trp Ala 180 185 190 Leu Gly Gln Val Phe His Arg Phe Lys Phe Pro Ala Ala Val Val Val 195 200 205 Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe Gln Ala 210 215 220 Thr Tyr Pro Leu Leu Arg Ala Asp Pro Ser Leu Trp Cys Val Ser Ala 225 230 235 240 Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ser Ser Lys Pro Glu 245 250 255 Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu Leu Leu 260 265 270 Ala Glu Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Arg Ala Phe Trp 275 280 285 Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Gln Gly Arg Ala Cys Val 290 295 300 Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly Val Ser 305 310 315 320 His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu Asn Gln 325 330 335 His Phe Val Pro Phe Thr Gln Leu Asp Leu Ser Tyr Leu Arg Gln Glu 340 345 350 Thr Tyr Asp Arg Asp Phe Leu Ala Arg Val Tyr Gly Ala Pro Leu Leu 355 360 365 Gln Val Glu Lys Val Arg Thr Ser Glu Arg Asn Glu Leu Gly Glu Val 370 375 380 Arg Val Gln Tyr Thr Gly Arg Asp Ser Phe Lys Ala Phe Ala Lys Ala 385 390 395 400 Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala Gly Tyr 405 410 415 Arg Gly Ile Val Ser Phe Leu Phe Arg Gly Arg Arg Val His Leu Ala 420 425 430 Pro Pro Gln Thr Trp Asp Gly Tyr Asp Pro Ser Trp Asn 435 440 445 <210> 11 <211> 447 <212> PRT <213> Sus scrofa <400> 11 Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Leu 1 5 10 15 Phe Val Ala Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro 20 25 30 Ala Pro Gly Arg Leu Pro Ser Asp Ser Ala Leu Asp Asp Asp Pro Ala 35 40 45 Ser Leu Thr Arg Glu Val Ile Arg Leu Ala Gln Asp Ala Glu Val Glu 50 55 60 Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Arg Glu His His Ala 65 70 75 80 Arg Trp Ser Gln Arg Trp Arg Val Pro Thr Val Ala Pro Pro Val Pro 85 90 95 Pro Arg Val Pro Val Thr Ser Ala Pro Thr Val Ile Pro Ile Leu Val 100 105 110 Ile Ala Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu 115 120 125 His Tyr Arg Pro Ser Ala Glu His Phe Pro Ile Ile Val Ser Gln Asp 130 135 140 Cys Gly His Glu Glu Thr Ala Gln Val Ile Ala Ser Tyr Gly Ser Ala 145 150 155 160 Val Thr His Ile Arg Gln Pro Asp Leu Ser Asn Ile Val Val Pro Pro 165 170 175 Asp His Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg 180 185 190 Trp Ala Leu Gly Gln Val Phe Glu Lys Phe Lys Phe Ser Ala Ala Val 195 200 205 Val Val Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe 210 215 220 Gln Ala Thr Tyr Pro Leu Leu Arg Ala Asp Pro Ser Leu Trp Cys Val 225 230 235 240 Ser Ala Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ser Ser Lys 245 250 255 Pro Glu Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu 260 265 270 Leu Leu Ala Glu Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Lys Ala 275 280 285 Phe Trp Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Gln Gly Arg Ala 290 295 300 Cys Val Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly 305 310 315 320 Val Ser His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu 325 330 335 Asn Gln His Phe Val Pro Phe Thr Gln Leu Asp Leu Ser Tyr Leu Arg 340 345 350 Arg Glu Ala Tyr Asp Arg Asp Phe Leu Ala Arg Val Tyr Gly Ala Pro 355 360 365 Leu Leu Gln Val Glu Lys Val Arg Thr Ser Glu Arg Ser Glu Leu Gly 370 375 380 Glu Val Arg Val Gln Tyr Thr Ser Arg Asp Ser Phe Lys Ala Phe Ala 385 390 395 400 Lys Ala Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala 405 410 415 Gly Tyr Arg Gly Ile Val Ser Phe Leu Phe Arg Gly Arg Arg Val Tyr 420 425 430 Leu Ala Pro Pro Glu Thr Trp Asp Gly Tyr Asp Pro Ser Trp Asn 435 440 445 <210> 12 <211> 447 <212> PRT <213> Canis familiaris <400> 12 Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Leu 1 5 10 15 Phe Val Ala Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro 20 25 30 Ser Pro Ser Arg Leu Pro Ser Asp Ser Ala Leu Asp Asp Asp Pro Ala 35 40 45 Ser Leu Thr Arg Glu Val Ile Arg Leu Ala Glu Asp Ala Glu Val Glu 50 55 60 Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Arg Glu His His Ala 65 70 75 80 Arg Trp Ser Gln Arg Trp Arg Val Pro Thr Ala Ala Pro Pro Ala Pro 85 90 95 Pro Arg Val Pro Val Ser Ser Pro Pro Ala Val Ile Pro Ile Leu Val 100 105 110 Ile Ala Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu 115 120 125 His Tyr Arg Pro Ser Ala Glu His Phe Pro Ile Ile Val Ser Gln Asp 130 135 140 Cys Gly His Glu Glu Thr Ala Gln Val Ile Ala Ser Tyr Gly Ser Ala 145 150 155 160 Ile Thr His Ile Arg Gln Pro Asp Leu Ser Ser Ile Thr Val Pro Pro 165 170 175 Asp His Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg 180 185 190 Trp Ala Leu Gly Gln Val Phe His Lys Phe Lys Phe Pro Ala Ala Val 195 200 205 Val Val Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe 210 215 220 Gln Ala Thr Tyr Pro Leu Leu Arg Ala Asp Pro Ser Leu Trp Cys Val 225 230 235 240 Ser Ala Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ser Ser Lys 245 250 255 Pro Glu Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu 260 265 270 Leu Leu Ala Glu Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Arg Ala 275 280 285 Phe Trp Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Gln Gly Arg Ala 290 295 300 Cys Val Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly 305 310 315 320 Val Ser His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu 325 330 335 Asn Gln His Phe Val Pro Phe Thr Gln Leu Asp Leu Ser Tyr Leu Arg 340 345 350 Gln Glu Thr Tyr Asp Arg Asp Phe Leu Ala Arg Val Tyr Gly Ala Pro 355 360 365 Leu Leu Gln Val Glu Lys Val Arg Thr Ser Glu Arg Ser Glu Leu Gly 370 375 380 Glu Val Arg Val Gln Tyr Thr Gly Arg Asp Ser Phe Lys Ala Phe Ala 385 390 395 400 Lys Ala Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala 405 410 415 Gly Tyr Arg Gly Ile Val Ser Phe Leu Phe Arg Gly Arg Arg Val His 420 425 430 Leu Ala Pro Pro Gln Thr Trp Asp Gly Tyr Asp Pro Ser Trp Asn 435 440 445 <210> 13 <211> 447 <212> PRT <213> Bos taurus <400> 13 Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Leu 1 5 10 15 Phe Val Ala Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro 20 25 30 Ala Pro Gly Arg Leu Pro Ser Asp Ser Ala Leu Asp Asp Asp Pro Ala 35 40 45 Ser Leu Thr Arg Glu Val Ile Arg Leu Ala Gln Asp Ala Glu Val Glu 50 55 60 Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Arg Glu His His Ala 65 70 75 80 Arg Trp Ser Gln Arg Trp Arg Val Pro Thr Val Ala Pro Pro Val Pro 85 90 95 Pro Arg Val Pro Val Thr Thr Pro Pro Ala Val Ile Pro Ile Leu Val 100 105 110 Ile Ala Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu 115 120 125 Asn Tyr Arg Pro Ser Ala Glu His Phe Pro Ile Ile Val Ser Gln Asp 130 135 140 Cys Gly His Glu Glu Thr Ala Gln Val Ile Ala Ser Tyr Gly Ser Ala 145 150 155 160 Val Met His Ile Arg Gln Pro Asp Leu Ser Thr Ile Ala Val Pro Pro 165 170 175 Asp His Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg 180 185 190 Trp Ala Leu Gly Gln Val Phe His Glu Phe Lys Phe Pro Ala Ala Val 195 200 205 Val Val Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe 210 215 220 Gln Ala Thr Tyr Pro Leu Leu Arg Ala Asp Pro Ser Leu Trp Cys Val 225 230 235 240 Ser Ala Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ser Ser Lys 245 250 255 Pro Glu Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu 260 265 270 Leu Leu Ala Glu Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Lys Ala 275 280 285 Phe Trp Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Gln Gly Arg Ala 290 295 300 Cys Val Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly 305 310 315 320 Val Ser His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu 325 330 335 Asn Gln His Phe Val Pro Phe Thr Gln Leu Asp Leu Ser Tyr Leu Arg 340 345 350 Gln Glu Thr Tyr Asp Arg Asp Phe Leu Ala Arg Val Tyr Gly Ala Pro 355 360 365 Leu Leu Gln Val Glu Lys Val Arg Thr Ser Glu Arg Ser Glu Leu Gln 370 375 380 Glu Val Arg Val Gln Tyr Thr Ser Arg Asp Ser Phe Lys Ala Phe Ala 385 390 395 400 Lys Ala Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala 405 410 415 Gly Tyr Arg Gly Ile Val Ser Phe Leu Tyr Arg Gly Arg Arg Val His 420 425 430 Leu Ala Pro Pro Gln Thr Trp Asp Gly Tyr Asp Pro Ser Trp Asn 435 440 445 <210> 14 <211> 447 <212> PRT <213> Equus caballus <400> 14 Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Leu 1 5 10 15 Phe Val Ala Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Met Arg Pro 20 25 30 Ser Pro Ser Arg Leu Pro Ser Asp Gly Thr Leu Asp Asp Asp Pro Thr 35 40 45 Gly Leu Thr Arg Lys Val Ile His Leu Ala Gln Asp Val Glu Val Glu 50 55 60 Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Arg Glu His His Ala 65 70 75 80 Arg Trp Ser Gln Trp Trp Arg Val Pro Thr Val Pro Pro Pro Val Pro 85 90 95 Pro His Val Ser Val Thr Ser Leu Pro Ala Val Ile Pro Ile Leu Val 100 105 110 Ile Ala Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu 115 120 125 His Tyr Arg Pro Ser Ala Glu His Phe Pro Ile Ile Val Ser Gln Asp 130 135 140 Cys Gly His Glu Glu Thr Ala Gln Val Ile Ala Ser Tyr Gly Ser Ala 145 150 155 160 Val Thr His Ile Arg Gln Pro Asp Leu Ser Asn Ile Ala Val Pro Pro 165 170 175 Asp His Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg 180 185 190 Trp Ala Leu Ala Gln Val Phe His Arg Phe Lys Phe Pro Ala Ala Val 195 200 205 Val Val Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe 210 215 220 Gln Ala Thr Tyr Pro Leu Leu Arg Ala Asp Pro Ser Leu Trp Cys Val 225 230 235 240 Ser Ala Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ser Ser Lys 245 250 255 Pro Glu Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu 260 265 270 Leu Leu Ala Glu Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Lys Ala 275 280 285 Phe Trp Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Gln Gly Arg Ala 290 295 300 Cys Val Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Ile Gly 305 310 315 320 Val Ser His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu 325 330 335 Asn Gln His Phe Val Pro Phe Thr Gln Leu Asp Leu Ser Tyr Leu Arg 340 345 350 Gln Glu Ala Tyr Asp Lys Asp Phe Leu Ala Arg Val Tyr Gly Ala Pro 355 360 365 Leu Leu Gln Val Glu Lys Val Arg Thr Gly Glu Arg Ser Glu Leu Gly 370 375 380 Glu Val Arg Val Gln Tyr Thr Gly Arg Asp Ser Phe Lys Ala Phe Ala 385 390 395 400 Lys Ala Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala 405 410 415 Gly Tyr Arg Gly Ile Val Ser Phe Leu Phe Arg Gly Arg Arg Val His 420 425 430 Leu Ala Pro Pro Gln Thr Trp Glu Gly Tyr Asp Pro Ser Trp Asn 435 440 445 <210> 15 <211> 447 <212> PRT <213> Monodelphis domestica <400> 15 Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Leu 1 5 10 15 Phe Val Ala Trp Asn Ala Leu Leu Leu Phe Phe Phe Trp Ala Arg Pro 20 25 30 Leu Pro Gly Gly Pro Ser Ser Glu Asp Pro Phe Ala Asn Asp Pro Ala 35 40 45 Ser Leu Ser Arg Arg Val Ile Arg Leu Ala Gln Glu Ala Glu Ile Glu 50 55 60 Leu Glu Arg Gln His Val Leu Leu Gln Gln Ile Gln Lys His Ser Val 65 70 75 80 Leu Trp Asn Gln Arg Gln Gln Val Ala Thr Ala Gly Pro Pro Ala Val 85 90 95 Ser His Pro Thr Val Ala Pro Thr Thr Phe Val Leu Pro Ile Leu Val 100 105 110 Ile Ala Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu 115 120 125 His Tyr Arg Pro Ser Ala Glu Arg Phe Pro Ile Ile Val Ser Gln Asp 130 135 140 Cys Gly His Lys Val Thr Ala Gln Val Ile Ala Ser Tyr Gly Asn Ala 145 150 155 160 Ile Met His Ile Lys Gln Pro Asp Leu Ser Ser Ile Pro Val Pro Thr 165 170 175 Glu His Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg 180 185 190 Trp Ala Leu Asn Gln Val Phe Arg Thr Phe Lys Tyr Gln Ala Ala Val 195 200 205 Val Val Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe 210 215 220 Gln Ala Thr Tyr Pro Leu Leu Arg Thr Asp Pro Ser Leu Trp Cys Val 225 230 235 240 Ser Ala Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ala Lys Arg 245 250 255 Pro Asp Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu 260 265 270 Leu Leu Ala Glu Leu Trp Asp Glu Leu Glu Pro Lys Trp Pro Lys Ala 275 280 285 Phe Trp Asp Asp Trp Met Arg Gln Pro Glu Gln Arg Arg Asp Arg Ala 290 295 300 Cys Leu Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly 305 310 315 320 Val Ser Gln Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu 325 330 335 Asn Gln Gly Phe Val Phe Phe Thr Gln Leu Asp Leu Ser Tyr Leu Lys 340 345 350 Gln Glu Ala Tyr Asp Arg Asp Phe Ser Ala Arg Val Tyr Ala Ala Pro 355 360 365 Gln Val Gln Val Glu Glu Leu Lys Ser Asn Gln Lys Gln Glu Leu Gly 370 375 380 Glu Val Arg Val Gln Tyr Arg Gly Arg Asp Ser Phe Arg Ala Phe Ala 385 390 395 400 Lys Ala Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala 405 410 415 Ser Tyr Arg Gly Ile Val Ser Phe Leu Phe Arg Gly Arg Arg Val Tyr 420 425 430 Leu Ala Pro Pro Gln Asp Trp Thr Gly Tyr Asp Pro Ser Trp Ser 435 440 445 <210> 16 <211> 438 <212> PRT <213> Salmo salar <400> 16 Met Leu Arg Lys Arg Gly Ser Ala Ile Leu Cys Gly Ala Phe Leu Phe 1 5 10 15 Val Ala Trp Asn Ala Val Val Val Leu Tyr Leu Trp Gly Arg Pro Leu 20 25 30 Ser Gly Arg Glu Glu Arg Glu Met Asp Gly Gly Arg Gly Gly Ala Asp 35 40 45 Leu Ala Gly Asp Val Ile His Met Ala Glu Ala Phe Glu Ala Glu Leu 50 55 60 Glu Met Gln Arg Lys Ile Leu Leu Gln Ile Gln Gly His Arg Ser Leu 65 70 75 80 Trp Glu Gln Pro Asn Glu Asn Gly Ala Ser Arg Ile Gly Pro Pro Gln 85 90 95 Val Val Ile Pro Ile Leu Val Ile Ala Cys Asn Arg Val Thr Val Lys 100 105 110 Arg Cys Leu Asp Lys Leu Leu Glu Tyr Arg Pro Ser Ala Glu Leu Tyr 115 120 125 Pro Ile Ile Val Ser Gln Asp Cys Gly His Ala Glu Thr Ala Gln Val 130 135 140 Ile Gly Ser Tyr Gly Ser Gln Val Thr His Leu Lys Gln Pro Asp Leu 145 150 155 160 Ser Asp Ile Ala Val Arg Pro Glu His Lys Lys Phe Gln Gly Tyr Tyr 165 170 175 Lys Ile Ser Arg His Tyr Arg Trp Ala Leu Asn Gln Val Phe Asn Ser 180 185 190 Leu Ser His Ser Ser Val Val Ile Val Glu Asp Asp Leu Glu Val Ala 195 200 205 Pro Asp Phe Phe Glu Tyr Phe Arg Ser Leu His Pro Ile Leu Lys Ser 210 215 220 Asp Leu Ser Leu Trp Cys Val Ser Ala Trp Asn Asp Asn Gly Arg Asp 225 230 235 240 Gly Tyr Val Asp Pro Ala Lys Ala Asp Leu Leu Tyr Arg Thr Asp Phe 245 250 255 Phe Pro Gly Leu Gly Trp Met Met Leu Lys Glu Leu Trp Val Glu Leu 260 265 270 Glu Pro Lys Trp Pro Gly Ala Phe Trp Asp Asp Trp Met Arg Gln Pro 275 280 285 Asp Gln Arg Arg Asp Arg Ala Cys Ile Arg Pro Glu Ile Ser Arg Thr 290 295 300 Leu Thr Phe Gly Arg Lys Gly Val Ser Leu Gly Gln Phe Tyr Asp Lys 305 310 315 320 Tyr Leu Arg Tyr Ile Lys Leu Asn Ser Glu Phe Val Pro Phe Thr Lys 325 330 335 Leu Asp Leu Ala Tyr Leu Lys Glu Glu Lys Tyr Lys Glu Ile Phe Glu 340 345 350 Lys Gln Val Tyr Ser Ala Pro Leu Val Lys Tyr Glu Glu Val Gln Arg 355 360 365 Gly Gln Leu Lys Gly Ala Gly Pro Phe Cys Leu His Tyr Leu Ser Lys 370 375 380 Asp Gly Phe Lys Val Leu Ala Lys Asn Leu Gly Val Met Glu Asp Leu 385 390 395 400 Lys Ser Gly Val Pro Arg Thr Gly Tyr Arg Gly Val Val Ser Phe Leu 405 410 415 Ser Arg Gly Arg Arg Ile Phe Leu Ala Pro Pro Pro Gly Trp Ser Lys 420 425 430 Tyr Asp Pro Thr Trp Ser 435 <210> 17 <211> 452 <212> PRT <213> Danio rerio <400> 17 Met Leu Arg Lys Arg Ser Pro Leu Val Ile Cys Gly Ala Phe Ile Phe 1 5 10 15 Val Ala Trp Asn Val Val Leu Leu Phe Val Leu Met Arg Arg Pro Ser 20 25 30 Ser Pro Gly Thr Phe Asn Asn Gln Asp Lys Pro Gly Glu Thr Glu His 35 40 45 Arg Ala Glu Gly Gly Lys Phe Gly Asn Ile Met Asn Glu Val Ile Arg 50 55 60 Val Ala Asp Ala Phe Glu Ala Glu Leu Ala Ala Gln Lys Lys Ile Leu 65 70 75 80 Gln Gln Ile Gln Ser His Trp Ser Val Trp Asp Ser Lys Asp Gly Val 85 90 95 Ile Pro Glu Lys Ser Lys Ser Glu Val Glu His Thr Ala Pro Val Val 100 105 110 Ile Pro Ile Leu Val Ile Ala Cys Asn Arg Val Thr Val Lys Arg Cys 115 120 125 Leu Asp Lys Leu Ile Glu His Arg Pro Ser Ala Glu Leu His Pro Ile 130 135 140 Ile Val Ser Gln Asp Cys Gly His Arg Glu Thr Ser Asp Val Ile Gly 145 150 155 160 Ser Tyr Gly Ser Gln Leu Thr His Ile Lys Gln Pro Asp Leu Ser Asp 165 170 175 Val Ala Val Pro Pro Gln His Lys Lys Phe Gln Gly Tyr Tyr Lys Ile 180 185 190 Ser Arg His Tyr Lys Trp Ala Leu Ser Gln Val Phe Asn Thr Phe Ser 195 200 205 Tyr Ser Ser Val Val Val Val Glu Asp Asp Leu Glu Val Ala Pro Asp 210 215 220 Phe Phe Glu Tyr Phe Arg Ala Leu His Pro Met Leu Lys Ser Asp Pro 225 230 235 240 Thr Leu Trp Cys Val Ser Ala Trp Asn Asp Asn Gly Arg Asp Gly Phe 245 250 255 Val Asp Pro Gly Lys Ala Ser Leu Leu Tyr Arg Thr Asp Phe Phe Pro 260 265 270 Gly Leu Gly Trp Met Leu Thr Lys Asp Leu Trp Ala Glu Leu Glu Pro 275 280 285 Lys Trp Pro Ala Ser Phe Trp Asp Asp Trp Met Arg His Pro Asp Gln 290 295 300 Arg Lys Asp Arg Ser Cys Ile Arg Pro Glu Ile Ser Arg Thr Leu Thr 305 310 315 320 Phe Gly Arg Lys Gly Val Ser Leu Gly Gln Phe Tyr Asp Lys Tyr Leu 325 330 335 Arg Phe Ile Lys Leu Asn Thr Glu Phe Val Pro Phe Thr Lys Met Asp 340 345 350 Leu Ser Tyr Leu Glu Lys Glu Lys Tyr Asp Glu Ser Phe Glu Lys Glu 355 360 365 Val Tyr Ala Ala Ser Leu Val Thr Leu Glu Asp Leu Lys Ser Gly Lys 370 375 380 Leu Ser Gly Ser Gly Pro Phe Arg Val Gln Tyr Ser Ser Pro Asp Ser 385 390 395 400 Phe Lys Ser Leu Ala Arg Asn Leu Gly Val Met Asp Asp Leu Lys Ser 405 410 415 Gly Val Pro Arg Ala Gly Tyr Arg Gly Ala Val Ser Phe Leu Leu Arg 420 425 430 Gly Lys Arg Val Tyr Leu Ala Pro Pro Ala Gly Trp Ser Arg Tyr Asp 435 440 445 Pro Ser Trp Ser 450 <210> 18 <211> 448 <212> PRT <213> Xenopus laevis <400> 18 Met Pro Arg Lys Val Ser Val Ala Ala Trp Gly Ala Ala Leu Phe Ile 1 5 10 15 Ser Trp Asn Ala Ile Leu Leu Leu Tyr Leu Met Ser Arg Ser Arg Gly 20 25 30 Thr Asp His Ser Asp Leu Thr Ala His Val Ile Gln Leu Ala Glu Ala 35 40 45 Ala Glu Ala Glu Leu Glu Lys Gln Lys Gly Leu Leu Gln Gln Ile His 50 55 60 His Tyr Ser Gly Leu Leu Asn Gln Gln Gln Pro Ser Ser His Val Arg 65 70 75 80 Leu Ala Pro Leu Met Pro Ile Lys Asn Leu Asn Val Ser Ser Pro Phe 85 90 95 Pro Ser Pro Val Gly Ser Gly Pro Leu Pro Leu Val Ile Pro Ile Leu 100 105 110 Val Val Ala Cys Asp Arg Pro Ser Val Arg Arg Cys Leu Asp Ser Leu 115 120 125 Leu Lys Tyr Arg Pro Ser Ala Glu Lys Phe Pro Ile Ile Val Ser Gln 130 135 140 Asp Cys Gly His Glu Glu Thr Gly Lys Val Ile Asp Ser Tyr Gly Asp 145 150 155 160 Ala Val Thr His Ile Lys Gln Pro Asp Leu Ser Glu Val Ala Val Pro 165 170 175 Pro Glu His Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ser Arg His Tyr 180 185 190 Arg Trp Ala Leu Asn Gln Ile Phe Lys Ser Met Gly Tyr Lys Ala Ala 195 200 205 Ile Val Val Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Tyr Glu Tyr 210 215 220 Phe Gln Ala Thr Leu Pro Leu Leu Gln Lys Asp Arg Met Leu Trp Cys 225 230 235 240 Val Ser Ala Trp Asn Asp Asn Gly Lys Glu Ala Leu Ile Asp Pro Gly 245 250 255 Gly Thr Ser Leu Leu Tyr Arg Ser Asp Phe Phe Pro Gly Leu Gly Trp 260 265 270 Leu Leu Leu Arg Glu Leu Trp Glu Glu Leu Glu Pro Lys Trp Pro Ser 275 280 285 Ala Phe Trp Asp Asp Trp Val Arg Arg Pro Glu Gln Arg Leu Asp Arg 290 295 300 Ala Cys Val Arg Pro Glu Leu Ser Arg Thr Arg Thr Phe Gly Arg Lys 305 310 315 320 Gly Val Ser Gln Gly Gln Phe Phe Asp Gln His Leu Arg Phe Ile Lys 325 330 335 Leu Asn Gln Asp Leu Val Pro Phe Thr Lys Met Asp Leu Ser Tyr Leu 340 345 350 Leu Lys Asp Thr Tyr Asp Pro Trp Phe Leu Glu Gln Val Tyr Gly Ala 355 360 365 Pro Lys Ala Arg Ala Glu Glu Val Leu His Gly Gln Val Pro Gly Gly 370 375 380 Arg Thr Val Arg Val Glu Tyr Thr Thr Lys Asp Thr Phe Lys Ala Met 385 390 395 400 Ala Arg Ala Phe Gly Val Met Glu Asp Leu Lys Ser Gly Val Ala Arg 405 410 415 Ala Ala Tyr Lys Gly Val Val Ser Phe Ser His Arg Gly Arg Arg Val 420 425 430 Phe Leu Ala Pro Pro Lys Asp Trp Thr Gly Tyr Asp Pro Leu Trp Asn 435 440 445 <210> 19 <211> 458 <212> PRT <213> Drosophila melanogaster <400> 19 Met Arg Thr Arg Lys Val Leu Leu Val Ile Gly Phe Leu Val Thr Trp 1 5 10 15 Thr Tyr Ala Thr Tyr Tyr Leu Leu Leu Arg Gln Thr Gly Ile His Thr 20 25 30 Ser Arg His Gln Ser Leu Gln Ala Tyr Lys Leu Asn Ser Gln Ala Arg 35 40 45 Asp Ala Asn Met Gln Ser His His Leu Ala Lys Asn Val Phe Glu Phe 50 55 60 Val Lys Leu Lys Tyr Leu Glu Lys Gln Pro Pro Ser Val Ala Ser Thr 65 70 75 80 Pro Gln Ile Ser Ile Ile Ala Ala Glu Ile Ser Ala Glu Leu Pro Glu 85 90 95 Gln His Val Ala Lys Ser Ala Thr Ala Arg Ile Pro Thr Lys Thr Tyr 100 105 110 Leu Ala Asn Gly Glu Pro Val Phe Pro Val Val Val Phe Ala Cys Asn 115 120 125 Arg Val Ser Val Lys Lys Cys Ile Asp Asn Leu Val Gln Tyr Arg Pro 130 135 140 Ser Val Glu Gln Phe Pro Ile Ile Val Ser Gln Asp Cys Gly Asp Glu 145 150 155 160 Pro Thr Lys Glu Ala Ile Leu Ser Tyr Gly Lys Gln Val Thr Leu Ile 165 170 175 Glu Gln Pro Asp Leu Ser Asp Ile Thr Val Leu Pro Lys Glu Lys Lys 180 185 190 Phe Lys Gly Tyr Tyr Lys Ile Ala Arg His Tyr Gly Trp Ala Leu Asn 195 200 205 Thr Thr Phe Ala Val Gly Phe Glu Phe Val Ile Ile Val Glu Asp Asp 210 215 220 Leu Asn Val Ala Pro Asp Phe Phe Glu Tyr Phe Leu Gly Thr His Lys 225 230 235 240 Leu Leu Lys Gln Asp Pro Ser Leu Trp Cys Val Ser Ala Trp Asn Asp 245 250 255 Asn Gly Lys Ala Ala Val Val Asp Ala Ala Gln Pro Glu Leu Leu Tyr 260 265 270 Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Met Leu Thr Lys Asp Leu 275 280 285 Trp Ala Glu Leu Ser Val Lys Trp Pro Lys Ser Phe Trp Asp Asp Trp 290 295 300 Ile Arg His Pro Ala Gln Arg Lys Asp Arg Val Cys Ile Arg Pro Glu 305 310 315 320 Ile Ser Arg Thr Arg Thr Phe Gly Lys Ile Gly Val Ser Asn Gly Leu 325 330 335 Phe Phe Asp Lys Tyr Leu Lys His Ile Lys Leu Ser Glu Asp Phe Val 340 345 350 Gln Phe Thr Lys Ile Asn Met Ser Tyr Leu Leu Lys Asp Asn Tyr Asp 355 360 365 Asn Thr Phe Leu Arg Arg Val Tyr Thr Tyr Pro Ile Val Thr Tyr Asp 370 375 380 Glu Leu Arg Arg Asn Leu Ile Arg Ile Glu Gly Pro Val Arg Ile Gln 385 390 395 400 Tyr Thr Thr Arg Glu Gln Tyr Lys Arg Thr Thr Lys Met Leu Gly Leu 405 410 415 Met Asp Asp Phe Lys Ser Gly Val Pro Arg Thr Ala Tyr His Gly Ile 420 425 430 Val Ser Phe Tyr Tyr Asn Lys Arg Arg Val His Leu Ala Pro Asn Ala 435 440 445 Asn Trp Lys Gly Tyr Glu Leu Ser Trp Ser 450 455 <210> 20 <211> 447 <212> PRT <213> Homo sapiens <400> 20 Met Arg Phe Arg Ile Tyr Lys Arg Lys Val Leu Ile Leu Thr Leu Val 1 5 10 15 Val Ala Ala Cys Gly Phe Val Leu Trp Ser Ser Asn Gly Arg Gln Arg 20 25 30 Lys Asn Glu Ala Leu Ala Pro Pro Leu Leu Asp Ala Glu Pro Ala Arg 35 40 45 Gly Ala Gly Gly Arg Gly Gly Asp His Pro Ser Val Ala Val Gly Ile 50 55 60 Arg Arg Val Ser Asn Val Ser Ala Ala Ser Leu Val Pro Ala Val Pro 65 70 75 80 Gln Pro Glu Ala Asp Asn Leu Thr Leu Arg Tyr Arg Ser Leu Val Tyr 85 90 95 Gln Leu Asn Phe Asp Gln Thr Leu Arg Asn Val Asp Lys Ala Gly Thr 100 105 110 Trp Ala Pro Arg Glu Leu Val Leu Val Val Gln Val His Asn Arg Pro 115 120 125 Glu Tyr Leu Arg Leu Leu Leu Asp Ser Leu Arg Lys Ala Gln Gly Ile 130 135 140 Asp Asn Val Leu Val Ile Phe Ser His Asp Phe Trp Ser Thr Glu Ile 145 150 155 160 Asn Gln Leu Ile Ala Gly Val Asn Phe Cys Pro Val Leu Gln Val Phe 165 170 175 Phe Pro Phe Ser Ile Gln Leu Tyr Pro Asn Glu Phe Pro Gly Ser Asp 180 185 190 Pro Arg Asp Cys Pro Arg Asp Leu Pro Lys Asn Ala Ala Leu Lys Leu 195 200 205 Gly Cys Ile Asn Ala Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu 210 215 220 Ala Lys Phe Ser Gln Thr Lys His His Trp Trp Trp Lys Leu His Phe 225 230 235 240 Val Trp Glu Arg Val Lys Ile Leu Arg Asp Tyr Ala Gly Leu Ile Leu 245 250 255 Phe Leu Glu Glu Asp His Tyr Leu Ala Pro Asp Phe Tyr His Val Phe 260 265 270 Lys Lys Met Trp Lys Leu Lys Gln Gln Glu Cys Pro Glu Cys Asp Val 275 280 285 Leu Ser Leu Gly Thr Tyr Ser Ala Ser Arg Ser Phe Tyr Gly Met Ala 290 295 300 Asp Lys Val Asp Val Lys Thr Trp Lys Ser Thr Glu His Asn Met Gly 305 310 315 320 Leu Ala Leu Thr Arg Asn Ala Tyr Gln Lys Leu Ile Glu Cys Thr Asp 325 330 335 Thr Phe Cys Thr Tyr Asp Asp Tyr Asn Trp Asp Trp Thr Leu Gln Tyr 340 345 350 Leu Thr Val Ser Cys Leu Pro Lys Phe Trp Lys Val Leu Val Pro Gln 355 360 365 Ile Pro Arg Ile Phe His Ala Gly Asp Cys Gly Met His His Lys Lys 370 375 380 Thr Cys Arg Pro Ser Thr Gln Ser Ala Gln Ile Glu Ser Leu Leu Asn 385 390 395 400 Asn Asn Lys Gln Tyr Met Phe Pro Glu Thr Leu Thr Ile Ser Glu Lys 405 410 415 Phe Thr Val Val Ala Ile Ser Pro Pro Arg Lys Asn Gly Gly Trp Gly 420 425 430 Asp Ile Arg Asp His Glu Leu Cys Lys Ser Tyr Arg Arg Leu Gln 435 440 445 <210> 21 <211> 447 <212> PRT <213> Pan troglodytes <400> 21 Met Arg Phe Arg Ile Tyr Lys Arg Lys Val Leu Ile Leu Thr Leu Val 1 5 10 15 Val Ala Ala Cys Gly Phe Val Leu Trp Ser Ser Asn Gly Arg Gln Arg 20 25 30 Lys Asn Glu Ala Leu Ala Pro Pro Leu Leu Asp Ala Glu Pro Ala Arg 35 40 45 Gly Ala Gly Gly Arg Gly Gly Asp His Pro Ser Val Ala Val Gly Ile 50 55 60 Arg Arg Val Ser Asn Val Ser Ala Ala Pro Leu Val Pro Ala Val Pro 65 70 75 80 Gln Pro Glu Ala Asp Asn Leu Thr Leu Arg Tyr Arg Ser Leu Val Tyr 85 90 95 Gln Leu Asn Phe Asp Gln Thr Leu Arg Asn Val Asp Lys Ala Gly Thr 100 105 110 Trp Ala Pro Arg Glu Leu Val Leu Val Val Gln Val His Asn Arg Pro 115 120 125 Glu Tyr Leu Arg Leu Leu Leu Asp Ser Leu Arg Lys Ala Gln Gly Ile 130 135 140 Asp Asn Val Leu Val Ile Phe Ser His Asp Phe Trp Ser Thr Glu Ile 145 150 155 160 Asn Gln Leu Ile Ala Gly Val Asn Phe Cys Pro Val Leu Gln Val Phe 165 170 175 Phe Pro Phe Ser Ile Gln Leu Tyr Pro Asn Glu Phe Pro Gly Ser Asp 180 185 190 Pro Arg Asp Cys Pro Arg Asp Leu Pro Lys Asn Ala Ala Leu Lys Leu 195 200 205 Gly Cys Ile Asn Ala Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu 210 215 220 Ala Lys Phe Ser Gln Thr Lys His His Trp Trp Trp Lys Leu His Phe 225 230 235 240 Val Trp Glu Arg Val Lys Ile Leu Arg Asp Tyr Ala Gly Leu Val Leu 245 250 255 Phe Leu Glu Glu Asp His Tyr Leu Ala Pro Asp Phe Tyr His Val Phe 260 265 270 Lys Lys Met Trp Lys Leu Lys Gln Gln Glu Cys Pro Glu Cys Asp Val 275 280 285 Leu Ser Leu Gly Thr Tyr Ser Ala Ser Arg Ser Phe Tyr Gly Met Ala 290 295 300 Asp Lys Val Asp Val Lys Thr Trp Lys Ser Thr Glu His Asn Met Gly 305 310 315 320 Leu Ala Leu Thr Arg Asn Ala Tyr Gln Lys Leu Ile Glu Cys Thr Asp 325 330 335 Thr Phe Cys Thr Tyr Asp Asp Tyr Asn Trp Asp Trp Thr Leu Gln Tyr 340 345 350 Leu Thr Val Ser Cys Leu Pro Lys Phe Trp Lys Val Leu Val Pro Gln 355 360 365 Val Pro Arg Ile Phe His Ala Gly Asp Cys Gly Met His His Lys Lys 370 375 380 Thr Cys Arg Pro Ser Thr Gln Ser Ala Gln Ile Glu Ser Leu Leu Asn 385 390 395 400 Asn Asn Lys Gln Tyr Met Phe Pro Glu Thr Leu Thr Ile Ser Glu Lys 405 410 415 Phe Thr Val Val Ala Ile Ser Pro Pro Arg Lys Asn Gly Gly Trp Gly 420 425 430 Asp Ile Arg Asp His Glu Leu Cys Lys Ser Tyr Arg Arg Leu Gln 435 440 445 <210> 22 <211> 447 <212> PRT <213> Oryctolagus cuniculus <400> 22 Met Arg Phe Arg Ile Tyr Lys Arg Lys Val Leu Ile Leu Thr Leu Val 1 5 10 15 Val Ala Ala Cys Gly Phe Val Leu Trp Ser Ser Asn Gly Arg Gln Arg 20 25 30 Lys Asn Glu Ala Leu Ala Pro Pro Leu Leu Asp Ala Glu Pro Ala Arg 35 40 45 Ala Ala Gly Gly Arg Gly Gly Asp His Pro Ala Val Ser Val Gly Ile 50 55 60 Arg Arg Val Ser Asn Glu Ser Ala Ala Pro Leu Val Pro Ala Ala Ala 65 70 75 80 Gln Pro Glu Ala Asp Asn Gln Thr Leu Arg Tyr Arg Ser Leu Val Tyr 85 90 95 Gln Leu Asn Phe Asp Gln Thr Leu Arg Asn Val Asp Lys Ala Gly Ser 100 105 110 Trp Ala Pro Arg Glu Leu Val Leu Val Val Gln Val His Asn Arg Leu 115 120 125 Glu Tyr Leu Arg Leu Leu Leu Asp Ser Leu Arg Lys Ala Gln Gly Ile 130 135 140 Glu Asp Val Leu Val Ile Phe Ser His Asp Phe Trp Ser Pro Glu Ile 145 150 155 160 Asn Gln Leu Ile Ala Gly Val Asp Phe Cys Pro Ile Leu Gln Val Phe 165 170 175 Phe Pro Phe Ser Ile Gln Leu Tyr Pro Asn Glu Phe Pro Gly Ser Asp 180 185 190 Pro Arg Asp Cys Pro Arg Asp Leu Gln Lys Asn Ala Ala Leu Lys Leu 195 200 205 Gly Cys Ile Asn Ala Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu 210 215 220 Ala Lys Phe Ser Gln Thr Lys His His Trp Trp Trp Lys Leu His Phe 225 230 235 240 Val Trp Glu Arg Val Lys Val Leu Gln Asp Tyr Ala Gly Leu Ile Leu 245 250 255 Phe Leu Glu Glu Asp His Tyr Leu Ala Pro Asp Phe Tyr His Val Phe 260 265 270 Lys Lys Met Trp Lys Leu Lys Gln Gln Glu Cys Pro Glu Cys Asp Val 275 280 285 Leu Ser Leu Gly Thr Tyr Thr Ala Ser Arg Ser Phe His Gly Ile Ala 290 295 300 His Lys Val Asp Val Lys Thr Trp Lys Ser Thr Glu His Asn Met Gly 305 310 315 320 Leu Ala Leu Thr Arg Asn Ala Tyr Gln Lys Leu Ile Glu Cys Thr Asp 325 330 335 Thr Phe Cys Thr Tyr Asp Asp Tyr Asn Trp Asp Trp Thr Leu Gln Tyr 340 345 350 Leu Thr Val Ser Cys Leu Pro Lys Leu Trp Arg Val Leu Val Pro Gln 355 360 365 Val Pro Arg Val Phe His Ala Gly Asp Cys Gly Met His His Lys Lys 370 375 380 Thr Cys Arg Pro Phe Thr Gln Ser Ala Gln Ile Glu Ser Leu Leu Asn 385 390 395 400 Ser Asn Arg Gln Tyr Met Phe Pro Glu Thr Leu Ile Ile Ser Glu Lys 405 410 415 Ser Pro Val Val Ser Ile Ala Ser Pro Arg Lys Asn Gly Gly Trp Gly 420 425 430 Asp Ile Arg Asp His Glu Leu Cys Lys Ser Tyr Arg Arg Leu Gln 435 440 445 <210> 23 <211> 446 <212> PRT <213> Ailuropoda melanoleuca <400> 23 Met Arg Phe Arg Ile Tyr Lys Arg Lys Val Leu Ile Leu Thr Leu Val 1 5 10 15 Val Ala Ala Cys Gly Phe Val Leu Trp Ser Ser Asn Gly Arg Gln Arg 20 25 30 Lys Asn Glu Ala Leu Ala Pro Pro Leu Leu Asp Ala Glu Pro Ala Arg 35 40 45 Gly Ala Gly Gly Arg Gly Gly Asp His Ser Ala Val Ser Ala Gly Ile 50 55 60 Arg Arg Val Ser Asn Asp Ser Ala Ala Pro Leu Val Pro Ala Ala Pro 65 70 75 80 Gln Pro Glu Ala Asp Asn Leu Thr Leu Arg Tyr Arg Ser Leu Val Tyr 85 90 95 Gln Leu Asn Phe Asp Gln Thr Leu Arg Asn Val Asp Lys Ala Gly Ser 100 105 110 Trp Ala Pro Arg Glu Leu Val Leu Val Val Gln Val His Asn Arg Pro 115 120 125 Asp Tyr Leu Arg Leu Leu Leu Asp Ser Leu Arg Lys Ala Gln Gly Ile 130 135 140 Asp Asn Val Leu Val Ile Phe Ser His Asp Phe Trp Ser Thr Glu Ile 145 150 155 160 Asn Gln Leu Ile Ala Gly Val Asp Phe Cys Pro Val Leu Gln Val Phe 165 170 175 Phe Pro Phe Ser Ile Gln Leu Tyr Pro Asn Glu Phe Pro Gly Ser Asp 180 185 190 Pro Arg Asp Cys Pro Arg Asp Leu Glu Lys Asn Ala Ala Leu Lys Met 195 200 205 Gly Cys Ile Asn Ala Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu 210 215 220 Ala Lys Phe Ser Gln Thr Lys His His Trp Trp Trp Lys Leu His Phe 225 230 235 240 Val Trp Glu Arg Val Lys Val Leu Arg Asp Tyr Ala Gly Leu Ile Leu 245 250 255 Phe Leu Glu Glu Asp His Tyr Leu Ala Pro Asp Phe Tyr His Val Phe 260 265 270 Lys Lys Met Trp Lys Leu Lys Gln Glu Glu Cys Thr Glu Cys Asp Val 275 280 285 Leu Ser Leu Gly Thr Tyr Thr Ala Val Arg Ser Phe His Gly Ile Ala 290 295 300 Asp Lys Val Asp Val Lys Thr Trp Lys Ser Thr Glu His Asn Met Gly 305 310 315 320 Leu Ala Leu Thr Arg Asp Ala Tyr Gln Lys Leu Ile Glu Cys Thr Asp 325 330 335 Thr Phe Cys Thr Tyr Asp Asp Tyr Asn Trp Asp Trp Thr Leu Gln Tyr 340 345 350 Leu Thr Val Ser Cys Leu Pro Lys Phe Trp Lys Val Leu Val Pro Gln 355 360 365 Val Pro Arg Ile Phe His Ala Gly Asp Cys Gly Met His His Lys Lys 370 375 380 Thr Cys Arg Pro Ser Thr Gln Ser Ala Gln Ile Glu Ser Leu Leu Asn 385 390 395 400 Asn Asn Lys Gln Tyr Leu Phe Pro Glu Thr Leu Ile Ile Ser Glu Lys 405 410 415 Phe Val Ala Ala Ile Ser Pro Pro Arg Lys Asn Gly Gly Trp Gly Asp 420 425 430 Ile Arg Asp His Glu Leu Cys Lys Ser Tyr Arg Arg Leu Gln 435 440 445 <210> 24 <211> 446 <212> PRT <213> Canis familiaris <400> 24 Met Arg Phe Arg Ile Tyr Lys Arg Lys Val Leu Ile Leu Thr Leu Val 1 5 10 15 Val Ala Ala Cys Gly Phe Val Leu Trp Ser Ser Asn Gly Arg Gln Arg 20 25 30 Lys Asn Glu Ala Leu Ala Pro Pro Leu Leu Asp Ala Glu Pro Ala Arg 35 40 45 Gly Ala Gly Gly Arg Gly Gly Asp His Ser Ala Val Ser Val Gly Ile 50 55 60 Arg Arg Gly Ser Asn Glu Ser Ala Ala Pro Leu Val Pro Ala Ala Pro 65 70 75 80 Gln Pro Glu Ala Asp Asn Leu Thr Leu Arg Tyr Arg Ser Leu Val Tyr 85 90 95 Gln Leu Asn Phe Asp Gln Thr Leu Arg Asn Val Asp Lys Ala Gly Ser 100 105 110 Trp Ala Pro Arg Glu Leu Val Leu Val Val Gln Val His Asn Arg Pro 115 120 125 Asp Tyr Leu Arg Leu Leu Leu Asp Ser Leu Arg Lys Ala Gln Gly Ile 130 135 140 Asp Asn Val Leu Val Ile Phe Ser His Asp Phe Trp Ser Thr Glu Ile 145 150 155 160 Asn Gln Leu Ile Ala Gly Val Asp Phe Cys Pro Val Leu Gln Val Phe 165 170 175 Phe Pro Phe Ser Ile Gln Leu Tyr Pro Asn Glu Phe Pro Gly Ser Asp 180 185 190 Pro Arg Asp Cys Pro Arg Asp Leu Glu Lys Asn Ala Ala Leu Lys Met 195 200 205 Gly Cys Ile Asn Ala Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu 210 215 220 Ala Lys Phe Ser Gln Thr Lys His His Trp Trp Trp Lys Leu His Phe 225 230 235 240 Val Trp Glu Arg Val Lys Val Leu Arg Asp Tyr Ala Gly Leu Ile Leu 245 250 255 Phe Leu Glu Glu Asp His Tyr Leu Ala Pro Asp Phe Tyr His Val Phe 260 265 270 Lys Lys Met Trp Lys Leu Lys Gln Glu Glu Cys Pro Glu Cys Asp Val 275 280 285 Leu Ser Leu Gly Thr Tyr Thr Ala Ile Arg Ser Phe His Gly Ile Ala 290 295 300 Asp Lys Val Asp Val Lys Thr Trp Lys Ser Thr Glu His Asn Met Gly 305 310 315 320 Leu Ala Leu Thr Arg Asp Ala Tyr Gln Lys Leu Ile Glu Cys Thr Asp 325 330 335 Thr Phe Cys Thr Tyr Asp Asp Tyr Asn Trp Asp Trp Thr Leu Gln Tyr 340 345 350 Leu Thr Val Ser Cys Leu Pro Lys Phe Trp Lys Val Leu Val Pro Gln 355 360 365 Val Pro Arg Ile Phe His Ala Gly Asp Cys Gly Met His His Lys Lys 370 375 380 Thr Cys Lys Pro Ser Thr Gln Ser Ala Gln Ile Glu Ser Leu Leu Asn 385 390 395 400 Ser Asn Lys Gln Tyr Leu Phe Pro Glu Thr Leu Ile Ile Ser Glu Lys 405 410 415 Phe Val Ala Ala Ile Ser Pro Pro Arg Lys Asn Gly Gly Trp Gly Asp 420 425 430 Ile Arg Asp His Glu Leu Cys Lys Ser Tyr Arg Arg Leu Gln 435 440 445 <210> 25 <211> 446 <212> PRT <213> Sus scrofa <400> 25 Met Arg Phe Arg Ile Tyr Lys Arg Lys Val Leu Ile Leu Thr Phe Val 1 5 10 15 Val Ala Ala Cys Gly Phe Val Leu Trp Ser Ser Asn Gly Arg Gln Arg 20 25 30 Lys Asn Glu Ala Leu Ala Pro Pro Leu Leu Asp Ala Glu Pro Val Arg 35 40 45 Gly Ala Gly Ala Arg Ala Gly Asp His Pro Ala Ile Ser Val Gly Ile 50 55 60 Arg Arg Gly Ser Asn Asp Ser Ala Ala Pro Leu Val Ala Ala Ala Pro 65 70 75 80 Gln Pro Glu Val Asp Asn Leu Thr Leu Arg Tyr Arg Ser Leu Val Tyr 85 90 95 Gln Leu Asn Phe Asp Gln Thr Leu Arg Asn Val Asp Lys Val Ser Ser 100 105 110 Trp Val Pro Arg Glu Leu Val Leu Val Val Gln Val His Asn Arg Ala 115 120 125 Glu Tyr Leu Lys Leu Leu Leu Asp Ser Leu Arg Lys Ala Gln Gly Ile 130 135 140 Asp Asn Val Leu Val Ile Phe Ser His Asp Phe Trp Ser Thr Glu Ile 145 150 155 160 Asn Gln Leu Ile Ala Gly Val Asp Phe Cys Pro Val Leu Gln Val Phe 165 170 175 Phe Pro Phe Ser Ile Gln Leu Tyr Pro Asn Glu Phe Pro Gly Thr Asp 180 185 190 Pro Arg Asp Cys Pro Arg Asp Leu Glu Lys Asn Ala Ala Leu Lys Met 195 200 205 Gly Cys Ile Asn Ala Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu 210 215 220 Ala Lys Phe Ser Gln Thr Lys His His Trp Trp Trp Lys Leu His Phe 225 230 235 240 Val Trp Glu Arg Val Lys Val Leu Arg Asp Tyr Ala Gly Leu Ile Leu 245 250 255 Phe Leu Glu Glu Asp His Tyr Val Ala Pro Asp Phe Tyr His Val Phe 260 265 270 Lys Lys Met Trp Asn Leu Lys Gln Gln Glu Cys Pro Glu Cys Asp Val 275 280 285 Leu Ser Leu Gly Thr Tyr Thr Thr Val Arg Ser Phe Arg Asp Val Ala 290 295 300 Asp Lys Val Asp Val Lys Thr Trp Lys Ser Thr Glu His Asn Met Gly 305 310 315 320 Leu Ala Leu Thr Arg Asp Ala Tyr Gln Lys Leu Ile Glu Cys Thr Asp 325 330 335 Thr Phe Cys Thr Tyr Asp Asp Tyr Asn Trp Asp Trp Thr Leu Gln Tyr 340 345 350 Leu Thr Val Ser Cys Leu Pro Lys Phe Trp Lys Val Leu Val Pro Gln 355 360 365 Val Pro Arg Ile Phe His Ala Gly Asp Cys Gly Met His His Lys Lys 370 375 380 Thr Cys Arg Pro Ser Thr Gln Ser Ala Gln Ile Glu Ser Leu Leu Asn 385 390 395 400 Ser Asn Lys Gln Tyr Met Phe Pro Glu Thr Leu Thr Ile Ser Glu Lys 405 410 415 Leu Thr Ala Ala Leu Ser Pro Pro Arg Lys Asn Gly Gly Trp Gly Asp 420 425 430 Ile Arg Asp His Glu Leu Cys Lys Ser Tyr Arg Arg Leu Gln 435 440 445 <210> 26 <211> 446 <212> PRT <213> Bos taurus <400> 26 Met Arg Phe Arg Ile Tyr Lys Arg Lys Val Leu Ile Leu Met Leu Val 1 5 10 15 Val Ala Ala Cys Gly Phe Val Leu Trp Ser Ser Asn Gly Arg Gln Arg 20 25 30 Lys Asn Glu Ala Leu Ala Pro Pro Leu Leu Asp Ala Asp Pro Val Arg 35 40 45 Gly Ala Gly Ala Arg Ala Gly Asp His Pro Ala Val Ser Val Gly Ile 50 55 60 Arg Arg Gly Ser Asn Glu Ser Ala Ala Pro Leu Val Ala Ala Ala Pro 65 70 75 80 Gln Pro Glu Val Asp Asn Leu Thr Leu Arg Tyr Arg Ser Leu Val Tyr 85 90 95 Gln Leu Asn Phe Asp Gln Thr Leu Arg Asn Val Asp Lys Ala Ala Ser 100 105 110 Trp Thr Pro Arg Glu Leu Ala Leu Val Val Gln Val His Asn Arg Pro 115 120 125 Glu Tyr Leu Lys Leu Leu Leu Asp Ser Leu Arg Lys Ala Gln Gly Ile 130 135 140 Asp Asp Val Leu Val Ile Phe Ser His Asp Phe Trp Ser Thr Glu Ile 145 150 155 160 Asn Gln Leu Ile Ala Gly Val Asp Phe Cys Pro Val Leu Gln Val Phe 165 170 175 Phe Pro Phe Ser Ile Gln Leu Tyr Pro Asn Glu Phe Pro Gly Thr Asp 180 185 190 Pro Arg Asp Cys Pro Arg Asp Met Glu Lys Asn Ala Ala Leu Arg Met 195 200 205 Gly Cys Ile Asn Ala Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu 210 215 220 Ala Lys Phe Ser Gln Thr Lys His His Trp Trp Trp Lys Leu His Phe 225 230 235 240 Val Trp Glu Arg Val Lys Val Leu Arg Asp Tyr Ala Gly Leu Ile Leu 245 250 255 Phe Leu Glu Glu Asp His Tyr Leu Ala Pro Asp Phe Tyr His Val Phe 260 265 270 Lys Lys Met Trp Lys Leu Lys Gln Leu Glu Cys Pro Glu Cys Asp Val 275 280 285 Leu Ser Leu Gly Thr Tyr Thr Ala Ile Arg Asn Phe Tyr Asp Val Ala 290 295 300 Asp Lys Val Asp Val Lys Thr Trp Lys Ser Thr Glu His Asn Met Gly 305 310 315 320 Leu Ala Leu Thr Arg Glu Ala Tyr Gln Lys Leu Ile Glu Cys Thr Asp 325 330 335 Thr Phe Cys Thr Tyr Asp Asp Tyr Asn Trp Asp Trp Thr Leu Gln Tyr 340 345 350 Leu Thr Val Ser Cys Leu Pro Lys Phe Trp Lys Val Leu Val Pro Gln 355 360 365 Val Pro Arg Ile Phe His Ala Gly Asp Cys Gly Met His His Gln Lys 370 375 380 Thr Cys Arg Pro Ala Thr Gln Ser Ala Gln Leu Glu Ser Leu Leu Asn 385 390 395 400 Asn Asn Lys Gln Tyr Leu Phe Pro Glu Thr Leu Thr Ile Ser Glu Lys 405 410 415 Phe Met Thr Ser Leu Ser Pro Pro Arg Lys Asn Gly Gly Trp Gly Asp 420 425 430 Ile Arg Asp His Glu Leu Cys Lys Ser Tyr Arg Arg Leu Gln 435 440 445 <210> 27 <211> 442 <212> PRT <213> Rattus norvegicus <400> 27 Met Arg Phe Arg Ile Tyr Lys Arg Lys Val Leu Ile Leu Thr Leu Val 1 5 10 15 Val Ala Ala Cys Gly Phe Val Leu Trp Ser Ser Asn Gly Arg Gln Arg 20 25 30 Lys Asn Asp Ala Leu Ala Pro Pro Leu Leu Asp Ser Glu Pro Leu Arg 35 40 45 Gly Ala Gly His Phe Ala Ala Ser Val Gly Ile Arg Arg Val Ser Asn 50 55 60 Asp Ser Ala Ala Pro Leu Val Pro Ala Val Pro Arg Pro Glu Val Asp 65 70 75 80 Asn Leu Thr Leu Arg Tyr Arg Ser Leu Val Tyr Gln Leu Asn Phe Asp 85 90 95 Gln Met Leu Arg Asn Val Asp Lys Asp Gly Thr Trp Ser Pro Gly Glu 100 105 110 Leu Val Leu Val Val Gln Val His Asn Arg Pro Glu Tyr Leu Arg Leu 115 120 125 Leu Ile Asp Ser Leu Arg Lys Ala Gln Gly Ile Arg Glu Val Leu Val 130 135 140 Ile Phe Ser His Asp Phe Trp Ser Ala Glu Ile Asn Ser Leu Ile Ser 145 150 155 160 Ser Val Asp Phe Cys Pro Val Leu Gln Val Phe Phe Pro Phe Ser Ile 165 170 175 Gln Leu Tyr Pro Ser Glu Phe Pro Gly Ser Asp Pro Arg Asp Cys Pro 180 185 190 Arg Asp Leu Lys Lys Asn Ala Ala Leu Lys Leu Gly Cys Ile Asn Ala 195 200 205 Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu Ala Lys Phe Ser Gln 210 215 220 Thr Lys His His Trp Trp Trp Lys Leu His Phe Val Trp Glu Arg Val 225 230 235 240 Lys Val Leu Gln Asp Tyr Thr Gly Leu Ile Leu Phe Leu Glu Glu Asp 245 250 255 His Tyr Leu Ala Pro Asp Phe Tyr His Val Phe Lys Lys Met Trp Lys 260 265 270 Leu Lys Gln Gln Glu Cys Pro Gly Cys Asp Val Leu Ser Leu Gly Thr 275 280 285 Tyr Thr Thr Ile Arg Ser Phe Tyr Gly Ile Ala Asp Lys Val Asp Val 290 295 300 Lys Thr Trp Lys Ser Thr Glu His Asn Met Gly Leu Ala Leu Thr Arg 305 310 315 320 Asp Ala Tyr Gln Lys Leu Ile Glu Cys Thr Asp Thr Phe Cys Thr Tyr 325 330 335 Asp Asp Tyr Asn Trp Asp Trp Thr Leu Gln Tyr Leu Thr Leu Ala Cys 340 345 350 Leu Pro Lys Val Trp Lys Val Leu Val Pro Gln Ala Pro Arg Ile Phe 355 360 365 His Ala Gly Asp Cys Gly Met His His Lys Lys Thr Cys Arg Pro Ser 370 375 380 Thr Gln Ser Ala Gln Ile Glu Ser Leu Leu Asn Asn Asn Lys Gln Tyr 385 390 395 400 Leu Phe Pro Glu Thr Leu Val Ile Gly Glu Lys Phe Pro Met Ala Ala 405 410 415 Ile Ser Pro Pro Arg Lys Asn Gly Gly Trp Gly Asp Ile Arg Asp His 420 425 430 Glu Leu Cys Lys Ser Tyr Arg Arg Leu Gln 435 440 <210> 28 <211> 442 <212> PRT <213> Mus musculus <400> 28 Met Arg Phe Arg Ile Tyr Lys Arg Lys Val Leu Ile Leu Thr Leu Val 1 5 10 15 Val Ala Ala Cys Gly Phe Val Leu Trp Ser Ser Asn Gly Arg Gln Arg 20 25 30 Lys Ser Asp Ala Leu Gly Pro Pro Leu Leu Asp Ala Glu Pro Val Arg 35 40 45 Gly Ala Gly His Leu Ala Val Ser Val Gly Ile Arg Arg Val Ser Asn 50 55 60 Glu Ser Ala Ala Pro Leu Val Pro Ala Val Pro Arg Pro Glu Val Asp 65 70 75 80 Asn Leu Thr Leu Arg Tyr Arg Ser Leu Val Tyr Gln Leu Asn Phe Asp 85 90 95 Gln Met Leu Arg Asn Val Gly Asn Asp Gly Thr Trp Ser Pro Gly Glu 100 105 110 Leu Val Leu Val Val Gln Val His Asn Arg Pro Glu Tyr Leu Arg Leu 115 120 125 Leu Ile Asp Ser Leu Arg Lys Ala Gln Gly Ile Gln Glu Val Leu Val 130 135 140 Ile Phe Ser His Asp Phe Trp Ser Ala Glu Ile Asn Ser Leu Ile Ser 145 150 155 160 Arg Val Asp Phe Cys Pro Val Leu Gln Val Phe Phe Pro Phe Ser Ile 165 170 175 Gln Leu Tyr Pro Asn Glu Phe Pro Gly Ser Asp Pro Arg Asp Cys Pro 180 185 190 Arg Asp Leu Lys Lys Asn Ala Ala Leu Lys Leu Gly Cys Ile Asn Ala 195 200 205 Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu Ala Lys Phe Ser Gln 210 215 220 Thr Lys His His Trp Trp Trp Lys Leu His Phe Val Trp Glu Arg Val 225 230 235 240 Lys Val Leu Gln Asp Tyr Thr Gly Leu Ile Leu Phe Leu Glu Glu Asp 245 250 255 His Tyr Leu Ala Pro Asp Phe Tyr His Val Phe Lys Lys Met Trp Lys 260 265 270 Leu Lys Gln Gln Glu Cys Pro Gly Cys Asp Val Leu Ser Leu Gly Thr 275 280 285 Tyr Thr Thr Ile Arg Ser Phe Tyr Gly Ile Ala Asp Lys Val Asp Val 290 295 300 Lys Thr Trp Lys Ser Thr Glu His Asn Met Gly Leu Ala Leu Thr Arg 305 310 315 320 Asp Ala Tyr Gln Lys Leu Ile Glu Cys Thr Asp Thr Phe Cys Thr Tyr 325 330 335 Asp Asp Tyr Asn Trp Asp Trp Thr Leu Gln Tyr Leu Thr Leu Ala Cys 340 345 350 Leu Pro Lys Ile Trp Lys Val Leu Val Pro Gln Ala Pro Arg Ile Phe 355 360 365 His Ala Gly Asp Cys Gly Met His His Lys Lys Thr Cys Arg Pro Ser 370 375 380 Thr Gln Ser Ala Gln Ile Glu Ser Leu Leu Asn Ser Asn Lys Gln Tyr 385 390 395 400 Leu Phe Pro Glu Thr Leu Val Ile Gly Glu Lys Phe Pro Met Ala Ala 405 410 415 Ile Ser Pro Pro Arg Lys Asn Gly Gly Trp Gly Asp Ile Arg Asp His 420 425 430 Glu Leu Cys Lys Ser Tyr Arg Arg Leu Gln 435 440 <210> 29 <211> 444 <212> PRT <213> Monodelphis domestica <400> 29 Met Arg Phe Arg Ile Tyr Lys Arg Lys Val Leu Ile Leu Thr Leu Val 1 5 10 15 Val Ala Ala Cys Gly Phe Val Phe Trp Asn Ser Asn Gly Arg Gln Arg 20 25 30 Lys Asn Glu Ala Phe Ala Gly Ser Val Pro Ala Pro Val Arg Ala Val 35 40 45 Gly Pro Gly Asp Leu Arg Arg Phe Pro Asn Gly Ser Ala Ala Pro Pro 50 55 60 Pro Glu Val Asp Asn Met Thr Leu Val Tyr Arg Ser Leu Val Tyr Gln 65 70 75 80 Val Asn Phe Asp Gln Thr Leu Lys Asn Ala Leu Ala Ala Ala Ala Val 85 90 95 Gly Ala Gly Gly Ala Gly Gly Gly Gly Gly Gly Pro Ala Gln Leu Glu 100 105 110 Leu Glu Leu Val Leu Val Val Gln Val His Asn Arg Pro Asp Tyr Leu 115 120 125 Lys Leu Leu Leu Asp Ser Leu Arg Lys Val Gln Gly Ile Gly Asn Leu 130 135 140 Leu Val Ile Phe Ser His Asp Phe Trp Ser Ala Glu Ile Asn Gln Leu 145 150 155 160 Ile Ala Gly Val Asp Phe Cys Pro Val Leu Gln Val Phe Phe Pro Phe 165 170 175 Ser Ile Gln Leu Tyr Pro Asn Glu Phe Pro Gly Asn Asp Pro Lys Asp 180 185 190 Cys Pro Arg Asp Leu Gln Lys Lys Ala Ala Leu Lys Met Gly Cys Ile 195 200 205 Asn Ala Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu Ala Lys Phe 210 215 220 Ser Gln Thr Lys His His Trp Trp Trp Lys Leu His Phe Ala Trp Glu 225 230 235 240 Arg Val Lys Ile Leu Arg Asn Tyr Ala Gly Leu Met Val Phe Leu Glu 245 250 255 Glu Asp His Tyr Leu Ala Pro Asp Phe Phe His Val Leu Lys Lys Met 260 265 270 Trp Lys Leu Lys Leu Gln Glu Cys Pro Asp Cys Asp Val Leu Ser Leu 275 280 285 Gly Ser Tyr Ala Val Ser Arg Ser Phe Phe Gly Lys Ala Asp Lys Val 290 295 300 Glu Val Lys Thr Trp Lys Ser Thr Glu His Asn Met Gly Leu Ala Leu 305 310 315 320 Thr Arg Asp Thr Tyr Gln Lys Leu Ile Glu Cys Thr Asp Thr Phe Cys 325 330 335 Thr Tyr Asp Asp Tyr Asn Trp Asp Trp Thr Leu Gln Tyr Leu Thr Thr 340 345 350 Thr Cys Leu Lys Asn Phe Trp Lys Val Met Val Pro Glu Val Pro Arg 355 360 365 Ile Tyr His Ala Gly Asp Cys Gly Met His His Lys Asp Pro Cys Arg 370 375 380 Pro Ser Thr Gln Ser Ala Gln Ile Glu Leu Leu Leu Asn Lys Asn Lys 385 390 395 400 Gln Tyr Leu Phe Pro Lys Thr Leu Ser Ile Ser Lys Lys Tyr Ser Met 405 410 415 Val Pro Leu Leu Pro His Gly Lys Asn Gly Gly Trp Gly Asp Ile Arg 420 425 430 Asp His Glu Leu Cys Lys Ser Tyr Arg Arg Leu Gln 435 440 <210> 30 <211> 432 <212> PRT <213> Xenopus laevis <400> 30 Met Arg Cys Arg Ile Tyr Lys Arg Lys Val Ile Ile Leu Thr Leu Val 1 5 10 15 Val Val Ala Cys Gly Leu Ala Leu Trp Ser Ser Gly Arg Gln Lys Lys 20 25 30 Asn Gly Phe Val Pro Glu Val Glu Ser Asp Arg Phe Gln Asn Lys Gly 35 40 45 His Ile Ser Pro Ala Ala Arg Lys Val Ser Asn Glu Ser Leu Ala Asn 50 55 60 Lys Glu Gln Lys Thr Arg Val Asp Asn Met Thr Leu Val Tyr Arg Ser 65 70 75 80 Val Val Phe Gln Trp Asn Phe Asp Gln Ala Ile Arg Asn Val Asp Lys 85 90 95 Ile Asn Arg Pro Gln Asp Asp Val Val Val Val Val Gln Val His Asn 100 105 110 Arg Pro Glu Phe Leu Arg Arg Leu Leu Asp Ser Leu Gly Lys Ala Lys 115 120 125 Gly Ile Glu Asn Val Leu Leu Val Phe Ser His Asp Tyr Trp Ser Pro 130 135 140 Glu Ile Asn Gln Ile Ile Ala Ser Val Asp Phe Cys Gln Val Leu Gln 145 150 155 160 Ile Phe Phe Pro Phe Ser Ile Gln Leu Tyr Pro Asn Glu Phe Pro Gly 165 170 175 His Asp Pro Lys Asp Cys Pro Arg Asp Ile Lys Lys Lys Asp Ala Val 180 185 190 Glu Leu Gly Cys Ile Asn Ala Glu Tyr Pro Asp Ser Phe Gly His Tyr 195 200 205 Arg Glu Ala Lys Phe Ser Gln Thr Lys His His Trp Trp Trp Lys Leu 210 215 220 Gln Phe Val Trp Asp Lys Leu Lys Val Leu Lys Glu His Asn Gly Leu 225 230 235 240 Val Leu Phe Ile Glu Glu Asp His Tyr Leu Ser Pro Asp Phe Tyr Tyr 245 250 255 Thr Leu Lys Lys Met Trp Ser Lys Lys Asn Glu Glu Cys Pro Asp Cys 260 265 270 Asp Met Leu Cys Leu Gly Thr Tyr Ala His Thr Pro Phe Ala Asp Lys 275 280 285 Ala Gly Lys Val Glu Val Lys Thr Trp Lys Ser Thr Glu His Asn Met 290 295 300 Gly Met Ala Met Asn Arg Glu Thr Tyr Lys Lys Leu Val Ala Cys Ser 305 310 315 320 Glu Thr Phe Cys Thr Tyr Asp Asp Tyr Asn Trp Asp Trp Thr Leu Gln 325 330 335 Tyr Leu Thr Val Asn Cys Leu Pro Lys Phe Trp Lys Val Met Val Pro 340 345 350 Glu Val Pro Arg Ile Tyr His Ile Gly Asp Cys Gly Met His His Asn 355 360 365 Lys Pro Cys Arg Pro Thr Thr Glu Ser Ala Lys Leu Glu Ala Leu Phe 370 375 380 Thr Ser Asn Gln Arg Asp Leu Phe Pro Glu Lys Ile Asp Ile Ser Arg 385 390 395 400 Arg Tyr Thr Met Ala Ala Leu Ser Pro His Val Lys Asn Gly Gly Trp 405 410 415 Gly Asp Ile Arg Asp His Glu Leu Cys Lys Ser Tyr His Arg Leu Gln 420 425 430 <210> 31 <211> 450 <212> PRT <213> Danio rerio <400> 31 Met Arg Phe Arg Ile Tyr Lys Arg Lys Val Val Ile Leu Thr Leu Val 1 5 10 15 Val Ile Ile Cys Gly Phe Ala Val Trp Asn Ser Gly Lys Pro Lys Lys 20 25 30 Ala Ser Thr Val Phe Pro Lys Glu Val Glu Thr Val Lys Arg Ser Ser 35 40 45 Val Gly Ser Gln Ile Gln Ala Thr Ile Pro Val Thr Arg Lys Pro Ile 50 55 60 Asn Glu Ser Ile Pro Glu Lys Gln Gln Gln Gln Gln Pro Val Ala Lys 65 70 75 80 Ser Glu Ala Asp Asn Thr Thr Leu Val Tyr Arg Gly Ile Val Phe Gln 85 90 95 Leu Asn Phe Asp Gln Asn Leu Lys Asn Glu Glu Lys Phe Arg Ala Val 100 105 110 Arg Gln Lys Asp Asp Leu Val Ile Val Val Gln Val His Asn Arg Pro 115 120 125 Glu Tyr Leu Arg Leu Leu Val Asp Ser Leu Arg Lys Ser Lys Gly Ile 130 135 140 Glu Asn Ile Leu Leu Ile Phe Ser His Asp Phe Trp Ser Pro Glu Ile 145 150 155 160 Asn Gln Ile Val Ala Ser Val Asp Phe Cys Leu Val Leu Gln Ile Phe 165 170 175 Phe Pro Phe Ser Ile Gln Leu Tyr Pro Gln Glu Phe Pro Gly Asn Asp 180 185 190 Pro Arg Asp Cys Pro Arg Asp Ile Pro Lys Lys Glu Ala Leu Thr Leu 195 200 205 Gly Cys Ile Asn Ala Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu 210 215 220 Ala Lys Phe Ser Gln Thr Lys His His Trp Trp Trp Lys Leu His Phe 225 230 235 240 Val Trp Asp Arg Val Arg Val Leu Lys Asp His Lys Gly Leu Val Leu 245 250 255 Leu Ile Glu Glu Asp His Tyr Leu Ala Pro Asp Phe Tyr His Leu Leu 260 265 270 Lys Leu Met Ala Ser Leu Lys Lys Glu Gln Cys Pro Asp Cys Asp Ile 275 280 285 Leu Ser Leu Gly Ser Tyr Gly His Ile Gly Tyr Ser Ser Lys Ala Asn 290 295 300 Lys Val Glu Val Lys Ala Trp Lys Ser Thr Glu His Asn Met Gly Met 305 310 315 320 Ala Leu Asn Arg Asp Ala Tyr Gln Lys Leu Leu Arg Cys Thr Asp Ala 325 330 335 Phe Cys Thr Tyr Asp Asp Tyr Asn Trp Asp Trp Ser Leu Gln His Leu 340 345 350 Thr Val Thr Cys Leu Pro Ala Phe Leu Lys Val Met Val Ser Glu Ala 355 360 365 Pro Arg Ile Phe His Ala Gly Asp Cys Gly Met His His Lys Lys Ser 370 375 380 Ala Cys Met Pro Ser Gly Gln Lys Thr Lys Ile Glu Asn Val Leu Gln 385 390 395 400 Asn Ser Gly Asn Gln Leu Phe Pro Lys Gln Leu Leu Ile Thr Lys Arg 405 410 415 Leu Pro Ala Ser Gly Ala Lys Gly Val Ala Pro His Val Lys Asn Gly 420 425 430 Gly Trp Gly Asp Ile Arg Asp His Glu Leu Cys Lys Ser Tyr Leu Arg 435 440 445 Leu Gln 450 <210> 32 <211> 465 <212> PRT <213> Salmo salar <400> 32 Met Arg Phe Arg Val Tyr Lys Arg Lys Val Val Ile Leu Thr Leu Val 1 5 10 15 Val Val Val Cys Gly Leu Ala Phe Trp Thr Ser Gly Lys Gln Lys Lys 20 25 30 Ser Ser Gly Val Val Val Leu Lys Glu Ala Glu Gly Ala Arg Arg Ser 35 40 45 Ser Ser Ser Gln Val Gln Pro Gln Pro Gln Ala Thr Pro Glu Val Ser 50 55 60 Arg Ile Pro Asn Val Pro Pro Ile Ala Pro Val Asn Glu Thr His Pro 65 70 75 80 Lys Asn Gln Pro Glu Lys His Leu Glu Lys Glu Glu Val Val Lys Pro 85 90 95 Glu Val Asp Asn Thr Thr Gln Val Tyr Arg Gly Ile Val Phe Gln Leu 100 105 110 Asn Phe Asp Gln Thr Val Arg His Glu Glu Lys Phe Arg Ala Ala Arg 115 120 125 Lys Lys Asp Asp Leu Val Val Val Val Gln Val His Asn Arg Pro Asp 130 135 140 Tyr Leu Arg Leu Leu Val Glu Ser Leu Arg Lys Ala Arg Gly Val Glu 145 150 155 160 Ser Ile Leu Leu Ile Phe Ser His Asp Phe Trp Ser Pro Glu Ile Asn 165 170 175 Gln Val Val Ala Ser Val Asp Phe Cys Gln Val Leu Gln Ile Phe Phe 180 185 190 Pro Phe Ser Ile Gln Leu Tyr Pro Gln Glu Phe Pro Gly His Asp Pro 195 200 205 Arg Asp Cys Pro Arg Asp Ile Ser Lys Ile Asp Ala Leu Lys Leu Gly 210 215 220 Cys Ile Asn Ala Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu Ala 225 230 235 240 Lys Phe Ser Gln Thr Lys His His Trp Trp Trp Lys Leu His Phe Val 245 250 255 Trp Asp Arg Val Arg Ala Leu Lys Asp His Arg Gly Leu Val Leu Leu 260 265 270 Ile Glu Glu Asp His Phe Leu Ser Pro Asp Phe Leu His Phe Leu Lys 275 280 285 Leu Met Ser Ile Leu Lys Arg Glu Asn Cys Pro Asp Cys Asp Ile Leu 290 295 300 Ser Leu Gly Ser Tyr Gly His Ile Ser Tyr Pro Ser Lys Ala Asn Lys 305 310 315 320 Val Glu Val Lys Ala Trp Lys Ser Thr Glu His Asn Met Gly Met Ala 325 330 335 Leu Ser Arg Glu Thr Tyr Gln Lys Leu Ile Gln Cys Thr Asp Ala Phe 340 345 350 Cys Thr Tyr Asp Asp Tyr Asn Trp Asp Trp Ser Leu Gln His Leu Thr 355 360 365 Val Thr Cys Leu Pro Ser Tyr Trp Lys Val Met Val Ser Glu Ala Pro 370 375 380 Arg Val Phe His Ala Gly Asp Cys Gly Met His His Lys Lys Ser Val 385 390 395 400 Cys Met Pro Ser Ser Gln Lys Ser Lys Ile Asp Thr Ile Leu Gln Ser 405 410 415 Ser Ser Asn Gln Leu Phe Pro Lys Asn Leu Leu Ile Thr Lys Arg Leu 420 425 430 Pro Ala Asn Gly Ala Gly Gly Val Ala Pro His Val Lys Asn Gly Gly 435 440 445 Trp Gly Asp Ile Arg Asp His Glu Leu Cys Lys Ser Tyr Pro Arg Leu 450 455 460 Gln 465 <210> 33 <211> 471 <212> PRT <213> Drosophila melanogaster <400> 33 Met Gly Arg Lys Arg Asn Asn Phe Tyr Met Arg Ser Leu Phe Leu Leu 1 5 10 15 Ala Leu Gly Ile Phe Gly Leu Leu Gln Tyr Asn Asn Phe Asn Tyr Leu 20 25 30 Asp Ser Arg Asp Asn Val Leu Gly Asp Ala Val Thr Asn Asp Ser Asp 35 40 45 Asp Ala Ile Leu Ala Met Val Pro Ala Thr Leu His Lys Tyr Leu Thr 50 55 60 Pro His Ser Arg Asn His Ser Ala Ser Gly Ala Gly Ala Leu Asn Gly 65 70 75 80 Ala Ala Leu Leu Leu Asn Ala Ser Ser Pro Gly Ala Ala Thr Ala Ser 85 90 95 Thr Ile Ser Phe Asp Val Tyr His Pro Pro Asn Ile Thr Glu Ile Lys 100 105 110 Arg Gln Ile Val Arg Tyr Asn Asp Met Gln Met Val Leu Asn Glu Asp 115 120 125 Val Phe Gly Pro Leu Gln Asn Asp Ser Val Ile Ile Val Val Gln Val 130 135 140 His Thr Arg Ile Thr Tyr Leu Arg His Leu Ile Val Ser Leu Ala Gln 145 150 155 160 Ala Arg Asp Ile Ser Lys Val Leu Leu Val Phe Ser His Asp Tyr Tyr 165 170 175 Asp Asp Asp Ile Asn Asp Leu Val Gln Gln Ile Asp Phe Cys Lys Val 180 185 190 Met Gln Ile Phe Tyr Pro Tyr Ser Ile Gln Thr His Pro Asn Glu Tyr 195 200 205 Pro Gly Val Asp Pro Asn Asp Cys Pro Arg Asn Ile Lys Lys Glu Gln 210 215 220 Ala Leu Ile Thr Asn Cys Asn Asn Ala Met Tyr Pro Asp Leu Tyr Gly 225 230 235 240 His Tyr Arg Glu Ala Lys Phe Thr Gln Thr Lys His His Trp Ile Trp 245 250 255 Lys Ala Asn Arg Val Phe Asn Glu Leu Glu Val Thr Arg Tyr His Thr 260 265 270 Gly Leu Val Leu Phe Leu Glu Glu Asp His Tyr Val Ala Glu Asp Phe 275 280 285 Leu Tyr Leu Leu Ala Met Met Gln Gln Arg Thr Lys Asp Leu Cys Pro 290 295 300 Gln Cys Asn Val Leu Ser Leu Gly Thr Tyr Leu Lys Thr Phe Asn Tyr 305 310 315 320 Tyr Thr Tyr His Ser Lys Val Glu Val Met Pro Trp Val Ser Ser Lys 325 330 335 His Asn Met Gly Phe Ala Phe Asn Arg Thr Thr Trp Ser Asn Ile Arg 340 345 350 Lys Cys Ala Arg His Phe Cys Thr Tyr Asp Asp Tyr Asn Trp Asp Trp 355 360 365 Ser Leu Gln His Val Ser Gln Gln Cys Leu Arg Arg Lys Leu His Ala 370 375 380 Met Ile Val Lys Gly Pro Arg Val Phe His Ile Gly Glu Cys Gly Val 385 390 395 400 His His Lys Asn Lys Asn Cys Glu Ser Asn Gln Val Ile Ser Lys Val 405 410 415 Gln His Val Leu Arg Ile Ala Arg Asn Ser His Gln Leu Phe Pro Arg 420 425 430 Ser Leu Thr Leu Thr Val Pro Ser Leu Met Lys Lys Ser Lys Leu Arg 435 440 445 Lys Gly Asn Gly Gly Trp Gly Asp Met Arg Asp His Glu Leu Cys Leu 450 455 460 Asn Met Thr Leu Ala Thr Arg 465 470 <210> 34 <211> 54 <212> PRT <213> Homo sapiens <400> 34 Thr Arg Pro Ala Pro Gly Arg Pro Pro Ser Val Ser Ala Leu Asp Gly 1 5 10 15 Asp Pro Ala Ser Leu Thr Arg Glu Val Ile Arg Leu Ala Gln Asp Ala 20 25 30 Glu Val Glu Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Gly Asp 35 40 45 Ala Leu Ser Ser Gln Arg 50 <210> 35 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Synthesized Construct <400> 35 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 15 <210> 36 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthesized Construct <400> 36 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 <210> 37 <211> 21 <212> PRT <213> Trichoderma reesei <400> 37 Ser Ser Ala Ala Thr Ala Thr Ala Ser Ala Thr Val Pro Gly Gly Gly 1 5 10 15 Ser Gly Pro Thr Ser 20 <210> 38 <211> 19 <212> PRT <213> Trichoderma reesei <400> 38 Ser Thr Gly Asn Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro 1 5 10 15 Gly Ser Thr <210> 39 <211> 10 <212> PRT <213> Trichoderma reesei <400> 39 Met Ala Ser Thr Asn Ala Arg Tyr Val Arg 1 5 10 <210> 40 <211> 17 <212> PRT <213> Trichoderma reesei <400> 40 Tyr Leu Leu Ile Ala Phe Phe Thr Ile Leu Val Phe Tyr Phe Val Ser 1 5 10 15 Asn <210> 41 <211> 379 <212> PRT <213> Trichoderma reesei <400> 41 Ser Lys Tyr Glu Gly Val Asp Leu Asn Lys Gly Thr Phe Thr Ala Pro 1 5 10 15 Asp Ser Thr Lys Thr Thr Pro Lys Pro Pro Ala Thr Gly Asp Ala Lys 20 25 30 Asp Phe Pro Leu Ala Leu Thr Pro Asn Asp Pro Gly Phe Asn Asp Leu 35 40 45 Val Gly Ile Ala Pro Gly Pro Arg Met Asn Ala Thr Phe Val Thr Leu 50 55 60 Ala Arg Asn Ser Asp Val Trp Asp Ile Ala Arg Ser Ile Arg Gln Val 65 70 75 80 Glu Asp Arg Phe Asn Arg Arg Tyr Asn Tyr Asp Trp Val Phe Leu Asn 85 90 95 Asp Lys Pro Phe Asp Asn Thr Phe Lys Lys Val Thr Thr Ser Leu Val 100 105 110 Ser Gly Lys Thr His Tyr Gly Glu Ile Ala Pro Glu His Trp Ser Phe 115 120 125 Pro Asp Trp Ile Asp Gln Asp Lys Ala Lys Lys Val Arg Glu Asp Met 130 135 140 Ala Glu Arg Lys Ile Ile Tyr Gly Asp Ser Val Ser Tyr Arg His Met 145 150 155 160 Cys Arg Phe Glu Ser Gly Phe Phe Phe Arg Gln Pro Leu Met Met Asn 165 170 175 Tyr Glu Tyr Tyr Trp Arg Val Glu Pro Ser Ile Glu Leu Tyr Cys Asp 180 185 190 Ile His Tyr Asp Pro Phe Arg Leu Met Val Glu Gln Gly Lys Lys Tyr 195 200 205 Ser Phe Val Ile Ser Leu Tyr Glu Tyr Pro Ala Thr Ile Ala Thr Leu 210 215 220 Trp Glu Ser Thr Lys Lys Phe Met Lys Asn His Pro Glu His Ile Ala 225 230 235 240 Pro Asp Asn Ser Met Arg Phe Leu Ser Asp Asp Gly Gly Glu Thr Tyr 245 250 255 Asn Asn Cys His Phe Trp Ser Asn Phe Glu Ile Gly Ser Leu Glu Trp 260 265 270 Leu Arg Ser Lys Gln Tyr Ile Asp Phe Phe Glu Ser Leu Asp Lys Asp 275 280 285 Gly Gly Phe Phe Tyr Glu Arg Trp Gly Asp Ala Pro Val His Ser Ile 290 295 300 Ala Ala Gly Leu Met Leu Asn Arg Ser Glu Ile His Phe Phe Asn Asp 305 310 315 320 Ile Ala Tyr Trp His Val Pro Phe Thr His Cys Pro Thr Gly Glu Lys 325 330 335 Thr Arg Leu Asp Leu Lys Cys His Cys Asp Pro Lys Glu Asn Phe Asp 340 345 350 Trp Lys Gly Tyr Ser Cys Thr Ser Arg Phe Phe Glu Met Asn Gly Met 355 360 365 Asp Lys Pro Glu Gly Trp Glu Asn Gln Gln Asp 370 375 <210> 42 <211> 8 <212> PRT <213> Trichoderma reesei <400> 42 Met Ala Ile Ala Arg Pro Val Arg 1 5 <210> 43 <211> 15 <212> PRT <213> Trichoderma reesei <400> 43 Ala Leu Gly Gly Leu Ala Ala Ile Leu Trp Cys Phe Phe Leu Tyr 1 5 10 15 <210> 44 <211> 371 <212> PRT <213> Trichoderma reesei <400> 44 Gln Leu Leu Arg Pro Ser Ser Ser Tyr Asn Ser Pro Gly Asp Arg Tyr 1 5 10 15 Ile Asn Phe Glu Arg Asp Pro Asn Leu Asp Pro Thr Gly Glu Pro Glu 20 25 30 Gly Ile Leu Val Arg Thr Ser Asp Arg Tyr Ala Pro Asp Ala Lys Asp 35 40 45 Thr Asp Arg Ala Ser Ala Thr Leu Leu Ala Leu Val Arg Asn Glu Glu 50 55 60 Val Asp Asp Met Val Ala Ser Met Val Asp Leu Glu Arg Thr Trp Asn 65 70 75 80 Ser Lys Phe Asn Tyr Pro Trp Thr Phe Phe Asn Asp Lys Pro Phe Ser 85 90 95 Glu Glu Phe Lys Lys Lys Thr Ser Ala Val Thr Asn Ala Thr Cys Asn 100 105 110 Tyr Glu Leu Ile Pro Lys Glu His Trp Asp Ala Pro Ser Trp Ile Asp 115 120 125 Pro Ala Ile Phe Glu Glu Ser Ala Ala Val Leu Lys Lys Asn Gly Val 130 135 140 Gln Tyr Ala Asn Met Met Ser Tyr His Gln Met Cys Arg Trp Asn Ser 145 150 155 160 Gly Met Phe Tyr Lys His Pro Ala Leu Lys Asp Val Arg Tyr Tyr Trp 165 170 175 Arg Val Glu Pro Lys Val His Phe Phe Cys Asp Val Asp Tyr Asp Val 180 185 190 Phe Arg Tyr Met Gln Asp Asn Asn Lys Thr Tyr Gly Phe Thr Ile Asn 195 200 205 Leu Tyr Asp Asp Pro His Thr Leu Pro Thr Leu Trp Pro Gln Thr Ala 210 215 220 Lys Phe Leu Ala Asp His Pro Asn Tyr Leu His Glu His Ser Ala Ile 225 230 235 240 Lys Trp Val Ile Asp Asp Ala Arg Arg Pro Gln His Asn Arg Glu Ala 245 250 255 Gln Gly Phe Ser Thr Cys His Phe Trp Ser Asn Phe Glu Val Ala Asp 260 265 270 Met Glu Phe Trp Arg Ser Lys Val Tyr Glu Asp Tyr Phe Glu His Leu 275 280 285 Asp Arg Ala Gly Gly Phe Phe Tyr Glu Arg Trp Gly Asp Ala Pro Val 290 295 300 His Ser Ile Ala Leu Gly Leu Phe Glu Asp Ser Ser Lys Ile His Trp 305 310 315 320 Phe Arg Asp Ile Gly Tyr Gln His Ile Pro Phe Phe Asn Cys Pro Asn 325 330 335 Ser Pro Lys Cys Lys Gly Cys Val Thr Gly Arg Leu Thr Asp Gly Glu 340 345 350 Pro Phe Leu His Arg Glu Asp Cys Arg Pro Asn Trp Phe Lys Tyr Ala 355 360 365 Gly Met Gly 370 <210> 45 <211> 6 <212> PRT <213> Trichoderma reesei <400> 45 Met Leu Asn Pro Arg Arg 1 5 <210> 46 <211> 15 <212> PRT <213> Trichoderma reesei <400> 46 Ala Leu Ile Ala Ala Ala Phe Ile Leu Thr Val Phe Phe Leu Ile 1 5 10 15 <210> 47 <211> 352 <212> PRT <213> Trichoderma reesei <400> 47 Ser Arg Ser His Asn Ser Glu Ser Ala Ser Thr Ser Glu Pro Lys Asp 1 5 10 15 Ala Glu Ala Glu Ala Leu Ser Ala Ala Asn Ala Gln Gln Arg Ala Ala 20 25 30 Pro Pro Pro Pro Pro Gln Lys Pro Met Ile Asp Met Ser Gly Met Ser 35 40 45 Thr Tyr Asp Lys Leu Ala Tyr Ala Tyr Glu Tyr Asp Ile Glu Ser Lys 50 55 60 Phe Pro Ala Tyr Ile Trp Gln Thr Trp Arg Lys Thr Pro Ser Glu Gly 65 70 75 80 Asp Phe Glu Phe Arg Glu Gln Glu Ala Ser Trp Ser Ile Glu His Pro 85 90 95 Gly Phe Ile His Glu Val Ile Thr Asp Ser Val Ala Asp Thr Leu Leu 100 105 110 Gln Leu Leu Tyr Gly Ser Ile Pro Glu Val Leu Glu Ala Tyr His Ala 115 120 125 Leu Pro Leu Pro Val Leu Lys Ala Asp Leu Phe Arg Tyr Leu Ile Leu 130 135 140 Tyr Ala Arg Gly Gly Ile Tyr Ser Asp Ile Asp Thr Tyr Ala Ile Arg 145 150 155 160 Ser Ala Leu Glu Trp Ile Pro Pro Gln Ile Pro Lys Glu Thr Val Gly 165 170 175 Leu Val Ile Gly Ile Glu Ala Asp Pro Asp Arg Pro Asp Trp Ala Asp 180 185 190 Trp Tyr Ser Arg Arg Ile Gln Phe Cys Gln Trp Thr Ile Gln Ser Lys 195 200 205 Pro Gly His Pro Val Leu Arg Asp Ile Ile Ser Arg Ile Thr Asn Gln 210 215 220 Thr Leu Glu Met Lys Lys Ser Gly Lys Leu Ser Ala Phe Gln Gly Asn 225 230 235 240 Arg Val Val Asp Leu Thr Gly Pro Ala Val Trp Thr Asp Thr Ile Met 245 250 255 Asp Tyr Phe Asn Asp Glu Arg Tyr Phe Asp Met Glu Asn Ser Lys Gly 260 265 270 Arg Ile Asp Tyr Arg Asn Phe Thr Gly Met Glu Thr Ser Lys Arg Val 275 280 285 Gly Asp Val Val Val Leu Pro Ile Thr Ser Phe Ser Pro Gly Val Gly 290 295 300 Gln Met Gly Ala Lys Asp Tyr Asp Asp Pro Met Ala Phe Val Lys His 305 310 315 320 Asp Phe Glu Gly Thr Trp Lys Pro Glu Ser Glu Arg His Ile Gly Glu 325 330 335 Ile Val Gln Glu Leu Gly Glu Gly Gln Gly Glu Ala Pro Lys Glu Gln 340 345 350 <210> 48 <211> 22 <212> PRT <213> Trichoderma reesei <400> 48 Met Gly Met Gly Gln Cys Gln Trp Ser Pro Phe Arg Asn Lys Val Pro 1 5 10 15 Thr Gln Met Arg Arg Cys 20 <210> 49 <211> 15 <212> PRT <213> Trichoderma reesei <400> 49 Leu Pro Leu Tyr Ile Thr Val Val Cys Val Phe Leu Val Ile Val 1 5 10 15 <210> 50 <211> 362 <212> PRT <213> Trichoderma reesei <400> 50 Asn Phe Asp Trp Ile Leu Ala Ile Pro Asn Pro Ala Ser Val Leu Arg 1 5 10 15 Arg Glu Pro Lys Ala Pro Pro Leu Pro Gly Ser Thr Phe Pro Gln Lys 20 25 30 Ile Trp Gln Thr Trp Lys Val Asp Pro Leu Asn Phe Asp Glu Arg Asp 35 40 45 Leu Val Thr Ala Arg Thr Trp Thr Thr Ile Asn Pro Gly Met Arg Tyr 50 55 60 Glu Val Val Thr Asp Ala Asn Glu Met Ala Tyr Ile Glu Asp Arg Tyr 65 70 75 80 Gly Pro Asn Gly Phe Asp Arg Pro Asp Ile Val Glu Phe Tyr Lys Met 85 90 95 Ile Asn Leu Pro Ile Ile Lys Ala Asp Leu Leu Arg Tyr Met Ile Met 100 105 110 Tyr Ala Glu Gly Gly Ile Tyr Ala Asp Ile Asp Val Glu Thr Met Lys 115 120 125 Pro Phe His Arg Phe Ile Pro Asp Arg Tyr Asp Glu Lys Asp Ile Asp 130 135 140 Ile Ile Ile Gly Val Glu Ile Asp Gln Pro Asp Phe Lys Asp His Pro 145 150 155 160 Ile Leu Gly Lys Lys Ser Met Ser Phe Cys Gln Trp Thr Phe Val Ala 165 170 175 Arg Pro Gln Gln Pro Val Met Met Arg Leu Ile Glu Asn Ile Met Lys 180 185 190 Trp Phe Lys Thr Val Ala Arg Asp Gln Gly Val Pro Leu Gly Glu Val 195 200 205 Gln Leu Asp Phe Asp Gln Val Ile Ser Gly Thr Gly Pro Ser Ala Phe 210 215 220 Thr Lys Ala Met Leu Glu Glu Met Asn Arg Lys Thr Lys Gly Pro Lys 225 230 235 240 Val Thr Trp Asp Ala Phe His Asn Leu Asp Glu Ser Lys Leu Val Gly 245 250 255 Gly Val Leu Val Leu Thr Val Glu Ala Phe Cys Ala Gly Gln Gly His 260 265 270 Ser Asp Ser Gly Asn His Asn Ala Arg Asn Ala Leu Val Lys His His 275 280 285 Phe His Ala Ser Asn Trp Pro Ser Arg His Pro Arg Tyr Lys His Pro 290 295 300 Ala Tyr Gly Gln Val Glu Asp Cys Asn Trp Val Pro Glu Cys Val Arg 305 310 315 320 Lys Trp Asp Glu Asp Thr Ser Asn Trp Asp Lys Tyr Ser Glu Asn Glu 325 330 335 Gln Lys Lys Ile Leu Gln Asp Ile Glu Asn Ala Arg Leu Glu Arg Glu 340 345 350 Arg Gln Gln Gln Ala Leu Ala Ala Leu Pro 355 360 <210> 51 <211> 17 <212> PRT <213> Trichoderma reesei <400> 51 Met Ala Arg Pro Met Gly Ser Val Arg Leu Lys Lys Ala Asn Pro Ser 1 5 10 15 Thr <210> 52 <211> 16 <212> PRT <213> Trichoderma reesei <400> 52 Leu Ile Leu Gly Ala Val Leu Cys Ile Phe Ile Ile Ile Phe Leu Val 1 5 10 15 <210> 53 <211> 339 <212> PRT <213> Trichoderma reesei <400> 53 Ser Pro Ser Ser Pro Ala Ser Ala Ser Arg Leu Ser Ile Val Ser Ala 1 5 10 15 Gln His His Leu Ser Pro Pro Thr Ser Pro Tyr Gln Ser Pro Arg Ser 20 25 30 Gly Ala Val Gln Gly Pro Pro Pro Val Thr Arg Tyr Asn Leu Asn Lys 35 40 45 Val Thr Val Thr Ser Asp Pro Val Arg Asn Gln Glu His Ile Leu Ile 50 55 60 Leu Thr Pro Met Ala Arg Phe Tyr Gln Glu Tyr Trp Asp Asn Leu Leu 65 70 75 80 Arg Leu Asn Tyr Pro His Glu Leu Ile Thr Leu Gly Phe Ile Leu Pro 85 90 95 Lys Thr Lys Glu Gly Asn Gln Ala Thr Ser Met Leu Gln Lys Gln Ile 100 105 110 Gln Lys Thr Gln Asn Tyr Gly Pro Glu Lys Asp Arg Phe Lys Ser Ile 115 120 125 Ile Ile Leu Arg Gln Asp Phe Asp Pro Ala Val Val Ser Gln Asp Glu 130 135 140 Ser Glu Arg His Lys Leu Ala Asn Gln Lys Ala Arg Arg Glu Val Met 145 150 155 160 Ala Lys Ala Arg Asn Ser Leu Leu Phe Thr Thr Leu Gly Pro Ser Thr 165 170 175 Ser Trp Val Leu Trp Leu Asp Ala Asp Ile Thr Glu Thr Ala Pro Thr 180 185 190 Leu Ile Gln Asp Leu Ala Ser His Asp Lys Pro Ile Ile Val Ala Asn 195 200 205 Cys Phe Gln Lys Tyr Tyr Asp Pro Glu Ser Lys Lys Met Ala Glu Arg 210 215 220 Pro Tyr Asp Phe Asn Ser Trp Gln Asp Ser Glu Thr Ala Leu Lys Met 225 230 235 240 Ala Glu Gln Met Gly Pro Asp Asp Ile Leu Leu Glu Gly Tyr Ala Glu 245 250 255 Met Ala Thr Tyr Arg Thr Leu Leu Ala Tyr Met Ser Thr Pro Gly Gly 260 265 270 Ser Lys Asp Leu Val Val Pro Leu Asp Gly Val Gly Gly Thr Ala Leu 275 280 285 Leu Val Lys Ala Asp Val His Arg Asp Gly Ala Met Phe Pro Pro Phe 290 295 300 Ala Phe Tyr His Leu Ile Glu Ser Glu Gly Phe Ala Lys Met Ala Lys 305 310 315 320 Arg Leu Gly Trp Gln Pro Tyr Gly Leu Pro Asn Tyr Lys Val Tyr His 325 330 335 Tyr Asn Glu <210> 54 <211> 31 <212> PRT <213> Trichoderma reesei <400> 54 Met Leu Leu Pro Lys Gly Gly Leu Asp Trp Arg Ser Ala Arg Ala Gln 1 5 10 15 Ile Pro Pro Thr Arg Ala Leu Trp Asn Ala Val Thr Arg Thr Arg 20 25 30 <210> 55 <211> 15 <212> PRT <213> Trichoderma reesei <400> 55 Phe Ile Leu Leu Val Gly Ile Thr Gly Leu Ile Leu Leu Leu Trp 1 5 10 15 <210> 56 <211> 358 <212> PRT <213> Trichoderma reesei <400> 56 Arg Gly Val Ser Thr Ser Ala Ser Glu Met Gln Ser Phe Tyr Cys Trp 1 5 10 15 Gly Pro Ala Lys Pro Pro Met Glu Met Ser Pro Asn Glu His Asn Arg 20 25 30 Trp Asn Gly His Leu Gln Thr Pro Val Ile Phe Asn His His Ala Pro 35 40 45 Val Glu Val Asn Ser Ser Thr Ile Glu His Val Asp Leu Asn Pro Ile 50 55 60 Asn Ser Thr Lys Gln Ala Val Thr Lys Glu Glu Arg Ile Leu Ile Leu 65 70 75 80 Thr Pro Leu Lys Asp Ala Ala Pro Tyr Leu Ser Lys Tyr Phe Glu Leu 85 90 95 Leu Ala Glu Leu Thr Tyr Pro His Arg Leu Ile Asp Leu Ala Phe Leu 100 105 110 Val Ser Asp Ser Thr Asp Asp Thr Leu Ala Val Leu Ala Ser Glu Leu 115 120 125 Asp Arg Ile Gln Lys Arg Pro Asp Gln Ile Pro Phe His Ser Ala Thr 130 135 140 Val Ile Glu Lys Asp Phe Gly Phe Lys Leu Ser Gln Asn Val Glu Glu 145 150 155 160 Arg His Ser Phe Glu Ala Gln Gly Pro Arg Arg Lys Ala Met Gly Arg 165 170 175 Ala Arg Asn Tyr Leu Leu Tyr Thr Ala Leu Lys Pro Glu His Ser Trp 180 185 190 Val Tyr Trp Arg Asp Val Asp Ile Val Asp Ser Pro Thr Gly Ile Leu 195 200 205 Glu Asp Phe Ile Ala His Asp Arg Asp Ile Leu Val Pro Asn Ile Trp 210 215 220 Phe His Arg Tyr Arg Asp Gly Val Asp Ile Glu Gly Arg Phe Asp Tyr 225 230 235 240 Asn Ser Trp Val Glu Ser Asp Lys Gly Arg Lys Leu Ala Asn Ser Leu 245 250 255 Asp Lys Asp Val Val Leu Ala Glu Gly Tyr Lys Gln Tyr Asp Thr Gly 260 265 270 Arg Thr Tyr Met Ala Lys Met Gly Asp Trp Arg Glu Asn Lys Asp Val 275 280 285 Glu Leu Glu Leu Asp Gly Ile Gly Gly Val Asn Ile Leu Val Lys Ala 290 295 300 Asp Val His Arg Ser Gly Ile Asn Phe Pro Cys Tyr Ala Phe Glu Asn 305 310 315 320 Gln Ala Glu Thr Glu Gly Phe Ala Lys Met Ala Lys Arg Ala Gly Tyr 325 330 335 Glu Val Tyr Gly Leu Pro Asn Tyr Val Val Trp His Ile Asp Thr Glu 340 345 350 Glu Lys Gly Gly Asn Ala 355 <210> 57 <211> 45 <212> PRT <213> Trichoderma reesei <400> 57 Met Met Pro Arg His His Ser Ser Gly Phe Ser Asn Gly Tyr Pro Arg 1 5 10 15 Ala Asp Thr Phe Glu Ile Ser Pro His Arg Phe Gln Pro Arg Ala Thr 20 25 30 Leu Pro Pro His Arg Lys Arg Lys Arg Thr Ala Ile Arg 35 40 45 <210> 58 <211> 16 <212> PRT <213> Trichoderma reesei <400> 58 Val Gly Ile Ala Val Val Val Ile Leu Val Leu Val Leu Trp Phe Gly 1 5 10 15 <210> 59 <211> 407 <212> PRT <213> Trichoderma reesei <400> 59 Gln Pro Arg Ser Val Ala Ser Leu Ile Ser Leu Gly Ile Leu Ser Gly 1 5 10 15 Tyr Asp Asp Leu Lys Leu Glu Thr Val Arg Tyr Tyr Asp Leu Ser Asn 20 25 30 Val Gln Gly Thr Ala Arg Gly Trp Glu Arg Glu Glu Arg Ile Leu Leu 35 40 45 Cys Val Pro Leu Arg Asp Ala Glu Gln His Leu Pro Met Phe Phe Ser 50 55 60 His Leu Lys Asn Phe Thr Tyr Pro His Asn Leu Ile Asp Leu Ala Phe 65 70 75 80 Leu Val Ser Asp Ser Lys Asp His Thr Leu Glu Ser Leu Thr Glu His 85 90 95 Leu Glu Ala Ile Gln Ala Asp Pro Asp Pro Lys Gln Pro Tyr Gly Glu 100 105 110 Ile Ser Ile Ile Glu Lys Asp Phe Gly Gln Lys Val Asn Gln Asp Val 115 120 125 Glu Ser Arg His Gly Phe Ala Ala Gln Ala Ser Arg Arg Lys Leu Met 130 135 140 Ala Gln Ala Arg Asn Trp Leu Leu Ser Ala Ala Leu Arg Pro Tyr His 145 150 155 160 Ser Trp Val Tyr Trp Arg Asp Val Asp Val Glu Thr Ala Pro Phe Thr 165 170 175 Ile Leu Glu Asp Leu Met Arg His Asn Lys Asp Val Ile Val Pro Asn 180 185 190 Val Trp Arg Pro Leu Pro Asp Trp Leu Gly Gly Glu Gln Pro Tyr Asp 195 200 205 Leu Asn Ser Trp Gln Glu Ser Glu Thr Ala Leu Ala Leu Ala Asp Thr 210 215 220 Leu Asp Glu Asp Ala Val Ile Val Glu Gly Tyr Ala Glu Tyr Ala Thr 225 230 235 240 Trp Arg Pro His Leu Ala Tyr Leu Arg Asp Pro Tyr Gly Asp Pro Asp 245 250 255 Met Glu Met Glu Ile Asp Gly Val Gly Gly Val Ser Ile Leu Ala Lys 260 265 270 Ala Lys Val Phe Arg Ala Gly Val His Phe Pro Ala Phe Ser Phe Glu 275 280 285 Lys His Ala Glu Thr Glu Gly Phe Gly Lys Met Ala Lys Arg Met His 290 295 300 Phe Ser Val Val Gly Leu Pro His Tyr Thr Ile Trp His Leu Tyr Glu 305 310 315 320 Pro Ser Val Asp Asp Ile Lys His Met Glu Glu Met Glu Arg Glu Arg 325 330 335 Ile Ala Arg Glu Lys Glu Glu Glu Glu Arg Lys Lys Lys Glu Ala Gln 340 345 350 Ile Lys Glu Glu Phe Gly Asp Ala Asn Ser Gln Trp Glu Gln Asp Lys 355 360 365 Gln Gln Met Gln Asp Leu Lys Leu Gln Asp Arg Gly Gly Asp Lys Glu 370 375 380 Ala Ala Ala Ala Gly Val Asn Gln Gly Ala Ala Ala Lys Ala Ala Gly 385 390 395 400 Ala Met Glu Gly Gln Lys Asn 405 <210> 60 <211> 119 <212> PRT <213> Trichoderma reesei <400> 60 Met Ser Leu Ser Arg Ser Pro Ser Pro Val Pro Gly Gly Gly Trp Ser 1 5 10 15 Ser Pro Gly Leu Asn Ile Asn Ser Gly Arg Ser Ser Pro Ser Asn Ala 20 25 30 Ala Gly Ser Ser Val Ser Trp Glu Ser Ala Lys Met Arg Lys Gln Gly 35 40 45 Ala Asn Gly Tyr Pro Ser Phe Ser Thr Gln Asn Gln Gly Phe Phe Thr 50 55 60 Arg His Met Arg Arg Ile Ser Ser Ser Leu Pro Arg Phe Ala Ala Gly 65 70 75 80 Pro Gly Asn Thr Tyr Ala Glu Arg Glu Lys Tyr Glu Arg Gly Gly His 85 90 95 Ser Pro His Ala Gly Gly Gly Arg Leu Arg Ala Phe Leu Ala Arg Ile 100 105 110 Gly Arg Arg Leu Lys Trp Arg 115 <210> 61 <211> 15 <212> PRT <213> Trichoderma reesei <400> 61 Ile Leu Leu Pro Leu Ile Ile Ile Cys Thr Ile Val Ala Tyr Tyr 1 5 10 15 <210> 62 <211> 325 <212> PRT <213> Trichoderma reesei <400> 62 Gly Thr His Glu Ala Pro Gly Phe Val His Trp Trp Arg Arg Ile Ser 1 5 10 15 Met Gly Gly Gly Gly Glu Lys Phe Val Ile Ile Leu Gly Ala Asn Val 20 25 30 Gly Gly Gly Val Met Glu Trp Lys Gly Ala Arg Glu Trp Ala Ile Glu 35 40 45 Arg Asp Ser Val Arg Asn Lys Arg Lys Tyr Ala Thr Arg Trp Gly Tyr 50 55 60 Asp Leu Glu Ile Val Asp Met Lys Thr Lys Lys Arg Tyr Ala His Glu 65 70 75 80 Trp Arg Glu Ser Trp Glu Lys Val Asp Phe Ile Arg Ala Ala Met Arg 85 90 95 Lys Tyr Pro Lys Ala Glu Trp Phe Trp Trp Leu Asp Leu Asn Thr Tyr 100 105 110 Val Met Glu Pro Ser Tyr Ser Leu Gln Arg His Leu Phe Asn His Leu 115 120 125 Asp Arg His Val Tyr Arg Asp Ile Asn Val Phe Asn Pro Leu Asn Ile 130 135 140 Thr His Pro Pro Thr Glu Glu Tyr Leu Asp Ala Glu Ala Arg Ser Pro 145 150 155 160 Val Gly Asp Gly Asn Ile Asn Ser Val Asn Leu Met Leu Thr Gln Asp 165 170 175 Cys Ser Gly Phe Asn Leu Gly Ser Phe Phe Ile Arg Arg Ser Ala Trp 180 185 190 Thr Glu Gln Leu Leu Asp Ile Trp Trp Asp Pro Val Leu Tyr Glu Gln 195 200 205 Lys His Met Glu Trp Glu His Lys Glu Gln Asp Ala Leu Glu Gln Leu 210 215 220 Tyr Arg Thr Gln Pro Trp Ile Arg Gln His Thr Gly Phe Leu Pro Gln 225 230 235 240 Arg Leu Ile Asn Ser Phe Pro Pro Ala Ala Cys Ala Asp Glu Ser Gly 245 250 255 Leu Asn Asn Thr Arg Ile His Tyr Asn Glu Lys Asp Arg Asp Phe Val 260 265 270 Val Asn Met Ala Gly Cys Glu Trp Gly Arg Asp Cys Trp Gly Glu Met 275 280 285 Tyr His Tyr Arg Glu Phe Ser Tyr Trp Leu Asn Arg Asn Pro Trp Glu 290 295 300 Leu Phe Lys Glu Glu Ile Val Ala Val Ile Trp Tyr Lys Leu Thr Gly 305 310 315 320 Gln Arg Val Lys Leu 325 <210> 63 <211> 33 <212> PRT <213> Trichoderma reesei <400> 63 Met His Phe Ala Tyr Pro Ser Arg Lys Ser Ser Asn Pro Pro Pro Phe 1 5 10 15 Arg Pro Arg Ser Thr Arg Leu Pro Gly Leu Arg Arg Ser Arg Ile Lys 20 25 30 Thr <210> 64 <211> 15 <212> PRT <213> Trichoderma reesei <400> 64 Ile Gly Ile Val Leu Phe Leu Val Leu Ala Thr Leu Trp Phe Phe 1 5 10 15 <210> 65 <211> 262 <212> PRT <213> Trichoderma reesei <400> 65 Ser Asn Pro Arg Val Pro Arg Pro Asp Pro Glu Arg Val Pro Ser Gly 1 5 10 15 Arg Pro Pro Val Val Leu Val Thr Val Ile Asp Pro Thr Gln Tyr Pro 20 25 30 Asn Ala Tyr Leu Lys Thr Ile Lys Glu Asn Arg Glu Gln Tyr Ala Ala 35 40 45 Lys His Gly Tyr Glu Ala Phe Ile Val Lys Ala Tyr Asp Tyr Asp Thr 50 55 60 Gln Gly Ala Pro Gln Ser Trp Ser Lys Leu Met Ala Met Arg His Ala 65 70 75 80 Leu Thr Lys Phe Pro Glu Cys Arg Phe Val Trp Tyr Leu Asp Gln Asp 85 90 95 Ala Tyr Ile Met Asp Met Ser Lys Ser Leu Glu Glu Gln Leu Leu Asn 100 105 110 Arg Gln Lys Leu Glu Ser Leu Met Ile Lys Asn Tyr Pro Val Val Pro 115 120 125 Pro Asp Ser Ile Ile Lys Thr Phe Ser His Leu Arg Pro Asp Glu Val 130 135 140 Asp Leu Ile Val Ser Gln Asp Ser Ser Gly Leu Val Ala Gly Ser Val 145 150 155 160 Val Val Arg Asn Ser Gln Trp Ser Lys Phe Leu Leu Glu Thr Trp Met 165 170 175 Asp Pro Leu Tyr Arg Ser Tyr Asn Phe Gln Lys Ala Glu Arg His Ala 180 185 190 Leu Glu His Ile Val Gln Trp His Pro Thr Ile Leu Ser Lys Leu Ala 195 200 205 Leu Val Pro Gln Arg Thr Leu Gly Pro Tyr Thr Arg Thr Asp Gln Gly 210 215 220 Asp Ala Tyr Gln Asp Gly Asp Phe Val Val Met Phe Thr Gly Cys Thr 225 230 235 240 Lys Ser Gly Glu Gln Ser Cys Glu Thr Val Ser Ala Ser Tyr Tyr Gln 245 250 255 Lys Trp Ser Ser Ser Leu 260 <210> 66 <211> 90 <212> PRT <213> Trichoderma reesei <400> 66 Met Ile Arg Asp Pro Phe Gly Ile His Ser Lys Asn Ala Phe Lys Ala 1 5 10 15 Thr Ala Leu Arg Ala Ala Arg Asp Ile Lys Glu Ala Ala Thr Gln Ala 20 25 30 Gly Ala Asn Ala Leu Glu Met Ser Phe Ser Leu Pro Lys His Val Pro 35 40 45 Asp Phe Gly Asp Pro Ser Arg Ala Leu Glu Asp Arg Ala Trp Ala Ala 50 55 60 Leu Leu Pro Met Tyr Lys Asp Lys Pro Tyr Ala Tyr Ala Pro Ser Met 65 70 75 80 Arg Leu Arg Pro Trp Trp Arg Arg Arg Lys 85 90 <210> 67 <211> 19 <212> PRT <213> Trichoderma reesei <400> 67 Val Leu Gly Met Ile Ala Ala Ala Val Met Phe Val Leu Tyr Val Thr 1 5 10 15 Gly Phe Phe <210> 68 <211> 565 <212> PRT <213> Trichoderma reesei <400> 68 Ser Ser Gly Gln Thr Glu Glu Ala Lys Lys Lys Ala Ser Gly Ser Ala 1 5 10 15 Phe Ser Trp Leu Gly Leu Ser Gln Glu Arg Gly Gly Val Asp Trp Asp 20 25 30 Glu Arg Arg Lys Ser Val Val Glu Ala Phe Glu Val Trp Asp Ala Tyr 35 40 45 Glu Arg Tyr Ala Trp Gly Lys Asp Glu Phe His Pro Ile Ser Lys Asn 50 55 60 Gly Arg Asn Met Ala Pro Lys Gly Leu Gly Trp Ile Ile Ile Asp Ser 65 70 75 80 Leu Asp Thr Met Met Leu Met Asn Gln Thr Thr Arg Leu Gln His Ala 85 90 95 Arg Glu Trp Ile Ser Thr Ser Leu Thr Trp Asp Gln Asp Gln Asp Val 100 105 110 Asn Thr Phe Glu Thr Thr Ile Arg Met Leu Gly Gly Leu Leu Ser Ala 115 120 125 His Tyr Leu Ser Thr Glu Phe Pro Glu Leu Ala Pro Leu Thr Glu Asp 130 135 140 Asp Glu Gly Ala Pro Gly Glu Asp Leu Tyr Leu Glu Lys Ala Lys Asp 145 150 155 160 Leu Ala Asp Arg Leu Leu Ser Ala Phe Glu Ser Glu Ser Gly Ile Pro 165 170 175 Tyr Ala Ser Val Asn Ile Gly Glu Tyr Lys Gly Pro Ser His Ser Asp 180 185 190 Asn Gly Ala Ser Ser Thr Ala Glu Ala Thr Thr Leu Gln Leu Glu Phe 195 200 205 Lys Tyr Leu Ala Lys Leu Thr Gly Glu Lys Asn Phe Trp Asp Lys Val 210 215 220 Glu Lys Val Met Glu Val Val Asp Asp Asn Gln Pro Glu Asp Gly Leu 225 230 235 240 Val Pro Ile Tyr Ile Tyr Ala Thr Thr Gly Glu Phe Arg Gly Gln Asn 245 250 255 Ile Arg Leu Gly Ser Arg Gly Asp Ser Tyr Tyr Glu Tyr Leu Ile Lys 260 265 270 Gln Tyr Leu Gln Thr Asn Lys Gln Glu Pro Ile Tyr Glu Glu Met Trp 275 280 285 Asp Glu Ala Leu Ala Gly Val Arg Lys His Leu Val Thr Tyr Thr Glu 290 295 300 Pro Ser Glu Phe Thr Ile Ile Ala Glu Arg Pro Asp Gly Leu Glu His 305 310 315 320 Pro Met Ser Pro Lys Met Asp His Leu Val Cys Phe Met Pro Gly Thr 325 330 335 Ile Ala Leu Ala Ala Thr Gly Gly Leu Thr Glu Ala Glu Ala Arg Lys 340 345 350 Leu Ser Thr Trp Asn Lys Lys Lys Asp Asp Asp Met Gln Leu Ala Arg 355 360 365 Glu Leu Met His Thr Cys Trp Gly Met Tyr Lys Tyr Met Lys Thr Gly 370 375 380 Leu Ala Pro Glu Ile Met Tyr Phe Asn Ile Pro Asn Pro Pro Pro Glu 385 390 395 400 Ser Ser Ala Pro His Gln Ala Pro Ala Ala Phe Asp Glu Asp Pro His 405 410 415 Ala Glu Trp Arg Lys Asp Phe Val Val His Ser Asn Asp Val His Asn 420 425 430 Leu Gln Arg Pro Glu Thr Val Glu Ser Leu Phe Tyr Met Trp Arg Ile 435 440 445 Thr Gly Asp Val Lys Tyr Arg Glu Trp Gly Trp Asp Met Phe Lys Ser 450 455 460 Phe Val Asn Tyr Thr Ala Val Glu Asp Gln Gly Gly Phe Thr Ser Leu 465 470 475 480 Leu Asp Ala Asn Ser Ile Pro Pro Thr Pro Lys Asp Asn Met Glu Ser 485 490 495 Phe Trp Leu Ala Glu Thr Leu Lys Tyr Met Tyr Leu Leu Phe Ser Pro 500 505 510 Asn Asp Val Leu Pro Leu His Lys Ile Val Leu Asn Thr Glu Ala His 515 520 525 Pro Phe Pro Arg Phe Asp Met Gly Pro Leu Phe Ser Thr Gly Trp Lys 530 535 540 Arg Lys Pro Arg Asp Gly Ser Ala Lys Lys Lys Ala Thr Thr Ala Ala 545 550 555 560 Thr Thr Asp Ala Glu 565 <210> 69 <211> 7 <212> PRT <213> Trichoderma reesei <400> 69 Met Ala Arg Arg Arg Tyr Arg 1 5 <210> 70 <211> 15 <212> PRT <213> Trichoderma reesei <400> 70 Leu Phe Met Ile Cys Ala Ala Val Ile Leu Phe Leu Leu Tyr Arg 1 5 10 15 <210> 71 <211> 871 <212> PRT <213> Trichoderma reesei <400> 71 Val Ser Gln Asn Thr Trp Asp Asp Ser Ala His Tyr Ala Thr Leu Arg 1 5 10 15 His Pro Pro Ala Ser Asn Pro Pro Ala Ala Gly Gly Glu Ser Pro Leu 20 25 30 Lys Pro Ala Ala Lys Pro Glu His Glu His Glu His Glu Asn Gly Tyr 35 40 45 Ala Pro Glu Ser Lys Pro Lys Pro Gln Ser Glu Pro Lys Pro Glu Ser 50 55 60 Lys Pro Ala Pro Glu His Ala Ala Gly Gly Gln Lys Ser Gln Gly Lys 65 70 75 80 Pro Ser Tyr Glu Asp Asp Glu Glu Thr Gly Lys Asn Pro Pro Lys Ser 85 90 95 Ala Val Ile Pro Ser Asp Thr Arg Leu Pro Pro Asp Asn Lys Val His 100 105 110 Trp Arg Pro Val Lys Glu His Phe Pro Val Pro Ser Glu Ser Val Ile 115 120 125 Ser Leu Pro Thr Gly Lys Pro Leu Lys Val Pro Arg Val Gln His Glu 130 135 140 Phe Gly Val Glu Ser Pro Glu Ala Lys Ser Arg Arg Val Ala Arg Gln 145 150 155 160 Glu Arg Val Gly Lys Glu Ile Glu Arg Ala Trp Ser Gly Tyr Lys Lys 165 170 175 Phe Ala Trp Met His Asp Glu Leu Ser Pro Val Ser Ala Lys His Arg 180 185 190 Asp Pro Phe Cys Gly Trp Ala Ala Thr Leu Val Asp Ser Leu Asp Thr 195 200 205 Leu Trp Ile Ala Gly Leu Lys Glu Gln Phe Asp Glu Ala Ala Arg Ala 210 215 220 Val Glu Gln Ile Asp Phe Thr Thr Thr Pro Arg Asn Asn Ile Pro Val 225 230 235 240 Phe Glu Thr Thr Ile Arg Tyr Leu Gly Gly Leu Leu Gly Ala Phe Asp 245 250 255 Val Ser Gly Gly His Asp Gly Gly Tyr Pro Met Leu Leu Thr Lys Ala 260 265 270 Val Glu Leu Ala Glu Ile Leu Met Gly Ile Phe Asp Thr Pro Asn Arg 275 280 285 Met Pro Ile Leu Tyr Tyr Gln Trp Gln Pro Glu Tyr Ala Ser Gln Pro 290 295 300 His Arg Ala Gly Ser Val Gly Ile Ala Glu Leu Gly Thr Leu Ser Met 305 310 315 320 Glu Phe Thr Arg Leu Ala Gln Leu Thr Ser Gln Tyr Lys Tyr Tyr Asp 325 330 335 Ala Val Asp Arg Ile Thr Asp Ala Leu Ile Glu Leu Gln Lys Gln Gly 340 345 350 Thr Ser Ile Pro Gly Leu Phe Pro Glu Asn Leu Asp Ala Ser Gly Cys 355 360 365 Asn His Thr Ala Thr Ala Leu Arg Ser Ser Leu Ser Glu Ala Ala Gln 370 375 380 Lys Gln Met Asp Glu Asp Leu Ser Asn Lys Pro Glu Asn Tyr Arg Pro 385 390 395 400 Gly Lys Asn Ser Lys Ala Asp Pro Gln Thr Val Glu Lys Gln Pro Ala 405 410 415 Lys Lys Gln Asn Glu Pro Val Glu Lys Ala Lys Gln Val Pro Thr Gln 420 425 430 Gln Thr Ala Lys Arg Gly Lys Pro Pro Phe Gly Ala Asn Gly Phe Thr 435 440 445 Ala Asn Trp Asp Cys Val Pro Gln Gly Leu Val Val Gly Gly Tyr Gly 450 455 460 Phe Gln Gln Tyr His Met Gly Gly Gly Gln Asp Ser Ala Tyr Glu Tyr 465 470 475 480 Phe Pro Lys Glu Tyr Leu Leu Leu Gly Gly Leu Glu Ser Lys Tyr Gln 485 490 495 Lys Leu Tyr Val Asp Ala Val Glu Ala Ile Asn Glu Trp Leu Leu Tyr 500 505 510 Arg Pro Met Thr Asp Gly Asp Trp Asp Ile Leu Phe Pro Ala Lys Val 515 520 525 Ser Thr Ala Gly Asn Pro Ser Gln Asp Leu Val Ala Thr Phe Glu Val 530 535 540 Thr His Leu Thr Cys Phe Ile Gly Gly Met Tyr Gly Leu Gly Gly Lys 545 550 555 560 Ile Phe Gly Arg Glu Lys Asp Leu Glu Thr Ala Lys Arg Leu Thr Asp 565 570 575 Gly Cys Val Trp Ala Tyr Gln Ser Thr Val Ser Gly Ile Met Pro Glu 580 585 590 Gly Ser Gln Val Leu Ala Cys Pro Thr Leu Glu Lys Cys Asp Phe Asn 595 600 605 Glu Thr Leu Trp Trp Glu Lys Leu Asp Pro Ala Lys Asp Trp Arg Asp 610 615 620 Lys Gln Val Ala Asp Asp Lys Asp Lys Ala Thr Val Gly Glu Ala Leu 625 630 635 640 Lys Glu Thr Ala Asn Ser His Asp Ala Ala Gly Gly Ser Lys Ala Val 645 650 655 His Lys Arg Ala Ala Val Pro Leu Pro Lys Pro Gly Ala Asp Asp Asp 660 665 670 Val Gly Ser Glu Leu Pro Gln Ser Leu Lys Asp Lys Ile Gly Phe Lys 675 680 685 Asn Gly Glu Gln Lys Lys Pro Thr Gly Ser Ser Val Gly Ile Gln Arg 690 695 700 Asp Pro Asp Ala Pro Val Asp Ser Val Leu Glu Ala His Arg Leu Pro 705 710 715 720 Pro Gln Glu Pro Glu Glu Gln Gln Val Ile Leu Pro Asp Lys Pro Gln 725 730 735 Thr His Glu Glu Phe Val Lys Gln Arg Ile Ala Glu Met Gly Phe Ala 740 745 750 Pro Gly Val Val His Ile Gln Ser Arg Gln Tyr Ile Leu Arg Pro Glu 755 760 765 Ala Ile Glu Ser Val Trp Tyr Met Tyr Arg Ile Thr Gly Asp Pro Ile 770 775 780 Trp Met Glu Lys Gly Trp Lys Met Phe Glu Ala Thr Ile Arg Ala Thr 785 790 795 800 Arg Thr Glu Ile Ala Asn Ser Ala Ile Asp Asp Val Asn Ser Glu Glu 805 810 815 Pro Gly Leu Lys Asp Glu Met Glu Ser Phe Trp Leu Ala Glu Thr Leu 820 825 830 Lys Tyr Tyr Tyr Leu Leu Phe Ser Glu Pro Ser Val Ile Ser Leu Asp 835 840 845 Glu Trp Val Leu Asn Thr Glu Ala His Pro Phe Lys Arg Pro Gly Gly 850 855 860 Ser Val Ile Gly His Ser Ile 865 870 <210> 72 <211> 13 <212> PRT <213> Trichoderma reesei <400> 72 Met Leu Asn Gln Leu Gln Gly Arg Val Pro Arg Arg Tyr 1 5 10 <210> 73 <211> 15 <212> PRT <213> Trichoderma reesei <400> 73 Ile Ala Leu Val Ala Phe Ala Phe Phe Val Ala Phe Leu Leu Trp 1 5 10 15 <210> 74 <211> 542 <212> PRT <213> Trichoderma reesei <400> 74 Ser Gly Tyr Asp Phe Val Pro Arg Thr Ala Thr Val Gly Arg Phe Lys 1 5 10 15 Tyr Val Pro Ser Ser Tyr Asp Trp Ser Lys Ala Lys Val Tyr Tyr Pro 20 25 30 Val Lys Asp Met Lys Thr Leu Pro Gln Gly Thr Pro Val Thr Phe Pro 35 40 45 Arg Leu Gln Leu Arg Asn Gln Ser Glu Ala Gln Asp Asp Thr Thr Lys 50 55 60 Ala Arg Lys Gln Ala Val Lys Asp Ala Phe Val Lys Ser Trp Glu Ala 65 70 75 80 Tyr Lys Thr Tyr Ala Trp Thr Lys Asp Gln Leu Gln Pro Leu Ser Leu 85 90 95 Ser Gly Lys Glu Thr Phe Ser Gly Trp Ser Ala Gln Leu Val Asp Ala 100 105 110 Leu Asp Thr Leu Trp Ile Met Asp Leu Lys Asp Asp Phe Phe Leu Ala 115 120 125 Val Lys Glu Val Ala Val Ile Asp Trp Ser Lys Thr Lys Asp Asn Lys 130 135 140 Val Ile Asn Leu Phe Glu Val Thr Ile Arg Tyr Leu Gly Gly Leu Ile 145 150 155 160 Ala Ala Tyr Asp Leu Ser Gln Glu Pro Val Leu Arg Ala Lys Ala Ile 165 170 175 Glu Leu Gly Asp Thr Leu Tyr Ala Thr Phe Asp Thr Pro Asn Arg Leu 180 185 190 Pro Ser His Trp Leu Asp Tyr Ser Lys Ala Lys Lys Gly Thr Gln Arg 195 200 205 Ala Asp Asp Ser Met Ser Gly Ala Ala Gly Gly Thr Leu Cys Met Glu 210 215 220 Phe Thr Arg Leu Ser Gln Ile Thr Gly Asp Pro Lys Tyr Tyr Asp Ala 225 230 235 240 Thr Glu Arg Ile Lys Gln Phe Phe Tyr Arg Phe Gln Asn Glu Thr Thr 245 250 255 Leu Pro Gly Met Trp Pro Val Met Met Asn Tyr Arg Glu Glu Thr Met 260 265 270 Val Glu Ser Arg Tyr Ser Met Gly Gly Ser Ala Asp Ser Leu Tyr Glu 275 280 285 Tyr Leu Val Lys Met Pro Ala Leu Leu Gly Gly Leu Asp Pro Gln Tyr 290 295 300 Pro Glu Met Ala Ile Arg Ala Leu Asp Thr Ala Arg Asp Asn Leu Leu 305 310 315 320 Phe Arg Pro Met Thr Glu Lys Gly Asp Asn Ile Leu Ala Leu Gly Asn 325 330 335 Ala Leu Val Asp His Gly Asn Val Gln Arg Ile Thr Glu Met Gln His 340 345 350 Leu Thr Cys Phe Ala Gly Gly Met Tyr Ala Met Ala Gly Lys Leu Phe 355 360 365 Lys Arg Asp Asp Tyr Val Asp Leu Gly Ser Arg Ile Ser Ser Gly Cys 370 375 380 Val Trp Ala Tyr Asp Ser Phe Pro Ser Gly Ile Met Pro Glu Ser Ala 385 390 395 400 Asp Met Ala Ala Cys Ala Lys Leu Asp Gly Pro Cys Pro Tyr Asp Glu 405 410 415 Val Lys Ala Pro Val Asp Pro Asp Gly Arg Arg Pro His Gly Phe Ile 420 425 430 His Val Lys Ser Arg His Tyr Leu Leu Arg Pro Glu Ala Ile Glu Ser 435 440 445 Val Phe Tyr Met Trp Arg Ile Thr Gly Asp Gln Val Trp Arg Asp Thr 450 455 460 Ala Trp Arg Met Trp Glu Asn Ile Val Arg Glu Ala Glu Thr Glu His 465 470 475 480 Ala Phe Ala Ile Val Glu Asp Val Thr Arg Thr Ala Ser Lys Leu Thr 485 490 495 Asn Asn Tyr Leu Leu Gln Thr Phe Trp Leu Ala Glu Thr Leu Lys Tyr 500 505 510 Phe Tyr Leu Ile Phe Asp Asp Glu Ser Ala Ile Asp Leu Asp Lys Trp 515 520 525 Val Phe Asn Thr Glu Ala His Pro Phe Lys Arg Pro Ala Val 530 535 540 <210> 75 <211> 13 <212> PRT <213> Trichoderma reesei <400> 75 Met Leu Val Val Gly Arg Pro Arg Leu Val Arg Asn Ser 1 5 10 <210> 76 <211> 16 <212> PRT <213> Trichoderma reesei <400> 76 Ile Ile Leu Thr Leu Ala Ile Leu Ser Ile Trp His Leu Gly Leu Leu 1 5 10 15 <210> 77 <211> 576 <212> PRT <213> Trichoderma reesei <400> 77 Ser Arg Thr Pro Thr Ser Ala Ser Ala Leu Val Ser Ala Ser Val Ser 1 5 10 15 Ala Ser Ser Glu Trp Ser Arg Leu Glu Arg Leu Met Asn Arg Gly Ala 20 25 30 Pro Leu Thr Pro Tyr Pro Asp Ser Asn Ser Ser Phe Asp Trp Ser Ala 35 40 45 Ile Pro Phe Arg Tyr Pro Pro His Asn Thr Thr His Leu Pro Pro Arg 50 55 60 His Lys Gln Pro Pro Leu Pro Arg Ile Gln His Arg Phe Gly Pro Glu 65 70 75 80 Ser Pro Ala Ala Ala Lys Glu Arg Ile Lys Arg Leu Lys Ala Val Lys 85 90 95 Gln Val Phe Leu Arg Ala Trp Gln Ala Tyr Lys Gly Tyr Ala Trp Lys 100 105 110 Gln Asp Ala Leu Leu Pro Ile Ser Gly Gly Gly Arg Glu Gln Phe Ser 115 120 125 Gly Trp Ala Ala Thr Leu Val Asp Ala Leu Asp Thr Leu Trp Ile Met 130 135 140 Gly Leu Arg Glu Glu Phe Asp Glu Ala Val Ala Ala Val Ala Glu Ile 145 150 155 160 Asp Phe Gly Ser Ser Thr Ser Ser Arg Val Asn Ile Phe Glu Thr Asn 165 170 175 Ile Arg Tyr Leu Gly Gly Leu Leu Ala Ala Tyr Asp Leu Ser Gly Arg 180 185 190 Glu Val Leu Leu Lys Lys Ala Val Glu Leu Gly Asp Leu Ile Tyr Ala 195 200 205 Gly Phe Asn Thr Glu Asn Gly Met Pro Val Asp Phe Leu Asn Phe Tyr 210 215 220 Ser Ala Lys Ser Gly Glu Gly Leu Val Val Glu Ser Ser Val Val Ser 225 230 235 240 Ala Ser Pro Gly Thr Leu Ser Leu Glu Leu Ala His Leu Ser Gln Val 245 250 255 Thr Gly Asp Asp Lys Tyr Tyr Ser Ala Val Ser Gln Val Met Asp Val 260 265 270 Phe Tyr Gln Gly Gln Asn Lys Thr Arg Leu Pro Gly Val Trp Pro Ile 275 280 285 Asp Val Asn Met Arg Ala Lys Asp Val Val Ser Gly Ser Arg Phe Thr 290 295 300 Leu Gly Gly Cys Ala Asp Ser Leu Tyr Glu Tyr Leu Pro Lys Met His 305 310 315 320 Gln Leu Leu Gly Gly Gly Glu Pro Lys Tyr Glu Thr Met Ser Arg Thr 325 330 335 Phe Leu Gln Ala Ala Asp Arg His Phe Val Phe Arg Pro Met Leu Pro 340 345 350 Gly Ala Glu Glu Asp Val Leu Met Pro Gly Asn Val Asn Val Asp Glu 355 360 365 Asp Ser Gly Glu Ala Val Leu Asp Pro Glu Thr Glu His Leu Ala Cys 370 375 380 Phe Val Gly Gly Met Phe Gly Leu Ala Gly Arg Leu Phe Ser Arg Pro 385 390 395 400 Asp Asp Val Glu Thr Gly Val Arg Leu Thr Asn Gly Cys Val Tyr Ala 405 410 415 Tyr Arg Ala Phe Pro Thr Gly Met Met Pro Glu Arg Leu Asp Leu Ala 420 425 430 Pro Cys Arg Asp Arg Ser Ser Arg Cys Pro Trp Asp Glu Glu His Trp 435 440 445 Leu Glu Glu Arg Ala Lys Arg Pro Glu Trp Glu Pro His Leu Pro Arg 450 455 460 Gly Phe Thr Ser Ala Lys Asp Pro Arg Tyr Leu Leu Arg Pro Glu Ala 465 470 475 480 Ile Glu Ser Val Phe Tyr Ser Tyr Arg Ile Thr Gly Arg Gln Glu Phe 485 490 495 Gln Thr Ala Ala Trp Asp Met Phe Thr Ala Val Glu Lys Gly Thr Arg 500 505 510 Thr Gln Phe Ala Asn Ala Ala Val Leu Asp Val Thr Arg Ala Ala Asp 515 520 525 Glu Leu Pro Gln Glu Asp Tyr Met Glu Ser Phe Trp Leu Ala Glu Thr 530 535 540 Leu Lys Tyr Phe Tyr Leu Met Phe Thr Thr Pro Asp Ile Ile Ser Leu 545 550 555 560 Asp Asp Tyr Val Leu Asn Thr Glu Ala His Pro Phe Lys Leu Val Gly 565 570 575 <210> 78 <211> 17 <212> PRT <213> Trichoderma reesei <400> 78 Met Val Met Leu Val Ala Ile Ala Leu Ala Trp Leu Gly Cys Ser Leu 1 5 10 15 Leu <210> 79 <211> 1053 <212> PRT <213> Trichoderma reesei <400> 79 Arg Pro Val Asp Ala Met Arg Ala Asp Tyr Leu Ala Gln Leu Arg Gln 1 5 10 15 Glu Thr Val Asp Met Phe Tyr His Gly Tyr Ser Asn Tyr Met Glu His 20 25 30 Ala Phe Pro Glu Asp Glu Leu Arg Pro Ile Ser Cys Thr Pro Leu Thr 35 40 45 Arg Asp Arg Asp Asn Pro Gly Arg Ile Ser Leu Asn Asp Ala Leu Gly 50 55 60 Asn Tyr Ser Leu Thr Leu Ile Asp Ser Leu Ser Thr Leu Ala Ile Leu 65 70 75 80 Ala Gly Gly Pro Gln Asn Gly Pro Tyr Thr Gly Pro Gln Ala Leu Ser 85 90 95 Asp Phe Gln Asp Gly Val Ala Glu Phe Val Arg His Tyr Gly Asp Gly 100 105 110 Arg Ser Gly Pro Ser Gly Ala Gly Ile Arg Ala Arg Gly Phe Asp Leu 115 120 125 Asp Ser Lys Val Gln Val Phe Glu Thr Val Ile Arg Gly Val Gly Gly 130 135 140 Leu Leu Ser Ala His Leu Phe Ala Ile Gly Glu Leu Pro Ile Thr Gly 145 150 155 160 Tyr Val Pro Arg Pro Glu Gly Val Ala Gly Asp Asp Pro Leu Glu Leu 165 170 175 Ala Pro Ile Pro Trp Pro Asn Gly Phe Arg Tyr Asp Gly Gln Leu Leu 180 185 190 Arg Leu Ala Leu Asp Leu Ser Glu Arg Leu Leu Pro Ala Phe Tyr Thr 195 200 205 Pro Thr Gly Ile Pro Tyr Pro Arg Val Asn Leu Arg Ser Gly Ile Pro 210 215 220 Phe Tyr Val Asn Ser Pro Leu His Gln Asn Leu Gly Glu Ala Val Glu 225 230 235 240 Glu Gln Ser Gly Arg Pro Glu Ile Thr Glu Thr Cys Ser Ala Gly Ala 245 250 255 Gly Ser Leu Val Leu Glu Phe Thr Val Leu Ser Arg Leu Thr Gly Asp 260 265 270 Ala Arg Phe Glu Gln Ala Ala Lys Arg Ala Phe Trp Glu Val Trp His 275 280 285 Arg Arg Ser Glu Ile Gly Leu Ile Gly Asn Gly Ile Asp Ala Glu Arg 290 295 300 Gly Leu Trp Ile Gly Pro His Ala Gly Ile Gly Ala Gly Met Asp Ser 305 310 315 320 Phe Phe Glu Tyr Ala Leu Lys Ser His Ile Leu Leu Ser Gly Leu Gly 325 330 335 Met Pro Asn Ala Ser Thr Ser Arg Arg Gln Ser Thr Thr Ser Trp Leu 340 345 350 Asp Pro Asn Ser Leu His Pro Pro Leu Pro Pro Glu Met His Thr Ser 355 360 365 Asp Ala Phe Leu Gln Ala Trp His Gln Ala His Ala Ser Val Lys Arg 370 375 380 Tyr Leu Tyr Thr Asp Arg Ser His Phe Pro Tyr Tyr Ser Asn Asn His 385 390 395 400 Arg Ala Thr Gly Gln Pro Tyr Ala Met Trp Ile Asp Ser Leu Gly Ala 405 410 415 Phe Tyr Pro Gly Leu Leu Ala Leu Ala Gly Glu Val Glu Glu Ala Ile 420 425 430 Glu Ala Asn Leu Val Tyr Thr Ala Leu Trp Thr Arg Tyr Ser Ala Leu 435 440 445 Pro Glu Arg Trp Ser Val Arg Glu Gly Asn Val Glu Ala Gly Ile Gly 450 455 460 Trp Trp Pro Gly Arg Pro Glu Phe Ile Glu Ser Thr Tyr His Ile Tyr 465 470 475 480 Arg Ala Thr Arg Asp Pro Trp Tyr Leu His Val Gly Glu Met Val Leu 485 490 495 Arg Asp Ile Arg Arg Arg Cys Tyr Ala Glu Cys Gly Trp Ala Gly Leu 500 505 510 Gln Asp Val Gln Thr Gly Glu Lys Gln Asp Arg Met Glu Ser Phe Phe 515 520 525 Leu Gly Glu Thr Ala Lys Tyr Met Tyr Leu Leu Phe Asp Pro Asp His 530 535 540 Pro Leu Asn Lys Leu Asp Ala Ala Tyr Val Phe Thr Thr Glu Gly His 545 550 555 560 Pro Leu Ile Ile Pro Lys Ser Lys Arg Gly Ser Gly Ser His Asn Arg 565 570 575 Gln Asp Arg Ala Arg Lys Ala Lys Lys Ser Arg Asp Val Ala Val Tyr 580 585 590 Thr Tyr Tyr Asp Glu Ser Phe Thr Asn Ser Cys Pro Ala Pro Arg Pro 595 600 605 Pro Ser Glu His His Leu Ile Gly Ser Ala Thr Ala Ala Arg Pro Asp 610 615 620 Leu Phe Ser Val Ser Arg Phe Thr Asp Leu Tyr Arg Thr Pro Asn Val 625 630 635 640 His Gly Pro Leu Glu Lys Val Glu Met Arg Asp Lys Lys Lys Gly Arg 645 650 655 Val Val Arg Tyr Arg Ala Thr Ser Asn His Thr Ile Phe Pro Trp Thr 660 665 670 Leu Pro Pro Ala Met Leu Pro Glu Asn Gly Thr Cys Ala Ala Pro Pro 675 680 685 Glu Arg Ile Ile Ser Leu Ile Glu Phe Pro Ala Asn Asp Ile Thr Ser 690 695 700 Gly Ile Thr Ser Arg Phe Gly Asn His Leu Ser Trp Gln Thr His Leu 705 710 715 720 Gly Pro Thr Val Asn Ile Leu Glu Gly Leu Arg Leu Gln Leu Glu Gln 725 730 735 Val Ser Asp Pro Ala Thr Gly Glu Asp Lys Trp Arg Ile Thr His Ile 740 745 750 Gly Asn Thr Gln Leu Gly Arg His Glu Thr Val Phe Phe His Ala Glu 755 760 765 His Val Arg His Leu Lys Asp Glu Val Phe Ser Cys Arg Arg Arg Arg 770 775 780 Asp Ala Val Glu Ile Glu Leu Leu Val Asp Lys Pro Ser Asp Thr Asn 785 790 795 800 Asn Asn Asn Thr Leu Ala Ser Ser Asp Asp Asp Val Val Val Asp Ala 805 810 815 Lys Ala Glu Glu Gln Asp Gly Met Leu Ala Asp Asp Asp Gly Asp Thr 820 825 830 Leu Asn Ala Glu Thr Leu Ser Ser Asn Ser Leu Phe Gln Ser Leu Leu 835 840 845 Arg Ala Val Ser Ser Val Phe Glu Pro Val Tyr Thr Ala Ile Pro Glu 850 855 860 Ser Asp Pro Ser Ala Gly Thr Ala Lys Val Tyr Ser Phe Asp Ala Tyr 865 870 875 880 Thr Ser Thr Gly Pro Gly Ala Tyr Pro Met Pro Ser Ile Ser Asp Thr 885 890 895 Pro Ile Pro Gly Asn Pro Phe Tyr Asn Phe Arg Asn Pro Ala Ser Asn 900 905 910 Phe Pro Trp Ser Thr Val Phe Leu Ala Gly Gln Ala Cys Glu Gly Pro 915 920 925 Leu Pro Ala Ser Ala Pro Arg Glu His Gln Val Ile Val Met Leu Arg 930 935 940 Gly Gly Cys Ser Phe Ser Arg Lys Leu Asp Asn Ile Pro Ser Phe Ser 945 950 955 960 Pro His Asp Arg Ala Leu Gln Leu Val Val Val Leu Asp Glu Pro Pro 965 970 975 Pro Pro Pro Pro Pro Pro Pro Ala Asn Asp Arg Arg Asp Val Thr Arg 980 985 990 Pro Leu Leu Asp Thr Glu Gln Thr Thr Pro Lys Gly Met Lys Arg Leu 995 1000 1005 His Gly Ile Pro Met Val Leu Val Arg Ala Ala Arg Gly Asp Tyr Glu 1010 1015 1020 Leu Phe Gly His Ala Ile Gly Val Gly Met Arg Arg Lys Tyr Arg Val 1025 1030 1035 1040 Glu Ser Gln Gly Leu Val Val Glu Asn Ala Val Val Leu 1045 1050 <210> 80 <211> 45 <212> PRT <213> Trichoderma reesei <400> 80 Met Met Pro Arg His His Ser Ser Gly Phe Ser Asn Gly Tyr Pro Arg 1 5 10 15 Ala Asp Thr Phe Glu Ile Ser Pro His Arg Phe Gln Pro Arg Ala Thr 20 25 30 Leu Pro Pro His Arg Lys Arg Lys Arg Thr Ala Ile Arg 35 40 45 <210> 81 <211> 16 <212> PRT <213> Trichoderma reesei <400> 81 Val Gly Ile Ala Val Val Val Ile Leu Val Leu Val Leu Trp Phe Gly 1 5 10 15 <210> 82 <211> 407 <212> PRT <213> Trichoderma reesei <400> 82 Gln Pro Arg Ser Val Ala Ser Leu Ile Ser Leu Gly Ile Leu Ser Gly 1 5 10 15 Tyr Asp Asp Leu Lys Leu Glu Thr Val Arg Tyr Tyr Asp Leu Ser Asn 20 25 30 Val Gln Gly Thr Ala Arg Gly Trp Glu Arg Glu Glu Arg Ile Leu Leu 35 40 45 Cys Val Pro Leu Arg Asp Ala Glu Gln His Leu Pro Met Phe Phe Ser 50 55 60 His Leu Lys Asn Phe Thr Tyr Pro His Asn Leu Ile Asp Leu Ala Phe 65 70 75 80 Leu Val Ser Asp Ser Lys Asp His Thr Leu Glu Ser Leu Thr Glu His 85 90 95 Leu Glu Ala Ile Gln Ala Asp Pro Asp Pro Lys Gln Pro Tyr Gly Glu 100 105 110 Ile Ser Ile Ile Glu Lys Asp Phe Gly Gln Lys Val Asn Gln Asp Val 115 120 125 Glu Ser Arg His Gly Phe Ala Ala Gln Ala Ser Arg Arg Lys Leu Met 130 135 140 Ala Gln Ala Arg Asn Trp Leu Leu Ser Ala Ala Leu Arg Pro Tyr His 145 150 155 160 Ser Trp Val Tyr Trp Arg Asp Val Asp Val Glu Thr Ala Pro Phe Thr 165 170 175 Ile Leu Glu Asp Leu Met Arg His Asn Lys Asp Val Ile Val Pro Asn 180 185 190 Val Trp Arg Pro Leu Pro Asp Trp Leu Gly Gly Glu Gln Pro Tyr Asp 195 200 205 Leu Asn Ser Trp Gln Glu Ser Glu Thr Ala Leu Ala Leu Ala Asp Thr 210 215 220 Leu Asp Glu Asp Ala Val Ile Val Glu Gly Tyr Ala Glu Tyr Ala Thr 225 230 235 240 Trp Arg Pro His Leu Ala Tyr Leu Arg Asp Pro Tyr Gly Asp Pro Asp 245 250 255 Met Glu Met Glu Ile Asp Gly Val Gly Gly Val Ser Ile Leu Ala Lys 260 265 270 Ala Lys Val Phe Arg Ala Gly Val His Phe Pro Ala Phe Ser Phe Glu 275 280 285 Lys His Ala Glu Thr Glu Gly Phe Gly Lys Met Ala Lys Arg Met His 290 295 300 Phe Ser Val Val Gly Leu Pro His Tyr Thr Ile Trp His Leu Tyr Glu 305 310 315 320 Pro Ser Val Asp Asp Ile Lys His Met Glu Glu Met Glu Arg Glu Arg 325 330 335 Ile Ala Arg Glu Lys Glu Glu Glu Glu Arg Lys Lys Lys Glu Ala Gln 340 345 350 Ile Lys Glu Glu Phe Gly Asp Ala Asn Ser Gln Trp Glu Gln Asp Lys 355 360 365 Gln Gln Met Gln Asp Leu Lys Leu Gln Asp Arg Gly Gly Asp Lys Glu 370 375 380 Ala Ala Ala Ala Gly Val Asn Gln Gly Ala Ala Ala Lys Ala Ala Gly 385 390 395 400 Ala Met Glu Gly Gln Lys Asn 405 <210> 83 <211> 31 <212> PRT <213> Trichoderma reesei <400> 83 Met Leu Leu Pro Lys Gly Gly Leu Asp Trp Arg Ser Ala Arg Ala Gln 1 5 10 15 Ile Pro Pro Thr Arg Ala Leu Trp Asn Ala Val Thr Arg Thr Arg 20 25 30 <210> 84 <211> 15 <212> PRT <213> Trichoderma reesei <400> 84 Phe Ile Leu Leu Val Gly Ile Thr Gly Leu Ile Leu Leu Leu Trp 1 5 10 15 <210> 85 <211> 358 <212> PRT <213> Trichoderma reesei <400> 85 Arg Gly Val Ser Thr Ser Ala Ser Glu Met Gln Ser Phe Tyr Cys Trp 1 5 10 15 Gly Pro Ala Lys Pro Pro Met Glu Met Ser Pro Asn Glu His Asn Arg 20 25 30 Trp Asn Gly His Leu Gln Thr Pro Val Ile Phe Asn His His Ala Pro 35 40 45 Val Glu Val Asn Ser Ser Thr Ile Glu His Val Asp Leu Asn Pro Ile 50 55 60 Asn Ser Thr Lys Gln Ala Val Thr Lys Glu Glu Arg Ile Leu Ile Leu 65 70 75 80 Thr Pro Leu Lys Asp Ala Ala Pro Tyr Leu Ser Lys Tyr Phe Glu Leu 85 90 95 Leu Ala Glu Leu Thr Tyr Pro His Arg Leu Ile Asp Leu Ala Phe Leu 100 105 110 Val Ser Asp Ser Thr Asp Asp Thr Leu Ala Val Leu Ala Ser Glu Leu 115 120 125 Asp Arg Ile Gln Lys Arg Pro Asp Gln Ile Pro Phe His Ser Ala Thr 130 135 140 Val Ile Glu Lys Asp Phe Gly Phe Lys Leu Ser Gln Asn Val Glu Glu 145 150 155 160 Arg His Ser Phe Glu Ala Gln Gly Pro Arg Arg Lys Ala Met Gly Arg 165 170 175 Ala Arg Asn Tyr Leu Leu Tyr Thr Ala Leu Lys Pro Glu His Ser Trp 180 185 190 Val Tyr Trp Arg Asp Val Asp Ile Val Asp Ser Pro Thr Gly Ile Leu 195 200 205 Glu Asp Phe Ile Ala His Asp Arg Asp Ile Leu Val Pro Asn Ile Trp 210 215 220 Phe His Arg Tyr Arg Asp Gly Val Asp Ile Glu Gly Arg Phe Asp Tyr 225 230 235 240 Asn Ser Trp Val Glu Ser Asp Lys Gly Arg Lys Leu Ala Asn Ser Leu 245 250 255 Asp Lys Asp Val Val Leu Ala Glu Gly Tyr Lys Gln Tyr Asp Thr Gly 260 265 270 Arg Thr Tyr Met Ala Lys Met Gly Asp Trp Arg Glu Asn Lys Asp Val 275 280 285 Glu Leu Glu Leu Asp Gly Ile Gly Gly Val Asn Ile Leu Val Lys Ala 290 295 300 Asp Val His Arg Ser Gly Ile Asn Phe Pro Cys Tyr Ala Phe Glu Asn 305 310 315 320 Gln Ala Glu Thr Glu Gly Phe Ala Lys Met Ala Lys Arg Ala Gly Tyr 325 330 335 Glu Val Tyr Gly Leu Pro Asn Tyr Val Val Trp His Ile Asp Thr Glu 340 345 350 Glu Lys Gly Gly Asn Ala 355 <210> 86 <211> 17 <212> PRT <213> Trichoderma reesei <400> 86 Met Ala Arg Pro Met Gly Ser Val Arg Leu Lys Lys Ala Asn Pro Ser 1 5 10 15 Thr <210> 87 <211> 16 <212> PRT <213> Trichoderma reesei <400> 87 Leu Ile Leu Gly Ala Val Leu Cys Ile Phe Ile Ile Ile Phe Leu Val 1 5 10 15 <210> 88 <211> 339 <212> PRT <213> Trichoderma reesei <400> 88 Ser Pro Ser Ser Pro Ala Ser Ala Ser Arg Leu Ser Ile Val Ser Ala 1 5 10 15 Gln His His Leu Ser Pro Pro Thr Ser Pro Tyr Gln Ser Pro Arg Ser 20 25 30 Gly Ala Val Gln Gly Pro Pro Pro Val Thr Arg Tyr Asn Leu Asn Lys 35 40 45 Val Thr Val Thr Ser Asp Pro Val Arg Asn Gln Glu His Ile Leu Ile 50 55 60 Leu Thr Pro Met Ala Arg Phe Tyr Gln Glu Tyr Trp Asp Asn Leu Leu 65 70 75 80 Arg Leu Asn Tyr Pro His Glu Leu Ile Thr Leu Gly Phe Ile Leu Pro 85 90 95 Lys Thr Lys Glu Gly Asn Gln Ala Thr Ser Met Leu Gln Lys Gln Ile 100 105 110 Gln Lys Thr Gln Asn Tyr Gly Pro Glu Lys Asp Arg Phe Lys Ser Ile 115 120 125 Ile Ile Leu Arg Gln Asp Phe Asp Pro Ala Val Val Ser Gln Asp Glu 130 135 140 Ser Glu Arg His Lys Leu Ala Asn Gln Lys Ala Arg Arg Glu Val Met 145 150 155 160 Ala Lys Ala Arg Asn Ser Leu Leu Phe Thr Thr Leu Gly Pro Ser Thr 165 170 175 Ser Trp Val Leu Trp Leu Asp Ala Asp Ile Thr Glu Thr Ala Pro Thr 180 185 190 Leu Ile Gln Asp Leu Ala Ser His Asp Lys Pro Ile Ile Val Ala Asn 195 200 205 Cys Phe Gln Lys Tyr Tyr Asp Pro Glu Ser Lys Lys Met Ala Glu Arg 210 215 220 Pro Tyr Asp Phe Asn Ser Trp Gln Asp Ser Glu Thr Ala Leu Lys Met 225 230 235 240 Ala Glu Gln Met Gly Pro Asp Asp Ile Leu Leu Glu Gly Tyr Ala Glu 245 250 255 Met Ala Thr Tyr Arg Thr Leu Leu Ala Tyr Met Ser Thr Pro Gly Gly 260 265 270 Ser Lys Asp Leu Val Val Pro Leu Asp Gly Val Gly Gly Thr Ala Leu 275 280 285 Leu Val Lys Ala Asp Val His Arg Asp Gly Ala Met Phe Pro Pro Phe 290 295 300 Ala Phe Tyr His Leu Ile Glu Ser Glu Gly Phe Ala Lys Met Ala Lys 305 310 315 320 Arg Leu Gly Trp Gln Pro Tyr Gly Leu Pro Asn Tyr Lys Val Tyr His 325 330 335 Tyr Asn Glu <210> 89 <211> 33 <212> PRT <213> Trichoderma reesei <400> 89 Met His Phe Ala Tyr Pro Ser Arg Lys Ser Ser Asn Pro Pro Pro Phe 1 5 10 15 Arg Pro Arg Ser Thr Arg Leu Pro Gly Leu Arg Arg Ser Arg Ile Lys 20 25 30 Thr <210> 90 <211> 15 <212> PRT <213> Trichoderma reesei <400> 90 Ile Gly Ile Val Leu Phe Leu Val Leu Ala Thr Leu Trp Phe Phe 1 5 10 15 <210> 91 <211> 262 <212> PRT <213> Trichoderma reesei <400> 91 Ser Asn Pro Arg Val Pro Arg Pro Asp Pro Glu Arg Val Pro Ser Gly 1 5 10 15 Arg Pro Pro Val Val Leu Val Thr Val Ile Asp Pro Thr Gln Tyr Pro 20 25 30 Asn Ala Tyr Leu Lys Thr Ile Lys Glu Asn Arg Glu Gln Tyr Ala Ala 35 40 45 Lys His Gly Tyr Glu Ala Phe Ile Val Lys Ala Tyr Asp Tyr Asp Thr 50 55 60 Gln Gly Ala Pro Gln Ser Trp Ser Lys Leu Met Ala Met Arg His Ala 65 70 75 80 Leu Thr Lys Phe Pro Glu Cys Arg Phe Val Trp Tyr Leu Asp Gln Asp 85 90 95 Ala Tyr Ile Met Asp Met Ser Lys Ser Leu Glu Glu Gln Leu Leu Asn 100 105 110 Arg Gln Lys Leu Glu Ser Leu Met Ile Lys Asn Tyr Pro Val Val Pro 115 120 125 Pro Asp Ser Ile Ile Lys Thr Phe Ser His Leu Arg Pro Asp Glu Val 130 135 140 Asp Leu Ile Val Ser Gln Asp Ser Ser Gly Leu Val Ala Gly Ser Val 145 150 155 160 Val Val Arg Asn Ser Gln Trp Ser Lys Phe Leu Leu Glu Thr Trp Met 165 170 175 Asp Pro Leu Tyr Arg Ser Tyr Asn Phe Gln Lys Ala Glu Arg His Ala 180 185 190 Leu Glu His Ile Val Gln Trp His Pro Thr Ile Leu Ser Lys Leu Ala 195 200 205 Leu Val Pro Gln Arg Thr Leu Gly Pro Tyr Thr Arg Thr Asp Gln Gly 210 215 220 Asp Ala Tyr Gln Asp Gly Asp Phe Val Val Met Phe Thr Gly Cys Thr 225 230 235 240 Lys Ser Gly Glu Gln Ser Cys Glu Thr Val Ser Ala Ser Tyr Tyr Gln 245 250 255 Lys Trp Ser Ser Ser Leu 260 <210> 92 <211> 119 <212> PRT <213> Trichoderma reesei <400> 92 Met Ser Leu Ser Arg Ser Pro Ser Pro Val Pro Gly Gly Gly Trp Ser 1 5 10 15 Ser Pro Gly Leu Asn Ile Asn Ser Gly Arg Ser Ser Pro Ser Asn Ala 20 25 30 Ala Gly Ser Ser Val Ser Trp Glu Ser Ala Lys Met Arg Lys Gln Gly 35 40 45 Ala Asn Gly Tyr Pro Ser Phe Ser Thr Gln Asn Gln Gly Phe Phe Thr 50 55 60 Arg His Met Arg Arg Ile Ser Ser Ser Leu Pro Arg Phe Ala Ala Gly 65 70 75 80 Pro Gly Asn Thr Tyr Ala Glu Arg Glu Lys Tyr Glu Arg Gly Gly His 85 90 95 Ser Pro His Ala Gly Gly Gly Arg Leu Arg Ala Phe Leu Ala Arg Ile 100 105 110 Gly Arg Arg Leu Lys Trp Arg 115 <210> 93 <211> 16 <212> PRT <213> Trichoderma reesei <400> 93 Ile Leu Leu Pro Leu Ile Ile Ile Cys Thr Ile Val Ala Tyr Tyr Gly 1 5 10 15 <210> 94 <211> 324 <212> PRT <213> Trichoderma reesei <400> 94 Thr His Glu Ala Pro Gly Phe Val His Trp Trp Arg Arg Ile Ser Met 1 5 10 15 Gly Gly Gly Gly Glu Lys Phe Val Ile Ile Leu Gly Ala Asn Val Gly 20 25 30 Gly Gly Val Met Glu Trp Lys Gly Ala Arg Glu Trp Ala Ile Glu Arg 35 40 45 Asp Ser Val Arg Asn Lys Arg Lys Tyr Ala Thr Arg Trp Gly Tyr Asp 50 55 60 Leu Glu Ile Val Asp Met Lys Thr Lys Lys Arg Tyr Ala His Glu Trp 65 70 75 80 Arg Glu Ser Trp Glu Lys Val Asp Phe Ile Arg Ala Ala Met Arg Lys 85 90 95 Tyr Pro Lys Ala Glu Trp Phe Trp Trp Leu Asp Leu Asn Thr Tyr Val 100 105 110 Met Glu Pro Ser Tyr Ser Leu Gln Arg His Leu Phe Asn His Leu Asp 115 120 125 Arg His Val Tyr Arg Asp Ile Asn Val Phe Asn Pro Leu Asn Ile Thr 130 135 140 His Pro Pro Thr Glu Glu Tyr Leu Asp Ala Glu Ala Arg Ser Pro Val 145 150 155 160 Gly Asp Gly Asn Ile Asn Ser Val Asn Leu Met Leu Thr Gln Asp Cys 165 170 175 Ser Gly Phe Asn Leu Gly Ser Phe Phe Ile Arg Arg Ser Ala Trp Thr 180 185 190 Glu Gln Leu Leu Asp Ile Trp Trp Asp Pro Val Leu Tyr Glu Gln Lys 195 200 205 His Met Glu Trp Glu His Lys Glu Gln Asp Ala Leu Glu Gln Leu Tyr 210 215 220 Arg Thr Gln Pro Trp Ile Arg Gln His Thr Gly Phe Leu Pro Gln Arg 225 230 235 240 Leu Ile Asn Ser Phe Pro Pro Ala Ala Cys Ala Asp Glu Ser Gly Leu 245 250 255 Asn Asn Thr Arg Ile His Tyr Asn Glu Lys Asp Arg Asp Phe Val Val 260 265 270 Asn Met Ala Gly Cys Glu Trp Gly Arg Asp Cys Trp Gly Glu Met Tyr 275 280 285 His Tyr Arg Glu Phe Ser Tyr Trp Leu Asn Arg Asn Pro Trp Glu Leu 290 295 300 Phe Lys Glu Glu Ile Val Ala Val Ile Trp Tyr Lys Leu Thr Gly Gln 305 310 315 320 Arg Val Lys Leu <210> 95 <211> 863 <212> PRT <213> Homo sapiens <400> 95 Met Arg Phe Arg Ile Tyr Lys Arg Lys Val Leu Ile Leu Thr Leu Val 1 5 10 15 Val Ala Ala Cys Gly Phe Val Leu Trp Ser Ser Asn Gly Arg Gln Arg 20 25 30 Lys Asn Glu Ala Leu Ala Pro Pro Leu Leu Asp Ala Glu Pro Ala Arg 35 40 45 Gly Ala Gly Gly Arg Gly Gly Asp His Pro Ser Val Ala Val Gly Ile 50 55 60 Arg Arg Val Ser Asn Val Ser Ala Ala Ser Leu Val Pro Ala Val Pro 65 70 75 80 Gln Pro Glu Ala Asp Asn Leu Thr Leu Arg Tyr Arg Ser Leu Val Tyr 85 90 95 Gln Leu Asn Phe Asp Gln Thr Leu Arg Asn Val Asp Lys Ala Gly Thr 100 105 110 Trp Ala Pro Arg Glu Leu Val Leu Val Val Gln Val His Asn Arg Pro 115 120 125 Glu Tyr Leu Arg Leu Leu Leu Asp Ser Leu Arg Lys Ala Gln Gly Ile 130 135 140 Asp Asn Val Leu Val Ile Phe Ser His Asp Phe Trp Ser Thr Glu Ile 145 150 155 160 Asn Gln Leu Ile Ala Gly Val Asn Phe Cys Pro Val Leu Gln Val Phe 165 170 175 Phe Pro Phe Ser Ile Gln Leu Tyr Pro Asn Glu Phe Pro Gly Ser Asp 180 185 190 Pro Arg Asp Cys Pro Arg Asp Leu Pro Lys Asn Ala Ala Leu Lys Leu 195 200 205 Gly Cys Ile Asn Ala Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu 210 215 220 Ala Lys Phe Ser Gln Thr Lys His His Trp Trp Trp Lys Leu His Phe 225 230 235 240 Val Trp Glu Arg Val Lys Ile Leu Arg Asp Tyr Ala Gly Leu Ile Leu 245 250 255 Phe Leu Glu Glu Asp His Tyr Leu Ala Pro Asp Phe Tyr His Val Phe 260 265 270 Lys Lys Met Trp Lys Leu Lys Gln Gln Glu Cys Pro Glu Cys Asp Val 275 280 285 Leu Ser Leu Gly Thr Tyr Ser Ala Ser Arg Ser Phe Tyr Gly Met Ala 290 295 300 Asp Lys Val Asp Val Lys Thr Trp Lys Ser Thr Glu His Asn Met Gly 305 310 315 320 Leu Ala Leu Thr Arg Asn Ala Tyr Gln Lys Leu Ile Glu Cys Thr Asp 325 330 335 Thr Phe Cys Thr Tyr Asp Asp Tyr Asn Trp Asp Trp Thr Leu Gln Tyr 340 345 350 Leu Thr Val Ser Cys Leu Pro Lys Phe Trp Lys Val Leu Val Pro Gln 355 360 365 Ile Pro Arg Ile Phe His Ala Gly Asp Cys Gly Met His His Lys Lys 370 375 380 Thr Cys Arg Pro Ser Thr Gln Ser Ala Gln Ile Glu Ser Leu Leu Asn 385 390 395 400 Asn Asn Lys Gln Tyr Met Phe Pro Glu Thr Leu Thr Ile Ser Glu Lys 405 410 415 Phe Thr Val Val Ala Ile Ser Pro Pro Arg Lys Asn Gly Gly Trp Gly 420 425 430 Asp Ile Arg Asp His Glu Leu Cys Lys Ser Tyr Arg Arg Leu Gln Thr 435 440 445 Arg Pro Ala Pro Gly Arg Pro Pro Ser Val Ser Ala Leu Asp Gly Asp 450 455 460 Pro Ala Ser Leu Thr Arg Glu Val Ile Arg Leu Ala Gln Asp Ala Glu 465 470 475 480 Val Glu Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Gly Asp Ala 485 490 495 Leu Ser Ser Gln Arg Gly Arg Val Pro Thr Ala Ala Pro Pro Ala Gln 500 505 510 Pro Arg Val Pro Val Thr Pro Ala Pro Ala Val Ile Pro Ile Leu Val 515 520 525 Ile Ala Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu 530 535 540 His Tyr Arg Pro Ser Ala Glu Leu Phe Pro Ile Ile Val Ser Gln Asp 545 550 555 560 Cys Gly His Glu Glu Thr Ala Gln Ala Ile Ala Ser Tyr Gly Ser Ala 565 570 575 Val Thr His Ile Arg Gln Pro Asp Leu Ser Ser Ile Ala Val Pro Pro 580 585 590 Asp His Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg 595 600 605 Trp Ala Leu Gly Gln Val Phe Arg Gln Phe Arg Phe Pro Ala Ala Val 610 615 620 Val Val Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe 625 630 635 640 Arg Ala Thr Tyr Pro Leu Leu Lys Ala Asp Pro Ser Leu Trp Cys Val 645 650 655 Ser Ala Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ala Ser Arg 660 665 670 Pro Glu Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu 675 680 685 Leu Leu Ala Glu Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Lys Ala 690 695 700 Phe Trp Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Gln Gly Arg Ala 705 710 715 720 Cys Ile Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly 725 730 735 Val Ser His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu 740 745 750 Asn Gln Gln Phe Val His Phe Thr Gln Leu Asp Leu Ser Tyr Leu Gln 755 760 765 Arg Glu Ala Tyr Asp Arg Asp Phe Leu Ala Arg Val Tyr Gly Ala Pro 770 775 780 Gln Leu Gln Val Glu Lys Val Arg Thr Asn Asp Arg Lys Glu Leu Gly 785 790 795 800 Glu Val Arg Val Gln Tyr Thr Gly Arg Asp Ser Phe Lys Ala Phe Ala 805 810 815 Lys Ala Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala 820 825 830 Gly Tyr Arg Gly Ile Val Thr Phe Gln Phe Arg Gly Arg Arg Val His 835 840 845 Leu Ala Pro Pro Pro Thr Trp Glu Gly Tyr Asp Pro Ser Trp Asn 850 855 860 <210> 96 <211> 2592 <212> DNA <213> Homo sapiens <400> 96 atgcgcttcc gaatctacaa gcggaaggtc ctcattctga cccttgtcgt ggccgcttgc 60 ggctttgttc tctggtccag caacggtcgc cagcgtaaga acgaggccct ggcgcctccc 120 ctcttggacg ccgaaccggc cagaggcgca ggtggcaggg gaggggatca cccctcggtc 180 gctgtcggca tccgccgcgt cagcaatgtg tccgccgcct ctctggtccc ggcggttccg 240 cagcctgagg cagacaacct cacgctgcgc taccgatcac tcgtgtatca acttaacttc 300 gaccagactc tgcggaacgt cgacaaggcc ggaacctggg ctccgcgtga gttggtcctc 360 gtcgttcagg tgcacaacag gcccgagtac ctccgcctcc tgctggattc gcttcgaaag 420 gcccagggca tcgacaacgt cctggtgatt ttcagccatg acttttggtc cacagagatc 480 aatcagctca ttgcgggtgt caacttttgc cccgtcttgc aagttttctt ccctttctct 540 atccaactct accccaacga gttcccgggc agtgaccccc gcgactgtcc tcgggatctg 600 ccaaaaaacg ccgctctcaa gctgggctgc atcaacgccg aataccccga cagctttggc 660 cactatcgcg aggccaagtt ctcgcagacg aagcaccact ggtggtggaa gctccatttt 720 gtctgggagc gagtgaagat ccttcgtgat tacgcaggac tcattctgtt cttggaagag 780 gaccactacc tggccccgga cttctaccac gtctttaaga agatgtggaa gctcaagcag 840 caggaatgcc ccgagtgcga cgttctgtcc cttggcacct atagcgcgtc ccgctcgttc 900 tacggtatgg ctgacaaggt cgatgtgaaa acctggaagt caactgagca caatatgggc 960 ctcgccctga cgaggaacgc ctaccagaaa ctcatcgagt gtaccgacac cttctgcacg 1020 tacgacgact ataactggga ttggacactg cagtacttga ctgtcagctg cctccctaag 1080 ttttggaagg tccttgttcc ccagatcccg agaattttcc atgctggcga ctgcgggatg 1140 caccacaaga aaacctgtcg cccatccacg cagtctgccc aaatcgagtc gctcctgaac 1200 aacaacaagc agtacatgtt ccccgagaca ctgaccatta gcgagaagtt tacggtcgtg 1260 gcgatctccc cgcctcgaaa gaatggcggc tggggtgaca tccgcgatca cgagctgtgc 1320 aagtcttacc gccggctcca gacgcgccca gcacctggca ggccaccctc agtcagcgct 1380 ctcgatggcg accccgccag cctcacccgg gaagtgattc gcctggccca agacgccgag 1440 gtggagctgg agcggcagcg tgggctgctg cagcagatcg gggatgccct gtcgagccag 1500 cgggggaggg tgcccaccgc cgcccctccc gcccagccgc gtgtgcctgt gacccccgcg 1560 ccggcggtga ttcccatcct ggtcatcgcc tgtgaccgca gcactgttcg gcgctgcctg 1620 gacaagctgc tgcattatcg gccctcggct gagctcttcc ccatcatcgt cagccaggac 1680 tgcgggcacg aggagacggc ccaggccatc gcctcctacg gcagcgcggt cacgcacatc 1740 cggcagcccg acctgagcag cattgcggtg ccgccggacc accgcaagtt ccagggctac 1800 tacaagatcg cgcgccacta ccgctgggcg ctgggccagg tcttccggca gtttcgcttc 1860 cccgccgccg tggtggtgga ggatgacctg gaggtggccc cggacttctt cgagtacttt 1920 cgggccacct atccgctgct gaaggccgac ccctccctgt ggtgcgtctc ggcctggaat 1980 gacaacggca aggagcagat ggtggacgcc agcaggcctg agctgctcta ccgcaccgac 2040 tttttccctg gcctgggctg gctgctgttg gccgagctct gggctgagct ggagcccaag 2100 tggccaaagg ccttctggga cgactggatg cggcggccgg agcagcggca ggggcgggcc 2160 tgcatccgcc ctgagatctc aagaacgatg acctttggcc gcaagggtgt gagccacggg 2220 cagttctttg accagcacct caagttcatc aagctgaacc agcagtttgt gcacttcacc 2280 cagctggacc tgtcttacct gcagcgggag gcctatgacc gagatttcct cgcccgcgtc 2340 tacggtgctc cccagctgca ggtggagaaa gtgaggacca atgaccggaa ggagctgggg 2400 gaggtgcggg tgcagtacac gggcagggac agcttcaagg ctttcgccaa ggctctgggt 2460 gtcatggatg acctcaagtc gggggttccg agagctggct accggggcat tgtcaccttc 2520 cagttccggg gccgccgtgt ccacctggcg cccccaccga cgtgggaggg ctatgatccc 2580 agctggaatt ag 2592 <210> 97 <211> 1263 <212> DNA <213> Trichoderma reesei <400> 97 atggcgtcac tcatcaaaac tgccgtggac attgccaacg gccgccatgc gctgtccaga 60 tatgtcatct ttgggctctg gcttgcggat gcggtgctgt gcgggctgat tatctggaaa 120 gtgccttata cggaaatcga ctgggtcgcc tacatggagc aagtcaccca gttcgtccac 180 ggagagcgag actaccccaa gatggagggc ggcacagggc ccctggtgta tcccgcggcc 240 catgtgtaca tctacacagg gctctactac ctgacgaaca agggcaccga catcctgctg 300 gcgcagcagc tctttgccgt gctctacatg gctactctgg cggtcgtcat gacatgctac 360 tccaaggcca aggtcccgcc gtacatcttc ccgcttctca tcctctccaa aagacttcac 420 agcgtcttcg tcctgagatg cttcaacgac tgcttcgccg ccttcttcct ctggctctgc 480 atcttcttct tccagaggcg agagtggacc atcggagctc tcgcatacag catcggcctg 540 ggcgtcaaaa tgtcgctgct actggttctc cccgccgtgg tcatcgtcct ctacctcggc 600 cgcggcttca agggcgccct gcggctgctc tggctcatgg tgcaggtcca gctcctcctc 660 gccataccct tcatcacgac aaattggcgc ggctacctcg gccgtgcatt cgagctctcg 720 aggcagttca agtttgaatg gacagtcaat tggcgcatgc tgggcgagga tctgttcctc 780 agccggggct tctctatcac gctactggca tttcacgcca tcttcctcct cgcctttatc 840 ctcggccggt ggctgaagat tagggaacgg accgtactcg ggatgatccc ctatgtcatc 900 cgattcagat cgccctttac cgagcaggaa gagcgcgcca tctccaaccg cgtcgtcacg 960 cccggctatg tcatgtccac catcttgtcg gccaacgtgg tgggactgct gtttgcccgg 1020 tctctgcact accagttcta tgcatatctg gcgtgggcga ccccctatct cctgtggacg 1080 gcctgcccca atcttttggt ggtggccccc ctctgggcgg cgcaagaatg ggcctggaac 1140 gtcttcccca gcacgcctct tagctcgagc gtcgtggtga gcgtgctggc cgtgacggtg 1200 gccatggcgt ttgcaggttc aaatccgcag ccacgtgaaa catcgaagcc gaagcagcac 1260 taa 1263 <210> 98 <211> 420 <212> PRT <213> Trichoderma reesei <400> 98 Met Ala Ser Leu Ile Lys Thr Ala Val Asp Ile Ala Asn Gly Arg His 1 5 10 15 Ala Leu Ser Arg Tyr Val Ile Phe Gly Leu Trp Leu Ala Asp Ala Val 20 25 30 Leu Cys Gly Leu Ile Ile Trp Lys Val Pro Tyr Thr Glu Ile Asp Trp 35 40 45 Val Ala Tyr Met Glu Gln Val Thr Gln Phe Val His Gly Glu Arg Asp 50 55 60 Tyr Pro Lys Met Glu Gly Gly Thr Gly Pro Leu Val Tyr Pro Ala Ala 65 70 75 80 His Val Tyr Ile Tyr Thr Gly Leu Tyr Tyr Leu Thr Asn Lys Gly Thr 85 90 95 Asp Ile Leu Leu Ala Gln Gln Leu Phe Ala Val Leu Tyr Met Ala Thr 100 105 110 Leu Ala Val Val Met Thr Cys Tyr Ser Lys Ala Lys Val Pro Pro Tyr 115 120 125 Ile Phe Pro Leu Leu Ile Leu Ser Lys Arg Leu His Ser Val Phe Val 130 135 140 Leu Arg Cys Phe Asn Asp Cys Phe Ala Ala Phe Phe Leu Trp Leu Cys 145 150 155 160 Ile Phe Phe Phe Gln Arg Arg Glu Trp Thr Ile Gly Ala Leu Ala Tyr 165 170 175 Ser Ile Gly Leu Gly Val Lys Met Ser Leu Leu Leu Val Leu Pro Ala 180 185 190 Val Val Ile Val Leu Tyr Leu Gly Arg Gly Phe Lys Gly Ala Leu Arg 195 200 205 Leu Leu Trp Leu Met Val Gln Val Gln Leu Leu Leu Ala Ile Pro Phe 210 215 220 Ile Thr Thr Asn Trp Arg Gly Tyr Leu Gly Arg Ala Phe Glu Leu Ser 225 230 235 240 Arg Gln Phe Lys Phe Glu Trp Thr Val Asn Trp Arg Met Leu Gly Glu 245 250 255 Asp Leu Phe Leu Ser Arg Gly Phe Ser Ile Thr Leu Leu Ala Phe His 260 265 270 Ala Ile Phe Leu Leu Ala Phe Ile Leu Gly Arg Trp Leu Lys Ile Arg 275 280 285 Glu Arg Thr Val Leu Gly Met Ile Pro Tyr Val Ile Arg Phe Arg Ser 290 295 300 Pro Phe Thr Glu Gln Glu Glu Arg Ala Ile Ser Asn Arg Val Val Thr 305 310 315 320 Pro Gly Tyr Val Met Ser Thr Ile Leu Ser Ala Asn Val Val Gly Leu 325 330 335 Leu Phe Ala Arg Ser Leu His Tyr Gln Phe Tyr Ala Tyr Leu Ala Trp 340 345 350 Ala Thr Pro Tyr Leu Leu Trp Thr Ala Cys Pro Asn Leu Leu Val Val 355 360 365 Ala Pro Leu Trp Ala Ala Gln Glu Trp Ala Trp Asn Val Phe Pro Ser 370 375 380 Thr Pro Leu Ser Ser Ser Val Val Val Ser Val Leu Ala Val Thr Val 385 390 395 400 Ala Met Ala Phe Ala Gly Ser Asn Pro Gln Pro Arg Glu Thr Ser Lys 405 410 415 Pro Lys Gln His 420 <210> 99 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 99 gcaaatggca ttctgacatc c 21 <210> 100 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 100 gactggttcc aattgacaag c 21 <210> 101 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 101 cagtggtacc ctaattccag ctaggatcat agccctccca cg 42 <210> 102 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 102 cggaccaccg caagttcc 18 <210> 103 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 103 atgcggaatt ctgcatcatc atcatcatca tcgccagcgt aagaacgagg ccct 54 <210> 104 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 104 cctttctcta tccaactcta cc 22 <210> 105 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 105 ggaacttgcg gtggtccg 18 <210> 106 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 106 ccgccggctc cagggaggtg ggggcagtgg aggtggcggc agtgggaggg tgcccaccgc 60 cgcccc 66 <210> 107 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 107 gcggtgggca ccctcccact gccgccacct ccactgcccc cacctccctg gagccggcgg 60 taagac 66 <210> 108 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 108 aggtgggggc agtggaggtg gcggcagtgg cggcggtgga agtgggaggg tgcccaccgc 60 cgccc 65 <210> 109 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 109 cggtgggcac cctcccactt ccaccgccgc cactgccgcc acctccactg cccccacctc 60 cctg 64 <210> 110 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 110 gtttccgccg ggagggttgc cgccgctagg gttgccggtg ctctggagcc ggcggtaaga 60 cttgc 65 <210> 111 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 111 gcaaccctcc cggcggaaac ccgcctggca gcaccgggag ggtgcccacc gccgcccctc 60 ccgccc 66 <210> 112 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 112 ccgcctccag gaacagtggc gctggcggtg gccgtcgcgg cggagctctg gagccggcgg 60 taagacttgc 70 <210> 113 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 113 cgccactgtt cctggaggcg gtagcggccc caccagcggg agggtgccca ccgccgcccc 60 tcccgcccag c 71 <210> 114 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 114 cattagcgag aagtttacgg 20 <210> 115 <211> 106 <212> PRT <213> Trichoderma reesei <400> 115 Met Ala Ser Thr Asn Ala Arg Tyr Val Arg Tyr Leu Leu Ile Ala Phe 1 5 10 15 Phe Thr Ile Leu Val Phe Tyr Phe Val Ser Asn Ser Lys Tyr Glu Gly 20 25 30 Val Asp Leu Asn Lys Gly Thr Phe Thr Ala Pro Asp Ser Thr Lys Thr 35 40 45 Thr Pro Lys Pro Pro Ala Thr Gly Asp Ala Lys Asp Phe Pro Leu Ala 50 55 60 Leu Thr Pro Asn Asp Pro Gly Phe Asn Asp Leu Val Gly Ile Ala Pro 65 70 75 80 Gly Pro Arg Met Asn Ala Thr Phe Val Thr Leu Ala Arg Asn Ser Asp 85 90 95 Val Trp Asp Ile Ala Arg Ser Ile Arg Gln 100 105 <210> 116 <211> 83 <212> PRT <213> Trichoderma reesei <400> 116 Met Ala Ser Thr Asn Ala Arg Tyr Val Arg Tyr Leu Leu Ile Ala Phe 1 5 10 15 Phe Thr Ile Leu Val Phe Tyr Phe Val Ser Asn Ser Lys Tyr Glu Gly 20 25 30 Val Asp Leu Asn Lys Gly Thr Phe Thr Ala Pro Asp Ser Thr Lys Thr 35 40 45 Thr Pro Lys Pro Pro Ala Thr Gly Asp Ala Lys Asp Phe Pro Leu Ala 50 55 60 Leu Thr Pro Asn Asp Pro Gly Phe Asn Asp Leu Val Gly Ile Ala Pro 65 70 75 80 Gly Pro Arg <210> 117 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthesized Construct <400> 117 Asp Tyr Lys Asp Asp Asp Asp Lys 1 5 <210> 118 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Synthesized Construct <400> 118 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 15 <210> 119 <211> 824 <212> PRT <213> Artificial Sequence <220> <223> Synthesized Construct <400> 119 Met Arg Phe Arg Ile Tyr Lys Arg Lys Val Leu Ile Leu Thr Leu Val 1 5 10 15 Val Ala Ala Cys Gly Phe Val Leu Trp Ser Ser Asn Gly Arg Gln Arg 20 25 30 Lys Asn Glu Ala Leu Ala Pro Pro Leu Leu Asp Ala Glu Pro Ala Arg 35 40 45 Gly Ala Gly Gly Arg Gly Gly Asp His Pro Ser Val Ala Val Gly Ile 50 55 60 Arg Arg Val Ser Asn Val Ser Ala Ala Ser Leu Val Pro Ala Val Pro 65 70 75 80 Gln Pro Glu Ala Asp Asn Leu Thr Leu Arg Tyr Arg Ser Leu Val Tyr 85 90 95 Gln Leu Asn Phe Asp Gln Thr Leu Arg Asn Val Asp Lys Ala Gly Thr 100 105 110 Trp Ala Pro Arg Glu Leu Val Leu Val Val Gln Val His Asn Arg Pro 115 120 125 Glu Tyr Leu Arg Leu Leu Leu Asp Ser Leu Arg Lys Ala Gln Gly Ile 130 135 140 Asp Asn Val Leu Val Ile Phe Ser His Asp Phe Trp Ser Thr Glu Ile 145 150 155 160 Asn Gln Leu Ile Ala Gly Val Asn Phe Cys Pro Val Leu Gln Val Phe 165 170 175 Phe Pro Phe Ser Ile Gln Leu Tyr Pro Asn Glu Phe Pro Gly Ser Asp 180 185 190 Pro Arg Asp Cys Pro Arg Asp Leu Pro Lys Asn Ala Ala Leu Lys Leu 195 200 205 Gly Cys Ile Asn Ala Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu 210 215 220 Ala Lys Phe Ser Gln Thr Lys His His Trp Trp Trp Lys Leu His Phe 225 230 235 240 Val Trp Glu Arg Val Lys Ile Leu Arg Asp Tyr Ala Gly Leu Ile Leu 245 250 255 Phe Leu Glu Glu Asp His Tyr Leu Ala Pro Asp Phe Tyr His Val Phe 260 265 270 Lys Lys Met Trp Lys Leu Lys Gln Gln Glu Cys Pro Glu Cys Asp Val 275 280 285 Leu Ser Leu Gly Thr Tyr Ser Ala Ser Arg Ser Phe Tyr Gly Met Ala 290 295 300 Asp Lys Val Asp Val Lys Thr Trp Lys Ser Thr Glu His Asn Met Gly 305 310 315 320 Leu Ala Leu Thr Arg Asn Ala Tyr Gln Lys Leu Ile Glu Cys Thr Asp 325 330 335 Thr Phe Cys Thr Tyr Asp Asp Tyr Asn Trp Asp Trp Thr Leu Gln Tyr 340 345 350 Leu Thr Val Ser Cys Leu Pro Lys Phe Trp Lys Val Leu Val Pro Gln 355 360 365 Ile Pro Arg Ile Phe His Ala Gly Asp Cys Gly Met His His Lys Lys 370 375 380 Thr Cys Arg Pro Ser Thr Gln Ser Ala Gln Ile Glu Ser Leu Leu Asn 385 390 395 400 Asn Asn Lys Gln Tyr Met Phe Pro Glu Thr Leu Thr Ile Ser Glu Lys 405 410 415 Phe Thr Val Val Ala Ile Ser Pro Pro Arg Lys Asn Gly Gly Trp Gly 420 425 430 Asp Ile Arg Asp His Glu Leu Cys Lys Ser Tyr Arg Arg Leu Gln Gly 435 440 445 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Arg 450 455 460 Val Pro Thr Ala Ala Pro Pro Ala Gln Pro Arg Val Pro Val Thr Pro 465 470 475 480 Ala Pro Ala Val Ile Pro Ile Leu Val Ile Ala Cys Asp Arg Ser Thr 485 490 495 Val Arg Arg Cys Leu Asp Lys Leu Leu His Tyr Arg Pro Ser Ala Glu 500 505 510 Leu Phe Pro Ile Ile Val Ser Gln Asp Cys Gly His Glu Glu Thr Ala 515 520 525 Gln Ala Ile Ala Ser Tyr Gly Ser Ala Val Thr His Ile Arg Gln Pro 530 535 540 Asp Leu Ser Ser Ile Ala Val Pro Pro Asp His Arg Lys Phe Gln Gly 545 550 555 560 Tyr Tyr Lys Ile Ala Arg His Tyr Arg Trp Ala Leu Gly Gln Val Phe 565 570 575 Arg Gln Phe Arg Phe Pro Ala Ala Val Val Val Glu Asp Asp Leu Glu 580 585 590 Val Ala Pro Asp Phe Phe Glu Tyr Phe Arg Ala Thr Tyr Pro Leu Leu 595 600 605 Lys Ala Asp Pro Ser Leu Trp Cys Val Ser Ala Trp Asn Asp Asn Gly 610 615 620 Lys Glu Gln Met Val Asp Ala Ser Arg Pro Glu Leu Leu Tyr Arg Thr 625 630 635 640 Asp Phe Phe Pro Gly Leu Gly Trp Leu Leu Leu Ala Glu Leu Trp Ala 645 650 655 Glu Leu Glu Pro Lys Trp Pro Lys Ala Phe Trp Asp Asp Trp Met Arg 660 665 670 Arg Pro Glu Gln Arg Gln Gly Arg Ala Cys Ile Arg Pro Glu Ile Ser 675 680 685 Arg Thr Met Thr Phe Gly Arg Lys Gly Val Ser His Gly Gln Phe Phe 690 695 700 Asp Gln His Leu Lys Phe Ile Lys Leu Asn Gln Gln Phe Val His Phe 705 710 715 720 Thr Gln Leu Asp Leu Ser Tyr Leu Gln Arg Glu Ala Tyr Asp Arg Asp 725 730 735 Phe Leu Ala Arg Val Tyr Gly Ala Pro Gln Leu Gln Val Glu Lys Val 740 745 750 Arg Thr Asn Asp Arg Lys Glu Leu Gly Glu Val Arg Val Gln Tyr Thr 755 760 765 Gly Arg Asp Ser Phe Lys Ala Phe Ala Lys Ala Leu Gly Val Met Asp 770 775 780 Asp Leu Lys Ser Gly Val Pro Arg Ala Gly Tyr Arg Gly Ile Val Thr 785 790 795 800 Phe Gln Phe Arg Gly Arg Arg Val His Leu Ala Pro Pro Pro Thr Trp 805 810 815 Glu Gly Tyr Asp Pro Ser Trp Asn 820 <210> 120 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthesized Construct <400> 120 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 <210> 121 <211> 819 <212> PRT <213> Artificial Sequence <220> <223> Synthesized Construct <400> 121 Met Arg Phe Arg Ile Tyr Lys Arg Lys Val Leu Ile Leu Thr Leu Val 1 5 10 15 Val Ala Ala Cys Gly Phe Val Leu Trp Ser Ser Asn Gly Arg Gln Arg 20 25 30 Lys Asn Glu Ala Leu Ala Pro Pro Leu Leu Asp Ala Glu Pro Ala Arg 35 40 45 Gly Ala Gly Gly Arg Gly Gly Asp His Pro Ser Val Ala Val Gly Ile 50 55 60 Arg Arg Val Ser Asn Val Ser Ala Ala Ser Leu Val Pro Ala Val Pro 65 70 75 80 Gln Pro Glu Ala Asp Asn Leu Thr Leu Arg Tyr Arg Ser Leu Val Tyr 85 90 95 Gln Leu Asn Phe Asp Gln Thr Leu Arg Asn Val Asp Lys Ala Gly Thr 100 105 110 Trp Ala Pro Arg Glu Leu Val Leu Val Val Gln Val His Asn Arg Pro 115 120 125 Glu Tyr Leu Arg Leu Leu Leu Asp Ser Leu Arg Lys Ala Gln Gly Ile 130 135 140 Asp Asn Val Leu Val Ile Phe Ser His Asp Phe Trp Ser Thr Glu Ile 145 150 155 160 Asn Gln Leu Ile Ala Gly Val Asn Phe Cys Pro Val Leu Gln Val Phe 165 170 175 Phe Pro Phe Ser Ile Gln Leu Tyr Pro Asn Glu Phe Pro Gly Ser Asp 180 185 190 Pro Arg Asp Cys Pro Arg Asp Leu Pro Lys Asn Ala Ala Leu Lys Leu 195 200 205 Gly Cys Ile Asn Ala Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu 210 215 220 Ala Lys Phe Ser Gln Thr Lys His His Trp Trp Trp Lys Leu His Phe 225 230 235 240 Val Trp Glu Arg Val Lys Ile Leu Arg Asp Tyr Ala Gly Leu Ile Leu 245 250 255 Phe Leu Glu Glu Asp His Tyr Leu Ala Pro Asp Phe Tyr His Val Phe 260 265 270 Lys Lys Met Trp Lys Leu Lys Gln Gln Glu Cys Pro Glu Cys Asp Val 275 280 285 Leu Ser Leu Gly Thr Tyr Ser Ala Ser Arg Ser Phe Tyr Gly Met Ala 290 295 300 Asp Lys Val Asp Val Lys Thr Trp Lys Ser Thr Glu His Asn Met Gly 305 310 315 320 Leu Ala Leu Thr Arg Asn Ala Tyr Gln Lys Leu Ile Glu Cys Thr Asp 325 330 335 Thr Phe Cys Thr Tyr Asp Asp Tyr Asn Trp Asp Trp Thr Leu Gln Tyr 340 345 350 Leu Thr Val Ser Cys Leu Pro Lys Phe Trp Lys Val Leu Val Pro Gln 355 360 365 Ile Pro Arg Ile Phe His Ala Gly Asp Cys Gly Met His His Lys Lys 370 375 380 Thr Cys Arg Pro Ser Thr Gln Ser Ala Gln Ile Glu Ser Leu Leu Asn 385 390 395 400 Asn Asn Lys Gln Tyr Met Phe Pro Glu Thr Leu Thr Ile Ser Glu Lys 405 410 415 Phe Thr Val Val Ala Ile Ser Pro Pro Arg Lys Asn Gly Gly Trp Gly 420 425 430 Asp Ile Arg Asp His Glu Leu Cys Lys Ser Tyr Arg Arg Leu Gln Gly 435 440 445 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Arg Val Pro Thr Ala Ala 450 455 460 Pro Pro Ala Gln Pro Arg Val Pro Val Thr Pro Ala Pro Ala Val Ile 465 470 475 480 Pro Ile Leu Val Ile Ala Cys Asp Arg Ser Thr Val Arg Arg Cys Leu 485 490 495 Asp Lys Leu Leu His Tyr Arg Pro Ser Ala Glu Leu Phe Pro Ile Ile 500 505 510 Val Ser Gln Asp Cys Gly His Glu Glu Thr Ala Gln Ala Ile Ala Ser 515 520 525 Tyr Gly Ser Ala Val Thr His Ile Arg Gln Pro Asp Leu Ser Ser Ile 530 535 540 Ala Val Pro Pro Asp His Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala 545 550 555 560 Arg His Tyr Arg Trp Ala Leu Gly Gln Val Phe Arg Gln Phe Arg Phe 565 570 575 Pro Ala Ala Val Val Val Glu Asp Asp Leu Glu Val Ala Pro Asp Phe 580 585 590 Phe Glu Tyr Phe Arg Ala Thr Tyr Pro Leu Leu Lys Ala Asp Pro Ser 595 600 605 Leu Trp Cys Val Ser Ala Trp Asn Asp Asn Gly Lys Glu Gln Met Val 610 615 620 Asp Ala Ser Arg Pro Glu Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly 625 630 635 640 Leu Gly Trp Leu Leu Leu Ala Glu Leu Trp Ala Glu Leu Glu Pro Lys 645 650 655 Trp Pro Lys Ala Phe Trp Asp Asp Trp Met Arg Arg Pro Glu Gln Arg 660 665 670 Gln Gly Arg Ala Cys Ile Arg Pro Glu Ile Ser Arg Thr Met Thr Phe 675 680 685 Gly Arg Lys Gly Val Ser His Gly Gln Phe Phe Asp Gln His Leu Lys 690 695 700 Phe Ile Lys Leu Asn Gln Gln Phe Val His Phe Thr Gln Leu Asp Leu 705 710 715 720 Ser Tyr Leu Gln Arg Glu Ala Tyr Asp Arg Asp Phe Leu Ala Arg Val 725 730 735 Tyr Gly Ala Pro Gln Leu Gln Val Glu Lys Val Arg Thr Asn Asp Arg 740 745 750 Lys Glu Leu Gly Glu Val Arg Val Gln Tyr Thr Gly Arg Asp Ser Phe 755 760 765 Lys Ala Phe Ala Lys Ala Leu Gly Val Met Asp Asp Leu Lys Ser Gly 770 775 780 Val Pro Arg Ala Gly Tyr Arg Gly Ile Val Thr Phe Gln Phe Arg Gly 785 790 795 800 Arg Arg Val His Leu Ala Pro Pro Pro Thr Trp Glu Gly Tyr Asp Pro 805 810 815 Ser Trp Asn <210> 122 <211> 19 <212> PRT <213> Trichoderma reesei <400> 122 Ser Thr Gly Asn Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro 1 5 10 15 Gly Ser Thr <210> 123 <211> 828 <212> PRT <213> Trichoderma reesei <400> 123 Met Arg Phe Arg Ile Tyr Lys Arg Lys Val Leu Ile Leu Thr Leu Val 1 5 10 15 Val Ala Ala Cys Gly Phe Val Leu Trp Ser Ser Asn Gly Arg Gln Arg 20 25 30 Lys Asn Glu Ala Leu Ala Pro Pro Leu Leu Asp Ala Glu Pro Ala Arg 35 40 45 Gly Ala Gly Gly Arg Gly Gly Asp His Pro Ser Val Ala Val Gly Ile 50 55 60 Arg Arg Val Ser Asn Val Ser Ala Ala Ser Leu Val Pro Ala Val Pro 65 70 75 80 Gln Pro Glu Ala Asp Asn Leu Thr Leu Arg Tyr Arg Ser Leu Val Tyr 85 90 95 Gln Leu Asn Phe Asp Gln Thr Leu Arg Asn Val Asp Lys Ala Gly Thr 100 105 110 Trp Ala Pro Arg Glu Leu Val Leu Val Val Gln Val His Asn Arg Pro 115 120 125 Glu Tyr Leu Arg Leu Leu Leu Asp Ser Leu Arg Lys Ala Gln Gly Ile 130 135 140 Asp Asn Val Leu Val Ile Phe Ser His Asp Phe Trp Ser Thr Glu Ile 145 150 155 160 Asn Gln Leu Ile Ala Gly Val Asn Phe Cys Pro Val Leu Gln Val Phe 165 170 175 Phe Pro Phe Ser Ile Gln Leu Tyr Pro Asn Glu Phe Pro Gly Ser Asp 180 185 190 Pro Arg Asp Cys Pro Arg Asp Leu Pro Lys Asn Ala Ala Leu Lys Leu 195 200 205 Gly Cys Ile Asn Ala Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu 210 215 220 Ala Lys Phe Ser Gln Thr Lys His His Trp Trp Trp Lys Leu His Phe 225 230 235 240 Val Trp Glu Arg Val Lys Ile Leu Arg Asp Tyr Ala Gly Leu Ile Leu 245 250 255 Phe Leu Glu Glu Asp His Tyr Leu Ala Pro Asp Phe Tyr His Val Phe 260 265 270 Lys Lys Met Trp Lys Leu Lys Gln Gln Glu Cys Pro Glu Cys Asp Val 275 280 285 Leu Ser Leu Gly Thr Tyr Ser Ala Ser Arg Ser Phe Tyr Gly Met Ala 290 295 300 Asp Lys Val Asp Val Lys Thr Trp Lys Ser Thr Glu His Asn Met Gly 305 310 315 320 Leu Ala Leu Thr Arg Asn Ala Tyr Gln Lys Leu Ile Glu Cys Thr Asp 325 330 335 Thr Phe Cys Thr Tyr Asp Asp Tyr Asn Trp Asp Trp Thr Leu Gln Tyr 340 345 350 Leu Thr Val Ser Cys Leu Pro Lys Phe Trp Lys Val Leu Val Pro Gln 355 360 365 Ile Pro Arg Ile Phe His Ala Gly Asp Cys Gly Met His His Lys Lys 370 375 380 Thr Cys Arg Pro Ser Thr Gln Ser Ala Gln Ile Glu Ser Leu Leu Asn 385 390 395 400 Asn Asn Lys Gln Tyr Met Phe Pro Glu Thr Leu Thr Ile Ser Glu Lys 405 410 415 Phe Thr Val Val Ala Ile Ser Pro Pro Arg Lys Asn Gly Gly Trp Gly 420 425 430 Asp Ile Arg Asp His Glu Leu Cys Lys Ser Tyr Arg Arg Leu Gln Ser 435 440 445 Thr Gly Asn Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly 450 455 460 Ser Thr Gly Arg Val Pro Thr Ala Ala Pro Pro Ala Gln Pro Arg Val 465 470 475 480 Pro Val Thr Pro Ala Pro Ala Val Ile Pro Ile Leu Val Ile Ala Cys 485 490 495 Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu His Tyr Arg 500 505 510 Pro Ser Ala Glu Leu Phe Pro Ile Ile Val Ser Gln Asp Cys Gly His 515 520 525 Glu Glu Thr Ala Gln Ala Ile Ala Ser Tyr Gly Ser Ala Val Thr His 530 535 540 Ile Arg Gln Pro Asp Leu Ser Ser Ile Ala Val Pro Pro Asp His Arg 545 550 555 560 Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg Trp Ala Leu 565 570 575 Gly Gln Val Phe Arg Gln Phe Arg Phe Pro Ala Ala Val Val Val Glu 580 585 590 Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe Arg Ala Thr 595 600 605 Tyr Pro Leu Leu Lys Ala Asp Pro Ser Leu Trp Cys Val Ser Ala Trp 610 615 620 Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ala Ser Arg Pro Glu Leu 625 630 635 640 Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu Leu Leu Ala 645 650 655 Glu Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Lys Ala Phe Trp Asp 660 665 670 Asp Trp Met Arg Arg Pro Glu Gln Arg Gln Gly Arg Ala Cys Ile Arg 675 680 685 Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly Val Ser His 690 695 700 Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu Asn Gln Gln 705 710 715 720 Phe Val His Phe Thr Gln Leu Asp Leu Ser Tyr Leu Gln Arg Glu Ala 725 730 735 Tyr Asp Arg Asp Phe Leu Ala Arg Val Tyr Gly Ala Pro Gln Leu Gln 740 745 750 Val Glu Lys Val Arg Thr Asn Asp Arg Lys Glu Leu Gly Glu Val Arg 755 760 765 Val Gln Tyr Thr Gly Arg Asp Ser Phe Lys Ala Phe Ala Lys Ala Leu 770 775 780 Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala Gly Tyr Arg 785 790 795 800 Gly Ile Val Thr Phe Gln Phe Arg Gly Arg Arg Val His Leu Ala Pro 805 810 815 Pro Pro Thr Trp Glu Gly Tyr Asp Pro Ser Trp Asn 820 825 <210> 124 <211> 21 <212> PRT <213> Trichoderma reesei <400> 124 Ser Ser Ala Ala Thr Ala Thr Ala Ser Ala Thr Val Pro Gly Gly Gly 1 5 10 15 Ser Gly Pro Thr Ser 20 <210> 125 <211> 830 <212> PRT <213> Trichoderma reesei <400> 125 Met Arg Phe Arg Ile Tyr Lys Arg Lys Val Leu Ile Leu Thr Leu Val 1 5 10 15 Val Ala Ala Cys Gly Phe Val Leu Trp Ser Ser Asn Gly Arg Gln Arg 20 25 30 Lys Asn Glu Ala Leu Ala Pro Pro Leu Leu Asp Ala Glu Pro Ala Arg 35 40 45 Gly Ala Gly Gly Arg Gly Gly Asp His Pro Ser Val Ala Val Gly Ile 50 55 60 Arg Arg Val Ser Asn Val Ser Ala Ala Ser Leu Val Pro Ala Val Pro 65 70 75 80 Gln Pro Glu Ala Asp Asn Leu Thr Leu Arg Tyr Arg Ser Leu Val Tyr 85 90 95 Gln Leu Asn Phe Asp Gln Thr Leu Arg Asn Val Asp Lys Ala Gly Thr 100 105 110 Trp Ala Pro Arg Glu Leu Val Leu Val Val Gln Val His Asn Arg Pro 115 120 125 Glu Tyr Leu Arg Leu Leu Leu Asp Ser Leu Arg Lys Ala Gln Gly Ile 130 135 140 Asp Asn Val Leu Val Ile Phe Ser His Asp Phe Trp Ser Thr Glu Ile 145 150 155 160 Asn Gln Leu Ile Ala Gly Val Asn Phe Cys Pro Val Leu Gln Val Phe 165 170 175 Phe Pro Phe Ser Ile Gln Leu Tyr Pro Asn Glu Phe Pro Gly Ser Asp 180 185 190 Pro Arg Asp Cys Pro Arg Asp Leu Pro Lys Asn Ala Ala Leu Lys Leu 195 200 205 Gly Cys Ile Asn Ala Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu 210 215 220 Ala Lys Phe Ser Gln Thr Lys His His Trp Trp Trp Lys Leu His Phe 225 230 235 240 Val Trp Glu Arg Val Lys Ile Leu Arg Asp Tyr Ala Gly Leu Ile Leu 245 250 255 Phe Leu Glu Glu Asp His Tyr Leu Ala Pro Asp Phe Tyr His Val Phe 260 265 270 Lys Lys Met Trp Lys Leu Lys Gln Gln Glu Cys Pro Glu Cys Asp Val 275 280 285 Leu Ser Leu Gly Thr Tyr Ser Ala Ser Arg Ser Phe Tyr Gly Met Ala 290 295 300 Asp Lys Val Asp Val Lys Thr Trp Lys Ser Thr Glu His Asn Met Gly 305 310 315 320 Leu Ala Leu Thr Arg Asn Ala Tyr Gln Lys Leu Ile Glu Cys Thr Asp 325 330 335 Thr Phe Cys Thr Tyr Asp Asp Tyr Asn Trp Asp Trp Thr Leu Gln Tyr 340 345 350 Leu Thr Val Ser Cys Leu Pro Lys Phe Trp Lys Val Leu Val Pro Gln 355 360 365 Ile Pro Arg Ile Phe His Ala Gly Asp Cys Gly Met His His Lys Lys 370 375 380 Thr Cys Arg Pro Ser Thr Gln Ser Ala Gln Ile Glu Ser Leu Leu Asn 385 390 395 400 Asn Asn Lys Gln Tyr Met Phe Pro Glu Thr Leu Thr Ile Ser Glu Lys 405 410 415 Phe Thr Val Val Ala Ile Ser Pro Pro Arg Lys Asn Gly Gly Trp Gly 420 425 430 Asp Ile Arg Asp His Glu Leu Cys Lys Ser Tyr Arg Arg Leu Gln Ser 435 440 445 Ser Ala Ala Thr Ala Thr Ala Ser Ala Thr Val Pro Gly Gly Gly Ser 450 455 460 Gly Pro Thr Ser Gly Arg Val Pro Thr Ala Ala Pro Pro Ala Gln Pro 465 470 475 480 Arg Val Pro Val Thr Pro Ala Pro Ala Val Ile Pro Ile Leu Val Ile 485 490 495 Ala Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu His 500 505 510 Tyr Arg Pro Ser Ala Glu Leu Phe Pro Ile Ile Val Ser Gln Asp Cys 515 520 525 Gly His Glu Glu Thr Ala Gln Ala Ile Ala Ser Tyr Gly Ser Ala Val 530 535 540 Thr His Ile Arg Gln Pro Asp Leu Ser Ser Ile Ala Val Pro Pro Asp 545 550 555 560 His Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg Trp 565 570 575 Ala Leu Gly Gln Val Phe Arg Gln Phe Arg Phe Pro Ala Ala Val Val 580 585 590 Val Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe Arg 595 600 605 Ala Thr Tyr Pro Leu Leu Lys Ala Asp Pro Ser Leu Trp Cys Val Ser 610 615 620 Ala Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ala Ser Arg Pro 625 630 635 640 Glu Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu Leu 645 650 655 Leu Ala Glu Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Lys Ala Phe 660 665 670 Trp Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Gln Gly Arg Ala Cys 675 680 685 Ile Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly Val 690 695 700 Ser His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu Asn 705 710 715 720 Gln Gln Phe Val His Phe Thr Gln Leu Asp Leu Ser Tyr Leu Gln Arg 725 730 735 Glu Ala Tyr Asp Arg Asp Phe Leu Ala Arg Val Tyr Gly Ala Pro Gln 740 745 750 Leu Gln Val Glu Lys Val Arg Thr Asn Asp Arg Lys Glu Leu Gly Glu 755 760 765 Val Arg Val Gln Tyr Thr Gly Arg Asp Ser Phe Lys Ala Phe Ala Lys 770 775 780 Ala Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala Gly 785 790 795 800 Tyr Arg Gly Ile Val Thr Phe Gln Phe Arg Gly Arg Arg Val His Leu 805 810 815 Ala Pro Pro Pro Thr Trp Glu Gly Tyr Asp Pro Ser Trp Asn 820 825 830 <210> 126 <211> 420 <212> PRT <213> Trichoderma reesei <400> 126 Met Ala Ser Leu Ile Lys Thr Ala Val Asp Ile Ala Asn Gly Arg His 1 5 10 15 Ala Leu Ser Arg Tyr Val Ile Phe Gly Leu Trp Leu Ala Asp Ala Val 20 25 30 Leu Cys Gly Leu Ile Ile Trp Lys Val Pro Tyr Thr Glu Ile Asp Trp 35 40 45 Val Ala Tyr Met Glu Gln Val Thr Gln Phe Val His Gly Glu Arg Asp 50 55 60 Tyr Pro Lys Met Glu Gly Gly Thr Gly Pro Leu Val Tyr Pro Ala Ala 65 70 75 80 His Val Tyr Ile Tyr Thr Gly Leu Tyr Tyr Leu Thr Asn Lys Gly Thr 85 90 95 Asp Ile Leu Leu Ala Gln Gln Leu Phe Ala Val Leu Tyr Met Ala Thr 100 105 110 Leu Ala Val Val Met Thr Cys Tyr Ser Lys Ala Lys Val Pro Pro Tyr 115 120 125 Ile Phe Pro Leu Leu Ile Leu Ser Lys Arg Leu His Ser Val Phe Val 130 135 140 Leu Arg Cys Phe Asn Asp Cys Phe Ala Ala Phe Phe Leu Trp Leu Cys 145 150 155 160 Ile Phe Phe Phe Gln Arg Arg Glu Trp Thr Ile Gly Ala Leu Ala Tyr 165 170 175 Ser Ile Gly Leu Gly Val Lys Met Ser Leu Leu Leu Val Leu Pro Ala 180 185 190 Val Val Ile Val Leu Tyr Leu Gly Arg Gly Phe Lys Gly Ala Leu Arg 195 200 205 Leu Leu Trp Leu Met Val Gln Val Gln Leu Leu Leu Ala Ile Pro Phe 210 215 220 Ile Thr Thr Asn Trp Arg Gly Tyr Leu Gly Arg Ala Phe Glu Leu Ser 225 230 235 240 Arg Gln Phe Lys Phe Glu Trp Thr Val Asn Trp Arg Met Leu Gly Glu 245 250 255 Asp Leu Phe Leu Ser Arg Gly Phe Ser Ile Thr Leu Leu Ala Phe His 260 265 270 Ala Ile Phe Leu Leu Ala Phe Ile Leu Gly Arg Trp Leu Lys Ile Arg 275 280 285 Glu Arg Thr Val Leu Gly Met Ile Pro Tyr Val Ile Arg Phe Arg Ser 290 295 300 Pro Phe Thr Glu Gln Glu Glu Arg Ala Ile Ser Asn Arg Val Val Thr 305 310 315 320 Pro Gly Tyr Val Met Ser Thr Ile Leu Ser Ala Asn Val Val Gly Leu 325 330 335 Leu Phe Ala Arg Ser Leu His Tyr Gln Phe Tyr Ala Tyr Leu Ala Trp 340 345 350 Ala Thr Pro Tyr Leu Leu Trp Thr Ala Cys Pro Asn Leu Leu Val Val 355 360 365 Ala Pro Leu Trp Ala Ala Gln Glu Trp Ala Trp Asn Val Phe Pro Ser 370 375 380 Thr Pro Leu Ser Ser Ser Val Val Val Ser Val Leu Ala Val Thr Val 385 390 395 400 Ala Met Ala Phe Ala Gly Ser Asn Pro Gln Pro Arg Glu Thr Ser Lys 405 410 415 Pro Lys Gln His 420 <210> 127 <211> 525 <212> PRT <213> Trichoderma atroviride <400> 127 Met Ala Ser Leu Ile Lys Phe Ala Ser Asp Val Ala Thr Gly Arg His 1 5 10 15 Ala Leu Ser Lys Leu Ile Pro Val Gly Leu Phe Leu Ala Asp Ala Ile 20 25 30 Leu Cys Gly Leu Val Ile Trp Lys Val Pro Tyr Thr Glu Ile Asp Trp 35 40 45 Thr Ala Tyr Met Glu Gln Val Thr Gln Phe Val Asn Gly Glu Arg Asp 50 55 60 Tyr Pro Lys Met Glu Gly Gly Thr Gly Pro Leu Val Tyr Pro Ala Ala 65 70 75 80 His Val Tyr Ile Tyr Thr Gly Leu Tyr Tyr Leu Thr Asn Arg Gly Thr 85 90 95 Asp Ile Leu Leu Ala Gln Gln Leu Phe Ala Val Leu Tyr Met Ala Thr 100 105 110 Leu Gly Val Val Met Leu Ser Tyr Trp Lys Ala Arg Val Pro Pro Tyr 115 120 125 Ile Phe Pro Leu Leu Ile Leu Ser Lys Arg Leu His Ser Val Phe Val 130 135 140 Leu Arg Cys Phe Asn Asp Cys Phe Ala Ala Phe Phe Leu Trp Leu Cys 145 150 155 160 Ile Tyr Ser Phe Gln Asn Arg Ala Trp Thr Phe Gly Ala Leu Ala Tyr 165 170 175 Thr Leu Gly Leu Gly Val Lys Met Ser Leu Leu Leu Val Leu Pro Ala 180 185 190 Val Val Ile Ile Leu Phe Leu Gly Arg Gly Phe Lys Gly Ala Leu Arg 195 200 205 Leu Val Trp Leu Met Ala Gln Val Gln Leu Val Leu Ala Ile Pro Phe 210 215 220 Ile Thr Thr Asn Trp Ala Gly Tyr Leu Gly Arg Ala Phe Glu Leu Ser 225 230 235 240 Arg Gln Phe Lys Phe Glu Trp Thr Val Asn Trp Arg Met Met Gly Glu 245 250 255 Glu Thr Phe Leu Ser Arg Gly Phe Ser Ile Thr Leu Leu Thr Phe His 260 265 270 Val Val Thr Leu Leu Val Phe Ile Ala Ala Arg Trp Leu Lys Leu Gln 275 280 285 Glu Arg Ser Leu Leu Gly Ile Ile Thr Tyr Ala Val Arg Phe Gln Ser 290 295 300 Pro Phe Thr Glu Gln Glu Glu Ala Lys Val Ser Lys Lys Val Val Thr 305 310 315 320 Pro Arg Tyr Val Leu Ala Thr Ile Leu Ser Ala Asn Val Ile Gly Leu 325 330 335 Leu Phe Ala Arg Ser Leu His Tyr Gln Phe Tyr Ala Tyr Leu Ala Trp 340 345 350 Ala Thr Pro Phe Leu Leu Trp Thr Ala Tyr Pro Asn Leu Leu Val Val 355 360 365 Val Pro Leu Trp Leu Ala Gln Glu Trp Ala Trp Asn Val Phe Pro Ser 370 375 380 Thr Pro Leu Ser Ser Ser Val Val Ile Ser Leu Val Pro Val Cys Leu 385 390 395 400 Leu Ser Pro Gln Leu Leu Val Ser His Asp Ile Tyr Asn Phe Ala Asn 405 410 415 Cys Ser Ala Ile Leu Arg Pro Arg Gly Ile Ala Phe Gly Gln Asp Ile 420 425 430 Ser Ala Thr Leu Asn Pro Asp Gly Val Ala Lys Pro Leu Gly Glu Leu 435 440 445 Glu Asn Asp Gly Leu Arg Val Trp His Leu Ala Ser Val Gln Val Val 450 455 460 Ser Phe Gly Leu His His Ala His Asn Glu Leu Gly Gly Leu Gln Phe 465 470 475 480 Gly Trp Trp Arg Glu Arg Phe Leu Arg Gly Gly Glu Asp Val Ala Leu 485 490 495 Trp Phe Ala His Gly Gly Phe Glu Phe Arg Phe Phe Ser Glu Leu Leu 500 505 510 Val Arg Leu Ala Asp Thr Ser Asp Ile Lys Lys Ser Phe 515 520 525 <210> 128 <211> 419 <212> PRT <213> Trichoderma virens <400> 128 Met Ala Ser Leu Ile Lys Phe Ala Ser Asp Val Ala Asn Gly Arg His 1 5 10 15 Ala Leu Ser Lys Phe Ile Pro Met Gly Leu Trp Leu Ala Asp Ala Val 20 25 30 Leu Cys Gly Leu Ile Ile Trp Lys Val Pro Tyr Thr Glu Ile Asp Trp 35 40 45 Val Ala Tyr Met Glu Gln Ile Thr Gln Phe Val His Gly Glu Arg Asp 50 55 60 Tyr Pro Lys Met Glu Gly Gly Thr Gly Pro Leu Val Tyr Pro Ala Ala 65 70 75 80 His Val Tyr Ile Tyr Thr Gly Leu Tyr Tyr Leu Thr Asn Lys Gly Thr 85 90 95 Asp Ile Leu Leu Ala Gln Gln Leu Phe Ala Val Leu Tyr Met Ala Thr 100 105 110 Leu Gly Val Val Met Leu Cys Tyr Trp Lys Ala Lys Val Pro Pro Tyr 115 120 125 Ile Phe Pro Leu Leu Ile Leu Ser Lys Arg Leu His Ser Val Phe Val 130 135 140 Leu Arg Cys Phe Asn Asp Cys Phe Ala Ala Phe Phe Leu Trp Leu Ser 145 150 155 160 Ile Phe Phe Phe Gln Arg Arg Val Trp Thr Leu Gly Ala Ile Ala Tyr 165 170 175 Thr Ile Gly Leu Gly Val Lys Met Ser Leu Leu Leu Val Leu Pro Ala 180 185 190 Val Val Ile Val Leu Phe Leu Gly Arg Gly Phe Lys Gly Ala Leu Arg 195 200 205 Leu Leu Trp Leu Met Val Gln Val Gln Leu Leu Leu Ala Ile Pro Phe 210 215 220 Ile Thr Thr Asn Trp Lys Gly Tyr Leu Gly Arg Ala Phe Glu Leu Ser 225 230 235 240 Arg Gln Phe Lys Phe Glu Trp Thr Val Asn Trp Arg Met Leu Gly Glu 245 250 255 Glu Leu Phe Leu Ser Arg Gly Phe Ser Ile Thr Leu Leu Ala Phe His 260 265 270 Ala Leu Phe Leu Leu Ile Phe Ile Leu Gly Arg Trp Leu Arg Ile Lys 275 280 285 Glu Arg Ser Phe Leu Gly Met Ile Pro Tyr Val Leu Arg Phe Thr Ser 290 295 300 Pro Phe Thr Glu His Glu Glu Ala Ser Ile Ser His Arg Val Val Thr 305 310 315 320 Pro Glu Tyr Ile Met Ser Ala Met Leu Ser Ala Asn Val Val Gly Leu 325 330 335 Leu Phe Ala Arg Ser Leu His Tyr Gln Phe Tyr Ala Tyr Leu Ala Trp 340 345 350 Ala Thr Pro Phe Leu Leu Trp Thr Ala Ser Pro Asn Leu Leu Val Val 355 360 365 Val Pro Leu Trp Ala Ala Gln Glu Trp Ala Trp Asn Val Phe Pro Ser 370 375 380 Thr Pro Leu Ser Ser Asn Val Val Val Ser Val Leu Ala Val Thr Val 385 390 395 400 Ala Met Ala Phe Val Gly Ser Asn Pro Gln Arg Gly Ala Pro Lys Pro 405 410 415 Lys Gln Leu <210> 129 <211> 434 <212> PRT <213> Fusarium oxysporum <400> 129 Met Pro Glu Ser Ala Ser Gly Thr Leu Ser Gln Gly Val Arg Phe Leu 1 5 10 15 Arg Asn Val Leu Asn Gly Arg His Ala Leu Ser Lys Leu Ile Pro Ile 20 25 30 Ala Leu Trp Leu Val Asp Ala Leu Gly Cys Gly Leu Ile Ile Trp Lys 35 40 45 Ile Pro Tyr Thr Glu Ile Asp Trp Val Ala Tyr Met Gln Gln Ile Ser 50 55 60 Gln Phe Val Ser Gly Glu Arg Asp Tyr Thr Lys Met Glu Gly Asp Thr 65 70 75 80 Gly Pro Leu Val Tyr Pro Ala Ala His Val Tyr Thr Tyr Thr Gly Leu 85 90 95 Tyr Tyr Ile Thr Asp Lys Gly Thr Asn Ile Leu Leu Ala Gln Gln Ile 100 105 110 Phe Ala Val Leu Tyr Met Ala Thr Leu Ala Val Val Met Leu Cys Tyr 115 120 125 Trp Lys Ala Lys Val Pro Pro Tyr Met Phe Ile Phe Leu Ile Ala Ser 130 135 140 Lys Arg Leu His Ser Leu Phe Val Leu Arg Cys Phe Asn Asp Cys Phe 145 150 155 160 Ala Val Phe Phe Leu Trp Leu Thr Ile Phe Leu Phe Gln Arg Arg Gln 165 170 175 Trp Thr Val Gly Ser Leu Val Tyr Ser Trp Gly Leu Gly Ile Lys Met 180 185 190 Ser Leu Leu Leu Val Leu Pro Ala Ile Gly Val Ile Leu Phe Leu Gly 195 200 205 Arg Gly Leu Trp Pro Ser Leu Arg Leu Ala Trp Leu Met Ala Gln Ile 210 215 220 Gln Phe Ala Ile Gly Leu Pro Phe Ile Thr Lys Asn Pro Arg Gly Tyr 225 230 235 240 Ala Ala Arg Ala Phe Glu Leu Ser Arg Gln Phe Gln Phe Lys Trp Thr 245 250 255 Val Asn Trp Arg Met Leu Gly Glu Glu Val Phe Leu Ser Lys Tyr Phe 260 265 270 Ala Leu Ser Leu Leu Ala Cys His Ile Leu Val Leu Leu Ile Phe Ile 275 280 285 Ser Lys Arg Trp Ile Gln Pro Thr Gly Arg Ser Leu Tyr Asp Leu Ile 290 295 300 Pro Ser Phe Leu Arg Leu Lys Ser Pro Phe Thr Met Gln Glu Gln Leu 305 310 315 320 Arg Ile Ser His Tyr Val Thr Pro Glu Tyr Ala Met Thr Thr Met Leu 325 330 335 Thr Ala Asn Leu Ile Gly Leu Leu Phe Ala Arg Ser Leu His Tyr Gln 340 345 350 Phe Tyr Ala Tyr Leu Ala Trp Ala Thr Pro Tyr Leu Leu Trp Arg Ala 355 360 365 Thr Glu Asp Pro Val Ile Val Ala Ile Ile Trp Ala Ala Gln Glu Trp 370 375 380 Ala Trp Asn Val Tyr Pro Ser Thr Asp Leu Ser Ser Thr Ile Ala Val 385 390 395 400 Asn Thr Met Leu Ala Thr Val Val Leu Val Tyr Leu Gly Thr Ala Arg 405 410 415 Arg Ala Val Pro Ala Pro Ala Ala Gln Val Gly Asn Val Asp Asp Lys 420 425 430 Asn Lys <210> 130 <211> 432 <212> PRT <213> Gibberella zeae <400> 130 Met Ala Asp Pro Ala Pro Gly Ala Leu Ala Arg Gly Thr Arg Phe Val 1 5 10 15 Arg Asn Val Leu Thr Gly Gln His Ala Leu Ser Lys Leu Ile Pro Val 20 25 30 Ala Leu Trp Leu Ala Asp Ala Val Gly Thr Ser Leu Ile Ile Trp Lys 35 40 45 Val Pro Tyr Thr Glu Ile Asp Trp Glu Ala Tyr Met Gln Gln Val Ser 50 55 60 Gln Phe Ile Ser Gly Glu Arg Asp Tyr Thr Lys Ile Glu Gly Gly Thr 65 70 75 80 Gly Pro Leu Val Tyr Pro Ala Ala His Val Tyr Thr Phe Thr Gly Leu 85 90 95 Tyr His Ile Thr Asn Glu Gly Glu Asn Ile Phe Leu Ala Gln Gln Ile 100 105 110 Phe Gly Val Leu Tyr Met Ala Thr Leu Ala Val Val Met Leu Cys Tyr 115 120 125 Trp Lys Ala Lys Val Pro Pro Tyr Met Phe Val Phe Leu Ile Ala Ser 130 135 140 Lys Arg Leu His Ser Leu Phe Val Leu Arg Cys Phe Asn Asp Cys Phe 145 150 155 160 Ala Val Phe Phe Leu Trp Leu Ser Ile Tyr Phe Phe Gln Arg Arg Asn 165 170 175 Trp Thr Phe Gly Ser Leu Ala Tyr Thr Trp Gly Leu Gly Ile Lys Met 180 185 190 Ser Leu Leu Leu Val Leu Pro Ala Ile Gly Val Ile Leu Leu Leu Gly 195 200 205 Arg Gly Phe Trp Pro Gly Leu Arg Leu Ala Trp Leu Met Ala Gln Val 210 215 220 Gln Phe Ala Ile Gly Ile Pro Phe Ile Met Lys Asn Ser Arg Gly Tyr 225 230 235 240 Ala Ala Arg Ala Phe Glu Leu Ser Arg Glu Phe Lys Phe Glu Trp Thr 245 250 255 Val Asn Trp Arg Met Leu Gly Glu Glu Val Phe Leu Ser Lys Ser Phe 260 265 270 Ala Ile Phe Leu Leu Ala Cys His Val Thr Ala Leu Leu Val Phe Ile 275 280 285 Ser Gln Arg Trp Leu Gln Pro Thr Gly Arg Pro Leu Ser Ala Met Ile 290 295 300 Pro Ser Phe Leu Gln Leu Lys Ser Pro Phe Thr Leu Gln Glu Gln Leu 305 310 315 320 Arg Ile Ser His Tyr Val Thr Pro Glu Tyr Val Met Thr Thr Met Leu 325 330 335 Ser Ala Asn Val Ile Gly Leu Leu Phe Ala Arg Ser Leu His Tyr Gln 340 345 350 Phe Tyr Ala Tyr Leu Ala Trp Ala Ser Pro Tyr Leu Ile Trp Arg Ala 355 360 365 Thr Glu Asp Pro Phe Ile Val Leu Leu Ile Trp Ala Ala Gln Glu Trp 370 375 380 Ala Trp Asn Val Phe Pro Ser Thr Asp Leu Ser Ser Arg Val Thr Val 385 390 395 400 Gly Ala Met Leu Ala Thr Val Val Leu Ala Tyr Arg Gly Thr Ala Arg 405 410 415 Leu Ala Val Pro Pro Ser Gln Ala Arg Lys Ile Glu Ala Lys Asn Lys 420 425 430 <210> 131 <211> 446 <212> PRT <213> Myceliophthora thermophila <400> 131 Met Thr Arg Met Arg Ser Ser Pro Lys Thr Pro Thr Ala Thr Met Ala 1 5 10 15 Asp Gln Asn Arg Pro Ile His Ile Arg Ala Thr Arg Leu Val Phe Asp 20 25 30 Ile Leu Asn Gly Arg His Val Leu Ser Lys Leu Ile Pro Pro Leu Val 35 40 45 Phe Leu Ala Asp Ala Leu Leu Cys Ala Leu Ile Ile Trp Lys Val Pro 50 55 60 Tyr Thr Glu Ile Asp Trp Asn Ala Tyr Met Glu Gln Val Ala Gln Ile 65 70 75 80 Leu Ser Gly Glu Arg Asp Tyr Thr Lys Ile Arg Gly Asn Thr Gly Pro 85 90 95 Leu Val Tyr Pro Ala Ala His Val Tyr Ile Tyr Thr Gly Leu Tyr His 100 105 110 Leu Thr Asp Glu Gly Arg Asn Ile Leu Thr Ala Gln Lys Leu Phe Gly 115 120 125 Phe Leu Tyr Met Val Thr Leu Ala Val Val Met Ala Cys Tyr Trp Gln 130 135 140 Ala Lys Val Pro Pro Tyr Val Phe Pro Leu Leu Ile Leu Ser Lys Arg 145 150 155 160 Leu His Ser Ile Phe Val Leu Arg Cys Phe Asn Asp Cys Phe Ala Thr 165 170 175 Leu Phe Leu Trp Leu Ala Ile Phe Ala Leu Gln Arg Arg Ala Trp Arg 180 185 190 Thr Gly Ala Leu Met Tyr Thr Leu Gly Leu Gly Val Lys Met Ser Leu 195 200 205 Leu Leu Val Leu Pro Ala Val Gly Val Val Leu Leu Leu Gly Ala Gly 210 215 220 Phe Ala Thr Ser Leu Arg Leu Ala Ala Val Ile Gly Leu Val Gln Val 225 230 235 240 Leu Ile Ala Val Pro Phe Leu Ser Asn Asn Pro Trp Gly Tyr Leu Gly 245 250 255 Arg Ala Phe Glu Leu Ser Arg Gln Phe Phe Phe Lys Trp Thr Val Asn 260 265 270 Trp Arg Phe Val Gly Glu Glu Val Phe Leu Ser Lys Glu Phe Ser Leu 275 280 285 Ala Leu Leu Gly Leu His Val Ala Val Leu Ala Ile Phe Val Thr Thr 290 295 300 Arg Trp Leu Lys Pro Ala Arg Lys Pro Val Ser Gln Leu Ile Val Pro 305 310 315 320 Ile Leu Leu Gly Lys Ser Pro Phe Thr Glu Glu Glu Gln Arg Ala Val 325 330 335 Ser Arg Asp Val Thr Pro Arg Phe Ile Leu Thr Ser Ile Leu Ser Ala 340 345 350 Asn Val Val Gly Leu Leu Phe Ala Arg Ser Leu His Tyr Gln Phe Tyr 355 360 365 Ser Tyr Leu Ala Trp Met Thr Pro Tyr Leu Leu Trp Arg Ser Gly Val 370 375 380 His Pro Ile Leu Gln Tyr Ala Ile Trp Thr Ala Gln Glu Trp Ala Trp 385 390 395 400 Asn Val Tyr Pro Ser Thr Pro Ile Ser Ser Gly Val Val Val Gly Val 405 410 415 Leu Ala Leu Thr Ala Ala Leu Val Trp Leu Gly Ala Arg Glu Asp Trp 420 425 430 Glu Pro Arg Arg Val Leu Leu Lys Gly Glu Ala Ala Lys Arg 435 440 445 <210> 132 <211> 442 <212> PRT <213> Neurospora crassa <400> 132 Met Ala Ala Pro Ser Ser Arg Pro Glu Ser Asn Pro Pro Leu Tyr Lys 1 5 10 15 Gln Ala Leu Asp Phe Ala Leu Asp Val Ala Asn Gly Arg His Ala Leu 20 25 30 Ser Lys Leu Ile Pro Pro Ala Leu Phe Leu Val Asp Ala Leu Leu Cys 35 40 45 Gly Leu Ile Ile Trp Lys Val Pro Tyr Thr Glu Ile Asp Trp Ala Ala 50 55 60 Tyr Met Glu Gln Val Ser Gln Ile Leu Ser Gly Glu Arg Asp Tyr Thr 65 70 75 80 Lys Val Arg Gly Gly Thr Gly Pro Leu Val Tyr Pro Ala Ala His Val 85 90 95 Tyr Ile Tyr Thr Gly Leu Tyr His Leu Thr Asp Glu Gly Arg Asn Ile 100 105 110 Leu Leu Ala Gln Gln Leu Phe Ala Gly Leu Tyr Met Val Thr Leu Ala 115 120 125 Val Val Met Gly Cys Tyr Trp Gln Ala Lys Ala Pro Pro Tyr Leu Phe 130 135 140 Pro Leu Leu Thr Leu Ser Lys Arg Leu His Ser Ile Phe Val Leu Arg 145 150 155 160 Cys Phe Asn Asp Cys Phe Ala Val Leu Phe Leu Trp Leu Ala Ile Phe 165 170 175 Phe Phe Gln Arg Arg Asn Trp Gln Ala Gly Ala Leu Leu Tyr Thr Leu 180 185 190 Gly Leu Gly Val Lys Met Thr Leu Leu Leu Ser Leu Pro Ala Val Gly 195 200 205 Ile Val Leu Phe Leu Gly Ser Gly Ser Phe Val Thr Thr Leu Gln Leu 210 215 220 Val Ala Thr Met Gly Leu Val Gln Ile Leu Ile Gly Val Pro Phe Leu 225 230 235 240 Ala His Tyr Pro Thr Glu Tyr Leu Ser Arg Ala Phe Glu Leu Ser Arg 245 250 255 Gln Phe Phe Phe Lys Trp Thr Val Asn Trp Arg Phe Val Gly Glu Glu 260 265 270 Ile Phe Leu Ser Lys Gly Phe Ala Leu Thr Leu Leu Ala Leu His Val 275 280 285 Leu Val Leu Gly Ile Phe Ile Thr Thr Arg Trp Ile Lys Pro Ala Arg 290 295 300 Lys Ser Leu Val Gln Leu Ile Ser Pro Val Leu Leu Ala Gly Lys Pro 305 310 315 320 Pro Leu Thr Val Pro Glu His Arg Ala Ala Ala Arg Asp Val Thr Pro 325 330 335 Arg Tyr Ile Met Thr Thr Ile Leu Ser Ala Asn Ala Val Gly Leu Leu 340 345 350 Phe Ala Arg Ser Leu His Tyr Gln Phe Tyr Ala Tyr Val Ala Trp Ser 355 360 365 Thr Pro Phe Leu Leu Trp Arg Ala Gly Leu His Pro Val Leu Val Tyr 370 375 380 Leu Leu Trp Ala Val His Glu Trp Ala Trp Asn Val Phe Pro Ser Thr 385 390 395 400 Pro Ala Ser Ser Ala Val Val Val Gly Val Leu Gly Val Thr Val Ala 405 410 415 Gly Val Trp Phe Gly Ala Arg Glu Glu Trp Glu Pro Gly Met Lys Ser 420 425 430 Ser Ser Lys Lys Glu Glu Ala Ala Met Arg 435 440 <210> 133 <211> 413 <212> PRT <213> Aspergillus oryzae <400> 133 Met Glu Leu Lys His Phe Ile His Glu Leu Cys Leu Asn Pro Arg His 1 5 10 15 Thr Lys Trp Ile Ala Pro Leu Leu Val Ile Gly Asp Ala Phe Leu Cys 20 25 30 Ala Leu Ile Ile Trp Lys Ile Pro Tyr Thr Glu Ile Asp Trp Thr Thr 35 40 45 Tyr Met Gln Gln Ile Ala Leu Tyr Ile Ser Gly Glu Arg Asp Tyr Thr 50 55 60 Leu Ile Lys Gly Ser Thr Gly Pro Leu Val Tyr Pro Ala Ala His Val 65 70 75 80 Tyr Ser Tyr Met Ala Leu Tyr His Leu Thr Asp Glu Gly Arg Asp Ile 85 90 95 Leu Phe Gly Gln Ile Leu Phe Ala Val Leu Tyr Leu Val Thr Leu Ala 100 105 110 Val Val Met Val Cys Tyr Arg Gln Ser Gly Ala Pro Pro Tyr Leu Phe 115 120 125 Pro Leu Leu Val Leu Ser Lys Arg Leu His Ser Val Phe Val Leu Arg 130 135 140 Leu Phe Asn Asp Gly Leu Ala Val Cys Ala Met Trp Ile Ala Ile Leu 145 150 155 160 Leu Phe Gln Asn Lys Lys Trp Thr Ala Gly Val Thr Ala Trp Thr Val 165 170 175 Gly Val Gly Ile Lys Met Thr Leu Leu Leu Leu Ala Pro Ala Ile Ala 180 185 190 Val Val Thr Val Leu Ser Leu Ser Leu Val Pro Ser Ile Arg Leu Gly 195 200 205 Ile Leu Ala Leu Leu Ile Gln Val Leu Leu Ala Ile Pro Phe Leu Gln 210 215 220 Gly Asn Pro Ile Gly Tyr Val Ala Arg Ala Phe Glu Leu Thr Arg Gln 225 230 235 240 Phe Met Phe Lys Trp Thr Val Asn Trp Arg Phe Val Gly Glu Asp Leu 245 250 255 Phe Leu Ser Lys Gln Phe Ser Leu Ala Leu Leu Gly Leu His Ile Phe 260 265 270 Leu Leu Gly Leu Phe Val Thr Thr Gly Trp Leu Arg Pro Ser Gly Ser 275 280 285 Asn Val Pro Asp Phe Leu Arg Ser Leu Leu Gln Gly Arg Gln Arg Thr 290 295 300 Val Val Leu Ser Lys Ser Phe Ile Met Thr Val Met Leu Thr Ser Leu 305 310 315 320 Ala Ile Gly Leu Leu Cys Ala Arg Ser Leu His Tyr Gln Phe Phe Ala 325 330 335 Tyr Leu Ser Trp Ala Thr Pro Cys Leu Leu Trp Arg Ala Arg Leu His 340 345 350 Pro Ile Leu Ile Tyr Ala Ile Trp Ala Leu Gln Glu Trp Ala Trp Asn 355 360 365 Val Tyr Pro Ser Thr Asn Ala Ser Ser Ser Val Val Val Phe Ser Leu 370 375 380 Ala Val Gln Val Phe Gly Val Leu Leu Asn Ser Arg Asn Ala Leu Ser 385 390 395 400 Asp Ala Pro Pro Arg Arg Lys Gly Lys Glu His Ile Gln 405 410 <210> 134 <211> 411 <212> PRT <213> Neosartorya fischeri <400> 134 Met Asp Leu Lys His Thr Leu Arg Asp Leu Cys Met Asn Pro Arg His 1 5 10 15 Thr Arg Trp Val Ala Pro Leu Leu Ile Leu Gly Asp Ala Val Leu Cys 20 25 30 Ala Leu Ile Ile Trp Lys Val Pro Tyr Thr Glu Ile Asp Trp Thr Thr 35 40 45 Tyr Met Gln Gln Ile Ser Leu Tyr Ile Ser Gly Glu Arg Asp Tyr Thr 50 55 60 Leu Ile Lys Gly Ser Thr Gly Pro Leu Val Tyr Pro Ala Ala His Val 65 70 75 80 Tyr Ile Phe Asn Ile Leu Tyr His Leu Thr Asp Glu Gly Arg Asp Ile 85 90 95 Phe Leu Gly Gln Ile Leu Phe Ala Ile Leu Tyr Leu Ala Thr Leu Thr 100 105 110 Val Ala Met Thr Cys Tyr Arg Gln Ala Gly Ala Pro Pro Tyr Leu Leu 115 120 125 Val Pro Leu Val Leu Ser Lys Arg Leu His Ser Val Phe Met Leu Arg 130 135 140 Leu Phe Asn Asp Gly Phe Ala Ala Tyr Ala Met Trp Val Ser Ile Leu 145 150 155 160 Leu Phe Met Asn Lys Lys Trp Thr Ala Gly Ala Ile Val Trp Ser Thr 165 170 175 Gly Val Gly Ile Lys Met Thr Leu Leu Leu Leu Ala Pro Ala Ile Ala 180 185 190 Val Val Leu Val Leu Ser Leu Ser Leu Gly Pro Ser Met Gln Leu Gly 195 200 205 Phe Leu Ala Val Leu Ile Gln Val Leu Phe Gly Ile Pro Phe Leu Gln 210 215 220 Asn Asn Pro Ala Gly Tyr Val Ser Arg Ala Phe Glu Leu Thr Arg Gln 225 230 235 240 Phe Met Phe Lys Trp Thr Val Asn Trp Arg Phe Val Gly Glu Glu Leu 245 250 255 Phe Leu Ser Arg Lys Phe Ser Leu Ala Leu Leu Ala Leu His Ile Leu 260 265 270 Leu Leu Gly Leu Phe Val Ala Thr Val Trp Leu Lys Pro Ser Gly Ser 275 280 285 Asp Leu Pro Ser Phe Leu Gln Arg Leu Ile Gln Arg Arg Tyr Arg Thr 290 295 300 Ala Ser Leu Ser Lys Ser Phe Ile Met Thr Ala Met Leu Ser Ser Leu 305 310 315 320 Ala Ile Gly Leu Leu Cys Ala Arg Ser Leu His Tyr Gln Phe Phe Ala 325 330 335 Tyr Leu Ala Cys Ala Thr Pro Phe Leu Leu Trp Gln Ala Gly Phe His 340 345 350 Pro Ile Leu Val Tyr Val Val Trp Val Ala Gln Glu Trp Ala Trp Asn 355 360 365 Thr Tyr Pro Ser Thr Asn Ala Ser Ser Leu Val Val Ile Leu Ser Leu 370 375 380 Ala Ala Gln Val Phe Gly Val Leu Gly Asn Ser Phe Ser Arg Lys His 385 390 395 400 Leu Asp Gln Ser Ser Gln Lys Glu His Leu Gln 405 410 <210> 135 <211> 413 <212> PRT <213> Aspergillus niger <400> 135 Met Asp Trp Met Arg Leu Ile Arg Asp Leu Cys Phe Asn Pro Arg His 1 5 10 15 Thr Lys Trp Met Ala Pro Leu Leu Val Leu Gly Asp Ala Phe Leu Cys 20 25 30 Ala Leu Ile Ile Trp Lys Val Pro Tyr Thr Glu Ile Asp Trp Ala Thr 35 40 45 Tyr Met Gln Gln Ile Ser Leu Tyr Leu Ser Gly Glu Arg Asp Tyr Thr 50 55 60 Leu Ile Arg Gly Ser Thr Gly Pro Leu Val Tyr Pro Ala Ala His Val 65 70 75 80 Tyr Ser Tyr Thr Ala Leu Tyr His Leu Thr Asp Glu Gly Arg Asp Ile 85 90 95 Phe Phe Gly Gln Ile Leu Phe Ala Val Leu Tyr Leu Ile Thr Leu Val 100 105 110 Val Val Leu Cys Cys Tyr Arg Gln Ser Gly Ala Pro Pro Tyr Leu Leu 115 120 125 Pro Leu Leu Val Leu Ser Lys Arg Leu His Ser Val Tyr Val Leu Arg 130 135 140 Leu Phe Asn Asp Gly Leu Ala Ala Leu Ala Met Trp Val Ala Ile Leu 145 150 155 160 Leu Phe Met Asn Arg Lys Trp Thr Ala Ala Val Ala Val Trp Ser Thr 165 170 175 Gly Val Ala Ile Lys Met Thr Leu Leu Leu Leu Ala Pro Ala Ile Ala 180 185 190 Val Val Thr Val Leu Ser Leu Ser Leu Gly Pro Ser Val Gly Leu Gly 195 200 205 Val Leu Ala Val Leu Val Gln Val Leu Leu Ala Ile Pro Phe Leu Gln 210 215 220 Asn Asn Pro Ala Gly Tyr Leu Ser Arg Ala Phe Glu Leu Thr Arg Gln 225 230 235 240 Phe Met Phe Lys Trp Thr Val Asn Trp Arg Phe Val Gly Glu Glu Val 245 250 255 Phe Leu Ser Lys Ser Phe Ser Leu Ala Leu Leu Ala Val His Ile Val 260 265 270 Leu Leu Gly Ala Phe Ala Val Thr Gly Trp Leu Arg Tyr Ser Arg Ser 275 280 285 Ser Leu Pro Ala Phe Ile Arg Asn Leu Leu Ala Gly Arg His Arg Thr 290 295 300 Val Ser Leu Pro Lys Pro Tyr Ile Met Ser Val Met Leu Ser Ser Leu 305 310 315 320 Thr Val Gly Leu Leu Cys Ala Arg Ser Leu His Tyr Gln Phe Phe Ala 325 330 335 Tyr Leu Ser Trp Ala Thr Pro Phe Leu Leu Trp Arg Ala Gly Phe His 340 345 350 Pro Ile Leu Leu Tyr Leu Ile Trp Ala Met Gln Glu Trp Ala Trp Asn 355 360 365 Thr Phe Pro Ser Thr Asn Leu Ser Ser Ile Ile Val Val Leu Ser Leu 370 375 380 Ala Thr Gln Ser Phe Gly Val Leu Ala Asn Ser Ala Ser Ala Phe Tyr 385 390 395 400 Thr Met Arg Ser Asn Pro Ser Gly Lys Glu His Asn Gln 405 410 <210> 136 <211> 357 <212> PRT <213> Magnaporthe oryzae <400> 136 Met Ala Ala Glu Arg Pro Ser Thr Leu Gly Lys Pro Val Gln Phe Val 1 5 10 15 Phe Asp Val Ala Asn Gly Arg His Pro Leu Ser Arg Ala Ile Pro Pro 20 25 30 Met Leu Leu Ala Phe Asp Gly Leu Leu Cys Gly Leu Ile Ile Lys Lys 35 40 45 Val Pro Ser Cys Tyr Arg Lys Ala Lys Val Pro Pro Tyr Val Leu Pro 50 55 60 Leu Leu Val Leu Ser Lys Arg Leu His Ser Ile Phe Val Leu Arg Cys 65 70 75 80 Phe Asn Asp Cys Phe Ala Val Leu Phe Phe Trp Leu Ala Ile Tyr Cys 85 90 95 Phe Gln Arg Arg Ala Trp Ser Leu Gly Gly Val Phe Tyr Ser Phe Gly 100 105 110 Leu Gly Ile Lys Met Thr Val Leu Leu Ser Leu Pro Ala Val Gly Val 115 120 125 Ile Leu Leu Leu Gly Arg Gly Phe Gly Gly Ala Leu Asn Val Ala Ser 130 135 140 Ile Met Gly Gln Leu Gln Val Ala Ile Gly Leu Pro Phe Leu Ser Lys 145 150 155 160 Asn Ala Trp Gly Tyr Leu Ser Arg Ala Phe Glu Leu Ser Arg Gln Phe 165 170 175 Met Phe Lys Trp Thr Val Asn Trp Arg Phe Val Gly Glu Glu Thr Phe 180 185 190 Leu Ser Lys Pro Phe Ala Ile Thr Leu Leu Ala Leu His Ala Ser Val 195 200 205 Leu Leu Ala Phe Val Thr Lys Arg Trp Leu Lys Pro Ala Ser Lys Ser 210 215 220 Ile Gly Gly Leu Ile Ala Pro Leu Leu Ser Gly Arg Pro Ile Phe Thr 225 230 235 240 Ala Glu Glu Ala Gln Thr Ala Ala Arg Ala Val Thr Pro Glu Tyr Val 245 250 255 Met Thr Thr Met Leu Thr Ala Asn Ile Val Gly Met Leu Phe Ala Arg 260 265 270 Ser Leu His Tyr Gln Phe Tyr Ala Tyr Leu Ala Trp Ser Thr Pro Tyr 275 280 285 Leu Leu Trp Arg Ser Gly Ile His Pro Leu Leu Gln Trp Gly Leu Trp 290 295 300 Ala Leu Gln Glu Trp Ala Trp Asn Val Tyr Pro Ser Thr Pro Val Ser 305 310 315 320 Ser Gly Val Val Val Gly Val Met Ala Ile Thr Val Gly Ala Val Met 325 330 335 Val Gly Ala Lys Ala Glu Phe Arg Pro Gln Val Pro Val Ala Lys Lys 340 345 350 Val Glu Ala Lys Arg 355 <210> 137 <211> 406 <212> PRT <213> Schizosaccharomyces pombe <400> 137 Met Ser Ser Val Glu Thr Arg Asn Ser Phe Asn Pro Phe Arg Val Leu 1 5 10 15 Phe Asp Leu Gly Ser Tyr Gly Trp Leu His Pro Ser Arg Leu Leu Leu 20 25 30 Leu Glu Ile Pro Phe Val Phe Ala Ile Ile Ser Lys Val Pro Tyr Thr 35 40 45 Glu Ile Asp Trp Ile Ala Tyr Met Glu Gln Val Asn Ser Phe Leu Leu 50 55 60 Gly Glu Arg Asp Tyr Lys Ser Leu Val Gly Cys Thr Gly Pro Leu Val 65 70 75 80 Tyr Pro Gly Gly His Val Phe Leu Tyr Thr Leu Leu Tyr Tyr Leu Thr 85 90 95 Asp Gly Gly Thr Asn Ile Val Arg Ala Gln Tyr Ile Phe Ala Phe Val 100 105 110 Tyr Trp Ile Thr Thr Ala Ile Val Gly Tyr Leu Phe Lys Ile Val Arg 115 120 125 Ala Pro Phe Tyr Ile Tyr Val Leu Leu Ile Leu Ser Lys Arg Leu His 130 135 140 Ser Ile Phe Ile Leu Arg Leu Phe Asn Asp Gly Phe Asn Ser Leu Phe 145 150 155 160 Ser Ser Leu Phe Ile Leu Ser Ser Cys Lys Lys Lys Trp Val Arg Ala 165 170 175 Ser Ile Leu Leu Ser Val Ala Cys Ser Val Lys Met Ser Ser Leu Leu 180 185 190 Tyr Val Pro Ala Tyr Leu Val Leu Leu Leu Gln Ile Leu Gly Pro Lys 195 200 205 Lys Thr Trp Met His Ile Phe Val Ile Ile Ile Val Gln Ile Leu Phe 210 215 220 Ser Ile Pro Phe Leu Ala Tyr Phe Trp Ser Tyr Trp Thr Gln Ala Phe 225 230 235 240 Asp Phe Gly Arg Ala Phe Asp Tyr Lys Trp Thr Val Asn Trp Arg Phe 245 250 255 Ile Pro Arg Ser Ile Phe Glu Ser Thr Ser Phe Ser Thr Ser Ile Leu 260 265 270 Phe Leu His Val Ala Leu Leu Val Ala Phe Thr Cys Lys His Trp Asn 275 280 285 Lys Leu Ser Arg Ala Thr Pro Phe Ala Met Val Asn Ser Met Leu Thr 290 295 300 Leu Lys Pro Leu Pro Lys Leu Gln Leu Ala Thr Pro Asn Phe Ile Phe 305 310 315 320 Thr Ala Leu Ala Thr Ser Asn Leu Ile Gly Ile Leu Cys Ala Arg Ser 325 330 335 Leu His Tyr Gln Phe Tyr Ala Trp Phe Ala Trp Tyr Ser Pro Tyr Leu 340 345 350 Cys Tyr Gln Ala Ser Phe Pro Ala Pro Ile Val Ile Gly Leu Trp Met 355 360 365 Leu Gln Glu Tyr Ala Trp Asn Val Phe Pro Ser Thr Lys Leu Ser Ser 370 375 380 Leu Ile Ala Val Cys Val Pro Leu Ile Thr Ile Leu Lys Leu Tyr Thr 385 390 395 400 Ser Asp Tyr Arg Lys Pro 405 <210> 138 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 138 ggaggtgggg gcagtggagg tggcggcagt 30 <210> 139 <211> 2460 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 139 atgcgcttcc gaatctacaa gcggaaggtc ctcattctga cccttgtcgt ggccgcttgc 60 ggctttgttc tctggtccag caacggtcgc cagcgtaaga acgaggccct ggcgcctccc 120 ctcttggacg ccgaaccggc cagaggcgca ggtggcaggg gaggggatca cccctcggtc 180 gctgtcggca tccgccgcgt cagcaatgtg tccgccgcct ctctggtccc ggcggttccg 240 cagcctgagg cagacaacct cacgctgcgc taccgatcac tcgtgtatca acttaacttc 300 gaccagactc tgcggaacgt cgacaaggcc ggaacctggg ctccgcgtga gttggtcctc 360 gtcgttcagg tgcacaacag gcccgagtac ctccgcctcc tgctggattc gcttcgaaag 420 gcccagggca tcgacaacgt cctggtgatt ttcagccatg acttttggtc cacagagatc 480 aatcagctca ttgcgggtgt caacttttgc cccgtcttgc aagttttctt ccctttctct 540 atccaactct accccaacga gttcccgggc agtgaccccc gcgactgtcc tcgggatctg 600 ccaaaaaacg ccgctctcaa gctgggctgc atcaacgccg aataccccga cagctttggc 660 cactatcgcg aggccaagtt ctcgcagacg aagcaccact ggtggtggaa gctccatttt 720 gtctgggagc gagtgaagat ccttcgtgat tacgcaggac tcattctgtt cttggaagag 780 gaccactacc tggccccgga cttctaccac gtctttaaga agatgtggaa gctcaagcag 840 caggaatgcc ccgagtgcga cgttctgtcc cttggcacct atagcgcgtc ccgctcgttc 900 tacggtatgg ctgacaaggt cgatgtgaaa acctggaagt caactgagca caatatgggc 960 ctcgccctga cgaggaacgc ctaccagaaa ctcatcgagt gtaccgacac cttctgcacg 1020 tacgacgact ataactggga ttggacactg cagtacttga ctgtcagctg cctccctaag 1080 ttttggaagg tccttgttcc ccagatcccg agaattttcc atgctggcga ctgcgggatg 1140 caccacaaga aaacctgtcg cccatccacg cagtctgccc aaatcgagtc gctcctgaac 1200 aacaacaagc agtacatgtt ccccgagaca ctgaccatta gcgagaagtt tacggtcgtg 1260 gcgatctccc cgcctcgaaa gaatggcggc tggggtgaca tccgcgatca cgagctgtgc 1320 aagtcttacc gccggctcca gggaggtggg ggcagtggag gtggcggcag tgggagggtg 1380 cccaccgccg cccctcccgc ccagccgcgt gtgcctgtga cccccgcgcc ggcggtgatt 1440 cccatcctgg tcatcgcctg tgaccgcagc actgttcggc gctgcctgga caagctgctg 1500 cattatcggc cctcggctga gctcttcccc atcatcgtca gccaggactg cgggcacgag 1560 gagacggccc aggccatcgc ctcctacggc agcgcggtca cgcacatccg gcagcccgac 1620 ctgagcagca ttgcggtgcc gccggaccac cgcaagttcc agggctacta caagatcgcg 1680 cgccactacc gctgggcgct gggccaggtc ttccggcagt ttcgcttccc cgccgccgtg 1740 gtggtggagg atgacctgga ggtggccccg gacttcttcg agtactttcg ggccacctat 1800 ccgctgctga aggccgaccc ctccctgtgg tgcgtctcgg cctggaatga caacggcaag 1860 gagcagatgg tggacgccag caggcctgag ctgctctacc gcaccgactt tttccctggc 1920 ctgggctggc tgctgttggc cgagctctgg gctgagctgg agcccaagtg gccaaaggcc 1980 ttctgggacg actggatgcg gcggccggag cagcggcagg ggcgggcctg catccgccct 2040 gagatctcaa gaacgatgac ctttggccgc aagggtgtga gccacgggca gttctttgac 2100 cagcacctca agttcatcaa gctgaaccag cagtttgtgc acttcaccca gctggacctg 2160 tcttacctgc agcgggaggc ctatgaccga gatttcctcg cccgcgtcta cggtgctccc 2220 cagctgcagg tggagaaagt gaggaccaat gaccggaagg agctggggga ggtgcgggtg 2280 cagtacacgg gcagggacag cttcaaggct ttcgccaagg ctctgggtgt catggatgac 2340 ctcaagtcgg gggttccgag agctggctac cggggcattg tcaccttcca gttccggggc 2400 cgccgtgtcc acctggcgcc cccaccgacg tgggagggct atgatcccag ctggaattag 2460 <210> 140 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 140 ggaggtgggg gcagtggagg tggcggcagt ggcggcggtg gaagt 45 <210> 141 <211> 2475 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 141 atgcgcttcc gaatctacaa gcggaaggtc ctcattctga cccttgtcgt ggccgcttgc 60 ggctttgttc tctggtccag caacggtcgc cagcgtaaga acgaggccct ggcgcctccc 120 ctcttggacg ccgaaccggc cagaggcgca ggtggcaggg gaggggatca cccctcggtc 180 gctgtcggca tccgccgcgt cagcaatgtg tccgccgcct ctctggtccc ggcggttccg 240 cagcctgagg cagacaacct cacgctgcgc taccgatcac tcgtgtatca acttaacttc 300 gaccagactc tgcggaacgt cgacaaggcc ggaacctggg ctccgcgtga gttggtcctc 360 gtcgttcagg tgcacaacag gcccgagtac ctccgcctcc tgctggattc gcttcgaaag 420 gcccagggca tcgacaacgt cctggtgatt ttcagccatg acttttggtc cacagagatc 480 aatcagctca ttgcgggtgt caacttttgc cccgtcttgc aagttttctt ccctttctct 540 atccaactct accccaacga gttcccgggc agtgaccccc gcgactgtcc tcgggatctg 600 ccaaaaaacg ccgctctcaa gctgggctgc atcaacgccg aataccccga cagctttggc 660 cactatcgcg aggccaagtt ctcgcagacg aagcaccact ggtggtggaa gctccatttt 720 gtctgggagc gagtgaagat ccttcgtgat tacgcaggac tcattctgtt cttggaagag 780 gaccactacc tggccccgga cttctaccac gtctttaaga agatgtggaa gctcaagcag 840 caggaatgcc ccgagtgcga cgttctgtcc cttggcacct atagcgcgtc ccgctcgttc 900 tacggtatgg ctgacaaggt cgatgtgaaa acctggaagt caactgagca caatatgggc 960 ctcgccctga cgaggaacgc ctaccagaaa ctcatcgagt gtaccgacac cttctgcacg 1020 tacgacgact ataactggga ttggacactg cagtacttga ctgtcagctg cctccctaag 1080 ttttggaagg tccttgttcc ccagatcccg agaattttcc atgctggcga ctgcgggatg 1140 caccacaaga aaacctgtcg cccatccacg cagtctgccc aaatcgagtc gctcctgaac 1200 aacaacaagc agtacatgtt ccccgagaca ctgaccatta gcgagaagtt tacggtcgtg 1260 gcgatctccc cgcctcgaaa gaatggcggc tggggtgaca tccgcgatca cgagctgtgc 1320 aagtcttacc gccggctcca gggaggtggg ggcagtggag gtggcggcag tggaggtggc 1380 ggcagtggga gggtgcccac cgccgcccct cccgcccagc cgcgtgtgcc tgtgaccccc 1440 gcgccggcgg tgattcccat cctggtcatc gcctgtgacc gcagcactgt tcggcgctgc 1500 ctggacaagc tgctgcatta tcggccctcg gctgagctct tccccatcat cgtcagccag 1560 gactgcgggc acgaggagac ggcccaggcc atcgcctcct acggcagcgc ggtcacgcac 1620 atccggcagc ccgacctgag cagcattgcg gtgccgccgg accaccgcaa gttccagggc 1680 tactacaaga tcgcgcgcca ctaccgctgg gcgctgggcc aggtcttccg gcagtttcgc 1740 ttccccgccg ccgtggtggt ggaggatgac ctggaggtgg ccccggactt cttcgagtac 1800 tttcgggcca cctatccgct gctgaaggcc gacccctccc tgtggtgcgt ctcggcctgg 1860 aatgacaacg gcaaggagca gatggtggac gccagcaggc ctgagctgct ctaccgcacc 1920 gactttttcc ctggcctggg ctggctgctg ttggccgagc tctgggctga gctggagccc 1980 aagtggccaa aggccttctg ggacgactgg atgcggcggc cggagcagcg gcaggggcgg 2040 gcctgcatcc gccctgagat ctcaagaacg atgacctttg gccgcaaggg tgtgagccac 2100 gggcagttct ttgaccagca cctcaagttc atcaagctga accagcagtt tgtgcacttc 2160 acccagctgg acctgtctta cctgcagcgg gaggcctatg accgagattt cctcgcccgc 2220 gtctacggtg ctccccagct gcaggtggag aaagtgagga ccaatgaccg gaaggagctg 2280 ggggaggtgc gggtgcagta cacgggcagg gacagcttca aggctttcgc caaggctctg 2340 ggtgtcatgg atgacctcaa gtcgggggtt ccgagagctg gctaccgggg cattgtcacc 2400 ttccagttcc ggggccgccg tgtccacctg gcgcccccac cgacgtggga gggctatgat 2460 cccagctgga attag 2475 <210> 142 <211> 57 <212> DNA <213> Trichoderma reesei <400> 142 agcaccggca accctagcgg cggcaaccct cccggcggaa acccgcctgg cagcacc 57 <210> 143 <211> 2487 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 143 atgcgcttcc gaatctacaa gcggaaggtc ctcattctga cccttgtcgt ggccgcttgc 60 ggctttgttc tctggtccag caacggtcgc cagcgtaaga acgaggccct ggcgcctccc 120 ctcttggacg ccgaaccggc cagaggcgca ggtggcaggg gaggggatca cccctcggtc 180 gctgtcggca tccgccgcgt cagcaatgtg tccgccgcct ctctggtccc ggcggttccg 240 cagcctgagg cagacaacct cacgctgcgc taccgatcac tcgtgtatca acttaacttc 300 gaccagactc tgcggaacgt cgacaaggcc ggaacctggg ctccgcgtga gttggtcctc 360 gtcgttcagg tgcacaacag gcccgagtac ctccgcctcc tgctggattc gcttcgaaag 420 gcccagggca tcgacaacgt cctggtgatt ttcagccatg acttttggtc cacagagatc 480 aatcagctca ttgcgggtgt caacttttgc cccgtcttgc aagttttctt ccctttctct 540 atccaactct accccaacga gttcccgggc agtgaccccc gcgactgtcc tcgggatctg 600 ccaaaaaacg ccgctctcaa gctgggctgc atcaacgccg aataccccga cagctttggc 660 cactatcgcg aggccaagtt ctcgcagacg aagcaccact ggtggtggaa gctccatttt 720 gtctgggagc gagtgaagat ccttcgtgat tacgcaggac tcattctgtt cttggaagag 780 gaccactacc tggccccgga cttctaccac gtctttaaga agatgtggaa gctcaagcag 840 caggaatgcc ccgagtgcga cgttctgtcc cttggcacct atagcgcgtc ccgctcgttc 900 tacggtatgg ctgacaaggt cgatgtgaaa acctggaagt caactgagca caatatgggc 960 ctcgccctga cgaggaacgc ctaccagaaa ctcatcgagt gtaccgacac cttctgcacg 1020 tacgacgact ataactggga ttggacactg cagtacttga ctgtcagctg cctccctaag 1080 ttttggaagg tccttgttcc ccagatcccg agaattttcc atgctggcga ctgcgggatg 1140 caccacaaga aaacctgtcg cccatccacg cagtctgccc aaatcgagtc gctcctgaac 1200 aacaacaagc agtacatgtt ccccgagaca ctgaccatta gcgagaagtt tacggtcgtg 1260 gcgatctccc cgcctcgaaa gaatggcggc tggggtgaca tccgcgatca cgagctgtgc 1320 aagtcttacc gccggctcca gagcaccggc aaccctagcg gcggcaaccc tcccggcgga 1380 aacccgcctg gcagcaccgg gagggtgccc accgccgccc ctcccgccca gccgcgtgtg 1440 cctgtgaccc ccgcgccggc ggtgattccc atcctggtca tcgcctgtga ccgcagcact 1500 gttcggcgct gcctggacaa gctgctgcat tatcggccct cggctgagct cttccccatc 1560 atcgtcagcc aggactgcgg gcacgaggag acggcccagg ccatcgcctc ctacggcagc 1620 gcggtcacgc acatccggca gcccgacctg agcagcattg cggtgccgcc ggaccaccgc 1680 aagttccagg gctactacaa gatcgcgcgc cactaccgct gggcgctggg ccaggtcttc 1740 cggcagtttc gcttccccgc cgccgtggtg gtggaggatg acctggaggt ggccccggac 1800 ttcttcgagt actttcgggc cacctatccg ctgctgaagg ccgacccctc cctgtggtgc 1860 gtctcggcct ggaatgacaa cggcaaggag cagatggtgg acgccagcag gcctgagctg 1920 ctctaccgca ccgacttttt ccctggcctg ggctggctgc tgttggccga gctctgggct 1980 gagctggagc ccaagtggcc aaaggccttc tgggacgact ggatgcggcg gccggagcag 2040 cggcaggggc gggcctgcat ccgccctgag atctcaagaa cgatgacctt tggccgcaag 2100 ggtgtgagcc acgggcagtt ctttgaccag cacctcaagt tcatcaagct gaaccagcag 2160 tttgtgcact tcacccagct ggacctgtct tacctgcagc gggaggccta tgaccgagat 2220 ttcctcgccc gcgtctacgg tgctccccag ctgcaggtgg agaaagtgag gaccaatgac 2280 cggaaggagc tgggggaggt gcgggtgcag tacacgggca gggacagctt caaggctttc 2340 gccaaggctc tgggtgtcat ggatgacctc aagtcggggg ttccgagagc tggctaccgg 2400 ggcattgtca ccttccagtt ccggggccgc cgtgtccacc tggcgccccc accgacgtgg 2460 gagggctatg atcccagctg gaattag 2487 <210> 144 <211> 65 <212> DNA <213> Trichoderma reesei <400> 144 agctccgccg cgacggccac cgccagcgcc actgttcctg gaggcggtag cggccccacc 60 agcgg 65 <210> 145 <211> 2493 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 145 atgcgcttcc gaatctacaa gcggaaggtc ctcattctga cccttgtcgt ggccgcttgc 60 ggctttgttc tctggtccag caacggtcgc cagcgtaaga acgaggccct ggcgcctccc 120 ctcttggacg ccgaaccggc cagaggcgca ggtggcaggg gaggggatca cccctcggtc 180 gctgtcggca tccgccgcgt cagcaatgtg tccgccgcct ctctggtccc ggcggttccg 240 cagcctgagg cagacaacct cacgctgcgc taccgatcac tcgtgtatca acttaacttc 300 gaccagactc tgcggaacgt cgacaaggcc ggaacctggg ctccgcgtga gttggtcctc 360 gtcgttcagg tgcacaacag gcccgagtac ctccgcctcc tgctggattc gcttcgaaag 420 gcccagggca tcgacaacgt cctggtgatt ttcagccatg acttttggtc cacagagatc 480 aatcagctca ttgcgggtgt caacttttgc cccgtcttgc aagttttctt ccctttctct 540 atccaactct accccaacga gttcccgggc agtgaccccc gcgactgtcc tcgggatctg 600 ccaaaaaacg ccgctctcaa gctgggctgc atcaacgccg aataccccga cagctttggc 660 cactatcgcg aggccaagtt ctcgcagacg aagcaccact ggtggtggaa gctccatttt 720 gtctgggagc gagtgaagat ccttcgtgat tacgcaggac tcattctgtt cttggaagag 780 gaccactacc tggccccgga cttctaccac gtctttaaga agatgtggaa gctcaagcag 840 caggaatgcc ccgagtgcga cgttctgtcc cttggcacct atagcgcgtc ccgctcgttc 900 tacggtatgg ctgacaaggt cgatgtgaaa acctggaagt caactgagca caatatgggc 960 ctcgccctga cgaggaacgc ctaccagaaa ctcatcgagt gtaccgacac cttctgcacg 1020 tacgacgact ataactggga ttggacactg cagtacttga ctgtcagctg cctccctaag 1080 ttttggaagg tccttgttcc ccagatcccg agaattttcc atgctggcga ctgcgggatg 1140 caccacaaga aaacctgtcg cccatccacg cagtctgccc aaatcgagtc gctcctgaac 1200 aacaacaagc agtacatgtt ccccgagaca ctgaccatta gcgagaagtt tacggtcgtg 1260 gcgatctccc cgcctcgaaa gaatggcggc tggggtgaca tccgcgatca cgagctgtgc 1320 aagtcttacc gccggctcca gagctccgcc gcgacggcca ccgccagcgc cactgttcct 1380 ggaggcggta gcggcccgac cagcgggagg gtgcccaccg ccgcccctcc cgcccagccg 1440 cgtgtgcctg tgacccccgc gccggcggtg attcccatcc tggtcatcgc ctgtgaccgc 1500 agcactgttc ggcgctgcct ggacaagctg ctgcattatc ggccctcggc tgagctcttc 1560 cccatcatcg tcagccagga ctgcgggcac gaggagacgg cccaggccat cgcctcctac 1620 ggcagcgcgg tcacgcacat ccggcagccc gacctgagca gcattgcggt gccgccggac 1680 caccgcaagt tccagggcta ctacaagatc gcgcgccact accgctgggc gctgggccag 1740 gtcttccggc agtttcgctt ccccgccgcc gtggtggtgg aggatgacct ggaggtggcc 1800 ccggacttct tcgagtactt tcgggccacc tatccgctgc tgaaggccga cccctccctg 1860 tggtgcgtct cggcctggaa tgacaacggc aaggagcaga tggtggacgc cagcaggcct 1920 gagctgctct accgcaccga ctttttccct ggcctgggct ggctgctgtt ggccgagctc 1980 tgggctgagc tggagcccaa gtggccaaag gccttctggg acgactggat gcggcggccg 2040 gagcagcggc aggggcgggc ctgcatccgc cctgagatct caagaacgat gacctttggc 2100 cgcaagggtg tgagccacgg gcagttcttt gaccagcacc tcaagttcat caagctgaac 2160 cagcagtttg tgcacttcac ccagctggac ctgtcttacc tgcagcggga ggcctatgac 2220 cgagatttcc tcgcccgcgt ctacggtgct ccccagctgc aggtggagaa agtgaggacc 2280 aatgaccgga aggagctggg ggaggtgcgg gtgcagtaca cgggcaggga cagcttcaag 2340 gctttcgcca aggctctggg tgtcatggat gacctcaagt cgggggttcc gagagctggc 2400 taccggggca ttgtcacctt ccagttccgg ggccgccgtg tccacctggc gcccccaccg 2460 acgtgggagg gctatgatcc cagctggaat tag 2493 <210> 146 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 146 ggtaccgggc ccactgcgca tcatgcgctt ccgaatctac aagcg 45 <210> 147 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct <400> 147 ggcgcgccac tagtctaatt ccagctggga tcatagcc 38

Claims (69)

  1. N-아세틸글루코사미닐트랜스퍼라제 활성을 갖는 재조합 단백질로서, 여기서 재조합 단백질은 N-아세틸글루코사민의 말단 Manα3 잔기로의 전달을 촉매하고 N-아세틸글루코사민의 수용체 글리칸의 말단 Manα6 잔기로의 전달을 촉매하며, 상기 재조합 단백질은 적어도 2종의 상이한 효소들로부터의 촉매 도메인을 포함하는 것인 재조합 단백질.
  2. 제1항에 있어서, 재조합 단백질은 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인 및 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 포함하는 융합 단백질인 것인 재조합 단백질.
  3. 제2항에 있어서, N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인과 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인은 인간 효소로부터 유래하는 것인 재조합 단백질
  4. 제3항에 있어서, N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인은 SEQ ID NO: 1의 아미노산 잔기 104-445와 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 포함하는 것인 재조합 단백질.
  5. 제3항 또는 제4항에 있어서, N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인은 SEQ ID NO: 21의 아미노산 잔기 30-447과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 포함하는 것인 재조합 단백질.
  6. 제2항 내지 제5항 중 어느 하나의 항에 있어서, N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인은 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인에 대한 N-말단인 것인 재조합 단백질.
  7. 제2항 내지 제5항 중 어느 하나의 항에 있어서, N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인과 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인 사이에 스페이서를 더 포함하는 것인 재조합 단백질.
  8. 제7항에 있어서, 스페이서는 스템 도메인으로부터의 서열을 포함하는 것인 재조합 단백질.
  9. 제7항 또는 제8항에 있어서, 스페이서는 SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO: 122, 및 SEQ ID NO: 124로 이루어진 군으로부터 선택된 서열을 포함하는 것인 재조합 단백질.
  10. 제9항에 있어서, 스페이서는 SEQ ID NO: 118, SEQ ID NO: 120, 및 SEQ ID NO: 124로 이루어진 군으로부터 선택된 서열을 포함하는 것인 재조합 단백질.
  11. 제9항에 있어서, 스페이서는 SEQ ID NO: 124 또는 SEQ ID NO: 120의 서열을 포함하는 것인 재조합 단백질.
  12. 제9항에 있어서, 스페이서는 SEQ ID NO: 124의 서열을 포함하는 것인 재조합 단백질.
  13. 제2항 내지 제12항 중 어느 하나의 항에 있어서, 촉매 도메인들의 N-말단에 링크된 표적화 펩타이드를 더 포함하는 것인 재조합 단백질.
  14. 제13항에 있어서, 표적화 펩타이드는 스템 도메인을 포함하는 것인 재조합 단백질.
  15. 제8항 내지 제14항 중 어느 하나의 항에 있어서, 스템 도메인은 만노시다제, 만노실트랜스퍼라제, 글리코실트랜스퍼라제, 2형 골지 단백질, MNN2, MNN4, MNN6, MNN9, MNN10, MNS1, KRE2, VAN1, 및 OCH1로 이루어진 군으로부터 선택된 단백질로부터 유래된 것인 재조합 단백질.
  16. 제15항에 있어서, 단백질은 아크레모니움, 아스퍼질러스, 아우레오바시디움, 크립토코쿠스, 크리소스포리움 , 크리소스포리움 루크노웬스, 필리바시디움 , 푸사리움, 지베렐라, 휴미콜라, 마그나포르테, 뮤코, 미셀리오프토라 , 미로테슘, 네오칼리마스틱스 , 뉴로스포라, 페실로마이세스 , 피니실륨, 피로마이세스 , 쉬조필룸, 라로마이세스, 써모아스쿠스 , 틸라비아 , 톨리포클라디움, 및 트리코더마로 이루어진 군으로부터 선택된 생물로부터 유래된 것인 재조합 단백질.
  17. 제13항 또는 제14항에 있어서, 표적화 펩타이드는 Kre2 표적화 펩타이드인 것인 재조합 단백질.
  18. 제14항 내지 제17항 중 어느 하나의 항에 있어서, 표적화 펩타이드는 스템 도메인의 N-말단 엔드에 링크된 막투과 도메인을 더 포함하는 것인 재조합 단백질.
  19. 제14항 내지 제17항 중 어느 하나의 항에 있어서, 표적화 펩타이드는 스템 도메인의 N-말단 엔드에 링크된 세포질 도메인을 더 포함하는 것인 재조합 단백질.
  20. 제18항에 있어서, 표적화 펩타이드는 막투과 도메인의 N-말단 엔드에 링크된 세포질 도메인을 더 포함하는 것인 재조합 단백질.
  21. 인간 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인과 인간 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인, 스페이서 서열 및 표적화 펩타이드를 포함하는 재조합 단백질로서 여기서 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인은 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인에 대해 N-말단에 위치하고, 스페이서 서열은 상기 촉매 도메인들 사이에 위치한 인간 N-아세틸글루코사미닐트랜스퍼라제 I 스템 도메인으로부터 유래된 서열을 포함하며, 표적화 펩타이드는 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인에 대해 N-말단에 위치하며 여기서 표적화 펩타이드는 인간 N-아세틸글루코사미닐트랜스퍼라제 II로부터의 세포질 도메인, 막투과 도메인, 및 스템 도메인을 포함하는 것인 재조합 단백질.
  22. SEQ ID NO: 95와 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 ㅅ서서열을 포함하는 재조합 단백질.
  23. 인간 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인 및 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인, 스페이서, 및 표적화 펩타이드를 포함하는 재조합 단백질로서, 여기서 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인은 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인에 대해 N-말단에 위치하고; 스페이서는 촉매 도메인들 사이에 위치하되, 여기서 스페이서는 SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO: 122, 및 SEQ ID NO: 124로 이루어진 군으로부터 선택된 서열을 포함하는 것이고; 표적화 펩타이드는 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인에 대해 N-말단에 위치하되, 여기서 표적화 펩타이드는 인간 N-아세틸글루코사미닐트랜스퍼라제 II로부터 유래된 세포질 도메인, 막투과 도메인, 및 스템 도메인을 포함하는 것인 재조합 단백질.
  24. 제23항에 있어서, 스페이서는 SEQ ID NO: 118, SEQ ID NO: 120, 및 SEQ ID NO: 124로 이루어진 군으로부터 선택된 서열을 포함하는 것인 재조합 단백질.
  25. 제23항에 있어서, 스페이서는 SEQ ID NO: 124 또는 SEQ ID NO: 120의 서열을 포함하는 것인 재조합 단백질.
  26. 제23항에 있어서, 스페이서는 SEQ ID NO: 124의 서열을 포함하는 것인 재조합 단백질.
  27. 전술한 청구항들 중 어느 하나의 항에 기재된 재조합 단백질을 코딩하는 분리된 폴리뉴클레오타이드.
  28. 프로모터에 작동적으로 링크된 제27항에 기재된 분리된 폴리뉴클레오타이드를 포함하는 발현 벡터.
  29. 제28항에 기재된 발현 벡터를 포함하는 숙주 세포.
  30. 복합 N-글리칸의 제조방법으로서:
    (1) N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인과 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 포함하는 융합 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 숙주 세포를 제공하는 단계; 및
    (2)융합 단백질이 발현되도록 상기 숙주 세포를 배양하는 단계로서, 여기서 융합 단백질은 N-아세틸글루코사민이 말단 Manα3 잔기로 전달되는 것과 N-아세틸글루코사민이 수용체 글리칸의 말단 Manα6 잔기로 전달되는 것을 촉매하여 복합 N-글리칸을 생산하는 것인 단계
    를 포함하는 복합 N-글리칸의 제조방법.
  31. 제30항에 있어서, 수용체 글리칸은 이종 폴리펩타이드에 결합된 것인 방법.
  32. 제30항 또는 제31항에 있어서, 복합 N-글리칸은 GlcNAcβ2Manβ3(GlcNAcβ2Manβ6)Manβ4GlcNAcβ4GlcNAc인 것인 방법.
  33. 제30항 내지 제32항 중 어느 하나의 항에 있어서, 숙주 세포는 트리코더마 sp., 아크레모늄 , 아스퍼질러스, 아우레오바시디움, 크립토코쿠스, 크리소스포리움 , 크리소스포리움 루크노웬스, 필리바시디움 , 푸사리움, 지베렐라 , 마그나포르 , 뮤코, 미셀리오프토라 , 미로테슘, 네오칼리마스틱스 , 뉴로스포라, 페실로미세 스, 피니실륨, 피로미세스 , 쉬조필룸, 탈라로미세스 , 써모아스쿠스 , 틸라비아 , 및 톨리포클라디움으로 이루어진 군으로부터 선택된 사상 진균 세포인 것인 방법.
  34. 제30항 내지 제33항 중 어느 하나의 항에 있어서, 숙주 세포는 UDP-GlcNAc 트랜스포터를 코딩하는 폴리뉴클레오타이드를 더 포함하는 것인 방법.
  35. 제30항 내지 제34항 중 어느 하나의 항에 있어서, 숙주 세포 중의 돌리킬-P-Man:Man(5)GlcNAc(2)-PP-돌리킬 만노실트랜스퍼라제의 활성 수준은 야생형 숙주 세포에서의 활성 수준에 비해 감소된 수준인 것인 방법.
  36. 제35항에 있어서, 숙주 세포 중의 alg3 유전자의 발현 수준은 야생형 숙주 세포에서의 발현 수준에 비해 감소된 수준인 것인 방법.
  37. 제36항에 있어서, alg3 유전자는 숙주 세포로부터 결실되는 것인 방법.
  38. 제30항 내지 제37항 중 어느 하나의 항에 있어서, 숙주 세포 중의 α-1,6-만노실트랜스퍼라제의 활성 수준은 야생형 숙주 세포에서의 활성 수준에 비해 감소된 수준인 것인 방법.
  39. 제38항에 있어서, 숙주 세포 중의 och1 유전자의 발현 수준은 야생형 숙주 세포에서의 발현 수준에 비해 감소된 수준인 것인 방법.
  40. 제30항 내지 제39항 중 어느 하나의 항에 있어서, 숙주 세포는 α-1,2-만노시다제를 코딩하는 폴리뉴클레오타이드를 더 포함하는 것인 방법.
  41. 제30항 내지 제40항 중 어느 하나의 항에 있어서, 숙주 세포는 β-1,4-갈락토실트랜스퍼라제를 코딩하는 폴리뉴클레오타이드를 더 포함하는 것인 방법.
  42. 제30항 내지 제41항 중 어느 하나의 항에 있어서, 숙주 세포는 시알릴트랜스퍼라제를 코딩하는 폴리뉴클레오타이드를 더 포함하는 것인 방법.
  43. 복합 N-글리칸의 제조방법으로서:
    (1) 트리코더마 숙주 세포를 제공하는 단계로서, 여기서 상기 숙주 세포 중의 alg3 유전자의 발현 수준은 야생형 숙주 세포에서의 발현 수준에 비해 감소된 수준이고 상기 숙주 세포는 N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인을 코딩하는 제1 폴리뉴클레오타이드와 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 코딩하는 제2 폴리뉴클레오타이드를 포함하는 것인 단계; 및
    (2) 숙주 세포를 배양하여 복합 N-글리칸을 생산하는 단계
    를 포함하는, 복합 N-글리칸의 제조방법.
  44. N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인와 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 함유하는 융합 단백질, 수용체 글리칸, 및 N-아세틸글루코사민 공여체를 완충액에서 함께 인큐베이션시키는 단계로서, 여기서, 상기 융합 단백질은 N-아세틸글루코사민이 말단 Manα3 잔기로 전달되는 것과 N-아세틸글루코사민이 수용체 글리칸의 말단 Manα6 잔기로 전달되는 것을 촉매하여 복합 N-글리칸을 제조하는 것인 단계를 포함하는, 복합 N-글리칸의 제조방법.
  45. alg3 및 Man3GlcNAc2의 돌연변이를 포함하는 사상 진균 세포로서, 여기서 Man3GlcNAc2는 세포 내의 중성 N-글리칸의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 적어도 100%를 포함하는 것인 사상 진균 세포.
  46. 제45항에 있어서, alg3의 돌연변이는 alg3의 결실인 것인 사상 진균 세포.
  47. 제45항 또는 제46항에 있어서, 세포는 트리코더마 리세이 세포인 것인 사상 진균 세포.
  48. 제45항 내지 제47항 중 어느 하나의 항에 있어서, N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인을 코딩하는 제1 폴리뉴클레오타이드 및 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 코딩하는 제2 폴리뉴클레오타이드를 더 포함하는 것인 사상 진균 세포.
  49. 제45항 내지 제47항 중 어느 하나의 항에 있어서, N-아세틸글루코사미닐트랜스퍼라제 I 촉매 도메인 및 N-아세틸글루코사미닐트랜스퍼라제 II 촉매 도메인을 포함하는 융합 단백질을 코딩하는 폴리뉴클레오타이드를 더 포함하는 것인 사상 진균 세포.
  50. 숙주 세포에서 Man3GlcNAc2 글리칸을 생산하는 방법으로서:
    (1) 야생형 숙주 세포에서의 활성 수준에 비해 만노실트랜스퍼라제의 활성 수준이 감소된 숙주 세포를 제공하는 단계; 및
    (2) 상기 숙주 세포를 배양하여 Man3GlcNAc2 글리칸을 생산하는 단계로서, 여기서 Man3GlcNAc2 글리칸은 숙주 세포 중 중성 N-글리칸의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 적어도 100%를 포함하는 것인 단계
    를 포함하는, 숙주 세포에서 Man3GlcNAc2 글리칸을 생산하는 방법.
  51. 제50항에 있어서, Man3GlcNAc2 글리칸은 이종 폴리펩타이드에 결합된 것인 방법.
  52. 제50항 또는 제51항에 있어서, 만노실트랜스퍼라제는 돌리킬-P-Man:Man(5)GlcNAc(2)-PP-돌리킬 만노실트랜스퍼라제인 것인 방법..
  53. 제50항 내지 제52항 중 어느 하나의 항에 있어서, 숙주 세포 중의 alg3 유전자의 발현 수준은 야생형 숙주 세포에서의 발현 수준에 비해 감소된 수준인 것인 방법.
  54. 제50항 내지 제53항 중 어느 하나의 항에 있어서, 숙주 세포는 트리코더마 세포인 것인 방법.
  55. 제50항 내지 제54항 중 어느 하나의 항에 있어서, 숙주 세포 중의 알파-1,6-만노실트랜스퍼라제의 활성 수준은 야생형 숙주 세포에서의 활성 수준에 비해 감소된 수준인 것인 방법.
  56. 제50항 내지 제55항 중 어느 하나의 항에 있어서, 숙주 세포는 α-1,2-만노시다제를 코딩하는 내인성 폴리뉴클레오타이드를 포함하는 것인 방법..
  57. 야생형 사상 진균 세포에서의 alg3 유전자의 발현 수준에 비해 감소된 alg3 유전자의 발현 수준을 갖는 사상 진균 세포로서, 여기서 상기 사상 진균 세포는 제2항 내지 제26항 중 어느 하나의 항에 기재된 재조합 단백질을 포함하는 것인 사상 진균 세포.
  58. 제57항에 있어서, alg3 유전자는 돌연변이를 포함하는 것인 사상 진균 세포.
  59. 제58항에 있어서, alg3 유전자의 돌연변이는 alg3 유전자의 결실인 것인 사상 진균 세포.
  60. 제57항 내지 제59항 중 어느 하나의 항에 있어서, 융합 단백질은 프로모터에 작동적으로 링크된 폴리뉴클레오타이드에 의해 코딩된 것인 사상 진균 세포.
  61. 제60항에 있어서, 프로모터는 유도(inducible) 프로모터인 것인 사상 진균 세포.
  62. 제1항에 있어서, 유도 프로모터는 cbh1 프로모터인 것인 사상 진균 세포.
  63. 제57항 내지 제62항 중 어느 하나의 항에 있어서, 사상 진균 세포는 UDP-GlcNAc 트랜스포터를 코딩하는 폴리뉴클레오타이드를 더 포함하는 것인 사상 진균 세포.
  64. 제57항 내지 제63항 중 어느 하나의 항에 있어서, 사상 진균 세포 중의 an α-1,6-만노실트랜스퍼라제의 활성 수준은 야생형 사상 진균 세포에서의 활성 수준에 비해 감소된 수준인 것인 사상 진균 세포.
  65. 제64항에 있어서, 사상 진균 세포에서의 och1 유전자의 발현 수준은 야생형 사상 진균 세포에서의 발현 수준보다 감소된 수준인 것인 사상 진균 세포.
  66. 제57항 내지 제65항 중 어느 하나의 항에 있어서, 사상 진균 세포는 α-1,2-만노시다제를 코딩하는 폴리뉴클레오타이드를 더 포함하는 것인 사상 진균 세포.
  67. 제57항 내지 제65항 중 어느 하나의 항에 있어서, 사상 진균 세포는 베타-1,4-갈락토실트랜스퍼라제를 코딩하는 폴리뉴클레오타이드를 더 포함하는 것인 사상 진균 세포.
  68. 제57항 내지 제65항 중 어느 하나의 항에 있어서, 사상 진균 세포는 시알릴트랜스퍼라제를 코딩하는 폴리뉴클레오타이드를 더 포함하는 것인 사상 진균 세포.
  69. 제57항 내지 제65항 중 어느 하나의 항에 있어서, 사상 진균 세포는 트리코더마 sp ., 아크레모늄 , 아스퍼질러스, 아우레오바시디움, 크립토코쿠스, 크리소스포리움 , 크리소스포리움 루크노웬스, 필리바시디움 , 푸사리움, 지베렐라 , 마그나포르테, 뮤코, 미셀리오프토라 , 미로테슘, 네오칼리마스틱스 , 뉴로스포라, 페실로미세스 , 피니실륨, 피로미세스 , 쉬조필룸, 탈라로미세스 , 써모아스쿠스 , 틸라비아 , 및 톨리포클라디움으로 이루어진 군으로부터 선택되는 것인 사상 진균 세포.
KR1020137016445A 2010-11-24 2011-11-24 N-아세틸글루코사미닐트랜스퍼라제 활성을 갖는 융합 효소 KR20140018851A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US41714410P 2010-11-24 2010-11-24
US61/417,144 2010-11-24
PCT/EP2011/070956 WO2012069593A2 (en) 2010-11-24 2011-11-24 Fusion enzymes

Publications (1)

Publication Number Publication Date
KR20140018851A true KR20140018851A (ko) 2014-02-13

Family

ID=45093734

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020137016445A KR20140018851A (ko) 2010-11-24 2011-11-24 N-아세틸글루코사미닐트랜스퍼라제 활성을 갖는 융합 효소

Country Status (14)

Country Link
US (2) US9399764B2 (ko)
EP (1) EP2643456B1 (ko)
JP (1) JP6017439B2 (ko)
KR (1) KR20140018851A (ko)
CN (1) CN103348003B (ko)
AU (1) AU2011333685A1 (ko)
BR (1) BR112013013045A2 (ko)
CA (1) CA2819071A1 (ko)
DK (1) DK2643456T3 (ko)
IL (1) IL226481A0 (ko)
MX (1) MX338560B (ko)
RU (1) RU2013128619A (ko)
SG (1) SG190321A1 (ko)
WO (1) WO2012069593A2 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG190321A1 (en) 2010-11-24 2013-06-28 Novartis Int Pharm Ltd Fusion enzymes having n-acetylglucosaminyltransferase activity
EP2852610B1 (en) 2012-05-23 2018-07-11 Glykos Finland Oy Production of fucosylated glycoproteins
US20160177355A1 (en) * 2013-03-14 2016-06-23 Adam C. Fisher Oligosaccharide compositions, glycoproteins and methods to produce the same in prokaryotes
PL3016970T3 (pl) 2013-07-04 2019-09-30 Glykos Finland Oy Komórki grzybów nitkowatych z niedoborem O-mannozylotransferazy i sposoby ich zastosowania
PL3019621T3 (pl) 2013-07-10 2019-05-31 Glykos Finland Oy Wytwarzanie glikoprotein o zwiększonym zajmowaniu miejsca N-glikozylacji
CA2916905A1 (en) 2013-07-10 2015-01-15 Novartis Ag Multiple proteases deficient filamentous fungal cells and methods of use thereof
EP3027743A1 (en) 2013-07-29 2016-06-08 Danisco US Inc. Variant enzymes
SG11201700446XA (en) 2014-07-21 2017-02-27 Glykos Finland Oy Production of glycoproteins with mammalian-like n-glycans in filamentous fungi
CN105695439B (zh) * 2014-11-27 2023-08-01 丰益(上海)生物技术研发中心有限公司 一种β-葡萄糖苷酶基因的重组表达方法
JP2021534763A (ja) * 2018-08-21 2021-12-16 クララ フーズ カンパニー 微生物におけるタンパク質のグリコシル化の修飾
US10927358B2 (en) * 2019-01-16 2021-02-23 Fornia Biosolutions, Inc. Endoglucanase compositions and methods
CN110448719B (zh) * 2019-06-28 2020-05-22 浙江大学 一种促进凝血的丝素-多肽电纺膜及其制备方法
CN116121094A (zh) * 2023-03-03 2023-05-16 天津科技大学 一株高产神经酰胺的酿酒酵母工程菌株、构建方法及其应用

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4500707A (en) 1980-02-29 1985-02-19 University Patents, Inc. Nucleosides useful in the preparation of polynucleotides
US4475196A (en) 1981-03-06 1984-10-02 Zor Clair G Instrument for locating faults in aircraft passenger reading light and attendant call control system
US4447233A (en) 1981-04-10 1984-05-08 Parker-Hannifin Corporation Medication infusion pump
US4439196A (en) 1982-03-18 1984-03-27 Merck & Co., Inc. Osmotic drug delivery system
US4447224A (en) 1982-09-20 1984-05-08 Infusaid Corporation Variable flow implantable infusion apparatus
US4487603A (en) 1982-11-26 1984-12-11 Cordis Corporation Implantable microinfusion pump system
US4486194A (en) 1983-06-08 1984-12-04 James Ferrara Therapeutic device for administering medicaments through the skin
US4743546A (en) 1985-02-13 1988-05-10 Biotechnica International, Inc. Controlled gene excision
US4596556A (en) 1985-03-25 1986-06-24 Bioject, Inc. Hypodermic injection apparatus
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4941880A (en) 1987-06-19 1990-07-17 Bioject, Inc. Pre-filled ampule and non-invasive hypodermic injection device assembly
US4790824A (en) 1987-06-19 1988-12-13 Bioject, Inc. Non-invasive hypodermic injection device
US5700637A (en) 1988-05-03 1997-12-23 Isis Innovation Limited Apparatus and method for analyzing polynucleotide sequences and method of generating oligonucleotide arrays
GB8822228D0 (en) 1988-09-21 1988-10-26 Southern E M Support-bound oligonucleotides
US5312335A (en) 1989-11-09 1994-05-17 Bioject Inc. Needleless hypodermic injection device
US5064413A (en) 1989-11-09 1991-11-12 Bioject, Inc. Needleless hypodermic injection device
US5383851A (en) 1992-07-24 1995-01-24 Bioject Inc. Needleless hypodermic injection device
DE19754622A1 (de) 1997-12-09 1999-06-10 Antje Von Dr Schaewen Pflanzliche GntI-Sequenzen und Verwendung derselben zur Gewinnung von Pflanzen mit verminderter oder fehlender N-Acetylglucosaminyltransferase I (GnTI)-Aktivität
US7244601B2 (en) * 1997-12-15 2007-07-17 National Research Council Of Canada Fusion proteins for use in enzymatic synthesis of oligosaccharides
ATE332968T1 (de) 1998-10-26 2006-08-15 Novozymes As Erstellung und durchmusterung von interessierenden dna-banken in zellen von filamentösen pilzen
AU784960B2 (en) * 1999-08-19 2006-08-10 Kirin Pharma Kabushiki Kaisha Novel yeast variants and process for producing glycoprotein containing mammalian type sugar chain
US7598055B2 (en) * 2000-06-28 2009-10-06 Glycofi, Inc. N-acetylglucosaminyltransferase III expression in lower eukaryotes
US7795002B2 (en) * 2000-06-28 2010-09-14 Glycofi, Inc. Production of galactosylated glycoproteins in lower eukaryotes
EP2359685B1 (en) 2001-12-27 2013-12-04 GlycoFi, Inc. Methods to engineer mammalian-type carbohydrate structures
EP1504023A4 (en) * 2002-05-03 2006-03-22 Neose Technologies Inc RECOMBINANT GLYCOSYL TRANSFERASE FUSION PROTEINS
WO2006026992A1 (en) 2004-09-07 2006-03-16 Novozymes A/S Altered structure of n-glycans in a fungus
US7501275B2 (en) 2004-10-27 2009-03-10 The United States Of America As Represented By The Secretary Of Agriculture Yeast transformation system
US20080026376A1 (en) 2006-07-11 2008-01-31 Huaming Wang KEX2 cleavage regions of recombinant fusion proteins
BRPI0622182B1 (pt) 2006-10-03 2018-07-31 Metabolic Explorer Processo para a substituição de uma sequência de DNA alvo através de recombinação homóloga em Clostridia, cepa recombinante de Clostridium e vetor para a substituição de uma sequência de DNA alvo por recombinação homóloga em Clostridia
TW201028431A (en) 2008-10-31 2010-08-01 Lonza Ag Novel tools for the production of glycosylated proteins in host cells
SG190321A1 (en) 2010-11-24 2013-06-28 Novartis Int Pharm Ltd Fusion enzymes having n-acetylglucosaminyltransferase activity

Also Published As

Publication number Publication date
JP6017439B2 (ja) 2016-11-02
SG190321A1 (en) 2013-06-28
AU2011333685A1 (en) 2013-06-27
MX338560B (es) 2016-04-20
EP2643456B1 (en) 2016-05-11
BR112013013045A2 (pt) 2021-10-26
CA2819071A1 (en) 2012-05-31
WO2012069593A2 (en) 2012-05-31
EP2643456A2 (en) 2013-10-02
IL226481A0 (en) 2013-07-31
CN103348003B (zh) 2016-09-07
RU2013128619A (ru) 2014-12-27
DK2643456T3 (en) 2016-08-22
WO2012069593A3 (en) 2013-01-03
US20130330780A1 (en) 2013-12-12
CN103348003A (zh) 2013-10-09
MX2013005853A (es) 2013-12-12
US9399764B2 (en) 2016-07-26
JP2014500019A (ja) 2014-01-09
US20170002337A1 (en) 2017-01-05

Similar Documents

Publication Publication Date Title
EP2643456B1 (en) Fusion enzymes having n-acetylglucosaminyltransferase activity
US9695454B2 (en) Production of fucosylated glycoproteins
JP4742191B2 (ja) 糖蛋白質およびその製造方法
EP3172333B1 (en) Production of glycoproteins with mammalian-like n-glycans in filamentous fungi
Kainz et al. N-glycan modification in Aspergillus species
AU2011247333A1 (en) Improved glycosylation of proteins in host cells
US20200362319A1 (en) O-Mannosyltransferase Deficient Filamentous Fungal Cells and Methods of Use Thereof
US20190276867A1 (en) Production of Glycoproteins Having Increased N-Glycosylation Site Occupancy
WO2011119498A1 (en) Production of glycoproteins in genetically modified ciliates

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid