KR20230075436A - 번역 인자를 과발현하는 숙주 세포 - Google Patents

번역 인자를 과발현하는 숙주 세포 Download PDF

Info

Publication number
KR20230075436A
KR20230075436A KR1020237010094A KR20237010094A KR20230075436A KR 20230075436 A KR20230075436 A KR 20230075436A KR 1020237010094 A KR1020237010094 A KR 1020237010094A KR 20237010094 A KR20237010094 A KR 20237010094A KR 20230075436 A KR20230075436 A KR 20230075436A
Authority
KR
South Korea
Prior art keywords
leu
ile
glu
val
thr
Prior art date
Application number
KR1020237010094A
Other languages
English (en)
Inventor
브리지트 개서
제니퍼 스타우다허
디트하드 마타노비치
Original Assignee
론자 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 론자 리미티드 filed Critical 론자 리미티드
Publication of KR20230075436A publication Critical patent/KR20230075436A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4705Regulators; Modulating activity stimulating, promoting or activating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

재조합 진핵 숙주 세포로서, 유전적 변형에 의해 조작되어, 상기 하나 이상의 유전적 변형 이전의 숙주 세포와 비교하여, 메신저 리보핵단백질(mRNP)의 번역 개시 인자(TIF 유전자)를 코딩하는 2개 이상의 유전자의 발현을 증가시키는 관심 유전자(GOI)를 발현하며, 여기서 상기 TIF 유전자는 적어도 eIF4A를 코딩하는 유전자 및 eIF4G를 코딩하는 유전자를 포함하고, 상기 TIF 유전자 중 적어도 하나의 발현은 상기 GOI의 발현을 제어하는 프로모터와 상이한 프로모터의 전사 제어 하에 있는, 숙주 세포.

Description

번역 인자를 과발현하는 숙주 세포
본 발명은 하나 이상의 번역 인자의 발현을 증가시키도록 조작된 숙주 세포 및 재조합 단백질 생산의 수율을 개선하는 것에 관한 것이다.
재조합 숙주 세포 배양에서 생성된 단백질은 진단 및 치료제로서 점점 더 중요해지고 있다. 이러한 목적을 위해 세포는 비정상적으로 높은 수준의 재조합 또는 이종 관심 단백질을 생산하도록 조작 및/또는 선택된다.
관심 단백질(POI)의 성공적인 생산은 세포 배양에서 진핵 숙주 세포로 달성되었다. 진핵 숙주 세포, 특히 포유동물 숙주 세포, 효모 또는 사상성 진균 또는 박테리아는 일반적으로 대용량 화학물질 뿐만 아니라 생약학적 단백질의 생산 숙주로서 사용된다. 가장 눈에 띄는 예는 이종 단백질의 효율적인 분비로 잘 알려진 피치아 파스토리스(Pichia pastoris)와 같은 메틸로트로픽(methylotrophic) 효모이다. 2005년에 P. 파스토리스(P. pastoris)는 새로운 속인 코마가타엘라(Komagataella)로 재분류되었고, K. 파스토리스(K. pastoris), K. 파피(K. phaffii)K. 슈도파스토리스(K. pseudopastoris)의 세 종으로 분리되었다. 생명공학 응용에 일반적으로 사용되는 균주는 제안된 두 종인 K. 파스토리스(K. pastoris)와 K. 파피(K. phaffii)에 속한다. 균주 GS115, X-33, CBS2612 및 CBS7435는 K. 파피(K. phaffii)인 반면, 균주 DSMZ70382는 기준 종인 K. 파스토리스(K. pastoris)로 분류되며, 이는 이용가능한 모든 P. 파스토리스(P. pastoris) 균주에 대한 참조 균주이다(Kurtzman 2009, J Ind Microbiol Biotechnol. 36(11):1435-8). 마타노비치 등(Mattanovich et al., Microbial Cell Factories 2009, 8:29 doi:10.1186/1475-2859-8-29)은 K. 파스토리스(K. pastoris)의 유형 균주 DSMZ70382의 게놈 시퀀싱을 설명하고 이의 세크레톰(secretome) 및 당 수송체를 분석했다.
리보솜은 단백질 합성을 수행하는 복잡한 리보핵단백질 집합체이다. 메신저 리보핵단백질(mRNP)은 mRNA-단백질 복합체이며, 여기서 전사체는 전사체의 수명 주기를 구성하는 동시-전사 및 전사-후 이벤트를 중재하는 변화하는 단백질 세트에 의해 결합된다. 전사체는 먼저 5' 단부 캡핑, 많은 경우 스플라이싱, 3' 절단 및 폴리아데닐화, 핵 엑소좀에 의한 mRNA 품질 제어 및 수출 인자 모집을 거친다. 그런 다음 세포질로 보내지며, 일부는 특정 세포 내 지역화를 거친다. 전사체는 결국 종종 규제된 방식으로 번역되고 품질이 저하된다.
번역 개시는 재조합 단백질 생산을 위한 중요한 경로에 있다. mRNA, 다수의 진핵 개시 인자(eIF) 및 리보솜 단백질로 이루어진 폐쇄 루프 구조의 형성이 번역 개시를 돕고 따라서 전체적인 번역 효율을 증가시키기 위해 논의되고 있다.
미드 등(Mead et al. , Biochem. J. 2015, 472:261-273)은 폐쇄 루프, eIF(eIF3a, eIF3b, eIF3c, eIF3h, eIF3i 및 eIF4G1), 폴리(A)-결합 단백질(PABP) 1 및 PABP-상호작용 단백질 1(PAIP1)의 주요 성분의 mRNA 및 단백질 수준을 모노클로날 항체(mAb)를 생성하는 30개의 재조합 CHO 세포주 패널에 걸쳐서 설명한다. 고-생산성 세포주는 폐쇄 루프 mRNA의 형성에 관여하는 번역 개시 인자의 양을 유지하여 이러한 단백질을 적절한 수준으로 유지하여 향상된 재조합 단백질 생산을 전달하는 것으로 밝혀졌다.
eIF4F 복합체는 캡-결합 단백질 eIF4E, eIF4G 및 RNA 헬리케이스 eIF4A로 이루어진다. eIF4G는 PABP(PAB1), eIF4E, eIF4A 및 (포유류에서) eIF3에 대한 결합 도메인을 보유하는 스캐폴드 단백질이다. 효모와 인간 eIF4G 모두 RNA에 결합한다. RNA-결합 활성과 함께 eIF4G에서 eIF4E 및 PABP에 대한 결합 도메인은 eIF4G가 안정적인 원형 메신저 리보핵단백질(mRNP)을 조립하기 위해 캡, 폴리(A) 꼬리 및 mRNA 본체의 서열을 통해 mRNA와 독립적인 상호작용을 조정할 수 있게 하며, 이는 "폐쇄-루프" 구조라고 한다.
폐쇄 루프 모델은 여러 번역 개시 인자를 포함하여 많은 단백질에 의해 매개되는 가교 메커니즘을 통해 mRNA의 5'- 및 3'-단부의 상호작용을 제안한다. 폐쇄 루프의 코어 브리지는 5'-캡, eIF4F(eIF4A, eIF4E 및 eIF4G로 구성), eIF3, 폴리(A)-결합 단백질(PABP)-상호작용 단백질 1(PAIP1), PABP1 및 폴리(A) 꼬리 사이에 형성된다. mRNA의 이러한 원형화는 리보솜의 향상된 재활용 및/또는 eIF4F가 mRNA에 묶인 상태로 유지되도록 함으로써 번역 속도를 향상시키고 번역 개시의 모든 라운드에 대해 유리 eIF4F 풀에서 다시 모집할 필요가 없다는 것이 대체로 받아들여지고 있다. 진핵생물에서 번역의 신장, 종료 및 재활용 단계는 문헌에서 검토되었다(Dever et al., Cold Spring Harb Perspect Biol 2012;4:a013706 및 Hinnebusch et al., Cold Spring Harb Perspect Biol 2012;4:a011544).
루볼 등(Roobol et al., Metabolic Engineering 2020, 59:98-105)은 증가된 성장 속도, 증가된 단백질 합성 용량 및 지연된 아폽토시스에 대한 포유류 세포주 HEK 및 CHO 세포주 각각에서 대형 eIF3 복합체의 eIF3i 및 eIF3v 서브유닛의 일시적이고 안정적인 과발현의 효과를 조사한다. eIF3i는 진핵 개시 인자 3(eIF3) 복합체의 성분로 12개의 상이한 서브유닛의 단일 카피를 포함하며, 그 중 a, b, c, g 및 i의 5개가 보존되어 있으며 효모에서 포유류에 이르기까지 생체 내에서 필수적이다.
아쳐 등(Archer et al., RNA Biol. 2015 Mar; 12(3): 248-254)은 효모에서 캡 구조, 폴리(A) 꼬리, eIF4E, eIF4G 및 PAB 사이의 상호작용을 통해 형성된 mRNA 폐쇄-루프를 조사했다.
챈 등(Chan et al., eLife 2018;7:e32536)은 효모에서 번역 개시를 억제하면 개별 전사체가 불안정해지고 mRNA 붕괴가 가속화된다고 설명한다. eIF4E의 5'캡- 결합 돌연변이의 과발현은 미묘한 성장 억제를 일으켰다. eIF4E 및 eIF4G를 동시에 하향조절하면 강력한 합성 성장 결함이 관찰되었다.
39S 및 57S 번역 복합체에 존재하는 번역 개시 인자 eIF4E, eIF4G1 및 eIF4G2는 PAB1과 동시-정제된다. 이러한 복합체는 폐쇄-루프 인자, eIF4E, eIF4G 및 PAB1을 함유하며 eIF4E가 mRNA 캡에 결합하고 PAB1이 폴리아데닐화된 꼬리에 결합함으로써 mRNA와 명백하게 연관된다(Denis et al. Nature Scientific Reports 2018, 8:11468).
RLI1은 리보솜 재활용에 중요하고 효율적인 정지 코돈 인식에 필요하여 번역 종료를 자극하는 것으로 알려져 있다. 그러나 RLI1은 번역 개시와 리보솜 생물발생에서 이중 기능을 가지고 있다. 야루닌 등(Yarunin et al., The EMBO Journal 2005, 24:580-588)은 pre-40S 입자 및 성숙한 40S 서브유닛과 연관된 리보솜 형성에서 기능을 가진 RLI1을 설명한다. RLI1은 특히 MFC 성분 및 40S 리보솜과 연관이 있다(Dong et al., THE JOURNAL OF BIOLOGICAL CHEMISTRY 2004, 279(40):42157-42168).
랴오 등(Liao et al., Biotechnol Lett (2020). https://doi.org/10.1007/s10529-020-02977-z)은 번역-관련 인자-과발현 균주에서 메탄올 유도 하에 eGFP의 발현 프로필을 기재하고 메탄올 유도 하에서 과발현되었을 때 eGFP 발현을 상당히 증가시킨 요인으로 리보솜 생물발생 인자인 Bcy1을 확인하였다. eIF4A 및 eIF4G 과발현자는 그러한 발현 시스템에서 유의미한 영향을 미치지 않았다. Bcy1은 사이클릭 AMP-의존성 단백질 키나제(PKA)의 조절 서브유닛으로 리보솜 단백질 유전자, 포스트디옥식(postdiauxic) 이동 유전자 및 스트레스 반응 요소 유전자를 조절하여 세포 성장 및 이종 단백질 발현을 개선한다.
WO2019173204A1은 PAB1을 과발현하는 효모를 개시하여 대규모 에탄올 생산에 사용하기 위한 아세테이트 형성을 감소시킨다. US5646009는 하나의 열린 해독틀에 eIF4E를 코딩하는 DNA 세그먼트 및 관심 단백질을 코딩하는 또 다른 DNA 세그먼트를 포함하여 진핵 숙주 세포, 특히 HEK 세포에서 단백질의 발현을 증가시키는 하이브리드 벡터를 개시한다.
CN110551750은 RLI1을 과발현함으로써 효모 mRNA 발현의 효율을 향상시키는 것을 기술한다.
EP3663319는 PAB1 및 eIF4G를 포함하는 융합 단백질을 발현하고 효모에서 관심 단백질을 발현하는 것을 개시한다.
이 요약은 하기의 상세한 설명에서 추가로 설명되는 단순화된 형태로 개념의 선택을 소개하기 위해 제공된다. 이 요약은 청구된 주제의 핵심 또는 필수 기능을 식별하기 위한 것이 아니며 청구된 주제의 범위를 제한하기 위해 사용하려는 것도 아니다. 청구된 주제의 다른 특징, 세부 사항, 유용성 및 장점은 첨부된 도면에 예시되고 첨부된 청구 범위에 정의된 측면을 포함하여 다음의 서면 상세한 설명으로부터 명백해질 것이다.
생산 숙주 세포에서 재조합 단백질 생산을 개선하는 것이 본 발명의 목적이다. 번역 효율을 증가시켜 재조합 단백질의 수율을 증가시키는 것이 구체적인 목적이다.
목적은 청구범위의 주제에 의해 해결되며 본원에서 추가로 설명된다.
본 발명은 상기 하나 이상의 유전적 변형 이전의 숙주 세포와 비교하여 메신저 리보핵단백질(mRNP)의 번역 개시 인자(TIF 유전자)를 코딩하는 2개 이상의 유전자의 발현을 증가시키기 위해 유전적 변형에 의해 조작된 관심 유전자(GOI)를 발현하는 재조합 진핵 숙주 세포를 제공한다.
구체적으로, 상기 2개 이상의 TIF 유전자는 적어도 eIF4A를 코딩하는 유전자 및 eIF4G를 코딩하는 유전자를 포함하는 TIF 유전자이다.
특정 측면에 따르면, TIF 유전자는 eIF4E, PAB1 또는 RLI1을 코딩하는 유전자 중 임의의 하나 이상을 추가로 포함한다.
특정 구현양태에 따르면, 상기 TIF 유전자는 하기 TIF를 포함하거나 이로 이루어진 TIF, 특히 하기 TIF의 조합을 포함하거나 이로 이루어진 TIF를 코딩한다:
a) eIF4A 및 eIF4G;
b) eIF4A, eIF4G 및 eIF4E;
c) eIF4A, eIF4G, eIF4E 및 PAB1;
d) eIF4A, eIF4G 및 PAB1.
구체적으로, 상기 구현양태 a) 내지 d)의 TIF의 임의의 조합은 임의로 RLI1을 추가로 포함할 수 있다.
특정 측면에 따르면, 숙주 세포는 적어도
a) eIF4A 및 eIF4G를 코딩하는 유전자;
b) eIF4A, eIF4G 및 eIF4E를 코딩하는 유전자;
c) eIF4A, eIF4G, eIF4E 및 PAB1을 코딩하는 유전자;
d) eIF4A, eIF4G 및 PAB1을 코딩하는 유전자를 과발현하도록 조작된다.
구체적으로, 숙주 세포는 상기 a) 내지 d)에 언급된 임의의 유전자 조합을 과발현하도록 조작되고, 임의로 추가로 RLI1을 과발현하도록 조작되도록 조작될 수 있다. 구체적으로, 상기 TIF 유전자 중 적어도 하나의 발현은 상기 GOI의 발현을 제어하는 프로모터와 상이한 프로모터의 전사 제어 하에 있다. 구체적으로, GOI는 GOI 발현 카세트(GOIEC)에 의해 발현되고 각각의 TIF 유전자는 TIF 유전자 발현 카세트(TIFEC)에 의해 발현된다. 발현 카세트는 발현될 유전자에 작동가능하게 연결된 적어도 하나의 프로모터를 포함하거나 이로 이루어진다.
특정 측면에 따르면, GOIEC 프로모터는 임의의 하나 이상 또는 모든 TIFEC 프로모터와 상이하다.
프로모터는 TIF 유전자(들) 및 GOI를 발현하기 위해 각각의 개별 발현 카세트에 구체적으로 포함된다.
구체적으로, mRNP의 TIF는 43S 예비개시 복합체(PIC)에 결합하기 전과 같이 mRNP 복합체 또는 활성화된 mRNP에 존재하는 TIF이다. 이러한 TIF 중에는 특히 eIF4E, eIF4A, eIF4G, PAB1 및/또는 RLI1과 같은 폐쇄-루프 요소 중 하나 이상이 있으며, 이는 폐쇄 루프 구조와 연관이 있는 것으로 이해되며, 특히 eIF4E, eIF4A 또는 eIF4G와 같은 eIF4F 복합체의 하나 이상의 인자와 연관된다.
구체적으로, 상기 eIF4G는 eIF4G2(TIF4632, 진핵 개시 인자 4F 서브유닛 p130), 바람직하게는 효모, 예컨대 피치아(Pichia) 또는 사카로미세스(Saccharomyces)이다.
특정 구현양태에 따르면, 숙주 세포는 적어도 2개, 적어도 3개, 적어도 4개 또는 적어도 5개의 상기 TIF 유전자를 과발현하도록 유전적으로 조작되며, 상기 TIF 유전자는 적어도 eIF4A 및 eIF4G를 코딩하는 유전자를 포함한다.
구체적으로, 상기 TIF 중 적어도 2개는 eIF4F 복합체, 특히 eIF4A, eIF4G 및 임의로 eIF4E이다. 구체적으로, eIF4F 복합체의 2개, 3개 또는 그 이상 또는 모든 TIF 유전자, 특히 eIF4A, eIF4G 및 임의로 eIF4E가 과발현된다.
구체적으로, 상기 TIF 중 적어도 하나는 폐쇄-루프 인자, 특히 eIF4G, 및 임의로 eIF4E 또는 PAB1 중 임의의 하나 또는 둘 다일 수 있다. 구체적으로, 1개, 2개, 3개 또는 그 이상 또는 모든 폐쇄-루프 인자, 특히 eIF4G, 및 임의로 eIF4E 또는 PAB1 중 임의의 하나 또는 둘 모두가 과발현된다.
구체적으로, TIF 유전자는 자연-발생 유전자 또는 이의 인공 변이체, 특히 자연 발생 TIF(자연-발생 이소폼 포함)를 코딩하는 유전자, 또는 높은 서열 동일성 및 활성화된 mRNP에서의 TIF와 거의 동일하거나 증가된 기능 및/또는 생산 숙주 세포에서의 번역 개시를 갖는 기능적으로 활성인 변이체를 포함하는 진핵 또는 원핵 기원, 특히 효모 또는 포유동물 기원이다.
구체적으로, TIF 유전자는 하기에서 유래하는 것과 같이 본원에 추가로 기재된 임의의 숙주 세포 종으로부터 유래하는 것과 같은 진핵생물 기원이다:
a) 피치아(Pichia), 한세눌라(Hansenula), 코마가타엘라(Komagataella), 사카로미세스(Saccharomyces), 클루이베로미세스(Kluyveromyces), 칸디다(Candida), 오가테아(Ogataea), 야로위아(Yarrowia) 및 지오트리쿰(Geotrichum), 바람직하게는 피치아 파스토리스(Pichia pastoris), 코마가타엘라 파피(Komagataella phaffii), 코마가타엘라 파스토리스(Komagataella pastoris), 코마가타엘라 슈도파스토리스(Komagataella pseudopastoris), 사카로미세스 세레비지애(Saccharomyces cerevisiae), 오가테아 미누타(Ogataea minuta), 클루이베롬세스 락티스(Kluyveromces lactis), 클루이베로메스 마르시아누스(Kluyveromes marxianus), 야로위아 리폴리티카(Yarrowia lipolytica) 또는 한세눌라 폴리모르파(Hansenula polymorpha)로 이루어진 군에서 선택되는 속의 효모 세포; 또는
b) 아스페르길루스 아와모리(Aspergillus awamori) 또는 트리코더마 리세이(Trichoderma reesei)와 같은 사상성 진균의 세포; 또는
c) 비-인간 영장류, 인간, 설치류 또는 소 세포, 예컨대 마우스 골수종(NSO)-세포주, 차이니즈 햄스터 난소(CHO)-세포주, HT1080, H9, HepG2, MCF7, MDBK Jurkat, MDCK, NIH3T3 , PC12, BHK(아기 햄스터 신장 세포), VERO, SP2/0, YB2/0, Y0, C127, L 세포, COS, 예를 들어 COS1 및 COS7, QC1-3, HEK-293, VERO, PER.C6, HeLA, EB1, EB2, EB3, 종양용해성 또는 하이브리도마-세포주; 또는
d) Sf9, Mimic Sf9, Sf21, 하이 파이브(High Five)(BT1-TN-5B1-4) 또는 BT1-Ea88 세포와 같은 곤충 세포; 또는
e) 암포라(Amphora), 규조류(Bacillariophyceae), 두날리엘라(Dunaliella), 클로렐라(Chlorella), 클라미도모나스(Chlamydomonas), 시아노피타(Cyanophyta)(시아노박테리아), 나노클로롭시스(Nannochloropsis), 스피룰리나(Spirulina) 또는 오크로모나스(Ochromonas) 속과 같은 조류 세포; 또는
f) 식물 세포, 예컨대 단자엽 식물, 바람직하게는 옥수수, 벼, 밀 또는 세타리아, 또는 쌍자엽 식물, 바람직하게는 카사바, 감자, 대두, 토마토, 담배, 알팔파, 피스코미트렐라 파텐스(Physcomitrella patens) 또는 애기장대(Arabidopsis)로부터의 세포.
특정 측면에 따르면, TIF 유전자는 POI와 동일한 종 기원에서 기원하는 것과 같은 진핵생물 기원이다. 특히, TIF 유전자(들)는 피치아(Pichia), 또는 사카로미세스(Saccharomyces)와 같은 효모 기원; 또는 인간 또는 비-인간 동물 기원과 같은 포유류 기원일 수 있다. 특정 측면에 따르면, TIF 중 임의의 1개, 2개, 3개, 4개 또는 5개는 천연-발생 이소폼을 포함하는 효모 또는 포유동물(예를 들어 인간, 마우스, 햄스터 또는 유인원) 단백질이다.
특정 구현양태에 따르면, 효모 또는 인간 TIF 유전자(들) 중 임의의 것이 숙주 세포에서의 과발현을 위해 선택된다.
구체적으로, 본원에 제공된 목적을 위해 사용되는 TIF는 각각의 자연-발생(천연 또는 야생형이라고도 지칭) TIF의 서열, 특히 본원에 제공된 서열에 의해 확인된 TIF 중 임의의 하나와 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 한 것 중 적어도 임의의 하나인 아미노산 서열을 포함하거나 이로 이루어진다.
구체적인 측면에 따르면,
a) 상기 TIF 유전자는 서열번호: 1-11 중 임의의 하나와 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성 중 적어도 임의의 하나를 포함하거나 이들로 이루어진 eIF4E를 코딩하고;
b) 상기 TIF 유전자는 서열번호: 12-33 중 임의의 하나와 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성 중 적어도 임의의 하나를 포함하거나 이들로 이루어진 eIF4A를 코딩하고;
c) 상기 TIF 유전자는 서열번호: 34-44 중 임의의 하나와 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성 중 적어도 임의의 하나를 포함하거나 이로 구성되는 eIF4G를 코딩하고;
d) 상기 TIF 유전자는 서열번호: 45-55 중 임의의 하나와 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성 중 적어도 임의의 하나를 포함하거나 이로 구성되는 PAB1을 코딩하고; 그리고
e) 상기 TIF 유전자는 서열번호:56-65 중 임의의 하나와 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성 중 적어도 임의의 하나를 포함하거나 이로 구성되는 RLI1을 코딩한다.
구체적인 측면에 따르면,
a) eIF4E 단백질은 서열번호:1-11 중 임의의 하나와 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성 중 적어도 임의의 하나를 포함하거나 이로 이루어지고;
b) eIF4A 단백질은 서열번호: 12-33 중 임의의 하나와 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성 중 적어도 임의의 하나를 포함하거나 이로 이루어지고;
c) eIF4G 단백질은 서열번호: 34-44 중 임의의 하나와 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성 중 적어도 임의의 하나를 포함하거나 이로 이루어지고;
d) PAB1 단백질은 서열번호: 45-55 중 임의의 하나와 적어도 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성 중 임의의 하나를 포함하거나 이로 이루어지고; 그리고
e) RLI1 단백질은 서열번호: 56-65 중 임의의 하나와 적어도 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성 중 임의의 하나를 포함하거나 이로 이루어진다.
구체적으로, 본원에 제공된 목적을 위해 사용되는 TIF 유전자는 각각의 TIF를 코딩하는 뉴클레오티드 서열을 포함하거나 이로 이루어진 핵산 분자이다. TIF 유전자는 자연-발생(천연 또는 야생형이라고도 지칭) 뉴클레오티드 서열을 포함하거나 이로 구성될 수 있거나 돌연변이될 수 있고, 예를 들어 숙주 세포에서 상기 TIF 유전자를 발현하기 위해 최적화되고, 예를 들어 코돈-최적화 서열 또는 골든 게이트(Golden Gate) 최적화 서열일 수 있다.
구체적으로, 본원에 제공된 목적을 위해 사용되는 TIF 유전자는 각각의 자연-발생(천연 또는 야생형이라고도 지칭) TIF 유전자의 서열, 특히 본원에 제공된 서열에 의해 확인된 TIF 유전자 중 임의의 하나와 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 적어도 임의의 하나인 뉴클레오티드 서열을 포함하거나 이로 이루어진다.
특정 측면에 따르면, 상기 하나 이상의 유전적 변형은 (i) 하나 이상의 폴리뉴클레오티드 또는 이의 일부; 또는 (ii) 발현 제어 서열, 바람직하게는 프로모터, 리보솜 결합 부위, 전사 또는 번역 개시 및 정지 서열, 인핸서 및 활성자 서열로 이루어진 군으로부터 선택되는 발현 제어 서열의 녹킨(knockin), 치환, 파괴, 결실 또는 녹아웃을 포함하고, 바람직하게는 상기 하나 이상의 유전적 변형은 숙주 세포 게놈으로의 이종 폴리뉴클레오티드 또는 발현 카세트의 통합을 포함한다.
특정 측면에 따르면, 상기 하나 이상의 유전적 변형은 상기 TIF 유전자(들)의 수 또는 상기 TIF 유전자(들)을 포함하는 발현 카세트의 수의 증가, 및/또는 상상기 TIF 유전자(들)의 기능 획득 변경을 포함하여서, 상기 TIF 유전자(들)의 수준 또는 활성을 증가시킨다.
특정 측면에 따르면, 상기 하나 이상의 유전적 변형은, 예를 들어 각각의 TIF 유전자(들)을 과발현함으로써, 및/또는 각각의 TIF 유전자(들) 또는 TIF mRNA의 분해를 감소시키거나 안정성을 증가시킴으로써 TIF의 수준 또는 활성을 증가시키는 각각의 TIF 유전자에서의 기능 획득 변경을 포함한다.
구체적으로, 상기 기능 획득 변경은 각각의 TIF 유전자의 녹킨을 포함한다.
구체적으로, 상기 기능 획득 변경은 상기 세포에서 각각의 TIF 유전자 발현을 상향조절한다.
구체적으로, 상기 기능 획득 변경은 상기 세포에서 각각의 TIF 유전자를 과발현하기 위한 이종 발현 카세트의 삽입을 포함한다.
기능 획득 변경은 구체적으로, 예를 들어 TIF를 코딩하는 폴리뉴클레오티드(또는 이러한 폴리뉴클레오티드를 포함하는 TIFEC)를 숙주 세포 게놈에 도입하고, 임의로 이러한 폴리뉴클레오티드에 작동가능하게 연결된 프로모터를 파괴하고, 이러한 프로모터를 더 높은 프로모터 활성을 갖는 다른 프로모터로 대체하는 것을 포함하여 TIF 유전자의 발현을 증가시키기 위한 것이다.
유전자 발현을 변형시키는 특정 방법은 폴리뉴클레오티드(유전자)의 발현을 조절(예를 들어, 활성화, 상향조절, 불활성화, 억제 또는 하향조절)하는 조절 서열을 사용하며, 예를 들어 숙주 세포를 변형시키는 CRISPR 기반 방법, 예를 들어, 프로모터, 리보솜 결합 부위, 전사 개시 또는 정지 서열, 번역 개시 또는 정지 서열, 인핸서 또는 활성자 서열, 억제자 또는 억제자 서열, 신호 또는 리더 서열, 특히 단백질의 발현 및/또는 분비를 제어하는 것들로 이루어진 군으로부터 선택된 조절 서열에 사용되는 RNA 가이드된 리보뉴클레아제에 의해 관련 서열에 표적화된 각각의 전사 조절자를 사용한다.
구체적으로, TIF 유전자의 발현을 증가시키기 위한 상기 하나 이상의 유전적 변형은 유전자 또는 유전자의 일부의 발현을 그러한 유전적 변형이 없는 각각의 숙주와 비교하여 적어도 50%, 60%, 70%, 80%, 90%, 또는 95%, 또는 훨씬 더 유전자 또는 유전자의 일부의 발현을 증가시키는, 예를 들어, 이종 유전자의 녹킨 또는 내인성 유전자의 카피 수를 증가시키는 각각의 유전자 또는 게놈 서열의 삽입 또는 활성화를 포함하는 하나 이상의 게놈 돌연변이를 포함한다.
구체적으로, 발현을 증가시키는 하나 이상의 유전적 변형은 하나 이상의 내인성 폴리뉴클레오티드의 발현을 구성적으로 개선하거나 그렇지 않으면 증가시키는 게놈 돌연변이를 포함한다.
구체적으로, 발현을 증가시키는 하나 이상의 유전적 변형은 하나 이상의 내인성 폴리뉴클레오티드의 발현을 조건부로 개선하거나 그렇지 않으면 증가시키는 하나 이상의 유도성 또는 억제성 조절 서열을 도입하는 게놈 돌연변이를 포함한다. 이러한 조건부 활성 변형은 특히 세포 배양 조건에 따라 활성 및/또는 발현되는 조절 요소 및 유전자를 표적으로 한다.
구체적으로, 관심 단백질(POI)을 생산하는 방법에 숙주 세포를 사용하는 경우 각각의 TIF를 코딩하는 폴리뉴클레오티드의 발현이 증가한다. 구체적으로, 유전자 변형 시, POI가 생성되는 동안 숙주 세포 배양 조건 하에서 각각의 TIF 유전자의 발현이 증가한다.
구체적으로, 숙주 세포는 상기 변형이 없는 숙주 세포와 비교하여, 예를 들어 하나 이상의 각각의 TIF 유전자의 녹킨에 의해 각각의 TIF(들)의 양(예를 들어, 수준, 활성 또는 농도)을 50%, 60%, 70%, 80%, 90%, 또는 95%, (mol/mol), 또는 그 이상 중 적어도 어느 하나만큼 증가시키도록 유전적으로 변형된다. 특정 구현양태에 따르면, 숙주 세포는 (하나 이상) 게놈 서열, 특히 숙주 세포 게놈에 통합된 각각의 TIF(들)을 코딩하는 게놈 서열의 하나 이상의 삽입을 포함하도록 유전적으로 변형된다. 이러한 숙주 세포는 전형적으로 녹킨 균주로서 제공된다.
특정 구현양태에 따르면, 본원에 기술된 숙주 세포가 세포 배양물에서 배양되면, 숙주 세포 또는 숙주 세포 배양물에서 각각의 과발현된 TIF(들)의 총량은 그러한 유전자 변형 이전 또는 변형 없이 숙주 세포에 의해 발현되거나 생성된 기준량과 비교하여, 또는 각각의 숙주 세포 배양물에서 생산된 기준량과 비교하여, 또는 상기 변형 전 또는 변형 없는 숙주 세포와 비교하여 50%, 60%, 70%, 80%, 90% 또는 95%, (활성% 또는 mol/mol), 또는 심지어 100% 이상 중 적어도 어느 하나만큼 증가된다.
특정 측면에 따르면, 상기 TIF 유전자 중 하나 이상은 숙주 세포에 대해 내인성 또는 이종성이다. 구체적으로, 상기 TIF 유전자(들)는 각각의 TIF 발현 카세트(TIFEC)에 포함된다. 구체적으로, 상기 TIF 유전자(들)는 하나 이상의 TIFEC에서 발현된다.
구체적으로, 상기 TIF 유전자(들)는 하나 이상의 이종 발현 카세트(들)에 포함되며, 특히 TIF 유전자에 작동가능하게 연결된, 예를 들어 프로모터와 같은 하나 이상의 발현 제어 서열을 함유하는 이종 발현 구성물을 포함한다. 구체적으로, 상기 발현 구성물은 상기 숙주 세포에서 자연적으로 발생하지 않거나, 각각의 내인성 TIF 유전자 또는 발현 구성물이 자연적으로 발생하는 부위와 다른 부위에서 숙주 세포의 게놈 또는 염색체 내에 통합되거나, 에피솜 플라스미드상에 제공된다.
구체적으로, 임의의 1개, 2개, 3개, 4개 또는 5개 이상 또는 모든 TIFEC는 TIF 발현 카세트(TIFEC) 프로모터로 지칭되는 프로모터를 포함한다.
구체적으로, TIFEC 프로모터는 구성적 프로모터, 또는 유도성 또는 탈-억제성 프로모터와 같은 조절가능한 프로모터이고, 이러한 TIFEC 프로모터는 발현될 TIF 유전자에 작동가능하게 연결된다.
구체적으로, 동일한 숙주 세포 내의 TIF 발현 카세트에 사용되는 적어도 하나, 예컨대 임의의 하나 이상 또는 모든 TIFEC 프로모터는 P. 파스토리스(P. pastoris), 특히 K. 파스토리스(K. pastoris) 또는 K. 파피(K. phaffii)의 pAOX1이 아니거나 메탄올-유도성이 아니다. pAOX1 프로모터는 UniProtKB - F2QY27로 식별되는 P. 파스토리스(P. pastoris) 알코올 옥시다제 1의 알코올 옥시다제 1을 코딩하는 천연 유전자로 지칭되는 "AOX1" 유전자의 천연 프로모터로 이해된다.
특정 측면에 따르면, 숙주 세포는 숙주 세포 배양물에서 상기 GOI를 발현하기 위해 GOI 및 상기 GOI에 작동가능하게 연결된 하나 이상의 발현 제어 서열을 포함하는 발현 카세트를 추가로 포함한다.
구체적으로, 상기 GOI는 TIF 발현 카세트(들)와 별개인 GOI 발현 카세트(GOIEC)에서 발현된다.
구체적으로, GOIEC는 GOI 발현 카세트(GOIEC) 프로모터로 지칭되는 프로모터를 포함한다.
구체적으로, GOIEC 프로모터는 유도성 또는 탈-억제성 프로모터와 같은 조절 가능한 프로모터, 또는 GOIEC 프로모터가 발현될 GOI에 작동가능하게 연결된 구성적 프로모터이다.
바람직하게는, 동일한 숙주 세포 내의 TIF 발현 카세트에 사용되는 적어도 하나, 예컨대 임의의 하나 이상 또는 모든 TIFEC 프로모터는 GOIEC 프로모터 이외의 임의의 것이다.
구체적으로,
a) 임의의 하나 이상 또는 모든 TIFEC 프로모터는 구성적이며, GOIEC 프로모터는 유도성 또는 (탈)억제성 프로모터이고;
b) 임의의 하나 이상 또는 모든 TIFEC 프로모터는 유도성 또는 (탈)억제성이며, GOIEC 프로모터는 구성적 프로모터이고;
c) 임의의 하나 이상 또는 모든 TIFEC 프로모터는 구성적이며, GOIEC 프로모터는 이러한 TIFEC 프로모터(들) 중 임의의 하나 이상과 상이한 유형 또는 강도의 구성적 프로모터이고;
d) 임의의 하나 이상 또는 모든 TIFEC 프로모터는 유도성이거나 (탈)억제성이고, GOIEC 프로모터는 그러한 TIFEC 프로모터 중 임의의 하나 이상과 상이한 유형 또는 강도의 유도성 또는 (탈)억제성 프로모터이다.
특정 측면에 따르면, GOIEC 프로모터는 임의의 TIFEC 프로모터와 비교하여 더 높은 프로모터 강도를 갖는다.
바람직한 구현양태에서, 각각의 TIF를 코딩하는 폴리뉴클레오티드의 발현은 구성적 프로모터에 의해 구동되고 POI를 코딩하는 폴리뉴클레오티드(유전자)의 발현은 유도성 프로모터에 의해 구동된다. 또 다른 바람직한 구현양태에서, 각각의 TIF를 코딩하는 폴리뉴클레오티드의 발현은 유도성 프로모터에 의해 구동되고 POI를 코딩하는 폴리뉴클레오티드(유전자)의 발현은 구성적 프로모터에 의해 구동된다.
한 예로서, TIF를 코딩하는 폴리뉴클레오티드의 발현은 구성적 GAP 프로모터에 의해 구동될 수 있고 POI를 코딩하는 폴리뉴클레오티드의 발현은 AOX1 또는 AOX2 프로모터와 같은 메탄올-유도성 프로모터에 의해 구동될 수 있다.
또 다른 예로서, TIF를 코딩하는 폴리뉴클레오티드의 발현은 MDH3, POR1, PDC1, FBA1-1 또는 GPM1과 같은 구성적 프로모터에 의해 구동될 수 있으며(Prielhofer et al. 2017, BMC Sys Biol. 11: 123), POI를 코딩하는 폴리뉴클레오티드의 발현은 AOX1 또는 AOX2 프로모터와 같은 메탄올-유도성 프로모터에 의해 구동될 수 있다.
또 다른 예로서, TIF를 코딩하는 폴리뉴클레오티드의 발현은 GAP 프로모터와 같은 구성적 프로모터에 의해 구동될 수 있고, POI를 코딩하는 폴리뉴클레오티드의 발현은 본원에서 추가로 기술된 것들과 같은 탈억제성 프로모터에 의해 구동될 수 있다.
또 다른 예로서, TIF를 코딩하는 폴리뉴클레오티드의 발현은 구성적 프로모터에 의해 구동될 수 있고 POI를 코딩하는 폴리뉴클레오티드의 발현은 본원에서 추가로 기술된 것과 같은 탈억제성 프로모터에 의해 구동될 수 있다.
또 다른 예로서, TIF를 코딩하는 폴리뉴클레오티드의 발현은 탈-억제성 프로모터에 의해 구동될 수 있고, POI를 코딩하는 폴리뉴클레오티드의 발현은 본원에 추가로 기술된 것과 같은 탈-억제성 프로모터에 의해 구동될 수 있다.
구체적으로, 본원에서 언급된 발현 카세트(들)은 적어도 하나의 프로모터 및 상기 프로모터의 전사 제어 하에 발현될 폴리뉴클레오티드(또는 유전자), 및 임의로 리보솜 결합 부위, 전사 개시 또는 정지 서열, 번역 개시 또는 정지 서열, 인핸서 또는 활성자 서열, 억제자 또는 억제제 서열, 신호 또는 리더 서열, 특히 단백질의 발현 및/또는 분비를 제어하는 것들로 이루어진 군으로부터 선택되는 것과 같은 추가 조절 서열을 포함한다.
구체적으로, 숙주 세포에 대해 이종성인 발현 카세트가 사용되며, 특히 여기서 발현 카세트는 폴리뉴클레오티드에 작동가능하게 연결된 프로모터를 포함하고, 여기서 프로모터와 폴리뉴클레오티드는 서로 이종성이며, 이들은 자연에서 이러한조합으로 발생하지 않는다는 의미이며, 예를 들어 여기서 프로모터 및 폴리뉴클레오티드 중 하나(또는 단지 하나)는 인공적이거나 다른 것 및/또는 본원에 기재된 숙주 세포에 대해 이종성이고; 프로모터는 내인성 프로모터이고 폴리뉴클레오티드는 이종 폴리뉴클레오티드이거나; 또는 프로모터는 인공 또는 이종 프로모터이고 폴리뉴클레오티드는 내인성 폴리뉴클레오티드이거나; 여기에서 프로모터 및 폴리뉴클레오티드 둘 다는 인공적이거나, 이종이거나, 본원에 기술된 숙주 세포와 비교하여 세포의 상이한 종 또는 유형(균주)으로부터와 같이 상이한 기원으로부터 유래한다. 구체적으로, 프로모터는 본원에 기술된 숙주 세포로 사용되는 세포에서 상기 폴리뉴클레오티드와 자연적으로 연관되지 않고/않거나 작동가능하게 연결되지 않는다.
특정 측면에 따르면, 이종 발현 카세트는 자가 복제 벡터 또는 플라스미드에 포함되거나 상기 숙주 세포의 염색체 내에 통합된다.
GOI-발현 구성물은 숙주 세포에서 상기 발현 구성물로부터 상기 GOI를 발현시키기 위해 필요에 따라 GOI에 작동가능하게 연결된 프로모터와 같은 발현 제어 서열(들)을 포함하거나 이로 구성될 수 있다. GOI-발현 구성물은 별개의 발현 카세트에 포함될 수 있거나, 상기 TIF 유전자(들) 중 하나 이상을 추가로 발현하는 발현 카세트에 포함될 수 있다.
특정 측면에 따르면, 숙주 세포는 적어도 하나의 이종 GOIEC를 포함하는 재조합 숙주 세포이고, 여기서 GOIEC에 포함된 적어도 하나의 성분 또는 성분들의 조합은 숙주 세포에 대해 이종이다. 구체적으로, 특히 프로모터와 GOI가 서로 이종이고 자연에서 이러한 조합이 발생하지 않는 인공 발현 카세트가 사용되며, 예를 들어 여기서 프로모터 및 GOI 중 하나(또는 단지 하나)는 인공적이거나 다른 것 및/또는 본원에 기재된 숙주 세포에 대해 이종성이고; 프로모터는 내인성 프로모터이고 GOI는 이종 GOI이거나; 또는 프로모터는 인공 또는 이종 프로모터이고 GOI는 내인성 GOI이거나; 여기에서 프로모터 및 GOI 둘 다는 인공적이거나, 이종이거나, 본원에 기술된 숙주 세포와 비교하여 세포의 상이한 종 또는 유형(균주)으로부터와 같이 상이한 기원으로부터 유래한다. 구체적으로, GOIEC 프로모터는 본원에 기술된 숙주 세포로 사용되는 세포에서 상기 GOI와 자연적으로 연관되지 않고/않거나 작동가능하게 연결되지 않는다.
구체적으로, 숙주 세포는 다음을 포함한다:
a) 상기 TIF 유전자(들)에 작동가능하게 연결된 하나 이상의 발현 제어 서열을 각각 포함하는 하나 이상의 이종 TIF 발현 카세트에서 하나 이상의 상기 TIF 유전자를 발현하기 위한 발현 시스템; 및
b) GOI 및 상기 GOI에 작동가능하게 연결된 하나 이상의 발현 제어 서열을 포함하는 GOI 발현 카세트;
여기서 a)의 발현 시스템 및 b)의 발현 카세트는 세포 배양물에서 숙주 세포를 배양할 때 각각의 TIF 유전자(들) 및 GOI를 발현하도록 조작된다.
특정 측면에 따르면, 숙주 세포는 하나 이상의 이종 발현 카세트에서 상기 TIF 유전자 중 1개, 2개, 3개, 4개 또는 5개 이상을 발현하기 위한 발현 시스템을 포함하며, 각각은 상기 TIF 유전자(들)에 작동가능하게 연결된 하나 이상의 발현 제어 서열을 포함한다. 특정 구현양태에서, 각각의 TIF 유전자는 TIFEC 프로모터에 작동가능하게 연결된다.
세포당 GOIEC 또는 TIEFEC의 수는 일반적으로 각 발현 생성물의 양을 결정한다. 숙주 세포는 구체적으로 세포당 적어도 하나의 GOIEC 및 적어도 하나의 TIFEC 카피를 포함한다. 하나의 발현 카세트는 일반적으로 "하나의 카피"로 언급된다.
특정 측면에 따르면, 숙주 세포당 한 가지 유형의 GOIEC 또는 GOIEC 카피의 수는 적어도(또는 최대) 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10 중 어느 하나, 또는 최대 20, 30, 40 또는 50의 더 높은 숫자를 사용할 수 있다.
특정 측면에 따르면, 숙주 세포당 한 가지 유형의 TIFEC 또는 TIFEC 카피의 수는 적어도(또는 최대) 1, 2, 3, 4 또는 5 중 임의의 하나이다.
특정 측면에 따르면, 숙주 세포당 이종 TIFEC의 수는 적어도(또는 최대) 1, 2, 3, 4 또는 5이다.
TIFEC는 바람직하게는 숙주 세포에 대해 이종성이지만, GOIEC는 이종성 또는 내인성일 수 있다.
특정 측면에 따르면, 숙주 세포는, 예를 들어 TIFEC 또는 GOIEC의 적어도 1, 2, 3, 4 또는 5개 카피(유전자 카피 번호, GCN)와 같은 TIF(들)을 발현하는 하나 이상의 발현 카세트(들), 및 GOI를 발현하는 발현 카세트의 하나 이상의(다중) 카피를 포함하는 하나 이상(예를 들어, 다중) 이종성 발현 카세트를 포함한다. 각각의 카피는 발현될 각각의 유전자에 작동가능하게 연결된 발현 제어 서열을 포함하여 동일하거나 상이한 서열을 포함하거나 이로 구성될 수 있다.
구체적으로, 숙주 세포에서 과발현된 각각의 TIF에 대해, 모든 과발현된 TIF의 거의 동일한 수준을 보장하기 위해, 세포당 TIF 코딩 폴리뉴클레오티드의 수는 다른 과발현된 TIF에 대해 약 (+/- 1) 동일하다.
구체적인 측면에 따르면,
a) 적어도 하나, 즉 임의의 하나 이상 또는 모든 TIF 발현 카세트는 구성적 프로모터를 포함하고; 및/또는
b) GOI 발현 카세트는 유도성, 탈-억제성 또는 달리 조절가능한 프로모터, 또는 구성적 프로모터를 포함한다.
구체적으로, GOI는 상기 TIF 유전자와 상이한 폴리뉴클레오티드 또는 유전자이다. 구체적으로, GOI는 관심 단백질(POI)을 발현하고 있다. 구체적으로, POI는 상기 TIF와 상이한 폴리펩티드 또는 단백질이다.
특정 측면에 따르면, POI는 숙주 세포 종에 대해 이종이다.
특정 측면에 따르면 POI는 치료 또는 진단 생성물이다. 바람직하게는 POI는 포유동물에서 기능하는 치료 단백질이다.
구체적으로, POI는 항원-결합 단백질, 치료 단백질, 효소, 펩티드, 단백질 항생제, 독소 융합 단백질, 탄수화물-단백질 접합체, 구조적 단백질, 조절 단백질, 백신 항원, 성장 인자, 호르몬, 사이토카인, 공정 효소 및 대사 효소로 이루어진 군으로 부터 선택된 펩티드, 폴리펩티드 또는 단백질이다.
구체적으로, POI는 진핵 단백질, 바람직하게는 인간 단백질 또는 인간 단백질 서열을 포함하는 단백질과 같은 포유동물 유래 단백질, 또는 박테리아 단백질 또는 박테리아 유래 단백질이다. 효모 숙주 세포에서 자연적으로 발생하지 않는 임의의 그러한 포유동물, 박테리아 또는 인공 단백질은 숙주 세포에 대해 이종인 것으로 이해된다.
특정한 경우에 POI는 다량체 단백질, 특히 이량체 또는 사량체이다.
구체적으로, 항원-결합 단백질은
a) 키메라 항체, 인간화 항체, 이중특이성 항체, Fab, Fd, scFv, 디아바디, 트리아바디, Fv 사량체, 미니바디, VH, VHH, IgNAR 또는 V-NAR과 같은 단일 도메인 항체와 같은 항체 또는 항체 단편;
b) 애드넥틴, 아피바디, 아필린, 아피머, 아피틴, 알파바디, 안티칼린, 아비머, DARPin, 파이노머, 쿠니츠 도메인 펩티드, 모노바디 또는 NanoCLAMPS와 같은 항체 모방체; 또는
c) 하나 이상의 면역글로불린-접힘 도메인, 항체 도메인 또는 항체 모방체를 포함하는 융합 단백질.
특정 POI는 항체 또는 이의 단편, 특히 항원-결합 도메인을 포함하는 항체 단편과 같은 항원-결합 분자이다. 특정 POI 중에는 모노클로날 항체(mAbs), 면역글로불린(Ig) 또는 면역글로불린 클래스 G(IgG), 중쇄-항체(HcAb's) 또는 이의 단편, 예를 들어 단편-항원 결합(Fab), Fd, 단일-사슬 가변 단편(scFv), 또는 예를 들어 Fv 이량체(디아바디), Fv 삼량체(트리아바디), Fv 사량체 또는 미니바디와 같은 이의 조작된 변이체 및 VH, VHH, IgNAR 또는 V-NAR과 같은 단일-도메인 항체, 또는 면역글로불린-접힘 도메인을 포함하는 임의의 단백질과 같은 항체가 있다. 추가의 항원-결합 분자는 항체 모방체, 또는 예를 들어 조작된 쿠니츠 도메인, 애드넥틴, 아피바디, 아필린, 안티칼린, 또는 DARPin과 같은 (대체) 스캐폴드 단백질로부터 선택될 수 있다.
특정 측면에 따르면, POI는, 예를 들어 BOTOX, 미오블록, 뉴로블록, 디스포트(또는 보툴리눔 신경독소의 다른 혈청형), 알글루코시다제 알파, 답토마이신, YH-16, 융모생식샘자극호르몬 알파, 필그라스팀, 세트로렐릭스, 인터루킨-2, 알데스류킨, 테셀룰린, 데닐류킨 디프티톡스, 인터페론 알파-n3(주사), 인터페론 알파-nl, DL-8234, 인터페론, 산토리(감마-1a), 인터페론 감마, 티모신 알파 1, 타소너민, DigiFab, ViperaTAb, EchiTAb, CroFab, 네시리티드, 아바타셉트, 알레파셉트, 레비프, 엡토터미날파, 테리파라타이드(골다공증), 칼시토닌 주사성(뼈 질환), 칼시토닌(비강, 골다공증), 에타너셉트, 헤모글로빈 글루타머 250(소), 드로트레코진 알파, 콜라게나제, 카르페리티드, 재조합 인간 표피 성장 인자(국소 젤, 상처 치유), DWP401, 다베포에틴 알파, 에포에틴 오메가, 에포에틴 베타, 에포에틴 알파, 데시루딘, 레피루딘, 비발리루딘, 노나코그 알파, 모노닌, 엡타코그 알파(활성화), 재조합 인자 VIII+VWF, 리콤비네이트, 재조합 인자 VIII, 인자 VIII(재조합), 알프메이트, 옥토코그 알파, 인자 VIII, 팔리퍼민, 인디키나제, 테넥테플라제, 알테플라제, 파미테플라제, 레테플라제, 나테플라제, 몬테플라제, 폴리트로핀 알파, rFSH, hpFSH, 미카푼긴, 페그필그라스팀, 레노그라스팀, 나르토그라스팀, 세르모렐린, 글루카곤, 엑세나타이드, 프람린타이드, 이니글루세라제, 갈설파제, 류코트로핀, 몰그라모스틴, 트립토렐린 아세테이트, 히스트렐린(피하 임플란트, 하이드로론), 데스로렐린, 히스트렐린, 나파렐린, 류프로라이드 서방성 저장소(ATRIGEL), 류프로라이드 임플란트(DUROS), 고세렐린, 유트로핀, KP-102 프로그램, 소마트로핀, 메카세르민(성장 장애), 엔파비르타이드, Org-33408, 인슐린 글라진, 인슐린 글루리신, 인슐린(흡입형), 인슐린 리스프로, 인슐린 데터니르, 인슐린(협측, RapidMist), 메카세르민 린파베이트, 아나킨라, 셀몰류킨, 99 mTc-앱시타이드 주사, 골수, 베타세론, 글라티라머 아세테이트, 게폰, 사르그라모스팀, 오프렐베킨, 인간 백혈구-유래 알파 인터페론, 빌라이브, 인슐린(재조합), 재조합 인간 인슐린, 인슐린 아스파트, 메카세닌, 로페론-A, 인터페론-알파 2, 알파페론, 인터페론 알파콘-1, 인터페론 알파, 아보넥스의 재조합 인간 황체화 호르몬, 도르나제 알파, 트라페르민, 지코노타이드, 탈티렐린, 디보터미날파, 아토시반, 베카플러민, 엡티피바타이드, 제마이라, CTC-111, 샨백-B, HPV 백신(4가), 옥트레오타이드, 란레오타이드, 안세스티른, 아갈시다제 베타, 아갈시다제 알파, 라로니다제, 프레자타이드 구리 아세테이트 (국소 겔), 라스부리카제, 라니비주맙, 액티뮨, PEG-인트론, 트리코민, 재조합 집 먼지 진드기 알레르기 탈감작 주사, 재조합 인간 부갑상선 호르몬(PTH) 1-84(sc, 골다공증), 에포에틴 델타, 트랜스제닉 안티트롬빈 III, 그란디트로핀, 비트라아제, 재조합 인슐린, 인터페론-알파(경구용 로젠지), GEM-21S, 바프레오타이드, 이두설파제, 옴나파트릴라트, 재조합 혈청 알부민, 세르톨리주맙 페골, 글루카르피다제, 인간 재조합 C1 에스테라제 억제제(혈관부종), 라노트플라제, 재조합 인간 성장 호르몬, 엔푸비타이드(무바늘 주사, 바이오젝터 2000), VGV-1, 인터페론(알파), 루시나탄트, 아비프타딜(흡입형, 폐질환), 이카티반트, 에칼란티드, 오미가난, 오로그랩, 펙시가난아세테이트, ADI-PEG -20, LDI-200, 데가렐릭스, 신트레델린베수도톡스, Favld, MDX-1379, ISAtx-247, 리라글루타이드, 테리파라타이드(골다공증), 티파코긴, AA4500, T4N5 리포좀 로션, 카투막소맙, DWP413, ART-123, 크리살린, 데스모테플라제, 아메디플라제, 코리폴리트로핀알파, TH-9507, 테두글루타이드, 디아미드, DWP-412, 성장 호르몬(지속방출 주사제), 재조합 G-CSF, 인슐린(흡입형, AIR), 인슐린(흡입형, 테크노스피어), 인슐린(흡입형, AERx), RGN- 303, DiaPep277, 인터페론 베타(C형 간염 바이러스 감염(HCV)), 인터페론 알파-n3(경구), 벨라타셉트, 경피 인슐린 패치, AMG-531, MBP-8298, 제레셉트, 오페바칸, AIDSVAX, GV-1001, 림프스캔, 란피나아제, 리폭시산, 루수풀티드, MP52(베타-트리칼슘포스페이트 담체, 뼈 재생), 흑색종 백신, 시푸류셀-T, CTP-37, 인세지아, 비테스펜, 인간 트롬빈(동결, 수술 출혈), 트롬빈, TransMID, 알피메프라제, 퓨리카제, 터리프레신(정맥, 간신증후군), EUR-1008M, 재조합 FGF-I(주사용, 혈관질환), BDM-E, 로티갑티드, ETC-216, P-113, MBI-594AN, 듀라마이신(흡입형, 낭포성 섬유증), SCV-07, OPI-45, 엔도스타틴, 안지오스타틴, ABT-510, 보우만 버크 억제제 농축물, XMP-629, 99 mTc-Hynic-아넥신 V, 카할랄리드 F, CTCE -9908, 테베렐릭스(서방형), 오자렐릭스, 로니뎁신, BAY-504798, 인터루킨4, PRX-321, 펩스캔, 이복타데킨, 랄락토페린, TRU-015, IL-21, ATN-161, 실렌기타이드, 알부페론, 비파식스, IRX-2, 오메가 인터페론, PCK-3145, CAP-232, 파시레오티드, huN901-DMI, 난소암 면역치료 백신, SB-249553, 온코백스-CL, 온코백스-P, BLP-25, 서백스-16, 다중-에피토프 펩티드 흑색종 백신(MART-1, gp100, 티로시나제), 네미피타이드, rAAT(흡입), rAAT(피부과), CGRP(흡입, 천식), 페그수너셉트, 티모신베타4, 플리티뎁신, GTP-200, 라모플라닌, GRASPA, OBI-1, AC-100, 연어 칼시토닌(경구, 엘리겐), 칼시토닌(경구, 골다공증), 에그모렐린, 카프로모렐린, 카르데바, 벨라페르민, 131I-TM-601, KK-220, T-10, 유라리티드, 디펠레스타트, 헤마타이드, 크리살린(국소), rNAPc2, 재조합 인자 V111(PEG화 리포솜), bFGF, PEG화 재조합 스타필로키나제 변이체, V-10153, 소노리시스 프롤라이즈, 뉴로백스, CZEN-002, 섬 세포 신생 요법, rGLP-1, BIM-51077, LY-548806, 엑세나티드(제어 방출, 메디소브), AVE-0010, GA-GCB, 아보렐린, ACM-9604, 리나클로타이드 에아세테이트, CETi-1, 헤모스판, VAL(주사제), 속효성 인슐린(주사제, 비아델), 비강내 인슐린, 인슐린(흡입형), 인슐린(경구, 엘리젠), 재조합 메티오닐 인간 렙틴, 피트라킨라 피하 주사, 습진), 피트라킨라(흡입 건조 분말, 천식), 멀티킨, RG-1068, MM-093, NBI-6024, AT-001, PI-0824, Org-39141, Cpn10 (자가면역질환/염증), 탈락토페린(국소용), rEV-131(안과용), rEV-131(호흡기질환), 경구 재조합 인간 인슐린(당뇨병), RPI-78M, 오프렐베킨(경구용), CYT-99007 CTLA4-Ig, DTY-001, 발라테그라스트, 인터페론 알파-n3(국소용), IRX-3, RDP-58, 타우페론, 담즙염 자극 리파제, 메리스파제, 알라린 포스파타제, EP-2104R, 멜라노탄-II, 브레멜라노타이드, ATL-104, 재조합 인간 마이크로플라스민, AX-200, SEMAX, ACV-1, Xen-2174, CJC-1008, 다이노르핀 A, SI-6603, LAB GHRH, AER-002, BGC-728, 말라리아 백신(바이로솜, PeviPRO), ALTU-135, 파보바이러스 B19 백신, 인플루엔자 백신(재조합 뉴라미니다아제), 말라리아/HBV 백신, 탄저병 백신, Vacc-5q, Vacc-4x, HIV 백신(경구), HPV 백신, 타트 톡소이드, YSPSL, CHS-13340, PTH(1-34) 리포솜 크림(노바솜), 오스타볼린-C, PTH 유사체(국소, 건선), MBRI-93.02, MTB72F 백신(결핵), MVA-Ag85A 백신(결핵), FARA04, BA-210, 재조합 전염병 FIV 백신, AG-702, OxSODrol, rBetV1, Der-p1/Der-p2/Der-p7 알레르겐-표적 백신(먼지 진드기 알레르기), PR1 펩티드 항원(백혈병), 돌연변이 ras 백신, HPV-16 E7 리포펩티드 백신, 라비린틴 백신(선암종), CML 백신, WT1-펩티드 백신(암), IDD-5, CDX-110, 펜트리스, 노렐린, CytoFab, P-9808, VT-111, 이크로캅타이드, 텔베르민(피부과, 당뇨병성 족부궤양), 루핀트리비르, 레티쿨로스, rGRF, HA, 알파-갈락토시다제 A, ACE-011, ALTU-140, CGX-1160, 안지오텐신 치료 백신, D-4F, ETC-642, APP-018, rhMBL, SCV-07(경구, 결핵), DRF-7295, ABT-828, ErbB2-특이적 면역독소(항암제), DT3SSIL-3, TST-10088, PRO-1762, 콤보톡스, 콜레시스토키닌-B/가스트린-수용체 결합 펩티드, 111In-hEGF, AE-37, 트라스니주맙-DM1, 길항제 G, IL-12(재조합), PM-02734, IMP-321, rhIGF-BP3, BLX-883, CUV-1647(국소), L-19 기반 방사면역치료제(암), Re-188-P-2045, AMG-386, DC/1540/KLH 백신(암), VX-001, AVE-9633, AC-9301, NY-ESO-1 백신(펩티드), NA17.A2 펩티드, 흑색종 백신(펄스 항원 치료제), 전립선암 백신, CBP-501, 재조합 인간 락토페린(안구건조증), FX-06, AP-214, WAP-8294A(주사용), ACP-HIP, SUN-11031, 펩티드 YY[3-36](비만, 비강내), FGLL, 아타시셉트, BR3-Fc, BN-003, BA-058, 인간 부갑상선 호르몬 1-34(비강, 골다공증), F-18-CCR1, AT-1100(체강 질병/당뇨병), JPD-003, PTH(7-34) 리포좀 크림(노바솜), 듀라마이신(안과용, 안구건조증), CAB-2, CTCE-0214, 글리코페길화 에리트로포이에틴, EPO-Fc, CNTO-528, AMG-114, JR-013, XIII 인자, 아미노칸딘, PN-951, 716155, SUN-E7001, TH-0318, BAY-73-7977, 테베렐릭스(즉시 방출), EP-51216, hGH(제어 방출, 바이오스피어), OGP-I, 시푸비르타이드, TV4710, ALG-889, Org-41259, rhCC10, F-991, 티모펜틴(폐 질환), r(m)CRP, 간선택적 인슐린, 수발린, L19-IL-2 융합 단백질, 엘라핀, NMK-150, ALTU-139, EN-122004, rhTPO, 트롬보포이에틴 수용체 작용제(혈소판감소 장애), AL-108, AL-208, 신경 성장 인자 길항제(통증), SLV-317, CGX-1007, INNO-105, 경구용 테리파라타이드(엘리젠), GEM-OS1, AC-162352, PRX-302, LFn-p24 융합백신(테라포어), EP-1043, S. 뉴모니아 소아백신, 말라리아 백신, 나이세리아 뇌수막염 그룹 B 백신, 신생아 그룹 B 연쇄상구균 백신, 탄저병 백신, HCV 백신( gpE1+gpE2+MF-59), 중이염 치료제, HCV 백신(핵심항원+ISCOMATRIX), hPTH(1-34)(경피, ViaDerm), 768974, SYN-101, PGN-0052, 아비스쿠닌, BIM-23190, 결핵 백신, 다중-에피토프 티로시나제 펩티드, 암 백신, 엔카스팀, APC-8024, GI-5005, ACC-001, TTS-CD3, 혈관-표적 TNF(고형 종양), 데스모프레신(협측 제어-방출), 오너셉트 또는 TP-9201, 아달리무맙(HUMIRA), 인플릭시맙(REMICADE), 리툭시맙(RITUXAN/MAB THERA), 에타너셉트(ENBREL), 베바시주맙(AVASTIN), 트라스투주맙(HERCEPTIN), 페그릴그라스팀(NEULASTA), 또는 바이오시밀러 및 바이오베터를 포함한 기타 적합한 POI이다.
구체적으로, POI는 숙주 세포 종에 대해 이종이다.
구체적으로, POI는 분비된 펩티드, 폴리펩티드 또는 단백질, 즉 숙주 세포로부터 세포 배양 상청액으로 분비된 것이다.
구체적으로, GOI는 분비 신호 서열로 발현되며, 바람직하게는 분비 신호 펩티드(또는 분비 신호 펩티드를 포함하는 리더)가 POI의 N-말단에 융합된다.
본 발명은 본원에 기재된 바와 같은 숙주 세포를 생산하는 방법을 추가로 제공한다. 구체적으로, 이러한 방법은 하나 이상의 이종 발현 카세트 내에 하나 이상의 상기 TIF 유전자 및 관심 유전자(GOI)를 포함하도록 숙주 세포를 유전적으로 조작하는 것을 포함한다.
추가의 특정 측면에 따르면, 본 발명은 하나 이상의 발현 카세트 내에 숙주 세포를 유전적으로 조작하여 2개 이상의 이종 핵산 분자 및 이종 핵산 분자에 각각에 작동가능하게 연결된 발현 제어 서열을 도입함으로써, 숙주 세포 배양물에서 관심 단백질(POI)을 생산할 수 있는 본원에 기재된 숙주 세포를 생산하는 방법을 제공하고, 여기서 핵산 분자 중 하나는 POI를 코딩하는 관심 유전자(GOI)를 포함하고, 추가로 하나 이상의 핵산 분자는 본원에 추가로 기재된 바와 같은 TIF와 같은 TIF를 코딩한다.
구체적으로, 숙주 세포는 야생형 숙주 세포의 유전적으로 조작하여 제공된다.
특정 실시예에 따르면, 숙주 세포는 상기 TIF 유전자(들)을 발현하기 위해 하나 이상의 발현 카세트를 도입하도록 먼저 변형시킴으로써 생산될 수 있다. 그런 다음 이러한 변형된 숙주 세포는 POI 생성을 위한 발현 카세트를 포함하도록 추가로 조작될 수 있다.
또 다른 구체적인 실시예에 따르면, 숙주 세포는 POI 생산을 위한 발현 카세트를 포함하도록 먼저 조작되어 생산될 수 있다. 이러한 조작된 숙주 세포는 TIF 유전자(들)을 발현하기 위해 하나 이상의 발현 카세트를 도입하도록 추가로 변형될 수 있다.
본 발명은 추가로 관심 단백질(POI)을 생산하기 위한 조건 하에서 본원에 기술된 숙주 세포를 배양함으로써 관심 유전자(GOI)에 의해 코딩되는 관심 단백질(POI)을 생산하는 방법을 제공한다.
본 발명은 다음 단계를 포함하여, 숙주 세포에서 관심 단백질(POI)을 생산하는 방법을 추가로 제공한다:
(i) 하나 이상의 이종 발현 카세트 내에 상기 본원에 기술된 TIF 유전자(들) 및 POI를 코딩하는 관심 유전자(GOI)를 포함하도록 숙주 세포를 유전적으로 조작하는 단계,
(ii) 상기 TIF 유전자(들) 및 상기 GOI를 공동-발현하는 조건 하에서 배양 배지에서 상기 숙주 세포를 배양하여 POI를 수득하는 단계; 및
(iii) 숙주 세포 또는 배양 배지로부터 POI를 회수하는 단계.
구체적으로, 본원에 기술된 방법의 단계 i)는 단계 (ii) 이전에 수행된다.
구체적인 실시예에 따르면, 야생형 숙주 세포는 본원에 기술된 방법의 단계 i)에 따라 유전적으로 변형된다.
구체적으로, 숙주 세포는 이종 발현 카세트를 발현하기 위해 야생형 숙주 세포 균주에 상기 유전적 변형을 도입하여 제공된다. 그러나 특정 구현양태에 따르면, 숙주 세포는, 예를 들어 세포의 단백질 발현 및/또는 분비 능력을 향상시키거나 또는 숙주 세포 단백질과 같은 바람직하지 않은 부산물을 감소시키기 위해, 단계 i)에 따라 유전적으로 변형되기 전에 야생형 숙주 세포의 하나 이상의 추가 유전적 변형을 겪을 수 있다.
구체적으로, 본원에 추가로 기재된 바와 같이 재조합 숙주 세포를 생산하기 위해 적합한 방법 단계가 사용된다.
구체적으로, POI는 숙주 세포를 적절한 배지에서 배양하고, 발현된 POI를 세포 배양물, 특히 세포 분리시 세포 배양 상청액 또는 배지로부터 분리하고, 발현된 생성물에 적합한 방법으로 정제함으로써, 특히 POI를 세포에서 분리하고 적절한 수단으로 정제함으로써 생산될 수 있다. 이로써 정제된 POI 제제를 제조할 수 있다.
구체적으로, 본원에 기재된 방법은 본원에 추가로 기재된 특징, 특히 본원에 추가로 기재된 바와 같은 재조합 숙주 세포 및/또는 발현 시스템에 의해 특징지어진다.
특정 측면에 따르면, 본 발명은 POI의 생성을 위한 본원에 기술된 숙주 세포의 용도를 추가로 제공한다.
구체적으로, POI는 상기 하나 이상의 TIF 유전자를 공동-발현 또는 과발현하는 조건 하에서 숙주 세포를 배양하면서 상기 GOI를 발현함으로써 생성된다. 구체적으로, 이러한 방법에 의해 상기 GOI의 발현 및 상기 POI의 생산 수율이 증가된다.
구체적으로, 숙주 세포는 하나 이상의 상기 TIF 유전자를 공동-발현하고 상기 POI를 숙주 세포 배양으로 분비하는 조건 하에서 배양 배지에서 배양되고, POI는 숙주 세포 배양으로부터 회수된다.
구체적으로, 숙주 세포는 세포 배양에서 배양된 세포주, 특히 생산 숙주 세포주이다.
특정 구현양태에 따르면, 세포주는 적합한 배치, 유가식 또는 연속 배양 조건 하에서 배양된다. 배양은 마이크로타이터 플레이트, 쉐이크-플라스크 또는 생물반응기에서 수행될 수 있으며, 임의로 첫 번째 단계로서 배치 기로 시작하여 두 번째 단계로서 유가식 기 또는 연속 배양 기가 뒤따를 수 있다.
구체적으로, 상기 세포 배양은 배치 기에서 세포를 성장시키고; 및 유가식 또는 연속 배양기, 임의로 제 1 단계로서 배치 기로 시작하고, 이어서 제 2 단계로서 유가식 기 또는 연속 배양 기에서 세포를 배양하여 상기 POI를 생성하는 것을 채용한다.
특정 측면에 따르면, 본원에 기재된 방법은 성장 기 및 생성 기를 포함한다.
특히 이 방법은
a) 성장 조건(성장하는 기 또는 "성장 기") 하에서 숙주 세포를 배양하는 단계; 그리고 추가 단계
b) 상기 POI를 생산하기 위해 GOI가 발현되는 동안 성장-제한 조건(생산 기) 하에서 숙주 세포를 배양하는 단계를 포함한다.
구체적으로, 제 2 단계 b)는 제 1 단계 a)후에 온다.
구체적으로, 숙주 세포는 상기 POI에 대한 숙주 세포의 비 생산성(시간당 μg/g 효모 건조 질량(YDM) 및/또는 상기 POI에 대한 부피 생산성(시간당 μg/L))을 증가시키는 수준에서 상기 TIF 유전자 중 하나 이상을 공동-발현하도록 변형된다.
구체적으로, 이러한 공동-발현에 의해 생산성 또는 수율은 상기 TIF를 공동-발현하도록 조작되지 않은 상기 GOI를 발현하는 유사한 숙주 세포와 비교하여 적어도 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2.0배, 2.1배, 2.2배, 2.3배, 2.4배, 2.5배, 2.6배, 2.7배, 2.8배, 2.9배, 3배, 3.5배, 4배, 5배, 5.5배, 6배, 6.5배, 7배, 7.5배, 8배, 8.5배, 9배, 9.5배, 10배, 10.5배, 11배, 11.5배 또는 12배 중 어느 하나만큼 증가된다.
상기 TIF(들)을 생성하기 위한 유전적 변형(들)의 효과에 대해 본원에 기술된 숙주 세포를 비교할 때, 이는 전형적으로 이러한 유전적 변형 전 또는 없는 유사한 숙주 세포와 비교된다. 비교는 전형적으로, 특히 상기 POI를 생성하기 위한 조건 하에서 배양될 때 POI를 생성하도록 조작된 이러한 유전적 변형 없이 동일한 숙주 세포 종 또는 유형과 이루어진다. 그러나 POI를 생성하도록 더 이상 조작되지 않은 동일한 숙주 세포 종 또는 유형과도 비교할 수 있다. 각각의 코딩 서열의 발현 시 상기 TIF(들)의 생성은 숙주 세포에 의해 생성된 상기 TIF(들)의 양(예를 들어, 수준 또는 농도)에 의해 결정될 수 있다. 구체적으로, 그 양은 웨스턴 블롯, 면역형광 이미징, 유세포 분석 또는 질량 분석법을 사용하는 것과 같은 적합한 방법에 의해 결정될 수 있으며, 여기서 특히 질량 분석법은 액체 크로마토그래피-질량 분석법(LC-MS) 또는 액체 크로마토그래피 탠덤-질량분석법(LC-MS/MS)이다.
특정 측면에 따르면, 본원에 기술된 숙주 세포는, 예를 들어 단백질 생산을 개선하기 위해 하나 이상의 추가 유전적 변형을 겪을 수 있다.
구체적으로, 숙주 세포는 프로테아제 결핍 균주, 특히 카복시펩티다제 Y 활성이 결핍된 균주를 생성하는데 사용되는 단백질분해 활성에 영향을 미치는 하나 이상의 유전자를 변형시키도록 추가로 조작될 수 있다. 특정 예는 WO1992017595A1에 기술되어 있다. 프로테아제 A 또는 프로테아제 B와 같은 공포성 프로테아제에 기능적 결함이 있는 프로테아제 결핍 피치아(Pichia) 균주의 추가 예는 US6153424A에 설명되어 있다. 추가 예는 ade2 결실 및/또는 프로테아제 유전자, PEP4PRB1 중 하나 또는 둘 모두의 결실을 갖는 피치아 균주가, 예를 들어 써모피셔 사이언티픽(ThermoFisher Scientific)에 의해 제공된다.
구체적으로, 숙주 세포는 기능적 유전자 산물, 특히 WO2010099195A1에 기재된 바와 같이 PEP4, PRB1, YPS1, YPS2, YMP1, YMP2, YMP1, DAP2, GRHl, PRD1, YSP3, 및 PRB3로 이루어진 군으로부터 선택된 프로테아제를 코딩하는 적어도 하나의 핵산 서열을 변형시키도록 조작될 수 있다.
헬퍼 인자를 코딩하는 유전자의 과발현 또는 과소발현은 WO2015158800A1에 기재된 바와 같이 GOI의 발현을 향상시키기 위해 적용될 수 있다.
특정 측면에 따르면, 숙주 세포는 진핵 숙주 세포이다.
구체적으로, 숙주 세포는 다음과 같다:
a) 피치아(Pichia), 한세눌라(Hansenula), 코마가타엘라(Komagataella), 사카로미세스(Saccharomyces), 클루이베로미세스(Kluyveromyces), 칸디다(Candida), 오가테아(Ogataea), 야로위아(Yarrowia) 및 지오트리쿰(Geotrichum), 바람직하게는 피치아 파스토리스(Pichia pastoris), 코마가타엘라 파피(Komagataella phaffii), 코마가타엘라 파스토리스(Komagataella pastoris), 코마가타엘라 슈도파스토리스(Komagataella pseudopastoris), 사카로미세스 세레비지애(Saccharomyces cerevisiae), 오가테아 미누타(Ogataea minuta), 클루이베롬세스 락티스(Kluyveromces lactis), 클루이베로메스 마르시아누스(Kluyveromes marxianus), 야로위아 리폴리티카(Yarrowia lipolytica) 또는 한세눌라 폴리모르파(Hansenula polymorpha)로 이루어진 군에서 선택되는 속의 효모 세포; 또는
b) 아스페르길루스 아와모리(Aspergillus awamori) 또는 트리코더마 리세이(Trichoderma reesei)와 같은 사상성 진균의 세포; 또는
c) 비-인간 영장류, 인간, 설치류 또는 소 세포, 예컨대 마우스 골수종(NSO)-세포주, 차이니즈 햄스터 난소(CHO)-세포주, HT1080, H9, HepG2, MCF7, MDBK Jurkat, MDCK, NIH3T3, PC12, BHK(아기 햄스터 신장 세포), VERO, SP2/0, YB2/0, Y0, C127, L 세포, COS, 예를 들어 COS1 및 COS7, QC1-3, HEK-293, VERO, PER.C6, HeLA, EB1, EB2, EB3, 종양용해성 또는 하이브리도마-세포주; 또는
d) Sf9, Mimic Sf9, Sf21, 하이 파이브(High Five)(BT1-TN-5B1-4) 또는 BT1-Ea88 세포와 같은 곤충 세포; 또는
e) 암포라(Amphora), 규조류(Bacillariophyceae), 두날리엘라(Dunaliella), 클로렐라(Chlorella), 클라미도모나스(Chlamydomonas), 시아노피타(Cyanophyta)(시아노박테리아), 나노클로롭시스(Nannochloropsis), 스피룰리나(Spirulina) 또는 오크로모나스(Ochromonas) 속과 같은 조류 세포; 또는
f) 식물 세포, 예컨대 단자엽 식물, 바람직하게는 옥수수, 벼, 밀 또는 세타리아, 또는 쌍자엽 식물, 바람직하게는 카사바, 감자, 대두, 토마토, 담배, 알팔파, 피스코미트렐라 파텐스(Physcomitrella patens) 또는 애기장대(Arabidopsis)로부터의 세포.
특정 측면에 따르면, 숙주 세포는 임의의 효모 세포일 수 있다. 구체적으로 상기 숙주 세포는 피치아(Pichia), 한세눌라(Hansenula), 코마가타엘라(Komagataella), 사카로미세스(Saccharomyces), 클루이베로미세스(Kluyveromyces), 칸디다(Candida), 오가테아(Ogataea), 야로위아(Yarrowia) 및 지오트리쿰(Geotrichum), 구체적으로는 사카로미세스 세레비지애(Saccharomyces cerevisiae), 피치아 파스토리스(Pichia pastoris), 오가테아 미누타(Ogataea minuta), 클루이베롬세스 락티스(Kluyveromces lactis), 클루이베로메스 마르시아누스(Kluyveromes marxianus), 야로위아 리폴리티카(Yarrowia lipolytica) 또는 한세눌라 폴리모르파(Hansenula polymorpha) 또는 아스페르길루스 아와모리(Aspergillus awamori) 또는 트리코더마 리세이(Trichoderma reesei)와 같은 사상성 진균으로 이루어진 군으로부터 선택된 속의 세포이다. 바람직하게는, 숙주 세포는 메틸로트로픽 효모, 바람직하게는 피치아 파스토리스(Pichia pastoris)이다. 여기서 피치아 파스토리스(Pichia pastoris)코마가타엘라 파스토리스(Komagataella pastoris), 코마가타엘라 파피(Komagataella phaffii ) 및 코마가타엘라 슈도파스토리스(Komagataella pseudopastoris) 모두와 동의어로 사용된다.
구체적인 예로는 피치아(Pichia) 속(예를 들어, 피치아 파스토리스(Pichia pastoris), 피치아 메탄올리카(Pichia methanolica), 피치아 클루이베리(Pichia kluyveri) 및 피치아 앙구스타(Pichia angusta)), 코마가타엘라(Komagataella) 속(예를 들어, 코마가타엘라 파스토리스(Komagataella pastoris), 코마가타엘라슈도파스토리스(Komagataella pseudopastoris) 또는 코마가타엘라 파피(Komagataella phaffii)), 사카로미세스(Saccharomyces) 속(예를 들어, 사카로미세스 세레비지애(Saccharomyces cerevisae), 사카로미세스 클루이베리(Saccharomyces kluyveri), 사카로미세스 우바룸(Saccharomyces uvarum)), 클루이베로미세스 속(Kluyveromyces) (예를 들어, 클루이베로미세스 락티스(Kluyveromces lactis), 클루이베로미세스 마르시아누스(Kluyveromes marxianus)), 칸디다(Candida) 속(예를 들어, 칸디다 유틸리티(Candida utilis), 칸디다 카카오(Candida cacaoi), 칸디다 보이디니이(Candida boidinii)), 지오트리쿰(Geotrichum) 속(예를 들어, 지오트리쿰 페르멘타스(Geotrichum fermentans), 한세눌라 폴리모르파(Hansenula polymorpha), 야로위아 리포카카로미세스(Yarrowia lipoaccharomyces, 또는 스키조사카로미세스 폼베(Schizosaccharomyces pombe)의 효모 세포를 지칭한다.
피치아 파스토리스(Pichia pastoris) 종이 바람직하다. 구체적으로, 숙주 세포는 CBS704, CBS2612, CBS7435, CBS9173-9189, DSMZ 70877, X-33, GS115, KM71, KM71H 및 SMD1168로 이루어진 군으로부터 선택된 피치아 파스토리스(Pichia pastoris) 균주이다.
출처: CBS704 (=NRRL Y-1603 = DSMZ 70382), CBS2612 (=NRRL Y-7556), CBS7435 (=NRRL Y-11430), CBS9173-9189 (CBS 균주: CBS-KNAW Fungal Biodiversity Centre, Centraalbureau voor Schimmelculturen, Utrecht, The Netherlands) 및 DSMZ 70877(German Collection of Microorganisms and Cell Cultures); X-33, GS115, KM71, KM71H 및 SMD1168과 같은 써모 피셔(Thermo Fisher)의 균주.
바람직한 S. 세레비지애 균주의 예는 W303, CEN.PK 및 BY-시리즈(EUROSCARF collection)를 포함한다. 상기 기재된 모든 균주는 형질전환체를 생산하고 이종 유전자를 발현하는데 성공적으로 사용되었다.
본 발명은 추가로 POI를 코딩하는 관심 유전자(GOI)를 발현하는 숙주 세포에 의해 생산될 때 세포 배양물에서 메신저 리보핵단백질(mRNP)의 하나 이상의 TIF 유전자(들)를 발현하는 하나 이상의 이종 발현 카세트를 공동-발현함으로써, 관심 단백질(POI)의 수율을 증가시키는 방법을 제공한다.
본 발명은 메신저 리보핵단백질(mRNP)의 하나 이상의 TIF 유전자(들), 예컨대 본원에 추가로 기재된 바와 같은 TIF 유전자(들)을 발현하는 하나 이상의 이종 발현 카세트를 포함하는 폴리펩티드 발현 시스템을 추가로 제공한다. 이러한 발현 카세트는 본원에서 또한 TIF-발현 구성물, 또는 TIF(TIF 유전자) 발현 카세트(TIFEC)로 지칭된다. 구체적으로, 이종 발현 카세트는 상기 TIF 유전자를 발현하기 위해 상기 TIF 유전자에 작동가능하게 연결된 하나 이상의 발현 제어 서열을 포함하고, 특히 상기 발현 제어 서열 중 적어도 하나, 예를 들어, 프로모터, 신호 펩티드 또는 리더는 상기 TIF 유전자에 자연적으로 작동가능하게 연결되어 있지 않다. 구체적으로, TIF 발현 카세트는 본원에 추가로 기재된 바와 같이 특성화된다.
구체적으로, 발현 시스템은 관심 단백질(POI)을 코딩하는 GOI 및 상기 GOI에 작동가능하게 연결된 하나 이상의 발현 제어 서열을 포함하는 발현 카세트를 추가로 포함한다. 이러한 발현 카세트는 본원에서 GOI-발현 구성물(GOIEC) 또는 GOI 발현 카세트라고도 지칭다. 구체적으로, GOI 발현 카세트는 본원에 추가로 기재된 바와 같이 특성화된다. 구체적으로, GOI를 포함하는 발현 카세트는 TIF 유전자(들)을 발현하는 다른 발현 카세트와 분리되어 있다.
구체적으로, 본원에 기재된 발현 시스템은 본원에 추가로 기재된 바와 같은 발현 카세트 및 재조합 발현 구성물의 특징을 특징으로 한다.
구체적으로, 상기 유전적 조작에 의해 과발현된 TIF 유전자(들)는 각각 별도의 발현 카세트에 포함된다. 그러나 적어도 2개 또는 3개의 TIF 유전자(들)를 포함하고 임의로 GOI를 추가로 포함하는 발현 카세트가 사용될 수 있다.
본 발명은 추가로 본원에 기술된 발현 시스템, 특히 TIF 유전자(들)을 발현하기 위한 발현 카세트 및 GOI를 발현하기 위한 발현 카세트를 포함하는 발현 시스템을 포함하는 숙주 세포, 특히 본원에 기술된 바와 같은 숙주 세포를 제공한다.
특정 측면에 따르면, 숙주 세포는 GOI에 작동가능하게 연결된 발현 카세트 프로모터를 포함하는 적어도 하나의 이종 GOIEC를 포함하는 재조합 숙주 세포이고, 여기서 GOIEC에 포함된 적어도 하나의 성분 또는 성분들의 조합은 숙주 세포에 대해 이종이다.
구체적으로, 인공 발현 카세트가 사용되며, 여기서 특히 프로모터 및 상기 프로모터의 제어 하에 발현될 유전자는 서로 이종성이며, 자연에서 이러한 조합으로 발생하지 않으며, 예를 들어 프로모터 및 유전자 중 하나(또는 단지 하나)는 인공적이거나 다른 것 및/또는 본원에 기술된 숙주 세포에 대해 이종성이고; 프로모터는 내인성 프로모터이고 발현될 유전자는 이종 유전자이거나; 또는 프로모터는 인공 또는 이종 프로모터이고 유전자는 내인성 유전자이고; 여기서, 프로모터 및 유전자 둘 다는 인공적이거나, 이종이거나, 본원에 기재된 숙주 세포와 비교하여 세포의 상이한 종 또는 유형(균주)으로부터와 같이 상이한 기원으로부터 유래된다.
특정 측면에 따르면, 임의의 하나 이상(또는 모두)의 이종 발현 카세트는 하나 이상의 자가 복제 벡터 또는 플라스미드에 포함되거나 상기 숙주 세포의 염색체 내에 통합된다.
발현 카세트는 숙주 세포 내로 도입될 수 있고, 예를 들어 특정 통합 부위에서 염색체내 요소로서 숙주 세포 게놈(또는 그의 염색체 중 임의의 것) 내로 통합되거나 무작위로 통합될 수 있으며, 이때 고생산성 숙주 세포주가 선택된다. 대안적으로, 발현 카세트는 플라스미드 또는 인공 염색체, 예를 들어 효모 인공 염색체(YAC)와 같은 염색체외 유전 요소 내에 통합될 수 있다. 특정 실시예에 따르면, 발현 카세트는 벡터, 특히 적합한 형질전환 또는 형질주입 기술에 의해 숙주 세포에 도입되는 발현 벡터에 의해 숙주 세포에 도입된다. 이를 위해, 발현될 이종 폴리뉴클레오티드(들)(특히 GOI)는 발현 벡터에 결찰될 수 있다.
바람직한 효모 발현 벡터(효모에서의 발현에 바람직하게 사용되는)는 pPICZ, pGAPZ, pPIC9, pPICZalfa, pGAPZalfa, pPIC9K, pGAPHis, pPUZZLE 또는 GoldenPiCS 로부터 유도된 플라스미드로 이루어진 군으로부터 선택된다.
벡터 또는 플라스미드를 도입하기 위해 숙주 세포를 형질주입시키거나 형질전환시키는 기술은 당업계에 잘 알려져 있다. 이들은 전기천공, 스페로플라스팅, 지질 소포 매개 흡수, 열충격 매개 흡수, 인산칼슘 매개 형질주입(인산칼슘/DNA 공-침전), 바이러스 감염, 특히 예를 들어 변형된 아데노바이러스, 미세주입 및 전기천공법과 같은 변형된 바이러스의 사용을 포함할 수 있다.
본원에서 사용되는 바와 같이, 효모 세포를 "형질전환시키는"이라는 용어는 동일한 것을 "형질주입시키는" 것을 포함하는 것으로 이해된다.
본원에 기술된 형질전환체는 발현 카세트, 벡터 또는 플라스미드 DNA를 숙주에 도입하고 관련 단백질 또는 선택 마커를 발현하는 형질전환체를 선택함으로써 수득할 수 있다. 숙주 세포는 전기 펄스 방법, 원형질체 방법, 리튬 아세테이트 방법 및 이들의 변형된 방법과 같은 숙주 세포의 형질전환에 통상적으로 사용되는 방법에 의해 이종 또는 외래 DNA를 도입하도록 처리될 수 있다. 미생물에 의한 재조합 DNA 단편의 흡수를 위한 바람직한 형질전환 방법은 화학적 형질전환, 전기천공 또는 원형질화에 의한 형질전환을 포함한다.
특정 측면에 따르면, 이종 폴리뉴클레오티드에 작동가능하게 연결된 프로모터를 포함하는 폴리뉴클레오티드의 인공 융합, 및 임의로 신호, 리더 또는 종결 서열과 같은 추가 서열을 포함하거나 이로 이루어진 발현 카세트가 사용된다.
구체적으로, TIFEC는 상기 TIF(들)을 세포내 단백질(들)로서 발현한다.
구체적으로, GOIEC는 분비 단백질로서 POI를 발현하고 생산하는데 필요한 신호 및 리더 서열을 포함한다.
특정 측면에 따르면, GOI는 분비 신호 서열, 바람직하게는 이종 분비 신호 서열을 코딩하는 뉴클레오티드 서열에 5'-단부에서 융합된다.
특정 측면에 따르면, GOIEC는 POI의 분비를 가능하게 하는 신호 펩티드를 코딩하는 뉴클레오티드 서열을 포함한다. 구체적으로, 신호 펩티드를 코딩하는 뉴클레오티드 서열은 GOI의 5'-단부에 인접하여 융합된다.
신호 서열은 천연 신호 서열일 수 있으며, 본원에서는 자연-발생 단백질과 공동-발현되거나, 융합되거나, 그렇지 않으면 연관되어 발현시 이러한 단백질을 분비하는 신호 서열로 이해된다. 예를 들어, 천연 분비 신호 서열은 일반적으로 분비될 각각의 단백질과 공동-발현, 융합 또는 그렇지 않으면 연관된 신호 서열이다. 구체적으로, 상기 POI와 상이한 분비 단백질로부터 기원하는 신호 서열과 같이, 상기 POI에 대해 이종인(또는 자연적으로 연관되지 않은) 천연 분비 신호 서열이 사용된다.
대안적으로, 인공 분비 신호 서열, 특히 자연-발생 서열과 적어도 85%, 90% 또는 95% 서열 동일성 중 어느 하나인 신호 서열이 사용될 수 있다.
구체적으로, 신호 서열은 S. 세레비지애 알파-교배 인자 프리프로-펩티드의 신호 서열, P. 파스토리스 산 포스파타제 유전자(PHO1) 및 세포외 단백질 X(EPX1)의 신호 서열로 이루어진 군에서 선택된다(Heiss, S., V. Puxbaum, C. Gruber, F. Altmann, D. Mattanovich & B. Gasser, Microbiology 2015;161(7):1356-68).
구체적으로, WO2014067926 A1 또는 WO2012152823 A1에 기재된 임의의 신호 및/또는 리더 서열이 사용될 수 있다.
도 1: 본원에서 언급된 서열이다.
다르게 나타내거나 정의하지 않는 한, 본원에서 사용된 모든 용어는 당업계에서 통상적인 의미를 가지며, 이는 당업자에게 명백할 것이다. 예를 들어 표준 핸드북을 참조한다(Sambrook et al, "Molecular Cloning: A Laboratory Manual" (2nd Ed.), Vols. 1 -3, Cold Spring Harbor Laboratory Press (1989); Lewin, "Genes IV", Oxford University Press, New York, (1990), and Janeway et al., "Immunobiology" (5th Ed., or more recent editions), Garland Science, New York, 2001).
본원에서 사용된 "포함하다", "함유하다", "가지다" 및 "포함하다"라는 용어는 동의어로 사용될 수 있으며 추가 부재 또는 부품 또는 요소를 허용하는 열린 정의로 이해되어야 한다. "이루어지는"은 구성하는 정의 기능의 추가 요소가 없는 가장 가까운 정의로 간주된다. 따라서 "포함하는"은 더 광범위하며 "이루어지는" 정의를 포함한다.
본원에서 사용되는 용어 "약"은 동일한 값 또는 주어진 값의 +/-10% 또는 +/-5% 만큼 다른 값을 의미한다.
명세서 전반에 걸쳐 사용되는 특정 용어는 다음과 같은 의미를 갖는다.
본원에서 사용되는 "숙주 세포"와 관련하여 "세포"라는 용어는 단일 세포, 단일 세포 클론 또는 숙주 세포의 세포주를 의미한다.
본원에서 사용되는 용어 "세포주"는 장기간에 걸쳐 증식하는 능력을 획득한 특정 세포 유형의 확립된 클론을 의미한다. 세포주는 전형적으로 내인성 또는 재조합 핵산 분자 또는 유전자, 또는 이러한 폴리펩티드에 의해 매개되는 폴리펩티드 또는 세포 대사산물을 생산하기 위한 대사 경로의 생성물을 발현시키기 위해 사용된다. "생산 숙주 세포주" 또는 "생산 세포주"는 일반적으로 POI와 같은 생산 공정의 생성물을 얻기 위해 생물반응기에서 세포 배양에 바로 사용할 수 있는 세포주로 이해된다.
본원에 기재된 특정 구현양태는 적어도 2개의 상이한 폴리뉴클레오티드(핵산 분자 또는 유전자), 본원에 기재된 바와 같은 TIF를 코딩하는 적어도 하나의 TIF 유전자, 및 POI를 코딩하는 적어도 하나의 관심 유전자(GOI), 특히 각각의 폴리뉴클레오티드를 공동-발현함으로써 POI가 높은 수율로 생성되는 관심 유전자(GOI)를 공동-발현하도록 조작된 생산 숙주 세포주를 지칭한다.
본원에 기술된 POI를 생산하는 숙주 세포는 또한 "생산 숙주 세포"로 지칭되고, 각각의 세포주는 "생산 세포주"로 지칭된다. 본원에 기재된 특정 구현양태는 상기 TIF(들)를 공동-발현하도록 조작되고 POI 생성의 높은 수율을 특징으로 하는 이러한 POI 생성 숙주 세포주를 지칭한다.
본원에서 사용되는 "숙주 세포"라는 용어는 특히 POI 또는 숙주 세포 대사산물을 생성하기 위한 재조합 목적에 적합하게 사용되는 임의의 세포에 적용된다. "숙주 세포"라는 용어는 인간을 포함하지 않는 것으로 잘 알려져 있다. 구체적으로, 본원에 기재된 바와 같은 재조합 숙주 세포는 인공 유기체 및 천연(야생형) 숙주 세포의 유도체이다. 본원에 기술된 숙주 세포, 방법 및 용도, 예를 들어 구체적으로 하나 이상의 유전적 변형, 이종 발현 카세트 또는 인공 발현 구성물, 상기 형질주입 또는 형질전환된 숙주 세포 및 재조합 단백질을 포함하는 것을 언급하는 것은 비천연 발생이고, "인공" 또는 합성이므로 "자연법칙"의 결과로 간주되지 않는다는 것이 잘 이해된다. 본원에 기재된 유전자 변형은 당업계에 공지된 도구, 방법 및 기술을 사용할 수 있다(J. Sambrook et al., Molecular Cloning: A Laboratory Manual (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York (2001)).
숙주 세포와 관련하여 본원에서 사용되는 용어 "세포 배양" 또는 "배양하는" 또는 "배양"은 성장, 분화 또는 지속적인 생존에 유리한 조건 하에 인공, 예를 들어 특히 당업계에 알려진 방법에 따라 제어된 생물반응기에서 세포의 활성 또는 정지 상태에서 시험관내 환경에서 세포를 유지하는 것을 의미한다.
적절한 배양 배지를 사용하여 세포 배양물을 배양할 때, 세포는 배양 용기에서 배지 또는 세포 배양에서 세포 배양을 지원하기에 적합한 조건 하에서 기질과 접촉하게 된다. 표준 세포 배양 배지 및 기술은 당업계에 잘 알려져 있다.
본원에 기술된 바와 같은 세포 배양물은 특히 본원에서 "세포 배양 상청액"으로 지칭되는 세포 배양 배지에서 POI를 수득하는 것과 같이 분비된 POI의 생성을 제공하는 기술을 사용하며, 이는 세포 바이오매스로부터 분리가능하고, 더 높은 순도의 POI를 얻기 위해 정제될 수 있다. 단백질(예를 들어, POI)이 세포 배양에서 숙주 세포에 의해 생성되고 분비될 때, 이러한 단백질은 세포 배양 상청액으로 분비되고 세포 배양 상청액을 숙주 세포 바이오매스로부터 분리하고, 및 임의로 단백질을 추가로 정제하여 정제된 단백질 제제를 생성할 수 있다.
세포 배양 배지는 제어된 인공 및 시험관내 환경에서 세포를 유지하고 성장시키는 데 필요한 영양소를 제공한다. 세포 배양 배지의 특성 및 구성은 특정 세포 요구 사항에 따라 다르다. 중요한 매개변수에는 삼투모랄농도, pH 및 영양소 배합이 포함된다. 영양분의 공급은 당업계에 공지된 방법에 따라 연속적 또는 불연속적 방식으로 수행될 수 있다.
배치 공정은 세포 배양에 필요한 모든 영양분이 초기 배양 배지에 함유되어 발효시 추가적인 영양분 공급 없이 배양하는 세포 배양 방식인 반면, 유가식 또는 연속식 공정에서 배치 단계를 거친 후, 공급에 의해 하나 이상의 영양소가 배양에 공급되는 공급 기가 발생한다. 대부분의 공정에서 공급 방식이 결정적이고 중요하지만, 본원에 기재된 숙주 세포 및 방법은 세포 배양의 특정 방식과 관련하여 제한되지 않는다.
재조합 POI는 본원에 기술된 숙주 세포 및 각각의 세포주를 사용하여 적절한 배지에서 배양하고, 발현된 생성물 또는 대사산물을 배양물로부터 분리하고, 임의로 적합한 방법으로 정제함으로써 생성될 수 있다.
본원에 기술된 바와 같이 POI의 생성을 위한 여러 상이한 접근법이 바람직하다. 관련 단백질을 코딩하는 재조합 DNA를 보유하는 발현 벡터로 숙주 세포를 형질전환 또는 형질주입시키고, 형질전환 또는 형질주입된 세포의 배양물을 제조하고, 배양물을 성장시키고, 전사 및 POI 생성을 유도하고, 및 POI 회수함으로써, POI는 발현되고 처리되고 및 임의로 분비될 수 있다.
특정 구현양태에서, 세포 배양 공정은 유가식 공정이다. 구체적으로, 원하는 재조합 POI를 코딩하는 핵산 구성물로 형질주입된 숙주 세포는 원하는 재조합 POI를 생산하기 위해 성장기에서 배양되고 생산기로 전환된다.
또 다른 구현양태에서, 본원에 기술된 숙주 세포는, 예를 들어 케모스타트를 사용하는 연속 방식으로 배양된다. 연속 발효 공정은 정의되고 일정하며 연속적인 공급 속도로 신선한 배양 배지를 생물반응기로 공급하는 것을 특징으로 하며, 동시에 배양액은 생물반응기에서 동일한 정의되고 일정하며 연속적인 제거 속도로 제거된다. 배양 배지, 공급 속도 및 제거 속도를 동일한 일정한 수준으로 유지함으로써, 생물반응기의 세포 배양 매개변수 및 조건이 일정하게 유지된다.
또 다른 구현양태에서, 본원에 기재된 숙주 세포는 관류 방식, 예를 들어 신선한 배지를 공급하고 상청액을 제거하면서 장치 내에서 세포를 배양하는 방식으로 배양된다.
본원에 기술된 안정한 세포 배양은 구체적으로 유전적 특성을 유지하는 세포 배양, 심지어 약 20세대의 배양 후에도, 바람직하게는 적어도 30세대, 보다 바람직하게는 적어도 40세대, 가장 바람직하게는 적어도 50세대 배양 후에도 특히 높은 POI 생산 수준을 유지하는 것, 예를 들어 적어도 μg 수준으로 유지하는 세포 배양을 지칭하는 것으로 이해된다. 구체적으로, 산업적 규모의 생산에 사용될 때 큰 이점으로 여겨지는 안정한 재조합 숙주 세포주가 제공된다.
본원에 기술된 세포 배양은 산업 제조 규모, 예를 들어 영양 공급에 기반한 배양 모드, 특히 유가식 또는 배치 공정 또는 연속식 또는 반-연속식 공정(예를 들어, 케모스타트)과 조합하여 부피 및 기술 시스템과 모두에 관련한 방법에서 특히 유리하게 사용된다.
본원에 기재된 숙주 세포는 전형적으로 POI 생성을 위한 GOI를 발현하는 그의 능력에 대해 테스트되고, 하기 테스트 중 임의의 것에 의해 POI 수율에 대해 테스트된다: ELISA, 활성 검정, 모세관 전기영동, HPLC, 또는 SDS-PAGE 및 웨스턴 블로팅 기술 또는 질량 분석법와 같은 다른 적합한 테스트.
하나 이상의 TIF(들)의 공동-발현의 효과, 예를 들어 POI 생성에 대한 효과를 결정하기 위해, 숙주 세포주는 마이크로타이터 플레이트, 쉐이크 플라스크 또는 생물반응기에서 유가식 또는 케모스타트 발효를 사용하여 각각의 세포에서 공동-발현을 위한 이러한 유전적 변형이 없는 균주와 비교하여 배양될 수 있다.
본원에 기술된 생산 방법은 구체적으로 파일럿 또는 산업 규모의 발효를 가능하게 한다. 산업 공정 규모는 바람직하게는 적어도 10 L, 특히 적어도 50 L, 바람직하게는 적어도 1 m3, 바람직하게는 적어도 10 m3, 가장 바람직하게는 적어도 100 m3의 부피를 사용할 것이다.
산업적 규모의 생산 조건이 바람직하며, 이는, 예를 들어 반응기 부피가 100 L 내지 10 m3 이상인 유가 배양, 수일의 일반적인 공정 시간 또는 발효기 부피가 약 50 내지 1000 L 이상, 희석율은 약 0.001 - 0.15 h-1인 연속 공정을 지칭한다.
본원에 기술된 목적을 위해 사용되는 장치, 시설 및 방법은 임의의 원하는 세포주를 배양하는 데 사용하기에 특히 적합하다. 또한, 장치, 시설 및 방법은 임의의 효모 숙주 세포 유형을 배양하는 데 적합하며, 특히 폴리펩티드 생성물품(POI), 핵산 생성물(예를 들어, DNA 또는 RNA), 또는 세포 및/또는 세포 및/또는 바이러스 치료에 사용되는 것과 같은 바이러스와 같은 약제학적 및 바이오의약품 생산을 위해 구성된 생산 작업에 특히 적합하다.
특정 구현양태에서, 세포는 재조합 치료 또는 진단 생성물과 같은 생성물을 발현하거나 생산한다. 본원에 보다 상세히 기술된 바와 같이, 세포에 의해 생성된 생성물의 예는 POI, 예를 들어 항체 분자(예를 들어, 모노클로날 항체, 이중특이성 항체), 항체 모방체(항원에 특이적으로 결합하지만, 예를 들어 DARPin, 아피바디, 애드넥틴 또는 IgNAR과 같은 항체에 구조적으로 관련되지 않는 폴라펩티드 분자), 융합 단백질(예를 들어, Fc 융합 단백질, 키메라 사이토카인), 기타 재조합 단백질(예를 들어, 글리코실화 단백질, 효소, 호르몬) 또는 바이러스 치료제(예를 들어, 항암 종양용해 바이러스, 유전자 요법 및 바이러스 면역요법용 바이러스 벡터), 세포 치료제(예를 들어, 다능성 줄기 세포, 중간엽 줄기 세포 및 성체 줄기 세포), 백신 또는 지질-캡슐화 입자(예를 들어, 엑소좀, 바이러스-유사 입자), RNA(예를 들어, siRNA) 또는 DNA(예를 들어, 플라스미드 DNA), 항생제 또는 아미노산을 포함하지만, 이에 제한되지 않는다. 구현양태에서, 장치, 시설 및 방법은 바이오시밀러 생산에 사용될 수 있다.
언급된 바와 같이, 특정 구현양태에서, 장치, 시설 및 방법은, 예를 들어 효모 세포와 같은 진핵 세포 및/또는 상기 세포의 생성물, 예를 들어 대규모 방식으로 상기 세포에 의해 합성된 단백질, 펩티드 또는 항생제, 아미노산, 핵산(예를 들어, DNA 또는 RNA)을 포함하는 POI의 생산을 가능하게 한다. 본원에서 달리 언급하지 않는 한, 장치, 시설 및 방법은 벤치-규모, 파일럿-규모 및 전체 생산 규모 용량을 포함하지만 이에 제한되지 않는 임의의 원하는 부피 또는 생산 능력을 포함할 수 있다.
또한, 본원에서 달리 언급하지 않는 한, 장치, 시설 및 방법은 교반 탱크, 에어리프트, 섬유, 마이크로섬유, 중공 섬유, 세라믹 매트릭스, 유동층, 고정층 및 /또는 분출층 생물반응기를 포함하나 이에 제한되지 않는 임의의 적합한 반응기를 포함할 수 있다. 본원에서 사용되는 "반응기"는 발효기 또는 발효 유닛, 또는 임의의 다른 반응 용기를 포함할 수 있고 용어 "반응기"는 "발효기"와 상호교환적으로 사용된다. 예를 들어, 일부 측면에서, 예시적인 생물반응기 유닛은 다음 중 하나 이상 또는 모두를 수행할 수 있다: 영양분 및/또는 탄소원의 공급, 적합한 가스(예를 들어, 산소)의 주입, 발효 또는 세포 배양 배지의 입구 및 출구 흐름, 기체 및 액체 상 분리, 온도 유지, 산소 및 CO2 수준 유지, pH 수준 유지, 흔들기(예를 들어, 교반) 및/또는 세척/살균. 발효 유닛과 같은 예시적인 반응기 유닛은 유닛 내에 다중 반응기를 포함할 수 있으며, 예를 들어 유닛은 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90 또는 100개 이상의 생물반응기를 각 유닛에 가질 수 있고/있거나 시설에서 시설 내에 단일 또는 다중 반응기를 갖는 여러 유닛을 포함할 수 있다. 다양한 구현양태에서, 생물반응기는 배치, 반유가식, 유가식, 관류 및/또는 연속 발효 공정에 적합할 수 있다. 임의의 적합한 반응기 직경을 사용할 수 있다. 실시예에서, 생물반응기는 약 100 mL와 약 50,000 L 사이의 부피를 가질 수 있다. 비-제한적인 예는 100 mL, 250 mL, 500 mL, 750 mL, 1 리터, 2 리터, 3 리터, 4 리터, 5 리터, 6 리터, 7 리터, 8 리터, 9 리터, 10 리터, 15 리터, 20 리터, 25 리터, 30 리터, 40 리터, 50 리터, 60 리터, 70 리터, 80 리터, 90 리터, 100 리터, 150 리터, 200 리터, 250 리터, 300 리터, 350 리터, 400 리터, 450 리터, 500 리터, 550 리터, 600 리터, 650 리터, 700 리터, 750 리터, 800 리터, 850 리터, 900 리터, 950 리터, 1000 리터, 1500 리터, 2000 리터, 2500 리터, 3000 리터, 3500 리터, 4000 리터, 4500 리터, 5000 리터, 6000 리터, 7000 리터, 8000 리터, 9000 리터, 10,000 리터, 15,000 리터, 20,000 리터, 및/또는 50,000 리터를 포함한다. 또한, 적합한 반응기는 다중-사용, 단일-사용, 일회용 또는 비-일회용일 수 있으며 스테인리스강(예를 들어, 316 L 또는 임의의 다른 적합한 스테인리스강)과 같은 금속 합금 및 인코넬, 플라스틱, 및/또는 유리을 포함하는 임의의 적합한 재료로 형성될 수 있다.
구현양태에서 그리고 여기에 달리 언급되지 않는 한, 본원에 설명된 장치, 시설 및 방법은 또한 그러한 생성물의 분리, 정제 및 격리를 위한 작업 및/또는 장비와 같이 달리 언급되지 않은 임의의 적절한 단위 작업 및/또는 장비를 포함할 수 있다. 전통적인 스틱-빌트 시설, 모듈식, 이동식 및 임시 시설 또는 기타 적절한 건설, 시설 및/또는 레이아웃과 같은 적절한 시설 및 환경을 사용할 수 있다. 예를 들어, 일부 구현양태에서 모듈식 무균실이 사용될 수 있다. 추가로 달리 명시되지 않는 한, 본원에 설명된 장치, 시스템 및 방법은 단일 위치 또는 시설에 수용 및/또는 수행될 수 있거나 대안적으로 별도 또는 여러 위치 및/또는 시설에 수용 및/또는 수행될 수 있다.
적합한 기술은 배치 기로 시작하여 높은 특정 성장 속도에서 짧은 지수 유가식 기, 이어서 낮은 특정 성장 속도에서 유가식 기가 뒤따르는 생물반응기에서 배양하는 것을 포함할 수 있다. 또 다른 적합한 배양 기술은 POI 생산 시간에 걸쳐 높은 성장 속도에서 낮은 성장 속도로, 또는 POI 생산 시간에 걸쳐 낮은 성장 속도에서 높은 성장 속도로 진행하는 것과 같은 특정 성장 속도의 조합 또는 임의의 적합한 특정 성장 속도에서 배치 기에 이어서 유가식 기를 포함할 수 있다. 또 다른 적합한 배양 기술은 배치 기에 이어 낮은 희석 비율로 연속 배양 단계를 포함할 수 있다.
바람직한 구현양태는 바이오매스를 제공하기 위한 배치 배양에 이어 고수율 POI 생산을 위한 유가식 배양을 포함한다.
적어도 1 g/L 세포 건조 중량, 보다 바람직하게는 적어도 10 g/L 세포 건조 중량, 바람직하게는 적어도 20 g/L 세포 건조 중량, 바람직하게는 30, 40, 50, 60, 70 또는 80 g/L 세포 건조 중량 중 적어도 어느 하나의 세포 밀도를 수득하기 위해 성장 조건 하에 생물반응기에서 본원에 기재된 바와 같은 숙주 세포를 배양하는 것이 바람직하다. 파일럿 또는 산업적 규모에서 이러한 바이오매스 생산 수율을 제공하는 것이 유리하다.
바이오매스의 축적을 허용하는 성장 배지, 특히 기초 성장 배지는 전형적으로 탄소 공급원, 질소 공급원, 황 공급원 및 인산염 공급원을 포함한다. 전형적으로, 이러한 배지는 추가로 미량 원소 및 비타민을 포함하고, 추가로 아미노산, 펩톤 또는 효모 추출물을 포함할 수 있다.
바람직한 질소 공급원은 NH4H2PO4, 또는 NH3 또는 (NH4)2SO4를 포함하고;
바람직한 황 공급원은 MgSO4, 또는 (NH4)2SO4 또는 K2SO4를 포함하고;
바람직한 인산염 공급원은 NH4H2PO4, 또는 H3PO4, 또는 NaH2PO4, KH2PO4, Na2HPO4 또는 K2HPO4를 포함하고;
추가의 일반적인 배지 성분에는 KCl, CaCl2 및 Fe, Co, Cu, Ni, Zn, Mo, Mn, I, B와 같은 미량 원소가 포함되고;
바람직하게는 배지는 성장에 필수적인 비타민, 예를 들어 B7과 같은 B 비타민이 공급되고;
P. 파스토리스의 전형적인 성장 배지는 글리세롤, 소르비톨 또는 글루코스, NH4H2PO4, MgSO4, KCl, CaCl2, 비오틴 및 미량 원소를 포함한다.
생산 기에서 생산 배지는 특히 제한된 양의 보충 탄소원과 함께 사용된다.
바람직하게는 숙주 세포주는 적절한 탄소 공급원이 있는 미네랄 배지에서 배양되어 분리 과정을 더욱 단순화한다. 바람직한 미네랄 배지의 예는 활용가능한 탄소 공급원(예를 들어, 글루코스, 글리세롤, 소르비톨, 메탄올, 에탄올 또는 이들의 조합), 거대 원소(칼륨, 마그네슘, 칼슘, 암모늄, 염화물, 황산염, 인산염)를 함유하는 염 및 미량 원소(구리, 요오드화물, 망간, 몰리브덴산염, 코발트, 아연 및 철염, 및 붕산), 및 임의로 영양요구성을 보완하기 위한 비타민 또는 아미노산을 함유하는 것이다.
구체적으로, 세포는 발현 시스템 및 발현된 단백질의 특성, 예를 들어 단백질이 신호 펩티드에 융합되는지 여부 및 단백질이 가용성인지 또는 막 결합인지 여부에 따라 세포 또는 배양 배지로부터 정제될 수 있는 원하는 POI의 발현을 달성하기에 적합한 조건 하에서 배양된다. 숙련된 기술자에 의해 이해되는 바와 같이, 배양 조건은 사용된 숙주 세포 및 특정 발현 벡터의 유형을 포함하는 인자에 따라 달라질 것이다.
일반적인 생산 배지는 보충 탄소 공급원과 추가로 NH4H2PO4, MgSO4, KCl, CaCl2, 비오틴 및 미량 원소를 포함한다.
예를 들어, 발효에 첨가되는 보충 탄소 공급원의 공급물은 최대 50 wt%의 이용 가능한 당 또는 최대 100%의 이용가능한 알코올을 갖는 탄소 공급원을 포함할 수 있다.
발효는 바람직하게는 3 내지 8 범위의 pH에서 수행된다.
일반적인 발효 시간은 20℃-35℃, 바람직하게는 22-30℃ 범위의 온도에서 약 24-120시간이다.
POI는 바람직하게는 적어도 1 mg/L, 바람직하게는 적어도 10 mg/L, 바람직하게는 적어도 100 mg/L, 가장 바람직하게는 적어도 1 g/L의 수율을 생성하는 조건을 사용하여 발현된다.
용어 "발현" 또는 "발현 카세트"는 본원에서 원하는 코딩 서열(여기에서 유전자라고 지칭) 및 작동가능한 연결의 제어 서열을 함유하는 핵산 분자(여기에서 폴리뉴클레오티드라고도 지칭)를 지칭하는 것으로 이해되며, 이들 분자로 형질전환되거나 형질주입된 숙주는 각각의 서열을 포함하고 코딩된 단백질 또는 숙주 세포 대사산물을 생산할 수 있다. 본원에서 사용되는 용어 "발현"은 폴리뉴클레오티드 또는 유전자의 발현, 또는 각각의 폴리펩티드 또는 단백질의 발현을 의미한다.
하나 이상의 발현 카세트는 본원에서 "발현 시스템"으로도 이해된다. 발현 시스템은 벡터와 같은 발현 구성물에 포함될 수 있다; 그러나, 관련 DNA는 숙주 세포 염색체에 통합될 수도 있다. 발현은 폴리펩티드 또는 대사산물을 포함하는 분비 또는 비-분비 발현 생성물을 의미할 수 있다.
발현 카세트는, 예를 들어 "벡터" 또는 "플라스미드"의 형태로 발현 구성물로서 편리하게 제공되며, 이는 일반적으로 클로닝된 재조합 뉴클레오티드 서열의 전사, 즉 적합한 숙주 유기체에서 재조합 유전자의 전사 및 이들의 mRNA의 번역에 필요한 DNA 서열이다. 발현 벡터 또는 플라스미드는 일반적으로 자가 복제를 위한 기점 또는 숙주 세포에서 게놈 통합을 위한 유전자좌, 선택가능한 마커(예를 들어, 아미노산 합성 유전자 또는 제오신, 카나마이신, G418 또는 하이그로마이신, 누르세오트리신과 같은 항생제에 대한 내성을 부여하는 유전자), 다수의 제한 효소 절단 부위, 적합한 프로모터 서열 및 전사 종결자를 포함하며, 이들 성분은 함께 작동가능하게 연결된다. 본원에서 사용되는 용어 "플라스미드" 및 "벡터"는 자가 복제 뉴클레오티드 서열 뿐만 아니라 인공 염색체, 예를 들어 효모 인공 염색체(YAC)와 같은 게놈 통합 뉴클레오티드 서열을 포함한다.
발현 벡터는 클로닝 벡터, 변형된 클로닝 벡터 및 특이적으로 설계된 플라스미드를 포함할 수 있지만 이에 제한되지 않는다. 본원에 기재된 바람직한 발현 벡터는 진핵 숙주 세포에서 재조합 유전자의 발현에 적합한 발현 벡터이고 숙주 유기체에 따라 선택된다. 적절한 발현 벡터는 전형적으로 진핵 숙주 세포에서 POI를 코딩하는 DNA를 발현하기에 적합한 조절 서열을 포함한다. 조절 서열의 예는 프로모터, 오퍼레이터, 인핸서, 리보솜 결합 부위, 및 전사 및 번역 개시 및 종결을 제어하는 서열을 포함한다. 조절 서열은 전형적으로 발현될 DNA 서열에 작동가능하게 연결된다.
숙주 세포에서 재조합 뉴클레오티드 서열의 발현을 허용하기 위해, 프로모터 서열은 전형적으로 이것이 작동가능하게 연결된 다운스트림 뉴클레오티드 서열의 전사를 조절하고 개시한다. 발현 카세트 또는 벡터는 전형적으로 코딩 서열의 5' 단부에 인접한 프로모터 뉴클레오티드 서열, 예를 들어, 코딩 서열(예를 들어, 헬퍼 인자를 코딩) 또는 관심 유전자(GOI)의 업스트림 및 인접하거나, 또는 신호 또는 리더 서열이 사용되는 경우, 발현 생성물(예를 들어, TIF(들) 또는 POI)을 수득하기 위한 코딩 서열의 번역 개시 및 발현을 용이하게 하기 위해 각각 상기 신호 및 리더 서열의 업스트림 및 인접한 프로모터 뉴클레오티드 서열을 포함한다.
본원에 기술된 특정 발현 구성물은 상기 프로모터의 전사 제어 하에 TIF 또는 POI를 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함한다. 구체적으로, 상기 코딩 서열과 본래 연관되지 않은 프로모터가 사용될 수 있다.
본원에 기술된 특정 발현 구성물은 리더 서열(예를 들어, 분비 신호 펩티드 서열(pre-서열) 또는 pro-서열)과 연결된 POI를 코딩하는 폴리뉴클레오티드를 포함하고, 이는 POI를 분비 경로로 수송 및/또는 숙주 세포로부터 POI의 분비를 유발한다. 재조합 발현 및 분비를 위한 POI가 자연적으로 분비되지 않아 자연적인 분비 리더 서열이 결여된 단백질이거나, 이의 뉴클레오티드 서열이 이의 자연 분비 리더 서열 없이 클로닝된 경우, 발현 벡터에서 이러한 분비 리더 서열의 존재가 통상적으로 요구된다. 일반적으로, 숙주 세포로부터 POI의 분비를 일으키는 데 효과적인 임의의 분비 리더 서열이 사용될 수 있다. 분비 리더 서열은 효모 공급원, 예를 들어 사카로마이세스 세레비지애(Saccharomyces cerevisiae)의 MFα와 같은 효모 알파-인자 또는 효모 포스파타제, 포유류 또는 식물 공급원 또는 기타로부터 기원할 수 있다.
특정 구현양태에서, 멀티클로닝 부위를 갖는 벡터인 멀티클로닝 벡터가 사용될 수 있다. 구체적으로, 원하는 이종 폴리뉴클레오티드를 멀티클로닝 부위에 통합 또는 혼입하여 발현 벡터를 제조할 수 있다. 멀티클로닝 벡터의 경우, 프로모터는 일반적으로 멀티클로닝 사이트의 업스트림에 위치한다.
본원에서 사용되는 "유전자 발현" 또는 "폴리뉴클레오티드를 발현하는" 또는 "핵산 분자를 발현하는"이라는 용어는 mRNA로의 DNA 전사, mRNA 번역 및 처리, mRNA 성숙, mRNA 수출, 단백질 폴딩 및/또는 단백질 수송으로 이루어진 군으로부터 선택된 적어도 하나의 단계를 포함하는 것을 의미한다.
본원에서 상호교환적으로 사용되는 용어 "폴리뉴클레오티드" "핵산 분자(들)" 또는 "핵산 서열(들)"은 임의의 길이의 중합체 비분지형 형태의 리보뉴클레오티드 또는 데옥시리보뉴클레오티드 또는 이둘의 조합인 뉴클레오티드를 지칭한다. 바람직하게는, 폴리뉴클레오티드는 임의의 길이의 중합체 비분지형 형태의 데옥시리보뉴클레오티드를 지칭한다. 여기에서 뉴클레오티드는 오탄당(데옥시리보스), 질소 염기(아데닌, 구아닌, 시토신 또는 티민) 및 인산기로 이루어진다.
본원에서 사용되는 용어 "공동-발현하다" 또는 "공동-발현"은 적어도 2개 또는 다수의 폴리뉴클레오티드(유전자와 같은 핵산 분자)를 숙주 세포, 세포주 또는 세포 배양물에서, 예를 들어 거의 동일하거나 다른 양 또는 비율로 수반되는 또는 연이은(동일한 세포 배양 또는 봉쇄에서 세포를 배양하는 동안) 또는 동시 발현을 의미한다.
본원에 기술된 바와 같이 폴리뉴클레오티드(TIF 유전자와 같은)는 폴리뉴클레오티드(GOI와 같은) 중 적어도 하나가 과발현되도록 공동-발현될 수 있다.
본원에 기술된 바와 같은 TIF 유전자(들)를 공동-발현하는 숙주 세포는 숙주 세포 배양물에서 상기 TIF 유전자(들)의 발현을 증가시키기 위해 특이적으로 유전적으로 조작되고 변형되며, 이는 본원에서 "과발현" 또는 "공동-과발현"으로도 지칭된다.
본원에서 사용되는 용어 "과발현되다" 또는 "과발현"은 숙주 세포의 유전적 변형 이전 또는 정의된 조건에서 유전적으로 변형되지 않은 유사한 숙주에서 동일한 발현 생성물의 발현보다 더 높은 수준으로 발현 생성물, 예컨대 폴리펩티드 또는 단백질의 발현을 지칭할 것이다. 숙주 세포에 대해 이종인 TIF는 그러한 숙주 세포가 그러한 TIF를 발현한다면 항상 과발현되는 것으로 이해된다. 예를 들어, 본원에 기재된 바와 같은 숙주 세포가 임의의 상기 TIF를 천연적으로 발현하지 않는 경우, 이러한 TIF 단백질을 코딩하는 이종 폴리뉴클레오티드는 발현을 위해 숙주 세포에 새로 도입되고; 그러한 경우, 이러한 TIF의 검출가능한 발현은 "과발현"이라는 용어에 포함된다.
단백질을 코딩하는 유전자(예를 들어, TIF 유전자)의 과발현은 단백질(예를 들어, TIF)의 과발현이라고도 지칭된다. 과발현은 당업자에게 공지된 임의의 방식으로 달성될 수 있다. 일반적으로 유전자의 전사/번역을 증가시켜, 예를 들어 유전자의 카피 수를 증가시키거나 유전자 발현과 관련된 조절 서열 또는 부위를 변경 또는 수정함으로써 달성할 수 있다. 유전자는 높은 발현 수준에 도달하기 위해 강력한 프로모터에 작동가능하게 연결될 수 있다. 이러한 프로모터는 내인성 프로모터 또는 이종성, 특히 재조합 프로모터일 수 있다. 유전자의 발현을 증가시키는 이종 프로모터로 프로모터를 대체할 수 있다. 유도성 프로모터를 추가로 사용하면 배양 과정에서 발현을 증가시킬 수 있다. 또한, 과발현은, 예를 들어 특정 유전자의 염색체 위치 변형, 리보솜 결합 부위 또는 전사 종결자와 같은 특정 유전자에 인접한 핵산 서열 변경, 열린 해독틀에서 프레임-이동 도입, 유전자의 전사 및/또는 유전자 생성물의 번역에 관여하는 단백질의 변형(예를 들어, 조절 단백질, 억제자, 인핸서, 전사 활성자 등), 또는 당업계에서 특정 유전자 루틴의 발현을 조절 해제하는 임의의 다른 통상적인 수단(예를 들어, 억제 단백질의 발현을 차단하거나 일반적으로 과발현하고자 하는 유전자의 발현을 억제하는 전사 인자에 대한 유전자를 결실 또는 돌연변이시키기 위한 안티센스 핵산 분자의 사용을 포함하지만 이에 제한되지 않는다)에 의해 달성될 수도 있다. mRNA의 수명 연장은 또한 발현 수준을 향상시킬 수 있다. 예를 들어 특정 종결 영역을 사용하여 mRNA의 반감기를 연장시킬 수 있다. 유전자의 여러 카피가 포함된 경우, 유전자는 가변 카피 수의 플라스미드에 위치하거나 염색체에 통합 및 증폭될 수 있다. 발현을 위해 하나 이상의 유전자 또는 게놈 서열을 숙주 세포에 도입하는 것이 가능하다.
특정 구현양태에 따르면, 각각의 TIF를 코딩하는 폴리뉴클레오티드는 세포당 단일 카피 또는 다중 카피로 존재할 수 있다. 카피는 서로 인접하거나 떨어져 있을 수 있다. 또 다른 특정 구현양태에 따르면, 각각의 TIF의 과발현은 숙주 세포의 게놈으로의 통합(즉, 녹킨)에 적합한 하나 이상의 플라스미드 상에 제공되는 TIF를 세포당 단일 카피 또는 다중 카피로 코딩하는 재조합 뉴클레오티드 서열을 사용한다. 카피는 서로 인접하거나 떨어져 있을 수 있다. 과발현은 숙주 세포당 상기 폴리뉴클레오티드의 2, 3, 4, 5, 6개 이상의 카피와 같은 폴리뉴클레오티드의 다중 카피를 발현함으로써 달성될 수 있다.
GOI 및 각각의 TIF를 코딩하는 폴리뉴클레오티드(유전자)를 포함하는 재조합 뉴클레오티드 서열은 하나 이상의 자가 복제 플라스미드에 제공될 수 있고, 세포당 단일 카피 또는 다중 카피로 도입될 수 있다.
대안적으로, GOI 및 TIF를 코딩하는 폴리뉴클레오티드(유전자)를 포함하는 재조합 뉴클레오티드 서열은 동일한 플라스미드 상에 존재할 수 있고, 세포당 단일 카피 또는 다중 카피로 도입될 수 있다.
각각의 TIF를 코딩하는 이종 폴리뉴클레오티드(유전자) 또는 TIF를 코딩하는 폴리뉴클레오티드(유전자)를 포함하는 이종 재조합 발현 구성물은 바람직하게는 숙주 세포의 게놈으로 통합된다.
"게놈"이라는 용어는 일반적으로 DNA(또는 RNA)에서 코딩된 유기체의 전체 유전 정보를 의미한다. 염색체에, 플라스미드 또는 벡터 또는 둘 다에 존재할 수 있다. 바람직하게는, 각각의 TIF를 코딩하는 폴리뉴클레오티드(유전자)는 상기 세포의 염색체에 통합된다.
각각의 TIF를 코딩하는 폴리뉴클레오티드(유전자)는 이의 자연 유전자좌에 통합될 수 있다. "자연 유전자좌"는 TIF를 코딩하는 폴리뉴클레오티드(유전자)가 자연-발생 야생형 세포에 위치하는 특정 염색체 상의 위치를 의미한다. 그러나, 또 다른 구현양태에서, TIF를 코딩하는 폴리뉴클레오티드(유전자)는 자연 유전자좌가 아니라 이소성으로 통합된 숙주 세포의 게놈에 존재한다. 용어 "이소성 통합(ectopic integration)"은 통상적인 염색체 유전자좌 이외의 부위에서 미생물의 게놈으로 핵산을 삽입하는 것, 즉 예정된 또는 무작위 통합을 의미한다. 또 다른 구현양태에서, TIF를 코딩하는 폴리뉴클레오티드(유전자)는 천연 유전자좌 내로 및 이소적으로 통합된다. 무작위 또는 비-표적 통합을 달성하기 위해 이종 재조합을 사용할 수 있다. 이종 재조합은 상당히 다른 서열을 가진 DNA 분자 사이의 재조합을 지칭한다.
특정 구현양태에서, 각각의 TIF 및/또는 GOI를 코딩하는 폴리뉴클레오티드(유전자)는 플라스미드 또는 벡터에 통합될 수 있다. 바람직하게는, 플라스미드는 진핵 발현 벡터, 바람직하게는 효모 발현 벡터이다. 적합한 플라스미드 또는 벡터는 본원에서 추가로 설명된다.
재조합 숙주 세포에서 내인성 또는 이종 폴리뉴클레오티드의 과발현은 발현 제어 서열을 변형함으로써 달성될 수 있다. 발현 제어 서열은 당업계에 공지되어 있고, 예를 들어 숙주 세포에서 폴리뉴클레오티드 서열의 발현을 제공하는 프로모터, 인핸서, 폴리아데닐화 신호, 전사 종결자, 내부 리보솜 진입 부위(IRES) 등을 포함한다. 발현 제어 서열은 전사에 관여하는 세포 단백질과 특이적으로 상호 작용한다. 예시적인 발현 제어 서열은 문헌에 기재되어 있다(Goeddel, Gene Expression Technology: Methods in Enzymology, Vol. 185, Academic Press, San Diego, Calif. (1990)).
바람직한 구현양태에서, 과발현은 폴리뉴클레오티드를 발현하기 위해 인핸서를 사용함으로써 달성된다. 전사 인핸서는 상대적으로 방향 및 위치 독립적이며, 인트론 내에서 뿐만 아니라 코딩 서열 자체 내에서 전사 단위의 5' 및 3'에서 발견되었다. 인핸서는 코딩 서열에 대해 위치 5' 또는 3'에서 발현 벡터로 스플라이싱될 수 있지만, 바람직하게는 프로모터로부터 부위 5'에 위치한다. 대부분의 효모 유전자는 단 하나의 UAS를 함유하며, 이는 일반적으로 캡 부위의 수백 염기쌍 내에 있으며 대부분의 효모 인핸서(UAS)는 프로모터의 3'에 위치할 때 기능할 수 없지만 고등 진핵생물의 인핸서는 프로모터의 5' 및 3' 모두에서 기능할 수 있다.
많은 인핸서 서열이 포유류 유전자(글로빈, RSV, SV40, EMC, 엘라스타제, 알부민, α-태아단백질 및 인슐린)에서 알려져 있다. SV40 후기 인핸서, 거대세포바이러스 초기 프로모터 인핸서, 복제 오리진의 후기 측에 있는 폴리오마 인핸서 및 아데노바이러스 인핸서와 같은 진핵 세포 바이러스로부터의 인핸서를 사용할 수도 있다.
구체적으로, 본원에 기재된 바와 같은 GOI 및/또는 TIF 코딩 폴리뉴클레오티드(유전자)는 숙주 세포에서 발현을 제공하는 전사 및 번역 조절 서열에 작동가능하게 연결된다. 본원에서 사용되는 용어 "번역 조절 서열"은 유전자 핵산 서열과 연관되고 유전자의 번역을 조절하는 뉴클레오티드 서열을 의미한다. 전사 및/또는 번역 조절 서열은 플라스미드 또는 벡터에 위치하거나 숙주 세포의 염색체에 통합될 수 있다. 전사 및/또는 번역 조절 서열은 조절하는 유전자의 동일한 핵산 분자에 위치한다.
구체적으로, 각각의 TIF의 과발현은 당업계에 공지된 방법, 예를 들어 문헌에 기재된 바와 같이 그들의 내인성 조절 영역을 유전적으로 변형함으로써 달성될 수 있으며(Marx, H., Mattanovich, D. and Sauer, M. Microb Cell Fact 7 (2008): 23), 이러한 방법은, 예를 들어 유전자의 발현을 증가시키는 재조합 프로모터의 통합을 포함한다.
예를 들어, 재조합 숙주 세포에서 내인성 또는 이종 폴리뉴클레오티드의 과발현은 이러한 발현을 제어하는 프로모터를 변형함으로써, 예를 들어 높은 발현 수준에 도달하기 위해 상기 폴리뉴클레오티드에 작동가능하게 연결된 프로모터(예를 들어, 내인성 프로모터 또는 야생형 유기체에서 상기 폴리뉴클레오티드에 천연적으로 연결된 프로모터)를 또 다른 더 강력한 프로모터로 교체함으로써 달성될 수 있다. 이러한 프로모터는 유도적이거나 구성적일 수 있다. 프로모터의 변형은 또한 당업계에 공지된 돌연변이유발 방법에 의해 수행될 수 있다.
특정 구현양태는 GOI 발현과 함께 TIF(또는 TIF 유전자)의 공동-발현을 언급한다. 본원에 기술된 일부 구현양태에서, 벡터 또는 핵산 서열은 적어도 하나의 TIF 분자 및 GOI를 공동-발현하기 위한 하나 이상의 발현 카세트를 포함할 수 있다. 벡터 또는 핵산 서열은 2개 이상의 플라스미드의 공동-형질주입, 다중 또는 양방향 프로모터의 사용, 또는 바이시스트론 또는 멀티시스트론 벡터의 생성을 포함하는 여러 기술을 사용하여 2개 이상의 폴리늄클레오티드의 공동-발현을 허용하도록 구성될 수 있다.
특정 구현양태는, 예를 들어 숙주 세포 게놈 또는 염색체 내에서 안정한 통합을 위해 각각의 발현 카세트(들)를 도입할 때 적어도 1, 2, 3, 4 또는 5개의 TIF를 안정적으로 공동-발현하기 위한 유전적 변형을 지칭한다.
본원에서 사용되는 "기능적 변이체"라고도 지칭되는 용어 "기능적 활성 변이체"는 천연 서열("천연"은 야생형 세포에서 자연적으로 발생하는 서열로 이해됨) 이외의 모든 것을 의미하며, 예를 들어 TIF 또는 TIF의 뉴클레오티드 서열 또는 아미노산 서열로부터 유도되거나 관련된다. 본원에는 부모 서열에 대한 특정 서열 동일성을 갖는 임의의 (부모) TIF 또는 각각의 TIF 유전자(서열번호: 1-65 중 어느 하나, 특히 서열번호: 1, 12, 23, 34, 45 또는 56 중 임의의 것를 포함하거나 이로 구성되는 것과 같은)의 특정 기능적 변이체가 본원에 기술되어 있다.
특정 구현양태에 따르면, 기능적 변이체는 천연 서열로부터 유래하고 그것이 유래하는 천연 서열과 비교하여 거의 동일하고/하거나 심지어 개선된 숙주 세포에서 입증된 기능을 갖는 미리결정된 서열을 포함하거나 이로 이루어진다.
특정 구현양태에 따르면, 기능적 변이체는 자연-발생 모 분자의 이소폼 또는 오솔로그이며, 이 오솔로그는 자연-발생 모 분자를 포함하는 종 이외의 종, 예를 들어 포유동물 또는 진균 종에서 자연 발생한다.
일부 구현양태에서, 폴리뉴클레오티드 또는 핵산 분자의 기능적 변이체는, 예를 들어 핵산 안정성 개선, 숙주 세포에서의 번역 효능 증가, 발현된 절단 단백질의 수 감소, 발현된 단백질의 접힘 개선 또는 잘못된 접힘 방지, 발현된 생성물의 독성 감소, 발현된 생성물에 의해 유발된 세포 사멸 감소 또는 단백질 응집 증가 및/또는 감소를 위해 서열 최적화된다. 특정 구현양태에 따르면, 모 뉴클레오티드 서열의 기능적 변이체는 숙주 세포에서 발현되는 상기 모 뉴클레오티드 서열의 코돈-최적화된 변이체이며, 이는 숙주 세포의 세포 환경에서 개선된 발현을 위한 모 뉴클레오티드 서열의 하나 이상의 유전적 변형에 의해 수득할 수 있다.
본원에 기술된 TIF의 기능적 변이체는 특히 숙주 세포에서 공동-발현될 때 POI 생산을 개선하기 위해 천연 서열과 실질적으로 동일하거나 개선된 활성을 갖는 경우 기능적으로 활성인 것으로 간주된다.
TIF의 기능적 활성 변이체는 각각의 천연(야생형) TIF 유전자를 돌연변이시켜 이의 변이체를 생성하고, 이종 POI 코딩 유전자와 수반되어 또는 동시에 숙주 세포에서 변이체를 발현하고, POI를 생성하기 위해 숙주 세포 생산성을 향상시키기 위한 변이체의활성을 평가함으로써 제조될 수 있다.
TIF의 활성은, 예를 들어 시험관내 및 생체내 접근법을 사용하여 공지된 방법에 의해 기재된 바와 같이 결정될 수 있다.
번역 활성을 분석하는 데 적합한 방법은 문헌에 요약되어 있다(Dermit et al., Mol Biosyst. 2017 Nov 21;13(12):2477-24882017).
일부 추가의 적합한 방법은 문헌(Martin R, 1998; Protein synthesis: methods and protocols. Methods in Molecular Biology, Volume 77, Totowa, N.J.: Humana Press)에 기술된 바와 같이 능동적으로 번역된 단백질의 방사성 표지(방사성 표지된 아미노산의 혼입)를 사용한다.
번역 활성을 측정하는 특정 테스트는 하기 실시예 섹션에 설명되어 있다.
모 단백질의 기능적 변이체는, 예를 들어 N- 또는 C-말단에서 뿐만 아니라 하나 이상의 내부 도메인 내에서 하나 이상의 아미노산 잔기가 추가되거나 결실된 단백질을 포함한다. 특정 기능적 활성 변이체는 N-말단 및/또는 C-말단 단부에 추가 아미노산을 포함하여, 예를 들어 100개 미만의 아미노산, 구체적으로 75개 미만의 아미노산, 더 구체적으로 50개 미만의 아미노산, 더 구체적으로 25개 미만의 아미노산, 또는 10개 미만의 아미노산만큼 모 서열을 연장한다. 추가의 특정 기능적 활성 변이체는 융합 단백질일 수 있으며, 여기서 본 발명의 서열은 또 다른 폴리펩티드 또는 단백질의 추가 아미노산 잔기에 의해 연장된다.
특정 기능 변이체는 모 단백질 또는 핵산 분자의 단편이다.
폴리뉴클레오티드 또는 핵산 분자의 단편인 기능적 변이체는 적어도 20개 뉴클레오티드, 바람직하게는 적어도 100개 뉴클레오티드, 본원에 기술된 바와 같이 TIF를 코딩하는 전장 뉴클레오티드 서열까지의 범위일 수 있다. 폴리뉴클레오티드 또는 핵산 분자의 기능적으로 활성인 단편은 각각의 뉴클레오티드 서열의 적어도 50%, 바람직하게는 적어도 60, 70, 80, 85,90% 또는 95%를 포함할 수 있다.
폴리펩티드 또는 단백질의 단편인 기능적 변이체는 적어도 10개의 아미노산, 구체적으로 적어도 25개의 아미노산, 보다 구체적으로 적어도 50개의 아미노산, 보다 구체적으로 적어도 75개의 아미노산, 또는 적어도 100개의 연속 아미노산, 또는전장 단백질에 존재하는 아미노산의 총 수까지를 포함하거나 이로 구성될 수 있다.
본원에서 사용되는 용어 "내인성"은 각각의 내인성 유전자의 발현을 감소시키고/시키거나 내인성 단백질의 생성을 감소시키기 위한 이의 변형 전에 야생형(천연) 숙주 세포에 존재하는 분자 및 서열, 특히 내인성 유전자 또는 단백질을 포함하는 것을 의미한다. 특히, 자연에서 발견되는 바와 같이 특정 숙주 세포에서 발생하는(및 그로부터 수득될 수 있는) 내인성 핵산 분자(예를 들어, 유전자) 또는 단백질은 "내인성 숙주 세포" 또는 "숙주 세포에 내인성"인 것으로 이해된다. 더욱이, 핵산 또는 단백질을 "내인성으로 발현하는" 세포는 자연에서 발견되는 것과 동일한 특정 유형의 숙주가 하는 것처럼 그 핵산 또는 단백질을 발현한다. 더욱이, 숙주 세포는 핵산, 단백질 또는 다른 화합물을 "내인성 생산"하거나 "내인성으로 생산하는" 것은 자연에서 발견되는 것과 동일한 특정 유형의 숙주 세포가 하는 것과 같이 그 핵산, 단백질 또는 화합물을 생산한다.
따라서, 단백질 코딩 유전자가 불활성화되거나 결실된 숙주 세포의 녹아웃 돌연변이에서와 같이 내인성 단백질이 숙주 세포에 의해 더 이상 생산되지 않더라도, 단백질은 본원에서 여전히 "내인성"으로 지칭된다.
뉴클레오티드 서열, 발현 카세트와 같은 구성물, 아미노산 서열 또는 단백질과 관련하여 본원에서 사용되는 용어 "이종"은 주어진 숙주 세포에 대해 이질적인 화합물, 즉, 상기 숙주 세포에서 자연적으로 발견되지 않는 것과 같은 "외인성"이거나; 또는 주어진 숙주 세포에서 자연적으로 발견되는, 예를 들어 "내인성"이지만, 이종 구성물의 맥락에서 또는 이러한 이종 구성물에 통합된, 예를 들어 내인성 핵산과 융합되거나 결합된 이종 핵산을 사용하여, 따라서 구성물을 이종으로 만드는 화합물을 지칭한다. 내인성으로 발견되는 이종 뉴클레오티드 서열은 세포에서 비자연적으로, 예를 들어 예상보다 많거나 자연적으로 발견되는 것보다 많은 양으로 생산될 수도 있다. 이종 뉴클레오티드 서열, 또는 이종 뉴클레오티드 서열을 포함하는 핵산은 아마도 내인성 뉴클레오티드 서열과 서열이 상이하지만 내인성으로 발견되는 것과 동일한 단백질을 코딩한다. 구체적으로, 이종 뉴클레오티드 서열은 자연에서 숙주 세포와 동일한 관계로 발견되지 않는 것이다. 임의의 재조합 또는 인공 뉴클레오티드 서열은 이종인 것으로 이해된다. 이종 폴리뉴클레오티드의 예는 본원에 기술된 바와 같이, 예를 들어 하이브리드 프로모터를 얻기 위해 프로모터와 자연적으로 연관되지 않거나 코딩 서열에 작동가능하게 연결되지 않은 뉴클레오티드 서열이다. 결과적으로, 하이브리드 또는 키메릭 폴리뉴클레오티드가 수득될 수 있다. 이종 화합물의 추가 예는 전사 제어 요소, 예를 들어 프로모터에 작동가능하게 연결된 POI 코딩 폴리뉴클레오티드이며, 여기에는 내인성 자연-발생 POI 코딩 서열이 정상적으로 작동가능하게 연결되지 않는다.
본원에서 사용되는 "번역 개시 인자"라는 용어는 "TIF"로 약칭하여 번역 개시 인자 단백질 또는 번역 개시 인자를 코딩하는 폴리뉴클레오티드(핵산 분자)를 지칭할 것이다.
구체적으로, 본원에 기술된 TIF 중 어느 것도 관심 단백질(POI)이 아니다. 본원에 기술된 재조합 숙주 세포는 TIF(들)을 발현하고 추가로 또 다른 폴리뉴클레오티드(상기 TIF(들) 코딩 폴리뉴클레오티드와 상이)를 발현하기 위한 발현 시스템을 포함하고, 본원에서 관심 유전자(GOI)로 지칭되는 것으로 이해된다.
본원에서 사용되는 용어 "번역 개시 인자"는 특히 mRNP에 포함된 임의의 인자를 지칭한다.
특정 TIF 코딩 뉴클레오티드 서열은 자연-발생적이거나, 재조합 숙주 세포에서 이의 발현을 개선하기 위해 뉴클레오티드 서열 최적화 알고리즘 또는 코돈-최적화 기술에 의해 서열을 최적화하여, 하나 이상, 예를 들어 최대 50, 40, 30, 20 또는 10개의 점 돌연변이에 의해 부모(자연 발생)와 상이한 변이체 뉴클레오티드 서열과 같은 이의 기능적으로 활성 변이체이다.
특정 최적화 기술은, 예를 들어 뉴클레오티드 서열 최적화 알고리즘 또는 코돈-최적화 기술에 의해 숙주 세포에서 뉴클레오티드 서열의 발현을 개선하고 있다.
골든 게이트(Golden Gate) 클로닝 또는 골든 게이트 어셈블리를 위한 최적화와 같은 특정 최적화 기술이 클로닝을 개선하고 있다.
특정 최적화된 뉴클레오티드 서열은 사용된 제한 효소(예를 들어, BsaI 및 BpiI)의 인식 부위의 존재를 피하기 위해, 예를 들어 "침묵" 돌연변이를 포함한다.
본원에 기재된 최적화된 뉴클레오티드 서열은 전형적으로 하나 이상, 예를 들어 코딩된 아미노산 서열에서 수개의 점 돌연변이, 예를 들어 최대 10, 9, 8, 7, 6, 5, 4 또는 3개의 점 돌연변이를 허용한다.
진핵 번역 개시 인자 4E로도 알려진 "eIF4E"는 폐쇄 루프 인자이자 eIF4F 캡 -결합 복합체의 일부이자 mRNP의 일부인 폐쇄 루프 mRNA의 형성에 관여하는 TIF이다. 이는 서열번호: 1-11 중 어느 하나 또는 다른 진핵생물 종의 오르토로그를 특징으로 한다. eIF4E는 eIF4E 코딩 뉴클레오티드 서열에 의해 코딩되며, 이는 자연- 발생 eIF4E 유전자 또는 자연 발생 eIF4E와 특정 서열 동일성을 갖는 eIF4E를 코딩하는 각각의 기능적 변이체일 수 있다. 예시적인 eIF4E 코딩 뉴클레오티드 서열은 서열번호: 1을 코딩하는 코마가타엘라 파피(Komagataella phaffii)의 서열번호: 66 또는 이의 기능적으로 활성인 변이체에 의해 식별된다. 서열번호: 67은 골든 게이트 최적화에 의해 생성된 최적화된 코딩 뉴클레오티드 서열의 예를 식별하고, 서열번호: 66과 3개의 뉴클레오티드 치환: A276G, T354C, G492A에 의해 다르다.
진핵 번역 개시 인자 4A로도 알려진 eIF4A는 폐쇄 루프 인자이자 eIF4F 캡-결합 복합체의 일부이자 mRNP의 일부인 폐쇄 루프 mRNA의 형성에 관여하는 TIF이다. 이는 서열번호: 12-33 중 어느 하나 또는 다른 진핵 종의 오르토로그를 특징으로 한다. 용어 "eIF4A"는 TIF2a 및 Tif2b를 포함하며, TIF2b는 5' 단부에서 TIF2a의 249개 뉴클레오티드(83개 아미노산에 해당) 더 긴 변이체이다. 두 서열 모두 P. 파스토리스(P. Pastoris) 게놈에서 직접 증폭되었으며 대체 시작 위치를 갖는 eIF4A의 두 가지 변이체를 제시한다.
eIF4A는 자연-발생 eIF4A 유전자 또는 자연 발생 eIF4A에 특정 서열 동일성을 갖는 eIF4A를 코딩하는 각각의 기능적 변이체일 수 있는 eIF4A 코딩 뉴클레오티드 서열에 의해 코딩된다. 예시적인 eIF4A 코딩 뉴클레오티드 서열은 각각 서열번호: 12 및 서열번호: 23을 코딩하는 코마가타엘라 파피(Komagataella phaffii)의 서열번호: 68 또는 서열번호: 70 또는 이의 기능적 활성 변이체에 의해 식별된다. 서열번호: 69는 골든 게이트 최적화에 의해 생산된 최적화된 코딩 뉴클레오티드 서열의 예를 식별하고 서열번호: 68과 하나의 뉴클레오티드 치환: C45A에 의해 다르다. 서열번호: 71은 골든 게이트 최적화에 의해 생성된 최적화된 코딩 뉴클레오티드 서열의 예를 식별하고, 서열번호: 70과 하나의 뉴클레오티드 치환: C294A에 의해 다르다.
진핵 번역 개시 인자 4G로도 알려진 eIF4G는 폐쇄 루프 인자이자 eIF4F 캡-결합 복합체의 일부이자 mRNP의 일부인 폐쇄 루프 mRNA의 형성에 관여하는 TIF이다. 이는 서열번호: 34-44 중 어느 하나 또는 다른 진핵 종의 오르토로그를 특징으로 한다. eIF4G는 자연-발생 eIF4G 유전자 또는 자연 발생 eIF4G에 특정 서열 동일성을 갖는 eIF4G를 코딩하는 각각의 기능적 변이체일 수 있는 eIF4G 코딩 뉴클레오티드 서열에 의해 코딩된다. 예시적인 eIF4G 코딩 뉴클레오티드 서열은 서열번호: 34을 코딩하는 코마가타엘라 파피(Komagataella phaffii)의 서열번호: 72 또는 이의 기능적 활성 변이체에 의해 식별된다. 서열번호: 73은 골든 게이트 최적화에 의해 생산된 최적화된 코딩 뉴클레오티드 서열의 예를 식별하고 서열번호: 72와 4개의 뉴클레오티드 치환: A564G, A1923G, G2037C, T2100C에 의해 다르다.
폴리아데닐레이트-결합 단백질 1로도 알려진 PAB1은 폐쇄 루프 mRNA의 형성에 관여하는 TIF이고 mRNP의 일부이다. 이는 서열번호: 45-55 중 어느 하나 또는 다른 진핵 종의 오르토로그를 특징으로 한다. PAB1은 자연-발생 PAB1 유전자 또는 자연 발생 PAB1과 특정 서열 동일성을 갖는 PAB1을 코딩하는 각각의 기능적 변이체일 수 있는 PAB1 코딩 뉴클레오티드 서열에 의해 코딩된다. 예시적인 PAB1 코딩 뉴클레오티드 서열은 서열번호: 45를 코딩하는 코마가타엘라 파피(Komagataella phaffii)의 서열번호: 74, 또는 이의 기능적으로 활성인 변이체에 의해 식별된다. 서열번호: 75는 골든 게이트 최적화에 의해 생산된 최적화된 코딩 뉴클레오티드 서열의 예를 식별하고, 3개의 뉴클레오티드 치환 C150A, T384C, C707T에 의해 서열번호: 74와 다르다.
RNase L 억제제(RLI)로도 알려진 ATP-결합 카세트 서브패밀리 E 구성원 1(ABCE1)로도 알려진 RLI1은 인간에서 ABCE1 유전자에 의해 코딩되는 ATP-결합 카세트(ABC) 단백질이다. 이것은 번역 개시 및 리보솜 생물발생 뿐만 아니라 번역 종결 및 mRNP의 일부에서 이중 역할을 하는 TIF이다. 이는 서열번호: 56-65 중 어느 하나 또는 다른 진핵 종의 오르토로그를 특징으로 한다. RLI1은 자연-발생 RLI1 유전자 또는 자연 발생 RLI1과 특정 서열 동일성을 갖는 RLI1을 코딩하는 각각의 기능적 변이체일 수 있는 RLI1 코딩 뉴클레오티드 서열에 의해 코딩된다. 예시적인 RLI1 코딩 뉴클레오티드 서열은 서열번호: 56을 코딩하는 코마가타엘라 파피(Komagataella phaffii)의 서열번호: 76, 또는 이의 기능적으로 활성인 변이체에 의해 식별된다.
본원에 제공되고 실시예 섹션에서 사용된 바와 같은 서열번호: 1, 12, 23, 34, 45 및 56으로 식별된 아미노산 서열을 포함하거나 이로 이루어진 TIF(각각의 (최적화된) 뉴클레오티드 서열 포함)는 K. 파피(K. phaffii) 기원이다. 본원에 제공된 바와 같은 서열번호: 2, 13, 24, 35, 46 및 57에 의해 식별된 아미노산 서열을 포함하거나 이로 이루어진 TIF는 K. 파스토리스(K. pastoris) 기원이다. 다른 효모 숙주 세포, 특히 본원에 기술된 바와 같이 사용될 수 있는 도 1에 제공된 것과 같은 메틸로트로픽 효모에 존재하는 상동성 서열이 있음이 잘 이해된다. 예를 들어, 피치아 파스토리스의 효모는 각각의 상동성 서열을 포함한다. 피치아 파스토리스코마가타엘라(Komagataella)속으로 재분류되어 K. 파스토리스(K. pastoris), K. 파피(K. phaffii)K. 슈도파스토리스(K. pseudopastoris)의 3개의 종으로 나뉜다.
예를 들어, 본원에 기재된 특정 서열 동일성을 갖는 각각의 TIF의 임의의 상동성 서열, 특히 K. 파피, K. 파스토리스, 또는 K. 슈도파스토리스와 같은 특히 각각의 P. 파스토리스 TIF의 오르토로그인 이러한 임의의 단백질이 사용될 수 있다.
본원에서 사용되는 용어 "mRNP"는 결합된 단백질을 갖는 mRNA로 이루어진 입자 또는 복합체로 이해되는 메신저 RNP(메신저 리보핵단백질)를 지칭할 것이다. mRNA는 세포질에서 합성, 스플라이싱, 수출 및 번역되는 동안 다양한 단백질에 의해 결합된다.
본원에서 사용되는 용어 "작동가능하게 연결된"은 하나 이상의 뉴클레오티드 서열의 기능이 상기 핵산 분자에 존재하는 적어도 하나의 다른 뉴클레오티드 서열에 의해 영향을 받는 방식으로 단일 핵산 분자, 예를 들어 벡터 또는 발현 카세트 상의 뉴클레오티드 서열의 연관을 의미한다. 작동가능하게 연결함으로써, 핵산 서열은 동일한 핵산 분자 상의 다른 핵산 서열과 기능적 관계로 배치된다. 예를 들어, 프로모터는 재조합 유전자의 코딩 서열의 발현에 영향을 미칠 수 있을 때 재조합 유전자의 코딩 서열과 작동가능하게 연결된다. 추가의 예로서, 신호 펩티드를 코딩하는 핵산은 성숙한 단백질의 프리폼 또는 성숙한 단백질과 같은 분비된 형태의 단백질을 발현할 수 있을 때 POI를 코딩하는 핵산 서열에 작동가능하게 연결된다. 특히, 서로 작동가능하게 연결된 이러한 핵산은 즉시 연결될 수 있는데 즉, 신호 펩티드를 코딩하는 핵산과 POI를 코딩하는 핵산 서열 사이에 추가 요소 또는 핵산 서열 없이 연결될 수 있다. 대안적으로, 예를 들어 프로모터와 GOI 사이에 위치한 클로닝 부위와 같은 적합한 연결 서열이 사용될 수 있다.
프로모터가 코딩 서열의 전사를 제어한다면, "프로모터" 서열은 전형적으로 코딩 서열에 작동가능하게 연결된 것으로 이해된다. 프로모터 서열이 코딩 서열과 자연적으로 연관되지 않은 경우, 이의 전사는 천연(야생형) 세포에서 프로모터에 의해 제어되지 않거나 서열이 상이한 연속 서열과 재조합된다.
POI 코딩 DNA와 같은 단백질 코딩 폴리뉴클레오티드(DNA)의 발현을 개시, 조절, 또는 그렇지 않으면 매개 또는 제어하는 프로모터가 본원에 기술되어 있다. 프로모터 DNA와 코딩 DNA는 동일한 유전자 또는 다른 유전자에서 유래할 수 있으며 동일하거나 다른 유기체에서 유래할 수 있다.
프로모터의 강도는 구체적으로 전사 강도를 의미하며, 이는 높은 빈도 또는 낮은 빈도로 해당 프로모터에서 발생하는 전사 개시 효율로 표시된다. 전사 강도가 높을수록 해당 프로모터에서 전사가 더 자주 발생한다. 프로모터의 강도는 프로모터의 전형적인 특징인데, 이는 주어진 mRNA 서열이 얼마나 자주 전사되는지를 결정하여 일부 유전자에 다른 유전자보다 효과적으로 더 높은 전사 우선 순위를 부여하여 더 높은 전사물 농도를 유도하기 때문이다. 예를 들어, 대량으로 필요한 단백질을 코딩하는 유전자는 일반적으로 상대적으로 강력한 프로모터를 필요로 한다. RNA 중합효소는 한 번에 하나의 전사 작업만 수행할 수 있으므로 효율적이기 위해서는 작업의 우선순위를 정해야 한다. 프로모터 강도의 차이는 이러한 우선 순위를 허용하도록 선택된다.
프로모터 강도는 또한 일반적으로 전사율로 이해되는 전사 빈도를 의미하며, 예를 들어 RT-PCR 또는 노던 블로팅과 같은 적합한 검정에서 전사체의 양에 의해 결정된다. 예를 들어, 본원에 기술된 프로모터의 전사 강도는 P. 파스토리스인 숙주 세포에서 결정되고 P. 파스토리스의 천연 pGAP 프로모터와 비교된다.
관심 유전자를 발현하는 프로모터의 강도는 일반적으로 발현 강도 또는 높은 발현 수준/율을 지원하는 능력으로 이해된다. 예를 들어, 본 발명의 프로모터의 발현 및/또는 전사 강도는 P. 파스토리스인 숙주 세포에서 결정되고, P. 파스토리스의 천연 pGAP 프로모터와 비교되고, 예를 들어 완전히 유도되거나 억제되었을 때 측정된다.
특정 측면에 따르면, GOIEC 프로모터는 TIFEC 프로모터보다 더 강하다. 바람직하게는, 전사율 또는 강도가 POI를 생산하기 위한 재조합 목적을 위한 숙주 세포로 선택된 숙주 세포(예를 들어, 진핵)에서 결정된 바와 같이 천연 pGAP 프로모터와 비교하여 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100% 또는 그 이상, 110%, 120%, 130%, 140%, 150%, 160%, 170%, 180%, 190% 또는 200% 또는 그 이상 중 적어도 어느 하나인 프로모터가 사용된다. 예를 들어, 발현율은 eGFP와 같은 리포터 유전자의 발현량에 의해 결정될 수 있다.
천연 pGAP 프로모터는 일반적으로 대부분의 살아있는 유기체에 존재하는 구성적 프로모터인 글리세르알데하이드-3-포스페이트 탈수소효소(GAPDH)를 코딩하는 gap 유전자의 발현을 개시한다. GAPDH(EC 1.2.1.12)는 해당작용 및 포도당신생합성의 핵심 효소로 이화 및 단백동화 탄수화물 대사에서 중요한 역할을 한다.
참조 프로모터와 비교한 비교 전사 강도는, 예를 들어 전사체의 양을 측정하는 것과 같은 표준 방법에 의해 결정될 수 있으며, 재조합 세포에서 각각의 유전자 발현 생성물의 양을 측정하는 것과 같이 세포 배양에서 마이크로어레이를 사용한다. 특히, 전사율은 마이크로어레이, 노던 블롯 또는 정량적 실시간 PCR(qRT-PCR) 또는 RNA 시퀀싱(RNA-seq)에서의 전사 강도에 의해 결정될 수 있다.
본원에 기술된 바와 같이, 이종성 프로모터는 임의의 하나 이상 또는 모든 TIF를 발현하기 위해 각각의 TIFEC 및/또는 GOI를 발현하기 위해 GOIEC에서 사용될 수 있다. 이종성 프로모터는 발현될 폴리뉴클레오티드에 대해 이종성일 수 있고/있거나 인공 프로모터, 또는 야생형 숙주 세포로부터 기원하지만 이종성 발현 카세트 내의 숙주 세포 게놈에 위치하거나 야생형 숙주 세포에서 자연적으로 발생하지 않는 위치에 위치하는 프로모터일 수 있다.
본원에 기재된 바와 같이, 특정 구현양태에 따르면, 임의의 TIF 발현 카세트 또는 GOIEC는 구성적 프로모터, 예컨대 본원에 추가로 기재된 임의의 프로모터를 포함하고 사용할 수 있다.
구성적 프로모터의 특정 예는 예를 들어 pGAP(예를 들어, 서열번호: 100, 서열번호: 101) 및 이의 기능적 변이체, pCS1(예를 들어, 서열번호: 102 또는 WO2014139608에 공개된 것과 같은 이의 기능적 변이체)와 같은 임의의 구성적 프로모터, pMDH3(예를 들어, 서열번호: 103), pPOR1(예를 들어, 서열번호: 104), pRPP1B, pPDC1, pGPM1, pFBA1-1, 또는 전술한 것들 중 임의의 기능적 변이체를 포함한다.
유도성 또는 억제성 프로모터의 특정 예는, 예를 들어 천연 pAOX1 또는 pAOX2 및 이의 기능적 변이체, WO2013050551에 공개된 pG1-pG8 및 이의 단편과 같은 임의의 조절 프로모터; WO2017021541 A1에 공개된 pG1 및 pG1-x와 같은 임의의 조절 프로모터를 포함한다.
특히, 조절가능한 프로모터, 예컨대 탈억제성 또는 억제성(본원에서는 (탈)억제성으로 지칭) 또는 유도성 프로모터, 예를 들어 천연 메탄올-유도성 프로모터 pAOX1(서열번호: 81) 또는 pAOX2(서열번호: 82), 또는 P. 파스토리스의 임의의 천연 메탄올-유도성 프로모터(예를 들어, 서열번호: 83-96, published by Gasser, Steiger, & Mattanovich, Microb Cell Fact. 2015, 14: 196), 또는 임의의 다른 탄소 공급원 조절가능한 프로모터, 예를 들어 pG1-pG8(pG1: 서열번호: 97, pG3: 서열번호: 105, pG4: 서열번호: 106, pG5: 서열번호: 107, pG7: 서열번호: 108, pG8: 서열번호: 109, 및 전술한 임의의 것의 단편, 예를 들어 pG1의 단편, pG1a-pG1f: 서열번호: 110-115), 및 pG1-x, 특히 pG1-3(예를 들어, 서열번호: 98, 예를 들어 pG1-D1240으로 지칭), 또는 pG1-4(예를 들어, 서열번호: 99, 예를 들어, pG1-D1427로 지칭), WO2013050551 및 WO2017021541에 공개, 또는 길이가 적어도 300, 400 또는 500 bp(특히 3'-단부 포함)인 상기 중 임의의 것의 기능적 변이체, 또는 상기 중 임의의 것의 기능적 변이체가 사용될 수 있다.
구체적으로, 본원에 기술된 프로모터의 기능적 변이체는 전장 또는 일부에 걸쳐 적어도 300, 400 또는 500 bp의 길이를 갖는 프로모터 서열의 3'-단부에서 그것이 유래된 프로모터에 대해 80%, 85%, 90%, 95% 또는 100% 서열 동일성 중 적어도 어느 하나를 포함하고, 프로모터 활성이 그것이 유래된 프로모터와 비교하여 개선될 수 있음에도 불구하고, 특히 거의 동일한 프로모터 활성(예를 들어, +/- 50%, 40%, 30%, 20% 또는 10% 중 어느 하나)으로 발현될 폴리뉴클레오티드의 발현을 작동적으로 제어하는 기능을 한다. pG1-3 또는 pG1-4의 특정 기능적 프로모터 변이체는 도 1에 나타낸 바와 같이 적어도 2개의 주요 조절 영역, 및/또는 적어도 2개의 코어 조절 영역, 및/또는 적어도 2개의 T 모티프를 포함하는 것들이다.
적합한 프로모터 서열의 추가 예는 문헌(Prielhofer et al., BMC Syst Biol. 2017. 11(1):123 및 Mattanovich et al., Methods Mol. Biol.(2012) 824:329-58)에 기재되어 있으며, 해당 효소, 예를 들어 트리오세포스페이트 이성질화효소(TPI), 포스포글리세레이트 키나제(PGK), 글리세르알데히드-3-포스페이트 탈수소효소(GAPDH 또는 GAP) 및 이의 변이체, 락타제(LAC) 및 갈락토시다제(GAL), P. 파스토리스 글루코스-6-포스페이트 이성질화효소 프로모터(PPGI), 3-포스포글리세레이트 키나제 프로모터(pPGK), 글리세롤 알데하이드 포스페이트 탈수소효소 프로모터(pGAP), 번역 신장 인자 프로모터(PTEF), 및 P. 파스토리스 에놀라제 1 (pEN01)의 프로모터, 트리오세 포스페이트 이성질화효소(pTPI), 리보솜 서브유닛 단백질(pRPS2, pRPS7, pRPS31, pRPL1), 알코올 옥시다제 프로모터(pAOX1, pAOX2) 또는 변형된 특징을 가진 이의 변이체, 포름알데히드 탈수소효소 프로모터(pFLD), 이소시트레이트 리아제 프로모터(pICL), 알파-케토이소카프로에이트 데카복실라아제 프로모터(pTHI), 열충격 단백질 계열 구성원의 프로모터(pSSA1, pHSP90, pKAR2), 6-포스포글루코네이트 탈수소효소(pGND1), 포스포글리세레이트 뮤타제(pGPM1), 트랜스에톨라제(pTKL1), 포스파티딜이노시톨 신타아제(pPIS1), 페로-02-옥시도리덕타아제(pFET3), 고친화성 철 투과효소(pFTR1), 억제성 알칼리성 포스파타아제(pPH08), N-미리스토일 트랜스퍼라제(pNMT1), 페로몬 반응 전사 인자(pMCM1), 유비퀴틴(pUBI4), 단일-가닥 DNA 엔도뉴클레아제(pRAD2), 미토콘드리아 내막의 주요 ADP/ATP 운반체의 프로모터(pPET9)(WO2008/128701) 및 포메이트 탈수소효소(FMD) 프로모터를 포함한다.
적합한 프로모터의 추가 예는 S. 세레비지애 에놀라제(ENO1), S. 세레비지애 갈락토키나제(GAL1), S. 세레비지애 알코올 탈수소효소 및 S. 세레비지애 글리세르알데하이드-3-포스페이트 탈수소효소(ADH1, ADH2, GAP), S. 세레비지애 트리오세 포스페이트 이성질화효소(TPI), S. 세레비지애 메탈로티오네인(CUP1) 및 S. 세레비지애 3-포스포글리세레이트 키나제(PGK), 및 말타아제 유전자 프로모터(MAL)를 포함한다.
본원에서 사용되는 용어 "뉴클레오티드 서열" 또는 "핵산 서열"은 DNA 또는 RNA를 의미한다. "핵산 서열" 또는 "폴리뉴클레오티드 서열" 또는 간단히 "폴리뉴클레오티드"는 5'에서 3' 단부으로 판독되는 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 염기의 단일 또는 이중-가닥 중합체를 지칭한다. 여기에는 발현 카세트, 자가-복제 플라스미드, DNA 또는 RNA의 감염성 중합체, 비-기능성 DNA 또는 RNA가 포함된다.
본원에서 사용되는 용어 "관심 단백질(POI)"은 숙주 세포에서 재조합 기술에 의해 생산되는 폴리펩티드 또는 단백질을 의미한다. 보다 구체적으로, 단백질은 숙주 세포에서 자연적으로 발생하지 않는 폴리펩티드, 즉 이종 단백질일 수 있거나, 그렇지 않으면 숙주 세포에 자연적일 수 있고, 즉 숙주 세포에 대한 상동 단백질일 수 있지만, 예를 들어, POI를 코딩하는 핵산 서열을 함유하는 자가-복제 벡터로 형질전환 또는 형질주입에 의해, 또는 POI를 코딩하는 핵산 서열의 하나 이상의 카피를 재조합 기술에 의해 숙주 세포의 게놈으로 통합하거나, POI를 코딩하는 유전자, 예를 들어 프로모터 서열의 발현을 제어하는 하나 이상의 조절 서열의 재조합 변형에 의해 생성된다. 일부 경우에, 본원에서 사용되는 용어 POI는 또한 재조합적으로 발현된 단백질에 의해 매개되는 숙주 세포에 의한 임의의 대사 생성물을 지칭한다.
모 뉴클레오티드 또는 아미노산 서열과 비교하여 변이체, 상동체 또는 오르토로그의 "서열 동일성"이라는 용어는 2개 이상의 서열의 동일성 정도를 나타낸다. 2개 이상의 아미노산 서열은 상응하는 위치에서 동일하거나 보존된 아미노산 잔기를 어느 정도, 최대 100% 가질 수 있다. 2개 이상의 뉴클레오티드 서열은 상응하는 위치에서 어느 정도, 최대 100%까지 동일하거나 보존된 염기쌍을 가질 수 있다.
서열 유사성 검색은 초과(예를 들어, 50% 이상) 서열 동일성을 가진 상동체를 식별하기 위한 효과적이고 신뢰할 수 있는 전략이다. 자주 사용되는 서열 유사성 검색 도구는, 예를 들어 BLAST, FASTA 및 HMMER이다.
서열 유사성 검색은 과도한 유사성 및 공통 조상을 반영하는 통계적으로 유의미한 유사성을 감지하여 이러한 상동 단백질 또는 유전자를 식별할 수 있다. 상동체는 본원에서 상이한 유기체, 예를 들어 상이한 상이한 유기체 또는 종에서의 이러한 단백질의 변이체에서 동일한 단백질로 이해되는 오르토로그를 포함할 수 있다.
본원에 기술된 아미노산 서열, 상동체 및 오르토로그에 대한 "퍼센트(%) 아미노산 서열 동일성"은 서열을 정렬하고, 필요한 경우 갭을 도입하여 최대 퍼센트 서열 동일성을 달성하고 임의의 보존적 치환을 서열 동일성의 일부로 고려하지 않은 후, 특정 폴리펩티드 서열에서 아미노산 잔기와 동일한 후보 서열에서 아미노산 잔기의 백분율로 정의된다. 당업자는 비교되는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다.
본원에 기재된 목적을 위해, 2개의 아미노산 서열 사이의 서열 동일성은 하기 예시적인 매개변수와 함께 NCBI BLAST 프로그램 버전 BLASTP 2.8.1을 사용하여 결정된다: 프로그램: blastp, 단어 크기: 6, 예상 값: 10, 히트리스트 크기: 100, 갭코스트: 11.1, 매트릭스: BLOSUM62, 필터 스트링: F, 구성 조정: 조건부 구성 점수 매트릭스 조정.
전체 길이에 따른 2개의 아미노산 서열의 쌍별 단백질 서열 정렬을 위해 EMBOSS Needle 웹서버(https://www.ebi.ac.uk/Tools/psa/emboss_needle/)를 기본 설정(Matrix: EBLOSUM62; Gap open:10; Gap extend: 0.5; End Gap Penalty: false; End Gap Open: 10; End Gap Extend: 0.5)으로 사용했다. EMBOSS Needle은 니들맨-분쉬(Needleman-Wunsch) 정렬 알고리즘을 사용하여 두 입력 서열의 최적 정렬(갭 포함)을 찾고 최적의 전체 서열 정렬을 파일에 기록한다.
예를 들어, 프로모터 또는 유전자의 뉴클레오티드 서열에 대한 "퍼센트(%) 동일성"은 서열을 정렬한 후, 필요한 경우 최대 퍼센트 서열 동일성을 달성하기 위해 갭을 도입하고, 서열 동일성의 일부로서 임의의 보존적 치환을 고려하지 않고DNA 서열에서 뉴클레오티드와 동일한 후보 DNA 서열에서 뉴클레오티드 백분율로 정의된다. 뉴클레오티드 서열 퍼센트 동일성을 결정하기 위한 목적을 위한 정렬은, 예를 들어 공개적으로 이용가능한 컴퓨터 소프트웨어를 사용하여 당업계의 기술 범위 내에서 다양한 방식으로 달성될 수 있다. 당업자는 비교되는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다.
본원에 기술된 목적을 위해(다르게 나타내지 않는 한), 2개의 아미노산 서열 사이의 서열 동일성은 NCBI BLAST 프로그램 버전 BLASTN 2.8.1을 사용하여 다음의 예시적인 매개변수와 함께 결정된다: 프로그램: blastn, 단어 크기: 11, 예상 임계값: 10, 히트리스트 크기: 100, 갭 코스트: 5.2, 일치/불일치 점수: 2,-3, 필터 스트링: 낮은 복잡성 영역, 조회 표 전용으로 표시.
POI와 관련하여 본원에서 사용되는 용어 "분리된" 또는 "분리"는 POI가 자연적으로 연관될 환경, 특히 세포 배양 상청액으로부터 충분히 분리되어 "정제된" 또는 "실질적으로 순수한" 형태로 존재하는 그러한 화합물을 지칭할 것이다. 그러나 "분리된"은 반드시 다른 화합물 또는 물질을 갖는 인공 또는 합성 혼합물의 배제 또는 기본 활성을 방해하지 않고, 예를 들어 불완전한 정제로 인해 존재할 수 있는 불순물의 존재의 배제를 의미하지는 않는다. 분리된 화합물은 이의 제제를 생산하기 위해 추가로 제형화될 수 있고, 여전히 실용적인 목적을 위해 분리될 수 있다 - 예를 들어, POI는 진단 또는 치료에 사용될 때 약제학적으로 허용되는 담체 또는 부형제와 혼합될 수 있다.
본원에 사용된 용어 "정제된"은 적어도 50%(mol/mol), 바람직하게는 적어도 60%, 70%, 80%, 90% 또는 95%의 화합물(예를 들어, POI)을 포함하는 제제를 의미할 것이다. 순도는 화합물에 대해 적합한 방법(예를 들어, 크로마토그래피 방법, 폴리아크릴아미드 겔 전기영동, HPLC 분석 등)에 의해 측정된다. 불순물을 감소시키기 위해 세포 배양 상청액을 정제함으로써 본원에 기술된 바와 같이 분리되고 정제된 POI를 수득할 수 있다.
재조합 폴리펩티드 또는 단백질 생성물을 얻기 위한 분리 및 정제 방법으로서, 염석 및 용매 침전과 같은 용해도 차이를 이용하는 방법, 한외여과 및 겔 전기영동과 같은 분자량 차이를 이용하는 방법, 이온-교환 크로마토그래피와 같은 전하를 이용하는 방법, 친화성 크로마토그래피와 같이 특이적 친화성을 이용하는 방법, 역상 고성능 액체 크로마토그래피와 같이 소수성 차이를 이용하는 방법, 및 등전점 포커싱과 같이 등전점의 차이를 이용하는 방법을 사용할 수 있다.
다음과 같은 표준 방법이 선호된다: 정밀여과 또는 접선 흐름 필터(Tangential Flow Filter, TFF) 또는 원심분리에 의한 세포(파편) 분리 및 세척, 침전 또는 열처리에 의한 POI 정제, 효소 다이제스트에 의한 POI 활성화, 이온 교환(IEX), 소수성 상호작용 크로마토그래피(HIC), 친화성 크로마토그래피, 크기 배제(SEC) 또는 HPLC 크로마토그래피과 같은 크로마토그래피에 의한 POI 정제, 한외여과 단계 같은 POI 침전, 농축 및 세척.
고도로 정제된 생성물은 본질적으로 오염 단백질이 없고 바람직하게는 순도가 적어도 90%, 보다 바람직하게는 적어도 95%, 또는 심지어 적어도 98%, 최대 100%이다. 정제된 생성물은 세포 배양 상청액 또는 세포 파편으로부터 정제하여 얻을 수 있다.
분리 및 정제된 POI는 웨스턴 블롯, HPLC, 활성 검정 또는 ELISA와 같은 기존 방법으로 식별할 수 있다.
본원에서 사용된 "재조합"이라는 용어는 "유전 공학에 의해 제조되거나 그 결과"를 의미한다. "재조합 세포" 또는 "재조합 숙주 세포"는 본원에서 상기 세포에 자연적이지 않은 핵산 서열을 포함하도록 유전자 조작되거나 변형된 세포 또는 숙주 세포로 이해된다. 재조합 숙주는 하나 이상의 뉴클레오티드 또는 뉴클레오티드 서열을 결실 및/또는 불활성화하도록 조작될 수 있으며, 특히 숙주에 대해 외래인 뉴클레오티드 서열을 사용하는 재조합 핵산 서열을 함유하는 발현 벡터 또는 클로닝 벡터를 구체적으로 포함할 수 있다. 재조합 단백질은 각각의 재조합 핵산을 숙주에서 발현시켜 생산된다. 본원에서 사용되는 POI와 관련하여 용어 "재조합"은 재조합 수단에 의해 제조, 발현, 생성 또는 분리된 POI, 예를 들어 POI를 발현하도록 형질전환 또는 형질주입된 숙주 세포로부터 분리된 POI를 포함한다. 본 발명에 따르면 종래의 분자 생물학, 미생물학 및 당업계의 기술 내에서 재조합 DNA 기술이 사용될 수 있다. 이러한 기술은 문헌에 충분히 설명되어 있다(Maniatis, Fritsch & Sambrook, "Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, (1982)).
특정 재조합 숙주 세포는 유전 공학을 사용하여, 즉 인간 개입에 의해 조작된 숙주 세포로 이해되는 "조작된" 숙주 세포이다. 숙주 세포가 주어진 유전자 또는 각각의 단백질을 발현, 공동-발현 또는 과발현하도록 조작될 때, 숙주 세포는 숙주 세포가 그러한 유전자 및 단백질을 조작 전 동일한 조건 하에서 숙주 세포, 또는 상기 유전자 또는 단백질이 발현, 공동-발현 또는 과발현되도록 조작되지 않은 숙주 세포와 비교하여 각각 더 높은 정도로 발현하는 능력을 갖도록 조작된다. 본원에 기술된 바와 같이, 관심 단백질(POI)의 수율은 동일한 배양 조건 하에서 공동-발현되거나 과발현되는 TIF(들)을 코딩하는 폴리뉴클레오티드가 없거나 TIF(들)를 코딩하는 폴리뉴클레오티드를 공동-발현하거나 과발현하도록 조작되지 않는 동일한 POI를 발현하는 동일한 세포와 비교할 때 본원에 기술된 TIF(들)를 공동-발현 또는 과발현함으로써 증가될 수 있다.
놀랍게도, eIF3의 서브유닛이 아닌 mRNP의 일부인 TIF의 과발현이 여러 재조합 POI의 생산 및 분비를 증가시키는 것으로 밝혀졌다.
본원에 기재된 특정 실시예에 따르면, TIF 과발현은 조작된 세포의 번역 능력을 향상시켰고 또한 더 높은 수준의 POI 전사체 및 내인성 전사체와 상관관계가 있었다.
POI 생산 수율이 eIF4A, eIF4G, eIF4E, PAB1 및 RLI1과 같은 단일 TIF 뿐만 아니라 다양한 배양 방식(스크리닝, 유가 배양 및 연속 배양)에서 이들의 조합의 과발현에 의해 증가되었다는 것은 훨씬 더 놀라운 일이었다.
전술한 설명은 하기 실시예를 참조하여 더욱 완전히 이해될 것이다. 그러나 이러한 예는 본 발명의 하나 이상의 구현양태를 실행하는 방법을 단지 대표할 뿐이며 본 발명의 범위를 제한하는 것으로 해석되어서는 안 된다.
실시예
실시예 1: 번역 인자(TIF) 과발현 균주의 구성
a) 숙주 균주 및 발현 벡터:
P. 파스토리스 균주 CBS7435 또는 CBS2612(CBS-KNAW Fungal Biodiversity Centre, Centraalbureau voor Schimmelcultures, Utrecht, The Netherlands)를 배경 균주로 사용했다. 번역 인자 과발현의 영향을 평가하기 위해, 다양한 분비 모델 단백질을 리포터로 사용했다. 이를 위해 CBS2612_PG1-3_vHH#4(WO2020/144313A1에 기재)를 발현에 사용하였다. 추가 숙주 균주를 생성하기 위해, WO2020144313A1에 기재된 바와 같이 PG1-3_HSA에 대한 발현 카세트를 CBS2612로 형질전환시키고 PG1-3_vHH 발현 카세트를 CBS7435로 형질전환시켰다. MutS PAOX1-vHH(Zavec et al. 2020, Biotechnol Bioeng. 117(5):1394-1405)를 사용하여 메탄올 조건에서 효과를 평가했다.
b) TIF 과발현 벡터의 생성
각각의 발현 카세트를 숙주 균주로 상동 재조합하여 표적을 과발현시켰다. 이를 위한 플라스미드는 두 가지 다른 클로닝 전략을 사용하여 생성되었다. 선택한 표적 번역 인자 표 2와 7에 제시되어 있다.
pPuzzle 기반 발현에 의한 P. 파스토리스 번역 인자 과발현 균주의 구성 및 선택
AOX 종결자 서열(천연 AOX1 종결자 유전자좌에 통합용), 대장균(pUC19)의 복제 기점, 대장균 및 효모에서 선택하기 위한 항생제 저항성 카세트(카나마이신 및 G418에 대한 저항성을 부여하는 kanMX), GAP 프로모터, 다중 클로닝 부위(MCS) 및 S. 세레비지애 CYC1전사 종결자로 이루어진 관심 유전자(GOI)용 발현 카세트로 이루어진 WO2008/128701A2에 기술된 pPuzzle_ZeoR 벡터 백본의 유도체인 pPM2aK21 플라스미드를 사용하였다. 선택된 과발현 유전자는 표 8에 제시된 프라이머를 사용하여 시작부터 정지 코돈까지 PCR(Q5® 고-충실도 DNA 중합효소, New England Biolabs)로 증폭되었다. 서열은 2개의 제한 효소 SbfISfiI를 갖는 pPM2a 발현 벡터의 MCS로 클로닝되었다. 유전자 서열은 생어(Sanger) 시퀀싱으로 검증하였다.
Golden Pi CS 시스템을 이용한 P. 파스토리스 번역 인자 과발현 균주의 구성 및 선택
과발현을 위해 선택된 유전자는 PCR(Q5® 고-충실도 DNA 중합효소, New England Biolabs)에 의해 시작부터 정지 코돈까지 증폭되거나 2개 내지 여러 조각으로 분할되었다. GoldenPiCS 시스템(Prielhofer et al. 2017. BMC Systems Biol. 11, 123, doi: 10.1186/s12918-017-0492-3)은 일부 코딩 서열에서 침묵 돌연변이의 도입을 필요로 한다. 이는 표 3 및 9의 프라이머를 사용하여 하나의 코딩 서열에서 여러 단편을 증폭하여 수행했다. 대안적으로 gBlocks를 수득하였다(Integrated DNA Technology IDT). P. 파스토리스 균주 CBS2612의 게놈 DNA를 PCR 주형으로 사용했다. 표 3 및 표 9의 프라이머로 증폭한 후 생성된 단편을 제한 효소 BsaI을 사용하여 GoldenPiCS 시스템의 BB1에 도입하였다. GoldenPiCS 시스템은 백본 BB1, BB2 및 BB3으로 이루어진다. 각각의 코딩 서열을 운반하는 조립된 BB1은 BB2에서 프로모터 및 종결자 영역과 조합된 다음 문헌(Prielhofer et al. 2017)에 기재된 바와 같이필요한 BB3 통합 플라스미드를 생성하기 위해 추가로 처리된다. BB2 또는 BB3 백본에서 발현 카세트를 조립하는 데 사용되는 모든 프로모터 및 종결자는 문헌(Prielhofer et al. 2017)에 기재되어 있다. 사용된 BB3rN는 누르세오트리신에 대한 선택을 위한 5'-RGI1 게놈 통합 영역 및 NatMX 선택 마커 카세트를 함유한다. 모든 플라스미드는 대장균(pUC19)에 대한 복제 기점을 함유한다.
c) TIF 과발현 형질전환체의 생성
플라스미드는 전기천공 전에 AscI 제한 효소를 사용하여 P. 파스토리스로 선형화되었다(Gasser et al. 2013(Future Microbiol. 8(2):191-208)에 설명된 표준 변환 프로토콜을 사용하여). 양성 형질전환체의 선택은 500 μg mL-1의 G418 또는 100 μg mL-1의 누르세오트리신을 함유하는 YPD 플레이트(리터당: 효모 추출물 10 g, 펩톤 20 g, 글루코스 20 g, 한천 20 g)에서 수행되었다. 콜로니 PCR을 사용하여 올바른 유전자좌에서 형질전환된 플라스미드의 존재를 확인했다. 이를 위해 적절한 프라이머로 PCR에 직접 적용된 0.04 M NaOH에서 P. 파스토리스 콜로니를 쿡킹하여 게놈 DNA를 수득하였다.
d) 과발현 표적의 유전자 카피 수(GCN) 결정
발현 강도는 종종 P. 파스토리스 게놈에 통합된 발현 카세트의 수와 관련이 있다. 따라서, 각각의 과발현 표적의 유전자 카피 수를 결정하였다. 게놈 DNA는 Wizard® 게놈 DNA 정제 키트(Promega Corporation, Cat. No. A1120)를 사용하여 분리되었다. 그런 다음 정량적 실시간 PCR(qPCR)을 사용하여 유전자 카피 수를 결정했다. 이를 위해 Blue S'Green qPCR 키트(Biozym)를 사용하였다. Blue S'Green qPCR 마스터 믹스를 프라이머 및 샘플과 혼합하고 실시간 PCR 사이클러(Rotor Gene, Qiagen)에서 실시간 분석에 적용했다. 사용된 프라이머 목록은 표 1에 나와 있다. 모든 샘플은 삼중으로 분석되었다. 로터 유전자(Rotor Gen) 소프트웨어는 데이터 분석에 사용되었다. 교정기로는 ACT1 유전자를 사용하였다. GCN은 단일 과발현 구성물에 대한 PGAP 프라이머(실시예 4 참조) 및 조합된 과발현 구성물에 대한 TIF2 프라이머(실시예 5 참조)의 사용에 의해 결정되었다. 그 결과를 각각 표 10 및 표 12에 나타내었다. 선택된 과발현 표적이 P. 파스토리스의 내인성 유전자이기 때문에, 2개의 GCN은 하나의 추가 유전자 카피의 성공적인 통합을 보여주고, 유전자 중 하나는 원래 유전자이고 두 번째는 과발현 카세트이다.
표 1: GCN 결정에 사용되는 qPCR 프라이머. ACT1은 교정기로 사용되었다. PGAP는 단일 과발현 구성물에 대한 GCN, 조합된 과발현 구성물에 대한 TIF2를 결정하는 데 사용되었다.
Figure pct00001
실시예 2: TIF 과발현이 재조합 단백질 생산에 미치는 영향 분석
재조합 단백질 분비에 대한 번역 인자 과발현의 효과를 결정하기 위해, 조작된 과발현 균주를 GOI에 대해 pG-프로모터를 사용할 때 글루코스 제한 조건(Prielhofer et al. 2013. Microb Cell Fact 12, 5) 또는 메탄올-이용 경로에서 유도된 프로모터의 경우 메탄올 유도(Gasser et al. 2015. Microb. Cell Fact 14:196)과 같은 적합한 스크리닝 조건에서 배양하였다. pPuzzle-기반 또는 GoldenPiCS BB3rN-기반 TIF 발현 벡터를 P. 파스토리스 게놈에 통합함으로써 P. 파스토리스 숙주 균주의 조작을 실시예 1에 기재된 바와 같이 수행하였다. 이어서 조작된 P. 파스토리스 균주를 소규모로 배양하여(스크리닝 절차), 유가 배양을 시뮬레이션하였다. 상청액으로 분비된 재조합 단백질을 정량화하고 상이한 조작된 균주의 역가 및 수율을 모 숙주 균주와 비교하였다.
배지: 합성 스크리닝 배지 ASMv6/리터: 6.30 g (NH4)2HPO4, 0.8 g (NH4)2SO4, 0.49 MgSO4*7H2O, 2.64 g KCl, 0.0535 g CaCl2*2H2O, 22.0 g 시트르산 일수화물, 1470 μL PTM0 미량 염 스톡 용액, 20 mL NH4OH (25%), 4 mL 비오틴 (0.1 g L-1). 고체 KOH를 첨가하여 pH를 6.4 - 6.6으로 설정했다.
리터당 PTM0 미량 염 스톡 용액: 5.0 mL H2SO4 (95-98%), 65.0 g FeSO4*7H2O, 20 g ZnCl2, 6.00 g CuSO4*5H2O, 3.36 g MnSO4*H2O, 0.82 g CoCl2*6H2O, 0.20 g Na2MoO4*2H2O, 0.08 g NaI, 0.02 g H3BO3
a) pG-프로모터의 제어 하에 GOI 발현을 갖는 조작된 P. 파스토리스 균주의 스크리닝
모델 단백질 분비의 스크리닝을 위해, PCR 확인된 올바른 유전자좌로 유전자 통합을 갖는 단일 콜로니는 50 μg mL-1 제오신 및 500 μg mL-1 G418 또는 100 μg mL-1 누르세오트리신(적절한 경우) 함유하는 2 mL 액체 YPG 배지(리터당: 20 g 펩톤, 10 g 효모 추출물, 12.6 g 글리세린 100%, pH 7.4- 7.6)에서 접종되었다. 또한, 비교를 위해 각 플레이트에서 숙주 균주를 사중으로 배양하였다. 이 전배양은 280 rpm에서 24-DWP에서 25℃에서 약 24시간 동안 성장되었다. 그런 다음 전배양을 사용하여 2 mL의 합성 스크리닝 배지 ASMv6을 8의 시작-OD600로 접종했다. 배지는 탄소원으로 50 g L-1 다당류(EnPump200 다당류, Enpresso) 및 0.4%의 글루코스-방출 효소(시약 A, Enpresso)를 함유하였다. 배양 조건은 전배양 조건과 유사하였다. 48시간 후, 1 mL의 세포 현탁액을 미리 무게를 잰 1.5 mL 원심분리 튜브에 옮기고 실온에서 5분 동안 16,000 g에서 원심분리했다. 상청액을 새 바이알에 조심스럽게 옮기고 추가 사용 전까지 -20℃에서 보관했다. 펠릿을 함유하는 원심분리 튜브의 중량을 다시 측정하여 습윤 세포 중량(WCW)을 결정했다. 상청액에서 재조합 분비 단백질의 정량화는 하기 기술된 바와 같이 미세유체 모세관 전기영동에 의해 수행되었다.
b) 메탄올-유도성 프로모터의 제어 하에 GOI 발현을 갖는 조작된 P. 파스토 리스 균주의 스크리닝
50 μg mL-1 제오신 및 500 μg mL-1 G418 또는 100 μg mL-1 누르세오트리신(적절한 경우)을 함유하는 2 mL YPD 배지(리터당: 20 g 펩톤, 10 g 효모 추출물, 22 g D(+)-글루코스 일수화물, pH 7.4-7.6)를 P. 파스토리스 클론의 단일 콜로니를 접종하고 280 rpm에서 24-DWP에서 25℃에서 밤새 성장시켰다. 그런 다음 전배양물을 사용하여 2 mL의 합성 스크리닝 배지 ASMv6을 8의 시작-OD600로 접종했다. 배지는 탄소원으로 25 gL-1 다당류(EnPump200 다당류, Enpresso) 및 0.35%의 글루코스-방출 효소(시약 A, Enpresso)을 함유하였다. 이들 배양물을 280 rpm에서 24-DWP에서 25℃에서 48시간 동안 인큐베이션하였다. 처음 3시간 후 세포에 10 μL(0.5%)의 순수 메탄올을 공급했다. 그런 다음 19시간, 27시간 및 43시간 배양 시간 후에 세포에 20 μL(1%) 순수 메탄올을 다시 공급했다. 48시간 후, 1 mL의 세포 현탁액을 미리 무게를 잰 1.5 mL 원심분리 튜브에 옮기고 실온에서 5분 동안 16,000 g에서 원심분리했다. 상청액을 새 바이알에 조심스럽게 옮기고 추가 사용 전까지 -20℃에서 보관했다. 펠릿을 함유하는 원심분리 튜브의 중량을 다시 측정하여 습윤 세포 중량(WCW)을 결정했다. 상청액에서 재조합 분비 단백질의 정량화는 하기 기술된 바와 같이 미세유체 모세관 전기영동에 의해 수행되었다.
c) 미세유체 모세관 전기영동(mCE)에 의한 분비된 재조합 단백질의 정량화
'LabChip GX/GXII 시스템'(PerkinElmer)은 배양 상층액에서 분비 단백질 역가를 정량 분석하는 데 사용되었다. 소모품은 '단백질 익스프레스 랩 칩'(760499, PerkinElmer)과 '단백질 익스프레스 시약 키트'(CLS960008, PerkinElmer)를 사용하였다. 제조업체의 권장 사항에 따라 칩 및 샘플 제조를 수행했다. 절차에 대한 간략한 설명은 다음과 같다.
칩 제조: 시약이 실온에 도달한 후, 520 및 280 μL의 단백질 익스프레스 겔 매트릭스를 스핀 필터로 옮겼다. 20 μL의 단백질 익스프레스 염료 용액을 스핀 필터가 함유된 520 μL 겔 매트릭스에 첨가했다. 스핀 필터를 함유하는 염료를 역방향으로 잠시 와동시킨 후, 두 스핀 필터를 모두 9300 g에서 10분 동안 원심분리했다. 칩을 세척하기 위해 120 μL Milli-Q® 물을 모든 활성 칩 웰에 첨가하고 칩을 기기 세척 프로그램에 적용했다. Milli-Q® 물로 2번 더 헹구고, 남은 유체를 완전히 흡인하고 적절한 양의 필터링된 겔 매트릭스 용액과 단백질 익스프레스 하위 마커 용액을 적절한 칩 웰에 첨가했다.
샘플 및 래더 제조: 샘플 제조를 위해 6 μL 샘플을 96-마이크로타이터 플레이트에서 21 μL의 샘플 완충액과 혼합했다. 샘플을 100℃에서 5분 동안 변성시키고 1,200 g에서 2분 동안 원심분리하였다. 그 후 Milli-Q® 물 105 μL를 첨가했다. 샘플 용액을 피펫으로 간단히 혼합하고 측정 전에 다시 1,200 g에서 2분 동안 원심분리했다. 래더를 제조하기 위해, 단백질 익스프레스 래더(Protein Express Ladder) 12 μL를 PCR 튜브에서 100℃에서 5분 동안 변성시켰다. 이어서 Milli-Q® 물 120 μL를 첨가하고 래더 용액을 잠시 와류시킨 후 미니원심분리기에서 15초 동안 튜브를 회전시키고 측정을 시작했다.
제조업체에서 제공한 LabChip 소프트웨어를 사용하고 BSA 표준과 비교하여 정량화를 수행했다.
실시예 3: P. 파스토리스 에서 재조합 단백질 분비에 대한 번역 개시 인자 3(eIF3) 서브유닛 과발현의 효과.
첫째, 번역 개시 인자 3의 서브유닛인 eIF3이 과발현되었다. 이 인자는 효모에서 6개의 서브유닛으로 구성되며, 자체적으로 그리고 다른 조합으로 과발현되었다. 과발현을 위해, eIF3 서브유닛을 GoldenPiCS 벡터로 클로닝하고 실시예 1에 기재된 바와 같이 숙주 균주 CBS2612 PG1-3 vHH#4로 형질전환시켰다. 그런 다음 조작된 균주를 실시예 2에 기재된 바와 같이 스크리닝하고 수율을 숙주 균주와 비교하였다.
a) eIF3의 단일 서브유닛의 과발현.
표 2에 나타낸 eIF3의 서브유닛을 표 3에 나타낸 프라이머를 사용하여 증폭하고 실시예 1에 기재된 바와 같이 숙주 균주 CBS2612 PG1-3 vHH#4로 클로닝하였다. eIF3a에 대한 과발현 벡터는 수득되지 않았다.
표 2: 선택된 과발현 표적. 주어진 모든 유전자는 효모에서 eIF3의 서브유닛인 것으로 알려져 있다.
Figure pct00002
표 3: eIF3 서브유닛의 클로닝에 사용되는 프라이머.
Figure pct00003
Figure pct00004
표 4는 eIF3 서브유닛의 단일 과발현 결과를 보여준다. 각각의 표적 유전자는 약 10배의 과발현을 달성하기 위해 상이한 프로모터로 과발현되었다. 이러한 대략적인 과발현 강도는 OE 열에 표시되어 있으며 실시예 4a에 설명된 대로 계산되었다. 스크리닝 결과는 숙주 균주와 비교하여 vHH 수율의 배수 변화로 표시된다. 표 4의 결과는 단일 eIF3 서브유닛의 과발현이 피치아 파스토리스에서 재조합 단백질 분비에 영향을 미치지 않는다는 것을 명확하게 보여준다(조작된 균주와 대조군 사이의 vHH 수율의 배수 변화는 모두 약 1이며, 이는 조작된 균주와 모 대조군 균주 사이의 단백질 생산에 차이가 없음을 의미한다). 이것은 문헌(Roobol et al., Metabolic Engineering 2020, 59:98-105)이 포유류 HEK 및 CHO 세포주에서 eIF3i 및 eIF3v 서브유닛의 일시적이고 안정적인 과발현 시 성장 속도 증가 및 단백질 합성 능력 증가를 보고했기 때문에 예상치 못한 것이다.
표 4: 균주 CBS2612 PG1-3 vHH #4에서 번역 개시 인자 eIF3 서브유닛의 단일 과발현. FC vHH 수율 열은 숙주 균주와 비교하여 vHH 수율의 배수 변화를 보여준다.
Figure pct00005
a) eIF3 서브유닛 조합의 과발현.
다음으로, 표 5에 기재된 바와 같이 과발현을 위해 eIF3 서브유닛의 상이한 조합을 선택하였다. 실시예 1에 기재된 바와 같이 클로닝 및 형질전환을 수행하였고 생성된 균주를 실시예 2에 기재된 바와 같이 스크리닝하였다. 실시예 4a에 기재된 바와 같이 네이티브 균주와 동일하게 세포 내 전사체 농도 비율을 유지하기 위해 프로모터를 선택하였다. OE 열럼은 계산된 과발현 강도를 보여준다.
표 5: 선택된 프로모터와 함께 표시되는 eIF3에 대한 선택된 조합의 과발현. OE는 문헌(Rebnegger et al. 2014. Biotech J. 9(4):511-25)으로부터 유전자 발현 데이터에 따라 모 균주와 비교하여 조작된 균주에서 TIF 전사 수준의 추정된 증가를 보여준다. CBS2612 PG1-3 vHH #4를 숙주 균주로 사용하였다.
Figure pct00006
표 6: 균주 CBS2612 PG1-3 vHH #4에서 eIF3 서브유닛의 조합된 과발현. FC 수율은 분비된 vHH 수율의 배수 변화이다.
Figure pct00007
표 6은 숙주 균주와 비교하여 vHH 수율의 배수 변화를 보여준다. eIF3의 여러 서브유닛을 과발현하는 조합조차도 스크리닝에서 vHH 생산을 증가시키지 않았다. 실시예 3a에서와 같이, 배수 변화 값은 모두 약 1이며, 이는 eIF3 서브유닛이 단독으로 또는 조합으로 과발현될 때 재조합 단백질 분비의 유의한 증가가 없음을 의미한다.
실시예 4: mRNP의 단일 TIF의 과발현이 재조합 단백질 생산에 미치는 영향
번역 개시에 작용하고 mRNP 및 폐쇄 루프 복합체의 일부인 번역 인자를 과발현 목적을 위해 선택하였다: eIF4A, eIF4E, eIF4G, PAB1 및 RLI1(표 7) 및 과발현 벡터를 하기 표 8 및 9 에 제시된 프라이머를 사용하여 실시예 1b에서와 같이 구성하였다. CBS2612_PG1-3_vHH#4(WO2020/144313A1에 기재)를 모 숙주 균주로 사용하고 실시예 1에 기재된 단일 TIF 과발현 벡터로 형질전환하였다.
표 7: 과발현을 위해 선택된 번역 개시 인자(TIF)
Figure pct00008
a) 단일 OE 벡터 생성 및 OE 강도 결정
표 8: pPuzzle 기반 발현에 의한 P. 파스토리스 번역 인자 과발현 균주의 구성에 사용되는 프라이머. 각각의 유전자의 시작 및 정지 코돈은 이탤릭체 및 굵게 표시된다.
Figure pct00009
표 9: GoldenPiCS 시스템을 갖는 P. 파스토리스 번역 인자 과발현 균주의 구성에 사용되는 프라이머. BsaI 제한 부위는 밑줄로 표시된다. 각각의 유전자의 시작 및 정지 코돈은 이탤릭체 및 굵게 표시된다. 침묵 돌연변이는 굵게 표시되고 밑줄이 그어져 있다.
Figure pct00010
Figure pct00011
기술된 모든 단일 TIF 과발현에 대해 강력하고 구성적인 pGAP 프로모터가 사용되었고 TIF 발현 카세트는 5'-RGI1 유전자좌 또는 AOX1 전사 종결자에 통합되었다. 문헌(Rebnegger et al. 2014. Biotech J. 9(4):511-25)에 기술된 유전자 발현 데이터를 기반으로, 선택된 프로모터로 예상되는 과발현 정도를 계산하였다. 모 균주와 비교하여 발현 강도의 추정된 증가는 표 10에서 "OE" 열에 제시되어 있다.
표 10은 또한 선택된 클론의 측정된 GCN과 스크리닝 절차의 결과를 보여준다. 표 10에 나타낸 모든 클론은 각각의 TIF 유전자의 하나의 추가 카피를 함유했다(GCN = 2로 표시).
b) 리포터로서 pG1-3의 제어 하에 vHH를 사용한 재조합 단백질 생산에 대한 단일 TIF 과발현의 효과
균주를 실시예 2a에 기술된 바와 같이 배양하고 분비된 vHH 역가를 mCE에 의해 배양 48시간 후에 결정하였다(실시예 2c). 각 클론에 대해 역가(mg vHH L-1), WCW(g L-1) 및 바이오매스 특이적 생성물 수율(mg vHH g-1 WCW)을 계산한 다음 하나의 인자를 과발현하는 모든 클론과 모 균주의 복제물에 대해 평균을 냈다. 동일한 24-DWP에서 배양된 모 숙주 균주의 평균과 비교하여 역가 및 수율의 배수 변화(FC)를 결정하였다.
표 10: 균주 CBS2612 PG1-3 vHH #4에서 재조합 단백질 생산에 대한 번역 개시 인자의 단일 과발현의 효과. FC vHH 수율은 분비된 vHH 수율의 배수 변화이다. 표시된 결과는 스크리닝 배양 48시간 후에 측정되었다. OE는 모 균주와 비교하여 조작된 균주에서 TIF 전사체 수준의 추정된 증가를 보여준다.
Figure pct00012
예상외로, mRNP의 선택된 TIF의 단일 과발현조차도 재조합 단백질 생산 및 분비를 분명히 증가시켰다(표 10). 가장 높은 개선은 TIF4632(eIF4G) 및 PAB1 과발현에서 볼 수 있으며, 둘 다 재조합 단백질 분비를 약 2.0배 증가시켰다.
실시예 5: 재조합 단백질 분비에 대한 mRNP의 TIF 조합의 과발현 효과.
복합체에서 여러 번역 개시 인자를 과발현시키는 효과가 있는지 분석하기 위하여, 실시예 4에서 테스트한 번역 인자의 다양한 조합을 선택하여 재조합 단백질 생산에 미치는 영향을 비교하였다. 이 조합 조작은 실시예 1b에 설명된 대로 GoldenPiCS 툴박스를 사용하여 수행되었다. 생성된 플라스미드를 숙주 균주 CBS2612 PG1-3 vHH #4로 형질전환시켰다. 이어서 조작된 P. 파스토리스 균주를 실시예 2에 기재된 바와 같이 소규모로 배양하였다. 상청액으로 분비된 단백질을 실시예 2c에서와 같이 측정하고 상이한 조작된 균주의 역가 및 수율을 모 숙주와 비교하였다.
a) 번역 개시 인자 과발현에 대한 생성된 조합.
표 11에 기재된 상이한 조합 과발현을 테스트하였다. 설명된 프로모터는 각 유전자를 약 10배 과발현하도록 선택되었다. 이것은 세포에서 상이한 표적 유전자의 전사체 농도 비율의 균형을 맞추기 위해 수행되었다. 그러나, 또한 표 10에서 볼 수 있는 바와 같이 여전히 재조합 단백질 생산의 증가를 야기하는 더 강하거나 더 약한 과발현이 선택될 수 있었다.
표 11: 선택된 프로모터와 함께 표시되는 선택된 과발현 조합. OE는 문헌(Rebnegger et al. 2014. Biotech J. 9(4):511-25)으로부터의 유전자 발현 데이터에 따라 모 균주와 비교하여 조작된 균주에서 TIF 전사 수준의 추정된 증가를 보여준다.
Figure pct00013
a) 재조합 단백질 분비에 대한 조합된 과발현의 효과.
조작된 균주를 스크리닝하고 데이터를 실시예 2에 기재된 바와 같이 분석하였다.
표 12: 균주 CBS2612 PG1-3 vHH #4에서 번역 개시 인자의 조합된 과발현. FC 수율은 분비된 vHH 수율의 배수 변화이다.
Figure pct00014
표 12는 재조합 단백질 생산에 대한 상이한 TIF 조합의 과발현 효과를 보여준다. 표 12에 제시된 모든 클론은 과발현 카세트가 한 번만 삽입된 것으로 확인되었으며, 이는 GCN이 2임을 의미한다. vHH 수율의 배수 변화는 숙주 균주 CBS2612 PG1-3 vHH #4와 비교하여 나타낸다. 모든 조합이 모체에 비해 증가된 재조합 vHH 분비를 나타내었지만, 조합 C3 및 C13은 분명히 가장 큰 효과를 보인다. C3a 및 C3b는 P. 파스토리스 게놈 서열의 다른 주석에 따라 길이가 다른 TIF2의 다른 버전을 함유한다. TIF2 버전과는 별개로, 두 조합 모두 vHH 수율을 2배 이상 증가시켰다. C3b는 vHH 수율을 2.5배 증가시켰다.
b) 상이한 배경 균주에서 재조합 단백질 분비에 대한 C3b 과발현의 비교.
상이한 배경 균주의 효과를 비교하기 위해 PG1-3_vHH 발현 카세트를 실시예 1a에 기재된 바와 같이 CBS7435로 형질전환시켰다. 이어서, 구성물 C3b를 실시예 1c에 기재된 바와 같이 생성된 CBS7435 PG1-3 vHH 생산 숙주 균주의 게놈에 통합시켰다. 이어서 C3b 과발현의 효과를 실시예 2a에 기재된 바와 같이 스크리닝하고 분비된 vHH 역가를 실시예 2c에 기재된 바와 같이 측정하였다. 비교를 위해, CBS7435 PG1-3 vHH C3b의 9개의 상이한 클론을 스크리닝하고 숙주 균주 CBS7435 PG1-3 vHH의 생물학적 사중반복과 비교하였다.
표 13: 배경 균주 비교의 스크리닝 결과. vHH 수율의 배수 변화는 숙주 균주와 비교하여 과발현 구성물에 대해 표시된다.
Figure pct00015
표 13은 숙주 균주 CBS7435 PG1-3 vHH에서 C3b 과발현의 vHH 수율의 배수 변화를 보여준다. 이들 결과는 배경 균주의 선택과 무관하게, 재조합 vHH 분비에 대한 강력한 유익한 효과가 C3b 과발현을 갖는 모든 균주에서 볼 수 있음을 보여준다.
c) 메탄올 유도성 재조합 단백질 분비에 대한 TIF 과발현의 효과.
메탄올 유도성 재조합 단백질 분비에 대한 C3B 과발현의 효과를 결정하기 위해, PAOX1-vHH 발현 카세트(Zavec et al. 2020, Biotechnol Bioeng. 117(5): 1394-1405)를 함유하는 CBS7435 MutS는 C3b 과발현에 대한 숙주 균주로 사용되었다. PAOX1 유도에 대한 메탄올 샷을 사용하여 실시 예 2b에 기술된 바와 같이 균주를 스크리닝하고, 단백질 역가를 실시예 2c에 기재된 바와 같이 측정하였다.
10개의 C3b 과발현 클론을 갖는 스크리닝은 모 균주와 비교하여 vHH 수율의 1.39 ± 0.05배 평균 증가를 나타냈다. 이것은 적용된 탄소 공급원 또는 프로모터 시스템에 관계없이 TIF 과발현으로 재조합 단백질 분비의 증가가 달성될 수 있음을 확인시켜 준다.
실시예 6: 세포 과정에 대한 번역 개시 인자 과발현의 영향의 특성.
재조합 단백질 분비에서 관찰된 차이에 추가로 번역 개시 인자 과발현시 어떤 세포 과정이 영향을 받는지 평가하기 위해, 두 가지 다른 접근법이 따랐다: 한편으로, 전사체 풍부에 대한 잠재적 영향을 결정하기 위해 유전자 전사체 수준을 측정하였다 (실시예 6a). 한편, 세포 번역 활성은 에서 푸로 마이신 기반 방법 (실시 예 6B)을 설정 한 후 직접 측정되었다.한편, 세포 번역 활성은 P. 파스토리스에서 푸로마이신 기반 방법 (실시예 6b)을 설정한 후 직접 측정되었다.
a) 전사 수준의 비교 측정을 위한 스파이크-인 방법.
먼저, 균주를 실시예 2에 기술된 바와 같이 30시간 동안 24-DWP 스크리닝 절차에서 배양하였다. 이것은 수확 시점에서 약 0.025 h-1의 성장률에 해당한다. 1 mL의 배양물을 수확하고 4℃에서 16,000 g에서 5분 동안 원심분리하였다. 상청액을 폐기하고 펠렛을 추가로 사용하기 전까지 -80℃로 저장하였다.
일반적인 하우스키핑 유전자에 대한 전사체 농도의 잠재적 변화를 측정할 수 있으려면 펠렛을 PBS에 용해시키고 WCW에 따라 각 샘플에서 동일한 양의 효모 질량을 갖도록 다시 펠릿으로 하였다. 이어서, 각각의 펠렛은 1 mL의 S. 세래비지애 S288c 현탁액(단일 쉐이크 플라스크 배양의 분취량)으로 스파이크되었다. 생성된 혼합 P. 파스토리스 - S. 세래비지애 펠렛을 RNA 분리에 사용하였다.
RNA 분리의 경우 1 mL의 TRI 시약(Sigma-Aldrich) 및 500 μL 산 세척된 유리 비드를 세포에 첨가한 다음, 속도 5.5 m/s에서 40초 동안 FastPrep-24(mpbio)에서 파괴하였다. 그 후, 200 μL의 클로로포름을 첨가하였다. 이어서, 샘플을 격렬하게 진탕하고 실온에서 5-10 분 동안 정치시켰다. 상 분리를 촉진하기위해 16,000 g 및 4℃에서 10분 동안 원심분리한 후, RNA를 함유하는 상부 무색 수성상을 신선한 튜브로 옮기고 500 μL의 이소프로판올을 첨가하여 RNA를 침전시켰다. 10분의 인큐베이션 후 샘플을 16,000 g 및 4℃에서 10분 동안 원심분리하고 상청액을 폐기하였다. RNA 펠렛을 70% 에탄올로 한 번 세척하고, 공기-건조시키고, RNase 무함유 물에서 재현탁시켰다.
잔류 DNA를 제거하기 위해, 제조업체의 매뉴얼에 따라 DNA-Free-키트(Ambion)로 RNA 샘플을 처리하였다. 이어서, RNA 품질, 순도 및 농도는 나노드롭(Nanodrop) 2000 (Thermo Scientific)을 사용하여 겔 전기영동 및 분광광도 분석에 의해 분석되었다.
cDNA의 합성은 제조업체의 매뉴얼에 따라 Biozym cDNA 합성 키트로 수행하였다. 간략하게, 1 μg의 총 RNA를 역전사 효소, dNTP, RNase 억제제 및 합성 완충제를 함유하는 마스터 믹스에 첨가하였다. 프라이밍 올리고로서 d(T) 23 VN(NEB)이 사용되었다. 반응 혼합물의 인큐베이션을 55℃에서 45분 동안 수행하였다. 이어서, 효소의 불활성화는 99℃에서 5분 동안 반응 혼합물을 인큐베이션함으로써 달성되었다.
정량적 실시간 PCR(QPCR)에서 P. 파스토리스 ACT1, TDH3 및 vHH 특이적 프라이머가 사용되었다(표 14 참조). 정규화는 S. 세래비지애 ACT1 발현 수준과 비교하여 수행되었다(표 14 참조). 조작된 균주의 전사체 수준을 숙주 균주 전사체 수준과 비교하였다. ACT1 프라이머의 두 세트를 테스트하고 원하는 유기체의 cDNA에만 결합하도록 검증되었다. qPCR에서 1 μL의 cDNA, 물 및 프라이머를 Blue S'Green qPCR 마스터 믹스(Biozym)와 혼합하고 실시간 PCR 사이클러(Rotor-Gene, Qiagen)에서 분석하였다. 모든 샘플은 기술적 삼중으로 측정되었다. 비교 정량(QC) 방법을 사용하는 로터-유전자 소프트웨어로 데이터 분석을 수행하였다.
표 14 : 전사체 분석을 위한 정량적 실시간 PCR 프라이머
Figure pct00016
b) 전사체 풍부에 대한 TIF 과발현의 영향
표 15에 도시된 TIF 과발현 균주 및 호스트 균주, CBS2612 PG1-3 vHH #4는 3 중으로 실시예 2a에 기술된 바와 같이 30시간 동안 24-DWP 스크리닝 절차에서 배양되었다. 2개의 내인성 유전자 및 재조합 GOI의 전사체 풍부는 실시예 6a에 기술 된 바와 같이 결정되었다.
표 15는 전사체 수준 측정의 수득된 결과를 보여준다. 측정은 vHH의 전사체 수준이 TIF 과발현에 의해 크게 영향을 받음을 보여준다. 실시예 4 및 5에서 이미 더 높은 재조합 단백질 분비를 보여주는 과발현 조합에 대해 특히 높은 값을 볼 수있다. C3b를 과발현하는 균주에서 가장 높은 전사 수준이 발견되었다. 이 과발현은 vHH 전사체 수준을 5.5배 증가시켰다. 놀랍게도, TDH3의 발현은 모든 과발현 균주에서도 증가되는 것으로 보이지만, ACT1의 발현은 특히 조합된 과발현 균주에서 증가된 것으로 보인다. 하우스키핑 유전자, ACT1TDH3 모두에 대한 전사 수준의 증가는 세포 내의 모든 전사체의 증가를 나타낸다. 이러한 결과는 TIF 과발현이 세포 mRNA 수준에 대한 양성 및/또는 안정화 효과를 갖는데, 이는 하나의 인자가 생산성을 증가시킬 수 있음을 나타낸다.
표 15 : 숙주 균주와 비교하여 상이한 과발현 균주의 상대적인 전사체 수준. 실시예 2a에 기술된 스크리닝 배양의 30시간 후에 측정을 수행하였다.
Figure pct00017
c) 전반적인 번역 활성 측정.
O-프로파길 표지된 퓨로마이신으로 전체 번역 활성의 측정은 효모 세포에서 사용하기 위한 절차를 최적화한 후 문헌(Nagelreiter et al. 2018. Biotechnol J 13, e1700492)과 유사하게 수행하였다. 간략하게, 실시예 6a에서와 동일한 배양으로부터의 세포를 90 μL "인큐베이션 용액"에서 0.4의 단부-OD600을 갖는 96-웰 마이크로타이터 플레이트로 피펫팅하였다. "인큐베이션 용액"은 10% DMSO 및 PBS(2 mM KH2PO4, 10 mM Na2HPO4.2H2O, 2.7 mM g KCl, 8 mM NaCl, pH 7.4) 및 1.5 g L-1 이미프라민에 용해된 0.6 mM O-프로파길 퓨로마이신(Jena Bioscience, NU-931-05)을 포함하는 ASMv6 배지(실시예 2 참조)로 구성되었다. 현탁액을 진탕기에서 25℃에서 2시간 동안 인큐베이션하고, 얼음처럼 차가운 에펜도르프 튜브로 옮기고 4℃에서 5분 동안 16,000 g에서 원심분리했다. 펠렛화된 세포를 120 μL PBS로 세척한 후, 다시 펠렛화된 세포를 1 mL의 얼음처럼 차가운 70% 에탄올로 고정시켰다. 이 고정 샘플은 4℃에서 1일에서 2주 사이에 보관되었다.
클릭 화학 반응을 위해, 고정된 샘플을 16,000 g 및 4℃에서 5분 동안 원심분리하여 수확했다. 펠릿을 96-웰 마이크로타이터 플레이트로 옮기고 100 μL "클릭 화학 완충액"(115 mM 트리스/HCl pH=8.5, 0.1% 트리톤 X-100)으로 세척했다. 그런 다음 샘플을 "클릭 화학 믹스"(101 mM Click-it Click Chemistry Buffer, 1.9 mM CuSO4, 1.9 mg/mL 아스코르브 산, 20 μM Alexa Fluor 488 아지드(Invitrogen))에서 실온에서 30분 동안 배양했다. 그 후, 이전과 같이 세포를 수확하고, 150 μL PBS로 세척하고 150 μL 신선한 PBS에 용해시켰다. 생성된 형광 강도를 측정하기 위해, 세포를 여기 파장 488 nm 및 방출 파장 525 nm의 유세포 분석기로 분석했다. 각 샘플에 대해 40,000개의 이벤트가 측정되었다. 데이터 분석을 위해, 각 샘플의 기하 평균을 사용하고 각 샘플에서 블랭크(O-프로파길 퓨로마이신 첨가 없이 처리된 세포)를 차감했다.
d) 전체 세포 번역에 대한 TIF 과발현의 영향
표 16은 숙주 균주 CBS2612 PG1-3 vHH #4와 비교하여, 수득된 형광 값의 배수 변화, 따라서 전체 번역 활성의 평균 배수 변화를 보여준다. 번역 활성의 측정을 위해, 표 15에 나타낸 것과 동일한 클론을 사용하였다. 실시예 6c에 기술된 바와 같이 번역 활성을 결정하였다.
표 16: 숙주 균주 CBS2612 PG1-3 vHH#4(1.0으로 설정)에 대한 TIF 과발현 균주의 번역 활성. 실시예 2a에 기술된 스크리닝 배양 30시간 후에 측정을 수행하였다.
Figure pct00018
표 16은 단일 번역 개시 인자의 과발현이 각 세포에서 향상된 번역 활성으로 이어짐을 명확하게 보여준다. 선택된 TIF 조합의 과발현은 번역 활성의 훨씬 더 강력한 증가를 보여준다. 이것은 또한 이들 균주에서 관찰된 증가된 재조합 단백질 분비에 의해 반영된다(실시예 4 및 5). 숙주 균주보다 2.3배 더 높은 가장 높은 번역 활성은 C3b를 과발현함으로써 달성될 수 있었다. 이러한 결과는 선택된 번역 개시 인자 또는 이들의 조합의 과발현이 재조합 단백질과 같은 특정 단백질의 번역 뿐만 아니라 전체 세포 번역 활성을 증가시킨다는 것을 보여준다. 놀랍게도, vHH 수율의 개선(표 10 및 12)과 상대적 번역 활성(상관 계수 R2=0.84) 사이에 명확한 상관관계가 있으며, 이는 번역 개시 동안 mRNP의 형성이 재조합 단백질 생산에 대한 속도-제한 단계임을 나타낸다.
실시예 7: 유가 배양에서 번역 인자 과발현의 효과.
스크리닝에서 이루어진 관찰을 추가로 검증하기 위해, 표준 생산 공정과 유사한 유가 배양을 선택된 과발현 표적으로 수행했다.
a) 유가 배양에서 vHH 생산에 대한 TIF 과발현의 효과:
이 실시예에서는 C3b 또는 RLI1을 과발현하는 CBS2612_PG1-3_vHH#4가 배양을 위해 선택되었다. 이들 균주는 스크리닝에서 재조합 단백질 분비에 대해 강력한 유익한 효과를 나타내었다(실시예 4, 5 및 9). 유가 배양의 경우, 동일한 배지를 사용하면서 상이한 공급 프로파일을 적용하여 각각의 샘플링 지점에서 다음과 같이 계산된 성장률을 얻었다(표 17). 배지 구성은 아래에서 확인할 수 있다.
표 17: 유가식에서 상이한 샘플링 지점에서의 성장률.
Figure pct00019
배지:
리터당 PTM0 미량 염 저장 용액:
5.0 mL H2SO4 (95-98%), 65.0 g FeSO4*7H2O, 20 g ZnCl2, 6.00 g CuSO4*5H2O, 3.0 g MnSO4*H2O, 0.5 g CoCl2*6H2O, 0.20 g Na2MoO4*2H2O, 0.08 g NaI, 0.02 g H3BO3
리터당 함유된 글리세롤 배치 배지:
2 g 시트르산 일수화물(C6H8O7*H2O), 45 g 글리세롤, 12.6 g (NH4)2HPO4, 0.5 g MgSO4*7H2O, 0.9 g KCl, 0.022 g CaCl2*2H2O, 13.2mL 비오틴 스톡 용액(0.1 g L-1) 및 4.6 mL PTM0 미량 염 스톡 용액. HCl(농축)을 첨가하여 pH를 5로 설정하였다.
리터당 함유된 글루코스 공급 배지:
495 g 글루코스 일수화물, 4.6 g MgSO4*7H2O, 8.4 g KCl, 0.28 g CaCl2*2H2O, 23.6 mL 비오틴 스톡 용액(0.1 g L-1) 및 10.1 mL PTM0 미량 염 스톡 용액.
b) 최소 성장률이 0.04 h -1 에 이르는 선형 공급을 사용한 유가 배양
유가 배양은 1 L 벤치탑 생물반응기(SR0700ODLS; Dasgip, Germany; 반응기 실행 #A-B) 또는 1.8 L 벤치탑 생물반응기(SR1500ODLS; Dasgip, Germany; 반응기 실행 #C)에서 숙주 균주 CBS2612 PG1-3 vHH #4 및 상응하는 과발현 균주 CBS2612 PG1-3 vHH C3b #13, CBS2612 PG1-3 vHH C3b #16 및 CBS2612 PG1-3 vHH PGAP RLI1 #4로 수행되었다. 사전 배양을 위해 1 L 진탕 플라스크에 50 μg mL-1 제오신 및 100 μg mL-1 누르세오트리신(적절한 경우)이 함유된 100 mL YPG 배지를 1.0 mL 냉동스톡(cryostock)으로 접종하고 약 24시간 동안 180 rpm 및 25℃에서 인큐베이션했다. 배치 배양은 0.5 L의 작업 부피에서 작동되었고 1.5의 시작 OD600으로 접종되었다. 글리세롤 배치 배지 조성은 위에 나와 있다. 전체 공정 동안 온도는 30℃로 제어되었고 DO는 교반기 속도(400-1200 rpm 사이) 및 공기 흐름(9.5-30 sL h-1 사이)을 자동으로 조정하여 30%로 유지되었고 pH는 12.5% NH4OH를 자동으로 첨가하여 5.0으로 조절했다. 배치-종료(BE)를 나타내는 DO의 갑작스러운 스파이크 후, 빠른 초기 성장률(μ)을 초래하는 선형 증분 글루코스 공급(위에서 자세히 설명된 배지 조성)에 이어 점진적으로 감소하는 μ의 연장된 기가 적용되었다. 공급의 선형 증가는 F[mL h-1] = 0.1431*t + 2.0499 방정식을 따르도록 설정되었다. 동일한 유가 배양을 두 번 수행하여 얻은 결과를 확인했다.
효모 건조 질량(YDM) 및 분비된 재조합 단백질을 공정 전반에 걸쳐 다양한 시점에서 분석하였다(표 18에 나타냄). YDM 분석을 위해, 1 mL의 배양액을 사전 건조(적어도 24시간 동안 105℃에서)되고 사전 중량을 잰 원심분리 2 mL 튜브로 옮겼다. 16,000 g 및 4℃에서 5분 동안 원심분리한 후 상층액을 조심스럽게 새로운 바이알로 옮기고 추가 사용 전까지 -20℃에서 보관했다. 세포 펠릿을 0.1 M HCl로 두 번 세척하고 무게를 다시 측정하기 전에 최소 24시간 동안 105℃에서 건조했다.
실시예 2c에 기재된 바와 같이 미세유체 모세관 전기영동(GXII, Perkin-Elmer)에 의해 상청액을 분석하였다.
표 18: 2개의 유가 배양 실행, B289-B292 및 C037-C040의 YDM 및 역가 및 수율의 FC를 여기에서 볼 수 있다. 2개 또는 3개의 다른 시점에서 샘플을 채취했다. FC vHH 역가/수율은 동일한 시점에서 숙주 균주 역가/수율과 비교한 과발현 구성물 역가/수율의 배수 변화이다.
Figure pct00020
표 18에서 TIF의 과발현이 유가 배양에서 바이오매스 농도에 영향을 미치지 않는다는 것을 알 수 있다. 대조적으로, 전체 유가 과정 동안 모 대조군에 비해 생성물 역가 및 수율이 증가하였다. 특히 나중 시점 F20 및 F46에서 RLI1 과발현이 생성물 역가 및 수율에 미치는 분명한 긍정적인 효과를 볼 수 있으며, 발효 종료 시 모 숙주 균주를 2.2배 초과한다. C3b의 과발현은 평균적으로 2.7배 더 높은 생성물 수율 및 역가의 훨씬 더 높은 증가를 가져왔다.
c) 0.02 h -1 의 최소 성장 속도로 일정한 공급에서 배양.
실시예 7a 및 7b에 기재된 바와 같이 숙주 균주 CBS2612 PG1-3 vHH #4 및 상응하는 과발현 균주 CBS2612 PG1-3 vHH C3 #16 및 CBS2612 PG1-3 vHH PGAP RLI1 #4로 또 다른 유가 배양을 수행하였다. 그러나 이 배양에서는 실시예 7b에 기술된 선형 증분 글루코스 공급 대신에 일정한 글루코스 공급을 적용하는 다른 공급 프로필이 선택되었다. 전체 유가 배양 동안 일정한 공급은 4 mL h-1로 유지되었다. 이것은 초기에 성장률의 더 빠른 감소와 느린 성장에서 더 긴 배양을 초래했다. 위에서 설명한대로 샘플링을 수행했다. YDM 및 상청액에 추가적으로, 1 mL의 세포 현탁액을 수집하고, 펠릿화하고, 전사체 수준 측정을 위해 -80℃에서 냉동시켰다.
표 19: 유가 배양 실행, C041-C044의 YDM 및 역가 및 수율의 FC를 여기에서 볼 수 있다. 샘플은 3개의 다른 시점에서 채취되었다. FC 역가/수율은 동일한 시점에서 숙주 균주 역가/수율과 비교한 과발현 구성물 역가/수율의 배수 변화이다.
Figure pct00021
표 19는 또한 이러한 공급 전략으로 RLI1 및 C3b 과발현 둘 모두가 동일한 양의 YDM을 생산하면서 숙주 균주에 비해 증가된 생성물 역가 및 수율을 초래하였음을 보여준다. 실시예 7b에서와 같이, C3b 과발현은 평균적으로 4배 더 높은 생산 수율 및 역가에 도달하여 재조합 단백질 생산에 매우 유익한 것으로 입증되었다.
함께, 이것은 단일 TIF 또는 이의 조합의 과발현이 적용된 공급 전략과 독립적으로 재조합 단백질 생산에 강력한 긍정적 영향을 미친다는 것을 나타낸다.
d) 유가식에서 전사체 수준에 대한 번역 인자 과발현의 효과.
실시예 6b에서 보여지는 전사체 풍부에 대한 TIF 과발현의 효과가 또한 유가식으로 세포를 배양할 때 지속되는지를 평가하기 위해, 유가식 실행 C041-C044(실시예 7b)로부터의 샘플에서 PpACT1, vHH 및 TDH3의 전사체 수준을 분석하였다. 실시예 6a에 기재된 바와 같이 절차를 수행하였다. 위에서 설명한 것처럼, 전사 수준은 S. 세레비지애 ACT1에 대해 정규화되었다. 또한 해당 샘플링 지점에서 숙주 균주, 반응기 C041로 정규화되었다. 표 20은 PpACT1, vHH 및 TDH3의 상대적 전사 수준의 배수 변화를 보여준다.
표 20: 2개의 P. 파스토리스 하우스키핑 유전자 ACT1 및 TDH3, 및 분비된 재조합 단백질 vHH의 상대적 전사 수준
Figure pct00022
RLI1의 과발현은 3개의 분석된 유전자의 전사 수준을 약간 증가시켰지만(나중 시점 F31 및 F54에서 2개의 천연 P. 파스토리스 유전자에 대해 평균 1.2), C3b 과발현은 PpACT1의 경우 최대 1.5배, vHH의 경우 최대 2.9배, TDH3의 경우 최대 2.2배(표 20)까지 증가시켰다. C3b의 vHH 전사 수준 증가는 동일한 유가식 배양에서 보이는 역가의 증가와 상관관계가 있는 것으로 보인다(표 19). 하우스키핑 유전자인 ACT1TDH3 모두에 대한 전사 수준의 증가는 배양 방식과 무관하게 세포 내 모든 전사의 증가를 나타낸다.
e) 메탄올 유도성 재조합 단백질 분비로 유가식 배양.
메탄올 유도가 필요한 클론의 유가식 배양은 문헌(Zavec et al. 2020)에 기재된 바와 같이 MutS 균주에 대한 표준 과정 및 배지에 따라 수행되었다. 사전 배양을 위해, 1 L 진탕 플라스크에 50 μg mL-1 제오신 및 100 μg mL-1 누르세오트리신(적절한 경우)이 함유된 100 mL YPG 배지를 1.0 mL 냉동스톡으로 접종하고 180 rpm 및 25℃에서 약 24시간 동안 인큐베이션했다.
배치 배양은 0.4 L BSM 배지(Mellitzer et al., 2014)의 작업 부피에서 작동되었고 2.5의 시작 OD600으로 접종되었다. 온도는 제어되어 25℃로 유지되었고, DO는 교반기 속도(200-1250 rpm 사이), 공기 흐름(9.5-50sL h-1 사이) 및 산소 보충의 자동 조정에 의해 20%로 유지되었다. 25% NH4OH를 자동으로 첨가하여 pH를 5.0으로 조절했다. 배치-종료(BE)를 나타내는 DO의 갑작스러운 스파이크 후에, 글리세롤 공급에 이어 글리세롤/메탄올 공동-공급이 시작되었다. 선형으로 증가하는(y = 0.225x + 1.95) 글리세롤 공급이 있는 글리세롤 공급(60% w/w + 12 mL/L PTM1)은 8시간 동안 지속되었다. 그런 다음 60% 글리세롤과 100% 메탄올을 18시간 동안 공동-공급했다. 공동-공급에서 60% 글리세롤 공급은 선형으로 감소하고(y = 3.75 - 0.111x) 메탄올 공급은 선형으로 증가했다(y = 0.028x + 0.6). 마지막으로, 메탄올 단독 공급 기에서 선형적으로 증가하는 메탄올 공급(y = 0.028x + 1.10)이 72시간 동안 적용되었다. 샘플링, YDM 결정 및 단백질 정량화를 실시예 7b에 기재된 바와 같이 수행하였다.
표 21: 메탄올-기반 유가식 배양 실행 B365-B368의 YDM, 역가 및 수율의 FC. 샘플은 3개의 상이한 시점에서 채취되었다. 공급 시작 후 시간은 순수 글리세롤 공급 시작 후 시간에 해당한다. FC 역가/수율은 동일한 시점에서 2개의 숙주 균주 역가/수율의 평균과 비교한 과발현 구성물 역가/수율의 배수 변화이다.
Figure pct00023
표 21은 또한 메탄올-기반 재조합 단백질 생산 전략을 사용할 때, C3b 과발현이 숙주 균주와 비교하여 증가된 생성물 역가 및 수율을 가져왔으며 따라서 명확한 유익한 효과를 나타냄을 보여준다. 증가는 약 1.7배이며 순수 메탄올 공급 개시 직후부터 시작하여 배양이 끝날 때까지 계속된다.
실시예 8: 케모스타트 배양에서 TIF 과발현의 효과.
바이오의약품 생산 분야에서 연속 배양이 더욱 주목을 받고 있어서, C3b 과발현이 재조합 단백질 분비에 미치는 영향도 케모스타트 배양에서 고정 성장률에서 분석하였다. 이 방법은 생산 공정 중 연속 배양 가능성을 제공하고 성장률을 엄격하게 제어할 수 있다.
a) 케모스타트에서 고정 성장률에서 재조합 단백질 분비에 대한 C3b 과발현의 효과.
배지:
리터당 케모스타트용 미량 원소 용액:
15 g EDTA, 4.5 g ZnSO4*7H2O, 1.03 g MnCl2*4H2O, 0.3 CoClo2*6H2O, 0.3g CuSO4, 0.4 g Na2MoO4*2H2O, 4.5 g CaCl2*2H2O, 3 g FeSO4*7H2O, 1 g H3BO3, 0.1 KI
EDTA와 ZnSO4*7H2O를 H2O에 용해시키고 pH를 고체 NaOH로 6으로 설정한 다음 다른 염을 하나씩 용해시켰다. 그런 다음 고체 NaOH 및 진한 HCl을 사용하여 pH를 4로 설정했다.
리터당 케모스타트용 글루코스 배지(10 g L-1의 YDM을 달성하기 위해):
22 g 글루코스 일수화물, 10 g (NH4)2SO4, 6 g KH2PO4, 1 MgSO4*7H2O, 0.5 g Pluronic® PE 6100, 3 mL 케모스타트용 미량 원소 용액, 1.6 mL 비오틴 스톡 용액(0.1 g L-1)
고체 KOH를 첨가하여 pH를 5로 설정하였다.
케모스타트의 경우 균주 CBS2612 PG1-3 vHH #4 및 상응하는 C3b 과발현 균주인 CBS2612 PG1-3 vHH C3b #13을 1.8 L 벤치탑 생물 반응기(SR1500ODLS; Dasgip, Germany)에서 이중으로 배양했다. 사전 배양을 위해 1 L 진탕 플라스크에 50 μg mL-1 제오신 및 100 μg mL-1 누르세오트리신(적절한 경우)을 함유하는 100 mL YPG 배지를 1.0 mL 냉동스톡으로 접종하고 180 rpm 및 25℃에서 ca. 24시간동안 인큐베이션했다. 배치 배양은 0.6 L의 작업 부피에서 작동되었고 0.4의 시작 OD600으로 접종되었다. 위에서 설명한 배지는 배치 및 연속 배양에 사용되었다. 배치 배양의 경우 교반기 속도(400-1200 rpm 사이)와 공기 흐름(9.5-30sL·h-1 사이)을 자동으로 조정하여 DO를 30%로 유지했다. 연속 배양을 위해, 교반기 속도는 700 rpm으로, 공기 흐름은 30 sL h-1로 설정하였다. 전체 과정 동안, 온도를 30℃로, 12.5% NH4OH를 자동으로 첨가하여 pH를 5로 유지했다. 배치 및 연속 배양에서 YDM이 약 10 g/L의 농도에 도달하도록 배지를 설계했다. 배치-종료를 나타내는 DO의 갑작스러운 스파이크 후에, 연속 배양이 시작되었다. 선택한 공급 속도는 μ=D=0.015 h-1에 대해 9 mL h-1이었고 배양 부피는 0.6 L로 일정하게 유지되었다. 이는 수준 센서를 사용하고 부피가 0.6 L를 초과할 때마다 추가 배양액을 반응기 외부로 자동 펌핑하여 수행했다. 정상 상태 조건으로 허용되는 반응기 부피의 5 부피 변화에 해당하는 333시간 후에 샘플을 채취했다.
효모 건조 질량(YDM) 및 분비된 재조합 단백질을 실시예 7b에 기재된 바와 같이 선택된 샘플링 지점에서 분석하였다. 또한, 전사 수준 분석을 위한 샘플을 실시예 6a에 기재된 바와 같이 채취하였다. 또한, 1 mL 배양물을 16,000 g에서 5분 동안 원심분리하여 만든 세포 펠릿을 수집하고, 상청액을 버리고 펠릿을 -20℃에 보관했다. 이들은 실시예 8c에 기술된 총 단백질 측정을 위해 사용되었다.
표 22는 상술한 케모스타트의 결과를 보여준다. 이 고정되고 느린 성장률과 정상 상태 조건에서도, 역가는 TIF 과발현 시 최대 1.75배 더 높은 반면, 바이오매스 농도(YDM)는 대조군 숙주 균주와 유사했다. 비 생산성은 숙주 균주에 비해 C3b 과발현 균주에서 1.5 내지 1.8배 증가하였다. 이것은 유가 배양(실시예 7)에서 보이는 재조합 단백질 생산에 대한 TIF 과발현의 긍정적인 효과가 연속 배양에서도 달성될 수 있음을 입증한다.
표 22: 숙주 균주 CBS2612 PG1-3 vHH #4 및 C3b 과발현 균주에 대한 vHH 역가, YDM 및 vHH의 비 생산성.
Figure pct00024
b) 연속 배양에서 번역 인자 과발현이 전사 수준에 미치는 영향.
C3b 과발현의 효과를 추가로 설명하기 위해, 전사 수준을 실시예 6a에 기재된 절차로 측정하였다. 위에서 설명한 것처럼 전사 수준은 S. 세레비지애 ACT1에 대해 정규화되었다. 또한, PpACT1 및 vHH에 대한 상대 전사 수준의 배수 변화를 수신하기 위해 숙주 균주인 반응기 C050에 대해 정규화하였다.
C3b의 과발현은 vHH의 상대 전사 수준을 1.40 ± 0.04배 더 높였다. PpACT1은 1.46 ± 0.04의 유사한 배수 변화를 보였다. 이것은 스크리닝 및 유가 배양에서 얻은 결과를 확인시켜주며, 전사 수준이 일반적으로 적용된 배양 모드와 무관하게 선택된 번역 개시 인자를 과발현하는 세포에서 증가한다는 것을 보여준다.
c) 총 단백질 농도의 결정.
증가된 전사 수준의 효과가 세포의 총 단백질 농도에 영향을 미치는지 확인하기 위해 뷰레(Biuret) 방법을 사용했다.
간략하게, 실시예 8a에 기재된 수집된 세포 펠릿을 물로 3회 세척하였다. 그런 다음 물로 희석하여 각 튜브에 8 mg mL-1 YDM을 넣었다. 샘플당 세포 현탁액 240 μL를 2회 125 μL의 3M NaOH와 혼합하고 99℃에서 5분 동안 끓였다. 냉각 후, 125 μL 2.5% CuSO4를 첨가하고 샘플을 16,000 g에서 5분 동안 원심분리했다. 얻어진 상청액 중 555 nm의 파장에서 테칸 판독기(Tecan Infinite M200)에서 측정을 위해 튜브당 200 μL를 2회 사용하였다. 검량선의 경우, 소 혈청 알부민 희석액(분자 생물학의 경우 알부민 분율 V ≥ 98%)(13, 12, 10, 8, 6, 4, 2, 1 및 0 g L-1)을 샘플과과 같은 방식으로 처리했다.
숙주 균주 CBS2612 PG1-3 vHH #4가 있는 2개의 반응기는 건조 질량 mg당 0.24 ± 0.00 mg의 단백질을 생산한 반면, 과발현 균주인 CBS2612 PG1-3 vHH C3b #13이 있는 2개의 반응기는 건조 질량 mg당 0.29 ± 0.00 mg의 단백질을 생산했다. 과발현 균주에서 관찰된 총 단백질의 1.2배 증가는 전사 수준의 증가가 세포 내 총 단백질의 증가를 초래함을 나타낸다. 그러나, 재조합 POI에 대한 효과는 전체 세포 단백질(1.2배)보다 훨씬 더 강하고(1.8배), 이는 mRNP의 TIF가 재조합 단백질 생산 동안 제한적이라는 본원의 놀라운 발견을 다시 한 번 강조하고 그들의 과발현은 더 높은 생산성을 초래한다.
실시예 9: 다른 모델 단백질의 분비에 대한 TIF의 과발현 효과.
인간 혈청 알부민(HSA)은 TIF 과발현의 효과를 확인하기 위한 또 다른 모델 단백질로 선택되었다.
a) HSA 생산자 균주의 생성
실시예 1a에 기재된 바와 같이, PG1-3_HSA에 대한 발현 카세트를 CBS2612로 형질전환시켜 HSA 생산 균주를 생성하였다. 생성된 균주를 실시예 2a에 기재된 바와 같이 스크리닝하고 실시예 2c에 기재된 바와 같이 미세유체 모세관 전기영동(mCE)에 의해 역가를 결정하였다. 상이한 생산성을 갖는 2개의 HSA 생성 클론을 TIF 과발현을 위한 숙주로 선택하였다. CBS2612 PG1-3 HSA #15는 평균 생산자 숙주 균주로 선택되었고, CBS2612 PG1-3 HSA #10은 높은 생산자 숙주 균주로 선택되었다. 이들 2개의 균주를 사중으로 재스크리닝하였고 그 결과를 표 23에서 볼 수 있다. 또한, 생산성의 차이를 설명하기 위해 이들 균주의 GCN을 결정하였다. GCN 측정은 실시예 1d에 따라 수행하였다.
표 23: 후속 TIF 과발현을 위한 숙주 균주로 사용하기 위해 1차 스크리닝에서 2개의 클론을 선택하였다. 역가, WCW 및 수율은 선택된 2개의 클론의 4회 반복하여 재스크리닝에서 얻어졌다. 추가로 이들 2개의 숙주 균주에서 재조합 단백질 발현 카세트에 대해 결정된 GCN이 제시되어 있다.
Figure pct00025
표 23에 나타난 역가는 사중반복의 평균을 보여준다. 높은 생산자는 평균 생산자보다 5배 이상 더 많이 생산하며 이는 더 높은 GCN과 잘 연관된다. 두 균주 모두 선택된 번역 개시 인자 구성물의 과발현에 사용되었다.
b) TIF 과발현 균주의 생성 및 HSA 분비에 미치는 영향
조합된 과발현 C3b는 실시예 9a에 기술된 2개의 HSA 생산 균주에서 테스트하기 위해 선택되었다. 실시예 1에 기술된 바와 같이 클로닝을 수행한 후, 실시예 2a 및 2c에 기술된 바와 같이 스크리닝한 후 역가 결정을 수행하였다.
표 24: 2개의 상이한 선택된 HSA 생산자 균주에서 C3b 과발현의 스크리닝 결과. HSA 역가, WCW 및 HSA 수율 외에도 HSA 수율의 배수 변화도 표시된다. 배수 변화는 각각의 숙주 균주인 CBS2612 PG1-3 HSA #10 또는 #15와 비교하여 계산되었다. 또한 스크리닝에 사용된 클론의 수가 표시된다.
Figure pct00026
스크리닝 결과를 표 24에 나타낸다. 2개의 생산자 숙주 균주 사이의 절대 HSA 역가의 차이에도 불구하고, TIF C3b 과발현의 영향은 1.4배 증가하여 거의 동일하다. 이는 TIF 과발현이 평균 균주 뿐만 아니라 고생산 균주에서도 재조합 단백질 분비를 증가시키는 효과가 있음을 보여준다. 추가로, 표 24의 결과는 C3b 과발현이 상기 실시예에서 확인된 바와 같이 vHH뿐만 아니라 HSA에 대한 재조합 단백질 분비를 증가시켜 재조합 단백질 생산에 대한 TIF 과발현의 일반적인 긍정적 영향의 개념을 강화함을 보여준다.
c) TIF를 과발현하는 HSA 생산자 균주의 유가식 배양
다음으로, HSA 숙주 균주 및 상응하는 C3b 과발현 균주를 유가식 배양에 사용하였다. 실시예 7에 기술된 바와 같이 유가식 배양을 수행하였다. 이 경우, 선형 증분 글루코스 공급에 대해 다음 방정식을 사용하였다: F[mL h-1] = 0.01*t + 2. 이것은 샘플링 지점 F9에서 0.029h-1의 대략적인 성장률을 산출하였다.
표 25: 유가식 배양 실행, A499-A502의 YDM, 역가 및 수율의 FC를 여기에서 볼 수 있다. 샘플은 2개의 다른 시점에서 채취되었다. FC 역가/수율은 동일한 시점에서 숙주 균주 역가/수율과 비교한 과발현 구성물 역가/수율의 배수 변화이다.
Figure pct00027
다른 모델 단백질 및 균주에 대해, 표 25에서 볼 수 있는 바와 같이 C3b 과발현은 두 생산자 숙주 균주 모두에서 재조합 HSA 분비 수율을 증가시켰다. 특히, 분비 단백질의 증가는 고 생산자 균주인 CBS2612 PG1-3 HSA #10에서 1.9배 증가하면서 훨씬 더 확연하다. 이는 mRNP의 TIF가 재조합 단백질 발현 능력이 더 높은 세포에 더 강한 병목 현상을 일으키고(예를 들어, 더 높은 발현 강도를 가진 더 높은 GCN 및/또는 프로모터로 인해 더 높은 전사에 의해), 이러한 세포가 TIF 과발현에 의해 훨씬 더 많은 혜택을 받는다는 결론으로 이어진다.
SEQUENCE LISTING <110> Lonza Ltd. <120> HOST CELLS OVEREXPRESSING TRANSLATIONAL FACTORS <130> LO011P <160> 196 <170> PatentIn version 3.5 <210> 1 <211> 202 <212> PRT <213> Komagataella phaffii <400> 1 Met Ser Glu Thr Glu Asn Ala Pro His Glu Lys Ser Leu Leu Asp Asp 1 5 10 15 Gln Val Asp Phe Thr Val Lys His Pro Leu Asn Ser Glu Trp Thr Leu 20 25 30 Trp Tyr Thr Lys Pro Ala Val His Glu Gln Glu Ser Trp Ser Asp Leu 35 40 45 Leu Arg Pro Ile Ile Ser Phe Asn Ser Val Glu Glu Phe Trp Gly Ile 50 55 60 Phe Asn Ser Ile Pro Lys Ala Ser Asp Leu Pro Val Lys Ser Asp Tyr 65 70 75 80 His Leu Phe Arg Asp Gly Ile Lys Pro Glu Trp Glu Asp Glu Arg Asn 85 90 95 Ala Asn Gly Gly Lys Leu Thr Tyr Gln Phe Ala Tyr Arg Lys Val Asp 100 105 110 Ile Asn Glu Leu Trp Ser Arg Gly Leu Leu Ser Val Ile Gly Glu Thr 115 120 125 Ile Gln Asp Asp Asp Gly Glu Thr Glu Val Asn Gly Ile Val Leu Ser 130 135 140 Ile Arg Arg Ala Ala Leu Lys Ile Ala Leu Trp Thr Lys Ser Lys Asp 145 150 155 160 Glu Ala Val Leu Arg Pro Ile Gly Glu Arg Phe Lys Lys Val Leu Lys 165 170 175 Leu Thr Ala Arg Asp His Ile Asp Phe Gln Pro His Lys Ser Gly Ala 180 185 190 Gly Ser Lys Asn Val Pro Ser Phe Ser Ile 195 200 <210> 2 <211> 202 <212> PRT <213> Komagatealla pastoris <400> 2 Met Ser Glu Thr Glu Asn Ala Pro His Glu Lys Ser Leu Leu Asp Asp 1 5 10 15 Gln Val Asp Phe Thr Val Lys His Pro Leu Asn Ser Glu Trp Thr Leu 20 25 30 Trp Tyr Thr Lys Pro Ala Val His Glu Gln Glu Ser Trp Ser Asp Leu 35 40 45 Leu Arg Pro Ile Ile Ser Phe Asn Ser Val Glu Glu Phe Trp Gly Ile 50 55 60 Phe Asn Ser Ile Pro Lys Ala Ser Asp Leu Pro Val Lys Ser Asp Tyr 65 70 75 80 His Leu Phe Arg Asp Gly Ile Lys Pro Glu Trp Glu Asp Glu Arg Asn 85 90 95 Ala Asn Gly Gly Lys Leu Thr Tyr Gln Phe Ala Tyr Arg Lys Val Asp 100 105 110 Ile Asn Glu Leu Trp Ser Arg Gly Leu Leu Ser Val Ile Gly Glu Thr 115 120 125 Ile Gln Asp Asp Asp Gly Glu Thr Glu Val Asn Gly Ile Val Leu Ser 130 135 140 Ile Arg Arg Ala Ala Leu Lys Ile Ala Leu Trp Thr Lys Ser Lys Asp 145 150 155 160 Glu Ala Val Leu Arg Pro Ile Gly Glu Arg Phe Lys Lys Val Leu Lys 165 170 175 Leu Thr Ala Arg Asp His Ile Asp Phe Gln Pro His Lys Ser Gly Ala 180 185 190 Gly Ser Lys Asn Val Pro Ser Phe Ser Ile 195 200 <210> 3 <211> 217 <212> PRT <213> Homo sapiens <400> 3 Met Ala Thr Val Glu Pro Glu Thr Thr Pro Thr Pro Asn Pro Pro Thr 1 5 10 15 Thr Glu Glu Glu Lys Thr Glu Ser Asn Gln Glu Val Ala Asn Pro Glu 20 25 30 His Tyr Ile Lys His Pro Leu Gln Asn Arg Trp Ala Leu Trp Phe Phe 35 40 45 Lys Asn Asp Lys Ser Lys Thr Trp Gln Ala Asn Leu Arg Leu Ile Ser 50 55 60 Lys Phe Asp Thr Val Glu Asp Phe Trp Ala Leu Tyr Asn His Ile Gln 65 70 75 80 Leu Ser Ser Asn Leu Met Pro Gly Cys Asp Tyr Ser Leu Phe Lys Asp 85 90 95 Gly Ile Glu Pro Met Trp Glu Asp Glu Lys Asn Lys Arg Gly Gly Arg 100 105 110 Trp Leu Ile Thr Leu Asn Lys Gln Gln Arg Arg Ser Asp Leu Asn Arg 115 120 125 Phe Trp Leu Glu Thr Leu Leu Cys Leu Ile Gly Glu Ser Phe Asp Asp 130 135 140 Tyr Ser Asp Asp Val Cys Gly Ala Val Val Asn Val Arg Ala Lys Gly 145 150 155 160 Asp Lys Ile Ala Ile Trp Thr Thr Glu Cys Glu Asn Arg Glu Ala Val 165 170 175 Thr His Ile Gly Arg Val Tyr Lys Glu Arg Leu Gly Leu Pro Pro Lys 180 185 190 Ile Val Ile Gly Tyr Gln Ser His Ala Asp Thr Ala Thr Lys Ser Gly 195 200 205 Ser Thr Thr Lys Asn Arg Phe Val Val 210 215 <210> 4 <211> 247 <212> PRT <213> Aspergillus niger <400> 4 Met Ala Ala Val Ala Glu Asn Gly His Ala Pro Val Ala Asp Glu Asn 1 5 10 15 Ala Ala Pro Val Ala Ala Ala Val Glu Gln Lys Glu Gln Thr Glu Lys 20 25 30 Thr Asn Gly Asp Ser Val Thr Val Phe His Asp Pro Glu Asn Phe Asn 35 40 45 Val Lys His Pro Leu Met His Glu Trp Thr Leu Trp Phe Thr Lys Pro 50 55 60 Pro Ser Gly Lys Gly Asp Asn Trp Asn Asp Leu Leu Lys Glu Val Val 65 70 75 80 Thr Phe Asn Ser Val Glu Glu Phe Trp Gly Ile Tyr Asn Asn Ile Ser 85 90 95 Pro Thr Ser Glu Leu Gly Leu Lys Ala Asp Tyr His Leu Phe Lys Lys 100 105 110 Gly Val Arg Pro Glu Trp Glu Asp Pro Gln Asn Lys His Gly Gly Lys 115 120 125 Trp Ser Tyr Ser Phe Lys Asp Lys Arg Ser Val Pro Ile Asp Asp Leu 130 135 140 Trp Leu His Ala Gln Leu Ala Ala Ile Gly Glu Thr Leu Glu Asn Asp 145 150 155 160 Gly Asp Asn Glu Val Met Gly Val Val Val Asn Val Arg Lys Gly Phe 165 170 175 Tyr Arg Val Gly Leu Trp Thr Arg Thr Val Gly Lys Ser Ile Pro Gly 180 185 190 Asp Lys Asn Gly Arg Thr Pro Ala Gln Gly Lys Glu Ile Leu Glu Asn 195 200 205 Ile Gly Arg Arg Phe Lys Glu Val Leu Arg Leu Lys Glu Ala Asp Ala 210 215 220 Val Glu Phe Ser Gly His Thr Asp Ser Ala His Ser Gly Ser Thr Arg 225 230 235 240 Ala Lys Ala Lys Tyr Thr Val 245 <210> 5 <211> 212 <212> PRT <213> Cricetulus griseus <400> 5 Met Glu Thr Thr Pro Thr Thr Asn Pro Pro Pro Val Glu Glu Glu Lys 1 5 10 15 Thr Glu Ser Asn Gln Glu Val Ala Asn Pro Glu His Tyr Ile Lys His 20 25 30 Pro Leu Gln Asn Arg Trp Ala Leu Trp Phe Phe Lys Asn Asp Lys Ser 35 40 45 Lys Thr Trp Gln Ala Asn Leu Arg Leu Ile Ser Lys Phe Asp Thr Val 50 55 60 Glu Asp Phe Trp Ala Leu Tyr Asn His Ile Gln Leu Ser Ser Asn Leu 65 70 75 80 Met Pro Gly Cys Asp Tyr Ser Leu Phe Lys Asp Gly Ile Glu Pro Met 85 90 95 Trp Glu Asp Glu Lys Asn Lys Arg Gly Gly Arg Trp Leu Ile Thr Leu 100 105 110 Asn Lys Gln Gln Arg Arg Ser Asp Leu Asp Arg Phe Trp Leu Glu Thr 115 120 125 Leu Leu Cys Leu Ile Gly Glu Ser Phe Asp Asp Tyr Ser Asp Asp Val 130 135 140 Cys Gly Ala Val Val Asn Val Arg Ala Lys Gly Asp Lys Ile Ala Ile 145 150 155 160 Trp Thr Thr Glu Cys Glu Asn Arg Asp Ala Val Thr His Ile Gly Arg 165 170 175 Val Tyr Lys Glu Arg Leu Gly Leu Pro Pro Lys Ile Val Ile Gly Tyr 180 185 190 Gln Ser His Ala Asp Thr Ala Thr Lys Ser Gly Ser Thr Thr Lys Asn 195 200 205 Arg Phe Val Val 210 <210> 6 <211> 210 <212> PRT <213> Kluyveromyces lactis <400> 6 Met Ser Val Glu Glu Val Thr Gln Lys Thr Gln Asp Leu Thr Val Asp 1 5 10 15 Glu Ala Lys Pro Ala Thr Val Leu Ser Asp Ser Lys Glu Phe Gln Leu 20 25 30 Lys His Pro Leu Ser Ser Lys Trp Thr Leu Trp Tyr Thr Lys Pro Pro 35 40 45 Val Asp Ser Ser Glu Ser Trp Ser Asp Leu Leu Arg Pro Val Thr Ser 50 55 60 Leu Asp Thr Val Glu Glu Phe Trp Ala Ile Gln Asn Gly Ile Pro Lys 65 70 75 80 Pro Phe Asp Leu Pro Ile Lys Ser Asp Tyr His Leu Phe Arg Asn Asp 85 90 95 Ile Arg Pro Glu Trp Glu Asp Glu Ala Asn Ser Glu Gly Gly Lys Leu 100 105 110 Ser Tyr Gln Phe Lys Asn Lys Arg His Asn Ile Asp Asp Leu Trp Leu 115 120 125 Arg Thr Leu Leu Ala Val Ile Gly Glu Thr Ile Asp Glu Glu Glu Ser 130 135 140 Glu Ile Asn Gly Cys Val Leu Asn Val Arg Lys Ala Val Phe Lys Ile 145 150 155 160 Ala Leu Trp Thr Arg Thr Thr Asn Leu Asn Ala Leu Thr Asn Ile Ala 165 170 175 Thr Lys Phe Lys Gln Val Leu Gln Leu Gly Glu Gly Glu Lys Leu Glu 180 185 190 Phe Tyr Asn His Arg Thr Ser Asn Ser Gly His Ala Pro Pro Thr Ala 195 200 205 Leu Leu 210 <210> 7 <211> 211 <212> PRT <213> Ogataea polymorpha <400> 7 Met Ser Glu Glu Leu Asn Gln Ala Ala Lys Asp Leu Ser Leu Asp Glu 1 5 10 15 Lys Lys Asp Val Thr Val Leu Asp Ser Arg Glu Glu Phe Asn Val Lys 20 25 30 His Pro Leu Asn Ser Lys Trp Thr Leu Trp Tyr Thr Lys Pro Ala Val 35 40 45 Asp Ser Ser Glu Ser Trp Ser Asp Leu Leu Lys Pro Val Val Ala Phe 50 55 60 Asp Thr Val Glu Glu Phe Trp Gly Ile Phe Asn Ser Ile Pro Lys Ala 65 70 75 80 Asp Glu Leu Pro Leu Lys Ser Asp Tyr His Leu Phe Arg Glu Asn Ile 85 90 95 Lys Pro Glu Trp Glu Asp Pro Ala Asn Ser Lys Gly Gly Arg Phe Ser 100 105 110 Phe Gln Phe Lys Gly Lys Arg Leu Glu His Gly Ile Asn Glu Ile Trp 115 120 125 Thr Arg Ala Leu Leu Ser Val Ile Gly Glu Thr Ile Glu Asp Asp Gln 130 135 140 Asn Glu Val Asn Gly Val Val Leu Asn Val Arg Lys Val Gly Tyr Arg 145 150 155 160 Val Cys Leu Trp Thr Lys Ser Cys Asp Arg Ala Ala Leu Val Pro Ile 165 170 175 Gly Glu Arg Leu Lys Lys Ile Leu Met Leu Arg Glu Gly Glu Ser Val 180 185 190 Glu Phe Ile Ser His Lys Asp Ser Asn Asp Arg Gly Ala Lys Pro Ala 195 200 205 Phe Tyr Val 210 <210> 8 <211> 213 <212> PRT <213> Saccharomyces cerevisiae <400> 8 Met Ser Val Glu Glu Val Ser Lys Lys Phe Glu Glu Asn Val Ser Val 1 5 10 15 Asp Asp Thr Thr Ala Thr Pro Lys Thr Val Leu Ser Asp Ser Ala His 20 25 30 Phe Asp Val Lys His Pro Leu Asn Thr Lys Trp Thr Leu Trp Tyr Thr 35 40 45 Lys Pro Ala Val Asp Lys Ser Glu Ser Trp Ser Asp Leu Leu Arg Pro 50 55 60 Val Thr Ser Phe Gln Thr Val Glu Glu Phe Trp Ala Ile Ile Gln Asn 65 70 75 80 Ile Pro Glu Pro His Glu Leu Pro Leu Lys Ser Asp Tyr His Val Phe 85 90 95 Arg Asn Asp Val Arg Pro Glu Trp Glu Asp Glu Ala Asn Ala Lys Gly 100 105 110 Gly Lys Trp Ser Phe Gln Leu Arg Gly Lys Gly Ala Asp Ile Asp Glu 115 120 125 Leu Trp Leu Arg Thr Leu Leu Ala Val Ile Gly Glu Thr Ile Asp Glu 130 135 140 Asp Asp Ser Gln Ile Asn Gly Val Val Leu Ser Ile Arg Lys Gly Gly 145 150 155 160 Asn Lys Phe Ala Leu Trp Thr Lys Ser Glu Asp Lys Glu Pro Leu Leu 165 170 175 Arg Ile Gly Gly Lys Phe Lys Gln Val Leu Lys Leu Thr Asp Asp Gly 180 185 190 His Leu Glu Phe Phe Pro His Ser Ser Ala Asn Gly Arg His Pro Gln 195 200 205 Pro Ser Ile Thr Leu 210 <210> 9 <211> 243 <212> PRT <213> Schizosaccharomyces pombe <400> 9 Met Ala Asp Ala Glu Asp Ser Arg His Ser Lys Asn Glu Gly Phe Pro 1 5 10 15 Asn Thr Ser Leu Ile Thr Glu Lys Leu Asp Leu Leu Asp Leu Phe Gly 20 25 30 Ser Pro Lys Val Lys Thr Glu Arg Glu Gly Arg Pro Ala Arg Leu Leu 35 40 45 Glu Gly Leu Ser Ala Val Asn Ala Glu Thr Ala Phe Val Lys Thr His 50 55 60 Pro Leu Gln His Glu Trp Thr Leu Trp Phe Leu Lys Pro Pro Thr Gln 65 70 75 80 Gly Leu Glu Trp Ser Asp Leu Leu Lys Glu Ile Ile Ser Phe Lys Thr 85 90 95 Val Glu Glu Phe Trp Gly Ile Phe Lys Thr Ile Ser Lys Ala Ser Met 100 105 110 Leu Pro Ala Lys Ser Asp Tyr Ser Tyr Phe Leu Lys Gly Ile Arg Pro 115 120 125 Glu Trp Glu Asp Pro Gln Asn Met Asn Gly Gly Lys Trp Ala Tyr Gln 130 135 140 Ser Lys His Lys Gly Ser Asn Leu Asp Glu Leu Trp Leu Tyr Met Val 145 150 155 160 Leu Ala Ala Ile Gly Glu Thr Leu Asp Pro Thr Gly Lys Glu Val Thr 165 170 175 Gly Val Val Cys Asn Met Arg Lys Gly Phe Tyr Arg Ile Ala Val Trp 180 185 190 Thr Arg Asn Cys Asn Asp Lys Asp Val Leu Glu Lys Ile Gly Leu Arg 195 200 205 Phe Lys Glu Val Leu Gly Ile Ser Asp Lys Glu Thr Ile Glu Tyr Ser 210 215 220 Ala His Glu Asp Ser Ser Lys Ala Gly Ser Met Arg Ala Lys Thr Arg 225 230 235 240 Met Ser Leu <210> 10 <211> 259 <212> PRT <213> Trichoderma reesei <400> 10 Met Ala Ser Ala Ala Val Asp Gly Ala Asn Met Asp Gln Gln Val Asp 1 5 10 15 Leu Thr Ser Ile Pro Ile Ser Pro Asn Gly Asp Glu His Ala Gly Glu 20 25 30 Thr Lys Glu Asn Lys Asp Asp Gly Lys Pro Val Thr Val Phe His Asp 35 40 45 Lys Asp Asn Phe Thr Val Lys His Pro Leu Gln Ser Lys Trp Thr Leu 50 55 60 Trp Phe Thr Lys Pro Pro Ser Gly Lys Gly Asp Asn Trp Asn Asp Leu 65 70 75 80 Leu Lys Glu Val Ile Thr Phe Asp Ser Val Glu Glu Phe Trp Gly Val 85 90 95 Tyr Asn Asn Val Ala Pro Val Ser Glu Leu Ala Leu Lys Ser Asp Tyr 100 105 110 His Leu Phe Lys Ala Gly Val Arg Pro Glu Trp Glu Asp Pro Gln Asn 115 120 125 Lys His Gly Gly Lys Trp Ser Tyr Gln Tyr Lys Asp Lys Arg Asn Val 130 135 140 Asp Val Asp Arg Leu Trp Leu Gln Val Met Met Ala Ala Ile Gly Glu 145 150 155 160 Thr Leu Glu Glu Glu Glu Asp Gly Glu Val Met Gly Val Val Val Asn 165 170 175 Val Arg Lys Gly Phe Tyr Arg Ile Gly Val Trp Thr Arg Thr Ile Gly 180 185 190 Lys Ser Ile Pro Gly Arg Gly Asp Gly Asp Val Ala Gly Gly Lys Gly 195 200 205 Arg Ser Asn Glu Lys Gly Lys Glu Ile Leu Met Asn Ile Gly Arg Arg 210 215 220 Phe Lys Glu Thr Leu Glu Leu Pro Ala Asn Glu Gln Ile Glu Phe Ser 225 230 235 240 Gly His Thr Asp Ser Ala His Ala Gly Ser Thr Arg Ala Lys Ala Lys 245 250 255 Tyr Val Val <210> 11 <211> 278 <212> PRT <213> Yarrowia lipolytica <400> 11 Met Ser Thr Met Ala Ile Gln Thr Asp Val Ser Val Ile Ser Thr Asp 1 5 10 15 Ile Ala Leu Gln Leu Ser Gln Met Ala Ala Thr Thr Asp Asn Val Thr 20 25 30 Glu Ala Val Ala Asn Leu Asn Ile Lys Glu Glu Ala Pro Val Ala Ser 35 40 45 Glu Pro Ala Glu Val Thr Glu Thr Val Glu Glu Glu Val Thr Pro Ala 50 55 60 Glu Pro Phe Ser Thr Val Phe Asp Ser Lys Thr Glu Phe Ala Thr Val 65 70 75 80 His Lys Leu Thr Thr Pro Trp Thr Leu Trp Tyr Ile Lys Pro Pro Ser 85 90 95 Pro Ala Val Ala Trp His Asp Leu Ile Lys Glu Val Val Ser Phe Asp 100 105 110 Thr Val Glu Gly Phe Trp Ala Val Tyr Asn Asn Ile Pro Lys Leu Val 115 120 125 Glu Leu Pro Ile Arg Ser Asp Tyr Ala Phe Phe Arg Lys Gly Ile Arg 130 135 140 Pro Glu Trp Glu Cys Asp Ser Asn Lys Ala Gly Gly Lys Trp Phe Tyr 145 150 155 160 Gln Phe Lys Pro Lys Ser Ala Asn Glu Phe Asp Glu Ile Trp Leu His 165 170 175 Thr Val Leu Ser Val Ile Gly Glu Ser Leu Glu Thr Asp Glu Glu Ile 180 185 190 Ala Lys His Glu Gly Lys Tyr Asn Asn Val Asp Gly Ser Ala Ser Asn 195 200 205 Val Asn Gly Ile Phe Val Asn Ile Arg Lys Ala Gly Val Arg Phe Asn 210 215 220 Val Trp Thr Lys Thr Ser Glu Val Thr Asp Glu Leu Arg Gln Met Gly 225 230 235 240 Val Lys Ile Lys Gln Val Leu Arg Leu Pro Glu Lys Glu Glu Val Gln 245 250 255 Phe Gln Ser His Glu Glu Ser Ala Ser Lys Asn Val Lys Ser Gln Gly 260 265 270 Lys Thr Arg Leu Ala Val 275 <210> 12 <211> 403 <212> PRT <213> Komagataella phaffii <400> 12 Met Ser Glu Gly Ile Ile Glu Ile Asp Thr Asn Leu Ile Glu Thr Asn 1 5 10 15 Tyr Asp Gln Val Val Ser Thr Phe Asp Glu Leu Asn Leu Lys Glu Gln 20 25 30 Ile Leu Arg Ala Val Phe Ala Tyr Gly Tyr Glu Phe Pro Ser Ala Ile 35 40 45 Gln Ser Arg Ala Ile Leu Pro Ile Val Ala Gly Arg Asp Val Leu Ala 50 55 60 Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ala Ile Ser Ala 65 70 75 80 Leu Gln Arg Leu Asp Glu Lys Leu Lys Ala Ala Gln Val Leu Ile Leu 85 90 95 Ala Pro Thr Arg Glu Leu Ala Leu Gln Ile Lys Lys Val Val Leu Ala 100 105 110 Leu Gly Met His Leu Asn Ile Ser Val His Ala Cys Ile Gly Gly Val 115 120 125 Asp Pro Ala Leu Asp Val Lys Ala Phe Asn Ser Gly Val Gln Ile Val 130 135 140 Val Gly Thr Pro Gly Arg Val Gln Asp Met Ile Glu Arg Gly Ala Phe 145 150 155 160 Arg Thr Glu Asn Val Lys Met Val Ile Leu Asp Glu Ala Asp Glu Met 165 170 175 Leu Ser Thr Gly Phe Lys Glu Gln Ile Tyr Thr Leu Phe Thr Leu Leu 180 185 190 Pro Ser Thr Thr Gln Val Val Leu Leu Ser Ala Thr Met Pro Gln Glu 195 200 205 Val Leu Glu Val Thr Thr Lys Phe Met Asn Asn Pro Ile Arg Ile Leu 210 215 220 Val Lys Lys Asp Gln Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr Val 225 230 235 240 Asp Val Gly Glu Glu Gln Tyr Lys Phe Asp Cys Leu Cys Asp Leu Tyr 245 250 255 Asp Ser Ile Ser Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg Arg 260 265 270 Lys Val Glu Glu Leu Thr Glu Arg Leu Thr Ala Gln Lys Phe Thr Val 275 280 285 Ser Ala Ile His Ser Glu Leu Ser Gln Thr Glu Arg Asp Thr Ile Met 290 295 300 Gln Glu Phe Arg Thr Gly Ser Ser Arg Ile Leu Ile Ser Thr Asp Leu 305 310 315 320 Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Tyr 325 330 335 Asp Leu Pro Ser Asn Lys Glu Asn Tyr Ile His Arg Ile Gly Arg Gly 340 345 350 Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val Thr Ser Lys 355 360 365 Asp Val Glu Met Met Lys Glu Ile Glu Lys Phe Tyr Ser Thr Gln Ile 370 375 380 Asp Glu Leu Pro Ser Ser Ile Thr Asp Leu Phe Glu Thr Glu Glu Val 385 390 395 400 Asn Glu Ser <210> 13 <211> 403 <212> PRT <213> Komagataella pastoris <400> 13 Met Ser Glu Gly Ile Ile Glu Ile Asp Thr Asn Leu Ile Glu Thr Asn 1 5 10 15 Tyr Asp Gln Val Val Ser Thr Phe Asp Glu Leu Asn Leu Lys Glu Gln 20 25 30 Ile Leu Arg Ala Val Phe Ala Tyr Gly Tyr Glu Phe Pro Ser Ala Ile 35 40 45 Gln Ser Arg Ala Ile Leu Pro Ile Val Ala Gly Arg Asp Val Leu Ala 50 55 60 Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ala Ile Ser Ala 65 70 75 80 Leu Gln Arg Leu Asp Glu Lys Leu Lys Ala Ala Gln Val Leu Ile Leu 85 90 95 Ala Pro Thr Arg Glu Leu Ala Leu Gln Ile Lys Lys Val Val Leu Ala 100 105 110 Leu Gly Met His Leu Asn Ile Ser Val His Ala Cys Ile Gly Gly Val 115 120 125 Asp Pro Ala Leu Asp Val Lys Ala Phe Asn Ser Gly Val Gln Ile Val 130 135 140 Val Gly Thr Pro Gly Arg Val Gln Asp Met Ile Glu Arg Gly Ala Phe 145 150 155 160 Arg Thr Glu Asn Val Lys Met Val Ile Leu Asp Glu Ala Asp Glu Met 165 170 175 Leu Ser Thr Gly Phe Lys Glu Gln Ile Tyr Thr Leu Phe Thr Leu Leu 180 185 190 Pro Ser Thr Thr Gln Val Val Leu Leu Ser Ala Thr Met Pro Gln Glu 195 200 205 Val Leu Glu Val Thr Thr Lys Phe Met Asn Asn Pro Ile Arg Ile Leu 210 215 220 Val Lys Lys Asp Gln Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr Val 225 230 235 240 Asp Val Gly Glu Glu Gln Tyr Lys Phe Asp Cys Leu Cys Asp Leu Tyr 245 250 255 Asp Ser Ile Ser Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg Arg 260 265 270 Lys Val Glu Glu Leu Thr Glu Arg Leu Thr Ala Gln Lys Phe Thr Val 275 280 285 Ser Ala Ile His Ser Glu Leu Ser Gln Ser Glu Arg Asp Thr Ile Met 290 295 300 Gln Glu Phe Arg Thr Gly Ser Ser Arg Ile Leu Ile Ser Thr Asp Leu 305 310 315 320 Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Tyr 325 330 335 Asp Leu Pro Ser Asn Lys Glu Asn Tyr Ile His Arg Ile Gly Arg Gly 340 345 350 Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val Thr Ser Lys 355 360 365 Asp Val Glu Met Met Lys Glu Ile Glu Lys Phe Tyr Ser Thr Gln Ile 370 375 380 Asp Glu Leu Pro Ser Ser Ile Thr Asp Leu Phe Glu Thr Glu Glu Val 385 390 395 400 Asn Glu Ser <210> 14 <211> 413 <212> PRT <213> Homo sapiens <400> 14 Met Ala Thr Thr Ala Thr Met Ala Thr Ser Gly Ser Ala Arg Lys Arg 1 5 10 15 Leu Leu Lys Glu Glu Asp Met Thr Lys Val Glu Phe Glu Thr Ser Glu 20 25 30 Glu Val Asp Val Thr Pro Thr Phe Asp Thr Met Gly Leu Arg Glu Asp 35 40 45 Leu Leu Arg Gly Ile Tyr Ala Tyr Gly Phe Glu Lys Pro Ser Ala Ile 50 55 60 Gln Gln Arg Ala Ile Lys Gln Ile Ile Lys Gly Arg Asp Val Ile Ala 65 70 75 80 Gln Ser Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser Ile Ser Val 85 90 95 Leu Gln Cys Leu Asp Ile Gln Val Arg Glu Thr Gln Ala Leu Ile Leu 100 105 110 Ala Pro Thr Arg Glu Leu Ala Val Gln Ile Gln Lys Gly Leu Leu Ala 115 120 125 Leu Gly Asp Tyr Met Asn Val Gln Cys His Ala Cys Ile Gly Gly Thr 130 135 140 Asn Val Gly Glu Asp Ile Arg Lys Leu Asp Tyr Gly Gln His Val Val 145 150 155 160 Ala Gly Thr Pro Gly Arg Val Phe Asp Met Ile Arg Arg Arg Ser Leu 165 170 175 Arg Thr Arg Ala Ile Lys Met Leu Val Leu Asp Glu Ala Asp Glu Met 180 185 190 Leu Asn Lys Gly Phe Lys Glu Gln Ile Tyr Asp Val Tyr Arg Tyr Leu 195 200 205 Pro Pro Ala Thr Gln Val Val Leu Ile Ser Ala Thr Leu Pro His Glu 210 215 220 Ile Leu Glu Met Thr Asn Lys Phe Met Thr Asp Pro Ile Arg Ile Leu 225 230 235 240 Val Lys Arg Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Phe Val 245 250 255 Ala Val Glu Arg Glu Glu Trp Lys Phe Asp Thr Leu Cys Asp Leu Tyr 260 265 270 Asp Thr Leu Thr Ile Thr Gln Ala Val Ile Phe Cys Asn Thr Lys Arg 275 280 285 Lys Val Asp Trp Leu Thr Glu Lys Met Arg Glu Ala Asn Phe Thr Val 290 295 300 Ser Ser Met His Gly Asp Met Pro Gln Lys Glu Arg Glu Ser Ile Met 305 310 315 320 Lys Glu Phe Arg Ser Gly Ala Ser Arg Val Leu Ile Ser Thr Asp Val 325 330 335 Trp Ala Arg Gly Leu Asp Val Pro Gln Val Ser Leu Ile Ile Asn Tyr 340 345 350 Asp Leu Pro Asn Asn Arg Glu Leu Tyr Ile His Arg Ile Gly Arg Ser 355 360 365 Gly Arg Tyr Gly Arg Lys Gly Val Ala Ile Asn Phe Val Lys Asn Asp 370 375 380 Asp Ile Arg Ile Leu Arg Asp Ile Glu Gln Tyr Tyr Ser Thr Gln Ile 385 390 395 400 Asp Glu Met Pro Met Asn Val Ala Asp Leu Ile Leu Glu 405 410 <210> 15 <211> 398 <212> PRT <213> Aspergillus niger <400> 15 Met Ala Ser Asn Asp Lys Gly Leu Glu Glu Ile Pro Glu Gly Gln Ile 1 5 10 15 Glu Thr Asn Tyr Asp Glu Val Thr Asp Ser Phe Asp Ser Met Asp Leu 20 25 30 Lys Pro Glu Leu Leu Arg Gly Val Tyr Ala Tyr Gly Phe Glu Arg Pro 35 40 45 Ser Ala Ile Gln Gln Arg Ala Ile Lys Pro Ile Ile Ala Gly His Asp 50 55 60 Val Ile Ala Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser 65 70 75 80 Ile Ser Ala Leu Gln Lys Ile Asp Gln Glu Leu Lys Ala Cys Gln Ala 85 90 95 Leu Ile Val Ala Pro Thr Arg Glu Leu Ala Gln Gln Ile Gln Lys Val 100 105 110 Val Val Ala Ile Gly Asp Phe Met Asn Ile Glu Cys His Ala Cys Ile 115 120 125 Gly Gly Thr Asn Val Arg Asp Asp Met Asn Ala Leu Arg Ala Gly Pro 130 135 140 Gln Val Val Val Gly Thr Pro Gly Arg Ile His Asp Met Ile Glu Arg 145 150 155 160 Arg Val Leu Lys Thr Asp Gln Met Lys Leu Phe Ile Leu Asp Glu Ala 165 170 175 Asp Glu Met Leu Ser Arg Gly Phe Thr Glu Gln Ile Tyr Asp Ile Phe 180 185 190 Gln Leu Leu Pro Gln Ser Thr Gln Val Thr Leu Leu Ser Ala Thr Met 195 200 205 Pro Gln Asp Val Leu Glu Val Thr Thr Lys Phe Met Arg Asp Pro Ile 210 215 220 Arg Ile Leu Val Lys Lys Gln Glu Leu Thr Leu Glu Gly Ile Lys Gln 225 230 235 240 Phe Tyr Ile Ala Val Glu Lys Glu Glu Trp Lys Leu Asp Thr Leu Ser 245 250 255 Asp Leu Tyr Glu Thr Val Thr Ile Thr Gln Ala Val Ile Phe Cys Asn 260 265 270 Thr Arg Arg Lys Val Asp Trp Leu Thr Asp Lys Leu Thr Ala Arg Asp 275 280 285 Phe Thr Val Ser Ala Met His Gly Asp Met Glu Gln Gly Gln Arg Asp 290 295 300 Val Ile Met Lys Glu Phe Arg Ser Gly Ser Ser Arg Val Leu Ile Ala 305 310 315 320 Thr Asp Leu Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val 325 330 335 Ile Asn Tyr Asp Leu Pro Ala Asn Arg Glu Asn Tyr Ile His Arg Ile 340 345 350 Gly Arg Gly Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val 355 360 365 Thr Ala Asp Asp Val Arg Met Met Arg Glu Ile Glu Gln Phe Tyr Ser 370 375 380 Thr Gln Ile Glu Glu Met Pro Met Asn Val Ala Asp Leu Ile 385 390 395 <210> 16 <211> 411 <212> PRT <213> Cricetulus griseus <400> 16 Met Ala Ala Ala Ala Thr Met Ala Thr Ser Gly Ser Ala Arg Lys Arg 1 5 10 15 Leu Leu Lys Glu Glu Asp Met Thr Lys Val Glu Phe Glu Thr Ser Glu 20 25 30 Glu Val Asp Val Thr Pro Thr Phe Asp Thr Met Gly Leu Arg Glu Asp 35 40 45 Leu Leu Arg Gly Ile Tyr Ala Tyr Gly Phe Glu Lys Pro Ser Ala Ile 50 55 60 Gln Gln Arg Ala Ile Lys Gln Ile Ile Lys Gly Arg Asp Val Ile Ala 65 70 75 80 Gln Ser Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser Ile Ser Val 85 90 95 Leu Gln Cys Leu Asp Ile Gln Val Arg Glu Thr Gln Ala Leu Ile Leu 100 105 110 Ala Pro Thr Arg Glu Leu Ala Val Gln Ile Gln Lys Gly Leu Leu Ala 115 120 125 Leu Gly Asp Tyr Met Asn Val Gln Cys His Ala Cys Ile Gly Gly Thr 130 135 140 Asn Val Gly Glu Asp Ile Arg Lys Leu Asp Tyr Gly Gln His Val Val 145 150 155 160 Ala Gly Thr Pro Gly Arg Val Phe Asp Met Ile Arg Arg Arg Ser Leu 165 170 175 Arg Thr Arg Ala Ile Lys Met Leu Val Leu Asp Glu Ala Asp Glu Met 180 185 190 Leu Asn Lys Gly Phe Lys Glu Gln Ile Tyr Asp Val Tyr Arg Tyr Leu 195 200 205 Pro Pro Ala Thr Gln Val Val Leu Ile Ser Ala Thr Leu Pro His Glu 210 215 220 Ile Leu Glu Met Thr Asn Lys Phe Met Thr Asp Pro Ile Arg Ile Leu 225 230 235 240 Val Lys Arg Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Phe Val 245 250 255 Ala Val Glu Arg Glu Glu Trp Lys Phe Asp Thr Leu Cys Asp Leu Tyr 260 265 270 Asp Thr Leu Thr Ile Thr Gln Ala Val Ile Phe Cys Asn Thr Lys Arg 275 280 285 Lys Val Asp Trp Leu Thr Glu Lys Met Arg Glu Ala Asn Phe Thr Val 290 295 300 Ser Ser Met His Gly Asp Met Pro Gln Lys Glu Arg Glu Ser Ile Met 305 310 315 320 Lys Glu Phe Arg Ser Gly Ala Ser Arg Val Leu Ile Ser Thr Asp Val 325 330 335 Trp Ala Arg Gly Leu Asp Val Pro Gln Val Ser Leu Ile Ile Asn Tyr 340 345 350 Asp Leu Pro Asn Asn Arg Glu Leu Tyr Ile His Arg Ile Gly Arg Ser 355 360 365 Gly Arg Tyr Gly Arg Lys Gly Val Ala Ile Asn Phe Val Lys Asn Asp 370 375 380 Asp Ile Arg Ile Leu Arg Asp Ile Glu Gln Tyr Tyr Ser Thr Gln Ile 385 390 395 400 Asp Glu Met Pro Met Asn Val Ala Asp Leu Ile 405 410 <210> 17 <211> 396 <212> PRT <213> Kluyveromyces lactis <400> 17 Met Ser Asp Gly Ile Thr Asp Ile Asp Glu Asn Gln Ile Gln Ser Thr 1 5 10 15 Tyr Asp Lys Val Val Tyr Ser Phe Asp Asp Leu Lys Leu Lys Glu Glu 20 25 30 Leu Leu Arg Gly Ile Phe Gly Tyr Gly Phe Val Glu Pro Ser Ala Ile 35 40 45 Gln Gln Arg Ala Ile Leu Pro Ile Ile Glu Gly Lys Asp Val Leu Ala 50 55 60 Gln Ala Gln Ser Gly Thr Gly Lys Thr Gly Thr Phe Ser Ile Ala Ala 65 70 75 80 Leu Gln Asn Ile Asp Glu Lys Ile Lys Ala Pro Gln Gly Leu Ile Leu 85 90 95 Ala Pro Thr Arg Glu Leu Ala Leu Gln Ile Gln Lys Val Val Met Ala 100 105 110 Leu Ala Ile His Met Asp Val Lys Val His Ala Cys Ile Gly Gly Thr 115 120 125 Ser Leu Gln Glu Asp Ser Glu Ala Leu Arg Gly Gly Ala Gln Ile Ile 130 135 140 Val Gly Thr Pro Gly Arg Val Phe Asp Met Ile Asp Arg Arg Ile Phe 145 150 155 160 Lys Thr Asp Asn Ile Lys Met Phe Ile Leu Asp Glu Ala Asp Glu Met 165 170 175 Leu Ser Thr Gly Phe Lys Glu Gln Ile Tyr Asn Ile Phe Thr Met Leu 180 185 190 Pro Pro Thr Ser Gln Val Val Leu Leu Ser Ala Thr Met Pro Gly Asp 195 200 205 Val Leu Glu Val Thr Ser Lys Phe Met Lys Asp Pro Val Arg Ile Leu 210 215 220 Val Lys Lys Asp Glu Leu Thr Leu Glu Gly Ile Gly Gln Tyr Tyr Val 225 230 235 240 Asn Val Glu Glu Glu Gln Tyr Lys Tyr Asp Cys Leu Thr Asp Leu Tyr 245 250 255 Asp Ser Ile Ser Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg Arg 260 265 270 Lys Val Glu Glu Leu Thr Glu Arg Leu Arg Glu Asn Asn Phe Thr Val 275 280 285 Ser Ala Ile Tyr Ser Asp Leu Gln Gln Gln Glu Arg Asp Thr Ile Met 290 295 300 Lys Glu Phe Arg Ser Gly Ser Ser Arg Ile Leu Ile Ser Thr Asp Leu 305 310 315 320 Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Tyr 325 330 335 Asp Leu Pro Ser Asn Lys Glu Asn Tyr Ile His Arg Ile Gly Arg Gly 340 345 350 Gly Arg Phe Gly Arg Lys Gly Ile Ala Ile Asn Phe Val Thr Asn Lys 355 360 365 Asp Ile Gly Ala Met Arg Glu Leu Glu Arg Phe Tyr Ser Thr Gln Ile 370 375 380 Glu Glu Leu Pro Ser Ser Ile Ser Glu Leu Phe Asp 385 390 395 <210> 18 <211> 397 <212> PRT <213> Ogataea polymorpha <400> 18 Met Ala Ser Glu Asn Ile Gln Glu Val Asp Ser Asn Leu Ile Glu Ser 1 5 10 15 Asn Tyr Asp Asn Val Val Tyr Thr Phe Asp Glu Leu Asn Leu Lys Pro 20 25 30 Glu Ile Ile Arg Gly Ile Phe Ala Tyr Gly Tyr Glu Gln Pro Ser Ala 35 40 45 Ile Gln Gln Arg Ala Ile Leu Pro Ile Thr Glu Gly Arg Asp Val Leu 50 55 60 Ala Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Thr Ile Ser 65 70 75 80 Ala Leu Gln Arg Ile Asp Glu Lys Leu Lys Lys Thr Gln Ala Leu Ile 85 90 95 Leu Ala Pro Thr Arg Glu Leu Ala Leu Gln Ile Gln Lys Val Val Leu 100 105 110 Ala Ile Gly Met His Leu Asp Leu Thr Val His Ala Ser Ile Gly Gly 115 120 125 Lys Ala Val Gln Glu Asp Met Glu Ala Leu Arg Asn Gly Ala Gln Ile 130 135 140 Val Val Gly Thr Pro Gly Arg Val Tyr Asp Met Ile Glu Arg Gly Tyr 145 150 155 160 Phe Lys Thr Asp Ala Ile Lys Met Phe Ile Met Asp Glu Ala Asp Glu 165 170 175 Met Leu Ser Ser Gly Phe Lys Glu Gln Ile Tyr Asn Val Phe Arg Phe 180 185 190 Leu Pro Thr Thr Thr Gln Val Val Leu Leu Ser Ala Thr Met Pro Gln 195 200 205 Asp Val Leu Glu Val Thr Thr Lys Phe Met Arg Asn Pro Val Arg Ile 210 215 220 Leu Val Lys Lys Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr 225 230 235 240 Ile Asp Val Asp Glu Glu Gln Tyr Lys Phe Asp Cys Leu Cys Asp Leu 245 250 255 Tyr Asp Ser Ile Ser Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg 260 265 270 Arg Lys Val Glu Thr Leu Thr Gln Gln Leu Thr Glu Asn Asn Phe Thr 275 280 285 Val Ser Ala Ile His Ser Asp Leu Ser Gln Gln Asp Arg Asp Thr Ile 290 295 300 Met Asn Glu Phe Arg Thr Gly Ser Ser Arg Ile Leu Ile Ser Thr Asp 305 310 315 320 Leu Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn 325 330 335 Tyr Asp Leu Pro Ser Asn Lys Glu Asn Tyr Ile His Arg Ile Gly Arg 340 345 350 Gly Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Leu Ile Thr Arg 355 360 365 Glu Asp Thr Glu Met Leu Arg Glu Ile Glu Met Phe Tyr Ser Thr Gln 370 375 380 Ile Val Glu Met Pro Ser Ser Ile Asn Asp Leu Phe Asp 385 390 395 <210> 19 <211> 395 <212> PRT <213> Saccharomyces cerevisiae <400> 19 Met Ser Glu Gly Ile Thr Asp Ile Glu Glu Ser Gln Ile Gln Thr Asn 1 5 10 15 Tyr Asp Lys Val Val Tyr Lys Phe Asp Asp Met Glu Leu Asp Glu Asn 20 25 30 Leu Leu Arg Gly Val Phe Gly Tyr Gly Phe Glu Glu Pro Ser Ala Ile 35 40 45 Gln Gln Arg Ala Ile Met Pro Ile Ile Glu Gly His Asp Val Leu Ala 50 55 60 Gln Ala Gln Ser Gly Thr Gly Lys Thr Gly Thr Phe Ser Ile Ala Ala 65 70 75 80 Leu Gln Arg Ile Asp Thr Ser Val Lys Ala Pro Gln Ala Leu Met Leu 85 90 95 Ala Pro Thr Arg Glu Leu Ala Leu Gln Ile Gln Lys Val Val Met Ala 100 105 110 Leu Ala Phe His Met Asp Ile Lys Val His Ala Cys Ile Gly Gly Thr 115 120 125 Ser Phe Val Glu Asp Ala Glu Gly Leu Arg Asp Ala Gln Ile Val Val 130 135 140 Gly Thr Pro Gly Arg Val Phe Asp Asn Ile Gln Arg Arg Arg Phe Arg 145 150 155 160 Thr Asp Lys Ile Lys Met Phe Ile Leu Asp Glu Ala Asp Glu Met Leu 165 170 175 Ser Ser Gly Phe Lys Glu Gln Ile Tyr Gln Ile Phe Thr Leu Leu Pro 180 185 190 Pro Thr Thr Gln Val Val Leu Leu Ser Ala Thr Met Pro Asn Asp Val 195 200 205 Leu Glu Val Thr Thr Lys Phe Met Arg Asn Pro Val Arg Ile Leu Val 210 215 220 Lys Lys Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr Val Asn 225 230 235 240 Val Glu Glu Glu Glu Tyr Lys Tyr Glu Cys Leu Thr Asp Leu Tyr Asp 245 250 255 Ser Ile Ser Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg Arg Lys 260 265 270 Val Glu Glu Leu Thr Thr Lys Leu Arg Asn Asp Lys Phe Thr Val Ser 275 280 285 Ala Ile Tyr Ser Asp Leu Pro Gln Gln Glu Arg Asp Thr Ile Met Lys 290 295 300 Glu Phe Arg Ser Gly Ser Ser Arg Ile Leu Ile Ser Thr Asp Leu Leu 305 310 315 320 Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Tyr Asp 325 330 335 Leu Pro Ala Asn Lys Glu Asn Tyr Ile His Arg Ile Gly Arg Gly Gly 340 345 350 Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val Thr Asn Glu Asp 355 360 365 Val Gly Ala Met Arg Glu Leu Glu Lys Phe Tyr Ser Thr Gln Ile Glu 370 375 380 Glu Leu Pro Ser Asp Ile Ala Thr Leu Leu Asn 385 390 395 <210> 20 <211> 392 <212> PRT <213> Schizosaccharomyces pombe <400> 20 Met Val Asp Gln Leu Glu Asp Ser Val Ile Glu Thr Asn Tyr Asp Glu 1 5 10 15 Val Ile Asp Thr Phe Asp Asp Met Asn Leu Lys Pro Glu Leu Leu Arg 20 25 30 Gly Ile Tyr Ala Tyr Gly Phe Glu Arg Pro Ser Ala Ile Gln Gln Arg 35 40 45 Ala Ile Met Pro Ile Leu Gly Glu Arg Asp Val Leu Ala Gln Ala Gln 50 55 60 Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser Ile Ser Val Leu Gln Lys 65 70 75 80 Ile Asp Thr Ser Leu Lys Gln Cys Gln Ala Leu Ile Leu Ala Pro Thr 85 90 95 Arg Glu Leu Ala Gln Gln Ile Gln Lys Val Val Val Ala Leu Gly Asp 100 105 110 Leu Met Asn Val Glu Cys His Ala Cys Ile Gly Gly Thr Leu Val Arg 115 120 125 Asp Asp Met Ala Ala Leu Gln Ala Gly Val His Val Val Val Gly Thr 130 135 140 Pro Gly Arg Val His Asp Met Ile Gln Arg Arg Ala Leu Pro Thr Asp 145 150 155 160 Ala Val Gln Met Phe Val Leu Asp Glu Ala Asp Glu Met Leu Ser Arg 165 170 175 Gly Phe Lys Asp Gln Ile Tyr Asp Ile Phe Gln Leu Leu Pro Pro Thr 180 185 190 Ala Gln Val Val Leu Leu Ser Ala Thr Met Pro Gln Asp Val Leu Glu 195 200 205 Val Thr Thr Lys Phe Met Arg Asp Pro Ile Arg Ile Leu Val Lys Lys 210 215 220 Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr Val Ala Val Glu 225 230 235 240 Lys Glu Glu Trp Lys Leu Asp Thr Leu Cys Asp Leu Tyr Glu Thr Val 245 250 255 Thr Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg Arg Lys Val Asp 260 265 270 Trp Leu Thr Glu Gln Leu Thr Glu Arg Asp Phe Thr Val Ser Ser Met 275 280 285 His Gly Asp Met Asp Gln Ala Gln Arg Asp Thr Leu Met His Glu Phe 290 295 300 Arg Thr Gly Ser Ser Arg Ile Leu Ile Thr Thr Asp Leu Leu Ala Arg 305 310 315 320 Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Tyr Asp Leu Pro 325 330 335 Ala Asn Arg Glu Asn Tyr Ile His Arg Ile Gly Arg Gly Gly Arg Phe 340 345 350 Gly Arg Lys Gly Val Ser Ile Asn Phe Val Thr Asn Asp Asp Val Arg 355 360 365 Met Met Arg Glu Ile Glu Gln Phe Tyr Asn Thr His Ile Glu Glu Met 370 375 380 Pro Met Asn Ile Ala Asp Leu Ile 385 390 <210> 21 <211> 396 <212> PRT <213> Trichoderma reesei <400> 21 Met Ala Asp Lys Gly Leu Glu Asp Val Pro Glu Gly Gln Ile Glu Ser 1 5 10 15 Asn Tyr Asp Glu Thr Val Asp Ser Phe Asp Asp Met Asn Leu Lys Ser 20 25 30 Glu Leu Leu Arg Gly Val Tyr Ala Tyr Gly Phe Glu Arg Pro Ser Ala 35 40 45 Ile Gln Gln Arg Ala Ile Met Pro Val Ile Lys Gly His Asp Val Ile 50 55 60 Ala Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser Ile Ser 65 70 75 80 Val Leu Gln Lys Ile Asp Pro Ser Val Lys Gln Cys Gln Ala Leu Ile 85 90 95 Leu Ala Pro Thr Arg Glu Leu Ala Gln Gln Ile Gln Lys Val Val Val 100 105 110 Ala Ile Gly Asp Phe Met Asn Val Glu Cys His Ala Cys Ile Gly Gly 115 120 125 Thr Ser Val Arg Glu Asp Met Lys Ala Leu Gln Asp Gly Pro Gln Val 130 135 140 Val Val Gly Thr Pro Gly Arg Val His Asp Met Ile Gln Arg Arg Phe 145 150 155 160 Leu Lys Thr Asp Ala Met Lys Met Phe Val Leu Asp Glu Ala Asp Glu 165 170 175 Met Leu Ser Arg Gly Phe Thr Asp Gln Ile Tyr Asp Ile Phe Gln Leu 180 185 190 Leu Pro Gln Ser Thr Gln Val Val Leu Leu Ser Ala Thr Met Pro Gln 195 200 205 Asp Val Leu Glu Val Thr Thr Arg Phe Met Arg Asp Pro Val Arg Ile 210 215 220 Leu Val Lys Lys Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr 225 230 235 240 Ile Ala Val Glu Lys Glu Glu Trp Lys Leu Asp Thr Leu Ser Asp Leu 245 250 255 Tyr Glu Thr Val Thr Ile Thr Gln Ala Val Ile Phe Cys Asn Thr Arg 260 265 270 Arg Lys Val Asp Trp Leu Thr Asp Lys Leu Thr Ala Arg Asp Phe Thr 275 280 285 Val Ser Ala Met His Gly Asp Met Asp Gln Ala Gln Arg Asp Leu Ile 290 295 300 Met Lys Glu Phe Arg Ser Gly Ser Ser Arg Val Leu Ile Ala Thr Asp 305 310 315 320 Leu Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn 325 330 335 Tyr Asp Leu Pro Ala Asn Arg Glu Asn Tyr Ile His Arg Ile Gly Arg 340 345 350 Gly Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val Thr Ala 355 360 365 Asp Asp Val Arg Met Met Arg Glu Ile Glu Gln Phe Tyr Ser Thr Gln 370 375 380 Ile Glu Glu Met Pro Met Asn Val Ala Asp Leu Ile 385 390 395 <210> 22 <211> 395 <212> PRT <213> Yarrowia lipolytica <400> 22 Met Ala Asp Gly Leu Thr Asp Ile Asp Ser Ser Gln Ile Thr Thr Asn 1 5 10 15 Tyr Asp Glu Val Val Thr Ser Phe Asp Asp Leu Gly Leu Lys Asp Glu 20 25 30 Leu Leu Arg Gly Ile Tyr Gly Tyr Gly Phe Glu Asn Pro Ser Ser Ile 35 40 45 Gln Gln Arg Ala Ile Leu Pro Val Ile Lys Gly Asn Asp Val Leu Ala 50 55 60 Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser Ile Ser Ala 65 70 75 80 Leu Gln Asn Ile Asp Glu Lys Ile Lys Lys Pro Gln Ala Leu Ile Ile 85 90 95 Ala Pro Thr Arg Glu Leu Ala His Gln Ile Gln Lys Val Val Leu Ala 100 105 110 Phe Gly Glu Tyr Met Lys Ile Glu Cys His Ala Cys Ile Gly Gly Thr 115 120 125 Ser Val Ala Glu Asp Ile Arg Val Ile Gln Glu Gly Val His Val Ile 130 135 140 Val Gly Thr Pro Gly Arg Ile His Asp Met Ile Glu Arg Arg Ile Leu 145 150 155 160 Lys Thr Asp Leu Ile Lys Met Phe Ile Leu Asp Glu Ala Asp Glu Met 165 170 175 Leu Ser Arg Glu Phe Lys Asp Pro Ile Tyr Asp Ile Phe Thr Thr Leu 180 185 190 Pro Glu Thr Thr Gln Thr Val Leu Leu Ser Ala Thr Met Pro Ala Glu 195 200 205 Val Leu Asp Ile Thr Gly Lys Phe Met Arg Asp Pro Val Arg Ile Leu 210 215 220 Val Lys Lys Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr Ile 225 230 235 240 Asp Val Glu Gln Glu Ser Tyr Lys Phe Glu Val Leu Cys Asp Leu Tyr 245 250 255 Glu Thr Ile Asn Val Ser Gln Ala Val Ile Phe Cys Asn Thr Arg Arg 260 265 270 Lys Val Asp Tyr Leu Thr Gln Ala Leu Thr Glu Ala Asp Phe Thr Val 275 280 285 Ser Ser Met His Gly Glu Thr Glu Gln Ser Gln Arg Asp Val Ile Met 290 295 300 Lys Ala Phe Arg Thr Gly Ser Ser Arg Ile Leu Ile Thr Thr Asp Leu 305 310 315 320 Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Phe 325 330 335 Asp Leu Pro Ser Asn Arg Glu Asn Tyr Ile His Arg Ile Gly Arg Gly 340 345 350 Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val Thr Ser Glu 355 360 365 Asp His Gly Met Leu Lys Glu Leu Glu Arg Phe Tyr Ser Thr Glu Ile 370 375 380 Val Glu Met Pro Thr Asn Ile Ala Asp Leu Ile 385 390 395 <210> 23 <211> 486 <212> PRT <213> Komagataella phaffii <400> 23 Met His Pro Tyr Thr Val Val Phe Ala Arg Leu Leu Leu Gly Val Phe 1 5 10 15 Ser Thr Ala Ala Pro Asn Ser Pro Pro Pro Phe Cys Thr Ser Cys His 20 25 30 Leu Gly Asp Gln Arg Leu Trp Asn Leu Ala Gln Asn Leu Ala Cys Thr 35 40 45 Leu Pro Pro Gln Lys Asn Phe Pro Cys Leu Val Ala Arg Arg Ser Lys 50 55 60 Ile Lys Ser Phe Ser Thr Thr Phe Val Pro Asn Lys Ser Pro Phe Tyr 65 70 75 80 Leu Pro Ile Met Ser Glu Gly Ile Ile Glu Ile Asp Thr Asn Leu Ile 85 90 95 Glu Thr Asn Tyr Asp Gln Val Val Ser Thr Phe Asp Glu Leu Asn Leu 100 105 110 Lys Glu Gln Ile Leu Arg Ala Val Phe Ala Tyr Gly Tyr Glu Phe Pro 115 120 125 Ser Ala Ile Gln Ser Arg Ala Ile Leu Pro Ile Val Ala Gly Arg Asp 130 135 140 Val Leu Ala Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ala 145 150 155 160 Ile Ser Ala Leu Gln Arg Leu Asp Glu Lys Leu Lys Ala Ala Gln Val 165 170 175 Leu Ile Leu Ala Pro Thr Arg Glu Leu Ala Leu Gln Ile Lys Lys Val 180 185 190 Val Leu Ala Leu Gly Met His Leu Asn Ile Ser Val His Ala Cys Ile 195 200 205 Gly Gly Val Asp Pro Ala Leu Asp Val Lys Ala Phe Asn Ser Gly Val 210 215 220 Gln Ile Val Val Gly Thr Pro Gly Arg Val Gln Asp Met Ile Glu Arg 225 230 235 240 Gly Ala Phe Arg Thr Glu Asn Val Lys Met Val Ile Leu Asp Glu Ala 245 250 255 Asp Glu Met Leu Ser Thr Gly Phe Lys Glu Gln Ile Tyr Thr Leu Phe 260 265 270 Thr Leu Leu Pro Ser Thr Thr Gln Val Val Leu Leu Ser Ala Thr Met 275 280 285 Pro Gln Glu Val Leu Glu Val Thr Thr Lys Phe Met Asn Asn Pro Ile 290 295 300 Arg Ile Leu Val Lys Lys Asp Gln Leu Thr Leu Glu Gly Ile Lys Gln 305 310 315 320 Phe Tyr Val Asp Val Gly Glu Glu Gln Tyr Lys Phe Asp Cys Leu Cys 325 330 335 Asp Leu Tyr Asp Ser Ile Ser Val Thr Gln Ala Val Ile Phe Cys Asn 340 345 350 Thr Arg Arg Lys Val Glu Glu Leu Thr Glu Arg Leu Thr Ala Gln Lys 355 360 365 Phe Thr Val Ser Ala Ile His Ser Glu Leu Ser Gln Thr Glu Arg Asp 370 375 380 Thr Ile Met Gln Glu Phe Arg Thr Gly Ser Ser Arg Ile Leu Ile Ser 385 390 395 400 Thr Asp Leu Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val 405 410 415 Ile Asn Tyr Asp Leu Pro Ser Asn Lys Glu Asn Tyr Ile His Arg Ile 420 425 430 Gly Arg Gly Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val 435 440 445 Thr Ser Lys Asp Val Glu Met Met Lys Glu Ile Glu Lys Phe Tyr Ser 450 455 460 Thr Gln Ile Asp Glu Leu Pro Ser Ser Ile Thr Asp Leu Phe Glu Thr 465 470 475 480 Glu Glu Val Asn Glu Ser 485 <210> 24 <211> 403 <212> PRT <213> Komagatealla pastoris <400> 24 Met Ser Glu Gly Ile Ile Glu Ile Asp Thr Asn Leu Ile Glu Thr Asn 1 5 10 15 Tyr Asp Gln Val Val Ser Thr Phe Asp Glu Leu Asn Leu Lys Glu Gln 20 25 30 Ile Leu Arg Ala Val Phe Ala Tyr Gly Tyr Glu Phe Pro Ser Ala Ile 35 40 45 Gln Ser Arg Ala Ile Leu Pro Ile Val Ala Gly Arg Asp Val Leu Ala 50 55 60 Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ala Ile Ser Ala 65 70 75 80 Leu Gln Arg Leu Asp Glu Lys Leu Lys Ala Ala Gln Val Leu Ile Leu 85 90 95 Ala Pro Thr Arg Glu Leu Ala Leu Gln Ile Lys Lys Val Val Leu Ala 100 105 110 Leu Gly Met His Leu Asn Ile Ser Val His Ala Cys Ile Gly Gly Val 115 120 125 Asp Pro Ala Leu Asp Val Lys Ala Phe Asn Ser Gly Val Gln Ile Val 130 135 140 Val Gly Thr Pro Gly Arg Val Gln Asp Met Ile Glu Arg Gly Ala Phe 145 150 155 160 Arg Thr Glu Asn Val Lys Met Val Ile Leu Asp Glu Ala Asp Glu Met 165 170 175 Leu Ser Thr Gly Phe Lys Glu Gln Ile Tyr Thr Leu Phe Thr Leu Leu 180 185 190 Pro Ser Thr Thr Gln Val Val Leu Leu Ser Ala Thr Met Pro Gln Glu 195 200 205 Val Leu Glu Val Thr Thr Lys Phe Met Asn Asn Pro Ile Arg Ile Leu 210 215 220 Val Lys Lys Asp Gln Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr Val 225 230 235 240 Asp Val Gly Glu Glu Gln Tyr Lys Phe Asp Cys Leu Cys Asp Leu Tyr 245 250 255 Asp Ser Ile Ser Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg Arg 260 265 270 Lys Val Glu Glu Leu Thr Glu Arg Leu Thr Ala Gln Lys Phe Thr Val 275 280 285 Ser Ala Ile His Ser Glu Leu Ser Gln Ser Glu Arg Asp Thr Ile Met 290 295 300 Gln Glu Phe Arg Thr Gly Ser Ser Arg Ile Leu Ile Ser Thr Asp Leu 305 310 315 320 Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Tyr 325 330 335 Asp Leu Pro Ser Asn Lys Glu Asn Tyr Ile His Arg Ile Gly Arg Gly 340 345 350 Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val Thr Ser Lys 355 360 365 Asp Val Glu Met Met Lys Glu Ile Glu Lys Phe Tyr Ser Thr Gln Ile 370 375 380 Asp Glu Leu Pro Ser Ser Ile Thr Asp Leu Phe Glu Thr Glu Glu Val 385 390 395 400 Asn Glu Ser <210> 25 <211> 411 <212> PRT <213> Homo sapiens <400> 25 Met Ala Thr Thr Ala Thr Met Ala Thr Ser Gly Ser Ala Arg Lys Arg 1 5 10 15 Leu Leu Lys Glu Glu Asp Met Thr Lys Val Glu Phe Glu Thr Ser Glu 20 25 30 Glu Val Asp Val Thr Pro Thr Phe Asp Thr Met Gly Leu Arg Glu Asp 35 40 45 Leu Leu Arg Gly Ile Tyr Ala Tyr Gly Phe Glu Lys Pro Ser Ala Ile 50 55 60 Gln Gln Arg Ala Ile Lys Gln Ile Ile Lys Gly Arg Asp Val Ile Ala 65 70 75 80 Gln Ser Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser Ile Ser Val 85 90 95 Leu Gln Cys Leu Asp Ile Gln Val Arg Glu Thr Gln Ala Leu Ile Leu 100 105 110 Ala Pro Thr Arg Glu Leu Ala Val Gln Ile Gln Lys Gly Leu Leu Ala 115 120 125 Leu Gly Asp Tyr Met Asn Val Gln Cys His Ala Cys Ile Gly Gly Thr 130 135 140 Asn Val Gly Glu Asp Ile Arg Lys Leu Asp Tyr Gly Gln His Val Val 145 150 155 160 Ala Gly Thr Pro Gly Arg Val Phe Asp Met Ile Arg Arg Arg Ser Leu 165 170 175 Arg Thr Arg Ala Ile Lys Met Leu Val Leu Asp Glu Ala Asp Glu Met 180 185 190 Leu Asn Lys Gly Phe Lys Glu Gln Ile Tyr Asp Val Tyr Arg Tyr Leu 195 200 205 Pro Ser Ala Thr Gln Val Val Leu Ile Ser Ala Thr Leu Pro His Glu 210 215 220 Ile Leu Glu Met Thr Asn Lys Phe Met Thr Asp Pro Ile Arg Ile Leu 225 230 235 240 Val Lys Arg Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Phe Val 245 250 255 Ala Val Glu Arg Glu Glu Trp Lys Phe Asp Thr Leu Cys Asp Leu Tyr 260 265 270 Asp Thr Leu Thr Ile Thr Gln Ala Val Ile Phe Cys Asn Thr Lys Arg 275 280 285 Lys Val Asp Trp Leu Thr Glu Lys Met Arg Glu Ala Asn Phe Thr Val 290 295 300 Ser Ser Met His Gly Asp Met Pro Gln Lys Glu Arg Glu Ser Ile Met 305 310 315 320 Lys Glu Phe Arg Ser Gly Ala Ser Arg Val Leu Ile Ser Thr Asp Val 325 330 335 Trp Ala Arg Gly Leu Asp Val Pro Gln Val Ser Leu Ile Ile Asn Tyr 340 345 350 Asp Leu Pro Asn Asn Arg Glu Leu Tyr Ile His Arg Ile Gly Arg Ser 355 360 365 Gly Gln Tyr Gly Arg Lys Gly Val Ala Ile Asn Phe Val Lys Asn Asp 370 375 380 Asp Ile Arg Ile Leu Arg Asp Ile Glu Gln Tyr Tyr Ser Thr Gln Ile 385 390 395 400 Asp Glu Met Pro Met Asn Val Ala Asp Leu Ile 405 410 <210> 26 <211> 398 <212> PRT <213> Aspergillus niger <400> 26 Met Ala Ser Asn Asp Lys Gly Leu Glu Glu Ile Pro Glu Gly Gln Ile 1 5 10 15 Glu Thr Asn Tyr Asp Glu Val Thr Asp Ser Phe Asp Ser Met Asp Leu 20 25 30 Lys Pro Glu Leu Leu Arg Gly Val Tyr Ala Tyr Gly Phe Glu Arg Pro 35 40 45 Ser Ala Ile Gln Gln Arg Ala Ile Lys Pro Ile Ile Ala Gly His Asp 50 55 60 Val Ile Ala Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser 65 70 75 80 Ile Ser Ala Leu Gln Lys Ile Asp Gln Glu Leu Lys Ala Cys Gln Ala 85 90 95 Leu Ile Val Ala Pro Thr Arg Glu Leu Ala Gln Gln Ile Gln Lys Val 100 105 110 Val Val Ala Ile Gly Asp Phe Met Asn Ile Glu Cys His Ala Cys Ile 115 120 125 Gly Gly Thr Asn Val Arg Asp Asp Met Asn Ala Leu Arg Ala Gly Pro 130 135 140 Gln Val Val Val Gly Thr Pro Gly Arg Ile His Asp Met Ile Glu Arg 145 150 155 160 Arg Val Leu Lys Thr Asp Gln Met Lys Leu Phe Ile Leu Asp Glu Ala 165 170 175 Asp Glu Met Leu Ser Arg Gly Phe Thr Glu Gln Ile Tyr Asp Ile Phe 180 185 190 Gln Leu Leu Pro Gln Ser Thr Gln Val Thr Leu Leu Ser Ala Thr Met 195 200 205 Pro Gln Asp Val Leu Glu Val Thr Thr Lys Phe Met Arg Asp Pro Ile 210 215 220 Arg Ile Leu Val Lys Lys Gln Glu Leu Thr Leu Glu Gly Ile Lys Gln 225 230 235 240 Phe Tyr Ile Ala Val Glu Lys Glu Glu Trp Lys Leu Asp Thr Leu Ser 245 250 255 Asp Leu Tyr Glu Thr Val Thr Ile Thr Gln Ala Val Ile Phe Cys Asn 260 265 270 Thr Arg Arg Lys Val Asp Trp Leu Thr Asp Lys Leu Thr Ala Arg Asp 275 280 285 Phe Thr Val Ser Ala Met His Gly Asp Met Glu Gln Gly Gln Arg Asp 290 295 300 Val Ile Met Lys Glu Phe Arg Ser Gly Ser Ser Arg Val Leu Ile Ala 305 310 315 320 Thr Asp Leu Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val 325 330 335 Ile Asn Tyr Asp Leu Pro Ala Asn Arg Glu Asn Tyr Ile His Arg Ile 340 345 350 Gly Arg Gly Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val 355 360 365 Thr Ala Asp Asp Val Arg Met Met Arg Glu Ile Glu Gln Phe Tyr Ser 370 375 380 Thr Gln Ile Glu Glu Met Pro Met Asn Val Ala Asp Leu Ile 385 390 395 <210> 27 <211> 411 <212> PRT <213> Cricetulus griseus <400> 27 Met Ala Ala Ala Ala Thr Met Ala Thr Ser Gly Ser Ala Arg Lys Arg 1 5 10 15 Leu Leu Lys Glu Glu Asp Met Thr Lys Val Glu Phe Glu Thr Ser Glu 20 25 30 Glu Val Asp Val Thr Pro Thr Phe Asp Thr Met Gly Leu Arg Glu Asp 35 40 45 Leu Leu Arg Gly Ile Tyr Ala Tyr Gly Phe Glu Lys Pro Ser Ala Ile 50 55 60 Gln Gln Arg Ala Ile Lys Gln Ile Ile Lys Gly Arg Asp Val Ile Ala 65 70 75 80 Gln Ser Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser Ile Ser Val 85 90 95 Leu Gln Cys Leu Asp Ile Gln Val Arg Glu Thr Gln Ala Leu Ile Leu 100 105 110 Ala Pro Thr Arg Glu Leu Ala Val Gln Ile Gln Lys Gly Leu Leu Ala 115 120 125 Leu Gly Asp Tyr Met Asn Val Gln Cys His Ala Cys Ile Gly Gly Thr 130 135 140 Asn Val Gly Glu Asp Ile Arg Lys Leu Asp Tyr Gly Gln His Val Val 145 150 155 160 Ala Gly Thr Pro Gly Arg Val Phe Asp Met Ile Arg Arg Arg Ser Leu 165 170 175 Arg Thr Arg Ala Ile Lys Met Leu Val Leu Asp Glu Ala Asp Glu Met 180 185 190 Leu Asn Lys Gly Phe Lys Glu Gln Ile Tyr Asp Val Tyr Arg Tyr Leu 195 200 205 Pro Pro Ala Thr Gln Val Val Leu Ile Ser Ala Thr Leu Pro His Glu 210 215 220 Ile Leu Glu Met Thr Asn Lys Phe Met Thr Asp Pro Ile Arg Ile Leu 225 230 235 240 Val Lys Arg Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Phe Val 245 250 255 Ala Val Glu Arg Glu Glu Trp Lys Phe Asp Thr Leu Cys Asp Leu Tyr 260 265 270 Asp Thr Leu Thr Ile Thr Gln Ala Val Ile Phe Cys Asn Thr Lys Arg 275 280 285 Lys Val Asp Trp Leu Thr Glu Lys Met Arg Glu Ala Asn Phe Thr Val 290 295 300 Ser Ser Met His Gly Asp Met Pro Gln Lys Glu Arg Glu Ser Ile Met 305 310 315 320 Lys Glu Phe Arg Ser Gly Ala Ser Arg Val Leu Ile Ser Thr Asp Val 325 330 335 Trp Ala Arg Gly Leu Asp Val Pro Gln Val Ser Leu Ile Ile Asn Tyr 340 345 350 Asp Leu Pro Asn Asn Arg Glu Leu Tyr Ile His Arg Ile Gly Arg Ser 355 360 365 Gly Arg Tyr Gly Arg Lys Gly Val Ala Ile Asn Phe Val Lys Asn Asp 370 375 380 Asp Ile Arg Ile Leu Arg Asp Ile Glu Gln Tyr Tyr Ser Thr Gln Ile 385 390 395 400 Asp Glu Met Pro Met Asn Val Ala Asp Leu Ile 405 410 <210> 28 <211> 396 <212> PRT <213> Kluyveromyces lactis <400> 28 Met Ser Asp Gly Ile Thr Asp Ile Asp Glu Asn Gln Ile Gln Ser Thr 1 5 10 15 Tyr Asp Lys Val Val Tyr Ser Phe Asp Asp Leu Lys Leu Lys Glu Glu 20 25 30 Leu Leu Arg Gly Ile Phe Gly Tyr Gly Phe Val Glu Pro Ser Ala Ile 35 40 45 Gln Gln Arg Ala Ile Leu Pro Ile Ile Glu Gly Lys Asp Val Leu Ala 50 55 60 Gln Ala Gln Ser Gly Thr Gly Lys Thr Gly Thr Phe Ser Ile Ala Ala 65 70 75 80 Leu Gln Asn Ile Asp Glu Lys Ile Lys Ala Pro Gln Gly Leu Ile Leu 85 90 95 Ala Pro Thr Arg Glu Leu Ala Leu Gln Ile Gln Lys Val Val Met Ala 100 105 110 Leu Ala Ile His Met Asp Val Lys Val His Ala Cys Ile Gly Gly Thr 115 120 125 Ser Leu Gln Glu Asp Ser Glu Ala Leu Arg Gly Gly Ala Gln Ile Ile 130 135 140 Val Gly Thr Pro Gly Arg Val Phe Asp Met Ile Asp Arg Arg Ile Phe 145 150 155 160 Lys Thr Asp Asn Ile Lys Met Phe Ile Leu Asp Glu Ala Asp Glu Met 165 170 175 Leu Ser Thr Gly Phe Lys Glu Gln Ile Tyr Asn Ile Phe Thr Met Leu 180 185 190 Pro Pro Thr Ser Gln Val Val Leu Leu Ser Ala Thr Met Pro Gly Asp 195 200 205 Val Leu Glu Val Thr Ser Lys Phe Met Lys Asp Pro Val Arg Ile Leu 210 215 220 Val Lys Lys Asp Glu Leu Thr Leu Glu Gly Ile Gly Gln Tyr Tyr Val 225 230 235 240 Asn Val Glu Glu Glu Gln Tyr Lys Tyr Asp Cys Leu Thr Asp Leu Tyr 245 250 255 Asp Ser Ile Ser Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg Arg 260 265 270 Lys Val Glu Glu Leu Thr Glu Arg Leu Arg Glu Asn Asn Phe Thr Val 275 280 285 Ser Ala Ile Tyr Ser Asp Leu Gln Gln Gln Glu Arg Asp Thr Ile Met 290 295 300 Lys Glu Phe Arg Ser Gly Ser Ser Arg Ile Leu Ile Ser Thr Asp Leu 305 310 315 320 Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Tyr 325 330 335 Asp Leu Pro Ser Asn Lys Glu Asn Tyr Ile His Arg Ile Gly Arg Gly 340 345 350 Gly Arg Phe Gly Arg Lys Gly Ile Ala Ile Asn Phe Val Thr Asn Lys 355 360 365 Asp Ile Gly Ala Met Arg Glu Leu Glu Arg Phe Tyr Ser Thr Gln Ile 370 375 380 Glu Glu Leu Pro Ser Ser Ile Ser Glu Leu Phe Asp 385 390 395 <210> 29 <211> 397 <212> PRT <213> Ogataea polymorpha <400> 29 Met Ala Ser Glu Asn Ile Gln Glu Val Asp Ser Asn Leu Ile Glu Ser 1 5 10 15 Asn Tyr Asp Asn Val Val Tyr Thr Phe Asp Glu Leu Asn Leu Lys Pro 20 25 30 Glu Ile Ile Arg Gly Ile Phe Ala Tyr Gly Tyr Glu Gln Pro Ser Ala 35 40 45 Ile Gln Gln Arg Ala Ile Leu Pro Ile Thr Glu Gly Arg Asp Val Leu 50 55 60 Ala Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Thr Ile Ser 65 70 75 80 Ala Leu Gln Arg Ile Asp Glu Lys Leu Lys Lys Thr Gln Ala Leu Ile 85 90 95 Leu Ala Pro Thr Arg Glu Leu Ala Leu Gln Ile Gln Lys Val Val Leu 100 105 110 Ala Ile Gly Met His Leu Asp Leu Thr Val His Ala Ser Ile Gly Gly 115 120 125 Lys Ala Val Gln Glu Asp Met Glu Ala Leu Arg Asn Gly Ala Gln Ile 130 135 140 Val Val Gly Thr Pro Gly Arg Val Tyr Asp Met Ile Glu Arg Gly Tyr 145 150 155 160 Phe Lys Thr Asp Ala Ile Lys Met Phe Ile Met Asp Glu Ala Asp Glu 165 170 175 Met Leu Ser Ser Gly Phe Lys Glu Gln Ile Tyr Asn Val Phe Arg Phe 180 185 190 Leu Pro Thr Thr Thr Gln Val Val Leu Leu Ser Ala Thr Met Pro Gln 195 200 205 Asp Val Leu Glu Val Thr Thr Lys Phe Met Arg Asn Pro Val Arg Ile 210 215 220 Leu Val Lys Lys Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr 225 230 235 240 Ile Asp Val Asp Glu Glu Gln Tyr Lys Phe Asp Cys Leu Cys Asp Leu 245 250 255 Tyr Asp Ser Ile Ser Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg 260 265 270 Arg Lys Val Glu Thr Leu Thr Gln Gln Leu Thr Glu Asn Asn Phe Thr 275 280 285 Val Ser Ala Ile His Ser Asp Leu Ser Gln Gln Asp Arg Asp Thr Ile 290 295 300 Met Asn Glu Phe Arg Thr Gly Ser Ser Arg Ile Leu Ile Ser Thr Asp 305 310 315 320 Leu Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn 325 330 335 Tyr Asp Leu Pro Ser Asn Lys Glu Asn Tyr Ile His Arg Ile Gly Arg 340 345 350 Gly Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Leu Ile Thr Arg 355 360 365 Glu Asp Thr Glu Met Leu Arg Glu Ile Glu Met Phe Tyr Ser Thr Gln 370 375 380 Ile Val Glu Met Pro Ser Ser Ile Asn Asp Leu Phe Asp 385 390 395 <210> 30 <211> 395 <212> PRT <213> Saccharomyces cerevisiae <400> 30 Met Ser Glu Gly Ile Thr Asp Ile Glu Glu Ser Gln Ile Gln Thr Asn 1 5 10 15 Tyr Asp Lys Val Val Tyr Lys Phe Asp Asp Met Glu Leu Asp Glu Asn 20 25 30 Leu Leu Arg Gly Val Phe Gly Tyr Gly Phe Glu Glu Pro Ser Ala Ile 35 40 45 Gln Gln Arg Ala Ile Met Pro Ile Ile Glu Gly His Asp Val Leu Ala 50 55 60 Gln Ala Gln Ser Gly Thr Gly Lys Thr Gly Thr Phe Ser Ile Ala Ala 65 70 75 80 Leu Gln Arg Ile Asp Thr Ser Val Lys Ala Pro Gln Ala Leu Met Leu 85 90 95 Ala Pro Thr Arg Glu Leu Ala Leu Gln Ile Gln Lys Val Val Met Ala 100 105 110 Leu Ala Phe His Met Asp Ile Lys Val His Ala Cys Ile Gly Gly Thr 115 120 125 Ser Phe Val Glu Asp Ala Glu Gly Leu Arg Asp Ala Gln Ile Val Val 130 135 140 Gly Thr Pro Gly Arg Val Phe Asp Asn Ile Gln Arg Arg Arg Phe Arg 145 150 155 160 Thr Asp Lys Ile Lys Met Phe Ile Leu Asp Glu Ala Asp Glu Met Leu 165 170 175 Ser Ser Gly Phe Lys Glu Gln Ile Tyr Gln Ile Phe Thr Leu Leu Pro 180 185 190 Pro Thr Thr Gln Val Val Leu Leu Ser Ala Thr Met Pro Asn Asp Val 195 200 205 Leu Glu Val Thr Thr Lys Phe Met Arg Asn Pro Val Arg Ile Leu Val 210 215 220 Lys Lys Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr Val Asn 225 230 235 240 Val Glu Glu Glu Glu Tyr Lys Tyr Glu Cys Leu Thr Asp Leu Tyr Asp 245 250 255 Ser Ile Ser Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg Arg Lys 260 265 270 Val Glu Glu Leu Thr Thr Lys Leu Arg Asn Asp Lys Phe Thr Val Ser 275 280 285 Ala Ile Tyr Ser Asp Leu Pro Gln Gln Glu Arg Asp Thr Ile Met Lys 290 295 300 Glu Phe Arg Ser Gly Ser Ser Arg Ile Leu Ile Ser Thr Asp Leu Leu 305 310 315 320 Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Tyr Asp 325 330 335 Leu Pro Ala Asn Lys Glu Asn Tyr Ile His Arg Ile Gly Arg Gly Gly 340 345 350 Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val Thr Asn Glu Asp 355 360 365 Val Gly Ala Met Arg Glu Leu Glu Lys Phe Tyr Ser Thr Gln Ile Glu 370 375 380 Glu Leu Pro Ser Asp Ile Ala Thr Leu Leu Asn 385 390 395 <210> 31 <211> 392 <212> PRT <213> Schizosaccharomyces pombe <400> 31 Met Val Asp Gln Leu Glu Asp Ser Val Ile Glu Thr Asn Tyr Asp Glu 1 5 10 15 Val Ile Asp Thr Phe Asp Asp Met Asn Leu Lys Pro Glu Leu Leu Arg 20 25 30 Gly Ile Tyr Ala Tyr Gly Phe Glu Arg Pro Ser Ala Ile Gln Gln Arg 35 40 45 Ala Ile Met Pro Ile Leu Gly Glu Arg Asp Val Leu Ala Gln Ala Gln 50 55 60 Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser Ile Ser Val Leu Gln Lys 65 70 75 80 Ile Asp Thr Ser Leu Lys Gln Cys Gln Ala Leu Ile Leu Ala Pro Thr 85 90 95 Arg Glu Leu Ala Gln Gln Ile Gln Lys Val Val Val Ala Leu Gly Asp 100 105 110 Leu Met Asn Val Glu Cys His Ala Cys Ile Gly Gly Thr Leu Val Arg 115 120 125 Asp Asp Met Ala Ala Leu Gln Ala Gly Val His Val Val Val Gly Thr 130 135 140 Pro Gly Arg Val His Asp Met Ile Gln Arg Arg Ala Leu Pro Thr Asp 145 150 155 160 Ala Val Gln Met Phe Val Leu Asp Glu Ala Asp Glu Met Leu Ser Arg 165 170 175 Gly Phe Lys Asp Gln Ile Tyr Asp Ile Phe Gln Leu Leu Pro Pro Thr 180 185 190 Ala Gln Val Val Leu Leu Ser Ala Thr Met Pro Gln Asp Val Leu Glu 195 200 205 Val Thr Thr Lys Phe Met Arg Asp Pro Ile Arg Ile Leu Val Lys Lys 210 215 220 Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr Val Ala Val Glu 225 230 235 240 Lys Glu Glu Trp Lys Leu Asp Thr Leu Cys Asp Leu Tyr Glu Thr Val 245 250 255 Thr Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg Arg Lys Val Asp 260 265 270 Trp Leu Thr Glu Gln Leu Thr Glu Arg Asp Phe Thr Val Ser Ser Met 275 280 285 His Gly Asp Met Asp Gln Ala Gln Arg Asp Thr Leu Met His Glu Phe 290 295 300 Arg Thr Gly Ser Ser Arg Ile Leu Ile Thr Thr Asp Leu Leu Ala Arg 305 310 315 320 Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Tyr Asp Leu Pro 325 330 335 Ala Asn Arg Glu Asn Tyr Ile His Arg Ile Gly Arg Gly Gly Arg Phe 340 345 350 Gly Arg Lys Gly Val Ser Ile Asn Phe Val Thr Asn Asp Asp Val Arg 355 360 365 Met Met Arg Glu Ile Glu Gln Phe Tyr Asn Thr His Ile Glu Glu Met 370 375 380 Pro Met Asn Ile Ala Asp Leu Ile 385 390 <210> 32 <211> 396 <212> PRT <213> Trichoderma reesei <400> 32 Met Ala Asp Lys Gly Leu Glu Asp Val Pro Glu Gly Gln Ile Glu Ser 1 5 10 15 Asn Tyr Asp Glu Thr Val Asp Ser Phe Asp Asp Met Asn Leu Lys Ser 20 25 30 Glu Leu Leu Arg Gly Val Tyr Ala Tyr Gly Phe Glu Arg Pro Ser Ala 35 40 45 Ile Gln Gln Arg Ala Ile Met Pro Val Ile Lys Gly His Asp Val Ile 50 55 60 Ala Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser Ile Ser 65 70 75 80 Val Leu Gln Lys Ile Asp Pro Ser Val Lys Gln Cys Gln Ala Leu Ile 85 90 95 Leu Ala Pro Thr Arg Glu Leu Ala Gln Gln Ile Gln Lys Val Val Val 100 105 110 Ala Ile Gly Asp Phe Met Asn Val Glu Cys His Ala Cys Ile Gly Gly 115 120 125 Thr Ser Val Arg Glu Asp Met Lys Ala Leu Gln Asp Gly Pro Gln Val 130 135 140 Val Val Gly Thr Pro Gly Arg Val His Asp Met Ile Gln Arg Arg Phe 145 150 155 160 Leu Lys Thr Asp Ala Met Lys Met Phe Val Leu Asp Glu Ala Asp Glu 165 170 175 Met Leu Ser Arg Gly Phe Thr Asp Gln Ile Tyr Asp Ile Phe Gln Leu 180 185 190 Leu Pro Gln Ser Thr Gln Val Val Leu Leu Ser Ala Thr Met Pro Gln 195 200 205 Asp Val Leu Glu Val Thr Thr Arg Phe Met Arg Asp Pro Val Arg Ile 210 215 220 Leu Val Lys Lys Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr 225 230 235 240 Ile Ala Val Glu Lys Glu Glu Trp Lys Leu Asp Thr Leu Ser Asp Leu 245 250 255 Tyr Glu Thr Val Thr Ile Thr Gln Ala Val Ile Phe Cys Asn Thr Arg 260 265 270 Arg Lys Val Asp Trp Leu Thr Asp Lys Leu Thr Ala Arg Asp Phe Thr 275 280 285 Val Ser Ala Met His Gly Asp Met Asp Gln Ala Gln Arg Asp Leu Ile 290 295 300 Met Lys Glu Phe Arg Ser Gly Ser Ser Arg Val Leu Ile Ala Thr Asp 305 310 315 320 Leu Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn 325 330 335 Tyr Asp Leu Pro Ala Asn Arg Glu Asn Tyr Ile His Arg Ile Gly Arg 340 345 350 Gly Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val Thr Ala 355 360 365 Asp Asp Val Arg Met Met Arg Glu Ile Glu Gln Phe Tyr Ser Thr Gln 370 375 380 Ile Glu Glu Met Pro Met Asn Val Ala Asp Leu Ile 385 390 395 <210> 33 <211> 395 <212> PRT <213> Yarrowia lipolytica <400> 33 Met Ala Asp Gly Leu Thr Asp Ile Asp Ser Ser Gln Ile Thr Thr Asn 1 5 10 15 Tyr Asp Glu Val Val Thr Ser Phe Asp Asp Leu Gly Leu Lys Asp Glu 20 25 30 Leu Leu Arg Gly Ile Tyr Gly Tyr Gly Phe Glu Asn Pro Ser Ser Ile 35 40 45 Gln Gln Arg Ala Ile Leu Pro Val Ile Lys Gly Asn Asp Val Leu Ala 50 55 60 Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser Ile Ser Ala 65 70 75 80 Leu Gln Asn Ile Asp Glu Lys Ile Lys Lys Pro Gln Ala Leu Ile Ile 85 90 95 Ala Pro Thr Arg Glu Leu Ala His Gln Ile Gln Lys Val Val Leu Ala 100 105 110 Phe Gly Glu Tyr Met Lys Ile Glu Cys His Ala Cys Ile Gly Gly Thr 115 120 125 Ser Val Ala Glu Asp Ile Arg Val Ile Gln Glu Gly Val His Val Ile 130 135 140 Val Gly Thr Pro Gly Arg Ile His Asp Met Ile Glu Arg Arg Ile Leu 145 150 155 160 Lys Thr Asp Leu Ile Lys Met Phe Ile Leu Asp Glu Ala Asp Glu Met 165 170 175 Leu Ser Arg Glu Phe Lys Asp Pro Ile Tyr Asp Ile Phe Thr Thr Leu 180 185 190 Pro Glu Thr Thr Gln Thr Val Leu Leu Ser Ala Thr Met Pro Ala Glu 195 200 205 Val Leu Asp Ile Thr Gly Lys Phe Met Arg Asp Pro Val Arg Ile Leu 210 215 220 Val Lys Lys Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr Ile 225 230 235 240 Asp Val Glu Gln Glu Ser Tyr Lys Phe Glu Val Leu Cys Asp Leu Tyr 245 250 255 Glu Thr Ile Asn Val Ser Gln Ala Val Ile Phe Cys Asn Thr Arg Arg 260 265 270 Lys Val Asp Tyr Leu Thr Gln Ala Leu Thr Glu Ala Asp Phe Thr Val 275 280 285 Ser Ser Met His Gly Glu Thr Glu Gln Ser Gln Arg Asp Val Ile Met 290 295 300 Lys Ala Phe Arg Thr Gly Ser Ser Arg Ile Leu Ile Thr Thr Asp Leu 305 310 315 320 Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Phe 325 330 335 Asp Leu Pro Ser Asn Arg Glu Asn Tyr Ile His Arg Ile Gly Arg Gly 340 345 350 Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val Thr Ser Glu 355 360 365 Asp His Gly Met Leu Lys Glu Leu Glu Arg Phe Tyr Ser Thr Glu Ile 370 375 380 Val Glu Met Pro Thr Asn Ile Ala Asp Leu Ile 385 390 395 <210> 34 <211> 1098 <212> PRT <213> Komagataella phaffii <400> 34 Met Ser Asn Lys Asn Val Asp Thr Ala Pro Asp Asn Gly Ser Gly Gly 1 5 10 15 Ser Asn Ser Pro Ala Ser Val Pro His Tyr Pro Gln Gln His Arg Ala 20 25 30 Asn Tyr Asn Pro His Lys Asn His Thr Asn His Gly Gly Asn Asn Gly 35 40 45 Gly Ala Gln Gly Tyr Met Gln His Gln Gln Gln Gln Gln Met Tyr Tyr 50 55 60 Asn Gln Met Gly Tyr Pro Met Pro Tyr Pro Asn Ala Gly Gly Asn Phe 65 70 75 80 Asn Gln Asn Val Tyr Leu Val Pro Tyr Asn Thr Met Val Pro Gly Thr 85 90 95 Pro Tyr Gly Ala Gly Ala Pro Gly Val Pro Pro Ser Tyr Pro Val Ser 100 105 110 Pro Ser Pro Ala Phe Ala Ser Pro Gln Lys Thr His Val Pro Val Ser 115 120 125 Leu Arg Thr Pro Ser Gly Glu Pro Ile Asn Leu Val Pro Ala Gly Gln 130 135 140 Thr Ser Ser Ser Ser Ser Asn Ala Ser Pro His Val Lys Ser Thr Ser 145 150 155 160 Ile Pro Pro Ser Ala Val Thr Ser Pro Ala Ala Ser Ile Ala Pro Thr 165 170 175 Val Ala Ser Pro Thr Lys Ala Ala Ala Gly Ser Glu Asp Ala Gly Lys 180 185 190 Thr Arg Asp Ala Phe Lys Gln Met Val Gln Ala Leu Ala Ala Lys Lys 195 200 205 Lys Ala Ala Ala Ala Ala Lys Ala Glu Gly Lys Thr Asp Asp Lys Lys 210 215 220 Glu Ser Val Glu Ser Lys Pro Lys Ser Ala Val Gln Pro Glu Thr Lys 225 230 235 240 Pro Lys Val Glu Val Lys Leu Glu Pro Lys Pro Lys Val Glu Val Lys 245 250 255 Leu Glu Pro Lys Pro Lys Val Glu Ile Lys Leu Glu Pro Lys Pro Val 260 265 270 Ser Glu Ala Lys Pro Glu Thr Lys Thr Val Pro Glu Val Glu Glu Pro 275 280 285 Ser Thr Val Ala Thr Ile Lys Ser Glu Ser Thr Pro Ile Glu Glu Leu 290 295 300 Lys Pro Lys Val Glu Val Thr Pro Glu Val Ala Ser Lys Pro Glu Gln 305 310 315 320 Val Glu Ser Ala Gln Glu Pro Ala Asn Asp Val Lys Pro Ser Glu Val 325 330 335 Ser Ala Lys Glu Val Gln Glu Ser Lys Glu Glu Ser Leu Lys Gln Pro 340 345 350 Lys Glu Ala Leu Asn Asp Ile Lys Ser Thr Glu Glu Ser Asn Lys Lys 355 360 365 Phe Ser Leu Pro Glu Glu Glu Ser Asn Asp His Gln Thr Leu Ser Gln 370 375 380 Ile Gln Gly Val Lys Asp Thr Glu Gln Ser Gln Glu Phe Glu Glu Pro 385 390 395 400 Gln Gly Thr Gln Glu Thr Gln Glu Thr Gln Glu Thr Gln Glu Thr Ala 405 410 415 Lys Pro Leu Glu Ala Gln Ala Pro Gln Glu Ile Gln Glu Thr Gln Glu 420 425 430 Pro Glu Glu Val Gln Glu Gln Thr Pro Glu Thr Ser Glu Thr Val Ser 435 440 445 Ser Val Thr Glu Glu Val Ser Pro Ala Pro Ala Pro Gly Leu Pro Leu 450 455 460 Ser Lys Phe Leu Asp Arg Ile Arg Lys Ala Pro Ala Ile Ser Asn Pro 465 470 475 480 Phe Lys His Glu Tyr Ser Gly Asp Phe His Gly Pro Asp Glu Ser Leu 485 490 495 Ser Gly Leu Lys Thr Ile Lys Tyr Asp Pro Gly Phe Leu Ile Gln Phe 500 505 510 Ala Thr Phe Asn Phe His Ile Asp Glu Asp Phe Ile Asn Asp Val Gly 515 520 525 Ser Lys Val Val Ile Pro Val Asn Thr Arg Arg Asp Asn Phe Ser Lys 530 535 540 Ser Met Ser Thr Ser Asn Phe Lys Gly Ser Gly Arg Asn Met Gly Ser 545 550 555 560 Asn Phe Arg Asn Asp Phe Gly Ser Arg Asn Asn Ser Lys Gln Gly Ser 565 570 575 Lys Lys Lys Asn Lys Ser Gln Lys Ser Gln Ser Arg Arg Gly Pro Lys 580 585 590 Tyr Ser Asn Glu Glu Glu Pro Ala Glu Pro Ala Val Pro Ala Glu Leu 595 600 605 Pro Asn Arg Ala Ala Ser Lys Trp Val Pro Arg Ser Leu Arg Asn Lys 610 615 620 Glu Ala Glu Val Lys Thr Ala Pro Asp Gly Ser Ile Ile Val Ser Glu 625 630 635 640 Glu Asp Ile Lys Arg Lys Thr Lys Ser Leu Leu Asn Lys Leu Thr Leu 645 650 655 Glu Phe Phe Asp Asp Ile Ser Asn Asp Ile Ile Ala Leu Thr Lys Gln 660 665 670 Ala Gln Trp Glu Asp Asp Val Lys Thr Leu Lys Gln Val Ile Glu Ser 675 680 685 Ile Phe Ala Lys Ala Cys Asp Glu Pro Tyr Trp Ser Ser Met Tyr Ala 690 695 700 Lys Leu Cys Ala Lys Met Cys Lys Asp Thr Pro Pro Glu Ile Lys Glu 705 710 715 720 Thr Asn Glu Lys Gly Asn Thr Phe Thr Gly Gly Asp Leu Val Arg Arg 725 730 735 Val Leu Ile Asn Arg Cys Gln Thr Glu Tyr Gln Lys Gly Trp Ile Asp 740 745 750 Gln Leu Pro Thr Asn Glu Asp Gly Ser Pro Leu Glu Pro Glu Leu Met 755 760 765 Ser Asp Glu Tyr Tyr Lys Gln Ala Ala Ala Lys Arg Arg Gly Leu Gly 770 775 780 Leu Val Lys Phe Ile Gly Gln Leu Tyr Gln Leu Asn Leu Leu Ser Asp 785 790 795 800 Asn Val Ile Phe His Cys Val Leu Gly Gln Ser Lys Glu Thr Asp Asn 805 810 815 Pro Ser Glu Asp Thr Met Glu Asn Leu Val Gln Leu Leu Glu Ala Val 820 825 830 Gly Tyr Arg Met Glu Met Ser Ser Glu Pro Lys Ile Arg Arg Val Leu 835 840 845 Asp Leu Ala Phe Ala Asn Ile Lys Ala Ile Val Asp Ala Asn Lys Ile 850 855 860 Pro Ser Arg Ile Arg Phe Met Leu Met Asp Leu Met Asp Leu Arg Arg 865 870 875 880 Asn Gly Trp Ala Thr Thr Glu Glu Asn Ala Gly Pro Lys Thr Ile Gln 885 890 895 Glu Ile His Leu Glu Ala Glu Ile Lys Arg Ser Glu Glu Glu Arg Glu 900 905 910 Lys Glu Arg Asp Arg His Ser Arg Arg Gly Arg Tyr Asn Asp Ser Lys 915 920 925 Pro Asn Ser Arg Gln Lys Ser Ser Trp Gly Ser Ser Val Val Ser Pro 930 935 940 Asn Asp Ile Arg Asn Ala Gly Tyr Val Arg Asn Ser Asp Lys Ser Leu 945 950 955 960 Gly Pro Val Asn Ser Phe Ser Arg Gly Lys Ser Ser Arg Gln Ala Ser 965 970 975 Lys Gln Ser Asn Ser Asp Phe Thr Ser Val Pro Ile Thr Ser Ser Gly 980 985 990 Ser Arg Thr Ala Leu Asn His Ser Gly Asp Ser Ser Thr Ser Leu Asn 995 1000 1005 Glu Pro Gln Ser Arg Glu Tyr Ser Lys Lys Ser Glu Ser Arg Pro 1010 1015 1020 Ala Pro Ser Asn Ile Phe Ala Ala Leu Glu Asp His Asp His Asp 1025 1030 1035 His Glu His Gly His Glu Gln Glu Glu Asn Lys His Ser Lys Asp 1040 1045 1050 Leu Gln Asn Gly Glu Ala Glu Ala Pro Glu Asp Asp Asn Val Gly 1055 1060 1065 Glu Ile Ala Gln Ala Asp Glu Asn Val Gln Gly Gln Glu Gln Glu 1070 1075 1080 Glu Glu Arg Glu Glu Glu Arg Glu Gln Glu Glu Glu Gln Glu Val 1085 1090 1095 <210> 35 <211> 1101 <212> PRT <213> Komagataella pastoris <400> 35 Met Ser Asn Lys Asn Val Asp Thr Ala Pro Asp Asn Gly Ser Gly Gly 1 5 10 15 Ser Asn Ser Pro Ala Ser Val Pro His Tyr Pro Gln Gln His Arg Ser 20 25 30 Asn Tyr Asn Pro His Lys Asn His Thr Asn His Gly Gly Asn Asn Gly 35 40 45 Gly Ala Gln Gly Tyr Met Gln His Gln Gln Gln Gln Gln Met Tyr Tyr 50 55 60 Asn Gln Met Gly Tyr Pro Met Pro Tyr Pro Asn Ala Gly Gly Asn Phe 65 70 75 80 Asn Gln Asn Val Tyr Leu Val Pro Tyr Asn Thr Met Val Pro Gly Thr 85 90 95 Pro Tyr Gly Ala Gly Ala Pro Gly Val Pro Pro Ser Tyr Pro Val Ser 100 105 110 Pro Thr Pro Ala Phe Ala Ser Pro Gln Lys Thr His Val Pro Val Ser 115 120 125 Leu Arg Thr Pro Ser Gly Glu Pro Ile Asn Leu Val Pro Ala Gly Gln 130 135 140 Thr Ser Ser Ser Ser Ser Asn Ala Ser Pro His Val Lys Ser Thr Ser 145 150 155 160 Ile Pro Ala Ser Ala Val Thr Ser Pro Ala Ala Ser Ile Ala Pro Thr 165 170 175 Val Ala Ser Pro Ala Lys Pro Ala Ala Gly Ser Glu Asp Ala Gly Lys 180 185 190 Thr Arg Asp Ala Phe Lys Gln Met Val Gln Ala Leu Ala Ala Lys Lys 195 200 205 Lys Ala Ala Ala Ala Lys Ala Glu Gly Lys Thr Asp Asp Lys Lys Glu 210 215 220 Ser Val Glu Ser Lys Pro Lys Ala Ala Val Gln Pro Glu Ala Lys Pro 225 230 235 240 Lys Val Glu Val Lys Leu Glu Pro Lys Pro Lys Val Glu Val Lys Leu 245 250 255 Glu Pro Lys Pro Lys Val Glu Ile Lys Leu Glu Pro Lys Pro Val Ser 260 265 270 Glu Ala Lys Leu Glu Thr Lys Thr Ala Pro Glu Val Glu Glu Pro Ser 275 280 285 Thr Val Ala Thr Ile Lys Ser Glu Thr Lys Pro Ile Glu Glu Leu Lys 290 295 300 Pro Thr Val Glu Val Ser Leu Gln Val Glu Ala Glu Pro Lys Gln Phe 305 310 315 320 Glu Ser Ala Gln Glu Pro Ala Ala Asp Leu Asn Ser Ser Glu Val Ser 325 330 335 Ala Lys Glu Val Lys Glu Thr Lys Glu Glu Ala Leu Asn Gln Pro Lys 340 345 350 Glu Ala Leu Asn Asp Ile Lys Ser Ala Glu Glu Leu Asn Glu Lys Ser 355 360 365 Thr Pro Gln Glu Glu Glu Ser Asn Asp Gln Gln Thr Leu Ser Gln Ser 370 375 380 Gln Glu Ala Lys Glu Thr Glu Gln Ser Gln Gly Ser Glu Glu Pro Gln 385 390 395 400 Glu Thr Gln Glu Ala Gln Glu Val Gln Val Thr Gln Thr Thr Pro Glu 405 410 415 Gly Gln Glu Gly Lys Glu Thr Gln Glu Pro Gln Glu Ala Gln Glu Ala 420 425 430 Gln Glu Val Gln Glu Gln Thr Pro Glu Thr Ser Glu Thr Val Ser Ser 435 440 445 Val Thr Glu Glu Val Ser Pro Ala Pro Ala Pro Gly Leu Pro Leu Ser 450 455 460 Thr Phe Leu Asp Arg Ile Arg Lys Ser Pro Ala Ile Ser Asn Pro Phe 465 470 475 480 Lys His Gln Tyr Ser Gly Asp Phe His Gly Pro Asp Glu Ser Leu Ser 485 490 495 Gly Leu Lys Thr Ile Lys Tyr Asp Pro Gly Phe Leu Ile Gln Phe Ala 500 505 510 Ser Phe Asn Phe His Ile Asp Glu Asp Phe Ile Asn Asp Val Gly Ser 515 520 525 Lys Val Val Ile Pro Val Asn Thr Arg Arg Asp Asn Phe Ser Lys Ser 530 535 540 Met Ser Thr Ser Asn Phe Lys Gly Ser Gly Arg Asn Met Gly Ser Asn 545 550 555 560 Phe Arg Asn Asp Phe Gly Ser Arg Asn Asn Ser Lys Gln Gly Ser Lys 565 570 575 Lys Lys Asn Lys Ser Gln Lys Ser Gln Ser Arg Arg Gly Pro Lys Tyr 580 585 590 Ser Asn Glu Glu Glu Pro Ala Glu Pro Ala Val Pro Ala Glu Leu Pro 595 600 605 Asn Arg Ala Ala Ser Lys Trp Val Pro Arg Ser Leu Arg Asn Lys Glu 610 615 620 Ala Glu Val Lys Thr Ala Pro Asp Gly Ser Val Ile Val Ser Glu Glu 625 630 635 640 Asp Ile Lys Arg Lys Thr Lys Ser Leu Leu Asn Lys Leu Thr Leu Glu 645 650 655 Phe Phe Asp Asp Ile Ser Asn Asp Ile Ile Ala Leu Thr Lys Gln Ala 660 665 670 Gln Trp Glu Asp Asp Val Lys Thr Leu Lys Gln Val Ile Glu Ser Ile 675 680 685 Phe Ala Lys Ala Cys Asp Glu Pro Tyr Trp Ser Ser Met Tyr Ala Lys 690 695 700 Leu Cys Ala Lys Met Cys Lys Asp Thr Pro Pro Glu Ile Lys Glu Thr 705 710 715 720 Asn Glu Lys Gly Asn Thr Phe Thr Gly Gly Asp Leu Val Arg Arg Val 725 730 735 Leu Ile Asn Arg Cys Gln Thr Glu Tyr Gln Lys Gly Trp Ile Asp Gln 740 745 750 Leu Pro Thr Asn Glu Asp Gly Ser Pro Leu Glu Pro Glu Leu Met Ser 755 760 765 Asp Glu Tyr Tyr Lys Gln Ala Ala Ala Lys Arg Arg Gly Leu Gly Leu 770 775 780 Val Lys Phe Ile Gly Gln Leu Tyr Gln Leu Asn Leu Leu Ser Asp Asn 785 790 795 800 Val Ile Phe His Cys Val Leu Gly Gln Ser Lys Glu Thr Asp Asn Pro 805 810 815 Ser Glu Asp Thr Met Glu Asn Leu Val Gln Leu Leu Glu Ala Val Gly 820 825 830 Tyr Arg Met Glu Met Ser Ser Glu Pro Lys Ile Arg Arg Val Leu Asp 835 840 845 Leu Ala Phe Ala Asn Ile Lys Ala Ile Val Asp Ala Asn Lys Ile Pro 850 855 860 Ser Arg Ile Arg Phe Met Leu Met Asp Leu Met Asp Leu Arg Arg Asn 865 870 875 880 Gly Trp Ala Thr Thr Glu Glu Asn Ala Gly Pro Lys Thr Ile Gln Glu 885 890 895 Ile His Leu Glu Ala Glu Ile Lys Arg Ser Glu Glu Glu Arg Glu Lys 900 905 910 Glu Arg Asp Arg His Ser Arg Arg Gly Arg Tyr Asn Asp Ser Lys Pro 915 920 925 Asn Ser Arg Gln Lys Ser Ser Trp Gly Ser Ser Val Val Ser Pro Asn 930 935 940 Asp Ile Arg Asn Ala Gly Tyr Val Arg Asn Ser Asp Lys Ser Leu Gly 945 950 955 960 Pro Val Asn Ser Phe Ser Arg Gly Lys Ser Ser Arg Gln Ala Ser Lys 965 970 975 Gln Ser Asn Ser Asp Phe Thr Ser Val Pro Ile Thr Ser Ser Gly Ser 980 985 990 Arg Thr Ala Leu Asn His Ser Gly Asp Ser Ser Thr Ser Leu Asn Glu 995 1000 1005 Pro Gln Ser Arg Glu Tyr Ser Lys Lys Ser Glu Ser Arg Pro Ala 1010 1015 1020 Pro Ser Asn Ile Phe Ala Ala Leu Glu Asp His Asp His Asp His 1025 1030 1035 Glu His Gly His Glu Gln Glu Glu Asn Lys His Ser Lys Asp Leu 1040 1045 1050 Gln Asn Gly Glu Ala Glu Thr Pro Glu Asn Val Asn Val Glu Glu 1055 1060 1065 Ile Ala Gln Ala Asp Glu Asn Val Gln Gly Gln Glu Gln Asp Glu 1070 1075 1080 Glu Gln Asp Glu Glu Gln Asp Glu Glu Arg Glu Gln Glu Glu Glu 1085 1090 1095 Gln Glu Val 1100 <210> 36 <211> 1780 <212> PRT <213> Homo sapiens <400> 36 Val Lys Lys Ile His Arg His Arg Leu Ser Pro Ala Thr Glu Lys Gly 1 5 10 15 Ala Ala Ser Ser Gly Glu Gly Asp Lys Asp Pro Pro Pro Pro Ala His 20 25 30 Glu Asp Ile Ala Val Lys Gly Thr Ala Thr Ala Ala Gly Thr Gly Pro 35 40 45 Gly Thr Gly Ala Ala Ala Ala Ala Ala Ala Ala Val Pro Pro Pro His 50 55 60 Pro Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 65 70 75 80 Ala Val Pro Pro Pro His Pro Asn Ile Arg Ala Leu Gln Thr Gln Ala 85 90 95 Pro Gln Gln Ile Pro Arg Gly Pro Val Gln Gln Pro Leu Glu Asp Arg 100 105 110 Ile Phe Thr Pro Ala Val Ser Ala Val Tyr Ser Thr Val Thr Gln Val 115 120 125 Ala Arg Gln Pro Gly Thr Pro Thr Pro Ser Pro Tyr Ser Ala His Glu 130 135 140 Ile Asn Lys Gly His Pro Asn Leu Ala Ala Thr Pro Pro Gly His Ala 145 150 155 160 Ser Ser Pro Gly Leu Ser Gln Thr Pro Tyr Pro Ser Gly Gln Asn Ala 165 170 175 Gly Pro Thr Thr Leu Val Tyr Pro Gln Thr Pro Gln Thr Met Asn Ser 180 185 190 Gln Pro Gln Thr Arg Ser Pro Gly Gly Phe Arg Pro Ile Gln Phe Phe 195 200 205 Gln Arg Pro Gln Ile Gln Pro Pro Arg Ala Thr Ile Pro Asn Ser Ser 210 215 220 Pro Ser Ile Arg Pro Gly Ala Gln Thr Pro Thr Ala Val Tyr Gln Ala 225 230 235 240 Asn Gln His Ile Met Met Val Asn His Leu Pro Met Pro Tyr Pro Val 245 250 255 Pro Gln Gly Pro Gln Tyr Cys Ile Pro Gln Tyr Arg His Ser Gly Pro 260 265 270 Pro Tyr Val Gly Pro Pro Gln Gln Tyr Pro Val Gln Pro Pro Gly Pro 275 280 285 Gly Pro Phe Tyr Pro Gly Pro Gly Pro Gly Asp Phe Pro Asn Ala Tyr 290 295 300 Gly Thr Pro Phe Tyr Pro Ser Gln Pro Val Tyr Gln Ser Ala Pro Ile 305 310 315 320 Ile Val Pro Thr Gln Gln Gln Pro Pro Pro Ala Lys Arg Glu Lys Lys 325 330 335 Thr Ile Arg Ile Arg Asp Pro Asn Gln Gly Gly Lys Asp Ile Thr Glu 340 345 350 Glu Ile Met Ser Gly Gly Gly Ser Arg Asn Pro Thr Pro Pro Ile Gly 355 360 365 Arg Pro Thr Ser Thr Pro Thr Pro Pro Gln Leu Pro Ser Gln Val Pro 370 375 380 Glu His Ser Pro Val Val Tyr Gly Thr Val Glu Ser Ala His Leu Ala 385 390 395 400 Ala Ser Thr Pro Val Thr Ala Ala Ser Asp Gln Lys Gln Glu Glu Lys 405 410 415 Pro Lys Pro Asp Pro Val Leu Lys Ser Pro Ser Pro Val Leu Arg Leu 420 425 430 Val Leu Ser Gly Glu Lys Lys Glu Gln Glu Gly Gln Thr Ser Glu Thr 435 440 445 Thr Ala Ile Val Ser Ile Ala Glu Leu Pro Leu Pro Pro Ser Pro Thr 450 455 460 Thr Val Ser Ser Val Ala Arg Ser Thr Ile Ala Ala Pro Thr Ser Ser 465 470 475 480 Ala Leu Ser Ser Gln Pro Ile Phe Thr Thr Ala Ile Asp Asp Arg Cys 485 490 495 Glu Leu Ser Ser Pro Arg Glu Asp Thr Ile Pro Ile Pro Ser Leu Thr 500 505 510 Ser Cys Thr Glu Thr Ser Asp Pro Leu Pro Thr Asn Glu Asn Asp Asp 515 520 525 Asp Ile Cys Lys Lys Pro Cys Ser Val Ala Pro Asn Asp Ile Pro Leu 530 535 540 Val Ser Ser Thr Asn Leu Ile Asn Glu Ile Asn Gly Val Ser Glu Lys 545 550 555 560 Leu Ser Ala Thr Glu Ser Ile Val Glu Ile Val Lys Gln Glu Val Leu 565 570 575 Pro Leu Thr Leu Glu Leu Glu Ile Leu Glu Asn Pro Pro Glu Glu Met 580 585 590 Lys Leu Glu Cys Ile Pro Ala Pro Ile Thr Pro Ser Thr Val Pro Ser 595 600 605 Phe Pro Pro Thr Pro Pro Thr Pro Pro Ala Ser Pro Pro His Thr Pro 610 615 620 Val Ile Val Pro Ala Ala Ala Thr Thr Val Ser Ser Pro Ser Ala Ala 625 630 635 640 Ile Thr Val Gln Arg Val Leu Glu Glu Asp Glu Ser Ile Arg Thr Cys 645 650 655 Leu Ser Glu Asp Ala Lys Glu Ile Gln Asn Lys Ile Glu Val Glu Ala 660 665 670 Asp Gly Gln Thr Glu Glu Ile Leu Asp Ser Gln Asn Leu Asn Ser Arg 675 680 685 Arg Ser Pro Val Pro Ala Gln Ile Ala Ile Thr Val Pro Lys Thr Trp 690 695 700 Lys Lys Pro Lys Asp Arg Thr Arg Thr Thr Glu Glu Met Leu Glu Ala 705 710 715 720 Glu Leu Glu Leu Lys Ala Glu Glu Glu Leu Ser Ile Asp Lys Val Leu 725 730 735 Glu Ser Glu Gln Asp Lys Met Ser Gln Gly Phe His Pro Glu Arg Asp 740 745 750 Pro Ser Asp Leu Lys Lys Val Lys Ala Val Glu Glu Asn Gly Glu Glu 755 760 765 Ala Glu Pro Val Arg Asn Gly Ala Glu Ser Val Ser Glu Gly Glu Gly 770 775 780 Ile Asp Ala Asn Ser Gly Ser Thr Asp Ser Ser Gly Asp Gly Val Thr 785 790 795 800 Phe Pro Phe Lys Pro Glu Ser Trp Lys Pro Thr Asp Thr Glu Gly Lys 805 810 815 Lys Gln Tyr Asp Arg Glu Phe Leu Leu Asp Phe Gln Phe Met Pro Ala 820 825 830 Cys Ile Gln Lys Pro Glu Gly Leu Pro Pro Ile Ser Asp Val Val Leu 835 840 845 Asp Lys Ile Asn Gln Pro Lys Leu Pro Met Arg Thr Leu Asp Pro Arg 850 855 860 Ile Leu Pro Arg Gly Pro Asp Phe Thr Pro Ala Phe Ala Asp Phe Gly 865 870 875 880 Arg Gln Thr Pro Gly Gly Arg Gly Val Pro Leu Leu Asn Val Gly Ser 885 890 895 Arg Arg Ser Gln Pro Gly Gln Arg Arg Glu Pro Arg Lys Ile Ile Thr 900 905 910 Val Ser Val Lys Glu Asp Val His Leu Lys Lys Ala Glu Asn Ala Trp 915 920 925 Lys Pro Ser Gln Lys Arg Asp Ser Gln Ala Asp Asp Pro Glu Asn Ile 930 935 940 Lys Thr Gln Glu Leu Phe Arg Lys Val Arg Ser Ile Leu Asn Lys Leu 945 950 955 960 Thr Pro Gln Met Phe Asn Gln Leu Met Lys Gln Val Ser Gly Leu Thr 965 970 975 Val Asp Thr Glu Glu Arg Leu Lys Gly Val Ile Asp Leu Val Phe Glu 980 985 990 Lys Ala Ile Asp Glu Pro Ser Phe Ser Val Ala Tyr Ala Asn Met Cys 995 1000 1005 Arg Cys Leu Val Thr Leu Lys Val Pro Met Ala Asp Lys Pro Gly 1010 1015 1020 Asn Thr Val Asn Phe Arg Lys Leu Leu Leu Asn Arg Cys Gln Lys 1025 1030 1035 Glu Phe Glu Lys Asp Lys Ala Asp Asp Asp Val Phe Glu Lys Lys 1040 1045 1050 Gln Lys Glu Leu Glu Ala Ala Ser Ala Pro Glu Glu Arg Thr Arg 1055 1060 1065 Leu His Asp Glu Leu Glu Glu Ala Lys Asp Lys Ala Arg Arg Arg 1070 1075 1080 Ser Ile Gly Asn Ile Lys Phe Ile Gly Glu Leu Phe Lys Leu Lys 1085 1090 1095 Met Leu Thr Glu Ala Ile Met His Asp Cys Val Val Lys Leu Leu 1100 1105 1110 Lys Asn His Asp Glu Glu Ser Leu Glu Cys Leu Cys Arg Leu Leu 1115 1120 1125 Thr Thr Ile Gly Lys Asp Leu Asp Phe Glu Lys Ala Lys Pro Arg 1130 1135 1140 Met Asp Gln Tyr Phe Asn Gln Met Glu Lys Ile Val Lys Glu Arg 1145 1150 1155 Lys Thr Ser Ser Arg Ile Arg Phe Met Leu Gln Asp Val Ile Asp 1160 1165 1170 Leu Arg Leu Cys Asn Trp Val Ser Arg Arg Ala Asp Gln Gly Pro 1175 1180 1185 Lys Thr Ile Glu Gln Ile His Lys Glu Ala Lys Ile Glu Glu Gln 1190 1195 1200 Glu Glu Gln Arg Lys Val Gln Gln Leu Met Thr Lys Glu Lys Arg 1205 1210 1215 Arg Pro Gly Val Gln Arg Val Asp Glu Gly Gly Trp Asn Thr Val 1220 1225 1230 Gln Gly Ala Lys Asn Ser Arg Val Leu Asp Pro Ser Lys Phe Leu 1235 1240 1245 Lys Ile Thr Lys Pro Thr Ile Asp Glu Lys Ile Gln Leu Val Pro 1250 1255 1260 Lys Ala Gln Leu Gly Ser Trp Gly Lys Gly Ser Ser Gly Gly Ala 1265 1270 1275 Lys Ala Ser Glu Thr Asp Ala Leu Arg Ser Ser Ala Ser Ser Leu 1280 1285 1290 Asn Arg Phe Ser Ala Leu Gln Pro Pro Ala Pro Ser Gly Ser Thr 1295 1300 1305 Pro Ser Thr Pro Val Glu Phe Asp Ser Arg Arg Thr Leu Thr Ser 1310 1315 1320 Arg Gly Ser Met Gly Arg Glu Lys Asn Asp Lys Pro Leu Pro Ser 1325 1330 1335 Ala Thr Ala Arg Pro Asn Thr Phe Met Arg Gly Gly Ser Ser Lys 1340 1345 1350 Asp Leu Leu Asp Asn Gln Ser Gln Glu Glu Gln Arg Arg Glu Met 1355 1360 1365 Leu Glu Thr Val Lys Gln Leu Thr Gly Gly Val Asp Val Glu Arg 1370 1375 1380 Asn Ser Thr Glu Ala Glu Arg Asn Lys Thr Arg Glu Ser Ala Lys 1385 1390 1395 Pro Glu Ile Ser Ala Met Ser Ala His Asp Lys Ala Ala Leu Ser 1400 1405 1410 Glu Glu Glu Leu Glu Arg Lys Ser Lys Ser Ile Ile Asp Glu Phe 1415 1420 1425 Leu His Ile Asn Asp Phe Lys Glu Ala Met Gln Cys Val Glu Glu 1430 1435 1440 Leu Asn Ala Gln Gly Leu Leu His Val Phe Val Arg Val Gly Val 1445 1450 1455 Glu Ser Thr Leu Glu Arg Ser Gln Ile Thr Arg Asp His Met Gly 1460 1465 1470 Gln Leu Leu Tyr Gln Leu Val Gln Ser Glu Lys Leu Ser Lys Gln 1475 1480 1485 Asp Phe Phe Lys Gly Phe Ser Glu Thr Leu Glu Leu Ala Asp Asp 1490 1495 1500 Met Ala Ile Asp Ile Pro His Ile Trp Leu Tyr Leu Ala Glu Leu 1505 1510 1515 Val Thr Pro Met Leu Lys Glu Gly Gly Ile Ser Met Arg Glu Leu 1520 1525 1530 Thr Ile Glu Phe Ser Lys Pro Leu Leu Pro Val Gly Arg Ala Gly 1535 1540 1545 Val Leu Leu Ser Glu Ile Leu His Leu Leu Cys Lys Gln Met Ser 1550 1555 1560 His Lys Lys Val Gly Ala Leu Trp Arg Glu Ala Asp Leu Ser Trp 1565 1570 1575 Lys Asp Phe Leu Pro Glu Gly Glu Asp Val His Asn Phe Leu Leu 1580 1585 1590 Glu Gln Lys Leu Asp Phe Ile Glu Ser Asp Ser Pro Cys Ser Ser 1595 1600 1605 Glu Ala Leu Ser Lys Lys Glu Leu Ser Ala Glu Glu Leu Tyr Lys 1610 1615 1620 Arg Leu Glu Lys Leu Ile Ile Glu Asp Lys Ala Asn Asp Glu Gln 1625 1630 1635 Ile Phe Asp Trp Val Glu Ala Asn Leu Asp Glu Ile Gln Met Ser 1640 1645 1650 Ser Pro Thr Phe Leu Arg Ala Leu Met Thr Ala Val Cys Lys Ala 1655 1660 1665 Ala Ile Ile Ala Asp Ser Ser Thr Phe Arg Val Asp Thr Ala Val 1670 1675 1680 Ile Lys Gln Arg Val Pro Ile Leu Leu Lys Tyr Leu Asp Ser Asp 1685 1690 1695 Thr Glu Lys Glu Leu Gln Ala Leu Tyr Ala Leu Gln Ala Ser Ile 1700 1705 1710 Val Lys Leu Asp Gln Pro Ala Asn Leu Leu Arg Met Phe Phe Asp 1715 1720 1725 Cys Leu Tyr Asp Glu Glu Val Ile Ser Glu Asp Ala Phe Tyr Lys 1730 1735 1740 Trp Glu Ser Ser Lys Asp Pro Ala Glu Gln Asn Gly Lys Gly Val 1745 1750 1755 Ala Leu Lys Ser Val Thr Ala Phe Phe Thr Trp Leu Arg Glu Ala 1760 1765 1770 Glu Glu Glu Ser Glu Asp Asn 1775 1780 <210> 37 <211> 1536 <212> PRT <213> Aspergillus niger <400> 37 Met Ser Ser Ile Pro Pro Lys Ser Gly Leu Gln Pro Gln Gly Gln Ser 1 5 10 15 Thr Ser Thr Gln Ala Ala Ser Ser Ala His Thr Ser Ser Pro Ser Val 20 25 30 Gly Gly Lys Ser Pro Thr Pro Ser Ser Thr Ser Thr Thr Ala Pro Arg 35 40 45 Ser Tyr Ala Asn Ala Thr Lys Lys Ser Ala Thr Asp Ser Thr Ala Ala 50 55 60 Pro Val Thr Val Gly Gly Pro Ser Gln His Gly Lys Ser Thr Thr Ala 65 70 75 80 Ser Pro Val Ser Gly Lys Pro Met Gln Gln Ser Gln Thr Pro Gly Val 85 90 95 Thr Ile Val Asn Gly Ala Pro Ala Pro Ala Ser Gln Gly Asp His Thr 100 105 110 Arg Lys Pro Ser Val Thr Ile Thr Ser Ala Gly Thr Ser Gly Phe Ile 115 120 125 Pro Asn Gly Gly Gln Thr Gly Arg Pro Asn Ser Leu Gln Phe Gly Phe 130 135 140 Ala Ala Asn Gln Gln Ser Ser Pro Asn Met Gly Asn Pro Ala Val Leu 145 150 155 160 Ala Asn Gln Pro Gln Ser Gly Leu Gly Val Thr Pro Pro Met Asn Pro 165 170 175 Arg Val Thr Ser Pro Gln Thr Ser Pro Ser Pro Ile Pro Gln Pro Ala 180 185 190 Ser Ser Gly Gly Arg Pro Pro Pro Ser Ser Tyr Gln Ser Gln Gly Asn 195 200 205 Val Pro Asn Phe Gly Ser Phe Gly Asp Ala Gly Asp Asn Met Arg Pro 210 215 220 Ala Pro Gln Ala Pro Leu Gly Pro Gly Ala Gln Ser Thr His Leu Arg 225 230 235 240 Arg Glu Ser Ser Gln Ser Thr His Ser Asp Met Ser Asn His Met Gly 245 250 255 Gly Gly Pro Gly Gly Arg Gly Gly Tyr His His Gln Gly Gly Arg Gly 260 265 270 Arg Gly Phe Ser Gln Ser Ser Tyr Gln Gly Gln Met Pro Tyr Ser Pro 275 280 285 Asn Ala Ser Phe Arg Ser Thr Pro Asn Gln Pro Arg Gly Gly Pro Asn 290 295 300 Met Ala Pro Gln Phe Pro Asn Gln Pro Arg Pro Met Pro Phe Pro Asn 305 310 315 320 Ser Pro His Gln Ala Ser Arg Ser Pro Ala Leu Ala Asn Ala His Pro 325 330 335 Ala Thr Pro Gln Met Asn Gln Val Pro Met Ala His Pro Gln Met Ala 340 345 350 Pro Gln Pro Tyr Tyr Gly Gln Pro Met Pro Pro Gln Pro Val Arg Pro 355 360 365 His Pro Leu Gln Lys Pro Ala Arg Arg Gly Gly Ala Leu Asn Arg Lys 370 375 380 Lys Gly Pro Ser Arg Thr Pro Ile Thr Pro Arg Ser Ser Val Thr Pro 385 390 395 400 Asn Pro His Ile Thr Leu Pro Pro Asn Leu Ala Pro Glu Ser Gly His 405 410 415 Phe Glu Arg Tyr Leu Thr Met Met Lys Ser Lys Gln Gly Tyr Pro Thr 420 425 430 Phe Asp Pro Ala Tyr Gly Phe Tyr Pro Asn Tyr Asn Met Gly Gly Val 435 440 445 Pro Tyr Met Pro Pro Ser Pro Gln Pro Arg Pro Gly Ile Pro Tyr Asn 450 455 460 Ala Gln Ala Pro Tyr Met Gln Asn Gln Tyr Pro Val Gln Pro Ala Ala 465 470 475 480 Gln Ala Thr Ala Leu Ser Arg Ser Pro Ser His Ser Asn Asp Arg Pro 485 490 495 Gly Ser Ser Leu Gly Gln Gly Gln Pro Pro Ala Gly Ala Pro Gly Pro 500 505 510 Ala His Ala His Asn Ala Ser Arg Ser Ser Asn Ser Pro Ala Pro Gln 515 520 525 Lys Ser Ser Phe Val Ile Pro Thr Ala Lys Lys Asn Ala Val Val Ile 530 535 540 Lys Asp Pro Gly Ser Gly Ala Val Lys Thr Phe Glu Lys Ala Pro Ala 545 550 555 560 Ser Pro Ala Arg Val Thr Pro Ser Pro Val Lys Ile Ala Thr Pro Thr 565 570 575 Ser Thr Pro Pro Pro Arg Thr Gly Ser Ser Ala Asp His Thr Arg Thr 580 585 590 Asp Ser Lys Ser Thr Lys Thr Asp Glu Glu Lys Lys Lys Glu Leu Arg 595 600 605 Asp Ala Val His Gln Lys Ile Glu Gln Asp Arg Ile Glu Lys Glu Glu 610 615 620 Ala Glu Arg Arg Lys Ala Glu Glu Glu Ala Ala Gln Lys Lys Lys Glu 625 630 635 640 Glu Glu Glu Glu Ala Ala Arg Lys Lys Ala Glu Glu Asp Ala Ala Gln 645 650 655 Lys Lys Lys Glu Glu Glu Glu Ala Ala Gln Lys Lys Ala Ala Asp Glu 660 665 670 Glu Ala Ala Arg Lys Gly Leu Glu Asp Leu Ser Leu Lys Asp Lys Pro 675 680 685 Ala Glu Thr Lys Ala Glu Glu Pro Ser Lys Pro Ala Ala Ala Pro Ala 690 695 700 Pro Ala Asp Asp Asp Asp Asp Ile Asp Tyr Asp Ala Ile Glu Arg Glu 705 710 715 720 Met Ala Glu Ile Glu Ala Lys Glu Arg Ala Ala Glu Glu Ala Tyr Tyr 725 730 735 Ala Arg Lys Lys Ala Glu Lys Glu Glu Lys Glu Arg Lys Glu Lys Glu 740 745 750 Glu Arg Glu Ala Tyr Glu Ala Asn Met Lys Asn Ala Glu Arg Glu Ala 755 760 765 Glu Ala Leu Glu Glu Ala Arg Ala Lys Lys Arg Glu Ala Gly Val Glu 770 775 780 Glu Glu Ser Lys Asp Lys Asp Leu Phe Ala Ser Leu Lys Lys Gly Gly 785 790 795 800 Phe Pro Ala Thr Glu Ala Ser Thr Pro Gly Asp Ser Gly Ala Ala Thr 805 810 815 Pro Ala Ser Asp Met Ser Met Gly Pro Pro Ser Lys Pro Ala Ser Ala 820 825 830 Asn Lys Arg Glu Lys Pro Ala Ala Leu Lys Leu Glu Thr Thr Lys Ala 835 840 845 Val Glu Pro Pro Gln Pro Ser Ala Ala Met Lys Ala Leu His Ser Ala 850 855 860 Arg Phe Val Asp Asp Leu Ser Lys Ile Thr Tyr Pro Ala Ser Ile Val 865 870 875 880 Ser Pro Asn Pro Ala Leu Asn Ala Ser Ala Pro Ala Asp Arg Lys Phe 885 890 895 His Tyr Asn Lys Glu Phe Leu Leu Gln Phe Gln Ser Val Phe Lys Glu 900 905 910 Lys Pro Ser Ile Asp Trp Asp Ala Arg Val Arg Glu Thr Val Gly Asp 915 920 925 Ser Asp Ser Ser Arg Pro Gln Ser Ala Arg Thr Pro Met Met Gly Gly 930 935 940 Arg Asn Ser Ser Arg Pro Gly Ala Ala Pro Phe Gln Met Gly Asn Phe 945 950 955 960 Gly Gln Thr Pro Ser Arg Ala Ser Asn Leu Pro Pro Gly Thr Thr Ser 965 970 975 Ala Glu Arg Phe Ala Met Ser Asn Ala Ala Arg Thr Ala Ser Met Gly 980 985 990 Asn Pro Phe Gly Asn Phe Gly Arg Pro Gly Leu Gly Ile Gly Ala Pro 995 1000 1005 Gly Ile Ser Arg Thr Asn Ser Ala Ser Ala Met His Pro Gly Met 1010 1015 1020 Pro Ser Ser Pro Arg Val Gly Ser Ser Asn Arg Ser Gly Thr Arg 1025 1030 1035 Thr Gly Ser Lys Arg Asp Lys Gln Asn Ala Lys Lys Glu Glu Glu 1040 1045 1050 Met Ala Lys Ser Met Pro Leu Thr Ala Gly Met Glu Val Lys Ala 1055 1060 1065 Leu Gln Val Ser Ser Thr Gly Trp Lys Pro Arg Ser Ile Gly Gln 1070 1075 1080 Ala Pro Ala Ala Ala Ala Gly Pro Thr Pro Gly Gly Ala Thr His 1085 1090 1095 Met Pro Pro Asp Met Val Gln Arg Lys Val Lys Ala Ala Leu Asn 1100 1105 1110 Lys Met Thr Pro Glu Asn Phe Asp Arg Ile Ala Gly Gln Leu Leu 1115 1120 1125 Glu Ile Val Ser Gln Ser Lys Asp Glu Thr Asp Gly Arg Thr Leu 1130 1135 1140 Arg Gln Val Ile Gln Leu Thr Phe Glu Lys Ala Thr Asp Glu Ala 1145 1150 1155 His Trp Ala Ser Ile Tyr Ala Lys Phe Cys Lys Arg Met Leu Glu 1160 1165 1170 Ser Met Ser Ala Glu Ile Lys Asp Glu Asn Ile His Asp Lys Asn 1175 1180 1185 Gly Asn Val Val Ala Gly Gly Ser Leu Phe Arg Lys Tyr Leu Leu 1190 1195 1200 Asn Arg Cys Gln Glu Glu Phe Glu Arg Gly Trp Lys Val Asn Leu 1205 1210 1215 Pro Pro Lys Pro Glu Gly Glu Thr Glu Glu Ala Ala Met Met Ser 1220 1225 1230 Asp Glu Tyr Tyr Lys Ala Ala Ala Ala Lys Arg Arg Gly Leu Gly 1235 1240 1245 Leu Val Lys Phe Ile Gly Glu Leu Tyr Lys Leu Gly Met Leu Thr 1250 1255 1260 Glu Arg Ile Met His Glu Cys Val Lys Lys Leu Val Asp Tyr Glu 1265 1270 1275 Gly Met Pro Asp Glu Ala Glu Val Glu Ser Leu Thr Ser Leu Leu 1280 1285 1290 Arg Thr Ile Gly Ala Ser Leu Asp Val Ser Glu Lys Gly His Ala 1295 1300 1305 Phe Met Asn Ala Tyr Phe His Arg Ile Gly Leu Met Ile Gln Thr 1310 1315 1320 Pro Gly Leu Pro Ser Arg Leu Arg Phe Met Leu Met Asp Ile Val 1325 1330 1335 Asp Leu Arg Ala Ala Arg Trp Gln Ser Lys Asp Ala Asp Lys Gly 1340 1345 1350 Pro Lys Thr Ile Gln Gln Ile Arg Glu Glu Ala Ala Arg Ala Gln 1355 1360 1365 Gln Glu Ala Glu Met Glu Arg Leu Arg Gln Gln Ala Asn Arg Gly 1370 1375 1380 Ser Arg Pro Gly Leu Gly Arg Gly Asp Ala Arg Ser Tyr Ser Gly 1385 1390 1395 Tyr Gly Asn Gln Ala Pro Pro Gln Asp Phe Ala Ser Ser Lys Val 1400 1405 1410 Gly Ser Asp Asp Leu Arg Arg Leu Arg Thr Ser Arg Gln Thr Asn 1415 1420 1425 Gln Pro Met Ser Phe Gly Pro Ser Ser Met Leu Gly Ser Arg Ser 1430 1435 1440 Asn Ser Gly Arg Lys Asn Leu Gly Pro Gly Gly Asn Leu Val Arg 1445 1450 1455 Gly Ser Asp Asp Ser Ala Ala Ser Ser Arg Thr Gly Thr Pro Thr 1460 1465 1470 Gly Lys Lys Glu Asp Lys Glu Ala Ala Ser Ser Ile Asn Ala Phe 1475 1480 1485 Ser Ala Leu Ala Ser Leu Glu Asp Arg Asp Asn Met Ala Thr Ser 1490 1495 1500 Pro Pro Ser Asn Pro Thr Ser Pro Leu Leu Thr Lys Ser Gln Pro 1505 1510 1515 Ala Val Glu Arg Arg Pro Ser Lys Thr Pro Ser Lys Asp Gly Glu 1520 1525 1530 Glu Ala Ser 1535 <210> 38 <211> 1725 <212> PRT <213> Cricetulus griseus <400> 38 Met Gly Arg Pro Gln Gly Phe Arg Ile Pro Arg Gly Pro Val Gln Gln 1 5 10 15 Pro Leu Glu Asp Arg Ile Phe Pro Pro Thr Val Ser Ala Val Tyr Ser 20 25 30 Thr Val Thr Gln Val Ala Arg Gln Pro Gly Pro Pro Thr Pro Ser Pro 35 40 45 Tyr Ser Ala His Glu Ile Asn Lys Gly His Pro Asn Leu Ala Ala Thr 50 55 60 Pro Pro Gly His Ala Ser Ser Pro Gly Leu Ser Gln Thr Pro Tyr Pro 65 70 75 80 Ser Gly Gln Asn Ala Gly Pro Thr Thr Leu Val Tyr Pro Gln Ala Pro 85 90 95 Gln Thr Met Asn Ser Gln Pro Gln Thr Arg Ser Pro Pro Ser Arg Thr 100 105 110 Val Pro Ile His Cys Thr Asp Asn Trp Lys Arg Arg Lys Val Leu Glu 115 120 125 Gln Thr Pro Val Tyr Arg Ser Leu Ala Gly Arg Gly Trp Ile Lys Tyr 130 135 140 Cys Ile Phe Ala Ala Gly Pro Arg Pro Ala His His Gln Phe Phe Gln 145 150 155 160 Arg Pro Gln Ile Gln Pro Pro Arg Ala Thr Ile Pro Asn Ser Ser Pro 165 170 175 Ser Ile Arg Pro Gly Ala Gln Thr Pro Thr Ala Val Tyr Gln Ala Asn 180 185 190 Gln His Ile Met Met Val Asn His Leu Pro Met Pro Tyr Pro Val Pro 195 200 205 Gln Gly Pro Gln Tyr Cys Ile Pro Gln Tyr Arg His Ser Gly Pro Pro 210 215 220 Tyr Val Gly Pro Pro Gln Gln Tyr Pro Val Gln Pro Pro Gly Pro Gly 225 230 235 240 Pro Phe Tyr Pro Gly Pro Gly Pro Gly Asp Phe Ala Asn Ala Tyr Gly 245 250 255 Thr Pro Phe Tyr Pro Ser Gln Pro Val Tyr Gln Ser Ala Pro Ile Ile 260 265 270 Val Pro Thr Gln Gln Gln Pro Pro Pro Ala Lys Arg Glu Lys Lys Thr 275 280 285 Ile Arg Ile Arg Asp Pro Asn Gln Gly Gly Lys Asp Ile Thr Glu Glu 290 295 300 Ile Met Ser Gly Gly Gly Ser Arg Asn Pro Thr Pro Pro Ile Gly Arg 305 310 315 320 Pro Thr Ser Thr Pro Thr Pro Pro Gln Gln Leu Pro Ser Gln Val Pro 325 330 335 Glu His Ser Pro Val Val Tyr Gly Thr Val Glu Ser Ala His Leu Ala 340 345 350 Ala Ser Thr Pro Val Thr Ala Ala Ser Asp Gln Lys Gln Glu Glu Lys 355 360 365 Pro Lys Pro Asp Pro Val Phe Gln Ser Pro Ser Thr Val Leu Arg Leu 370 375 380 Val Leu Ser Gly Glu Lys Lys Glu Gln Ala Ser Pro Val Pro Glu Thr 385 390 395 400 Pro Ala Gly Glu Pro Thr Pro Glu Leu Pro Arg Thr Ser Ser Pro Thr 405 410 415 Thr Leu Ala Pro Leu Ala Arg Ser Ser Val Pro Ser Pro Thr Cys Ala 420 425 430 Ala Leu Ser Ser Gln Pro Leu Phe Thr Thr Ala Leu Glu Asp Lys Arg 435 440 445 Asp Leu Ser Ser Ser Gln Glu Asp Ala Leu Pro Val Pro Ser Pro Thr 450 455 460 Ser Cys Thr Val Thr Ser Asp Pro Ser Leu Thr Asp Asp Lys Asn Ile 465 470 475 480 Cys Lys Lys Pro Cys Ser Val Ala Pro His Asp Ile Gln Leu Ile Ser 485 490 495 Thr Pro Asn Leu Met Asn Glu Met Asn Gly Val Gly Glu Lys Leu Pro 500 505 510 Ala Gln Glu Ser Ile Val Asp Met Ala Lys Gln Glu Thr Leu Pro Leu 515 520 525 Thr Leu Glu Leu Glu Ile Leu Glu His Ala Gln Glu Glu Met Lys Val 530 535 540 Glu Cys Thr Pro Thr Ala Ile Thr Pro Ser Met Leu Thr Ser Phe Ser 545 550 555 560 Pro Ala Pro Leu Thr Pro Pro Ser Ser Pro Cys Ala Pro Val Ile Ser 565 570 575 Ala Thr Thr Ala Arg Ser Pro Val Ala Ala Thr Val Val Gln Arg Val 580 585 590 Ala Glu Glu Gly Glu Ser Ile Arg Thr Cys Leu Ser Glu Asp Ala Asn 595 600 605 Glu Thr Gln Tyr Lys Thr Glu Ala Glu Ala Asp Gly Gln Thr Glu Glu 610 615 620 Ile Val Asp Ser Gln Asn Leu Asn Ser Arg Arg Ser Pro Gly Pro Val 625 630 635 640 Gln Thr Ala Ile Ile Ala Pro Lys Thr Trp Lys Lys Ala Lys Asp Arg 645 650 655 Ser Arg Thr Pro Asp Glu Val Leu Glu Ala Glu Ala Glu Pro Lys Ala 660 665 670 Asp Glu Glu Leu Pro Asp Asp Arg Val Leu Glu Pro Glu Thr Asp Lys 675 680 685 Met Ser Gln Gly Phe His Phe Glu Arg Asp Ser Ser Ala Leu Lys Arg 690 695 700 Val Lys Ala Gly Glu Glu Asn Gly Glu Glu Val Glu Pro Leu Arg Asn 705 710 715 720 Gly Ala Glu Ser Pro Ser Glu Gly Glu Gly Gly Asp Ala Asn Ser Gly 725 730 735 Ser Thr Asp Ser Ser Gly Asp Gly Ile Pro Phe Pro Phe Lys Ala Glu 740 745 750 Ser Trp Lys Pro Ala Asp Thr Glu Gly Lys Lys Gln Tyr Asp Arg Glu 755 760 765 Phe Leu Leu Asp Ile Gln Phe Met Pro Ala Cys Ile Gln Lys Pro Glu 770 775 780 Gly Leu Pro Pro Ile Ser Asp Val Val Leu Asp Lys Ile Asn Gln Pro 785 790 795 800 Arg Leu Pro Met Arg Thr Leu Asp Pro Arg Ile Leu Pro Arg Gly Pro 805 810 815 Asp Phe Thr Pro Ala Phe Ala Asp Phe Gly Arg Gln Thr Pro Gly Gly 820 825 830 Arg Gly Val Pro Leu Leu Asn Val Gly Pro Arg Arg Ser Gln Pro Gly 835 840 845 Gln Arg Arg Glu Pro Arg Lys Ile Ile Thr Val Ser Val Lys Glu Asp 850 855 860 Val His Leu Arg Lys Ala Glu Asn Ala Trp Lys Pro Ser Gln Lys Arg 865 870 875 880 Asp Ser His Ala Asp Asp Pro Glu Ser Ile Lys Thr Gln Glu Leu Phe 885 890 895 Arg Lys Val Arg Ser Ile Leu Asn Lys Leu Thr Pro Gln Met Phe Asn 900 905 910 Gln Leu Met Lys Gln Val Ser Gly Leu Thr Val Asp Thr Glu Glu Arg 915 920 925 Leu Lys Gly Val Ile Asp Leu Val Phe Glu Lys Ala Ile Asp Glu Pro 930 935 940 Ser Phe Ser Val Ala Tyr Ala Asn Met Cys Arg Cys Leu Val Thr Leu 945 950 955 960 Lys Val Pro Met Ala Glu Lys Pro Gly Asn Thr Val Asn Phe Arg Lys 965 970 975 Leu Leu Leu Asn Arg Cys Gln Lys Glu Phe Glu Lys Asp Lys Ala Asp 980 985 990 Asp Asp Val Phe Glu Lys Lys Gln Lys Glu Leu Glu Ala Ala Ser Ala 995 1000 1005 Pro Glu Glu Arg Thr Arg Leu His Asp Glu Leu Glu Glu Ala Lys 1010 1015 1020 Asp Lys Ala Arg Arg Arg Ser Ile Gly Asn Ile Lys Phe Ile Gly 1025 1030 1035 Glu Leu Phe Lys Leu Lys Met Leu Thr Glu Ala Ile Met His Asp 1040 1045 1050 Cys Val Val Lys Leu Leu Lys Asn His Asp Glu Glu Ser Leu Glu 1055 1060 1065 Cys Leu Cys Arg Leu Leu Thr Thr Ile Gly Lys Asp Leu Asp Phe 1070 1075 1080 Glu Lys Ala Lys Pro Arg Met Asp Gln Tyr Phe Asn Gln Met Glu 1085 1090 1095 Lys Ile Val Lys Glu Arg Lys Thr Ser Ser Arg Ile Arg Phe Met 1100 1105 1110 Leu Gln Asp Val Ile Asp Leu Arg Leu Cys Asn Trp Val Ser Arg 1115 1120 1125 Arg Ala Asp Gln Gly Pro Lys Thr Ile Glu Gln Ile His Lys Glu 1130 1135 1140 Ala Lys Ile Glu Glu Gln Glu Glu Gln Arg Lys Val Gln Gln Leu 1145 1150 1155 Met Thr Lys Glu Lys Arg Arg Pro Gly Val Gln Arg Val Asp Glu 1160 1165 1170 Gly Gly Trp Asn Thr Val Gln Gly Ala Lys Asn Ser Arg Val Leu 1175 1180 1185 Asp Pro Ser Lys Phe Leu Lys Ile Thr Lys Pro Thr Ile Asp Glu 1190 1195 1200 Lys Ile Gln Leu Val Pro Lys Ala Gln Leu Gly Ser Trp Gly Lys 1205 1210 1215 Gly Ser Ser Gly Gly Ala Lys Ala Ser Glu Thr Asp Ala Leu Arg 1220 1225 1230 Ser Ser Ala Ser Ser Leu Asn Arg Phe Ser Pro Leu Gln Pro Pro 1235 1240 1245 Ala Pro Ser Gly Ser Pro Ser Thr Thr Pro Leu Glu Phe Asp Ser 1250 1255 1260 Arg Arg Ala Leu Thr Ser Arg Gly Ser Met Gly Arg Glu Lys Ser 1265 1270 1275 Asp Lys Pro Leu Pro Thr Gly Ala Ala Arg Pro Asn Thr Phe Leu 1280 1285 1290 Arg Gly Ser Ser Lys Asp Leu Leu Asp Asn Gln Ser Gln Glu Glu 1295 1300 1305 Gln Arg Arg Glu Met Leu Glu Thr Val Lys Gln Leu Thr Gly Gly 1310 1315 1320 Val Asp Thr Glu Arg Ala Ser Ser Glu Ala Asp Arg Ser Lys Thr 1325 1330 1335 Arg Glu Leu Val Lys Ser Glu Met Cys Ala Val Ser Pro Pro Asp 1340 1345 1350 Lys Pro Ala Leu Ser Glu Glu Glu Val Glu Arg Lys Ser Lys Ser 1355 1360 1365 Ile Ile Asp Glu Phe Leu His Ile Asn Asp Phe Lys Glu Ala Thr 1370 1375 1380 Gln Cys Ile Glu Glu Leu Ser Ala Gln Gly Pro Leu His Val Phe 1385 1390 1395 Val Lys Val Gly Val Glu Phe Thr Leu Glu Arg Ser Gln Ile Thr 1400 1405 1410 Arg Asp His Met Gly His Leu Leu Tyr Gln Leu Val Gln Ser Glu 1415 1420 1425 Lys Leu Ser Lys Gln Asp Phe Phe Lys Gly Phe Ser Glu Thr Leu 1430 1435 1440 Glu Leu Ala Asp Asp Met Ala Ile Asp Ile Pro His Ile Trp Leu 1445 1450 1455 Tyr Leu Ala Glu Leu Val Thr Pro Met Leu Lys Glu Gly Gly Ile 1460 1465 1470 Ser Met Arg Glu Leu Ile Val Glu Phe Ser Lys Pro Leu Leu Pro 1475 1480 1485 Val Gly Arg Ala Gly Val Leu Leu Ser Glu Ile Leu Arg Leu Leu 1490 1495 1500 Cys Lys Gln Met Ser His Lys Lys Val Gly Ala Leu Trp Arg Glu 1505 1510 1515 Ala Asp Leu Ser Trp Lys Asp Phe Leu Pro Glu Gly Glu Asp Val 1520 1525 1530 His His Phe Leu Leu Glu Gln Lys Leu Asp Phe Ile Glu Thr Glu 1535 1540 1545 Ser Ser Cys Ser Ser Glu Ala Leu Ser Lys Arg Glu Leu Ser Ala 1550 1555 1560 Glu Glu Leu Ser Gln Arg Leu Glu Lys Leu Ile Met Glu Asp Lys 1565 1570 1575 Ala Asp Asp Glu Arg Ile Phe Asp Trp Val Glu Ala Asn Leu Asp 1580 1585 1590 Glu Ser Gln Met Ser Ser Pro Thr Phe Leu Arg Ala Leu Met Thr 1595 1600 1605 Ala Val Cys Lys Ala Ala Ile Ile Ala Asp Cys Pro Thr Phe Arg 1610 1615 1620 Val Asp Thr Ala Val Ile Lys Gln Arg Val Pro Ile Leu Leu Lys 1625 1630 1635 Tyr Leu Asp Ser Asp Thr Glu Lys Glu Leu Gln Ala Leu Tyr Ala 1640 1645 1650 Leu Gln Ala Ser Ile Val Lys Leu Asp Gln Pro Ala Asn Leu Leu 1655 1660 1665 Arg Met Phe Phe Asp Cys Leu Tyr Asp Glu Glu Val Ile Ser Glu 1670 1675 1680 Asp Ala Phe Tyr Lys Trp Glu Ser Ser Lys Asp Pro Ala Glu Gln 1685 1690 1695 Asn Gly Lys Gly Val Ala Leu Lys Ser Val Thr Ala Phe Phe Thr 1700 1705 1710 Trp Leu Arg Glu Ala Glu Glu Glu Ser Glu Asp Asn 1715 1720 1725 <210> 39 <211> 1017 <212> PRT <213> Kluyveromyces lactis <400> 39 Met Gly Glu Pro Thr Ser Glu Gln Gln Pro Ala Val Glu Ala Pro Val 1 5 10 15 Val Gln Glu Glu Thr Ile Ser Ser Pro Gln Lys Asn Ser Gly Tyr Val 20 25 30 Lys Asn Thr Ala Gly Ser Gly Ala Pro Arg Asn Gly Lys Tyr Asp Gly 35 40 45 Asn Arg Lys Asn Ser Arg Pro Tyr Asn Gln Arg Gly Asn Asn Asn Asn 50 55 60 Asn Asn Asn Gly Ser Ser Ser Asn Lys His Tyr Gln Lys Tyr Asn Gln 65 70 75 80 Pro Ala Tyr Gly Val Pro Ala Gly Tyr Ile Pro Asn Tyr Ala Val Ser 85 90 95 Ala Glu Tyr Asn Pro Leu Tyr Tyr Asn Gln Tyr Gln Gln Gln Gln Gln 100 105 110 Leu Tyr Ala Ala Ala Tyr Gln Thr Pro Met Ser Gly Gln Gly Tyr Val 115 120 125 Ala Pro Val Val Ser Pro Ala Ala Val Ser Ala Lys Pro Ala Lys Val 130 135 140 Glu Ile Thr Asn Lys Ser Gly Glu His Ile Asp Ile Ala Ser Ile Ala 145 150 155 160 His Pro His Thr His Ser His Ser Gln Ser His Ser Arg Ala Val Pro 165 170 175 Val Val Ser Pro Pro Ala Asn Ala Ala Val Thr Ala Ala Ala Ser Ser 180 185 190 Ser Val Ser Pro Ser Ala Ser Pro Ala Val Lys Val Gln Ser Pro Ala 195 200 205 Ala Asn Asp Lys Glu Gln Ser Pro Ala Lys Pro Glu Glu Pro Lys Lys 210 215 220 Asp Thr Leu Ile Val Asn Asp Phe Leu Glu Gln Val Lys Arg Arg Lys 225 230 235 240 Ala Ala Leu Ala Ala Lys Lys Ala Val Glu Glu Arg Gly Ser Glu Glu 245 250 255 Gln Lys Glu Pro Val Val Gly Ala Asp Thr Asp Ala Asn Val Asp Ala 260 265 270 Lys Thr Gly Ser Thr Ala Ala Asp Ser Thr Lys Ser Glu Glu Ala Gln 275 280 285 Ser Glu Ser Gln Glu Lys Thr Lys Glu Glu Ala Pro Ala Glu Pro Lys 290 295 300 Pro Leu Thr Leu Ala Glu Lys Leu Arg Leu Lys Arg Met Glu Ala Ala 305 310 315 320 Lys Gln Ala Ser Ala Lys Thr Glu Glu Leu Lys Thr Glu Glu Ser Lys 325 330 335 Pro Glu Glu Leu Lys Thr Glu Glu Pro Lys Ala Glu Glu Pro Lys Ala 340 345 350 Glu Glu Pro Lys Leu Glu Glu Pro Lys Pro Glu Glu Pro Lys Thr Glu 355 360 365 Glu Pro Lys Thr Glu Glu Pro Lys Thr Glu Glu Pro Lys Ser Glu Glu 370 375 380 Pro Lys Ser Glu Glu Pro Lys Ser Asp Glu Pro Lys Ser Asp Glu Pro 385 390 395 400 Lys Ala Glu Glu Pro Lys Thr Glu Glu Leu Lys Thr Glu Glu Pro Lys 405 410 415 Thr Glu Glu Leu Lys Thr Glu Glu Pro Lys Thr Glu Glu Thr Lys Pro 420 425 430 Glu Glu Pro Lys Thr Glu Glu Ser Ala Thr Glu Ala Asn Ala Lys Glu 435 440 445 Gly Glu Pro Ala Pro Ala Gly Ser Val Glu Thr Pro Ala Asp Val Glu 450 455 460 Thr Lys Pro Gln Glu Glu Thr Glu Val Glu Asp Asp Gly Lys Ile Thr 465 470 475 480 Met Thr Asp Phe Leu Gln Lys Leu Lys Glu Val Ser Pro Val Asp Asp 485 490 495 Ile Tyr Ser Phe Gln Tyr Pro Ser Asp Ile Thr Pro Pro Asn Asp Arg 500 505 510 Tyr Lys Lys Thr Ser Ile Lys Tyr Ala Tyr Gly Pro Asp Phe Leu Tyr 515 520 525 Gln Phe Lys Asp Lys Val Asp Val Lys Tyr Asp Pro Ala Trp Met Ala 530 535 540 Glu Met Thr Ser Lys Ile Val Ile Pro Pro Lys Lys Pro Gly Ser Ser 545 550 555 560 Gly Arg Gly Glu Asp Arg Phe Ser Lys Gly Lys Val Gly Ser Leu Arg 565 570 575 Ser Glu Gly Arg Ser Gly Ser Arg Ser Asn Ser Lys Lys Lys Ser Lys 580 585 590 Arg Asp Asp Arg Lys Ser Asn Arg Ser Tyr Thr Ser Arg Lys Asp Arg 595 600 605 Glu Arg Phe Arg Glu Glu Glu Val Glu Glu Pro Lys Val Glu Val Ala 610 615 620 Pro Leu Val Pro Ser Ala Asn Arg Trp Val Pro Lys Ser Lys Met Lys 625 630 635 640 Lys Thr Glu Val Lys Leu Ala Pro Asp Gly Thr Glu Leu Tyr Asp Ala 645 650 655 Glu Glu Ala Ser Arg Lys Met Lys Ser Leu Leu Asn Lys Leu Thr Leu 660 665 670 Glu Met Phe Glu Pro Ile Ser Asp Asp Ile Met Lys Ile Ala Asn Gln 675 680 685 Ser Lys Trp Glu Glu Lys Gly Glu Thr Leu Lys Ile Val Ile Gln Gln 690 695 700 Ile Phe Asn Lys Ala Cys Asp Glu Pro His Trp Ser Ser Met Tyr Ala 705 710 715 720 Gln Leu Cys Gly Lys Val Val Lys Asp Leu Asp Asp Ser Ile Lys Asp 725 730 735 Ser Glu Thr Pro Asp Lys Thr Gly Ser His Leu Val Leu His Tyr Leu 740 745 750 Val Gln Arg Cys Gln Thr Glu Phe Gln Thr Gly Trp Thr Asp Gln Leu 755 760 765 Pro Thr Asn Glu Asp Gly Thr Pro Leu Gln Pro Glu Met Met Ser Asp 770 775 780 Glu Tyr Tyr Lys Met Ala Ala Ala Lys Arg Arg Gly Leu Gly Leu Val 785 790 795 800 Arg Phe Ile Gly Phe Leu Tyr Arg Ser Asn Leu Leu Thr Ser Arg Met 805 810 815 Val Phe Phe Cys Phe Lys Arg Leu Met Lys Asp Ile Gln Asn Ser Pro 820 825 830 Thr Glu Asp Thr Leu Glu Ser Val Cys Glu Leu Leu Glu Thr Ile Gly 835 840 845 Glu Gln Phe Glu Gly Ala Arg Ile Gln Val Thr Ala Glu Ala Val Ile 850 855 860 Glu Gly Ser Ser Leu Leu Asp Thr Leu Phe Asp Gln Ile Lys Asn Val 865 870 875 880 Ile Glu Asn Gly Asp Ile Ser Ser Arg Ile Lys Phe Lys Leu Ile Asp 885 890 895 Ile Val Glu Leu Arg Glu Lys Arg Asn Trp Asn Ser Lys Asn Lys Asn 900 905 910 Asp Gly Pro Lys Thr Ile Ala Gln Ile His Glu Glu Glu Ala Leu Lys 915 920 925 Arg Ala Leu Glu Glu Arg Glu Arg Glu Arg Asp Arg His Gly Ser Arg 930 935 940 Gly Gly Ser Arg Arg Met Asn Ser Glu Arg Asn Ser Ser Arg Arg Asp 945 950 955 960 Phe Ser Ser His Ser His Ser His Asn Gln Asn Arg Asp Gly Phe Thr 965 970 975 Thr Thr Arg Ser Ser Ser Val Arg Tyr Ser Glu Pro Lys Lys Glu Glu 980 985 990 Gln Ala Pro Thr Pro Thr Lys Ser Ser Ala Gly Ala Ala Asn Met Phe 995 1000 1005 Asp Ala Leu Met Asp Ala Glu Asp Asp 1010 1015 <210> 40 <211> 1013 <212> PRT <213> Ogataea polymorpha <400> 40 Met Ser Asn Pro Asn Ser Val Pro Pro Thr Gly Asn Ala His His His 1 5 10 15 Tyr Asn Ser Asn Tyr His Lys Asn Arg Arg Asn Asn Gly Ser Tyr Ser 20 25 30 Asn Tyr Ser Gln Ser His Pro Gln Pro Pro Tyr Tyr Gln Gln Gln Gly 35 40 45 Trp Thr Gly Tyr Met Thr Gln Pro Tyr Gln Ala Ala Ala Pro Gly Tyr 50 55 60 Ala Tyr Ser Tyr Tyr Ala Pro Ser Pro Gln Gly Val Ser Gly Gly Ala 65 70 75 80 Tyr Tyr Ala Pro Pro Pro Pro Gly Ala Ile Ala Ile Ser Pro Thr Leu 85 90 95 Pro Asn Ser Ala Thr His Thr Pro Val Thr Lys Pro Val Asn Leu Ser 100 105 110 Ile Lys Asn Lys Asn Gly Glu Ala Val Gln Phe Asn Lys Gly His Ser 115 120 125 Lys Thr Ala Ser Leu Ser Ser Ser Ser Ser Ser Ser Thr Pro Val Leu 130 135 140 Ser Lys Val Asn Ala Ser Leu Pro Ala Val Pro Pro Ser Thr Ser Ser 145 150 155 160 Thr Ala Ser Val Pro Met Ser Pro Ser Lys Lys Asp Ser Ser Pro Ala 165 170 175 Lys Pro Ala Gln Pro Glu Val Lys Lys Ala Asn Glu Glu Phe Lys Ala 180 185 190 Lys Phe Leu Glu Gln Leu Arg Leu Lys Asn Ser Lys Ala Thr Ser Glu 195 200 205 Lys Lys Glu Glu Lys Ser Gln Pro Thr Lys Glu Val Glu Lys Glu Ser 210 215 220 Lys Pro Asp Ala Ser Ser Lys Lys Ser Glu Pro Pro Lys Glu Leu Pro 225 230 235 240 Gln Glu Ile Ser Lys Glu Ala Pro Lys Pro Ala Glu Lys Pro Glu Thr 245 250 255 Ser Lys Glu Glu Pro Lys Glu Pro Ala Glu Ser Ala Lys Pro Ala Lys 260 265 270 Pro Ala Val Pro Ser Ala Ser Ile Glu Gln Gln Lys Glu Glu Thr Lys 275 280 285 Glu Ile Glu Lys Thr Gln Pro Asn Ser Lys Gln Ala Glu Lys Pro Glu 290 295 300 Glu Leu Gln Ala Val Pro Glu Ser Pro Val Glu Ser Ile Gln Pro Lys 305 310 315 320 Pro Val Ala Ala Ser Ala Pro Ser Val Asp Glu Val Lys Glu Glu Ala 325 330 335 Gln Pro Thr Pro Val Lys Glu Glu Pro Ile Asn Ala Asp Ser Glu Gln 340 345 350 Thr Glu Gly Pro Lys Ser Ser Pro Val Ala Asp Ser Gln Glu Asp Thr 355 360 365 Lys Asp Glu Thr Ala Glu Pro Leu Glu Ala Ala Ser Pro Gly Ile Asp 370 375 380 Lys Thr Phe Asp Met Thr Arg Phe Phe Ala Gln Ile Ser Lys Ala Thr 385 390 395 400 Pro Ile Lys Asp Ile Tyr Ala Phe Pro Tyr Lys Glu Gly Gln Glu Lys 405 410 415 Pro Asp Leu Arg Leu Gln Asn Ser Pro Lys Asn Lys Tyr Ser Pro Pro 420 425 430 Phe Leu Leu Gln Phe Gln Pro Val Cys Gln Phe Pro Val Asp Asp Glu 435 440 445 Trp Asp Ala Lys Val Arg Ser Ile Ile Asp Leu Val Gly Ala Lys Lys 450 455 460 Glu Ser Arg Asp Arg Gly Phe Ser Arg Ser Gly Ser Gln Phe Gly Arg 465 470 475 480 Gly Gly Ala Gly Ser Ser Asn Ala Met Pro Arg Ser Ala Thr Leu Arg 485 490 495 Gly Glu Phe Gly Ser Arg Asn Gly Ser Arg Gly Gly Ser Lys Lys Lys 500 505 510 Met Gly Leu Gly Ser Arg Glu Lys Ser Gln Arg Gln Gly Ser Lys Lys 515 520 525 Pro Arg Arg Leu Asp Asp Glu Lys Asp Asn Lys Asp Glu Glu Thr Glu 530 535 540 Ala Pro Lys Gln Val Val Glu Val Lys Pro Leu Glu Lys Ser Ala Asn 545 550 555 560 Arg Trp Val Pro Arg Ser Gln Arg Asn Lys Glu Lys Glu Val Arg Tyr 565 570 575 Ala Pro Asp Gly Val Thr Val Ile Leu Glu Glu Asp Asp Val Glu Ala 580 585 590 Lys Val Lys Ser His Leu Asn Lys Leu Thr Leu Asp Asn Phe Asp Thr 595 600 605 Ile Ser Ala Glu Ile Ile Gln Ile Ala Asn Gln Ala Arg Trp Glu Asp 610 615 620 Asp Val Lys Thr Leu Lys Gln Val Ile Glu Leu Thr Phe Ala Lys Ala 625 630 635 640 Cys Asp Glu His Leu Trp Ser Ser Val Tyr Ala Lys Leu Cys Leu Thr 645 650 655 Leu Cys Thr Asp Ile Ser Glu Asp Val Glu Asp Lys Ser Gln Pro Arg 660 665 670 Pro Glu Gln Val Pro Lys Arg Val Tyr Ser Ser Gly Leu Val Arg Lys 675 680 685 Leu Leu Leu Ser Arg Cys Gln Ala Glu Tyr Glu Lys Gly Trp Ser Asp 690 695 700 Lys Leu Pro Thr Asn Glu Asp Gly Thr Pro Leu Glu Pro Glu Met Met 705 710 715 720 Ser Asp Glu Tyr Tyr Lys Leu Ala Ala Ala Lys Arg Arg Gly Leu Gly 725 730 735 Leu Val Arg Phe Ile Gly Glu Leu Tyr Tyr Leu Asn Leu Leu Ser Glu 740 745 750 Lys Ile Ile Ile Lys Cys Leu Val Asp Gln Leu Ser Asp Ser Asp Ser 755 760 765 Pro Ser Glu Asp Thr Leu Glu Thr Leu Thr Gln Leu Leu Thr Thr Thr 770 775 780 Gly Ala Lys Leu Asp Ser Ser Asn Arg Gly Pro Leu Asp Phe Ala Phe 785 790 795 800 Glu Lys Ile Asn His Ile Ile Asn Asn Cys Gln Leu Ser Ser Arg Ile 805 810 815 Lys Phe Lys Leu Met Asp Leu Cys Asp Leu Arg Ala Asn Arg Trp Ala 820 825 830 Asp Ala Lys Ile Asn Ala Gly Pro Lys Thr Ile Ala Glu Ile His Gln 835 840 845 Glu Ala Glu Ala Lys Arg Leu Gln Glu Glu Arg Asp Ala Ile Arg Arg 850 855 860 Arg Lys Ala Asp Pro Arg Ser Gly Ser Ser Arg Ser Asn Ser Ser Arg 865 870 875 880 Ser Asn Ser Lys Trp Gly Asn Ser Asn Gln Ile Ser Ser Asn Asp Ile 885 890 895 Ser Lys Val Gly Val Val Arg Asn Ser Ser Glu Arg Ser Leu Gly Pro 900 905 910 Phe Asn Lys Gln Lys Ser Lys Leu Ser Ser Ser Lys Leu Ser Gln Gln 915 920 925 Gln Phe Thr Thr Val Pro Ser Ala Gly Ser Ala Asn Ser Ser Gly Ala 930 935 940 Ser Ser Gly Gln Lys Arg Ala Gly Thr Pro Pro Asp Glu Pro Arg Glu 945 950 955 960 Ala Ser Arg Asn Ile Phe Ala Ala Leu Gly Asp His Glu Asp Glu Asp 965 970 975 Ser Asp Arg Glu Ala Glu His His Glu Pro Glu Pro Glu His Glu Gly 980 985 990 Ala Asp Ile Ser Ser Ala His His Glu Gly Val Ser Ala Val Ala Asp 995 1000 1005 Ser Glu Ser Gln Ala 1010 <210> 41 <211> 952 <212> PRT <213> Saccharomyces cerevisiae <400> 41 Met Thr Asp Glu Thr Ala His Pro Thr Gln Ser Ala Ser Lys Gln Glu 1 5 10 15 Ser Ala Ala Leu Lys Gln Thr Gly Asp Asp Gln Gln Glu Ser Gln Gln 20 25 30 Gln Arg Gly Tyr Thr Asn Tyr Asn Asn Gly Ser Asn Tyr Thr Gln Lys 35 40 45 Lys Pro Tyr Asn Ser Asn Arg Pro His Gln Gln Arg Gly Gly Lys Phe 50 55 60 Gly Pro Asn Arg Tyr Asn Asn Arg Gly Asn Tyr Asn Gly Gly Gly Ser 65 70 75 80 Phe Arg Gly Gly His Met Gly Ala Asn Ser Ser Asn Val Pro Trp Thr 85 90 95 Gly Tyr Tyr Asn Asn Tyr Pro Val Tyr Tyr Gln Pro Gln Gln Met Ala 100 105 110 Ala Ala Gly Ser Ala Pro Ala Asn Pro Ile Pro Val Glu Glu Lys Ser 115 120 125 Pro Val Pro Thr Lys Ile Glu Ile Thr Thr Lys Ser Gly Glu His Leu 130 135 140 Asp Leu Lys Glu Gln His Lys Ala Lys Leu Gln Ser Gln Glu Arg Ser 145 150 155 160 Thr Val Ser Pro Gln Pro Glu Ser Lys Leu Lys Glu Thr Ser Asp Ser 165 170 175 Thr Ser Thr Ser Thr Pro Thr Pro Thr Pro Ser Thr Asn Asp Ser Lys 180 185 190 Ala Ser Ser Glu Glu Asn Ile Ser Glu Ala Glu Lys Thr Arg Arg Asn 195 200 205 Phe Ile Glu Gln Val Lys Leu Arg Lys Ala Ala Leu Glu Lys Lys Arg 210 215 220 Lys Glu Gln Leu Glu Gly Ser Ser Gly Asn Asn Asn Ile Pro Met Lys 225 230 235 240 Thr Thr Pro Glu Asn Val Glu Glu Lys Gly Ser Asp Lys Pro Glu Val 245 250 255 Thr Glu Lys Thr Lys Pro Ala Glu Glu Lys Ser Ala Glu Pro Glu Val 260 265 270 Lys Gln Glu Thr Pro Ala Glu Glu Gly Glu Gln Gly Glu Lys Gly Gln 275 280 285 Ile Lys Glu Glu Ser Thr Pro Lys Val Leu Thr Phe Ala Glu Arg Leu 290 295 300 Lys Leu Lys Lys Gln Gln Lys Glu Arg Glu Glu Lys Thr Glu Gly Lys 305 310 315 320 Glu Asn Lys Glu Val Pro Val Gln Glu Glu Thr Lys Ser Ala Ile Glu 325 330 335 Ser Ala Pro Val Pro Pro Ser Glu Gln Val Lys Glu Glu Thr Glu Val 340 345 350 Ala Glu Thr Glu Gln Ser Asn Ile Asp Glu Ser Ala Thr Thr Pro Ala 355 360 365 Ile Pro Thr Lys Ser Asp Glu Ala Glu Ala Glu Val Glu Ala Glu Ala 370 375 380 Gly Asp Ala Gly Thr Lys Ile Gly Leu Glu Ala Glu Ile Glu Thr Thr 385 390 395 400 Thr Asp Glu Thr Asp Asp Gly Thr Asn Thr Val Ser His Ile Leu Asn 405 410 415 Val Leu Lys Asp Ala Thr Pro Ile Glu Asp Val Phe Ser Phe Asn Tyr 420 425 430 Pro Glu Gly Ile Glu Gly Pro Asp Ile Lys Tyr Lys Lys Glu His Val 435 440 445 Lys Tyr Thr Tyr Gly Pro Thr Phe Leu Leu Gln Phe Lys Asp Lys Leu 450 455 460 Asn Val Lys Ala Asp Ala Glu Trp Val Gln Ser Thr Ala Ser Lys Ile 465 470 475 480 Val Ile Pro Pro Gly Met Gly Arg Gly Asn Arg Ser Arg Asp Ser Gly 485 490 495 Arg Phe Gly Asn Asn Ser Ser Arg Gly His Asp Phe Arg Asn Thr Ser 500 505 510 Val Arg Asn Met Asp Asp Arg Ala Asn Ser Arg Thr Ser Ser Lys Arg 515 520 525 Arg Ser Lys Arg Met Asn Asp Asp Arg Arg Ser Asn Arg Ser Tyr Thr 530 535 540 Ser Arg Arg Asp Arg Glu Arg Gly Ser Tyr Arg Asn Glu Glu Lys Arg 545 550 555 560 Glu Asp Asp Lys Pro Lys Glu Glu Val Ala Pro Leu Val Pro Ser Ala 565 570 575 Asn Arg Trp Val Pro Lys Phe Lys Ser Lys Lys Thr Glu Lys Lys Leu 580 585 590 Ala Pro Asp Gly Lys Thr Glu Leu Leu Asp Lys Asp Glu Val Glu Arg 595 600 605 Lys Met Lys Ser Leu Leu Asn Lys Leu Thr Leu Glu Met Phe Asp Ala 610 615 620 Ile Ser Ser Glu Ile Leu Ala Ile Ala Asn Ile Ser Val Trp Glu Thr 625 630 635 640 Asn Gly Glu Thr Leu Lys Ala Val Ile Glu Gln Ile Phe Leu Lys Ala 645 650 655 Cys Asp Glu Pro His Trp Ser Ser Met Tyr Ala Gln Leu Cys Gly Lys 660 665 670 Val Val Lys Glu Leu Asn Pro Asp Ile Thr Asp Glu Thr Asn Glu Gly 675 680 685 Lys Thr Gly Pro Lys Leu Val Leu His Tyr Leu Val Ala Arg Cys His 690 695 700 Ala Glu Phe Asp Lys Gly Trp Thr Asp Lys Leu Pro Thr Asn Glu Asp 705 710 715 720 Gly Thr Pro Leu Glu Pro Glu Met Met Ser Glu Glu Tyr Tyr Ala Ala 725 730 735 Ala Ser Ala Lys Arg Arg Gly Leu Gly Leu Val Arg Phe Ile Gly Phe 740 745 750 Leu Tyr Arg Leu Asn Leu Leu Thr Gly Lys Met Met Phe Glu Cys Phe 755 760 765 Arg Arg Leu Met Lys Asp Leu Thr Asp Ser Pro Ser Glu Glu Thr Leu 770 775 780 Glu Ser Val Val Glu Leu Leu Asn Thr Val Gly Glu Gln Phe Glu Thr 785 790 795 800 Asp Ser Phe Arg Thr Gly Gln Ala Thr Leu Glu Gly Ser Gln Leu Leu 805 810 815 Asp Ser Leu Phe Gly Ile Leu Asp Asn Ile Ile Gln Thr Ala Lys Ile 820 825 830 Ser Ser Arg Ile Lys Phe Lys Leu Ile Asp Ile Lys Glu Leu Arg His 835 840 845 Asp Lys Asn Trp Asn Ser Asp Lys Lys Asp Asn Gly Pro Lys Thr Ile 850 855 860 Gln Gln Ile His Glu Glu Glu Glu Arg Gln Arg Gln Leu Lys Asn Asn 865 870 875 880 Ser Arg Ser Asn Ser Arg Arg Thr Asn Asn Ser Ser Asn Arg His Ser 885 890 895 Phe Arg Arg Asp Ala Pro Pro Ala Ser Lys Asp Ser Phe Ile Thr Thr 900 905 910 Arg Thr Tyr Ser Gln Arg Asn Ser Gln Arg Ala Pro Pro Pro Lys Glu 915 920 925 Glu Pro Ala Ala Pro Thr Ser Thr Ala Thr Asn Met Phe Ser Ala Leu 930 935 940 Met Gly Glu Ser Asp Asp Glu Glu 945 950 <210> 42 <211> 1403 <212> PRT <213> Schizosaccharomyces pombe <400> 42 Met Ser Ser Lys Pro Pro Ser Asn Thr Pro Lys Phe Ser Tyr Ala Arg 1 5 10 15 Ala Leu Ala Ser Ser Gln Ser Asn Lys Ser Asn Ser Thr Lys Ala Ser 20 25 30 Glu Asn Asn Thr Ala Thr Ala Glu Lys Gln Ala Val Lys Pro Ser Gly 35 40 45 Val Glu Pro Thr Asn Thr Ser Arg Ala Asn Ala Gln Lys Lys Thr Glu 50 55 60 Ser Thr Gly Lys Ile Thr Ser Glu Ala Asp Thr Glu Lys Tyr Asn Ser 65 70 75 80 Ser Lys Ser Pro Val Asn Lys Glu Gly Ser Val Glu Lys Lys Ser Ser 85 90 95 Glu Lys Ser Ser Thr Asn Asn Lys Pro Trp Arg Gly Asp Asn Thr Ser 100 105 110 Lys Pro Ser Ala Asn Ser Ser Ala Glu Arg Thr Ser Ser Gln His Gln 115 120 125 Lys Pro Glu Thr Ser Ser Gln Ile Gly Lys Asp Asn Ala Ala Pro Val 130 135 140 Glu Asn Val Asn Glu Lys Ser Thr Ser Gln Glu Thr Ala Pro Pro Val 145 150 155 160 Ser Thr Val Pro Ile Gln Phe Gly Ser Ile Thr Arg Asn Ala Ala Ile 165 170 175 Pro Ser Lys Pro Lys Val Ser Gly Asn Met Gln Asn Lys Ser Gly Val 180 185 190 Ser Ser Tyr Ser Ser Lys Ser Gln Ser Val Asn Ser Ser Val Thr Ser 195 200 205 Asn Pro Pro His Thr Glu Glu Pro Val Ala Ala Lys Pro Glu Ala Ser 210 215 220 Ser Thr Ala Thr Lys Gly Pro Arg Pro Thr Thr Ser Ala Ser Asn Thr 225 230 235 240 Asn Thr Ser Pro Ala Asn Gly Ala Pro Thr Asn Lys Pro Ser Thr Asp 245 250 255 Ile Asn Thr Thr Asp Pro Ala Thr Gln Thr Thr Gln Val Ser Ala Ser 260 265 270 Asn Ser Pro Ala Leu Ser Gly Ser Ser Thr Pro Ser Asn Thr Ser Ser 275 280 285 Arg Ser Asn Arg Gln Asn His Gly Asn Phe Ser Glu Lys Arg His Tyr 290 295 300 Asp Arg Tyr Gly Asn Ser His Pro Ser Tyr Asn Lys Tyr Ser His Tyr 305 310 315 320 Gln His Gly Phe Asn Tyr Asn Asn Ser Gly Asn Asn Arg Asn Glu Ser 325 330 335 Gly His Pro Arg Phe Arg Asn Ser Arg Arg Asn Tyr Asn Asn Gln Gly 340 345 350 Ala Tyr Pro Thr Tyr Met Ser Asn Gly Arg Ser Ala Asn Gln Ser Pro 355 360 365 Arg Asn Asn Pro Gln Asn Val Asn Asn Gly Ser Thr Pro Ile Gln Ile 370 375 380 Pro Val Ser Leu Gln Thr Pro Tyr Gly Gln Val Tyr Gly Gln Pro Gln 385 390 395 400 Tyr Ile Val Asp Pro Asn Met Val Gln Tyr Gly Pro Ile Leu Gln Pro 405 410 415 Gly Tyr Val Pro Gln Tyr Tyr Pro Val Tyr His Gln Thr Pro Tyr Thr 420 425 430 Gln Asn Phe Pro Asn Met Ser Arg Ser Gly Ser Gln Val Ser Asp Gln 435 440 445 Val Val Glu Ser Pro Asn Ser Ser Thr Leu Ser Pro Arg Asn Gly Phe 450 455 460 Ala Pro Ile Val Lys Gln Gln Lys Lys Ser Ser Ala Leu Lys Ile Val 465 470 475 480 Asn Pro Val Thr His Thr Glu Val Val Val Pro Gln Lys Asn Ala Ser 485 490 495 Ser Pro Asn Pro Ser Glu Thr Asn Ser Arg Ala Glu Thr Pro Thr Ala 500 505 510 Ala Pro Pro Gln Ile Ser Glu Glu Glu Ala Ser Gln Arg Lys Asp Ala 515 520 525 Ile Lys Leu Ala Ile Gln Gln Arg Ile Gln Glu Lys Ala Glu Ala Glu 530 535 540 Ala Lys Arg Lys Ala Glu Glu Lys Ala Arg Leu Glu Ala Glu Glu Asn 545 550 555 560 Ala Lys Arg Glu Ala Glu Glu Gln Ala Lys Arg Glu Ala Glu Glu Lys 565 570 575 Ala Lys Arg Glu Ala Glu Glu Lys Ala Lys Arg Glu Ala Glu Glu Lys 580 585 590 Ala Lys Arg Glu Ala Glu Glu Asn Ala Lys Arg Glu Ala Glu Glu Lys 595 600 605 Ala Lys Arg Glu Ala Glu Glu Lys Ala Lys Arg Glu Ala Glu Glu Lys 610 615 620 Ala Lys Arg Glu Ala Glu Glu Lys Ala Lys Arg Glu Ala Glu Glu Lys 625 630 635 640 Ala Lys Arg Glu Ala Glu Glu Lys Ala Lys Arg Glu Ala Glu Glu Lys 645 650 655 Ala Lys Arg Glu Ala Glu Glu Asn Ala Lys Arg Glu Ala Glu Glu Lys 660 665 670 Ala Lys Arg Glu Ala Glu Glu Asn Ala Lys Arg Glu Ala Glu Glu Lys 675 680 685 Val Lys Arg Glu Thr Glu Glu Asn Ala Lys Arg Lys Ala Glu Glu Glu 690 695 700 Gly Lys Arg Glu Ala Asp Lys Asn Pro Glu Ile Lys Ser Ser Ala Pro 705 710 715 720 Leu Ala Ser Ser Glu Ala Asn Val Asp Thr Ser Lys Gln Thr Asn Ala 725 730 735 Thr Glu Pro Glu Val Val Asp Lys Thr Lys Val Glu Lys Leu Lys Ala 740 745 750 Ser Glu Gly Lys Ser Thr Ser Ser Leu Ser Ser Pro Ser His Ser Thr 755 760 765 Ser Ser Lys Arg Asp Leu Leu Ser Gly Leu Glu Ser Leu Ser Leu Lys 770 775 780 Thr Asn Pro Lys Ser Glu Gln Cys Leu Glu Ser Leu Leu Asn Ser Gln 785 790 795 800 Phe Ile Thr Asp Phe Ser Ala Leu Val Tyr Pro Ser Thr Ile Lys Pro 805 810 815 Pro Ser Thr Glu Glu Ala Leu Lys Ala Gly Lys Tyr Glu Tyr Asp Val 820 825 830 Pro Phe Leu Leu Gln Phe Gln Ser Val Tyr Thr Asp Lys Pro Met Lys 835 840 845 Gly Trp Asp Glu Arg Met Lys Glu Thr Val Ala Ser Ala Phe Ser Asp 850 855 860 Lys Ser Ser Arg Gly Met Tyr Ser Ser Ser Arg Gln Ser Ser Arg Ser 865 870 875 880 Gly Ser Asn Thr His Ser His Ala Gly Pro Gly Phe Gly Gly Pro Ser 885 890 895 Glu Arg Lys Gly Ile Ser Arg Leu Gly Ile Asp Arg Gly Phe Ser Ser 900 905 910 Ser Gly Ala Gly Phe Gly Ser Gly Ser Asn Tyr Lys Ser Ala Pro Ser 915 920 925 Arg Gly Val Ser His His Gly His Gly Gly Met Ser Gly Ser His Arg 930 935 940 Gly Ser Gln Arg Gly Ser Arg Arg Gly Gly Gly Glu Arg Asp Lys Pro 945 950 955 960 Asp Pro Ser Ser Leu Thr Ile Pro Val Asp Gln Val Ala Pro Leu Gln 965 970 975 Leu Ser Ala Asn Arg Trp Gln Pro Lys Lys Leu Thr Glu Lys Pro Ala 980 985 990 Glu Thr Lys Gly Glu Asp Glu Glu Ala Leu Leu Pro Pro Glu Val Val 995 1000 1005 Gln Arg Lys Val Lys Gly Ser Leu Asn Lys Met Thr Leu Glu Lys 1010 1015 1020 Phe Asp Lys Ile Ser Asp Gln Ile Leu Glu Ile Ala Met Gln Ser 1025 1030 1035 Arg Lys Glu Asn Asp Gly Arg Thr Leu Lys Gln Val Ile Gln Leu 1040 1045 1050 Thr Phe Glu Lys Ala Thr Asp Glu Pro Asn Phe Ser Asn Met Tyr 1055 1060 1065 Ala Arg Phe Ala Arg Lys Met Met Asp Ser Ile Asp Asp Ser Ile 1070 1075 1080 Arg Asp Glu Gly Val Leu Asp Lys Asn Asn Gln Pro Val Arg Gly 1085 1090 1095 Gly Leu Leu Phe Arg Lys Tyr Leu Leu Ser Arg Cys Gln Glu Asp 1100 1105 1110 Phe Glu Arg Gly Trp Lys Ala Asn Leu Pro Ser Gly Lys Ala Gly 1115 1120 1125 Glu Ala Glu Ile Met Ser Asp Glu Tyr Tyr Val Ala Ala Ala Ile 1130 1135 1140 Lys Arg Arg Gly Leu Gly Leu Val Arg Phe Ile Gly Glu Leu Phe 1145 1150 1155 Lys Leu Ser Met Leu Ser Glu Lys Ile Met His Glu Cys Ile Lys 1160 1165 1170 Arg Leu Leu Gly Asn Val Thr Asp Pro Glu Glu Glu Glu Ile Glu 1175 1180 1185 Ser Leu Cys Arg Leu Leu Met Thr Val Gly Val Asn Ile Asp Ala 1190 1195 1200 Thr Glu Lys Gly His Ala Ala Met Asp Val Tyr Val Leu Arg Met 1205 1210 1215 Glu Thr Ile Thr Lys Ile Pro Asn Leu Pro Ser Arg Ile Lys Phe 1220 1225 1230 Met Leu Met Asp Val Met Asp Ser Arg Lys Asn Gly Trp Ala Val 1235 1240 1245 Lys Asn Glu Val Glu Lys Gly Pro Lys Thr Ile Ala Glu Ile His 1250 1255 1260 Glu Glu Ala Glu Arg Lys Lys Ala Leu Ala Glu Ser Gln Arg Pro 1265 1270 1275 Ser Ser Gly Arg Met His Gly Arg Asp Met Asn Arg Gly Asp Ser 1280 1285 1290 Arg Met Gly Gly Arg Gly Ser Asn Pro Pro Phe Ser Ser Ser Asp 1295 1300 1305 Trp Ser Asn Asn Lys Asp Gly Tyr Ala Arg Leu Gly Gln Gly Ile 1310 1315 1320 Arg Gly Leu Lys Ser Gly Thr Gln Gly Ser His Gly Pro Thr Ser 1325 1330 1335 Leu Ser Ser Met Leu Lys Gly Gly Ser Val Ser Arg Thr Pro Ser 1340 1345 1350 Arg Gln Asn Ser Ala Leu Arg Arg Glu Gln Ser Val Arg Ala Pro 1355 1360 1365 Pro Ser Asn Val Ala Val Thr Ser Ala Asn Ser Phe Glu Leu Leu 1370 1375 1380 Glu Glu His Asp His Asp Asn Asp Gly Gly Gln Lys Asp Ser Asn 1385 1390 1395 Ser Lys Thr Ser Ser 1400 <210> 43 <211> 1603 <212> PRT <213> Trichoderma reesei <400> 43 Met Thr Ser Pro Ala Asn Gln Gln Thr Pro Ile Pro Ala Thr Thr Thr 1 5 10 15 Asn Ala Pro Thr Ala Pro Ser Tyr Ala Ser Ala Ala Gly Ala Pro Lys 20 25 30 Lys Pro Ala Gln Ala Pro Val Val Ala Ser Gly Ser Asn Ala Pro Leu 35 40 45 Val Val Gly Ser Ser Ala Pro Thr Ala Ser Ala Gln Asn Ala Lys Ala 50 55 60 Ala Ser Ser Pro Ser Pro Val Asn Gly Lys Gln Pro Val Pro Pro Ala 65 70 75 80 Val Pro Thr Val Ala Arg Ser Ser Phe Asn Gly Ser Gly Pro Asp His 85 90 95 Phe Arg Lys Gly Ser Val Thr Met Ala Ala Asn Gly Pro Ser Gly Phe 100 105 110 Val Pro Asn Gly Gly Ser Ile Ala Gly Ala Lys Ser Gly Ile Gln Phe 115 120 125 Gly Tyr Asp Ser Pro Ala Met Gly His Ser Thr Pro His Val Gly His 130 135 140 Ser Ala Pro Ile Pro Val Pro Asp Ala Asn Asn His His Arg Val Pro 145 150 155 160 Ser Pro Ala His Ser Pro Ala Pro Ile Pro Gln Pro Ser Ala Ser Gly 165 170 175 Gly Arg Pro Pro Ser Ser Leu Gln Gln Pro Thr Asn Gln Met Thr Phe 180 185 190 Gly Ser Leu Gly Ser Asp Gly Asp Arg His Met Arg Gln Gly Ser Val 195 200 205 Pro Pro Asn Pro Asn Leu Ala Asn Gln Ser Gly Ala His Phe Arg Arg 210 215 220 Glu Ser Ser His Ser Val Gln Ser Asp Ser Ser Arg Gly Asn Phe Gly 225 230 235 240 Pro Gln Asn Asn Arg Asn Arg Asn Ser Phe Asn Pro His Ala Thr Gln 245 250 255 Phe Asn Asn Gln Met Gly Phe Pro Pro Gln Asn Gln Phe Arg Thr Pro 260 265 270 Gly Gln Asn Arg Gly Met Pro Pro Ser Phe Gln Pro Asn Pro Arg Gly 275 280 285 Tyr Pro Asn Ser Pro Gln Pro Ala Arg Ser Pro Ala Leu Ala Asn Leu 290 295 300 Val Pro Ser Leu Pro Gly Thr Pro Asn Met Pro Pro Ala Thr Met Gln 305 310 315 320 Pro Asn Met Ala Met Pro Asn Ala Pro Ala Tyr His Tyr Pro Pro Pro 325 330 335 Ile Pro Ala Ser His Gln Gln Gln Val Gln Tyr Pro Phe Pro Ala Val 340 345 350 Ala Ala Lys Met His Ser Lys Pro Ser Tyr Lys Lys Ser Lys Ser Arg 355 360 365 Arg Glu Tyr Asp Arg His Phe Ser Gln Gly Ser Pro Leu Asp Thr Ala 370 375 380 His Asp Ala Pro Thr Ser Ala Ala Trp Pro Gln Gln Gln Gln Gln Gln 385 390 395 400 Gln His His Gln Arg Arg Phe Gly Ser Gln Gly Gln Arg Ala Asp Thr 405 410 415 Gln Trp Arg Ala His Asp Lys Asn Asn Met Arg Pro Ile Ser Ser Gly 420 425 430 Ile Gln Lys Asp Gly Pro Ser Ser Pro Ser Leu Pro Leu Val Asp Ala 435 440 445 Pro Leu Ser His Pro Asn Ser Leu Asp Leu Ser Pro Glu Asn Gly Gly 450 455 460 Phe Glu Leu Trp Leu Thr Trp Lys Asn Gln Thr Tyr Gly Phe Pro Pro 465 470 475 480 Gln Gln Met Asn Gln Tyr Gly Gln Pro Met Thr Val Pro Tyr Tyr Gly 485 490 495 Gly Ala Met Pro Tyr Met Gly Pro Pro Gln Pro Gly Ala Gln Ala Tyr 500 505 510 Asn Gln Gln Phe Ala Pro Pro Thr Phe His Gln Gln Ser His Ser Met 515 520 525 Ser Arg Thr Pro Ser Gln Pro Glu Arg Pro Ala Ser Ala Ser Gln Pro 530 535 540 Ser Gln Pro Ala Ile Val Ser Ser Asn Pro Lys Ala Leu Asn Ala Gln 545 550 555 560 Ala Asn Pro Asn Ser Phe Val Lys Pro Arg Lys Ser Ala Ala Val Gln 565 570 575 Ile Lys Asn Leu Ala Gly Glu Val Val Asp Thr Ser Thr Phe Lys Gln 580 585 590 Pro Ala Ser Pro Val Pro Ala Gln Thr Arg Thr Pro Pro Val Ile Ala 595 600 605 Ala Ser Thr Pro Pro Gln Gln Lys Leu Asp Ala Pro Ser His Ala Arg 610 615 620 Thr Asp Ser Gln Ser Pro Ser Lys Thr Ala Lys Glu Ile Gln Glu Glu 625 630 635 640 Leu Lys Ala Lys Ile Gln Ala Glu Ile Arg Ala Ala Ser Glu Lys Ala 645 650 655 Ala Lys Gln Glu Ala Gly Ala Lys Ala Gly Ala Ala Glu Asp Ala Ser 660 665 670 Ala Lys Lys Ala Glu Ala Ala Glu Ala Lys Val Glu Glu Lys Thr Glu 675 680 685 Ala Lys Ala Glu Ala Gln Pro Glu Val Lys Ala Gln Pro Glu Ala Thr 690 695 700 Pro Asp Val Lys Pro Glu Glu Pro Lys Ala Glu Pro Ala Glu Thr Lys 705 710 715 720 Ala Glu Ala Lys Ala Glu Pro Gln Pro Glu Ala Ala Ala Lys Ala Glu 725 730 735 Ala Pro Ala Pro Glu Lys Ala Ala Glu Lys Pro Ala Glu Glu Pro Ala 740 745 750 Glu Lys Ala Thr Glu Lys Ala Ala Glu Lys Pro Ala Glu Thr Pro Ala 755 760 765 Glu Ala Pro Lys Ala Glu Glu Pro Pro Ala Lys Ser Glu Glu Pro Ala 770 775 780 Lys Ser Asp Glu Pro Glu Glu Asp Glu Leu Glu Arg Ile Ile Arg Glu 785 790 795 800 Met Glu Glu Ala Glu Ala Lys Arg Glu Ala Gln Glu Glu Glu His Arg 805 810 815 Lys Lys Arg Glu Ala Glu Lys Ala Ala Gln Lys Ala Ala Glu Glu Ala 820 825 830 Asn Gln Lys Lys Asn Ala Glu Glu Ala Asp Arg Lys Leu Arg Glu Gln 835 840 845 Glu Arg Glu Met Glu Arg Leu Glu Glu Glu Lys Glu Arg Arg Arg Glu 850 855 860 Ala Ala Glu Ser Ser Gly Lys Thr Leu Ser Val Ala Glu Ala Leu Ala 865 870 875 880 Gln Met Arg Ser Gly Asn Ala Pro Asp Lys Lys Asp Glu Pro Ala Ser 885 890 895 Val Glu Ala Val Ala Asp Lys Leu Ala Asp Phe Ser Ile Ala Gly Asp 900 905 910 Lys Ser Gly Asp Ala Ala Gly Gln Lys Glu Lys Arg Val Ala Lys Pro 915 920 925 Ala Ala Leu Asn Leu Ala Pro Ile Lys Thr Ser Ala Val Glu Pro Pro 930 935 940 Gln Pro Ser Ala Ala Leu Gln Ser Leu Lys Ser Ala Arg Phe Leu Gln 945 950 955 960 Val Met Asp Gln Asp Ile Tyr Pro Glu Gly Ile Lys Ser Pro Asn Pro 965 970 975 Ala Leu Asn Ala Ala Val Ala Lys Lys Gly Lys Thr Phe Lys Tyr Asp 980 985 990 Ala Ala Phe Leu Leu Gln Phe Gln Lys Val Phe Thr Glu Gln Pro Ser 995 1000 1005 Leu Gln Phe His Gln Gln Ile Lys Gln Leu Ile Gly Asp Gly Asp 1010 1015 1020 Gly Asn Arg Ser Ala Ser Arg Gly Gln Thr Pro Ser Ser Ala Arg 1025 1030 1035 Gln Gly Ser Arg Gly Gly Gly Gly Phe Pro Gly Gly Ser Phe Gly 1040 1045 1050 Val Pro Gly Gly Arg Thr Leu Pro Pro Gly Thr Thr Ser Ala Asp 1055 1060 1065 Arg Met Ala Ile Ala Ser Gly Ala Leu Pro Arg Pro Gln Val Asn 1070 1075 1080 Pro Met Ala Ser Phe Gln Arg Pro Gly Ala Ala Phe Pro Ala Ser 1085 1090 1095 Ser Ser Met Ser Arg Thr Ser Ser Gln Asn Met Arg Asn Asn Leu 1100 1105 1110 Pro Asn Ser Pro Arg Gln Ser Ser Arg Ser Thr Arg Gly Ser Arg 1115 1120 1125 Arg Asn Asp Met Ala Ala Lys Glu Ala Gln Ala Ala Lys Thr Met 1130 1135 1140 Pro Leu Thr Ala Gly Gln Glu Val Lys Pro Ile Thr Val Ser Ala 1145 1150 1155 Ser Gly Trp Lys Ala Ser Ser Leu Gly Lys Ala Pro Ser Ala Ala 1160 1165 1170 Thr Pro Gln Pro Gly Gln Leu Met Asp Pro Glu Met Val Gln Arg 1175 1180 1185 Lys Val Lys Ala Ala Leu Asn Lys Met Thr Pro Glu Asn Phe Glu 1190 1195 1200 Arg Ile Ser Glu Gln Ile Leu Ala Ile Ala Ser Gln Ser Lys Asp 1205 1210 1215 Glu Thr Asp Gly Arg Thr Leu Arg Gln Val Ile Gln Leu Thr Phe 1220 1225 1230 Glu Lys Ala Thr Asp Glu Ala His Trp Ala Ser Met Tyr Ala Lys 1235 1240 1245 Phe Cys Lys Arg Met Leu Glu Thr Met Ser Pro Asp Ile Arg Asp 1250 1255 1260 Glu Asn Ile Lys Asp Lys Asn Gly Asn Val Val Ser Gly Gly Asn 1265 1270 1275 Leu Phe Arg Lys Tyr Leu Leu Asn Arg Cys Gln Lys Glu Phe Glu 1280 1285 1290 Arg Gly Trp Thr Thr Asn Leu Pro Glu Ala Pro Lys Asp Thr Glu 1295 1300 1305 Glu Gly Glu Lys Lys Thr Gly Glu Ala Ala Met Leu Ser Asp Glu 1310 1315 1320 Tyr Tyr Ala Ala Ala Ala Ala Lys Arg Arg Gly Leu Gly Leu Val 1325 1330 1335 Gln Phe Ile Gly Glu Leu Phe Lys Leu Gly Met Leu Thr Glu Arg 1340 1345 1350 Ile Met His Glu Cys Val Thr Lys Leu Val Asp Tyr Lys Gly Met 1355 1360 1365 Pro Asp Glu Ala Glu Ile Glu Ser Leu Cys Lys Leu Leu Arg Thr 1370 1375 1380 Ile Gly Ala Asn Leu Asp Glu Thr Asp Lys Gly Arg Pro Leu Met 1385 1390 1395 Asp Ile Tyr Phe Gln Arg Ile Gln Gly Met Ala Asp Leu Pro Glu 1400 1405 1410 Leu Gln Ser Arg Met Arg Phe Met Leu Met Asp Val Ile Asp Leu 1415 1420 1425 Arg Lys Ala Arg Trp Val Ser Lys Glu Gly Asn Lys Gly Pro Lys 1430 1435 1440 Thr Leu Glu Glu Val Arg Ala Glu Ala Glu Ala Gln Ser Ala Ala 1445 1450 1455 Lys Ala Gln Glu Ala Ala Arg Thr Ser Gln Arg Gly Gly Pro Gly 1460 1465 1470 Gly Gly Arg Pro Pro Ala Gly Arg Gly Asp Ala Arg Gly Phe Ser 1475 1480 1485 Gly Ser Phe Asn Gln Pro Ser Asn Gln Val Gly Met Asp Asp Leu 1490 1495 1500 Arg Arg Leu Lys Gly Ser Ser Val Asn Arg Thr Ser Ser Ser Asn 1505 1510 1515 Val Thr Leu Gly Pro Thr Ser Met Leu Ser Ser Arg Ser Asn Ser 1520 1525 1530 Gly Arg Arg Phe Gly Pro Gly Gly Ala Leu Gly Arg Gly Gly Asp 1535 1540 1545 Asp Ser Asn Ser Ser Ser Arg Ala Gly Thr Pro Gly Pro Thr Ser 1550 1555 1560 Ser Asn Ala Phe Ser Leu Leu Ala Thr Met Asp Asp Gly His Pro 1565 1570 1575 Ala Ser Pro Pro Ser Ala Gly Pro Ser Pro Leu Met Ala Lys Ala 1580 1585 1590 Val Pro Ala Thr Asp Lys Lys Asp Asn Glu 1595 1600 <210> 44 <211> 904 <212> PRT <213> Yarrowia lipolytica <400> 44 Met Ser Tyr Thr Tyr Asn Asn Gly Ala Tyr Ser Pro Arg Asn Asn Gln 1 5 10 15 Pro Gly Thr Pro Asn Gln Gly Gln Gln His Met Ala Tyr Ser Pro Ala 20 25 30 Ala Met Tyr Asn Gly Gly Tyr Gly Tyr Val Asp Met Thr Gln Met Gln 35 40 45 Gly Gln Tyr Tyr Pro Pro Gln Glu Gly Met Ser Pro Gly Ala Gln Tyr 50 55 60 Ala Gln Pro Tyr Gly Ser Pro His His Thr His Ser Pro Leu Thr Ile 65 70 75 80 Met Asp Pro Val Thr His Arg Pro Ile Val Thr Pro Gly Ser Asn Thr 85 90 95 Gly Thr Pro Thr Gly Pro Asn Ala Thr Leu Ala Ser Pro Lys Pro Asn 100 105 110 Ser Pro Arg Val Ala His Arg Arg Thr Asp Ser Ser Asn Pro Ala Gly 115 120 125 Asp Ser Ile Lys Ala Asn Phe Met Ala Gln Val Leu Ala Ala Lys Ala 130 135 140 Lys Lys Glu Ala Ala Glu Lys Gly Thr Glu Lys Lys Glu Glu Val Lys 145 150 155 160 Glu Glu Lys Lys Glu Glu Pro Lys Pro Glu Thr Lys Pro Glu Glu Glu 165 170 175 Val Lys Lys Glu Glu Pro Lys Lys Glu Glu Pro Lys Glu Asp Gln Lys 180 185 190 Glu Glu Val Lys Glu Glu Leu Lys Glu Thr Pro Lys Glu Asp Ala Lys 195 200 205 Pro Val Glu Ala Glu Lys Pro Lys Glu Asp Val Lys Glu Glu Ala Lys 210 215 220 Pro Val Glu Ala Glu Lys Pro Ala Glu Thr Lys Leu Glu Glu Glu Ser 225 230 235 240 Ser Ala Pro Ala Gln Glu Glu Lys Val Glu Lys Lys Val Glu Ile Val 245 250 255 Glu Pro Pro Lys Glu Pro Ser Ala Glu Gly Glu Pro Thr Glu Asp Ala 260 265 270 Ser Glu Ser Thr Pro Asn Pro Val Glu Lys Ile Ala Glu Thr Met Arg 275 280 285 Leu Lys Lys Arg Phe Ala His Ser Trp Asn Asn Ala Thr Pro Leu Thr 290 295 300 Ala Glu Glu Ile Thr Thr Lys Val Thr Tyr Pro Glu Ser Val Thr Lys 305 310 315 320 Ser Leu Met Glu Val Ser Pro Ala Pro Thr Phe Arg Tyr Ser Leu Asp 325 330 335 Phe Leu Leu Gln Phe Gln Pro Leu Val Thr Glu Gln Pro Pro Ser Gly 340 345 350 Leu Glu Gly Ala Lys Ala Ile Thr Glu Asp Cys Lys Gly Ser Lys Ala 355 360 365 Pro Arg Ala Ser Ser Arg Gly Ser Gly Gly Gly Pro Asn Gln Gln Met 370 375 380 Gly Ser Phe Ser Asn Phe Gly Arg Gly Gly Pro Gly Gly Pro Ser Gly 385 390 395 400 Arg Gly Met Pro Arg Met Gly Ser Ser Ser Asn Met Arg Gly Asp His 405 410 415 Gly Gly His His Gln Ser His Arg Gly Gly Asp Arg Gly Asp Arg Glu 420 425 430 Gly Gly Gly Arg Ser Thr Arg Asn Asn Ser Ser Arg Asn Arg Arg Asn 435 440 445 Pro Ser Asn Arg Glu Arg Tyr Pro Pro Gln Gly Ala Asn Gln Glu Ile 450 455 460 Ile Glu Tyr Val Pro Pro Pro Pro Lys Ser Glu Asn Ser Trp Ala Ala 465 470 475 480 Lys Arg Leu Ala Ala Lys Lys Glu Thr Ser Thr Pro Pro Pro Ala Glu 485 490 495 Ser Glu Pro Ala Glu Glu Glu Thr Pro Arg Ile Pro Pro Asp Val Val 500 505 510 Gln Lys Lys Val Asn Ser Met Leu Asn Lys Met Thr Leu Glu Lys Phe 515 520 525 Asp Lys Ile Ser Asp Gln Ile Leu Glu Ile Ala Ser Gln Ser Lys His 530 535 540 Glu His Asp Gly Arg Thr Leu Arg Gln Val Leu Glu Leu Thr Phe Ala 545 550 555 560 Lys Ala Thr Asp Glu Ala His Trp Ala Ser Met Tyr Ala Arg Phe Cys 565 570 575 Lys Lys Thr Met Val Thr Val Asp Pro Asp Ile Tyr Asp Asp Asp Val 580 585 590 Lys Asp Lys Asn Gly Glu Tyr Val Arg Gly Gly Ala Leu Tyr Arg Lys 595 600 605 Tyr Leu Leu Asn Arg Cys Gln Asp Glu Phe Glu Lys Gly Trp Glu Asp 610 615 620 Lys Leu Pro Thr Asn Glu Asp Gly Ser Pro Met Asp Pro Asp Asn Ala 625 630 635 640 Thr Pro Glu Tyr Asp Lys Ala Val Val Ala Lys Arg Arg Gly Leu Gly 645 650 655 Leu Met Val Phe Ile Gly Glu Leu Phe Met Leu Asn Met Leu Ser Glu 660 665 670 Asn Ile Met Arg Ser Cys Leu Thr Arg Leu Ile Ser Pro Lys Asp Gly 675 680 685 Ala Ser Glu Glu Thr Ile Glu Ser Leu Cys Lys Leu Thr Ser Thr Val 690 695 700 Gly Leu Arg Met Asp Gln Ser Pro Asn Ser Lys Glu Phe Met Asp Met 705 710 715 720 Phe Phe Gln Arg Leu Thr Asp Thr Lys Asn Ser Gly Thr Leu Pro Ser 725 730 735 Arg Leu Lys Phe Lys Ile Leu Asp Leu Leu Glu Met Arg Ala Gly Gly 740 745 750 Trp Lys Gln Ser Asn Asp Gln Gly Pro Lys Thr Ile Ser Glu Ile Gln 755 760 765 Asp Glu Ala Ala Ala Ala Lys Glu Lys Gln Gln Gln Gln Gln Asp Arg 770 775 780 Asp Arg Ser His Arg Gly Gly Asn Arg Arg Ser Gly His Pro Met Gly 785 790 795 800 Gly Arg Ser Glu Ser Tyr Arg Gly Gly Asn Glu Arg Asp Arg Asn Thr 805 810 815 Asn Ser Leu Asn Thr Gly Asp Leu Lys Gln Phe Gly Lys Ile Arg Ser 820 825 830 Asp Ser Ser Asn Thr Phe Gly Pro Pro Ser Ser Met Met Gly Arg Gly 835 840 845 Gly Ser Asn Ala Ser Arg Asn Ser Ser Gln Thr Ser Leu Gln Gln Gln 850 855 860 Gly Arg Gln Asn Ser Ser Ser Pro Gly Ile Pro Leu Ser Lys Asp Ser 865 870 875 880 Ser Arg Ala Ser Ser Lys Arg Gly Asn Ile Phe Glu His Leu Met Gly 885 890 895 Asp Gly Glu Gly Glu Glu Glu Asn 900 <210> 45 <211> 626 <212> PRT <213> Komagataella phaffii <400> 45 Met Ser Val Asp Thr Lys Glu Val Gln Glu Ser Leu Asp Gln Leu Asn 1 5 10 15 Ile Ser Glu Ser Pro Ala Thr Ala Val Thr Glu Glu Thr Pro Ala Thr 20 25 30 Ser Thr Glu Ala Ala Glu Glu Ser Asn Glu Ser Ser Thr Gln Ala Ser 35 40 45 Glu Thr Leu Ala Ser Leu Tyr Val Gly Glu Leu Asp Pro Thr Val Thr 50 55 60 Glu Ser Asp Leu Tyr Glu Phe Phe Ser Pro Ile Gly Ser Val Asn Ser 65 70 75 80 Ile Arg Val Cys Arg Asp Ala Val Thr Lys Arg Ser Leu Gly Tyr Gly 85 90 95 Tyr Val Asn Phe His Ser Gln Ala Ala Gly Glu Arg Ala Leu Glu Glu 100 105 110 Leu Asn Tyr Ala Glu Ile Lys Gly Val Arg Cys Arg Leu Met Trp Ser 115 120 125 Gln Arg Asp Pro Ser Leu Arg Arg Ser Gly Ser Gly Asn Ile Phe Ile 130 135 140 Lys Asn Leu Asp Pro Ala Ile Glu Asn Lys Thr Leu His Asp Thr Phe 145 150 155 160 Ser Ser Phe Gly Lys Val Leu Ser Cys Lys Val Ala Thr Asp Glu Asn 165 170 175 Gly Asn Ser Lys Gly Phe Gly Phe Val His Tyr Glu Ser Asp Glu Ala 180 185 190 Ala Gln Ala Ala Ile Glu Asn Ile Asn Gly Met Leu Leu Asn Gly Arg 195 200 205 Glu Ile Tyr Val Gly Pro His Leu Ala Lys Lys Asp Arg Glu Ser Arg 210 215 220 Phe Gln Glu Met Ile Lys Asn Tyr Thr Asn Val Phe Val Lys Asn Phe 225 230 235 240 Asp Thr Glu Ser Thr Glu Asp Glu Leu Arg Glu Leu Phe Glu Ser Tyr 245 250 255 Gly Pro Ile Thr Ser Ile His Leu Gln Val Asp Ser Glu Gly His Asn 260 265 270 Lys Gly Phe Gly Phe Val Asn Phe Ala Glu His Asp Asp Ala Val Lys 275 280 285 Ala Val Glu Ala Leu Asn Asp Lys Glu Tyr Lys Gly Lys Pro Leu Tyr 290 295 300 Val Gly Arg Ala Gln Lys Lys Asn Glu Arg Val His Glu Leu Thr Lys 305 310 315 320 Lys Tyr Glu Ala Asp Arg Leu Glu Lys Leu Gln Lys Tyr Gln Ser Val 325 330 335 Asn Leu Phe Ile Lys Asn Leu Asp Glu Ser Ile Asp Asp Ala Arg Leu 340 345 350 Glu Glu Glu Phe Lys Pro Phe Gly Thr Ile Thr Ser Ala Lys Val Met 355 360 365 Leu Asp Glu Asn Gly Lys Ser Arg Gly Phe Gly Phe Val Cys Leu Ser 370 375 380 Thr Pro Glu Glu Ala Thr Lys Ala Ile Ser Glu Met Asn Gln Arg Met 385 390 395 400 Val Ala Asn Lys Pro Leu Tyr Val Ala Leu Ala Gln Pro Lys Ala Ile 405 410 415 Arg Arg Ser Gln Leu Ala Gln Gln Ile Gln Ala Arg Asn Gln Met Arg 420 425 430 Met Gln Gln Gln Ala Gly Pro Gly Ile Pro Asn Gln Phe Val Gln Pro 435 440 445 Ile Phe Tyr Gly Gln Gln Pro Gly Met Leu Pro Pro Gly Ala Arg Val 450 455 460 Pro Pro Met Gly Asn Gln Ile Pro Gln Phe Ala Gly Met Pro Arg Pro 465 470 475 480 Gly Pro Phe Pro Gln Gly Gln Phe Pro Arg Met Ala Pro Asn Gly Gln 485 490 495 Pro Met Pro Val Tyr Gly Gln Pro Val Phe Asn Gly Asn Gly Pro Gln 500 505 510 Gln Arg Gly Tyr Tyr Pro Asn Asn Arg Gln Asn Lys Asn Arg Asn Gln 515 520 525 Lys Glu Glu Gly Asn Ser Leu Ala Ala Ile Leu Pro Gln Leu Pro Leu 530 535 540 Glu Gln Gln Lys Arg Val Leu Gly Glu Glu Leu Tyr Pro Lys Val Val 545 550 555 560 Ala Thr Asn Lys Thr Gln Asp Pro Glu Ala Ala Gly Lys Ile Thr Gly 565 570 575 Met Ile Leu Asp Leu Asp Asn Gln Glu Ile Leu Gln Leu Leu Glu Asp 580 585 590 Glu Glu Leu Phe Asn Thr His Phe Asn Glu Ala Leu Gln Ala Tyr Glu 595 600 605 Glu Tyr Lys Ser Lys Thr Val Glu Gln Gln Gln Gln Ala Asp Ala Gln 610 615 620 Ala Asn 625 <210> 46 <211> 626 <212> PRT <213> Komagataella pastoris <400> 46 Met Ser Val Asp Thr Lys Glu Val Gln Glu Ser Leu Asp Gln Leu Asn 1 5 10 15 Ile Ser Glu Ser Pro Ala Thr Ala Val Thr Glu Glu Thr Pro Ala Thr 20 25 30 Ser Thr Glu Ala Ala Glu Glu Ser Asn Glu Ser Ser Thr Gln Ala Ser 35 40 45 Glu Thr Leu Ala Ser Leu Tyr Val Gly Glu Leu Asp Pro Thr Val Thr 50 55 60 Glu Ser Asp Leu Tyr Glu Phe Phe Ser Pro Ile Gly Ser Val Asn Ser 65 70 75 80 Ile Arg Val Cys Arg Asp Ala Val Thr Lys Arg Ser Leu Gly Tyr Gly 85 90 95 Tyr Val Asn Phe His Ser Gln Ala Ala Gly Glu Arg Ala Leu Glu Glu 100 105 110 Leu Asn Tyr Ala Glu Ile Lys Gly Val Arg Cys Arg Leu Met Trp Ser 115 120 125 Gln Arg Asp Pro Ser Leu Arg Arg Ser Gly Ser Gly Asn Ile Phe Ile 130 135 140 Lys Asn Leu Asp Pro Ala Ile Glu Asn Lys Thr Leu His Asp Thr Phe 145 150 155 160 Ser Ser Phe Gly Lys Val Leu Ser Cys Lys Val Ala Thr Asp Glu Asn 165 170 175 Gly Asn Ser Lys Gly Phe Gly Phe Val His Tyr Glu Ser Asp Glu Ala 180 185 190 Ala Gln Ala Ala Ile Glu Asn Ile Asn Gly Met Leu Leu Asn Gly Arg 195 200 205 Glu Ile Tyr Val Gly Pro His Leu Ala Lys Lys Asp Arg Glu Ser Arg 210 215 220 Phe Gln Glu Met Ile Lys Asn Tyr Thr Asn Val Phe Val Lys Asn Phe 225 230 235 240 Asp Thr Glu Ser Thr Glu Asp Glu Leu Arg Glu Leu Phe Glu Ser Tyr 245 250 255 Gly Pro Ile Thr Ser Ile His Leu Gln Val Asp Ser Glu Gly His Asn 260 265 270 Lys Gly Phe Gly Phe Val Asn Phe Ala Glu His Asp Asp Ala Val Lys 275 280 285 Ala Val Glu Ala Leu Asn Asp Lys Glu Phe Lys Gly Lys Pro Leu Tyr 290 295 300 Val Gly Arg Ala Gln Lys Lys Asn Glu Arg Val His Glu Leu Thr Lys 305 310 315 320 Lys Tyr Glu Ala Asp Arg Leu Glu Lys Leu Gln Lys Tyr Gln Ser Val 325 330 335 Asn Leu Phe Ile Lys Asn Leu Asp Glu Ser Ile Asp Asp Thr Arg Leu 340 345 350 Glu Glu Glu Phe Lys Pro Phe Gly Thr Ile Thr Ser Ala Lys Val Met 355 360 365 Leu Asp Glu Asn Gly Lys Ser Arg Gly Phe Gly Phe Val Cys Leu Ser 370 375 380 Thr Pro Glu Glu Ala Thr Lys Ala Ile Ser Glu Met Asn Gln Arg Met 385 390 395 400 Val Ala Asn Lys Pro Leu Tyr Val Ala Leu Ala Gln Pro Lys Ala Ile 405 410 415 Arg Arg Ser Gln Leu Ala Gln Gln Ile Gln Ala Arg Asn Gln Met Arg 420 425 430 Met Gln Gln Gln Ala Gly Pro Gly Ile Pro Asn Gln Phe Val Gln Pro 435 440 445 Ile Phe Tyr Gly Gln Gln Pro Gly Met Leu Pro Pro Gly Ala Arg Val 450 455 460 Pro Pro Met Gly Asn Gln Ile Pro Gln Phe Ala Gly Met Pro Arg Pro 465 470 475 480 Gly Pro Phe Pro Gln Gly Gln Phe Pro Arg Met Ala Pro Asn Gly Gln 485 490 495 Pro Met Pro Val Tyr Gly Gln Pro Val Phe Asn Gly Asn Gly Pro Gln 500 505 510 Gln Arg Gly Tyr Tyr Pro Asn Asn Arg Gln Asn Lys Asn Arg Asn Gln 515 520 525 Lys Glu Glu Gly Asn Ser Leu Ala Ala Ile Leu Pro Gln Leu Pro Ile 530 535 540 Glu Gln Gln Lys Arg Val Leu Gly Glu Glu Leu Tyr Pro Lys Val Val 545 550 555 560 Ala Thr Asn Lys Ala Gln Asp Pro Glu Ala Ala Gly Lys Ile Thr Gly 565 570 575 Met Ile Leu Asp Leu Asp Asn Gln Glu Ile Leu Gln Leu Leu Glu Asp 580 585 590 Glu Glu Leu Phe Asn Thr His Phe Asn Glu Ala Leu Gln Ala Tyr Glu 595 600 605 Glu Tyr Lys Ser Lys Thr Val Glu Gln Gln Gln Gln Ala Asp Ala Gln 610 615 620 Ala Asn 625 <210> 47 <211> 636 <212> PRT <213> Homo sapiens <400> 47 Met Asn Pro Ser Ala Pro Ser Tyr Pro Met Ala Ser Leu Tyr Val Gly 1 5 10 15 Asp Leu His Pro Asp Val Thr Glu Ala Met Leu Tyr Glu Lys Phe Ser 20 25 30 Pro Ala Gly Pro Ile Leu Ser Ile Arg Val Cys Arg Asp Met Ile Thr 35 40 45 Arg Arg Ser Leu Gly Tyr Ala Tyr Val Asn Phe Gln Gln Pro Ala Asp 50 55 60 Ala Glu Arg Ala Leu Asp Thr Met Asn Phe Asp Val Ile Lys Gly Lys 65 70 75 80 Pro Val Arg Ile Met Trp Ser Gln Arg Asp Pro Ser Leu Arg Lys Ser 85 90 95 Gly Val Gly Asn Ile Phe Ile Lys Asn Leu Asp Lys Ser Ile Asp Asn 100 105 110 Lys Ala Leu Tyr Asp Thr Phe Ser Ala Phe Gly Asn Ile Leu Ser Cys 115 120 125 Lys Val Val Cys Asp Glu Asn Gly Ser Lys Gly Tyr Gly Phe Val His 130 135 140 Phe Glu Thr Gln Glu Ala Ala Glu Arg Ala Ile Glu Lys Met Asn Gly 145 150 155 160 Met Leu Leu Asn Asp Arg Lys Val Phe Val Gly Arg Phe Lys Ser Arg 165 170 175 Lys Glu Arg Glu Ala Glu Leu Gly Ala Arg Ala Lys Glu Phe Thr Asn 180 185 190 Val Tyr Ile Lys Asn Phe Gly Glu Asp Met Asp Asp Glu Arg Leu Lys 195 200 205 Asp Leu Phe Gly Lys Phe Gly Pro Ala Leu Ser Val Lys Val Met Thr 210 215 220 Asp Glu Ser Gly Lys Ser Lys Gly Phe Gly Phe Val Ser Phe Glu Arg 225 230 235 240 His Glu Asp Ala Gln Lys Ala Val Asp Glu Met Asn Gly Lys Glu Leu 245 250 255 Asn Gly Lys Gln Ile Tyr Val Gly Arg Ala Gln Lys Lys Val Glu Arg 260 265 270 Gln Thr Glu Leu Lys Arg Lys Phe Glu Gln Met Lys Gln Asp Arg Ile 275 280 285 Thr Arg Tyr Gln Gly Val Asn Leu Tyr Val Lys Asn Leu Asp Asp Gly 290 295 300 Ile Asp Asp Glu Arg Leu Arg Lys Glu Phe Ser Pro Phe Gly Thr Ile 305 310 315 320 Thr Ser Ala Lys Val Met Met Glu Gly Gly Arg Ser Lys Gly Phe Gly 325 330 335 Phe Val Cys Phe Ser Ser Pro Glu Glu Ala Thr Lys Ala Val Thr Glu 340 345 350 Met Asn Gly Arg Ile Val Ala Thr Lys Pro Leu Tyr Val Ala Leu Ala 355 360 365 Gln Arg Lys Glu Glu Arg Gln Ala His Leu Thr Asn Gln Tyr Met Gln 370 375 380 Arg Met Ala Ser Val Arg Ala Val Pro Asn Pro Val Ile Asn Pro Tyr 385 390 395 400 Gln Pro Ala Pro Pro Ser Gly Tyr Phe Met Ala Ala Ile Pro Gln Thr 405 410 415 Gln Asn Arg Ala Ala Tyr Tyr Pro Pro Ser Gln Ile Ala Gln Leu Arg 420 425 430 Pro Ser Pro Arg Trp Thr Ala Gln Gly Ala Arg Pro His Pro Phe Gln 435 440 445 Asn Met Pro Gly Ala Ile Arg Pro Ala Ala Pro Arg Pro Pro Phe Ser 450 455 460 Thr Met Arg Pro Ala Ser Ser Gln Val Pro Arg Val Met Ser Thr Gln 465 470 475 480 Arg Val Ala Asn Thr Ser Thr Gln Thr Met Gly Pro Arg Pro Ala Ala 485 490 495 Ala Ala Ala Ala Ala Thr Pro Ala Val Arg Thr Val Pro Gln Tyr Lys 500 505 510 Tyr Ala Ala Gly Val Arg Asn Pro Gln Gln His Leu Asn Ala Gln Pro 515 520 525 Gln Val Thr Met Gln Gln Pro Ala Val His Val Gln Gly Gln Glu Pro 530 535 540 Leu Thr Ala Ser Met Leu Ala Ser Ala Pro Pro Gln Glu Gln Lys Gln 545 550 555 560 Met Leu Gly Glu Arg Leu Phe Pro Leu Ile Gln Ala Met His Pro Thr 565 570 575 Leu Ala Gly Lys Ile Thr Gly Met Leu Leu Glu Ile Asp Asn Ser Glu 580 585 590 Leu Leu His Met Leu Glu Ser Pro Glu Ser Leu Arg Ser Lys Val Asp 595 600 605 Glu Ala Val Ala Val Leu Gln Ala His Gln Ala Lys Glu Ala Ala Gln 610 615 620 Lys Ala Val Asn Ser Ala Thr Gly Val Pro Thr Val 625 630 635 <210> 48 <211> 764 <212> PRT <213> Aspergillus niger <400> 48 Met Ser Ala Asp Val Ser Thr Thr Pro Ala Ala Glu Asn Val Asn Gly 1 5 10 15 Ala Ala Glu Ala Ser Pro Ala Ala Ala Ala Pro Ser Ala Thr Thr Pro 20 25 30 Glu Val Thr Ala Val Glu Asn Ser Thr Pro Ala Pro Ala Ala Asn Gln 35 40 45 Pro His Ser Ala Ser Leu Tyr Val Gly Glu Leu Asp Pro Ser Val Thr 50 55 60 Glu Ala Met Leu Tyr Glu Leu Phe Ser Ser Ile Gly Gln Val Ala Ser 65 70 75 80 Ile Arg Val Cys Arg Asp Ala Val Thr Arg Arg Ser Leu Gly Tyr Ala 85 90 95 Tyr Val Asn Tyr Asn Asn Thr Ala Asp Gly Glu Arg Ala Leu Glu Asp 100 105 110 Leu Asn Tyr Thr Leu Ile Lys Gly Lys Pro Cys Arg Ile Met Trp Ser 115 120 125 Gln Arg Asp Pro Ala Leu Arg Lys Thr Gly Gln Gly Asn Val Phe Ile 130 135 140 Lys Asn Leu Asp Ser Ala Ile Asp Asn Lys Ala Leu His Asp Thr Phe 145 150 155 160 Ala Ala Phe Gly Asn Ile Leu Ser Cys Lys Val Ala Gln Asp Glu Phe 165 170 175 Gly Asn Ser Lys Gly Tyr Gly Phe Val His Tyr Glu Thr Ala Glu Ala 180 185 190 Ala Asn Asn Ala Ile Lys His Val Asn Gly Met Leu Leu Asn Asp Lys 195 200 205 Lys Val Phe Val Gly His His Ile Ser Lys Lys Asp Arg Gln Ser Lys 210 215 220 Phe Glu Glu Met Lys Ala Asn Phe Thr Asn Val Tyr Ile Lys Asn Leu 225 230 235 240 Asp Ser Glu Ile Asp Asp Asp Glu Phe Arg Lys Met Phe Glu Lys Phe 245 250 255 Gly Glu Ile Thr Ser Ala Thr Leu Ser Arg Asp Gln Glu Gly Lys Ser 260 265 270 Arg Gly Phe Gly Phe Val Asn Phe Ser Thr His Glu Ser Ala Gln Ala 275 280 285 Ala Val Glu Glu Met Asn Asp Lys Glu Ile Arg Ser Gln Lys Leu Tyr 290 295 300 Val Gly Arg Ala Gln Lys Lys His Glu Arg Glu Glu Glu Leu Arg Lys 305 310 315 320 Gln Tyr Glu Ala Ala Arg Leu Glu Lys Ala Ser Lys Tyr Gln Gly Val 325 330 335 Asn Leu Tyr Val Lys Asn Leu Thr Asp Asp Ile Asp Asp Glu Lys Leu 340 345 350 Arg Glu Leu Phe Gly Pro Tyr Gly Thr Ile Thr Ser Ala Lys Val Met 355 360 365 Arg Asp Thr Asn Val Glu Arg Glu Ser Ser Pro Glu Ser Ala Gly Lys 370 375 380 Glu Lys Glu Ala Asn Lys Glu Asn Asp Lys Glu Ala Thr Pro Glu Ala 385 390 395 400 Glu Lys Ala Glu Glu Lys Ala Glu Glu Lys Pro Ala Glu Ser Ser Glu 405 410 415 Glu Lys Asp Lys Glu Ala Lys Lys Ser Asp Lys Lys Pro Phe Gly Lys 420 425 430 Ser Lys Gly Phe Gly Phe Val Cys Phe Ser Ser Pro Asp Glu Ala Ser 435 440 445 Lys Ala Val Thr Glu Met Asn Gln Arg Met Val Asn Gly Lys Pro Leu 450 455 460 Tyr Val Ala Leu Ala Gln Arg Lys Asp Val Arg Arg Ser Gln Leu Glu 465 470 475 480 Ala Ser Ile Gln Ala Arg Asn Thr Ile Arg Gln Gln Gln Ala Ala Ala 485 490 495 Ala Ala Gly Met Pro Gln Pro Tyr Met Gln Pro Ala Val Phe Tyr Gly 500 505 510 Pro Gly Gln Gln Gly Phe Ile Pro Gly Gly Gln Arg Gly Met Ala Phe 515 520 525 Pro Pro Gln Pro Gly Met Val Met Gly Ile Pro Gly Gly Arg Pro Gly 530 535 540 Gln Tyr Pro Gly Pro Phe Pro Gly Gln Gln Gly Gly Arg Gly Met Gly 545 550 555 560 Pro Asn Gln Gln Ile Pro Pro Asn Phe Ala Gln Gly Ile Pro Met Gly 565 570 575 Met Gln Gly Pro Gly Ala Ile Pro Asn Gly Met Gly Tyr Pro Gln Met 580 585 590 Ala Gln Val Gln Phe Gly Arg Gly Ala Gly Gly Arg Gly Gln Val Pro 595 600 605 Gly Met Pro Met Gly Gln Gly Met Arg Gly Gly Pro Gly Tyr Gly Gln 610 615 620 Gly Arg Gly Gly Val Pro Val Gln Gln Gly Gln Ile Arg Pro Gly Gln 625 630 635 640 Gly Gly Arg Gly Gln Asn Ala Ala Ala Pro Ala Gly Pro Gln Glu Gly 645 650 655 Ala Ala Gly Gly Val Asn Ala Gln Thr Leu Gly Ala Ala Pro Pro Ala 660 665 670 Gln Gln Lys Gln Met Leu Gly Glu Ala Leu Tyr Pro Lys Ile Gln Ala 675 680 685 Gln Gln Pro Glu Leu Ala Gly Lys Ile Thr Gly Met Leu Leu Glu Met 690 695 700 Asp Asn Thr Glu Leu Leu Ser Leu Leu Glu Asp Glu Glu Ala Leu Arg 705 710 715 720 Ala Lys Val Asp Glu Ala Leu Ser Val Tyr Asp Glu Tyr Met Lys Asn 725 730 735 Lys Gly Thr Glu Ser Glu Ala Pro Ala Ala Glu Ala Ala Lys Pro Glu 740 745 750 Ala Glu Lys Glu Ala Ser Thr Glu Glu Asn Lys Ala 755 760 <210> 49 <211> 636 <212> PRT <213> Cricetulus griseus <400> 49 Met Asn Pro Ser Ala Pro Ser Tyr Pro Met Ala Ser Leu Tyr Val Gly 1 5 10 15 Asp Leu His Pro Asp Val Thr Glu Ala Met Leu Tyr Glu Lys Phe Ser 20 25 30 Pro Ala Gly Pro Ile Leu Ser Ile Arg Val Cys Arg Asp Met Ile Thr 35 40 45 Arg Arg Ser Leu Gly Tyr Ala Tyr Val Asn Phe Gln Gln Pro Ala Asp 50 55 60 Ala Glu Arg Ala Leu Asp Thr Met Asn Phe Asp Val Ile Lys Gly Lys 65 70 75 80 Pro Val Arg Ile Met Trp Ser Gln Arg Asp Pro Ser Leu Arg Lys Ser 85 90 95 Gly Val Gly Asn Ile Phe Ile Lys Asn Leu Asp Lys Ser Ile Asp Asn 100 105 110 Lys Ala Leu Tyr Asp Thr Phe Ser Ala Phe Gly Asn Ile Leu Ser Cys 115 120 125 Lys Val Val Cys Asp Glu Asn Gly Ser Lys Gly Tyr Gly Phe Val His 130 135 140 Phe Glu Thr Gln Glu Ala Ala Glu Arg Ala Ile Glu Lys Met Asn Gly 145 150 155 160 Met Leu Leu Asn Asp Arg Lys Val Phe Val Gly Arg Phe Lys Ser Arg 165 170 175 Lys Glu Arg Glu Ala Glu Leu Gly Ala Arg Ala Lys Glu Phe Thr Asn 180 185 190 Val Tyr Ile Lys Asn Phe Gly Glu Asp Met Asp Asp Glu Arg Leu Lys 195 200 205 Asp Leu Phe Gly Lys Phe Gly Pro Ala Leu Ser Val Lys Val Met Thr 210 215 220 Asp Glu Ser Gly Lys Ser Lys Gly Phe Gly Phe Val Ser Phe Glu Arg 225 230 235 240 His Glu Asp Ala Gln Lys Ala Val Asp Glu Met Asn Gly Lys Glu Leu 245 250 255 Asn Gly Lys Gln Ile Tyr Val Gly Arg Ala Gln Lys Lys Val Glu Arg 260 265 270 Gln Thr Glu Leu Lys Arg Lys Phe Glu Gln Met Lys Gln Asp Arg Ile 275 280 285 Thr Arg Tyr Gln Gly Val Asn Leu Tyr Val Lys Asn Leu Asp Asp Gly 290 295 300 Ile Asp Asp Glu Arg Leu Arg Lys Glu Phe Ser Pro Phe Gly Thr Ile 305 310 315 320 Thr Ser Ala Lys Val Met Met Glu Gly Gly Arg Ser Lys Gly Phe Gly 325 330 335 Phe Val Cys Phe Ser Ser Pro Glu Glu Ala Thr Lys Ala Val Thr Glu 340 345 350 Met Asn Gly Arg Ile Val Ala Thr Lys Pro Leu Tyr Val Ala Leu Ala 355 360 365 Gln Arg Lys Glu Glu Arg Gln Ala His Leu Thr Asn Gln Tyr Met Gln 370 375 380 Arg Met Ala Ser Val Arg Ala Val Pro Asn Pro Val Ile Asn Pro Tyr 385 390 395 400 Gln Pro Ala Pro Pro Ser Gly Tyr Phe Met Ala Ala Ile Pro Gln Thr 405 410 415 Gln Asn Arg Ala Ala Tyr Tyr Pro Pro Ser Gln Ile Ala Gln Leu Arg 420 425 430 Pro Ser Pro Arg Trp Thr Ala Gln Gly Ala Arg Pro His Pro Phe Gln 435 440 445 Asn Met Pro Gly Ala Ile Arg Pro Ala Ala Pro Arg Pro Pro Phe Ser 450 455 460 Thr Met Arg Pro Ala Ser Ser Gln Val Pro Arg Val Met Ser Thr Gln 465 470 475 480 Arg Val Ala Asn Thr Ser Thr Gln Thr Met Gly Pro Arg Pro Ala Ala 485 490 495 Ala Ala Ala Ala Ala Thr Pro Ala Val Arg Thr Val Pro Gln Tyr Lys 500 505 510 Tyr Ala Ala Gly Val Arg Asn Pro Gln Gln His Leu Asn Ala Gln Pro 515 520 525 Gln Val Thr Met Gln Gln Pro Ala Val His Val Gln Gly Gln Glu Pro 530 535 540 Leu Thr Ala Ser Met Leu Ala Ser Ala Pro Pro Gln Glu Gln Lys Gln 545 550 555 560 Met Leu Gly Glu Arg Leu Phe Pro Leu Ile Gln Ala Met His Pro Thr 565 570 575 Leu Ala Gly Lys Ile Thr Gly Met Leu Leu Glu Ile Asp Asn Ser Glu 580 585 590 Leu Leu His Met Leu Glu Ser Pro Glu Ser Leu Arg Ser Lys Val Asp 595 600 605 Glu Ala Val Ala Val Leu Gln Ala His Gln Ala Lys Glu Ala Ala Gln 610 615 620 Lys Ala Val Asn Ser Ala Ala Gly Val Pro Ser Val 625 630 635 <210> 50 <211> 592 <212> PRT <213> Kluyveromyces lactis <400> 50 Met Ser Asp Ile Thr Glu Lys Thr Ala Glu Gln Leu Glu Asn Leu Gln 1 5 10 15 Ile Asn Asp Asp Gln Gln Pro Ala Gln Ser Ala Ser Ala Pro Ser Thr 20 25 30 Ser Ala Ser Glu Ser Glu Ala Ser Ser Val Ser Lys Val Glu Asn Asn 35 40 45 Asn Ala Ser Leu Tyr Val Gly Glu Leu Asp Pro Asn Ile Thr Glu Ala 50 55 60 Leu Leu Tyr Asp Val Phe Ser Pro Leu Gly Pro Ile Ser Ser Ile Arg 65 70 75 80 Val Cys Arg Asp Ala Val Thr Lys Ala Ser Leu Gly Tyr Ala Tyr Val 85 90 95 Asn Tyr Thr Asp Tyr Glu Ala Gly Lys Lys Ala Ile Gln Glu Leu Asn 100 105 110 Tyr Ala Glu Ile Asn Gly Arg Pro Cys Arg Ile Met Trp Ser Glu Arg 115 120 125 Asp Pro Ala Ile Arg Lys Lys Gly Ser Gly Asn Ile Phe Ile Lys Asn 130 135 140 Leu His Pro Ala Ile Asp Asn Lys Ala Leu His Glu Thr Phe Ser Thr 145 150 155 160 Phe Gly Glu Val Leu Ser Cys Lys Val Ala Leu Asp Glu Asn Gly Asn 165 170 175 Ser Arg Gly Phe Gly Phe Val His Phe Lys Glu Glu Ser Asp Ala Lys 180 185 190 Asp Ala Ile Glu Ala Val Asn Gly Met Leu Met Asn Gly Leu Glu Val 195 200 205 Tyr Val Ala Met His Val Pro Lys Lys Asp Arg Ile Ser Lys Leu Glu 210 215 220 Glu Ala Lys Ala Asn Phe Thr Asn Ile Tyr Val Lys Asn Ile Asp Val 225 230 235 240 Glu Thr Thr Asp Glu Glu Phe Glu Gln Leu Phe Ser Gln Tyr Gly Glu 245 250 255 Ile Val Ser Ala Ala Leu Glu Lys Asp Ala Glu Gly Lys Pro Lys Gly 260 265 270 Phe Gly Phe Val Asn Phe Val Asp His Asn Ala Ala Ala Lys Ala Val 275 280 285 Glu Glu Leu Asn Gly Lys Glu Phe Lys Ser Gln Ala Leu Tyr Val Gly 290 295 300 Arg Ala Gln Lys Lys Tyr Glu Arg Ala Glu Glu Leu Lys Lys Gln Tyr 305 310 315 320 Glu Gln Tyr Arg Leu Glu Lys Leu Ala Lys Phe Gln Gly Val Asn Leu 325 330 335 Phe Ile Lys Asn Leu Asp Asp Ser Ile Asp Asp Glu Lys Leu Lys Glu 340 345 350 Glu Phe Ala Pro Tyr Gly Thr Ile Thr Ser Ala Arg Val Met Arg Asp 355 360 365 Gln Glu Gly Asn Ser Lys Gly Phe Gly Phe Val Cys Phe Ser Ser Pro 370 375 380 Glu Glu Ala Thr Lys Ala Met Thr Glu Lys Asn Gln Gln Ile Val Ala 385 390 395 400 Gly Lys Pro Leu Tyr Val Ala Ile Ala Gln Arg Lys Asp Val Arg Arg 405 410 415 Ser Gln Leu Ala Gln Gln Ile Gln Ala Arg Asn Gln Ile Arg Phe Gln 420 425 430 Gln Gln Gln Gln Gln Gln Ala Ala Ala Ala Ala Ala Gly Met Pro Gly 435 440 445 Gln Tyr Met Pro Gln Met Phe Tyr Gly Val Met Ala Pro Arg Gly Phe 450 455 460 Pro Gly Pro Asn Pro Gly Met Asn Gly Pro Met Gly Ala Gly Ile Pro 465 470 475 480 Lys Asn Gly Met Val Pro Pro Pro Gln Gln Phe Ala Gly Arg Pro Asn 485 490 495 Gly Pro Met Tyr Gln Gly Met Pro Pro Gln Asn Gln Phe Pro Arg His 500 505 510 Gln Gln Gln His Tyr Ile Gln Gln Gln Lys Gln Arg Gln Ala Leu Gly 515 520 525 Glu Gln Leu Tyr Lys Lys Val Ser Ala Lys Ile Asp Asp Glu Asn Ala 530 535 540 Ala Gly Lys Ile Thr Gly Met Ile Leu Asp Leu Pro Pro Gln Gln Val 545 550 555 560 Ile Gln Leu Leu Asp Asn Asp Glu Gln Phe Glu Gln Gln Phe Gln Glu 565 570 575 Ala Leu Ala Ala Tyr Glu Asn Phe Lys Lys Glu Gln Glu Ala Gln Ala 580 585 590 <210> 51 <211> 629 <212> PRT <213> Ogataea polymorpha <400> 51 Met Ser Ser Ala Glu Ile Asn Gln Ile Thr Glu Gln Ala Glu Lys Leu 1 5 10 15 Ser Val Ala Asp Pro Ala Ala Ala Glu Thr Pro Ala Thr Thr Ala Glu 20 25 30 Glu Ser Ser Thr Ala Glu Ser Thr Gln Asn Ser Glu Thr Leu Ala Ser 35 40 45 Leu Tyr Val Gly Glu Leu Asp Pro Ser Val Thr Glu Ser Asp Leu Phe 50 55 60 Glu Val Phe Ser Pro Ile Gly Gln Val Ser Thr Ile Arg Val Cys Arg 65 70 75 80 Asp Ala Val Ser Lys Gln Ser Leu Gly Tyr Ala Tyr Val Asn Phe Gln 85 90 95 Ser His Ala Asp Gly Glu Lys Ala Leu Glu Glu Leu Asn Tyr Thr Pro 100 105 110 Ile Lys Gly Lys Ala Cys Arg Ile Met Trp Ser Gln Arg Asp Pro Ser 115 120 125 Leu Arg Arg Asn Gly Ser Gly Asn Ile Phe Ile Lys Asn Leu His Pro 130 135 140 Ala Ile Asp Asn Lys Thr Leu His Asp Thr Phe Ser Ala Phe Gly Lys 145 150 155 160 Ile Leu Ser Cys Lys Ile Ala Thr Asp Glu Asn Gly Asn Ser Lys Gly 165 170 175 Phe Gly Phe Val His Tyr Glu Asp Ser Glu Ser Ala Lys Ala Ala Ile 180 185 190 Glu Asn Val Asn Gly Met Leu Leu Asn Asp His Glu Val Tyr Val Gly 195 200 205 Pro His Leu Ala Lys Lys Asp Arg Gln Ser Lys Met Arg Glu Leu Ile 210 215 220 Ala Asn Phe Thr Asn Val Tyr Val Lys Asn Ile Asn Leu Asn Trp Asp 225 230 235 240 Glu Asp Lys Leu Arg Glu Thr Phe Ser Pro Phe Gly Ala Ile Ser Ser 245 250 255 Ile Phe Leu Ser Lys Asp Glu Ser Gly Lys Ser Arg Gly Phe Gly Phe 260 265 270 Val Asn Phe Glu Lys His Glu Asp Ala Val Lys Ala Val Glu Glu Leu 275 280 285 Asn Asn Lys Glu Ile Asp Gly Gln Lys Leu Tyr Val Gly Arg Ala Gln 290 295 300 Lys Lys Ser Glu Arg Met Glu Ser Leu Lys His Gln Tyr Glu Ala Ala 305 310 315 320 Arg Gln Glu Gln Leu Asn Lys Tyr Gln Gly Tyr Asn Leu Phe Val Lys 325 330 335 Asn Leu Asp Asp Ser Ile Asp Asp Ala Lys Leu Glu Glu Glu Phe Lys 340 345 350 Pro Tyr Gly Thr Ile Thr Ser Ala Lys Val Met Leu Asp Asp Ala Gly 355 360 365 Lys Ser Lys Gly Phe Gly Phe Val Cys Tyr Ser Ser Pro Glu Glu Ala 370 375 380 Thr Lys Ala Ile Thr Glu Met His Gln Arg Met Val Ala Gly Lys Pro 385 390 395 400 Leu Tyr Val Ala Leu Ala Gln Arg Lys Glu Val Arg Arg Ser Gln Leu 405 410 415 Ser Gln Gln Ile Gln Ala Arg Asn Gln Met Arg Met Gln Gln Ala Ala 420 425 430 Ala Gln Gly Gly Met Gly Gln Phe Val Ala Pro Met Phe Tyr Gly Gln 435 440 445 Asn Pro Gly Phe Leu Pro Pro Gly Ala Arg Gly Ala Pro Phe Ala Ala 450 455 460 Pro Gly Gln Gln Met Met Met Gln Gln Gly Ile Pro Arg Pro Gly Gln 465 470 475 480 Gly Val Pro Val Ser Pro Gly Gln Phe Arg Val Gly Pro Asn Gly Gln 485 490 495 Pro Val Pro Met Tyr Met Gln Pro Val Phe Asn Glu Tyr Pro Gln Asn 500 505 510 Gly Arg Met Pro Gln Gln Arg Tyr Tyr Gln Gly Gly Arg Pro Gly Gln 515 520 525 Gln Pro Pro Gln Ala Gly Pro Arg Gly Lys Ser Glu Asp Gly Ala Val 530 535 540 Pro Ser Leu Ala Gln Val Leu Pro Gln Phe Pro Pro Glu Gln Gln Lys 545 550 555 560 Arg Met Leu Gly Glu Glu Leu Tyr Pro Leu Ile Val Ala Thr Gly Lys 565 570 575 Ala Gln Asp Pro Glu Ala Ala Gly Lys Ile Thr Gly Met Met Leu Glu 580 585 590 Met Asp Asn Gln Gln Ile Leu Ala Leu Leu Glu Asp Arg Asp Leu Phe 595 600 605 Asn Ser Gln Phe Glu Glu Ala Leu Ser Ala Tyr Glu Glu Tyr Lys Asn 610 615 620 Lys Glu Ala Ser Ala 625 <210> 52 <211> 581 <212> PRT <213> Saccharomyces cerevisiae <400> 52 Gly Pro Asp Ser Met Ala Asp Ile Thr Asp Lys Thr Ala Glu Gln Leu 1 5 10 15 Glu Asn Leu Asn Ile Gln Asp Asp Gln Lys Gln Ala Ala Thr Gly Ser 20 25 30 Glu Ser Gln Ser Val Glu Asn Ser Ser Ala Ser Leu Tyr Val Gly Asp 35 40 45 Leu Glu Pro Ser Val Ser Glu Ala His Leu Tyr Asp Ile Phe Ser Pro 50 55 60 Ile Gly Ser Val Ser Ser Ile Arg Val Cys Arg Asp Ala Ile Thr Lys 65 70 75 80 Thr Ser Leu Gly Tyr Ala Tyr Val Asn Phe Asn Asp His Glu Ala Gly 85 90 95 Arg Lys Ala Ile Glu Gln Leu Asn Tyr Thr Pro Ile Lys Gly Arg Leu 100 105 110 Cys Arg Ile Met Trp Ser Gln Arg Asp Pro Ser Leu Arg Lys Lys Gly 115 120 125 Ser Gly Asn Ile Phe Ile Lys Asn Leu His Pro Asp Ile Asp Asn Lys 130 135 140 Ala Leu Tyr Asp Thr Phe Ser Val Phe Gly Asp Ile Leu Ser Ser Lys 145 150 155 160 Ile Ala Thr Asp Glu Asn Gly Lys Ser Lys Gly Phe Gly Phe Val His 165 170 175 Phe Glu Glu Glu Gly Ala Ala Lys Glu Ala Ile Asp Ala Leu Asn Gly 180 185 190 Met Leu Leu Asn Gly Gln Glu Ile Tyr Val Ala Pro His Leu Ser Arg 195 200 205 Lys Glu Arg Asp Ser Gln Leu Glu Glu Thr Lys Ala His Tyr Thr Asn 210 215 220 Leu Tyr Val Lys Asn Ile Asn Ser Glu Thr Thr Asp Glu Gln Phe Gln 225 230 235 240 Glu Leu Phe Ala Lys Phe Gly Pro Ile Val Ser Ala Ser Leu Glu Lys 245 250 255 Asp Ala Asp Gly Lys Leu Lys Gly Phe Gly Phe Val Asn Tyr Glu Lys 260 265 270 His Glu Asp Ala Val Lys Ala Val Glu Ala Leu Asn Asp Ser Glu Leu 275 280 285 Asn Gly Glu Lys Leu Tyr Val Gly Arg Ala Gln Lys Lys Asn Glu Arg 290 295 300 Met His Val Leu Lys Lys Gln Tyr Glu Ala Tyr Arg Leu Glu Lys Met 305 310 315 320 Ala Lys Tyr Gln Gly Val Asn Leu Phe Val Lys Asn Leu Asp Asp Ser 325 330 335 Val Asp Asp Glu Lys Leu Glu Glu Glu Phe Ala Pro Tyr Gly Thr Ile 340 345 350 Thr Ser Ala Lys Val Met Arg Thr Glu Asn Gly Lys Ser Lys Gly Phe 355 360 365 Gly Phe Val Cys Phe Ser Thr Pro Glu Glu Ala Thr Lys Ala Ile Thr 370 375 380 Glu Lys Asn Gln Gln Ile Val Ala Gly Lys Pro Leu Tyr Val Ala Ile 385 390 395 400 Ala Gln Arg Lys Asp Val Arg Arg Ser Gln Leu Ala Gln Gln Ile Gln 405 410 415 Ala Arg Asn Gln Met Arg Tyr Gln Gln Ala Thr Ala Ala Ala Ala Ala 420 425 430 Ala Ala Ala Gly Met Pro Gly Gln Phe Met Pro Pro Met Phe Tyr Gly 435 440 445 Val Met Pro Pro Arg Gly Val Pro Phe Asn Gly Pro Asn Pro Gln Gln 450 455 460 Met Asn Pro Met Gly Gly Met Pro Lys Asn Gly Met Pro Pro Gln Phe 465 470 475 480 Arg Asn Gly Pro Val Tyr Gly Val Pro Pro Gln Gly Gly Phe Pro Arg 485 490 495 Asn Ala Asn Asp Asn Asn Gln Phe Tyr Gln Gln Lys Gln Arg Gln Ala 500 505 510 Leu Gly Glu Gln Leu Tyr Lys Lys Val Ser Ala Lys Thr Ser Asn Glu 515 520 525 Glu Ala Ala Gly Lys Ile Thr Gly Met Ile Leu Asp Leu Pro Pro Gln 530 535 540 Glu Val Phe Pro Leu Leu Glu Ser Asp Glu Leu Phe Glu Gln His Tyr 545 550 555 560 Lys Glu Ala Ser Ala Ala Tyr Glu Ser Phe Lys Lys Glu Gln Glu Gln 565 570 575 Gln Thr Glu Gln Ala 580 <210> 53 <211> 653 <212> PRT <213> Schizosaccharomyces pombe <400> 53 Met Pro Ser Thr Asp Leu Lys Lys Gln Ala Asp Ala Ala Val Glu Ser 1 5 10 15 Asp Val Asn Thr Asn Asn Glu Ala Val Glu Ser Ser Thr Lys Glu Glu 20 25 30 Ser Ser Asn Thr Pro Ser Thr Glu Thr Gln Pro Glu Lys Lys Ala Glu 35 40 45 Glu Pro Glu Ala Ala Ala Glu Pro Ser Glu Ser Thr Ser Thr Pro Thr 50 55 60 Asn Ala Ser Ser Val Ala Thr Pro Ser Gly Thr Ala Pro Thr Ser Ala 65 70 75 80 Ser Leu Tyr Val Gly Glu Leu Asp Pro Ser Val Thr Glu Ala Met Leu 85 90 95 Phe Glu Leu Phe Asn Ser Ile Gly Pro Val Ala Ser Ile Arg Val Cys 100 105 110 Arg Asp Ala Val Thr Arg Arg Ser Leu Gly Tyr Ala Tyr Val Asn Phe 115 120 125 His Asn Met Glu Asp Gly Glu Lys Ala Leu Asp Glu Leu Asn Tyr Thr 130 135 140 Leu Ile Lys Gly Arg Pro Cys Arg Ile Met Trp Ser Gln Arg Asp Pro 145 150 155 160 Ser Leu Arg Lys Met Gly Thr Gly Asn Val Phe Ile Lys Asn Leu Asp 165 170 175 Pro Ala Ile Asp Asn Lys Ala Leu His Asp Thr Phe Ser Ala Phe Gly 180 185 190 Lys Ile Leu Ser Cys Lys Val Ala Val Asp Glu Leu Gly Asn Ala Lys 195 200 205 Gly Tyr Gly Phe Val His Phe Asp Ser Val Glu Ser Ala Asn Ala Ala 210 215 220 Ile Glu His Val Asn Gly Met Leu Leu Asn Asp Lys Lys Val Tyr Val 225 230 235 240 Gly His His Val Ser Arg Arg Glu Arg Gln Ser Lys Val Glu Ala Leu 245 250 255 Lys Ala Asn Phe Thr Asn Val Tyr Ile Lys Asn Leu Asp Thr Glu Ile 260 265 270 Thr Glu Gln Glu Phe Ser Asp Leu Phe Gly Gln Phe Gly Glu Ile Thr 275 280 285 Ser Leu Ser Leu Val Lys Asp Gln Asn Asp Lys Pro Arg Gly Phe Gly 290 295 300 Phe Val Asn Tyr Ala Asn His Glu Cys Ala Gln Lys Ala Val Asp Glu 305 310 315 320 Leu Asn Asp Lys Glu Tyr Lys Gly Lys Lys Leu Tyr Val Gly Arg Ala 325 330 335 Gln Lys Lys His Glu Arg Glu Glu Glu Leu Arg Lys Arg Tyr Glu Gln 340 345 350 Met Lys Leu Glu Lys Met Asn Lys Tyr Gln Gly Val Asn Leu Phe Ile 355 360 365 Lys Asn Leu Gln Asp Glu Val Asp Asp Glu Arg Leu Lys Ala Glu Phe 370 375 380 Ser Ala Phe Gly Thr Ile Thr Ser Ala Lys Ile Met Thr Asp Glu Gln 385 390 395 400 Gly Lys Ser Lys Gly Phe Gly Phe Val Cys Tyr Thr Thr Pro Glu Glu 405 410 415 Ala Asn Lys Ala Val Thr Glu Met Asn Gln Arg Met Leu Ala Gly Lys 420 425 430 Pro Leu Tyr Val Ala Leu Ala Gln Arg Lys Glu Val Arg Arg Ser Gln 435 440 445 Leu Glu Ala Gln Ile Gln Ala Arg Asn Gln Phe Arg Leu Gln Gln Gln 450 455 460 Val Ala Ala Ala Ala Gly Ile Pro Ala Val Gln Tyr Gly Ala Thr Gly 465 470 475 480 Pro Leu Ile Tyr Gly Pro Gly Gly Tyr Pro Ile Pro Ala Ala Val Asn 485 490 495 Gly Arg Gly Met Pro Met Val Pro Gly His Asn Gly Pro Met Pro Met 500 505 510 Tyr Pro Gly Met Pro Thr Gln Phe Pro Ala Gly Gly Pro Ala Pro Gly 515 520 525 Tyr Pro Gly Met Asn Ala Arg Gly Pro Val Pro Ala Gln Gly Arg Pro 530 535 540 Met Met Met Pro Gly Ser Val Pro Ser Ala Gly Pro Ala Glu Ala Glu 545 550 555 560 Ala Val Pro Ala Val Pro Gly Met Pro Glu Arg Phe Thr Ala Ala Asp 565 570 575 Leu Ala Ala Val Pro Glu Glu Ser Arg Lys Gln Val Leu Gly Glu Leu 580 585 590 Leu Tyr Pro Lys Val Phe Val Arg Glu Glu Lys Leu Ser Gly Lys Ile 595 600 605 Thr Gly Met Leu Leu Glu Met Pro Asn Ser Glu Leu Leu Glu Leu Leu 610 615 620 Glu Asp Asp Ser Ala Leu Asn Glu Arg Val Asn Glu Ala Ile Gly Val 625 630 635 640 Leu Gln Glu Phe Val Asp Gln Glu Pro Gly Phe Thr Glu 645 650 <210> 54 <211> 745 <212> PRT <213> Trichoderma reesei <400> 54 Met Ala Ala Asn Thr Thr Ser Ala Ala Val Asp Gln Leu Ala Ser Asp 1 5 10 15 Leu Asn Asn Thr Ser Leu Asn Gly Ser Gly Asp Val Lys Ala Pro Ala 20 25 30 Ile Asp Thr Ser Val Ser Ala Gly Ala Glu Asp Ala Ser Ala Pro Thr 35 40 45 Pro Thr Ala Ala Pro His Pro Gln Asn Ser Ala Ser Leu Tyr Val Gly 50 55 60 Glu Leu Asp Pro Ser Val Thr Glu Ala Met Leu Phe Glu Leu Phe Ser 65 70 75 80 Gln Ile Gly Ala Val Ala Ser Ile Arg Val Cys Arg Asp Ala Val Thr 85 90 95 Arg Arg Ser Leu Gly Tyr Ala Tyr Val Asn Tyr Asn Ser Thr Pro Asp 100 105 110 Gly Glu Lys Ala Leu Glu Glu Leu Asn Tyr Thr Leu Ile Lys Gly Arg 115 120 125 Pro Cys Arg Ile Met Trp Ser Gln Arg Asp Pro Ala Leu Arg Lys Thr 130 135 140 Gly Gln Gly Asn Val Phe Ile Lys Asn Leu Asp Val Ala Ile Asp Asn 145 150 155 160 Lys Ala Leu His Asp Thr Phe Ala Ala Phe Gly Asn Ile Leu Ser Cys 165 170 175 Lys Val Ala Gln Asp Glu Asn Gly Asn Ser Lys Gly Tyr Gly Phe Val 180 185 190 His Tyr Glu Thr Asp Glu Ala Ala Ala Gln Ala Ile Lys His Val Asn 195 200 205 Gly Met Leu Leu Asn Glu Lys Lys Val Tyr Val Gly Tyr His Ile Pro 210 215 220 Lys Lys Asp Arg Gln Ser Lys Phe Glu Glu Met Lys Ala Asn Phe Thr 225 230 235 240 Asn Val Tyr Val Lys Asn Ile Ala Pro Asp Val Thr Asp Glu Asp Phe 245 250 255 Arg Gln Leu Phe Glu Lys Phe Gly Asp Val Thr Ser Ser Ser Leu Ala 260 265 270 Arg Asp Gln Glu Gly Lys Thr Arg Gly Phe Gly Phe Val Asn Phe Thr 275 280 285 Thr His Glu Ala Ala Phe Lys Ala Val Glu Glu Leu Asn Gly Lys Asp 290 295 300 Phe Arg Gly Gln Asp Leu Tyr Val Gly Arg Ala Gln Lys Lys His Glu 305 310 315 320 Arg Glu Glu Glu Leu Arg Lys Ser Tyr Glu Ala Ala Arg Leu Glu Lys 325 330 335 Ala Asn Lys Tyr Gln Gly Val Asn Leu Tyr Ile Lys Asn Leu Asp Asp 340 345 350 Asp Val Asp Asp Glu Lys Leu Arg Gln Met Phe Ala Glu Phe Gly Pro 355 360 365 Ile Thr Ser Ala Lys Val Met Arg Asp Val Pro Gln Glu Gly Glu Glu 370 375 380 Glu Ala Lys Asp Gln Glu Lys Asp Lys Glu Asn Gln Lys Glu Gly Glu 385 390 395 400 Lys Glu Gly Glu Ser Ala Glu Gly Ala Glu Lys Lys Thr Glu Lys Lys 405 410 415 Ser Asp Lys Lys Leu Gly Lys Ser Lys Gly Phe Gly Phe Val Cys Phe 420 425 430 Ser Asn Pro Asp Asp Ala Thr Lys Ala Val Ala Glu Met Asn Gln Arg 435 440 445 Met Ile Asn Asn Lys Pro Leu Tyr Val Ala Leu Ala Gln Arg Lys Asp 450 455 460 Val Arg Lys Ser Gln Leu Glu Ala Ser Ile Gln Ala Arg Asn Gln Leu 465 470 475 480 Arg Met Gln Gln Ala Ala Ala Ala Ala Gly Met Pro Gln Gln Tyr Met 485 490 495 Gln Pro Pro Val Phe Tyr Ala Pro Gly Gln Gln Pro Gly Phe Ile Pro 500 505 510 Gln Gly Gly Arg Gly Ile Pro Phe Pro Gln Pro Gly Met Pro Met Pro 515 520 525 Asn Val Gln Gly Gly Arg Pro Gly Gln Phe Pro Gly Tyr Pro Gln Gln 530 535 540 Gly Gly Arg Asn Met Pro Gln Gly Leu Pro Pro Asn Met Tyr Ser Ile 545 550 555 560 Pro Gly Gln Phe Pro Pro Gln Phe Gly Gln Pro Gly Thr Pro Gln Phe 565 570 575 Met Ala Ala Met Gln Gln Ala Gln Gln Ala Ala Ala Leu Ala Gly Gly 580 585 590 Arg Gly Gly Ala Pro Gln Gly Gly Arg Gly Ala Met Ala Gly Met Pro 595 600 605 Pro Asn Val Gln Gly Gly Met Pro Gly Tyr Pro Pro Asn Asn Arg Gln 610 615 620 Met Gly Arg Asn Asn Asn Gly Gly Asn Gly Asn Asn Ala Gly Arg Asn 625 630 635 640 Gly Asn Phe Pro Asn Gln Ala Pro Arg Asp Ser Asn Thr Ala Ser Met 645 650 655 Leu Gln Asn Gln Leu Ala Ala Ala Gln Pro Ala Gln Gln Lys Gln Ile 660 665 670 Leu Gly Glu Leu Ile Phe Pro Lys Ile Gln Ala Ile Asn Ser Glu Leu 675 680 685 Ala Gly Lys Ile Thr Gly Met Leu Leu Glu Met Asp Asn Ser Glu Leu 690 695 700 Val Asn Leu Ile Glu Asp Glu Ala Ala Leu Lys Ala Lys Val Asp Glu 705 710 715 720 Ala Leu Ala Val Tyr Asp Glu Tyr Val Lys Ser Gln Ala Thr Gly Ser 725 730 735 Glu Lys Lys Glu Glu Glu Thr Lys Ala 740 745 <210> 55 <211> 645 <212> PRT <213> Yarrowia lipolytica <400> 55 Met Ser Ala Asp Ala Ser Leu Val Ala Ala Glu Lys Ala Leu Glu Lys 1 5 10 15 Met Thr Leu Glu Asn Lys Ala Glu Ala Ser Pro Ala Thr Lys Glu Glu 20 25 30 Thr Thr Thr Glu Ala Ala Pro Ala Glu Gly Glu Ala Lys Thr Glu Ser 35 40 45 Ser Glu Glu Lys Gly Ser Lys Glu Asp Gln Gly Asp Asn Ala Ser Leu 50 55 60 Tyr Val Gly Glu Leu Asp Pro Ser Val Thr Glu Ala Met Leu Phe Glu 65 70 75 80 Ile Phe Asn Pro Ile Gly Pro Val Thr Ser Val Arg Val Cys Arg Asp 85 90 95 Ala Ile Thr Arg Arg Ser Leu Gly Tyr Ala Tyr Val Asn Phe His Asn 100 105 110 Gln Ala Asp Gly Ile Arg Ala Leu Glu Glu Leu Asn Tyr Ser Pro Ile 115 120 125 Lys Glu Arg Pro Cys Arg Ile Met Trp Ser Gln Arg Asp Pro Ala Leu 130 135 140 Arg Lys Thr Gly Ala Gly Asn Ile Tyr Ile Lys Asn Leu Asp Pro Ala 145 150 155 160 Ile Asp Asn Lys Ala Leu His Asp Thr Phe Ser Ala Phe Gly Gln Ile 165 170 175 Leu Ser Cys Lys Ile Ala Thr Asp Glu Phe Gly Asn Ser Arg Gly Phe 180 185 190 Gly Phe Val His Tyr Glu Ser Ala Glu Ser Ala Glu Ser Ala Ile Gln 195 200 205 His Val Asn Gly Met Leu Leu Asn Asp Lys Lys Val Phe Val Gly Pro 210 215 220 His Val Pro Lys Ser Asp Arg Met Gln Ser Phe Glu Glu Gln Lys Asn 225 230 235 240 Ser Phe Thr Asn Val Phe Ile Lys Asn Leu Gly Thr Glu Ile Thr Glu 245 250 255 Ala Glu Phe Glu Glu Leu Val Asn Lys Phe Gly Glu Thr Ser Ser Val 260 265 270 His Leu Ser Thr Asn Asp Glu Gly Lys Pro Thr Gly Phe Gly Phe Val 275 280 285 Asp Tyr Lys Glu His Asp Val Ala Val Lys Ala Ile Asp Gly Leu Ser 290 295 300 Glu Thr Glu Phe Lys Gly Asn Lys Leu Phe Ala Gly Arg Ala Lys Lys 305 310 315 320 Lys Tyr Glu Arg Ala Asp Glu Leu Arg Lys Gln Tyr Glu Ala Ser Arg 325 330 335 Leu Glu Lys Leu Asn Lys Tyr Gln Gly Val Asn Leu Tyr Ile Lys Asn 340 345 350 Leu Asp Asp Thr Ile Asp Asp Asp Lys Leu Arg Ala Glu Phe Ala Pro 355 360 365 His Gly Thr Ile Thr Ser Ala Lys Val Met Val Asp Glu Ala Gly Lys 370 375 380 Ser Lys Gly Phe Gly Phe Val Cys Tyr Ser Ser Pro Glu Glu Ala Thr 385 390 395 400 Lys Ala Val Thr Glu Met Asn His Arg Leu Val Ala Gly Lys Pro Leu 405 410 415 Tyr Val Val Leu Ala Gln Arg Lys Asp Val Arg Arg Ser Gln Leu Gln 420 425 430 Gln Gln Ile Gln Ala Lys Asn Gln Met Arg Leu Gln Gln Gln Ala Ala 435 440 445 Ala Gly Gly Leu Pro Gly Gln Tyr Met Gly Asn Pro Gly Val Phe Tyr 450 455 460 Pro Gly Gln Pro Gly Phe Met Pro Pro Gly Arg Gly Gly Met Pro Phe 465 470 475 480 Gly Ala Asn Pro Gln Met Met Met Arg Pro Pro Met Pro Pro Gln Asn 485 490 495 Gln Phe Pro Pro Arg Gly Val Pro Gly Gly Pro Asn Met Tyr Gly Ala 500 505 510 Pro Pro Gln Gly Tyr Gln Gln Gly Gly Phe Pro Pro Gln Gly Pro Met 515 520 525 Arg Gly Gly Gln Pro Pro Arg Ser Gly Gln Pro Gly Pro Gln Gly Gln 530 535 540 Phe Arg Gly Ala Pro Arg Arg Lys Asp Gly Glu Ser Arg Val Ala Asp 545 550 555 560 Ser Ile Ser Asn Ala Leu Glu Asn Ala Pro Glu Glu Gln His Lys Gln 565 570 575 Leu Val Gly Glu Ala Leu Tyr Pro Lys Val Leu Ala Glu Lys Ala Ile 580 585 590 Asp Gly Asn Ala Glu Phe Ala Gly Lys Ile Thr Gly Met Leu Leu Glu 595 600 605 Met Pro Ile Lys Glu Ile Leu Glu Val Ile Asp Asp Glu Glu Gly Leu 610 615 620 Gln Ala Gln Ile Asn Asp Ala Ile Thr Ala Tyr Asn Glu Tyr Leu Asn 625 630 635 640 Ser Gln Lys Glu Glu 645 <210> 56 <211> 606 <212> PRT <213> Komagataella phaffii <400> 56 Met Ser Glu Lys Asn Thr Arg Ile Ala Ile Val Ser Asp Asp Arg Cys 1 5 10 15 Lys Pro Lys Lys Cys Arg Gln Glu Cys Arg Lys Ser Cys Pro Val Val 20 25 30 Lys Thr Gly Lys Leu Cys Ile Glu Val Glu Ala Tyr Ser Lys Ile Ala 35 40 45 Phe Ile Ser Glu Thr Leu Cys Ile Gly Cys Gly Ile Cys Val Lys Lys 50 55 60 Cys Pro Phe Gly Ala Ile Asn Ile Ile Asn Leu Pro Thr Asn Leu Glu 65 70 75 80 Lys Glu Val Thr His Arg Tyr Ser Ala Asn Ser Phe Lys Leu His Arg 85 90 95 Leu Pro Thr Pro Arg Pro Gly Gln Val Leu Gly Leu Val Gly Thr Asn 100 105 110 Gly Ile Gly Lys Ser Thr Ala Leu Lys Ile Leu Ala Gly Lys Gln Lys 115 120 125 Pro Asn Leu Gly Arg Tyr Asp Ala Pro Pro Asp Trp Glu Glu Ile Leu 130 135 140 Lys Tyr Phe Arg Gly Ser Glu Leu Gln Asn Tyr Phe Thr Lys Val Leu 145 150 155 160 Glu Asp Asn Ile Lys Ala Ile Ile Lys Pro Gln Tyr Val Asp Asn Leu 165 170 175 Pro Arg Ala Ile Lys Gly Pro Val Asn Lys Val Gly Glu Leu Leu Lys 180 185 190 Ala Lys Leu Glu Arg Lys Glu Glu Gly Lys His Ile Ile Gln Val Leu 195 200 205 Glu Leu Lys His Val Leu Asn Arg Glu Val Ala Lys Leu Ser Gly Gly 210 215 220 Glu Leu Gln Arg Phe Ala Ile Gly Met Thr Cys Val Gln Asp Ala Asn 225 230 235 240 Val Tyr Met Phe Asp Glu Pro Ser Ser Tyr Leu Asp Val Lys Gln Arg 245 250 255 Leu Asn Ala Ala Gln Ile Ile Arg Ser Leu Leu His Ala Thr Cys Tyr 260 265 270 Val Ile Val Val Glu His Asp Leu Ser Val Leu Asp Tyr Leu Ser Asp 275 280 285 Phe Val Cys Ile Leu Tyr Gly Val Pro Ser Val Tyr Gly Val Val Thr 290 295 300 Leu Pro Ala Ser Val Arg Glu Gly Ile Asn Ile Phe Leu Asp Gly His 305 310 315 320 Ile Pro Thr Glu Asn Leu Arg Phe Arg Thr Glu Ser Leu Lys Phe Lys 325 330 335 Leu Thr Asp Ala Ser Asp Ser Val Leu Ile Glu Gln Ser Arg Ala Phe 340 345 350 Glu Tyr Pro Lys Met Val Lys Thr Gln Gly Asp Phe Lys Leu Thr Val 355 360 365 Asn Ala Gly Asp Phe Ser Asp Ser Glu Ile Ile Val Met Met Gly Glu 370 375 380 Asn Gly Thr Gly Lys Thr Thr Leu Cys Lys Leu Leu Ala Gly Ala Ile 385 390 395 400 Glu Gly Asp Glu Gly Thr Lys Val Pro Lys Leu Asn Val Ser Met Lys 405 410 415 Pro Gln Lys Ile Ala Pro Lys Phe Thr Gly Thr Val Arg Gln Leu Phe 420 425 430 Leu Lys Lys Ile Arg Ser Ser Phe Leu His Pro Gln Phe Asn Thr Asp 435 440 445 Val Met Lys Pro Leu Lys Val Asp Asp Val Ile Asp Gln Glu Val Gln 450 455 460 His Leu Ser Gly Gly Glu Leu Gln Arg Val Ala Ile Val Leu Ala Leu 465 470 475 480 Gly Lys Glu Ala Asp Ile Tyr Leu Ile Asp Glu Pro Ser Ala Tyr Leu 485 490 495 Asp Ser Glu Gln Arg Ile Ile Cys Ser Lys Val Ile Arg Arg Phe Ile 500 505 510 Leu His Ser Lys Lys Thr Ala Phe Ile Val Glu His Asp Phe Ile Met 515 520 525 Ala Thr Tyr Leu Ala Asp Lys Val Met Val Phe Glu Gly Gln Pro Ser 530 535 540 Lys Asn Ala Val Ala Asn Arg Pro Glu Thr Leu Leu Thr Gly Cys Asn 545 550 555 560 Arg Phe Leu Lys Asn Leu Asn Val Thr Phe Arg Arg Asp Pro Asn Ser 565 570 575 Phe Arg Pro Arg Ile Asn Lys Leu Asp Ser Gln Met Asp Arg Glu Gln 580 585 590 Lys Leu Ser Gly Asn Tyr Phe Phe Leu Glu Asn Thr Glu Leu 595 600 605 <210> 57 <211> 606 <212> PRT <213> Komagataella pastoris <400> 57 Met Ser Glu Lys Asn Thr Arg Ile Ala Ile Val Ser Asp Asp Arg Cys 1 5 10 15 Lys Pro Lys Lys Cys Arg Gln Glu Cys Arg Lys Ser Cys Pro Val Val 20 25 30 Lys Thr Gly Lys Leu Cys Ile Glu Val Glu Ala Tyr Ser Lys Ile Ala 35 40 45 Phe Ile Ser Glu Thr Leu Cys Ile Gly Cys Gly Ile Cys Val Lys Lys 50 55 60 Cys Pro Phe Gly Ala Ile Asn Ile Ile Asn Leu Pro Thr Asn Leu Glu 65 70 75 80 Lys Glu Val Thr His Arg Tyr Ser Ala Asn Ser Phe Lys Leu His Arg 85 90 95 Leu Pro Thr Pro Arg Pro Gly Gln Val Leu Gly Leu Val Gly Thr Asn 100 105 110 Gly Ile Gly Lys Ser Thr Ala Leu Lys Ile Leu Ala Gly Lys Gln Lys 115 120 125 Pro Asn Leu Gly Arg Tyr Asp Ala Pro Pro Asp Trp Glu Glu Ile Leu 130 135 140 Lys Tyr Phe Arg Gly Ser Glu Leu Gln Asn Tyr Phe Thr Lys Val Leu 145 150 155 160 Glu Asp Asn Ile Lys Ala Ile Ile Lys Pro Gln Tyr Val Asp Asn Leu 165 170 175 Pro Arg Ala Ile Lys Gly Pro Val Asn Lys Val Gly Glu Leu Leu Lys 180 185 190 Ala Lys Leu Glu Arg Lys Glu Glu Gly Lys His Ile Ile Gln Val Leu 195 200 205 Glu Leu Lys His Val Leu Asn Arg Glu Val Ala Lys Leu Ser Gly Gly 210 215 220 Glu Leu Gln Arg Phe Ala Ile Gly Met Thr Cys Val Gln Asp Ala Asn 225 230 235 240 Val Tyr Met Phe Asp Glu Pro Ser Ser Tyr Leu Asp Val Lys Gln Arg 245 250 255 Leu Asn Ala Ala Gln Ile Ile Arg Ser Leu Leu His Ala Thr Cys Tyr 260 265 270 Val Ile Val Val Glu His Asp Leu Ser Val Leu Asp Tyr Leu Ser Asp 275 280 285 Phe Val Cys Ile Leu Tyr Gly Val Pro Ser Val Tyr Gly Val Val Thr 290 295 300 Leu Pro Ala Ser Val Arg Glu Gly Ile Asn Ile Phe Leu Asp Gly His 305 310 315 320 Ile Pro Thr Glu Asn Leu Arg Phe Arg Thr Glu Ser Leu Lys Phe Lys 325 330 335 Leu Thr Asp Ala Ser Asp Ser Val Leu Ile Glu Gln Ser Arg Ala Phe 340 345 350 Glu Tyr Pro Lys Met Val Lys Thr Gln Gly Asp Phe Lys Leu Thr Val 355 360 365 Asn Ala Gly Asp Phe Ser Asp Ser Glu Ile Ile Val Met Met Gly Glu 370 375 380 Asn Gly Thr Gly Lys Thr Thr Leu Cys Lys Leu Leu Ala Gly Ala Ile 385 390 395 400 Glu Gly Asp Glu Gly Thr Lys Val Pro Lys Leu Asn Val Ser Met Lys 405 410 415 Pro Gln Lys Ile Ala Pro Lys Phe Thr Gly Thr Val Arg Gln Leu Phe 420 425 430 Leu Lys Lys Ile Arg Ser Ser Phe Leu His Pro Gln Phe Asn Thr Asp 435 440 445 Val Met Lys Pro Leu Lys Val Asp Asp Val Ile Asp Gln Glu Val Gln 450 455 460 His Leu Ser Gly Gly Glu Leu Gln Arg Val Ala Ile Val Leu Ala Leu 465 470 475 480 Gly Lys Glu Ala Asp Ile Tyr Leu Ile Asp Glu Pro Ser Ala Tyr Leu 485 490 495 Asp Ser Glu Gln Arg Ile Ile Cys Ser Lys Val Ile Arg Arg Phe Ile 500 505 510 Leu His Ser Lys Lys Thr Ala Phe Ile Val Glu His Asp Phe Ile Met 515 520 525 Ala Thr Tyr Leu Ala Asp Lys Val Met Val Phe Glu Gly Gln Pro Ser 530 535 540 Lys Asn Ala Val Ala Asn Arg Pro Glu Thr Leu Leu Thr Gly Cys Asn 545 550 555 560 Arg Phe Leu Lys Asn Leu Asn Val Thr Phe Arg Arg Asp Pro Asn Ser 565 570 575 Phe Arg Pro Arg Ile Asn Lys Leu Asp Ser Gln Met Asp Arg Glu Gln 580 585 590 Lys Leu Ser Gly Asn Tyr Phe Phe Leu Glu Asn Thr Glu Leu 595 600 605 <210> 58 <211> 599 <212> PRT <213> Homo sapiens <400> 58 Met Ala Asp Lys Leu Thr Arg Ile Ala Ile Val Asn His Asp Lys Cys 1 5 10 15 Lys Pro Lys Lys Cys Arg Gln Glu Cys Lys Lys Ser Cys Pro Val Val 20 25 30 Arg Met Gly Lys Leu Cys Ile Glu Val Thr Pro Gln Ser Lys Ile Ala 35 40 45 Trp Ile Ser Glu Thr Leu Cys Ile Gly Cys Gly Ile Cys Ile Lys Lys 50 55 60 Cys Pro Phe Gly Ala Leu Ser Ile Val Asn Leu Pro Ser Asn Leu Glu 65 70 75 80 Lys Glu Thr Thr His Arg Tyr Cys Ala Asn Ala Phe Lys Leu His Arg 85 90 95 Leu Pro Ile Pro Arg Pro Gly Glu Val Leu Gly Leu Val Gly Thr Asn 100 105 110 Gly Ile Gly Lys Ser Thr Ala Leu Lys Ile Leu Ala Gly Lys Gln Lys 115 120 125 Pro Asn Leu Gly Lys Tyr Asp Asp Pro Pro Asp Trp Gln Glu Ile Leu 130 135 140 Thr Tyr Phe Arg Gly Ser Glu Leu Gln Asn Tyr Phe Thr Lys Ile Leu 145 150 155 160 Glu Asp Asp Leu Lys Ala Ile Ile Lys Pro Gln Tyr Val Asp Gln Ile 165 170 175 Pro Lys Ala Ala Lys Gly Thr Val Gly Ser Ile Leu Asp Arg Lys Asp 180 185 190 Glu Thr Lys Thr Gln Ala Ile Val Cys Gln Gln Leu Asp Leu Thr His 195 200 205 Leu Lys Glu Arg Asn Val Glu Asp Leu Ser Gly Gly Glu Leu Gln Arg 210 215 220 Phe Ala Cys Ala Val Val Cys Ile Gln Lys Ala Asp Ile Phe Met Phe 225 230 235 240 Asp Glu Pro Ser Ser Tyr Leu Asp Val Lys Gln Arg Leu Lys Ala Ala 245 250 255 Ile Thr Ile Arg Ser Leu Ile Asn Pro Asp Arg Tyr Ile Ile Val Val 260 265 270 Glu His Asp Leu Ser Val Leu Asp Tyr Leu Ser Asp Phe Ile Cys Cys 275 280 285 Leu Tyr Gly Val Pro Ser Ala Tyr Gly Val Val Thr Met Pro Phe Ser 290 295 300 Val Arg Glu Gly Ile Asn Ile Phe Leu Asp Gly Tyr Val Pro Thr Glu 305 310 315 320 Asn Leu Arg Phe Arg Asp Ala Ser Leu Val Phe Lys Val Ala Glu Thr 325 330 335 Ala Asn Glu Glu Glu Val Lys Lys Met Cys Met Tyr Lys Tyr Pro Gly 340 345 350 Met Lys Lys Lys Met Gly Glu Phe Glu Leu Ala Ile Val Ala Gly Glu 355 360 365 Phe Thr Asp Ser Glu Ile Met Val Met Leu Gly Glu Asn Gly Thr Gly 370 375 380 Lys Thr Thr Phe Ile Arg Met Leu Ala Gly Arg Leu Lys Pro Asp Glu 385 390 395 400 Gly Gly Glu Val Pro Val Leu Asn Val Ser Tyr Lys Pro Gln Lys Ile 405 410 415 Ser Pro Lys Ser Thr Gly Ser Val Arg Gln Leu Leu His Glu Lys Ile 420 425 430 Arg Asp Ala Tyr Thr His Pro Gln Phe Val Thr Asp Val Met Lys Pro 435 440 445 Leu Gln Ile Glu Asn Ile Ile Asp Gln Glu Val Gln Thr Leu Ser Gly 450 455 460 Gly Glu Leu Gln Arg Val Ala Leu Ala Leu Cys Leu Gly Lys Pro Ala 465 470 475 480 Asp Val Tyr Leu Ile Asp Glu Pro Ser Ala Tyr Leu Asp Ser Glu Gln 485 490 495 Arg Leu Met Ala Ala Arg Val Val Lys Arg Phe Ile Leu His Ala Lys 500 505 510 Lys Thr Ala Phe Val Val Glu His Asp Phe Ile Met Ala Thr Tyr Leu 515 520 525 Ala Asp Arg Val Ile Val Phe Asp Gly Val Pro Ser Lys Asn Thr Val 530 535 540 Ala Asn Ser Pro Gln Thr Leu Leu Ala Gly Met Asn Lys Phe Leu Ser 545 550 555 560 Gln Leu Glu Ile Thr Phe Arg Arg Asp Pro Asn Asn Tyr Arg Pro Arg 565 570 575 Ile Asn Lys Leu Asn Ser Ile Lys Asp Val Glu Gln Lys Lys Ser Gly 580 585 590 Asn Tyr Phe Phe Leu Asp Asp 595 <210> 59 <211> 587 <212> PRT <213> Aspergillus niger <400> 59 Met Lys Lys Cys Arg Gln Glu Cys Lys Lys Ser Cys Pro Val Val Arg 1 5 10 15 Thr Gly Lys Leu Cys Ile Glu Val Thr Pro Glu Ser Lys Ile Ala Phe 20 25 30 Ile Ser Glu Arg Leu Cys Ile Gly Cys Gly Ile Cys Pro Lys Lys Cys 35 40 45 Pro Phe Gly Ala Ile His Ile Ile Asn Leu Pro Thr Asn Leu Glu Thr 50 55 60 Gln Val Thr His Arg Tyr Ser Ala Asn Ser Phe Lys Leu His Arg Leu 65 70 75 80 Pro Met Pro Arg Pro Gly Gln Val Leu Gly Leu Val Gly Thr Asn Gly 85 90 95 Ile Gly Lys Ser Thr Ala Leu Lys Ile Leu Ser Gly Lys Leu Lys Pro 100 105 110 Asn Leu Gly Arg Phe Asp Asn Pro Pro Asp Trp Glu Glu Ile Leu Lys 115 120 125 Tyr Phe Arg Gly Ser Glu Leu Gln Asn Tyr Phe Thr Lys Val Leu Glu 130 135 140 Asp Asp Leu Lys Ala Val Val Lys Pro Gln Tyr Val Asp Gln Ile Pro 145 150 155 160 Arg Ala Val Lys Gly Pro Val Gln Asn Val Gly Ala Leu Ile Lys Ala 165 170 175 Arg Ala Gln Leu Asp Asn Leu Asp His Ile Leu Asp Thr Leu Glu Leu 180 185 190 Arg Gln Val Gln Asp Arg Asp Ile Gly His Leu Ser Gly Gly Glu Leu 195 200 205 Gln Arg Phe Ala Ile Gly Leu Val Cys Val Gln Lys Ala Asp Val Tyr 210 215 220 Met Phe Asp Glu Pro Ser Ser Tyr Leu Asp Val Lys Gln Arg Leu Ala 225 230 235 240 Ala Ala Arg Ser Ile Arg Glu Leu Leu Arg Pro Asp Asp Tyr Val Ile 245 250 255 Val Val Glu His Asp Leu Ser Val Leu Asp Tyr Leu Ser Asp Phe Val 260 265 270 Cys Val Leu Tyr Gly Arg Pro Ala Leu Tyr Gly Val Val Thr Leu Pro 275 280 285 Ala Ser Val Arg Glu Gly Ile Asn Ile Phe Leu Asp Gly His Ile Pro 290 295 300 Thr Glu Asn Leu Arg Phe Arg Glu Glu Ser Leu Thr Phe Arg Leu Ala 305 310 315 320 Glu Ala Gly Asp Asp Phe Met Val Asp Arg Ala Arg Ala Phe Ala Tyr 325 330 335 Pro Ser Met Glu Lys Thr Leu Gly Asn Phe His Leu Lys Ile Asp Ala 340 345 350 Gly Ser Phe Thr Asp Ser Glu Ile Ile Val Met Met Gly Glu Asn Gly 355 360 365 Thr Gly Lys Thr Thr Phe Cys Lys Met Leu Ala Gly Ala Glu Lys Pro 370 375 380 Asp Gly Gly Lys Ser Val Pro Arg Leu Asn Ile Ser Met Lys Pro Gln 385 390 395 400 Lys Ile Thr Pro Lys Phe Gln Gly Thr Val Arg Gln Leu Phe Phe Lys 405 410 415 Arg Ile Lys Ala Ala Phe Leu Ser Pro Gln Phe Gln Thr Asp Val Tyr 420 425 430 Lys Pro Leu Lys Ile Asp Asp Phe Ile Asp Gln Glu Val Gln Asn Leu 435 440 445 Ser Gly Gly Glu Leu Gln Arg Val Ala Ile Val Leu Ala Leu Gly Ile 450 455 460 Pro Ala Asp Ile Tyr Leu Ile Asp Glu Pro Ser Ala Tyr Leu Asp Ser 465 470 475 480 Glu Gln Arg Ile Val Ala Ser Arg Val Ile Lys Arg Phe Ile Met His 485 490 495 Thr Lys Lys Thr Ala Phe Ile Val Glu His Asp Phe Ile Met Ala Thr 500 505 510 Tyr Leu Ala Asp Arg Val Ile Val Phe Asp Gly Gln Pro Ser Val Asp 515 520 525 Ala His Ala Asn Ala Pro Glu Ser Leu Val Thr Gly Cys Asn Thr Phe 530 535 540 Leu Lys Asn Leu Asp Val Thr Phe Arg Arg Asp Pro Asn Ser Tyr Arg 545 550 555 560 Pro Arg Ile Asn Lys Tyr Gln Ser Gln Met Asp Gln Glu Gln Lys Leu 565 570 575 Ala Gly Asn Tyr Phe Phe Leu Glu Glu Glu Lys 580 585 <210> 60 <211> 599 <212> PRT <213> Cricetulus griseus <400> 60 Met Ala Asp Lys Leu Thr Arg Ile Ala Ile Val Asn His Asp Lys Cys 1 5 10 15 Lys Pro Lys Lys Cys Arg Gln Glu Cys Lys Lys Ser Cys Pro Val Val 20 25 30 Arg Met Gly Lys Leu Cys Ile Glu Val Thr Pro Gln Ser Lys Ile Ala 35 40 45 Trp Ile Ser Glu Thr Leu Cys Ile Gly Cys Gly Ile Cys Ile Lys Lys 50 55 60 Cys Pro Phe Gly Ala Leu Ser Ile Val Asn Leu Pro Ser Asn Leu Glu 65 70 75 80 Lys Glu Thr Thr His Arg Tyr Cys Ala Asn Ala Phe Lys Leu His Arg 85 90 95 Leu Pro Ile Pro Arg Pro Gly Glu Val Leu Gly Leu Val Gly Thr Asn 100 105 110 Gly Ile Gly Lys Ser Thr Ala Leu Lys Ile Leu Ala Gly Lys Gln Lys 115 120 125 Pro Asn Leu Gly Lys Tyr Asp Asp Pro Pro Asp Trp Gln Glu Ile Leu 130 135 140 Thr Tyr Phe Arg Gly Ser Glu Leu Gln Asn Tyr Phe Thr Lys Ile Leu 145 150 155 160 Glu Asp Asp Leu Lys Ala Ile Ile Lys Pro Gln Tyr Val Asp Gln Ile 165 170 175 Pro Lys Ala Ala Lys Gly Thr Val Gly Ser Ile Leu Asp Arg Lys Asp 180 185 190 Glu Thr Lys Thr Gln Ala Ile Val Cys Gln Gln Leu Asp Leu Thr His 195 200 205 Leu Lys Glu Arg Asn Val Glu Asp Leu Ser Gly Gly Glu Leu Gln Arg 210 215 220 Phe Ala Cys Ala Val Val Cys Ile Gln Lys Ala Asp Ile Phe Met Phe 225 230 235 240 Asp Glu Pro Ser Ser Tyr Leu Asp Val Lys Gln Arg Leu Lys Ala Ala 245 250 255 Ile Thr Ile Arg Ser Leu Ile Asn Pro Asp Arg Tyr Ile Ile Val Val 260 265 270 Glu His Asp Leu Ser Val Leu Asp Tyr Leu Ser Asp Phe Ile Cys Cys 275 280 285 Leu Tyr Gly Val Pro Ser Ala Tyr Gly Val Val Thr Met Pro Phe Ser 290 295 300 Val Arg Glu Gly Ile Asn Ile Phe Leu Asp Gly Tyr Val Pro Thr Glu 305 310 315 320 Asn Leu Arg Phe Arg Asp Ala Ser Leu Val Phe Lys Val Ala Glu Thr 325 330 335 Ala Asn Glu Glu Glu Val Lys Lys Met Cys Met Tyr Lys Tyr Pro Glu 340 345 350 Met Lys Lys Lys Met Gly Glu Phe Glu Leu Ala Ile Val Ala Gly Glu 355 360 365 Phe Thr Asp Ser Glu Ile Met Val Met Leu Gly Glu Asn Gly Thr Gly 370 375 380 Lys Thr Thr Phe Ile Arg Met Leu Ala Gly Arg Leu Lys Pro Asp Glu 385 390 395 400 Gly Gly Ala Val Pro Ile Leu Asn Val Ser Tyr Lys Pro Gln Lys Ile 405 410 415 Ser Pro Lys Ser Thr Gly Ser Val Arg Gln Leu Leu His Glu Lys Ile 420 425 430 Arg Asp Ala Tyr Thr His Pro Gln Phe Val Thr Asp Val Met Lys Pro 435 440 445 Leu Gln Ile Glu Asn Ile Ile Asp Gln Glu Val Gln Thr Leu Ser Gly 450 455 460 Gly Glu Leu Gln Arg Val Ala Leu Ala Leu Cys Leu Gly Lys Pro Ala 465 470 475 480 Asp Val Tyr Leu Ile Asp Glu Pro Ser Ala Tyr Leu Asp Ser Glu Gln 485 490 495 Arg Leu Met Ala Ala Arg Val Val Lys Arg Phe Ile Leu His Ala Lys 500 505 510 Lys Thr Ala Phe Val Val Glu His Asp Phe Ile Met Ala Thr Tyr Leu 515 520 525 Ala Asp Arg Val Ile Val Phe Asp Gly Val Pro Ser Lys Asn Thr Val 530 535 540 Ala Asn Ser Pro Gln Thr Leu Leu Ala Gly Met Asn Lys Phe Leu Ser 545 550 555 560 Gln Leu Glu Ile Thr Phe Arg Arg Asp Pro Asn Asn Tyr Arg Pro Arg 565 570 575 Ile Asn Lys Leu Asn Ser Ile Lys Asp Val Glu Gln Lys Lys Ser Gly 580 585 590 Asn Tyr Phe Phe Leu Asp Asp 595 <210> 61 <211> 607 <212> PRT <213> Kluyveromyces lactis <400> 61 Met Ser Ser Lys Asn Thr Arg Ile Ala Ile Val Ser Glu Asp Lys Cys 1 5 10 15 Lys Pro Lys Lys Cys Arg Gln Glu Cys Lys Arg Ser Cys Pro Val Val 20 25 30 Lys Thr Gly Lys Leu Cys Ile Glu Val Met Pro Thr Ser Lys Ile Ala 35 40 45 Phe Ile Ser Glu Asn Leu Cys Ile Gly Cys Gly Ile Cys Val Lys Lys 50 55 60 Cys Pro Phe Asp Ala Ile Gln Ile Ile Asn Leu Pro Thr Asn Leu Asp 65 70 75 80 Ser Gln Val Thr His Arg Tyr Ser Ala Asn Ser Phe Lys Leu His Arg 85 90 95 Leu Pro Thr Pro Arg Pro Gly Gln Val Leu Gly Leu Val Gly Thr Asn 100 105 110 Gly Ile Gly Lys Ser Thr Ala Leu Lys Ile Leu Ala Gly Lys Gln Lys 115 120 125 Pro Asn Leu Gly Arg Phe Glu Asp Pro Pro Glu Trp Gln Glu Ile Ile 130 135 140 Lys Tyr Phe Arg Gly Ser Glu Leu Gln Asn Tyr Phe Thr Lys Met Leu 145 150 155 160 Glu Asp Asp Ile Lys Ala Ile Ile Lys Pro Gln Tyr Val Asp Asn Ile 165 170 175 Pro Arg Ala Ile Lys Gly Pro Val Gln Lys Val Gly Glu Leu Leu Lys 180 185 190 Leu Arg Leu Glu Lys Ser Lys Asp Asp Ala Lys Asn Tyr Ile Asp Ile 195 200 205 Leu Gln Leu Lys Asn Val Leu Asn Arg Glu Val Ser Ala Leu Ser Gly 210 215 220 Gly Glu Leu Gln Arg Phe Ala Ile Gly Met Ser Cys Val Gln Glu Ala 225 230 235 240 Asp Val Tyr Met Phe Asp Glu Pro Ser Ser Tyr Leu Asp Val Lys Gln 245 250 255 Arg Leu Asn Ala Ala Leu Ile Ile Arg Ser Leu Leu Lys Pro Thr Thr 260 265 270 Tyr Val Ile Cys Val Glu His Asp Leu Ser Val Leu Asp Tyr Leu Ser 275 280 285 Asp Phe Val Cys Ile Ile Tyr Gly Val Pro Ser Val Tyr Gly Val Val 290 295 300 Thr Leu Pro Ser Ser Val Arg Glu Gly Ile Asn Ile Phe Leu Asp Gly 305 310 315 320 His Ile Pro Ser Glu Asn Leu Arg Phe Arg Thr Glu Ala Leu Gln Phe 325 330 335 Arg Met Ala Asp Ala Gly Asp Glu Leu Glu Ala Asp Ala Ser Arg Ala 340 345 350 Phe Thr Tyr Pro Asp Met Lys Arg Thr Gln Gly Asp Phe Ser Leu Thr 355 360 365 Val Glu Ala Gly Glu Phe Ser Asp Ser Gln Ile Leu Val Met Met Gly 370 375 380 Glu Asn Gly Thr Gly Lys Thr Thr Leu Ile Lys Leu Leu Ala Gly Ala 385 390 395 400 Ile Pro Ala Asp Asp Gly Gln Asp Ile Pro Lys Leu Asn Val Ser Met 405 410 415 Lys Pro Gln Lys Ile Ala Pro Lys Phe Thr Gly Thr Val Arg Gln Leu 420 425 430 Phe Phe Lys Arg Ile Arg Ala Gln Phe Leu Asn Pro Gln Phe Gln Thr 435 440 445 Asp Val Val Lys Pro Leu Lys Ile Asp Asp Ile Ile Asp Gln Glu Val 450 455 460 Gln His Leu Ser Gly Gly Glu Leu Gln Arg Val Ala Ile Val Leu Ser 465 470 475 480 Leu Gly Met Asn Ala Asp Ile Tyr Leu Ile Asp Glu Pro Ser Ala Tyr 485 490 495 Leu Asp Ser Glu Gln Arg Ile Ile Cys Ser Lys Val Ile Arg Arg Phe 500 505 510 Ile Leu His Asn Lys Lys Thr Ala Phe Ile Val Glu His Asp Phe Ile 515 520 525 Met Ala Thr Tyr Leu Ala Asp Lys Val Ile Val Phe Asp Gly Thr Pro 530 535 540 Ser Lys Gln Ala Phe Ala Arg Ala Pro Glu Ser Leu Leu Thr Gly Cys 545 550 555 560 Asn Lys Phe Leu Lys Asn Leu Asn Val Thr Phe Arg Arg Asp Pro Thr 565 570 575 Ser Phe Arg Pro Arg Ile Asn Lys Leu Asp Ser Gln Met Asp Lys Glu 580 585 590 Gln Lys Ser Ser Gly Asn Tyr Phe Phe Leu Asp His Asn Gly Val 595 600 605 <210> 62 <211> 608 <212> PRT <213> Saccharomyces cerevisiae <400> 62 Met Ser Asp Lys Asn Ser Arg Ile Ala Ile Val Ser Ala Asp Lys Cys 1 5 10 15 Lys Pro Lys Lys Cys Arg Gln Glu Cys Lys Arg Ser Cys Pro Val Val 20 25 30 Lys Thr Gly Lys Leu Cys Ile Glu Val Thr Pro Thr Ser Lys Ile Ala 35 40 45 Phe Ile Ser Glu Ile Leu Cys Ile Gly Cys Gly Ile Cys Val Lys Lys 50 55 60 Cys Pro Phe Asp Ala Ile Gln Ile Ile Asn Leu Pro Thr Asn Leu Glu 65 70 75 80 Ala His Val Thr His Arg Tyr Ser Ala Asn Ser Phe Lys Leu His Arg 85 90 95 Leu Pro Thr Pro Arg Pro Gly Gln Val Leu Gly Leu Val Gly Thr Asn 100 105 110 Gly Ile Gly Lys Ser Thr Ala Leu Lys Ile Leu Ala Gly Lys Gln Lys 115 120 125 Pro Asn Leu Gly Arg Phe Asp Asp Pro Pro Glu Trp Gln Glu Ile Ile 130 135 140 Lys Tyr Phe Arg Gly Ser Glu Leu Gln Asn Tyr Phe Thr Lys Met Leu 145 150 155 160 Glu Asp Asp Ile Lys Ala Ile Ile Lys Pro Gln Tyr Val Asp Asn Ile 165 170 175 Pro Arg Ala Ile Lys Gly Pro Val Gln Lys Val Gly Glu Leu Leu Lys 180 185 190 Leu Arg Met Glu Lys Ser Pro Glu Asp Val Lys Arg Tyr Ile Lys Ile 195 200 205 Leu Gln Leu Glu Asn Val Leu Lys Arg Asp Ile Glu Lys Leu Ser Gly 210 215 220 Gly Glu Leu Gln Arg Phe Ala Ile Gly Met Ser Cys Val Gln Glu Ala 225 230 235 240 Asp Val Tyr Met Phe Asp Glu Pro Ser Ser Tyr Leu Asp Val Lys Gln 245 250 255 Arg Leu Asn Ala Ala Gln Ile Ile Arg Ser Leu Leu Ala Pro Thr Lys 260 265 270 Tyr Val Ile Cys Val Glu His Asp Leu Ser Val Leu Asp Tyr Leu Ser 275 280 285 Asp Phe Val Cys Ile Ile Tyr Gly Val Pro Ser Val Tyr Gly Val Val 290 295 300 Thr Leu Pro Ala Ser Val Arg Glu Gly Ile Asn Ile Phe Leu Asp Gly 305 310 315 320 His Ile Pro Ala Glu Asn Leu Arg Phe Arg Thr Glu Ala Leu Gln Phe 325 330 335 Arg Ile Ala Asp Ala Thr Glu Asp Leu Gln Asn Asp Ser Ala Ser Arg 340 345 350 Ala Phe Ser Tyr Pro Ser Leu Lys Lys Thr Gln Gly Asp Phe Val Leu 355 360 365 Asn Val Glu Glu Gly Glu Phe Ser Asp Ser Glu Ile Leu Val Met Met 370 375 380 Gly Glu Asn Gly Thr Gly Lys Thr Thr Leu Ile Lys Leu Leu Ala Gly 385 390 395 400 Ala Leu Lys Pro Asp Glu Gly Gln Asp Ile Pro Lys Leu Asn Val Ser 405 410 415 Met Lys Pro Gln Lys Ile Ala Pro Lys Phe Pro Gly Thr Val Arg Gln 420 425 430 Leu Phe Phe Lys Lys Ile Arg Gly Gln Phe Leu Asn Pro Gln Phe Gln 435 440 445 Thr Asp Val Val Lys Pro Leu Arg Ile Asp Asp Ile Ile Asp Gln Glu 450 455 460 Val Gln His Leu Ser Gly Gly Glu Leu Gln Arg Val Ala Ile Val Leu 465 470 475 480 Ala Leu Gly Ile Pro Ala Asp Ile Tyr Leu Ile Asp Glu Pro Ser Ala 485 490 495 Tyr Leu Asp Ser Glu Gln Arg Ile Ile Cys Ser Lys Val Ile Arg Arg 500 505 510 Phe Ile Leu His Asn Lys Lys Thr Ala Phe Ile Val Glu His Asp Phe 515 520 525 Ile Met Ala Thr Tyr Leu Ala Asp Lys Val Ile Val Phe Glu Gly Ile 530 535 540 Pro Ser Lys Asn Ala His Ala Arg Ala Pro Glu Ser Leu Leu Thr Gly 545 550 555 560 Cys Asn Arg Phe Leu Lys Asn Leu Asn Val Thr Phe Arg Arg Asp Pro 565 570 575 Asn Ser Phe Arg Pro Arg Ile Asn Lys Leu Asp Ser Gln Met Asp Lys 580 585 590 Glu Gln Lys Ser Ser Gly Asn Tyr Phe Phe Leu Asp Asn Thr Gly Ile 595 600 605 <210> 63 <211> 593 <212> PRT <213> Schizosaccharomyces pombe <400> 63 Met Ser Glu Ser Leu Thr Arg Ile Ala Ile Val Ser Glu Asp Lys Cys 1 5 10 15 Arg Pro Lys Lys Cys Arg Gln Glu Cys Arg Arg Ser Cys Pro Val Val 20 25 30 Arg Thr Gly Lys Leu Cys Ile Glu Val Asn Pro Thr Asp Arg Ile Ala 35 40 45 Phe Ile Ser Glu Thr Leu Cys Ile Gly Cys Gly Ile Cys Val Lys Lys 50 55 60 Cys Pro Phe Gly Ala Ile Asn Ile Ile Asn Leu Pro Thr Asn Leu Glu 65 70 75 80 Ser Glu Val Thr His Arg Tyr Ser Ala Asn Ser Phe Lys Leu His Arg 85 90 95 Leu Pro Thr Pro Arg Pro Gly Gln Val Leu Gly Leu Val Gly Thr Asn 100 105 110 Gly Ile Gly Lys Ser Thr Ala Leu Lys Ile Leu Ser Gly Lys Met Lys 115 120 125 Pro Asn Leu Gly Arg Tyr Asp Asn Pro Pro Asp Trp Ala Glu Val Val 130 135 140 Lys Tyr Phe Arg Gly Ser Glu Leu Gln Asn Phe Phe Thr Lys Val Val 145 150 155 160 Glu Asp Asn Ile Lys Ala Leu Ile Lys Pro Gln Tyr Val Asp His Ile 165 170 175 Pro Arg Ala Ile Lys Thr Gly Asp Lys Thr Val Ser Gly Leu Ile Lys 180 185 190 Ala Arg Ala Asn Asn Asn Asn Phe Glu Glu Val Met Asp His Thr Asp 195 200 205 Leu Gln Asn Leu Leu Asn Arg Glu Val Gly His Leu Ser Gly Gly Glu 210 215 220 Leu Gln Arg Phe Ala Ile Ala Ala Val Ala Thr Gln Lys Ala Asp Val 225 230 235 240 Tyr Met Phe Asp Glu Pro Ser Ser Tyr Leu Asp Ile Lys Gln Arg Leu 245 250 255 Lys Ala Gly Arg Val Ile Arg Ser Leu Leu Ala Thr Thr Asn Tyr Val 260 265 270 Ile Val Val Glu His Asp Leu Ser Val Leu Asp Tyr Leu Ser Asp Phe 275 280 285 Val Cys Val Leu Tyr Gly Val Pro Ser Met Tyr Gly Val Val Thr Leu 290 295 300 Pro Tyr Ser Val Arg Glu Gly Ile Asn Ile Phe Leu Asp Gly His Ile 305 310 315 320 Pro Thr Glu Asn Leu Arg Phe Arg Ser Glu Ala Leu Thr Phe Arg Leu 325 330 335 Ala Asp Ala Ser Asp Glu Ile Thr Ala Asp Arg Thr Ala Glu Tyr Asn 340 345 350 Tyr Pro Asp His Val Ile Glu Gln Gly Asp Phe Lys Leu Thr Ile Lys 355 360 365 Ser Gly Gly Phe Ser Asp Ala Glu Ile Ile Val Leu Leu Gly Glu Asn 370 375 380 Gly Thr Gly Lys Thr Thr Phe Cys Lys Trp Met Ala Lys Asn Ser Asp 385 390 395 400 Leu Lys Ile Ser Met Lys Pro Gln Thr Ile Ala Pro Lys Phe Gln Gly 405 410 415 Thr Val Arg Met Leu Phe Leu Lys Lys Ile Arg Ala Ala Phe Leu Asn 420 425 430 Gly Lys Phe Gln Ser Glu Val Cys Lys Pro Leu Ser Ile Asp Asn Ile 435 440 445 Ile Asp Gln Glu Val Leu Asn Leu Ser Gly Gly Glu Leu Gln Arg Val 450 455 460 Ala Ile Cys Leu Ala Leu Gly Met Pro Ala Asp Val Tyr Leu Ile Asp 465 470 475 480 Glu Pro Ser Ala Tyr Leu Asp Ser Glu Gln Arg Ile Ile Ala Ser Lys 485 490 495 Val Ile Arg Arg Phe Ile Val Asn Ser Arg Lys Thr Ala Phe Ile Val 500 505 510 Glu His Asp Phe Ile Met Ala Thr Tyr Leu Ala Asp Arg Val Ile Leu 515 520 525 Phe Glu Gly Gln Pro Ser Arg Asp Ala Arg Cys Asn Pro Pro Gln Ser 530 535 540 Leu Leu Thr Gly Met Asn Thr Phe Leu Lys Asn Leu Asp Val Thr Phe 545 550 555 560 Arg Arg Asp Pro Asn Thr Leu Arg Pro Arg Ile Asn Lys Phe Asp Ser 565 570 575 Gln Met Asp Gln Glu Gln Lys Asn Ala Gly Asn Tyr Phe Phe Leu Glu 580 585 590 Asn <210> 64 <211> 253 <212> PRT <213> Trichoderma reesei <400> 64 Met Glu Lys Thr Leu Gly Asn Phe Arg Leu Arg Ile Asp Ala Gly Glu 1 5 10 15 Phe Thr Asp Ser Glu Ile Ile Val Met Met Gly Glu Asn Gly Thr Gly 20 25 30 Lys Thr Thr Phe Cys Arg Leu Leu Ala Gly Ala Leu Lys Pro Asp Ser 35 40 45 Lys Arg Ser Val Pro Asp Met Lys Ile Ser Met Lys Pro Gln Thr Ile 50 55 60 Thr Pro Lys Phe Glu Gly Thr Val Arg Gln Leu Phe Phe Lys Lys Ile 65 70 75 80 Lys Ala Ala Phe Leu Ser Pro Gln Phe Gln Thr Asp Val Val Lys Pro 85 90 95 Leu Lys Leu Asp Asp Phe Ile Asp Gln Glu Val Lys Asn Leu Ser Gly 100 105 110 Gly Glu Leu Gln Arg Val Ala Ile Val Leu Ala Leu Gly Met Pro Ala 115 120 125 Asp Ile Tyr Leu Ile Asp Glu Pro Ser Ala Tyr Leu Asp Ser Glu Gln 130 135 140 Arg Ile Ile Ala Ser Arg Val Ile Lys Arg Phe Ile Met His Ser Lys 145 150 155 160 Lys Thr Ala Phe Val Val Glu His Asp Phe Ile Met Ala Thr Tyr Leu 165 170 175 Ala Asp Arg Val Ile Val Phe Asp Gly Lys Pro Gly Ile Asp Ala His 180 185 190 Ala Asn Arg Pro Glu Ser Leu Leu Thr Gly Cys Asn Thr Phe Leu Lys 195 200 205 Asn Leu Asp Val Thr Phe Arg Arg Asp Pro Thr Asn Tyr Arg Pro Arg 210 215 220 Ile Asn Lys Leu Gly Ser Gln Leu Asp Gln Glu Gln Lys Leu Ser Gly 225 230 235 240 Asn Phe Phe Phe Leu Glu Glu Lys Pro Glu Glu Thr Ala 245 250 <210> 65 <211> 616 <212> PRT <213> Yarrowia lipolytica <400> 65 Met Pro Pro Lys Asn Lys Asn Glu Val Lys Asp Gly Asp Lys Asn Thr 1 5 10 15 Arg Ile Ala Ile Val Asn Val Asp Lys Cys Lys Pro Lys Lys Cys Arg 20 25 30 Gln Glu Cys Lys Lys Ser Cys Pro Val Val Arg Thr Gly Lys Leu Cys 35 40 45 Ile Glu Val Thr Pro Asp Ser Lys Ile Ala Phe Ile Ser Glu Thr Leu 50 55 60 Cys Ile Gly Cys Gly Ile Cys Pro Lys Lys Cys Pro Phe Gly Ala Leu 65 70 75 80 Gln Ile Ile Asn Leu Pro Thr Asn Leu Asp Ser Glu Val Thr His Arg 85 90 95 Tyr Ser Ala Asn Ser Phe Lys Leu His Arg Leu Pro Thr Pro Arg Pro 100 105 110 Gly Gln Val Leu Gly Leu Val Gly Thr Asn Gly Ile Gly Lys Ser Thr 115 120 125 Ala Leu Lys Ile Leu Ala Gly Lys Gln Lys Pro Asn Leu Gly Arg Tyr 130 135 140 Glu Asp Pro Pro Thr Trp Gln Glu Ile Leu Thr His Phe Arg Gly Ser 145 150 155 160 Glu Leu Gln Asn Tyr Phe Thr Arg Val Leu Glu Asp Asn Leu Lys Ala 165 170 175 Ile Ile Lys Pro Gln Tyr Val Asp Asn Leu Pro Arg Ala Ile Lys Gly 180 185 190 Pro Leu Gln Lys Val Gly Glu Leu Leu Lys Ala Lys Leu Glu Arg Lys 195 200 205 Asp Asp Phe Glu Asn Ile Val Asn Thr Leu Glu Leu Lys Gly Val Trp 210 215 220 Lys Arg Glu Val Ser Leu Leu Ser Gly Gly Glu Leu Gln Arg Phe Ala 225 230 235 240 Ile Gly Met Ser Cys Val Gln Leu Ala Gln Val Tyr Met Phe Asp Glu 245 250 255 Pro Ser Ser Tyr Leu Asp Val Lys Gln Arg Leu His Ala Ala Ala Met 260 265 270 Ile Arg Ser Leu Ile Asp Ser Thr Gly Tyr Ile Ile Val Val Glu His 275 280 285 Asp Leu Ser Val Leu Asp Tyr Leu Ser Asp Phe Val Cys Ile Leu Tyr 290 295 300 Gly Val Pro Ser Val Tyr Gly Val Val Thr Leu Pro Ser Ser Val Arg 305 310 315 320 Glu Gly Ile Asn Ile Phe Leu Asp Gly His Ile Pro Thr Glu Asn Leu 325 330 335 Arg Phe Arg Thr Glu Ser Leu Gln Phe Arg Leu Ala Asp Ala Thr Glu 340 345 350 Ile Ile Pro Leu Asp Gln Ser Arg Ser Phe Lys Tyr Pro Thr Met Ser 355 360 365 Arg Thr Gln Gly Asp Phe Lys Leu Asn Val Glu Ser Gly Glu Phe Thr 370 375 380 Asp Ser Glu Ile Ile Val Met Met Gly Glu Asn Gly Thr Gly Lys Thr 385 390 395 400 Thr Leu Cys Arg Leu Leu Ala Gly Ala Val Ala Pro Asp Glu Gly Gln 405 410 415 Lys Ala Pro Lys Leu Asn Val Ser Met Lys Pro Gln Lys Ile Ala Pro 420 425 430 Lys Phe Thr Gly Thr Val Arg Gln Leu Phe Leu Lys Lys Ile Arg Ser 435 440 445 Ser Met His His Pro Gln Phe Gln Thr Asp Val Tyr Lys Pro Leu Arg 450 455 460 Ile Asp Asp Ile Ile Asp Gln Glu Val Gln Asn Leu Ser Gly Gly Glu 465 470 475 480 Leu Gln Arg Val Ala Ile Val Leu Ala Leu Gly Gln Pro Ala Asp Ile 485 490 495 Tyr Leu Ile Asp Glu Pro Ser Ala Tyr Leu Asp Ser Glu Gln Arg Ile 500 505 510 Ile Cys Ala Lys Val Ile Arg Arg Phe Ile Leu His Ser Lys Lys Thr 515 520 525 Ala Phe Ile Val Glu His Asp Phe Ile Met Ala Thr Tyr Leu Ala Asp 530 535 540 Arg Val Ile Val Phe Asp Gly Gln Pro Ser Val Glu Ala Phe Ala Arg 545 550 555 560 Arg Pro Glu Ser Leu Leu Thr Gly Cys Asn Arg Phe Leu Lys Ser Leu 565 570 575 Asn Val Thr Phe Arg Arg Asp Pro Thr Ser Phe Arg Pro Arg Ile Asn 580 585 590 Lys Lys Asp Ser Gln Met Asp Lys Glu Gln Lys Ala His Gly Asn Tyr 595 600 605 Phe Phe Leu Asp Thr Ala Glu Ala 610 615 <210> 66 <211> 609 <212> DNA <213> Komagataella phaffii <400> 66 atgtcagaga ctgaaaacgc tcctcacgaa aagtcactgc ttgacgacca agttgatttc 60 actgttaagc atccgctcaa ctctgagtgg acactatggt atacgaagcc agccgttcat 120 gaacaagaaa gttggtcaga tttgctacgt cctatcattt cattcaactc ggtagaggag 180 ttctggggaa tcttcaactc cattccaaag gcctccgatt tgccagtcaa gtcggactat 240 catcttttta gagatggaat caaacctgaa tgggaagacg agcgcaatgc taacggagga 300 aaactgacat accagtttgc ctacagaaag gttgatatca atgaattgtg gtctcgcggt 360 ctgttgagtg tgattggtga aacgattcag gatgatgacg gagaaactga ggtgaacggt 420 attgttctga gcattcgtcg tgccgctttg aagattgccc tctggaccaa gtccaaggat 480 gaggcagttt tgagaccaat tggcgagaga ttcaagaaag ttttgaagtt gacagcccgt 540 gatcatattg actttcaacc tcataagagt ggtgctggta gcaagaacgt accttctttc 600 agcatttag 609 <210> 67 <211> 609 <212> DNA <213> artificial <220> <223> eIF4E gene mutant <400> 67 atgtcagaga ctgaaaacgc tcctcacgaa aagtcactgc ttgacgacca agttgatttc 60 actgttaagc atccgctcaa ctctgagtgg acactatggt atacgaagcc agccgttcat 120 gaacaagaaa gttggtcaga tttgctacgt cctatcattt cattcaactc ggtagaggag 180 ttctggggaa tcttcaactc cattccaaag gcctccgatt tgccagtcaa gtcggactat 240 catcttttta gagatggaat caaacctgaa tgggaggacg agcgcaatgc taacggagga 300 aaactgacat accagtttgc ctacagaaag gttgatatca atgaattgtg gtcccgcggt 360 ctgttgagtg tgattggtga aacgattcag gatgatgacg gagaaactga ggtgaacggt 420 attgttctga gcattcgtcg tgccgctttg aagattgccc tctggaccaa gtccaaggat 480 gaggcagttt taagaccaat tggcgagaga ttcaagaaag ttttgaagtt gacagcccgt 540 gatcatattg actttcaacc tcataagagt ggtgctggta gcaagaacgt accttctttc 600 agcatttag 609 <210> 68 <211> 1212 <212> DNA <213> Komagataella phaffii <400> 68 atgtctgaag gtattattga aatcgacact aacttaatcg agaccaacta cgaccaggtt 60 gtcagcacct tcgatgagct gaacctgaag gagcaaatcc tgagagccgt ttttgcttac 120 ggttacgagt tcccatctgc cattcaatct cgtgccattt tgccaattgt tgctggtcgt 180 gatgtcttgg cccaagccca gtccggtacc ggtaagactg ctacctttgc catctccgct 240 ttgcagagat tggatgagaa gctgaaggct gcccaagttt tgatcttggc cccaaccaga 300 gagttggccc tgcagatcaa gaaggttgtt ttggccctcg gtatgcactt gaacatctct 360 gtccatgcct gtatcggtgg tgttgaccca gctttggatg tcaaggcctt caactccggt 420 gttcaaatcg tcgttggtac cccaggtaga gtccaagaca tgatcgaacg tggagctttc 480 agaactgaga acgtcaagat ggtcattttg gatgaggccg atgagatgtt gtccactgga 540 ttcaaggagc aaatctacac cttgttcaca ttgttaccat ccactacaca ggttgttctt 600 ctatccgcca ccatgcctca agaggtgttg gaggttacca ccaagttcat gaacaaccct 660 attcgtatct tggtcaagaa ggaccaattg accttggaag gtattaagca attctacgtc 720 gacgtcggtg aagaacaata caagttcgac tgtctgtgtg atctgtacga ctccatctcc 780 gtcacccagg ccgttatctt ctgtaacacc agacgaaagg tcgaggagtt gactgagcgt 840 ttgaccgccc agaagttcac cgtctctgct atccactctg agctgtcaca aaccgagaga 900 gacaccatca tgcaagagtt cagaaccggt tcttccagaa tcttaatctc caccgacttg 960 ctggccagag gtatcgatgt ccaacaagtc tcattggtta tcaactacga cttaccatct 1020 aacaaggaaa actacatcca cagaatcggt agaggtggtc gtttcggtag aaagggtgtt 1080 gctatcaact tcgtcaccag caaggacgtt gagatgatga aggagatcga gaagttctac 1140 tctacccaaa tcgacgagtt gccatcttcc atcactgact tgtttgagac tgaggaagtt 1200 aatgagtctt ag 1212 <210> 69 <211> 1212 <212> DNA <213> artificial <220> <223> eIF4A gene mutant <400> 69 atgtctgaag gtattattga aatcgacact aacttaatcg agacaaacta cgaccaggtt 60 gtcagcacct tcgatgagct gaacctgaag gagcaaatcc tgagagccgt ttttgcttac 120 ggttacgagt tcccatctgc cattcaatct cgtgccattt tgccaattgt tgctggtcgt 180 gatgtcttgg cccaagccca gtccggtacc ggtaagactg ctacctttgc catctccgct 240 ttgcagagat tggatgagaa gctgaaggct gcccaagttt tgatcttggc cccaaccaga 300 gagttggccc tgcagatcaa gaaggttgtt ttggccctcg gtatgcactt gaacatctct 360 gtccatgcct gtatcggtgg tgttgaccca gctttggatg tcaaggcctt caactccggt 420 gttcaaatcg tcgttggtac cccaggtaga gtccaagaca tgatcgaacg tggagctttc 480 agaactgaga acgtcaagat ggtcattttg gatgaggccg atgagatgtt gtccactgga 540 ttcaaggagc aaatctacac cttgttcaca ttgttaccat ccactacaca ggttgttctt 600 ctatccgcca ccatgcctca agaggtgttg gaggttacca ccaagttcat gaacaaccct 660 attcgtatct tggtcaagaa ggaccaattg accttggaag gtattaagca attctacgtc 720 gacgtcggtg aagaacaata caagttcgac tgtctgtgtg atctgtacga ctccatctcc 780 gtcacccagg ccgttatctt ctgtaacacc agacgaaagg tcgaggagtt gactgagcgt 840 ttgaccgccc agaagttcac cgtctctgct atccactctg agctgtcaca aaccgagaga 900 gacaccatca tgcaagagtt cagaaccggt tcttccagaa tcttaatctc caccgacttg 960 ctggccagag gtatcgatgt ccaacaagtc tcattggtta tcaactacga cttaccatct 1020 aacaaggaaa actacatcca cagaatcggt agaggtggtc gtttcggtag aaagggtgtt 1080 gctatcaact tcgtcaccag caaggacgtt gagatgatga aggagatcga gaagttctac 1140 tctacccaaa tcgacgagtt gccatcttcc atcactgact tgtttgagac tgaggaagtt 1200 aatgagtctt ag 1212 <210> 70 <211> 1461 <212> DNA <213> Komagataella phaffii <400> 70 atgcatccat acaccgtagt atttgcgcgc ctcctcctgg gtgttttctc aactgccgcc 60 cccaactcgc cccccccctt ttgcacttct tgccaccttg gagatcagag attgtggaac 120 cttgctcaaa atctggcatg cacactacct cctcaaaaaa attttccttg ccttgttgca 180 aggcgctcaa aaatcaaaag tttttctaca acttttgttc ccaacaaatc acctttttac 240 ttacccatta tgtctgaagg tattattgaa atcgacacta acttaatcga gaccaactac 300 gaccaggttg tcagcacctt cgatgagctg aacctgaagg agcaaatcct gagagccgtt 360 tttgcttacg gttacgagtt cccatctgcc attcaatctc gtgccatttt gccaattgtt 420 gctggtcgtg atgtcttggc ccaagcccag tccggtaccg gtaagactgc tacctttgcc 480 atctccgctt tgcagagatt ggatgagaag ctgaaggctg cccaagtttt gatcttggcc 540 ccaaccagag agttggccct gcagatcaag aaggttgttt tggccctcgg tatgcacttg 600 aacatctctg tccatgcctg tatcggtggt gttgacccag ctttggatgt caaggccttc 660 aactccggtg ttcaaatcgt cgttggtacc ccaggtagag tccaagacat gatcgaacgt 720 ggagctttca gaactgagaa cgtcaagatg gtcattttgg atgaggccga tgagatgttg 780 tccactggat tcaaggagca aatctacacc ttgttcacat tgttaccatc cactacacag 840 gttgttcttc tatccgccac catgcctcaa gaggtgttgg aggttaccac caagttcatg 900 aacaacccta ttcgtatctt ggtcaagaag gaccaattga ccttggaagg tattaagcaa 960 ttctacgtcg acgtcggtga agaacaatac aagttcgact gtctgtgtga tctgtacgac 1020 tccatctccg tcacccaggc cgttatcttc tgtaacacca gacgaaaggt cgaggagttg 1080 actgagcgtt tgaccgccca gaagttcacc gtctctgcta tccactctga gctgtcacaa 1140 accgagagag acaccatcat gcaagagttc agaaccggtt cttccagaat cttaatctcc 1200 accgacttgc tggccagagg tatcgatgtc caacaagtct cattggttat caactacgac 1260 ttaccatcta acaaggaaaa ctacatccac agaatcggta gaggtggtcg tttcggtaga 1320 aagggtgttg ctatcaactt cgtcaccagc aaggacgttg agatgatgaa ggagatcgag 1380 aagttctact ctacccaaat cgacgagttg ccatcttcca tcactgactt gtttgagact 1440 gaggaagtta atgagtctta g 1461 <210> 71 <211> 1461 <212> DNA <213> Artificial Sequence <220> <223> eIF4A gene mutant <400> 71 atgcatccat acaccgtagt atttgcgcgc ctcctcctgg gtgttttctc aactgccgcc 60 cccaactcgc cccccccctt ttgcacttct tgccaccttg gagatcagag attgtggaac 120 cttgctcaaa atctggcatg cacactacct cctcaaaaaa attttccttg ccttgttgca 180 aggcgctcaa aaatcaaaag tttttctaca acttttgttc ccaacaaatc acctttttac 240 ttacccatta tgtctgaagg tattattgaa atcgacacta acttaatcga gacaaactac 300 gaccaggttg tcagcacctt cgatgagctg aacctgaagg agcaaatcct gagagccgtt 360 tttgcttacg gttacgagtt cccatctgcc attcaatctc gtgccatttt gccaattgtt 420 gctggtcgtg atgtcttggc ccaagcccag tccggtaccg gtaagactgc tacctttgcc 480 atctccgctt tgcagagatt ggatgagaag ctgaaggctg cccaagtttt gatcttggcc 540 ccaaccagag agttggccct gcagatcaag aaggttgttt tggccctcgg tatgcacttg 600 aacatctctg tccatgcctg tatcggtggt gttgacccag ctttggatgt caaggccttc 660 aactccggtg ttcaaatcgt cgttggtacc ccaggtagag tccaagacat gatcgaacgt 720 ggagctttca gaactgagaa cgtcaagatg gtcattttgg atgaggccga tgagatgttg 780 tccactggat tcaaggagca aatctacacc ttgttcacat tgttaccatc cactacacag 840 gttgttcttc tatccgccac catgcctcaa gaggtgttgg aggttaccac caagttcatg 900 aacaacccta ttcgtatctt ggtcaagaag gaccaattga ccttggaagg tattaagcaa 960 ttctacgtcg acgtcggtga agaacaatac aagttcgact gtctgtgtga tctgtacgac 1020 tccatctccg tcacccaggc cgttatcttc tgtaacacca gacgaaaggt cgaggagttg 1080 actgagcgtt tgaccgccca gaagttcacc gtctctgcta tccactctga gctgtcacaa 1140 accgagagag acaccatcat gcaagagttc agaaccggtt cttccagaat cttaatctcc 1200 accgacttgc tggccagagg tatcgatgtc caacaagtct cattggttat caactacgac 1260 ttaccatcta acaaggaaaa ctacatccac agaatcggta gaggtggtcg tttcggtaga 1320 aagggtgttg ctatcaactt cgtcaccagc aaggacgttg agatgatgaa ggagatcgag 1380 aagttctact ctacccaaat cgacgagttg ccatcttcca tcactgactt gtttgagact 1440 gaggaagtta atgagtctta g 1461 <210> 72 <211> 3297 <212> DNA <213> Komagataella phaffii <400> 72 atgtccaata agaacgtgga tacagctcca gataatggtt ctggtggctc caattcccca 60 gcttctgtgc cgcattatcc acagcaacac cgtgctaatt ataatcctca taagaatcat 120 actaatcatg ggggcaataa tggaggcgcc cagggttaca tgcagcatca gcaacagcaa 180 caaatgtatt acaatcagat gggctaccct atgccgtatc cgaatgctgg tggcaatttc 240 aaccagaatg tatacttggt tccttataat actatggttc caggtactcc atatggtgca 300 ggtgccccgg gcgtgcctcc aagctaccca gtgtctcctt ctccagcatt cgcctctcca 360 caaaagactc atgtgccagt aagtctgcgt accccttctg gagaacctat aaatttggtt 420 cctgctgggc aaacgagttc cagttcatcc aatgcctctc ctcatgttaa gtctacctct 480 attcctcctt ctgctgtcac tagtcctgct gcttccattg ctccaactgt tgcatcaccg 540 actaaggccg cggctggatc tgaagacgct ggcaagacta gagatgcatt caagcagatg 600 gttcaggctt tagctgctaa aaagaaggct gcagctgctg ccaaggctga aggtaaaaca 660 gatgataaaa aggagtctgt ggagtctaag cctaagtctg ctgtacagcc cgagacaaag 720 ccaaaagttg aggttaagtt agagccaaaa ccaaaagttg aggtcaaatt agagccaaag 780 ccaaaggttg agattaaact agagcccaaa ccagtatcgg aggctaaacc agagacaaaa 840 acagtacctg aggttgaaga accttcaaca gttgcaacga tcaaatcaga atccacacca 900 attgaggagc tcaaacccaa agttgaggta accccagaag ttgcatccaa gcctgaacag 960 gttgagtctg cacaggagcc ggctaacgat gtaaaaccat ctgaagtctc agctaaagag 1020 gttcaagaat ccaaggagga gtctttgaaa caacctaagg aagctttgaa tgacattaaa 1080 tccaccgagg agtcaaataa aaagttttct cttccagaag aggagtctaa cgatcaccag 1140 acactttccc aaattcaagg agttaaagat acagaacaat cgcaagaatt tgaagaacct 1200 caaggaaccc aggaaactca ggaaactcag gaaacgcagg aaaccgcaaa gcctttggaa 1260 gctcaagcac ctcaagaaat tcaagaaacc caagaacctg aggaagttca ggaacaaact 1320 cctgaaacat ctgagactgt ttcttctgtc acagaagaag tgtctccagc tccagcacct 1380 ggattgcccc tttcaaagtt cttggacaga atcagaaagg ctcccgccat ttcaaaccca 1440 ttcaagcatg agtactcagg tgatttccat ggtccagacg aaagtttaag tggtctgaaa 1500 accatcaaat atgatccggg tttcttgatc caattcgcca ccttcaactt ccatattgat 1560 gaagatttca tcaacgatgt cggttctaag gttgtgatcc ctgtcaacac cagaagagac 1620 aatttttcca agagcatgtc taccagcaat ttcaaaggtt ctggtagaaa tatgggttct 1680 aatttcagaa atgattttgg atctagaaac aactccaagc aaggttccaa gaaaaagaat 1740 aaatctcaaa agagccaatc taggaggggt ccaaagtact ccaatgaaga agaacctgct 1800 gaaccagccg tgcctgctga attgcctaat agagctgcaa gcaagtgggt acctcgttcg 1860 ttaagaaata aggaggctga agtcaagact gctccagacg gatctataat agtatcagaa 1920 gaagacatca aaaggaaaac taaatccctt ttgaataagt tgacgttgga attctttgat 1980 gatatctcaa acgatataat tgctttgacc aagcaagctc aatgggaaga tgacgtgaag 2040 actttgaaac aagttattga gtctatattt gcaaaggctt gtgacgaacc ctactggtct 2100 tctatgtacg ctaaattatg cgccaaaatg tgcaaggaca ccccacctga gatcaaggaa 2160 actaatgaga agggaaatac tttcaccggt ggtgatttgg tgagaagagt gttgattaat 2220 agatgtcaaa ccgaatatca gaaaggatgg attgaccagc taccaaccaa cgaggatggt 2280 tcacctctag agccagaact gatgtctgac gaatattaca aacaagctgc tgctaaacgt 2340 agaggtcttg gtctggttaa gttcattggt caattgtacc agttgaactt attatcagac 2400 aatgtcattt tccactgtgt ccttggtcag tccaaagaaa cagacaatcc atcagaagat 2460 actatggaga acctggttca attattggaa gctgtaggtt atagaatgga gatgtccagt 2520 gaacctaaga ttagaagggt tcttgatctc gcctttgcca acatcaaggc cattgttgac 2580 gctaacaaga ttccttcaag aataagattt atgctcatgg atttgatgga tctaagaaga 2640 aatggctggg ctacaacaga agagaacgct ggtccaaaga ccattcaaga gattcactta 2700 gaggctgaga tcaagagatc agaggaggag agagaaaaag aaagagacag gcattctcgt 2760 agaggacgtt acaacgactc caaacctaac tctcgtcaaa agtcatcttg gggaagttca 2820 gtggtttcac ctaatgatat tagaaatgca ggctatgtta gaaactctga caaatctctg 2880 gggcctgtca acagtttttc caggggcaag tcatcccgtc aagcttcaaa gcaatcaaac 2940 agtgatttta ccagtgttcc tatcacttcc agtggtagta gaactgctct aaaccactct 3000 ggcgacagct caacgtctct gaacgaacct caatcaagag aatattcaaa aaaatctgaa 3060 tctaggcccg ctccttccaa catttttgct gcattagagg atcacgatca tgatcatgaa 3120 catggccacg aacaagaaga aaacaagcat tccaaggatc tccaaaacgg agaggccgaa 3180 gcacctgagg acgacaatgt gggagaaata gcccaagctg acgaaaatgt gcaagggcaa 3240 gagcaagagg aagaacgaga ggaagagcga gagcaagaag aggaacagga agtttaa 3297 <210> 73 <211> 3297 <212> DNA <213> Artificial Sequence <220> <223> eIF4G gene mutant <400> 73 atgtccaata agaacgtgga tacagctcca gataatggtt ctggtggctc caattcccca 60 gcttctgtgc cgcattatcc acagcaacac cgtgctaatt ataatcctca taagaatcat 120 actaatcatg ggggcaataa tggaggcgcc cagggttaca tgcagcatca gcaacagcaa 180 caaatgtatt acaatcagat gggctaccct atgccgtatc cgaatgctgg tggcaatttc 240 aaccagaatg tatacttggt tccttataat actatggttc caggtactcc atatggtgca 300 ggtgccccgg gcgtgcctcc aagctaccca gtgtctcctt ctccagcatt cgcctctcca 360 caaaagactc atgtgccagt aagtctgcgt accccttctg gagaacctat aaatttggtt 420 cctgctgggc aaacgagttc cagttcatcc aatgcctctc ctcatgttaa gtctacctct 480 attcctcctt ctgctgtcac tagtcctgct gcttccattg ctccaactgt tgcatcaccg 540 actaaggccg cggctggatc tgaggacgct ggcaagacta gagatgcatt caagcagatg 600 gttcaggctt tagctgctaa aaagaaggct gcagctgctg ccaaggctga aggtaaaaca 660 gatgataaaa aggagtctgt ggagtctaag cctaagtctg ctgtacagcc cgagacaaag 720 ccaaaagttg aggttaagtt agagccaaaa ccaaaagttg aggtcaaatt agagccaaag 780 ccaaaggttg agattaaact agagcccaaa ccagtatcgg aggctaaacc agagacaaaa 840 acagtacctg aggttgaaga accttcaaca gttgcaacga tcaaatcaga atccacacca 900 attgaggagc tcaaacccaa agttgaggta accccagaag ttgcatccaa gcctgaacag 960 gttgagtctg cacaggagcc ggctaacgat gtaaaaccat ctgaagtctc agctaaagag 1020 gttcaagaat ccaaggagga gtctttgaaa caacctaagg aagctttgaa tgacattaaa 1080 tccaccgagg agtcaaataa aaagttttct cttccagaag aggagtctaa cgatcaccag 1140 acactttccc aaattcaagg agttaaagat acagaacaat cgcaagaatt tgaagaacct 1200 caaggaaccc aggaaactca ggaaactcag gaaacgcagg aaaccgcaaa gcctttggaa 1260 gctcaagcac ctcaagaaat tcaagaaacc caagaacctg aggaagttca ggaacaaact 1320 cctgaaacat ctgagactgt ttcttctgtc acagaagaag tgtctccagc tccagcacct 1380 ggattgcccc tttcaaagtt cttggacaga atcagaaagg ctcccgccat ttcaaaccca 1440 ttcaagcatg agtactcagg tgatttccat ggtccagacg aaagtttaag tggtctgaaa 1500 accatcaaat atgatccggg tttcttgatc caattcgcca ccttcaactt ccatattgat 1560 gaagatttca tcaacgatgt cggttctaag gttgtgatcc ctgtcaacac cagaagagac 1620 aatttttcca agagcatgtc taccagcaat ttcaaaggtt ctggtagaaa tatgggttct 1680 aatttcagaa atgattttgg atctagaaac aactccaagc aaggttccaa gaaaaagaat 1740 aaatctcaaa agagccaatc taggaggggt ccaaagtact ccaatgaaga agaacctgct 1800 gaaccagccg tgcctgctga attgcctaat agagctgcaa gcaagtgggt acctcgttcg 1860 ttaagaaata aggaggctga agtcaagact gctccagacg gatctataat agtatcagaa 1920 gaggacatca aaaggaaaac taaatccctt ttgaataagt tgacgttgga attctttgat 1980 gatatctcaa acgatataat tgctttgacc aagcaagctc aatgggaaga tgacgtcaag 2040 actttgaaac aagttattga gtctatattt gcaaaggctt gtgacgaacc ctactggtcc 2100 tctatgtacg ctaaattatg cgccaaaatg tgcaaggaca ccccacctga gatcaaggaa 2160 actaatgaga agggaaatac tttcaccggt ggtgatttgg tgagaagagt gttgattaat 2220 agatgtcaaa ccgaatatca gaaaggatgg attgaccagc taccaaccaa cgaggatggt 2280 tcacctctag agccagaact gatgtctgac gaatattaca aacaagctgc tgctaaacgt 2340 agaggtcttg gtctggttaa gttcattggt caattgtacc agttgaactt attatcagac 2400 aatgtcattt tccactgtgt ccttggtcag tccaaagaaa cagacaatcc atcagaagat 2460 actatggaga acctggttca attattggaa gctgtaggtt atagaatgga gatgtccagt 2520 gaacctaaga ttagaagggt tcttgatctc gcctttgcca acatcaaggc cattgttgac 2580 gctaacaaga ttccttcaag aataagattt atgctcatgg atttgatgga tctaagaaga 2640 aatggctggg ctacaacaga agagaacgct ggtccaaaga ccattcaaga gattcactta 2700 gaggctgaga tcaagagatc agaggaggag agagaaaaag aaagagacag gcattctcgt 2760 agaggacgtt acaacgactc caaacctaac tctcgtcaaa agtcatcttg gggaagttca 2820 gtggtttcac ctaatgatat tagaaatgca ggctatgtta gaaactctga caaatctctg 2880 gggcctgtca acagtttttc caggggcaag tcatcccgtc aagcttcaaa gcaatcaaac 2940 agtgatttta ccagtgttcc tatcacttcc agtggtagta gaactgctct aaaccactct 3000 ggcgacagct caacgtctct gaacgaacct caatcaagag aatattcaaa aaaatctgaa 3060 tctaggcccg ctccttccaa catttttgct gcattagagg atcacgatca tgatcatgaa 3120 catggccacg aacaagaaga aaacaagcat tccaaggatc tccaaaacgg agaggccgaa 3180 gcacctgagg acgacaatgt gggagaaata gcccaagctg acgaaaatgt gcaagggcaa 3240 gagcaagagg aagaacgaga ggaagagcga gagcaagaag aggaacagga agtttaa 3297 <210> 74 <211> 1881 <212> DNA <213> Komagataella phaffii <400> 74 atgtctgtcg ataccaagga agttcaagaa tcccttgatc aacttaacat ttcagaatca 60 ccagctactg ctgtgactga agagactcca gctacctcta ccgaggccgc tgaagagtcc 120 aacgagtcat cgactcaagc ttccgagacc ttggcttcat tgtatgttgg tgagctggac 180 cctaccgtta ctgagagtga cttgtatgag ttcttctctc caatcggtag tgttaattcc 240 atccgtgtgt gtcgtgatgc agtcaccaag cgttcgttgg gttatggata cgttaacttt 300 cacagccaag ctgccggcga gcgtgccttg gaggagctga actacgctga gatcaaaggt 360 gtccgttgta gattgatgtg gtctcaacgt gacccttcct tgcgtcgtag tggttccggt 420 aacatcttca tcaagaactt agaccctgct attgagaaca agactttgca cgatactttc 480 tcctcttttg gaaaagtttt gtcctgtaag gttgccactg atgagaatgg aaactcaaag 540 ggattcggat tcgttcatta cgaaagcgat gaagcagctc aagctgccat tgagaacatc 600 aacggtatgc tgttgaatgg tcgtgaaatc tacgttggac ctcacttggc caagaaggac 660 cgtgaatcta gattccagga gatgatcaag aactacacca atgtcttcgt caagaacttt 720 gacactgagt ccactgagga tgaactgaga gagctgtttg agtcatacgg tccaatcact 780 tcgatccact tgcaagttga ttctgagggt cacaacaagg gttttggttt cgtcaacttt 840 gctgaacacg acgatgctgt taaggccgtt gaagccttga acgacaagga gtacaagggc 900 aagccattgt acgttggacg tgctcagaag aaaaacgaga gagtccacga acttaccaag 960 aagtacgagg ctgatcgtct tgaaaaattg caaaagtatc aatcagttaa cttgttcatc 1020 aagaacttgg atgagtccat tgatgatgcc cgtcttgagg aagagttcaa accatttgga 1080 accatcacct ctgccaaggt catgttggac gaaaatggaa aatctagagg tttcggtttc 1140 gtttgtctct ctactccaga ggaagccact aaggctatca gtgagatgaa ccaacgtatg 1200 gttgccaaca agccattata cgttgctttg gctcaaccaa aagccatcag acgctctcaa 1260 ttggctcagc agatccaagc tagaaaccaa atgagaatgc aacaacaagc tggtccaggt 1320 ataccaaacc agttcgttca acctatcttt tacgggcaac agccaggtat gttgccacca 1380 ggtgctagag tcccaccaat gggtaaccag attcctcaat ttgctggtat gccaagacca 1440 ggcccatttc cccaaggcca attccctaga atggctccta acggtcagcc aatgcctgtg 1500 tatggccaac ctgtattcaa cggtaacggt cctcagcagc gtggctacta cccaaacaac 1560 agacagaaca agaacaggaa tcaaaaggag gaaggaaact ctttggctgc aatcttgcct 1620 cagttgccat tagagcaaca aaagagagta ctgggtgagg agctttatcc aaaggttgtt 1680 gctactaaca agacccaaga tccagaagct gcaggtaaaa tcactggtat gatcttggat 1740 ttggacaacc aagaaatttt gcaactgttg gaagatgaag aacttttcaa cactcatttc 1800 aacgaagctc tccaagctta cgaggagtac aagagtaaga ctgttgaaca gcaacagcaa 1860 gcggatgcac aagcaaacta g 1881 <210> 75 <211> 1881 <212> DNA <213> Artificial Sequence <220> <223> PAB1 gene mutant <400> 75 atgtctgtcg ataccaagga agttcaagaa tcccttgatc aacttaacat ttcagaatca 60 ccagctactg ctgtgactga agagactcca gctacctcta ccgaggccgc tgaagagtcc 120 aacgagtcat cgactcaagc ttccgagaca ttggcttcat tgtatgttgg tgagctggac 180 cctaccgtta ctgagagtga cttgtatgag ttcttctctc caatcggtag tgttaattcc 240 atccgtgtgt gtcgtgatgc agtcaccaag cgttcgttgg gttatggata cgttaacttt 300 cacagccaag ctgccggcga gcgtgccttg gaggagctga actacgctga gatcaaaggt 360 gtccgttgta gattgatgtg gtcccaacgt gacccttcct tgcgtcgtag tggttccggt 420 aacatcttca tcaagaactt agaccctgct attgagaaca agactttgca cgatactttc 480 tcctcttttg gaaaagtttt gtcctgtaag gttgccactg atgagaatgg aaactcaaag 540 ggattcggat tcgttcatta cgaaagcgat gaagcagctc aagctgccat tgagaacatc 600 aacggtatgc tgttgaatgg tcgtgaaatc tacgttggac ctcacttggc caagaaggac 660 cgtgaatcta gattccagga gatgatcaag aactacacca atgtctttgt caagaacttt 720 gacactgagt ccactgagga tgaactgaga gagctgtttg agtcatacgg tccaatcact 780 tcgatccact tgcaagttga ttctgagggt cacaacaagg gttttggttt cgtcaacttt 840 gctgaacacg acgatgctgt taaggccgtt gaagccttga acgacaagga gtacaagggc 900 aagccattgt acgttggacg tgctcagaag aaaaacgaga gagtccacga acttaccaag 960 aagtacgagg ctgatcgtct tgaaaaattg caaaagtatc aatcagttaa cttgttcatc 1020 aagaacttgg atgagtccat tgatgatgcc cgtcttgagg aagagttcaa accatttgga 1080 accatcacct ctgccaaggt catgttggac gaaaatggaa aatctagagg tttcggtttc 1140 gtttgtctct ctactccaga ggaagccact aaggctatca gtgagatgaa ccaacgtatg 1200 gttgccaaca agccattata cgttgctttg gctcaaccaa aagccatcag acgctctcaa 1260 ttggctcagc agatccaagc tagaaaccaa atgagaatgc aacaacaagc tggtccaggt 1320 ataccaaacc agttcgttca acctatcttt tacgggcaac agccaggtat gttgccacca 1380 ggtgctagag tcccaccaat gggtaaccag attcctcaat ttgctggtat gccaagacca 1440 ggcccatttc cccaaggcca attccctaga atggctccta acggtcagcc aatgcctgtg 1500 tatggccaac ctgtattcaa cggtaacggt cctcagcagc gtggctacta cccaaacaac 1560 agacagaaca agaacaggaa tcaaaaggag gaaggaaact ctttggctgc aatcttgcct 1620 cagttgccat tagagcaaca aaagagagta ctgggtgagg agctttatcc aaaggttgtt 1680 gctactaaca agacccaaga tccagaagct gcaggtaaaa tcactggtat gatcttggat 1740 ttggacaacc aagaaatttt gcaactgttg gaagatgaag aacttttcaa cactcatttc 1800 aacgaagctc tccaagctta cgaggagtac aagagtaaga ctgttgaaca gcaacagcaa 1860 gcggatgcac aagcaaacta g 1881 <210> 76 <211> 1821 <212> DNA <213> Komagataella phaffii <400> 76 atgagtgaga aaaacacacg tattgccatt gtttcagacg atagatgcaa acctaagaaa 60 tgtcgtcagg aatgcagaaa atcctgtcct gttgttaaga caggaaagct ttgtattgaa 120 gttgaagcat actccaaaat tgccttcatc agtgagactc tgtgtatagg ttgtggtatt 180 tgtgtgaaaa agtgtccatt tggagcaatt aacattatca atctgcccac taacttggag 240 aaggaggtca cccacagata cagtgccaac tcattcaaat tgcacagatt gccaacacct 300 aggccaggtc aagtcctagg tcttgttgga accaatggta ttgggaaatc caccgcattg 360 aaaattcttg caggtaagca gaaaccaaat ttaggtagat acgacgcgcc acctgactgg 420 gaagaaattt tgaaatactt cagaggaagt gaattgcaaa attattttac caaagttttg 480 gaggacaata ttaaagcaat tattaagcct caatatgttg acaaccttcc aagggcaatc 540 aaaggtcctg ttaataaggt tggtgagctt ttgaaagcca aactggaaag aaaggaagag 600 ggaaagcata tcatccaagt tttggaattg aaacacgtat tgaacagaga agtcgctaag 660 ctttctggtg gtgagcttca aagatttgca attggtatga cttgtgtcca agatgctaat 720 gtgtacatgt ttgatgaacc ttcatcctat ttggatgtta agcaacgttt gaatgctgct 780 cagattatta gatctttgtt gcatgccacc tgttatgtta ttgttgttga gcacgatctg 840 tctgttttgg attatctttc tgattttgtt tgtattttgt atggtgtacc atcggtttac 900 ggtgttgtca ctttgccagc ctctgtcaga gaaggtatca atattttcct tgatggtcat 960 atccctaccg agaatttgag gttcagaact gagtctttaa aattcaaact tacagatgct 1020 tcggactctg tattaattga acaaagtaga gcttttgaat accccaaaat ggttaagact 1080 caaggtgatt tcaagttaac cgtcaacgct ggtgacttct cagactcgga aattattgtg 1140 atgatgggtg aaaatggtac cggtaagacc actttatgta agctgttagc tggtgccatt 1200 gaaggtgatg aaggcaccaa ggtacccaaa ttgaatgttt ctatgaagcc ccaaaagatt 1260 gctccaaaat tcacaggaac agttagacaa ctgttcttga aaaagattag atcatctttc 1320 ttacatccac aattcaacac cgatgtgatg aaacctttaa aagttgacga tgtcattgat 1380 caagaagtcc agcatttgtc tggtggtgaa ttgcaaagag ttgccatcgt cttagcttta 1440 ggaaaagagg cagacatcta cttgattgac gagccatctg cttacttgga ctctgaacag 1500 cgtattatct gttcgaaggt tattagaaga ttcatcctgc attccaagaa aactgctttc 1560 attgtggaac acgatttcat catggccaca tacttagccg ataaagtgat ggtatttgaa 1620 ggtcagcctt ccaagaatgc tgttgctaac cgcccagaaa cccttttgac tggttgtaac 1680 aggttcttga aaaacctgaa cgtcactttc agaagagatc caaactcttt tagacccaga 1740 atcaacaaac tggactccca gatggataga gagcaaaaac tgagtggtaa ttacttcttc 1800 cttgagaaca ctgagttata a 1821 <210> 77 <211> 362 <212> PRT <213> Artificial Sequence <220> <223> vHH expression construct <400> 77 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe 35 40 45 Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu 50 55 60 Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Ser Leu Glu Lys Arg Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu 85 90 95 Val Gln Ala Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg 100 105 110 Thr Phe Thr Ser Phe Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys 115 120 125 Glu Arg Glu Phe Val Ala Ser Ile Ser Arg Ser Gly Thr Leu Thr Arg 130 135 140 Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Val Asp Asn Ala 145 150 155 160 Lys Asn Thr Val Ser Leu Gln Met Asp Asn Leu Asn Pro Asp Asp Thr 165 170 175 Ala Val Tyr Tyr Cys Ala Ala Asp Leu His Arg Pro Tyr Gly Pro Gly 180 185 190 Thr Gln Arg Ser Asp Glu Tyr Asp Ser Trp Gly Gln Gly Thr Gln Val 195 200 205 Thr Val Ser Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 210 215 220 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Glu 225 230 235 240 Val Gln Leu Val Glu Ser Gly Gly Ala Leu Val Gln Pro Gly Gly Ser 245 250 255 Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Pro Val Asn Arg Tyr Ser 260 265 270 Met Arg Trp Tyr Arg Gln Ala Pro Gly Lys Glu Arg Glu Trp Val Ala 275 280 285 Gly Met Ser Ser Ala Gly Asp Arg Ser Ser Tyr Glu Asp Ser Val Lys 290 295 300 Gly Arg Phe Thr Ile Ser Arg Asp Asp Ala Arg Asn Thr Val Tyr Leu 305 310 315 320 Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Asn 325 330 335 Val Asn Val Gly Phe Glu Tyr Trp Gly Gln Gly Thr Gln Val Thr Val 340 345 350 Ser Ser Gly Gly His His His His His His 355 360 <210> 78 <211> 1092 <212> DNA <213> Artificial Sequence <220> <223> vHH Nucleotide Sequence <400> 78 atgagattcc catctatttt caccgctgtc ttgttcgctg cctcctctgc attggctgcc 60 cctgttaaca ctaccactga agacgagact gctcaaattc cagctgaagc agttatcggt 120 tactctgacc ttgagggtga tttcgacgtc gctgttttgc ctttctctaa ctccactaac 180 aacggtttgt tgttcattaa caccactatc gcttccattg ctgctaagga agagggtgtc 240 tctctcgaga agagacaggt tcagctgcag gagtccggtg gtggtctggt tcaagccggt 300 ggttcattaa gattgtcctg tgctgcctct ggtagaactt tcacttcttt cgcaatgggt 360 tggtttagac aagcacctgg aaaagagaga gagtttgttg cttctatctc cagatccggt 420 actttaacta gatacgctga ctctgccaag ggtagattca ctatttctgt tgacaacgcc 480 aagaacactg tttctttgca aatggacaac cttaacccag atgacaccgc agtctattac 540 tgtgccgctg acttgcacag accatacggt ccaggaaccc aaagatccga tgagtacgat 600 tcttggggtc agggaactca agtcactgtc tcttcaggtg gtggatctgg tggtggaggt 660 tcaggtggtg gaggatccgg tggtggtggt tctggtggtg gtggatctgg tggaggtgaa 720 gttcaacttg tcgaatccgg tggtgcactt gtccaacctg gtggatctct tagactttct 780 tgtgccgcct ccggttttcc tgttaaccgt tactctatgc gttggtacag acaagcccct 840 ggaaaagaac gtgaatgggt tgccggaatg tcctcagctg gtgacagatc ctcctacgaa 900 gattctgtga agggacgttt caccatctcc agagatgacg cccgtaacac cgtttacctt 960 caaatgaact cccttaagcc tgaggatact gccgtctact attgtaacgt gaatgtcgga 1020 tttgaatact ggggacaggg aacccaagtt actgtctctt ccggtggaca tcaccaccac 1080 catcactaat ag 1092 <210> 79 <211> 609 <212> PRT <213> Artificial Sequence <220> <223> Human serum albumin expression construct <400> 79 Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Arg Gly Val Phe Arg Arg Asp Ala His Lys Ser Glu Val Ala 20 25 30 His Arg Phe Lys Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu 35 40 45 Ile Ala Phe Ala Gln Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val 50 55 60 Lys Leu Val Asn Glu Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp 65 70 75 80 Glu Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp 85 90 95 Lys Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala 100 105 110 Asp Cys Cys Ala Lys Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln 115 120 125 His Lys Asp Asp Asn Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val 130 135 140 Asp Val Met Cys Thr Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys 145 150 155 160 Lys Tyr Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro 165 170 175 Glu Leu Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys 180 185 190 Cys Gln Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu 195 200 205 Leu Arg Asp Glu Gly Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys 210 215 220 Ala Ser Leu Gln Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val 225 230 235 240 Ala Arg Leu Ser Gln Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser 245 250 255 Lys Leu Val Thr Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly 260 265 270 Asp Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile 275 280 285 Cys Glu Asn Gln Asp Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu 290 295 300 Lys Pro Leu Leu Glu Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp 305 310 315 320 Glu Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser 325 330 335 Lys Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly 340 345 350 Met Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val 355 360 365 Leu Leu Leu Arg Leu Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys 370 375 380 Cys Ala Ala Ala Asp Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu 385 390 395 400 Phe Lys Pro Leu Val Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys 405 410 415 Glu Leu Phe Glu Gln Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu 420 425 430 Val Arg Tyr Thr Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val 435 440 445 Glu Val Ser Arg Asn Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His 450 455 460 Pro Glu Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val 465 470 475 480 Leu Asn Gln Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg 485 490 495 Val Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe 500 505 510 Ser Ala Leu Glu Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala 515 520 525 Glu Thr Phe Thr Phe His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu 530 535 540 Arg Gln Ile Lys Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys 545 550 555 560 Pro Lys Ala Thr Lys Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala 565 570 575 Ala Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe 580 585 590 Ala Glu Glu Gly Lys Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly 595 600 605 Leu <210> 80 <211> 1830 <212> DNA <213> Artificial Sequence <220> <223> Human serum albumin expression construct <400> 80 atgaagtggg ttactttcat ctccttgttg ttcttgttct cctcagctta ctccagaggt 60 gttttcagaa gagatgctca caagtccgag gttgctcaca gattcaagga cttgggtgaa 120 gagaacttca aggctttggt tttgatcgct ttcgctcagt acttgcagca gtgtccattc 180 gaggaccacg ttaagttggt taacgaggtt actgagttcg ctaagacttg tgttgctgac 240 gaatccgctg agaactgtga taagtccttg cacactttgt tcggtgacaa gttgtgtact 300 gttgctactt tgagagaaac ttacggtgag atggctgact gttgtgctaa gcaagagcct 360 gagagaaacg agtgtttctt gcaacacaag gacgacaacc caaacttgcc aagattggtt 420 agaccagagg ttgacgttat gtgtactgct ttccacgaca acgaagagac tttcttgaag 480 aagtacttgt acgagatcgc tagaagacac ccatacttct acgctccaga gttgttgttc 540 ttcgctaaga gatacaaggc tgctttcact gagtgttgtc aggctgctga taaggctgct 600 tgtttgttgc caaagttgga cgagttgaga gatgagggta aggcttcttc cgctaagcag 660 agattgaagt gtgcttcctt gcagaagttc ggagagagag cttttaaggc ttgggctgtt 720 gctagattgt cccagagatt cccaaaggct gagttcgctg aggtttccaa gttggttact 780 gacttgacta aggttcacac agagtgttgt cacggtgact tgttggaatg tgctgatgac 840 agagctgact tggctaagta catctgtgag aaccaggatt ccatctcctc caagttgaaa 900 gaatgttgtg agaagccttt gttggagaag tcccactgta tcgctgaggt tgaaaacgac 960 gaaatgccag ctgacttgcc atctttggct gctgacttcg ttgaatccaa ggacgtctgc 1020 aagaactacg ctgaggctaa ggacgttttc ttgggtatgt tcttgtatga gtacgctaga 1080 agacatccag actactccgt tgttttgttg ttgagattgg ctaagactta cgagactact 1140 ttggagaagt gttgtgctgc tgctgaccca catgagtgtt acgctaaggt tttcgacgag 1200 ttcaagccat tggttgagga accacagaac ttgatcaagc agaactgtga gttgttcgag 1260 cagttgggtg agtacaagtt ccagaacgct ttgttggtta gatacactaa gaaggttcca 1320 caggtttcca ctccaacttt ggttgaggtt tccagaaact tgggtaaggt tggttccaag 1380 tgttgtaagc acccagaggc taagagaatg ccatgtgctg aggactactt gtctgttgtt 1440 ttgaaccagt tgtgtgtctt gcacgaaaag acaccagttt ccgacagagt tactaagtgt 1500 tgtactgaat ccttggttaa cagaagacct tgtttctccg ctttggaggt tgacgagact 1560 tacgttccaa aagagttcaa cgctgagact ttcactttcc acgctgacat ctgtactttg 1620 tccgagaaag agagacagat caagaagcag actgctttgg ttgagttggt taagcacaag 1680 ccaaaggcta caaaagagca gttgaaggct gttatggacg acttcgctgc tttcgttgag 1740 aaatgttgta aggctgacga caaagagact tgtttcgctg aagagggtaa gaagttggtt 1800 gctgcttccc aagctgcttt gggtctgtaa 1830 <210> 81 <211> 1001 <212> DNA <213> Komagataella phaffii <400> 81 catgttggta ttgtgaaata gacgcagatc gggaacactg aaaaataaca gttattattc 60 gagatctaac atccaaagac gaaaggttga atgaaacctt tttgccatcc gacatccaca 120 ggtccattct cacacataag tgccaaacgc aacaggaggg gatacactag cagcagaccg 180 ttgcaaacgc aggacctcca ctcctcttct cctcaacacc cacttttgcc atcgaaaaac 240 cagcccagtt attgggcttg attggagctc gctcattcca attccttcta ttaggctact 300 aacaccatga ctttattagc ctgtctatcc tggcccccct ggcgaggttc atgtttgttt 360 atttccgaat gcaacaagct ccgcattaca cccgaacatc actccagatg agggctttct 420 gagtgtgggg tcaaatagtt tcatgttccc caaatggccc aaaactgaca gtttaaacgc 480 tgtcttggaa cctaatatga caaaagcgtg atctcatcca agatgaacta agtttggttc 540 gttgaaatgc taacggccag ttggtcaaaa agaaacttcc aaaagtcggc ataccgtttg 600 tcttgtttgg tattgattga cgaatgctca aaaataatct cattaatgct tagcgcagtc 660 tctctatcgc ttctgaaccc cggtgcacct gtgccgaaac gcaaatgggg aaacacccgc 720 tttttggatg attatgcatt gtctccacat tgtatgcttc caagattctg gtgggaatac 780 tgctgatagc ctaacgttca tgatcaaaat ttaactgttc taacccctac ttgacagcaa 840 tatataaaca gaaggaagct gccctgtctt aaaccttttt ttttatcatc attattagct 900 tactttcata attgcgactg gttccaattg acaagctttt gattttaacg acttttaacg 960 acaacttgag aagatcaaaa aacaactaat tattcgaaac g 1001 <210> 82 <211> 1000 <212> DNA <213> Komagataella phaffii <400> 82 gcttaaagga ctccatttcc taaaatttca agcagtcctc tcaactaaat ttttttccat 60 tcctctgcac ccagccctct tcatcaaccg tccagccttc tcaaaagtcc aatgtaagta 120 gcctgcaaat tcaggttaca acccctcaat tttccatcca agggcgatcc ttacaaagtt 180 aatatcgaac agcagagact aagcgagtca tcatcaccac ccaacgatgg tgaaaaactt 240 taagcataga ttgatggagg gtgtatggca cttggcggct gcattagagt ttgaaactat 300 ggggtaatac atcacatccg gaactgatcc gactccgaga tcatatgcaa agcacgtgat 360 gtaccccgta aactgctcgg attatcgttg caattcatcg tcttaaacag tacaagaaac 420 tttattcatg ggtcattgga ctctgatgag gggcacattt ccccaatgat tttttgggaa 480 agaaagccgt aagaggacag ttaagcgaaa gagacaagac aacgaacagc aaaagtgaca 540 gctgtcagct acctagtgga cagttgggag tttccaattg gttggttttg aatttttacc 600 catgttgagt tgtccttgct tctccttgca aacaatgcaa gttgataaga catcaccttc 660 caagataggc tatttttgtc gcataaattt ttgtctcgga gtgaaaaccc cttttatgtg 720 aacagattac agaagcgtcc tacccttcac cggttgagat ggggagaaaa ttaagcgatg 780 aggagacgat tattggtata aaagaagcaa ccaaaatccc ttattgtcct tttctgatca 840 gcatcaaaga atattgtctt aaaacgggct tttaactaca ttgttcttac acattgcaaa 900 cctcttcctt ctatttcgga tcaactgtat tgactacatt gatctttttt aacgaagttt 960 acgacttact aaatccccac aaacaaatca actgagaaaa 1000 <210> 83 <211> 991 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 83 gcaaggcaac tgagaaattg aatagtggtt tcaagcccgc tgactttttg tattatctca 60 atgtcggtgt ttcacagtcc ccagaagggg gctttgcctt caagggagac ggaagagaca 120 tcgtcaaccc tggggagaag tatttcaaat ggcgcaagtt cgctaatttt tacgattaag 180 cagtgctgta tggggtagtt aataaatcgg gaatatcctt ctgacgtgac tgtaacaaat 240 ctctttttac gtggtgcgca tactggacag aggcagagtc tcaatttctt cttttgagac 300 aggctactac agcctgtgat tcctcttggt acttggattt gcttttatct ggctccgttg 360 ggaactgtgc ctgggttttg aagtatcttg tggatgtgtt tctaacactt tttcaatctt 420 cttggagtga gaatgcagga ctttgaacat cgtctagctc gttggtaggt gaaccgtttt 480 accttgcatg tggttaggag ttttctggag taaccaagac cgtcttatca tcgccgtaaa 540 atcgctctta ctgtcgctaa taatcccgct ggaagagaag ttcgaacaga agtagcacgc 600 aaagctcttg tcaaatgaga attgttaatc gtttgacagg tcacactcgt gggctatgta 660 cgatcaactt gccggctgtt gctggagaga tgacaccagt tgtggcatgg ccaattggta 720 ttcagccgta ccactgtatg gaaaatgaga ttatcttgtt cttgatctag tttcttgcca 780 ttttagagtt gccacattcg taggtttcag taccaataat ggtaacttcc aaacttccaa 840 cgcagatacc agagatctgc cgatccttcc ccaacaatag gagcttacta cgccatacat 900 atagcctatc tattttcact ttcgcgtggg tgcttctata taaacggttc cccatcttcc 960 gtttcatact acttgaattt taagcactaa a 991 <210> 84 <211> 864 <212> DNA <213> Artificial Sequence <220> <223> promter <400> 84 cttttctttg ggcaaggaaa aatcaagaaa aagcagaggt taaagttttc aggggaatgg 60 caattgcttt atatatggga gaaagttaac tacgtcggtg ctgtaggcgt agagagcgac 120 tggagaatgc gtgatgaggt cgtctctttt cgccccccct tggcggggta aaaattgcac 180 tactgcagaa ttactacacc cctattccga ggagacggag tgcgacaaaa atggtaaagt 240 tcaccctagt ctgcgacttt taattgacgg acaccggcgt ttacatgcga aaaaaactaa 300 agtgcgcgca tttcacggcc gaggggggtc ccacttggga ctgagagggg gtgggatctg 360 aaatcgagga ggtatcaaga ccccccgttt ctcaactccc taatcaaaaa ttacgaagtc 420 ctcgttggaa aggagttaaa ataattaagc ggggtcggac gccataccga ggttatcttg 480 caggcatttt actaatattg gaattcggag ctcaacttgc aaccaggcag ggtttagcta 540 tgtaatcaat gtaatcaata taataaagca ctaccacatc gaaggtttgg gagggaggcc 600 aatagtgtcc cccacagggt gctgatatcg cgattcttgg gtgaggagac acatatttca 660 ctcctctcac caaccaacca agcggctcct cgcaagatga tttatccgat tatccggaca 720 ctatactccc atccagtttg atgccgattt catcgattgt cctaaataat ccttaaatat 780 gtatagaacg gtaccctggg gttacataat ccttatttaa taatccctcc cccaccgctt 840 ttcttttttt ttcttcttat tgtc 864 <210> 85 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 85 aaatggcaga aggatcagcc tggacgaagc aaccagttcc aactgctaag taaagaagat 60 gctagacgaa ggagacttca gaggtgaaaa gtttgcaaga agagagctgc gggaaataaa 120 ttttcaattt aaggacttga gtgcgtccat attcgtgtac gtgtccaact gttttccatt 180 acctaagaaa aacataaaga ttaaaaagat aaacccaatc gggaaacttt agcgtgccgt 240 ttcggattcc gaaaaacttt tggagcgcca gatgactatg gaaagaggag tgtaccaaaa 300 tggcaagtcg ggggctactc accggatagc caatacattc tctaggaacc agggatgaat 360 ccaggttttt gttgtcacgg taggtcaagc attcacttct taggaatatc tcgttgaaag 420 ctacttgaaa tcccattggg tgcggaacca gcttctaatt aaatagttcg atgatgttct 480 ctaagtggga ctctacggct caaacttcta cacagcatca tcttagtagt cccttcccaa 540 aacaccattc taggtttcgg aacgtaacga aacaatgttc ctctcttcac attgggccgt 600 tactctagcc ttccgaagaa ccaataaaag ggaccggctg aaacgggtgt ggaaactcct 660 gtccagttta tggcaaaggc tacagaaatc ccaatcttgt cgggatgttg ctcctcccaa 720 acgccatatt gtactgcagt tggtgcgcat tttagggaaa atttacccca gatgtcctga 780 ttttcgaggg ctacccccaa ctccctgtgc ttatacttag tctaattcta ttcagtgtgc 840 tgacctacac gtaatgatgt cgtaacccag ttaaatggcc gaaaaactat ttaagtaagt 900 ttatttctcc tccagatgag actctccttc ttttctccgc tagttatcaa actataaacc 960 tattttacct caaatacctc caacatcacc cacttaaaca 1000 <210> 86 <211> 549 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 86 aatgatataa acaacaattg agtgacaggt ctactttgtt ctcaaaaggc cataaccatc 60 tgtttgcatc tcttatcacc acaccatcct cctcatctgg ccttcaattg tggggaacaa 120 ctagcatccc aacaccagac taactccacc cagatgaaac cagttgtcgc ttaccagtca 180 atgaatgttg agctaacgtt ccttgaaact cgaatgatcc cagccttgct gcgtatcatc 240 cctccgctat tccgccgctt gctccaacca tgtttccgcc tttttcgaac aagttcaaat 300 acctatcttt ggcaggactt ttcctcctgc cttttttagc ctcaggtctc ggttagcctc 360 taggcaaatt ctggtcttca tacctatatc aacttttcat cagatagcct ttgggttcaa 420 aaaagaacta aagcaggatg cctgatatat aaatcccaga tgatctgctt ttgaaactat 480 tttcagtatc ttgattcgtt tacttacaaa caactattgt tgattttatc tggagaataa 540 tcgaacaaa 549 <210> 87 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 87 attactgttt tgggcaatcc tgttgataag acgcattcta gagttgtttc atgaaagggt 60 tacgggtgtt gattggtttg agatatgcca gaggacagat caatctgtgg tttgctaaac 120 tggaagtctg gtaaggactc tagcaagtcc gttactcaaa aagtcatacc aagtaagatt 180 acgtaacacc tgggcatgac tttctaagtt agcaagtcac caagagggtc ctatttaacg 240 tttggcggta tctgaaacac aagacttgcc tatcccatag tacatcatat tacctgtcaa 300 gctatgctac cccacagaaa taccccaaaa gttgaagtga aaaaatgaaa attactggta 360 acttcacccc ataacaaact taataatttc tgtagccaat gaaagtaaac cccattcaat 420 gttccgagat ttagtatact tgcccctata agaaacgaag gatttcagct tccttacccc 480 atgaacagaa atcttccatt taccccccac tggagagatc cgcccaaacg aacagataat 540 agaaaaaaga aattcggaca aatagaacac tttctcagcc aattaaagtc attccatgca 600 ctccctttag ctgccgttcc atccctttgt tgagcaacac catcgttagc cagtacgaaa 660 gaggaaactt aaccgatacc ttggagaaat ctaaggcgcg aatgagttta gcctagatat 720 ccttagtgaa gggttgttcc gatacttctc cacattcagt catagatggg cagctttgtt 780 atcatgaaga gacggaaacg ggcattaagg gttaaccgcc aaattatata aagacaacat 840 gtccccagtt taaagttttt ctttcctatt cttgtatcct gagtgaccgt tgtgtttaat 900 ataacaagtt cgttttaact taagaccaaa accagttaca acaaattata acccctctaa 960 acactaaagt tcactcttat caaactatca aacatcaaaa 1000 <210> 88 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 88 gtcaactgcg tactcttttg tcgaatggac tactgaatct gcctcgatag ccactatagg 60 aaggtccata gaggccagtt tttcaactag tcttggtgga aagaaaccga caaagccttt 120 catggagtca ccgatactga aaggttcaaa caaagaatgc ttgggtagtc tcttaatacc 180 catggcaacg aaaaaggggt cttcattgtt caacatgaat tcgtatccac ctttaatgta 240 gtcataaagc tgctgaagtt ccgaatcagt gatggaactg tctacagtga caatatagga 300 gttctcaatc accttatatc cagtcgaata tatctggata gggtcgggtc tcactgtgga 360 agattcaaat gggttagatc cctgtaattt cagcgatgga gactcagtat gatggggcaa 420 ggaaaacggc aattggatat tcaattggtc aagagatggt atcaaaagcg agtgtgccag 480 ggtagccacg gtagccactg atgctaatct gataattttc atttctggag tgtcaaaaca 540 gtagtgataa aaggctatga aggaggttgt ctaggggctc gcggaggaaa gtgattcaaa 600 cagacctgcc aaaaagagaa aaaagaggga atccctgttc tttccaatgg aaatgacgta 660 actttaactt gaaaaatacc ccaaccagaa gggttcaaac tcaacaagga ttgcgtaatt 720 cctacaagta gcttagagct gggggagaga caactgaagg cagcttaacg ataacgcggg 780 gggattggtg cacgactcga aaggaggtat cttagtcttg taacctcttt tttccagagg 840 ctattcaaga ttcataggcg atatcgatgt ggagaagggt gaacaatata aaaggctgga 900 gagatgtcaa tgaagcagct ggatagattt caaattttct agatttcaga gtaatcgcac 960 aaaacgaagg aatcccacca agcaaaaaaa aaaatctaag 1000 <210> 89 <211> 704 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 89 aaattaatcc ataagataag gcaaatgtgc ttaagtaatt gaaaacagtg ttgtgattat 60 ataagcatgg tatttgaata gaactactgg ggttaactta tctagtagga tggaagttga 120 gggagatcaa gatgcttaaa gaaaaggatt ggccaatatg aaagccataa ttagcaatac 180 ttatttaatc agataattgt ggggcattgt gacttgactt ttaccaggac ttcaaacctc 240 aaccatttaa acagttatag aagacgtacc gtcacttttg cttttaatgt gatctaaatg 300 tgatcacatg aactcaaact aaaatgatat cttttactgg acaaaaatgt tatcctgcaa 360 acagaaagct ttcttctatt ctaagaagaa catttacatt ggtgggaaac ctgaaaacag 420 aaaataaata ctccccagtg accctatgag caggattttt gcatccctat tgtaggcctt 480 tcaaactcac acctaatatt tcccgccact cacactatca atgatcactt cccagttctc 540 ttcttcccct attcgtacca tgcaaccctt acacgccttt tccatttcgg ttcggatgcg 600 acttccagtc tgtggggtac gtagcctatt ctcttagccg gtatttaaac atacaaattc 660 acccaaattc taccttgata aggtaattga ttaatttcat aaat 704 <210> 90 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 90 agctcagatt ggaaatgatt tttgatccta ccaagaagcc tttgatttcc agaatctccg 60 ctaagtaagt aacccccgca aacgcatgca tccatgcaaa caaaatacta acaattttag 120 ccccgttgtt gagaaaccca gaaaattgaa tgttcaacca atccagacga tcaataagaa 180 aaaaggccca aaggctactt ccaaacctgc tgccgccaaa cctgctcctt caaaagccgg 240 tcccaaggga ggtaagaagg tgagaaagcc aaagaagaca gttgaagaat tggatcagga 300 aatggctgac tactttgaaa ataagaatta gcccaacaaa atatgtacaa gtattatata 360 aatgaatcta catggtgtgt tttatttaga tcctccaaac caaggaaaga aactaaactt 420 atctccggac ttacgagtca aataactatc cgcagttcct tggaactcag actttcttcc 480 ataagcggtc atatcatctt tggactgtgg gaatcctgga cgaatctttg aaatgtcata 540 atcttgctct ctatctccaa gcacagcgtc cggtaaatgc tggttcttct ttctcagatg 600 aatcttggat ttaacaaata aagccgtgcc tatggctaat gtactcaaaa acaaagtctg 660 cttccagaat ttcgcaaacg atggaatgcc atttcctgta aatgtactca ttgaacctat 720 gtttgattaa agttggtgtg aagtcatcaa acgagagtaa aatcagatac tcgtgcaccg 780 gccaaaattg actgagctaa tctctgcagg cttgacatcc gaacacaaca aataggcgac 840 aaatcttaac tatctaatcg taggctatgg tagaactttg tgggggtaga ggaagactac 900 aacagcaaga caaaacaaaa gagtcatagt ttgactctct gcttttttct tctttctctt 960 ctttttcttc ctccatattc gttatttatt tcgaactgga 1000 <210> 91 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 91 cagccattaa tctcacctca gtttttgaat cagtagaatt tttaatgaaa caaacggttg 60 gtatattatt tgatagagtt gccaaatttc caaagataaa tttttcatca ggtaatatcc 120 tgaataccgt aacatagtga ctattggaag acactgctat catattatat ttcggataaa 180 aatccaaacc ccagaccgac ctcttgagtc tcaactccaa gtcagccgca actttaatta 240 tccgtggatt gggagctagt ttggacaacg catcagtata atataacttt acggttccat 300 tatcagacgc tattgcaaga acttcctttc cattgatctc gccaatgcgg cagtaattga 360 tatcgtaggg taggtctgga aagacgctgg cgcttgtgtc ccattctgca ggaatctctg 420 gcacggtgct aatggtagtt atccaacgga gctgaggtag tcgatatatc tggatatgcc 480 gcctatagga taaaaacagg agagggtgaa ccttgcttat ggctactaga ttgttcttgt 540 actctgaatt ctcattatgg gaaactaaac taatctcatc tgtgtgttgc agtactattg 600 aatcgttgta gtatctacct ggagggcatt ccatgaatta gtgagataac agagttgggt 660 aactagagag aataatagac gtatgcatga ttactacaca acggatgtcg cactctttcc 720 ttagttaaaa ctatcatcca atcacaagat gcgggctgga aagacttgct cccgaaggat 780 aatcttctgc ttctatctcc cttcctcata tggtttcgca gggctcatgc cccttcttcc 840 ttcgaactgc ccgatgagga agtccttagc ctatcaaaga attcgggacc atcatcgatt 900 tttagagcct tacctgatcg caatcaggat ttcactactc atataaatac atcgctcaaa 960 gctccaactt tgcttgttca tacaattctt gatattcaca 1000 <210> 92 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 92 tggttccctc tcggtccaat accaaaaata ttatcaccat acaggtctcc cttcgatacc 60 agtgcaaagt tgaaccgtgg gattaccttg gaatctacaa aaatagtgtc actcacaagt 120 ttgtcatcaa ccacgctgcc gcttgcaaag gagaactgaa catgaaggtt gttagggttt 180 gttatattgg aataagtggt ggatttgttg aaggcgaacg caccaaagct acatccgtcc 240 tgagcacact gtgaatttgt cacggaattg accaagaggt cagacgatcc tgtatcccat 300 tgagccgtta tgctttgtgg gggaaaccct atttctatcg tactaagaaa accaatggtg 360 aactcatatt cggtatcaat ggcgacgatt ccagcatagc ctgtagacag taacaacact 420 agggcaacag caactaacat atcttcattg atgaaacgtt gtgatcggtg tgacttttat 480 agtaaaagct acaactgttt gaaataccaa gatatcattg tgaatggctc aaaagggtaa 540 tacatctgaa aaacctgaag tgtggaaaat tccgatggag ccaactcatg ataacgcaga 600 agtcccattt tgccatcttc tcttggtatg aaacggtaga aaatgatccg agtatgccaa 660 ttgatactct tgattcatgc cctatagttt gcgtagggtt taattgatct cctggtctat 720 cgatctggga cgcaatgtag accccattag tggaaacact gaaagggatc caacactcta 780 ggcggacccg ctcacagtca tttcaggaca atcaccacag gaatcaacta cttctcccag 840 tcttccttgc gtgaagcttc aagcctacaa cataacactt cttacttaat ctttgattct 900 cgaattgttt acccaatctt gacaacttag cctaagcaat actctggggt tatatatagc 960 aattgctctt cctcgctgta gcgttcattc catctttcta 1000 <210> 93 <211> 1001 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 93 gatatcgatc tacacttaat agtagatgac gaggcatctc tccaataggt accatatctg 60 gtgtttcttg taatttaaga atctgttggt ctatgaatgt agatttgtca tgaacaatga 120 tatatgggtc aggaggacaa gatggtttct ctgagttggg ttgttgaggt gcctggcaag 180 acttcggagc gttgatatcc ccaagacttg tagtgaccga tagttgaagc gtgtgtttgc 240 aggaacggca catcaatgca actttcgtaa ctttggaatt gagagttgat gcactgatga 300 cgatacccga aattttgacg attttaccaa tatgacttga agacaagtct ctcattgaaa 360 ccttattatc gttactaagc aaaacgagct gacaagaagg gaaggtggtc ggtatttcct 420 cgttgttcaa atatatgatt ctcctggcaa tatctgtgat ggcctgttca aaaagtggaa 480 tcatttctgc aggatcatct accaactttt tattgagctc ctcattgaat acgattaagt 540 ggtcattttg aatcgtcagt aagtacttgt ttacaagtaa attctgtctg agttgttctc 600 tgtagatgta ctgattttcc atacgaaact ccaaaatgaa cgaacggaat gccttaatga 660 cctcactgaa ctggtcatcg ttctgttctc cgggaaggac acttgtgtta aagactgatg 720 ctctatcaaa ggacattgca acaaagtata aacggttgtg agcgggaaaa agatgtgtag 780 gtaattgtcg tagatgagac tgattcagta gaaaacgcgt cctgcactat ttttttcttt 840 cttcattaca tttcctaatc gggacaaaat gaatctaaag acgtggttat gtagtacacg 900 catcgatagg ctatccccat accaaaacac tattttaccc catccttgac aggttataaa 960 tatgcgatag tatgagtatc ttcaaattca gctgaaatat c 1001 <210> 94 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 94 aataaaaaaa cgttatagaa agaaattgga ctacgatatg ctccaatcca aattgtcaaa 60 attgaccacc gaaaaagaac aattggaatt tgacaagagg aacaactcac tagattctca 120 aacggagcgt cacctagagt cagtttccaa gtcaattaca gaaagtttgg aaacagaaga 180 ggagtatcta caattgaatt ccaaacttaa agtcgagctg tccgaattca tgtcgctaag 240 gctttcttac ttggacccca tttttgaaag tttcattaaa gttcagtcaa aaattttcat 300 ggacatttat gacacattaa agagcggact accttatgtt gattctctat ccaaagagga 360 ttatcagtcc aagatcttgg actctagaat agataacatt ctgtcgaaaa tggaagcgct 420 gaaccttcaa gcttacattg atgattagag caatgatata aacaacaatt gagtgacagg 480 tctactttgt tctcaaaagg ccataaccat ctgtttgcat ctcttatcac cacaccatcc 540 tcctcatctg gccttcaatt gtggggaaca actagcatcc caacaccaga ctaactccac 600 ccagatgaaa ccagttgtcg cttaccagtc aatgaatgtt gagctaacgt tccttgaaac 660 tcgaatgatc ccagccttgc tgcgtatcat ccctccgcta ttccgccgct tgctccaacc 720 atgtttccgc ctttttcgaa caagttcaaa tacctatctt tggcaggact tttcctcctg 780 ccttttttag cctcaggtct cggttagcct ctaggcaaat tctggtcttc atacctatat 840 caacttttca tcagatagcc tttgggttca aaaaagaact aaagcaggat gcctgatata 900 taaatcccag atgatctgct tttgaaacta ttttcagtat cttgattcgt ttacttacaa 960 acaactattg ttgattttat ctggagaata atcgaacaaa 1000 <210> 95 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 95 attgttgtga atactctcct tcatttggat ttcttggact tcggactctc ttgatctctc 60 ttcgaaagtt ttaactctgt tcatgtataa ttttacccgc tgtaggtcgc tcataatacc 120 atgagtatgc acatctttta ctccattaac tttcaggtat gcaaaataca atgaagatag 180 tatatagctc aaagaattta gcattttgca ttgatctaat tgtgacattt tctctatgat 240 atcatctagc ttcttaaact cgagaatctc gtccaacgag gcagaaacat tgtccagtct 300 tacgtcaaga ttattcacga gtttctggac cgtatcaacg ttttccatct taagattaca 360 gtaagtatcg tccttttgaa ctgcaaaggt agaaaagtta atttttgatt tggtagtaca 420 ctatgaaact tgctcacccc aatctttcct cctgacaggt tgatctttat ccctctacta 480 aattgcccca agtgtatcaa gtagactaga tctcgcgaaa gaacagccta ataaactccg 540 aagcatgatg gcctctatcc ggaaaacgtt aagagatgtg gcaacaggag ggcacataga 600 atttttaaag acgctgaaga atgctatcat agtccgtaaa aatgtgatag tactttgttt 660 agtgcgtacg ccacttattc ggggccaata gctaaaccca ggtttgctgg cagcaaattc 720 aactgtagat tgaatctctc taacaataat ggtgttcaat cccctggctg gtcacgggga 780 ggactatctt gcgtgatccg cttggaaaat gttgtgtatc cctttctcaa ttgcggaaag 840 catctgctac ttcccatagg caccagttac ccaattgata tttccaaaaa agattaccat 900 atgttcatct agaagtataa atacaagtgg acattcaatg aatatttcat tcaattagtc 960 attgacactt tcatcaactt actacgtctt attcaacaat 1000 <210> 96 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 96 tatacggtct atccactttg gaaacgatgt agttgaaacg gggaagtaat agtggttccc 60 aaacgacatg aagaggttat ataagtttgc aagagggtga caccatttta gttgtggttc 120 ccgggtattt ttttaatctt tttagtctaa gatagcctcc ccagatatta ccgagttggg 180 ccatttgggg cggtatcggt ggtatctgat ggtagcgcgt ttttacatgc ctgtgcattg 240 aactggcaaa gagtatacta tcgtggggcc ctgaaggagg cagcaaatgg accgtcaatt 300 ggttgatcag ggactcaaga caggtattga gcttttcaaa caaaaagagt ataggcgctg 360 ctacaaggca tttacttcta ctatcaattt cattgagaat gatcccgagt tggccgccag 420 ctgtgtatct caactgatat ctctgttaga ttgtagggca gcctgtttgg aaaagctaga 480 tcaattgaat atggccttga aagatggtct taaaatgatc aagagagagt gccacaactg 540 caagggttat ttgagaactt gcaaaatttt agacctacaa gggaagatca gtgaggcttt 600 gtctacagca agagaaggga tctccataat agaaactaga agagatcagg ataatcaatt 660 tagatattcc aaggttcttt tggaacaatt aaaggaactg aaaaatgcac tgaaaatcaa 720 attggacaag aaaaatcagc tacacttcaa agttttaaag tttgacgcac cagtgccttg 780 tacaaagaaa ctaagattag tcactccaag aacaatagat ccttccattt ttttgccgat 840 agagctagtg aagctgatct ttcgcctgtt gaatttctca gacatgtatg cctgtttatt 900 ggtctcaaca aaatggaact caattatatc ctcatcaccg gaactgtttc gaaaacttca 960 gttgaaatcc caactgtcca acaaggcgtt aaacaattgt 1000 <210> 97 <211> 951 <212> DNA <213> Artificial Sequence <220> <223> pG1 promoter <220> <221> misc_feature <222> (578)..(578) <223> n...(T)x wherein x is 14-16 <400> 97 caaacatttg ctccccctag tctccaggga aatgtaaaat atactgctaa tagaaaacag 60 taagacgctc agttgtcagg ataattacgt tcgactgtag taaaacagga atctgtattg 120 ttagaaagaa cgagagtttt ttacggcgcc gccatattgg gccgtgtgaa aacagcttga 180 aaccccacta ctttcaaagg ttctgttgct atacacgaac catgtttaac caacctcgct 240 tttgacttga ctgaagtcat cggttaacaa tcaagtaccc tagtctgtct gaatgctcct 300 ttccatattc agtaggtgtt tcttgcactt ttgcatgcac tgcggaagaa ttagccaata 360 gcgcgtttca tatgcgcttt taccccctct tttgtcaagc gcaaaatgcc tgtaagattt 420 ggtgggggtg tgagccgtta gctgaagtac aacaggctaa ttccctgaaa aaactgcaga 480 tagacttcaa gatctcaggg attcccacta tttggtattc tgatatgttt ttcctgatat 540 gcatcaaaac tctaatctaa aacctgaatc tccgctanga tgaccccgtt ttcgtgacaa 600 attaatttcc aacggggtct tgtccggata agagaatttt gtttgattat ccgttcggat 660 aaatggacgc ctgctccata tttttccggt tattacccca cctggaagtg cccagaattt 720 tccggggatt acggataata cggtggtctg gattaattaa tacgccaagt cttacatttt 780 gttgcagtct cgtgcgagta tgtgcaataa taaacaagat gagccaattt attggattag 840 ttgcagcttg accccgccat agctaggcat agccaagtgc tatgggtgtt agatgatgca 900 cttggatgca gtgagttttg gagtataaaa gatccttaaa attccaccct t 951 <210> 98 <211> 1238 <212> DNA <213> Artificial Sequence <220> <223> pG1-3 promoter <400> 98 caaacatttg ctccccctag tctccaggga aatgtaaaat atactgctaa tagaaaacag 60 taagacgctc agttgtcagg ataattacgt tcgactgtag taaaacagga atctgtattg 120 ttagaaagaa cgagagtttt ttacggcgcc gccatattgg gccgtgtgaa aacagcttga 180 aaccccacta ctttcaaagg ttctgttgct atacacgaac catgtttaac caacctcgct 240 tttgacttga ctgaagtcat cggttaacaa tcaagtaccc tagtctgtct gaatgctcct 300 ttccatattc agtaggtgtt tcttgcactt ttgcatgcac tgcggaagaa ttagccaata 360 gcgcgtttca tatgcgcttt taccccctct tttgtcaagc gcaaaatgcc tgtaagattt 420 ggtgggggtg tgagccgtta gctgaagtac aacaggctaa ttccctgaaa aaactgcagc 480 tcagggattc ccactatttg gtattctgat atgtttttcc tgatatgcat caaaactcta 540 atctaaaacc tgaatctccg ctattttttt tttttttgat gaccccgttt tcgtgacaaa 600 ttaatttcca acggggtctt gtccggataa gagaattttg tttgattatc cgttcggata 660 aatggacgcc tgctccatat ttttccggtt attaccccac ctggaagtgc ccagaatttt 720 ccggggatta cggataatac ggtggtctgg attaattaat acgagatctc agggattccc 780 actatttggt attctgatat gtttttcctg atatgcatca aaactctaat ctaaaacctg 840 aatctccgct attttttttt tttttgatga ccccgttttc gtgacaaatt aatttccaac 900 ggggtcttgt ccggataaga gaattttgtt tgattatccg ttcggataaa tggacgcctg 960 ctccatattt ttccggttat taccccacct ggaagtgccc agaattttcc ggggattacg 1020 gataatacgg tggtctggat taattaatac gccaagtctt acattttgtt gcagtctcgt 1080 gcgagtatgt gcaataataa acaagatgag ccaatttatt ggattagttg cagcttgacc 1140 ccgccatagc taggcatagc caagtgctat gggtgttaga tgatgcactt ggatgcagtg 1200 agttttggag tataaaagat ccttaaaatt ccaccctt 1238 <210> 99 <211> 1425 <212> DNA <213> Artificial Sequence <220> <223> pG1-4 promoter <400> 99 caaacatttg ctccccctag tctccaggga aatgtaaaat atactgctaa tagaaaacag 60 taagacgctc agttgtcagg ataattacgt tcgactgtag taaaacagga atctgtattg 120 ttagaaagaa cgagagtttt ttacggcgcc gccatattgg gccgtgtgaa aacagcttga 180 aaccccacta ctttcaaagg ttctgttgct atacacgaac catgtttaac caacctcgct 240 tttgacttga ctgaagtcat cggttaacaa tcaagtaccc tagtctgtct gaatgctcct 300 ttccatattc agtaggtgtt tcttgcactt ttgcatgcac tgcggaagaa ttagccaata 360 gcgcgtttca tatgcgcttt taccccctct tttgtcaagc gcaaaatgcc tgtaagattt 420 ggtgggggtg tgagccgtta gctgaagtac aacaggctaa ttccctgaaa aaactgcagc 480 tcagggattc ccactatttg gtattctgat atgtttttcc tgatatgcat caaaactcta 540 atctaaaacc tgaatctccg ctattttttt tttttttgat gaccccgttt tcgtgacaaa 600 ttaatttcca acggggtctt gtccggataa gagaattttg tttgattatc cgttcggata 660 aatggacgcc tgctccatat ttttccggtt attaccccac ctggaagtgc ccagaatttt 720 ccggggatta cggataatac ggtggtctgg attaattaat acgccaagtc ttacattttg 780 ttgcagtctc gtgcgagtat gtgcaataat aaacaagatg agccaattta ttggattagt 840 tgcagcttga ccccgccata gctaggcata gccaagtgct atgggtgtta gatgatgcac 900 ttggatgcag tgagttttgg agtataaaag atccttaaaa ttccaccctt agatctcagg 960 gattcccact atttggtatt ctgatatgtt tttcctgata tgcatcaaaa ctctaatcta 1020 aaacctgaat ctccgctatt tttttttttt ttgatgaccc cgttttcgtg acaaattaat 1080 ttccaacggg gtcttgtccg gataagagaa ttttgtttga ttatccgttc ggataaatgg 1140 acgcctgctc catatttttc cggttattac cccacctgga agtgcccaga attttccggg 1200 gattacggat aatacggtgg tctggattaa ttaatacgcc aagtcttaca ttttgttgca 1260 gtctcgtgcg agtatgtgca ataataaaca agatgagcca atttattgga ttagttgcag 1320 cttgaccccg ccatagctag gcatagccaa gtgctatggg tgttagatga tgcacttgga 1380 tgcagtgagt tttggagtat aaaagatcct taaaattcca ccctt 1425 <210> 100 <211> 491 <212> DNA <213> Komagataella phaffii <400> 100 cttttttgta gaaatgtctt ggtgtcctcg tccaatcagg tagccatctc tgaaatatct 60 ggctccgttg caactccgaa cgacctgctg gcaacgtaaa attctccggg gtaaaactta 120 aatgtggagt aatggaacca gaaacgtctc ttcccttctc tctccttcca ccgcccgtta 180 ccgtccctag gaaattttac tctgctggag agcttcttct acggccccct tgcagcaatg 240 ctcttcccag cattacgttg cgggtaaaac ggaggtcgtg tacccgacct agcagcccag 300 ggatggaaaa gtcccggccg tcgctggcaa taatagcggg cggacgcatg tcatgagatt 360 attggaaacc accagaatcg aatataaaag gcgaacacct ttcccaattt tggtttctcc 420 tgacccaaag actttaaatt taatttattt gtccctattt caatcaattg aacaactatc 480 acctgcaggc c 491 <210> 101 <211> 488 <212> DNA <213> Komagataella phaffii <400> 101 cttttttgta gaaatgtctt ggtgtcctcg tccaatcagg tagccatctc tgaaatatct 60 ggctccgttg caactccgaa cgacctgctg gcaacgtaaa attctccggg gtaaaactta 120 aatgtggagt aatggaacca gaaacgtctc ttcccttctc tctccttcca ccgcccgtta 180 ccgtccctag gaaattttac tctgctggag agcttcttct acggccccct tgcagcaatg 240 ctcttcccag cattacgttg cgggtaaaac ggaggtcgtg tacccgacct agcagcccag 300 ggatggaaaa gtcccggccg tcgctggcaa taatagcggg cggacgcatg tcatgagatt 360 attggaaacc accagaatcg aatataaaag gcgaacacct ttcccaattt tggtttctcc 420 tgacccaaag actttaaatt taatttattt gtccctattt caatcaattg aacaactatc 480 aaaacaca 488 <210> 102 <211> 985 <212> DNA <213> Komagataella phaffii <400> 102 agggcatcat tgaggtttcc acaaaaggaa gaaacatgga tccagagaca tcaacagaga 60 ggaaagcggg tagtgaagcc gaagccacaa cacagcccga tttggaaggg agttcacaat 120 caaggtgagt ccagccattt tttttctttt tttttttttt attcaggtga acccacctaa 180 ctatttttaa ctgggatcca gtgagctcgc tgggtgaaag ccaaccatct tttgtttcgg 240 ggaaccgtgc tcgccccgta aagttaattt ttttttcccg cgcagcttta atctttcggc 300 agagaaggcg ttttcatcgt agcgtgggaa cagaataatc agttcatgtg ctatacaggc 360 acatggcagc agtcactatt ttgcttttta accttaaagt cgttcatcaa tcattaactg 420 accaatcaga ttttttgcat ttgccactta tctaaaaata cttttgtatc tcgcagatac 480 gttcagtggt ttccaggaca acacccaaaa aaaggtatca atgccactag gcagtcggtt 540 ttatttttgg tcacccacgc aaagaagcac ccacctcttt taggttttaa gttgtgggaa 600 cagtaacacc gcctagagct tcaggaaaaa ccagtacctg tgaccgcaat tcaccatgat 660 gcagaatgtt aatttaaacg agtgccaaat caagatttca acagacaaat caatcgatcc 720 atagttaccc attccagcct tttcgtcgtc gagcctgctt cattcctgcc tcaggtgcat 780 aactttgcat gaaaagtcca gattagggca gattttgagt ttaaaatagg aaatataaac 840 aaatataccg cgaaaaaggt ttgtttatag cttttcgcct ggtgccgtac ggtataaata 900 catactctcc tcccccccct ggttctcttt ttcttttgtt acttacattt taccgttccg 960 tcactcgctt cactcaacaa caaaa 985 <210> 103 <211> 975 <212> DNA <213> Komagataella phaffii <400> 103 gtagcttggg taggacttga caagtacggc ttccgtggtc ataccaaacg cctttgttac 60 cgttggctat acctaatgac caaggcattt gtggattata acggtatcgt agttgaaaaa 120 tatgacgtaa ccactggtac tagcccccac aaggttgatg ctgaatacgg gaatcaaggt 180 gccgatttta aaggagtagc cactgaaggg tttggctggg tcaatgcctc ttttattttg 240 ggattaacct acttagatgt ccaaggcatc cgtgcgatag gcgccgttac gtcccctgat 300 gtatttttca ggaagctcaa accttgggaa cgcgcaagtt atggcctaag gccatgtaac 360 gagatagtca agtcaaacta gaagtatacg gtttccccgc agaaatagca gaaataggcg 420 acaaatacat acaacatttt cattgtgata gggggcggcg gttcctagga gggacaaccc 480 ccagaaacct tgtagactac gttttcacga cgatgggtta ttactgtaaa ggaagaatat 540 actacccacc agttgaatgt ttgaacggat caaaggtcga agggagtaca cggcccaacc 600 aacgtagcta ccggagaaag caagactttc ccaaaccaaa tagctccggg tttcttctcc 660 ggcaacccgt cagtttttgt gtggccggac aaaaattcgc accctcagtc taattgaaag 720 gtcgggctcc gagctctagg cgtttgcgca tgtaatattg catcccctcc catagataat 780 actgcgcgaa cacagggtgc aaattatgat gaccacacat gccagtgacc aaaacagttt 840 tttagtcttt aaaaaccctc ggaacttctg agtatataaa ggcttctcat ttcctacaag 900 caaacaaaga agaaacttcc actttctaac tttttatcta tagactttag agttacaacc 960 aacgaacaat aacaa 975 <210> 104 <211> 699 <212> DNA <213> Komagataella phaffii <400> 104 cgcattattt gggtcggcta ctgtcattgg ttatgatggc cttaccgagc acgaaggtgg 60 ttggatagac cacaactgga aacagttgta caaacagatt gcattcattt ttgcttgtat 120 tggatactcg atggccatca ccgctcttat ctgtttcatc ctcaaccgta ttccattttt 180 gcaactgcga gcttcagaag aggctgagga gaaaggtatg gatgaggatc agattggaga 240 gttcgcttat gactacgtgg aagtacgtcg tgattttttg gcttggggat caggcccaaa 300 caatggcttc aaggagccgg aagttctgga tcaggtagtt ccggttaatg atttcagcag 360 tgaccagaat gtgactaatc agaccaacga atctgagaag cagtagagta aatatagaga 420 tgatatttag tgtattctaa tgcttatgta atgtattaag caaaaagttg tgtttatgag 480 ttagcatttg tcttagcaaa cataaaatta tgtcgacatt tgcaacccgc atgtctagtg 540 tttttagatc gatcttcgat gtgtagaata atgcctccac gtgatgcccc gcgattttgt 600 tgggtcgcaa tgcctccaac ataaacccat cacgtataaa aagccctctt aaccctcccc 660 cctgtttcgt ttgcttcatc acttaacctg aactatcaa 699 <210> 105 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> pG3 promoter <400> 105 gtaaatagcg gcagcaatcc agtaaccttt tctgaatagc agagccttaa ctaaaataat 60 ggccagggta aaaaattcga aatttgacac caaaaataaa gacttgtcgt tataagtctt 120 aacaaagtcc gcaattttgg agctaacggt ggcggttgct gggatattca ataatggtag 180 aatgttgctg cgggtatatg acagagcgtg aaacacactg aacaaggtaa atggaacaac 240 agcaattgca atatggggga ggatagtcaa gaacaaagca gcaatggcaa agtactgaat 300 attctccaaa gccaaaaggt ccagtggttt caacgacaaa gtcttgttgg tatagctttg 360 gaacaaaagg acaccgaaag actcgacagc gcccacaaat acagcgttgt agaagaacga 420 attgattgct ccagagcttc taatagtcag aagatacccc aaacctccga gcaacgttag 480 cacatgacct aagaaccagg cgaagtgaag agtctggaat aacgacaccc agtcagtttt 540 tcctgagctc ctggtgggat tggtagaagc atttgatttg cttggagtgg ttttatttga 600 agatggtgtt gaagccattg ttgctaaaga gtcggagttt tgcttttagg gtttgttaag 660 caaaggagga aaaactgcgc cgtttgaagt cccaggtagt ttcgcgtgtg aggccagcca 720 gggaaagctt ccttcggtac ttttttttct tttgcaggtt ccggacggat taagcttcgg 780 gttatgaggg gggcggtagc caattccgga cacaatattg cgtcgcagct agtcaccccg 840 ccataaatat acgcaggatt gaggtaataa catcgatagt cttagtaatt aatacaattc 900 agtggcgaat ttggcaacat gacgtaaggc ccactgttgt ctataaaagg ggatgaattt 960 tcatgttttt gaggcctccc ggacaattta ttgaactcaa 1000 <210> 106 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> pG4 promoter <400> 106 tggactgttc aatttgaagt cgatgctgac gatgtcaaga gagatgctca attatatttg 60 tcatttgctg gttacactgg aaacgctact tttgttggcg gaaactctac cagtttggcc 120 gtccatgtaa acgatgtcgt tctgggccgt gaccgtttca acacgaacat aaccaatgac 180 aaatccactt acaggtctag ttcatatgga ggcaattggt accttacttc tttggatgtc 240 ccaagtgggg ctttaacgtc tggtactaac aatgtctcgt ttgtcactac aaactccgag 300 gtaaataaag gattcttgtg ggattctctc aagtttgttt ggaagttgta acaggtttat 360 aagcatatcg tgcgcttgtc cacaattgaa tcatttattg ttgcgagata catgaacaaa 420 gtgtgaactg ggacccatta ctacaattcc cacgcaaccg ttgtttcaaa gcccatattt 480 tttgacaatt gtttcgttac acccccagtt tgatgtacat cgcttgcaat gatgtgtgtc 540 ccggagtatt ttccatattc agcttgaatt cgtatactca accaatatct gggggtatac 600 ttttatgtaa cctatacaaa tcaactatac tatttcacct ttcgaccaat catctcccat 660 cttgttaagt tttgcttcct atatccctga ccctgacatc acccatgatt ccgctcaacg 720 gttctcctct acatcgtccc tcttttggag agggtgttca gtttgacatt caaattaccc 780 cccgccatca cgcgcaaccg agaccgcacc cccgaatttt cacaaattac cccacaccct 840 atactccacc actatgaggg ttattagaac tgatcacgta taaataccac cgcaagttcc 900 caagggatcg tgttcttctt ctccaattgc aatcatattt ctgactcttt ctagttcaga 960 ttaattcctt tacacttgct tttttccctt acctttatcc 1000 <210> 107 <211> 1001 <212> DNA <213> Artificial Sequence <220> <223> pG5 promoter <400> 107 agaccagcag tttaactacg caaatccaca ggaatttcta catcacaata ccaatggtaa 60 taccacgacg tcaaggaatg gaaacgacga cttggaggaa gacttcgtca acctcttgcg 120 gagtacccga ggctaagaca ataagaagaa aaaaaaaaga aaagcggtgg gggagggatt 180 attaaataag gattatgtaa ccccagggta ccgttctata catatttaag gattatttag 240 gacaatcgat gaaatcggca tcaaactgga tgggagtata gtgtccggat aatcggataa 300 atcatcttgc gaggagccgc ttggttggtt ggtgagagga gtgaaatatg tgtctcctca 360 cccaagaatc gcgatatcag caccctgtgg gggacactat tggcctccct cccaaacctt 420 cgatgtggta gtgctttatt atattgatta cattgattac atagctaaac cctgcctggt 480 tgcaagttga gctccgaatt ccaatattag taaaatgcct gcaagataac ctcggtatgg 540 cgtccgaccc cgcttaatta ttttaactcc tttccaacga ggacttcgta atttttgatt 600 agggagttga gaaacggggg gtcttgatac ctcctcgatt tcagatccca ccccctctca 660 gtcccaagtg ggacccccct cggccgtgaa atgcgcgcac tttagttttt ttcgcatgta 720 aacgccggtg tccgtcaatt aaaagtcgca gactagggtg aactttacca tttttgtcgc 780 actccgtctc ctcggaatag gggtgtagta attctgcagt agtgcaattt ttaccccgcc 840 aagggggggc gaaaagagac gacctcatca cgcattctcc agtcgctctc tacgcctaca 900 gcaccgacgt agttaacttt ctcccatata taaagcaatt gccattcccc tgaaaacttt 960 aacctctgct ttttcttgat ttttccttgc ccaaagaaaa g 1001 <210> 108 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> pG7 promoter <400> 108 aattgattaa gttcagtgaa atttcaaacc gctatacaca acaggacaac tttgagttta 60 gaaaaatccg atgtagtgta acggctagca cggtccgctt tcaccgggca gacccgggtt 120 cgactcccgg catcggagtt tatttttcca tttcgttctt tagagtattc tcctcagcat 180 gcccccctga atttttcctt ttttccatgt gtcccatttt tccacttttt ttacagtttt 240 cctcgtgatg ttaattggct acacaaaagc tgccacacga aaccttaatc acgaaaaact 300 atacagcctt cactaatccg tagccccata atatgttgtc cacgtgctgt tgggtactac 360 ctgtagactc tcatacccca ctccgtcttt ctccaacaat taacgcagta ccgagattta 420 tcagcagact caaattgggc aaactctgta tttttccttg cccgcataat ttatgggtct 480 caggcctcca cgtttcctgt ttacttgaag aatattggct gcggaaaaag tggtaaggac 540 aacccccttt taattggatc cagtttttcc gaaatgttcc gatccgtacg tcatctccga 600 agccgtacat tttcactcaa tctacgtagc tttggactca gcgctcctgg aattgccagg 660 acagtttact tgagttgata ttcccttgta gattgtgtgc ttctttttcc aaaatttgag 720 gcttcgtttg aaaagtggaa tctggtcgct agatcacttc atgcctattt ttcacggaaa 780 aataagtggt actatgcacc ccttaaacct aaagaaaaac ggaaaaatta ccccaaaacc 840 tggtgatgtt tttcgcccct ttctttttat ccgagttttt cttttttctt gtctgccaaa 900 ttcctctcct gaccttagcg tccccggaaa aaattaacta cttaaggacc gaatgagccc 960 cagcttttcc ccttctcttc attattcccc ataatataat 1000 <210> 109 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> pG8 promoter <400> 109 ctgcacaacc attgccagta aggacgaaga gaaggcccca ctacccaaaa ttcaggataa 60 cgtcttcata ccatgcagcg acgcctacaa gacgctgtca agacatgcca acttcaacga 120 agtgaacttt aacacattga tcgggaaatt gaccaccaag ggaatgctgg ttgaggctgg 180 aagcgttgcc agtgtcctga gggaactgga ccgaaagttt agtaatgcat aagaggatat 240 atataggaat gcagtaataa tattagtacc cattaagtgg gctaagccat tggaaggccg 300 tctgactgat ggtggtgttc ttctcattta gatagtgcat ttgcaactac cgtctgagat 360 tgagtttgat gtgaagctcc agcgccaaaa cagtataaga accttatctc cgcattattg 420 ttcttgcgta aaagtttgtg tgaagaaaca ggggtagttg cgcagattag ttgtaatatg 480 cgcataggat gggtcattga cttctttcct cgaaagagcc acaccgttag ctaaaaaagg 540 acgcgcatct accccaaaat agaatgtggg gaaataggac gcgcaacttc ctctcaatca 600 ctggacgtca gaaaaacaaa tgcgcaatcg agtcaccctc cgtgataccc tccgtgatac 660 cccctctccg tctattctga cagcgtctcc ccatgacgtt tcaatctact tagaaaagat 720 ttcgtttttt tttccttcaa ttacacgatc tcatcttctg caagggtctg gaggacatca 780 ccaatctgcg actccataac ttagtcctga gtttatattt acgcttcatc tgatgagtag 840 gaagaaaaag tttcacgaaa ttcccccgcc aacttgccct tcggaataag cagccactct 900 ccttctgccc atagtaagct tgcgcgaggc cccaacttgg ccagaaactt taaatatgcc 960 aaacaatctc ccccaatcta agttctccct cttctaaaaa 1000 <210> 110 <211> 859 <212> DNA <213> Artificial Sequence <220> <223> pG1a promoter <400> 110 ggaatctgta ttgttagaaa gaacgagagt tttttacggc gccgccatat tgggccgtgt 60 gaaaacagct tgaaacccca ctactttcaa aggttctgtt gctatacacg aaccatgttt 120 aaccaacctc gcttttgact tgactgaagt catcggttaa caatcaagta ccctagtctg 180 tctgaatgct cctttccata ttcagtaggt gtttcttgca cttttgcatg cactgcggaa 240 gaattagcca atagcgcgtt tcatatgcgc ttttaccccc tcttttgtca agcgcaaaat 300 gcctgtaaga tttggtgggg gtgtgagccg ttagctgaag tacaacaggc taattccctg 360 aaaaaactgc agatagactt caagatctca gggattccca ctatttggta ttctgatatg 420 tttttcctga tatgcatcaa aactctaatc taaaacctga atctccgcta tttttttttt 480 ttttttgatg accccgtttt cgtgacaaat taatttccaa cggggtcttg tccggataag 540 agaattttgt ttgattatcc gttcggataa atggacgcct gctccatatt tttccggtta 600 ttaccccacc tggaagtgcc cagaattttc cggggattac ggataatacg gtggtctgga 660 ttaattaata cgccaagtct tacattttgt tgcagtctcg tgcgagtatg tgcaataata 720 aacaagatga gccaatttat tggattagtt gcagcttgac cccgccatag ctaggcatag 780 ccaagtgcta tgggtgttag atgatgcact tggatgcagt gagttttgga gtataaaaga 840 tccttaaaat tccaccctt 859 <210> 111 <211> 664 <212> DNA <213> Artificial Sequence <220> <223> pG1b promoter <400> 111 ccatattcag taggtgtttc ttgcactttt gcatgcactg cggaagaatt agccaatagc 60 gcgtttcata tgcgctttta ccccctcttt tgtcaagcgc aaaatgcctg taagatttgg 120 tgggggtgtg agccgttagc tgaagtacaa caggctaatt ccctgaaaaa actgcagata 180 gacttcaaga tctcagggat tcccactatt tggtattctg atatgttttt cctgatatgc 240 atcaaaactc taatctaaaa cctgaatctc cgctattttt tttttttttt tgatgacccc 300 gttttcgtga caaattaatt tccaacgggg tcttgtccgg ataagagaat tttgtttgat 360 tatccgttcg gataaatgga cgcctgctcc atatttttcc ggttattacc ccacctggaa 420 gtgcccagaa ttttccgggg attacggata atacggtggt ctggattaat taatacgcca 480 agtcttacat tttgttgcag tctcgtgcga gtatgtgcaa taataaacaa gatgagccaa 540 tttattggat tagttgcagc ttgaccccgc catagctagg catagccaag tgctatgggt 600 gttagatgat gcacttggat gcagtgagtt ttggagtata aaagatcctt aaaattccac 660 cctt 664 <210> 112 <211> 493 <212> DNA <213> Artificial Sequence <220> <223> pG1c promoter <400> 112 ctgcagatag acttcaagat ctcagggatt cccactattt ggtattctga tatgtttttc 60 ctgatatgca tcaaaactct aatctaaaac ctgaatctcc gctatttttt tttttttttt 120 gatgaccccg ttttcgtgac aaattaattt ccaacggggt cttgtccgga taagagaatt 180 ttgtttgatt atccgttcgg ataaatggac gcctgctcca tatttttccg gttattaccc 240 cacctggaag tgcccagaat tttccgggga ttacggataa tacggtggtc tggattaatt 300 aatacgccaa gtcttacatt ttgttgcagt ctcgtgcgag tatgtgcaat aataaacaag 360 atgagccaat ttattggatt agttgcagct tgaccccgcc atagctaggc atagccaagt 420 gctatgggtg ttagatgatg cacttggatg cagtgagttt tggagtataa aagatcctta 480 aaattccacc ctt 493 <210> 113 <211> 370 <212> DNA <213> Artificial Sequence <220> <223> pG1d promoter <400> 113 gaccccgttt tcgtgacaaa ttaatttcca acggggtctt gtccggataa gagaattttg 60 tttgattatc cgttcggata aatggacgcc tgctccatat ttttccggtt attaccccac 120 ctggaagtgc ccagaatttt ccggggatta cggataatac ggtggtctgg attaattaat 180 acgccaagtc ttacattttg ttgcagtctc gtgcgagtat gtgcaataat aaacaagatg 240 agccaattta ttggattagt tgcagcttga ccccgccata gctaggcata gccaagtgct 300 atgggtgtta gatgatgcac ttggatgcag tgagttttgg agtataaaag atccttaaaa 360 ttccaccctt 370 <210> 114 <211> 328 <212> DNA <213> Artificial Sequence <220> <223> pG1e promoter <400> 114 ccggataaga gaattttgtt tgattatccg ttcggataaa tggacgcctg ctccatattt 60 ttccggttat taccccacct ggaagtgccc agaattttcc ggggattacg gataatacgg 120 tggtctggat taattaatac gccaagtctt acattttgtt gcagtctcgt gcgagtatgt 180 gcaataataa acaagatgag ccaatttatt ggattagttg cagcttgacc ccgccatagc 240 taggcatagc caagtgctat gggtgttaga tgatgcactt ggatgcagtg agttttggag 300 tataaaagat ccttaaaatt ccaccctt 328 <210> 115 <211> 283 <212> DNA <213> Artificial Sequence <220> <223> pG1f promoter <400> 115 gcctgctcca tatttttccg gttattaccc cacctggaag tgcccagaat tttccgggga 60 ttacggataa tacggtggtc tggattaatt aatacgccaa gtcttacatt ttgttgcagt 120 ctcgtgcgag tatgtgcaat aataaacaag atgagccaat ttattggatt agttgcagct 180 tgaccccgcc atagctaggc atagccaagt gctatgggtg ttagatgatg cacttggatg 240 cagtgagttt tggagtataa aagatcctta aaattccacc ctt 283 <210> 116 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 116 cctgaggctt tgttccaccc atct 24 <210> 117 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 117 ggaacatagt agtaccaccg gacataacga 30 <210> 118 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 118 taaaattctc cggggtaaaa c 21 <210> 119 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 119 ctctccagca gagtaaaatt tc 22 <210> 120 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 120 cacagaatcg gtagaggtg 19 <210> 121 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 121 cagtgatgga agatggc 17 <210> 122 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 122 agactttcac tttccacgct 20 <210> 123 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 123 caacgaaagc agcgaagtc 19 <210> 124 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 124 gatcggtctc acatgtcttg ggacgacg 28 <210> 125 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 125 gatcggtctc agtcctgctt tgtctctag 29 <210> 126 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 126 gatcggtctc tggactatgt gaacctcc 28 <210> 127 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 127 gatcggtctc aaagcctaca tgaaatcgtc atcacc 36 <210> 128 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 128 gatcggtctc acatgacaaa cgaaccagaa 30 <210> 129 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 129 gatgggtctc agaccggttt ggaaatcc 28 <210> 130 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 130 gatcggtctc aggtctgcct tgtagaac 28 <210> 131 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 131 gatcggtctc agagcctgca ttcaaagttg 30 <210> 132 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 132 gatcggtctc agctctggtg accttg 26 <210> 133 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 133 gatcggtctc aaagcctaat ccacaatttc ttctttctc 39 <210> 134 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 134 gatgggtctc acatgtcccg tttctttgcg tcag 34 <210> 135 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 135 gatcggtctc taagcttatt tactatagat cttcttttgg tctttgacat tggaggactg 60 <210> 136 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 136 gatcggtctc acatggctcc aaactacaac 30 <210> 137 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 137 gatcggtctc agtgaagaat tcgtagattg tctc 34 <210> 138 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 138 gatcggtctc atcacctcca aaagggttag 30 <210> 139 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 139 gatcggtctc agttatgtgt ctcgacctta c 31 <210> 140 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 140 gatcggtctc ataacaggct aaagagaatg g 31 <210> 141 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 141 gatcggtctc taagcttata ttcttccttg acgctttag 39 <210> 142 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 142 gatcggtctc acatgaggcc aattttactg aag 33 <210> 143 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 143 gaagggtctc attggacacc gaaaatagc 29 <210> 144 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 144 gatcggtctc tccaaggatt cggtagc 27 <210> 145 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 145 gatcggtctc aaagcctaag aggcagtctg taaag 35 <210> 146 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 146 gatcggtctc acatggcaac agcagtag 28 <210> 147 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 147 gatcggtctc accttgacac aatctacaca cc 32 <210> 148 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 148 gatcggtctc aaaggagatc atttcactac c 31 <210> 149 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 149 gaagggtctc actccgagtc cagagc 26 <210> 150 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 150 gatcggtctc aggaggctct ggaagctc 28 <210> 151 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 151 atcggtctct aagcctacac cttaggcttt ggcttg 36 <210> 152 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> ACGCCCTGCAGGATGTCTGAAGGTATTATTGAAATCGACACTAACTTAATCG <400> 152 acgccctgca ggatgtctga aggtattatt gaaatcgaca ctaacttaat cg 52 <210> 153 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 153 gactggccga ggcggcccta agactcatta acttcctcag tctcaaacaa gtc 53 <210> 154 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 154 gtctcctgca ggatgtccaa taagaacgtg gatacagctc ca 42 <210> 155 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 155 gactggccga ggcggcctta aacttcctgt tcctcttctt gctctc 46 <210> 156 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 156 gaggcctgca ggatgtctgt cgataccaag gaagttcaag 40 <210> 157 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 157 gagcggccga ggcggcccta gtttgcttgt gcatccgctt 40 <210> 158 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 158 gatcggtctc ccatgtcaga gactgaaaac g 31 <210> 159 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 159 gatcggtctc tattcaggtt tgattccatc tc 32 <210> 160 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 160 gatcggtctc agaatgggag gacgag 26 <210> 161 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 161 gatcggtctc acgcgggacc ac 22 <210> 162 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 162 gatcggtctc tcgcggtctg ttgag 25 <210> 163 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 163 gatcggtctc acatccttgg acttggtc 28 <210> 164 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 164 gatcggtctc agatgaggca gttttaagac c 31 <210> 165 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 165 gatcggtctc aaagcctaaa tgctgaaaga aggtacg 37 <210> 166 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 166 gatcggtctc acatgtctga aggtattatt gaaatcgaca ctaacttaat cgagacaaac 60 tac 63 <210> 167 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 167 gatcggtctc aaagcctaag actcattaac ttcctcagtc tcaaacaagt cagtg 55 <210> 168 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 168 gactggtctc acatgcatcc atacaccg 28 <210> 169 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 169 gatcggtctc aggtcgtagt ttgtctcg 28 <210> 170 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 170 gatcggtctc agaccaggtt gtcagc 26 <210> 171 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 171 gatcggtctc aaagcctaag actcattaac ttcctcag 38 <210> 172 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 172 gatcggtctc acatgtccaa taagaacgtg g 31 <210> 173 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 173 gatcggtctc accagcgtcc tcagat 26 <210> 174 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 174 gatcggtctc actggcaaga ctagagatg 29 <210> 175 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 175 gactggtctc acttaacgaa cgaggtacc 29 <210> 176 <211> 393 <212> DNA <213> Artificial Sequence <220> <223> gBlock <400> 176 ccattgggtc tcataagaaa taaggaggct gaagtcaaga ctgctccaga cggatctata 60 atagtatcag aagaggacat caaaaggaaa actaaatccc ttttgaataa gttgacgttg 120 gaattctttg atgatatctc aaacgatata attgctttga ccaagcaagc tcaatgggaa 180 gatgacgtca agactttgaa acaagttatt gagtctatat ttgcaaaggc ttgtgacgaa 240 ccctactggt cctctatgta cgctaaatta tgcgccaaaa tgtgcaagga caccccacct 300 gagatcaagg aaactaatga gaagggaaat actttcaccg gtggtgattt ggtgagaaga 360 gtgttgatta atagatgtca tgagaccgat tcg 393 <210> 177 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 177 agctggtctc agtcaaaccg aatatcagaa ag 32 <210> 178 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 178 gatcggtctc aaagcttaaa cttcctgttc ctcttc 36 <210> 179 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 179 gtacggtctc acatgtctgt cgataccaag 30 <210> 180 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 180 gatcggtctc agaagccaat gtctcgg 27 <210> 181 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 181 gatcggtctc tcttcattgt atgttggtga g 31 <210> 182 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 182 gatcggtctc acacgttggg accac 25 <210> 183 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 183 gatcggtctc acgtgaccct tccttg 26 <210> 184 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 184 gatcggtctc agttcttgac aaagacattg g 31 <210> 185 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 185 gatcggtctc tgaactttga cactgagtcc 30 <210> 186 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 186 gatcggtctc taagcctagt ttgcttgtgc atcc 34 <210> 187 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 187 gatcggtctc gcatgagtga gaaaaacaca cg 32 <210> 188 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 188 gatcggtctc aaagcttata actcagtgtt ctcaagg 37 <210> 189 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 189 agcggtgatt tccttttgca ttctttcg 28 <210> 190 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 190 tttgggtttg gaatctgccg gta 23 <210> 191 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 191 cctgaggctt tgttccaccc atct 24 <210> 192 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 192 ggaacatagt agtaccaccg gacataacga 30 <210> 193 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 193 cgagagatcc tccatcttcg acgc 24 <210> 194 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 194 gtgttgcaac aagtcgacga ctctg 25 <210> 195 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 195 tgtaacgtga atgtcggatt tg 22 <210> 196 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 196 tagtgatggt ggtggtgatg 20

Claims (21)

  1. 재조합 진핵 숙주 세포로서, 하나 이상의 유전적 변형 이전의 숙주 세포와 비교하여 메신저 리보핵단백질(mRNP)의 번역 개시 인자(TIF 유전자)를 코딩하는 2개 이상의 유전자의 발현을 증가시키도록 상기 유전적 변형에 의해 조작된 관심 유전자(GOI)를 발현하며, 여기서 상기 TIF 유전자는 적어도 eIF4A를 코딩하는 유전자 및 eIF4G를 코딩하는 유전자를 포함하고, 상기 TIF 유전자 중 적어도 하나의 발현은 상기 GOI의 발현을 제어하는 프로모터와 상이한 프로모터의 전사 제어 하에 있는, 숙주 세포.
  2. 제 1항에 있어서,
    a) 상기 eIF4A는 서열번호: 12-33 중 임의의 하나와 적어도 60%의 서열 동일성을 포함하고;
    b) 상기 eIF4G는 서열번호: 34-44 중 임의의 하나와 적어도 60%의 서열 동일성을 포함하는, 숙주 세포.
  3. 제 1항 또는 제 2항에 있어서, 상기 TIF 유전자는
    a) eIF4E를 코딩하는 유전자;
    b) PAB1을 코딩하는 유전자; 또는
    c) RLI1을 코딩하는 유전자
    중 임의의 하나 이상을 추가로 포함하는, 숙주 세포.
  4. 제 3항에 있어서,
    a) 상기 eIF4E는 서열번호: 1-11 중 임의의 하나와 적어도 60%의 서열 동일성을 포함하고;
    b) 상기 PAB1은 서열번호: 45-55 중 임의의 하나와 적어도 60%의 서열 동일성을 포함하고;
    c) 상기 RLI1은 서열번호: 56-65 중 임의의 하나와 적어도 60%의 서열 동일성을 포함하는, 숙주 세포.
  5. 제 1항 내지 제 4항 중 어느 한 항에 있어서, 상기 TIF 유전자 중 하나 이상이 숙주 세포에서 상기 TIF 유전자(들)를 발현시키기 위해 최적화된, 숙주 세포.
  6. 제 1항 내지 제 5항 중 어느 한 항에 있어서, 적어도
    a) eIF4A 및 eIF4G를 코딩하는 유전자;
    b) eIF4A, eIF4G 및 eIF4E를 코딩하는 유전자;
    c) eIF4A, eIF4G, eIF4E 및 PAB1을 코딩하는 유전자;
    d) eIF4A, eIF4G 및 PAB1을 코딩하는 유전자
    를 과발현하는, 숙주 세포.
  7. 제 6항에 있어서, 상기 숙주 세포가 RLI1을 코딩하는 유전자를 과발현하도록 추가로 조작된, 숙주 세포.
  8. 제 1항 내지 제 7항 중 어느 한 항에 있어서, 상기 유전적 변형이 (i) 하나 이상의 폴리뉴클레오티드 또는 이의 일부; 또는 (ii) 발현 제어 서열, 바람직하게는 프로모터, 리보솜 결합 부위, 전사 또는 번역 개시 및 정지 서열, 인핸서 및 활성자 서열로 이루어진 군으로부터 선택되는 발현 제어 서열의 녹킨, 치환, 파괴, 결실 또는 녹아웃을 포함하며; 바람직하게는 상기 하나 이상의 유전적 변형은 숙주 세포 게놈으로의 이종 폴리뉴클레오티드 또는 발현 카세트의 통합을 포함하는, 숙주 세포.
  9. 제 1항 내지 제 8항 중 어느 한 항에 있어서, 상기 유전적 변형이 상기 TIF 유전자(들)의 수 또는 상기 TIF 유전자(들)를 포함하는 발현 카세트의 수의 증가, 및/또는 상기 TIF 유전자(들)의 기능 획득 변경을 포함하여서, 상기 TIF 유전자(들)의 수준 또는 활성 증가를 초래하는, 숙주 세포.
  10. 제 1항 내지 제 9항 중 어느 한 항에 있어서, 상기 TIF 유전자가 숙주 세포에 대해 내인성 또는 이종성인, 숙주 세포.
  11. 제 1항 내지 제 10항 중 어느 한 항에 있어서,
    a) 상기 TIF 유전자(들)에 작동가능하게 연결된 하나 이상의 발현 제어 서열을 각각 포함하는, 하나 이상의 이종 TIF 발현 카세트에서 하나 이상의 상기 TIF 유전자를 발현하기 위한 발현 시스템; 및
    b) GOI 및 상기 GOI에 작동가능하게 연결된 하나 이상의 발현 제어 서열을 포함하는 GOI 발현 카세트를 포함하며;
    여기서 a)의 발현 시스템 및 b)의 발현 카세트는 세포 배양물에서 숙주 세포를 배양할 때 각각의 TIF 유전자(들) 및 GOI를 발현하도록 조작되는, 숙주 세포.
  12. 제 11항에 있어서,
    a) 상기 TIF 발현 카세트 중 적어도 하나는 구성적 프로모터를 포함하고/하거나;
    b) 상기 GOI 발현 카세트는 유도성, 탈-억제성 또는 달리 조절가능한 프로모터, 또는 구성적 프로모터를 포함하는, 숙주 세포.
  13. 제 1항 내지 제 12항 중 어느 한 항에 있어서,
    a) 피치아(Pichia), 한세눌라(Hansenula), 코마가타엘라(Komagataella), 사카로미세스(Saccharomyces), 클루이베로미세스(Kluyveromyces), 칸디다(Candida), 오가테아(Ogataea), 야로위아(Yarrowia) 및 지오트리쿰(Geotrichum), 바람직하게는 피치아 파스토리스(Pichia pastoris), 코마가타엘라 파피(Komagataella phaffii), 코마가타엘라 파스토리스(Komagataella pastoris), 코마가타엘라 슈도파스토리스(Komagataella pseudopastoris), 사카로미세스 세레비지애(Saccharomyces cerevisiae), 오가테아 미누타(Ogataea minuta), 클루이베롬세스 락티스(Kluyveromces lactis), 클루이베로메스 마르시아누스(Kluyveromes marxianus), 야로위아 리폴리티카(Yarrowia lipolytica) 또는 한세눌라 폴리모르파(Hansenula polymorpha)로 이루어진 군에서 선택되는 속의 효모 세포;
    b) 사상성 진균의 세포, 예컨대 아스페르길루스 아와모리(Aspergillus awamori) 또는 트리코더마 리세이(Trichoderma reesei);
    c) 비-인간 영장류, 인간, 설치류 또는 소 세포, 예컨대 마우스 골수종(NSO)-세포주, 차이니즈 햄스터 난소(CHO)-세포주, HT1080, H9, HepG2, MCF7, MDBK Jurkat, MDCK, NIH3T3, PC12, BHK(아기 햄스터 신장 세포), VERO, SP2/0, YB2/0, Y0, C127, L 세포, COS, 예를 들어 COS1 및 COS7, QC1-3, HEK-293, VERO, PER.C6, HeLA, EB1, EB2, EB3, 종양용해성 또는 하이브리도마-세포주;
    d) 곤충 세포, 예컨대 Sf9, Mimic Sf9, Sf21, 하이 파이브(High Five)(BT1-TN-5B1-4) 또는 BT1-Ea88 세포;
    e) 조류 세포, 예컨대 암포라(Amphora), 규조류(Bacillariophyceae), 두날리엘라(Dunaliella), 클로렐라(Chlorella), 클라미도모나스(Chlamydomonas), 시아노피타(Cyanophyta)(시아노박테리아), 나노클로롭시스(Nannochloropsis), 스피룰리나(Spirulina) 또는 오크로모나스(Ochromonas) 속; 또는
    f) 식물 세포, 예컨대 단자엽 식물, 바람직하게는 옥수수, 벼, 밀 또는 세타리아, 또는 쌍자엽 식물, 바람직하게는 카사바, 감자, 대두, 토마토, 담배, 알팔파, 피스코미트렐라 파텐스(Physcomitrella patens) 또는 애기장대(Arabidopsis)로부터의 세포인, 숙주 세포.
  14. 제 1항 내지 제 13항 중 어느 한 항의 숙주 세포를 생산하는 방법으로서, 하나 이상의 이종 발현 카세트 내에 하나 이상의 상기 TIF 유전자 및 관심 유전자(GOI)를 포함하도록 숙주 세포를 유전적으로 조작하는 것을 포함하는, 방법.
  15. 제 14항의 숙주 세포를 관심 단백질(POI)을 생산하는 조건 하에서 배양함으로써 관심 유전자(GOI)에 의해 코딩되는 상기 POI를 생산하는 방법.
  16. 제 15항에 있어서, 상기 숙주 세포는 하나 이상의 상기 TIF 유전자를 공동-발현하고 상기 POI를 숙주 세포 배양물로 분비하는 조건 하에 배양 배지에서 배양되고, 상기 POI는 숙주 세포 배양물로부터 회수되는, 방법.
  17. 제 15항 또는 제 16항에 있어서, 상기 숙주 세포가 상기 POI에 대한 숙주 세포의 비 생산성(시간당 μg/g 효모 건조 질량(YDM) 및/또는 상기 POI에 대한 부피 생산성(시간당 μg/L)을 증가시키는 수준에서 상기 TIF 유전자 중 하나 이상을 공동-발현하도록 변형되는, 방법.
  18. 제 15항 내지 제 17항 중 어느 한 항에 있어서, 상기 POI가 치료 또는 진단 생성물, 바람직하게는 항원-결합 단백질, 치료 단백질, 효소, 펩티드, 단백질 항생제, 독소 융합 단백질, 탄수화물-단백질 접합체, 구조 단백질, 조절 단백질, 백신 항원, 성장 인자, 호르몬, 사이토카인, 공정 효소 및 대사 효소로 이루어진 군으로부터 선택된 펩티드, 폴리펩티드 또는 단백질인, 방법.
  19. 세포 배양물에서 메신저 리보핵단백질(mRNP)의 하나 이상의 TIF 유전자(들)를 발현하는 하나 이상의 이종 발현 카세트를 공동-발현함으로써, 관심 단백질(POI)을 코딩하는 관심 유전자(GOI)를 발현하는 숙주 세포에 의해 생산될 때 상기 POI의 수율을 증가시키는 방법.
  20. 메신저 리보핵단백질(mRNP)의 하나 이상의 TIF 유전자(들)를 발현하는 하나 이상의 이종 발현 카세트를 포함하는 폴리펩티드 발현 시스템.
  21. 제 20항에 있어서, 관심 단백질(POI)을 코딩하는 관심 유전자(GOI) 및 상기 GOI에 작동가능하게 연결된 하나 이상의 발현 제어 서열을 포함하는 발현 카세트를 포함하는, 발현 시스템.
KR1020237010094A 2020-09-30 2021-09-30 번역 인자를 과발현하는 숙주 세포 KR20230075436A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP20199354 2020-09-30
EP20199354.0 2020-09-30
PCT/EP2021/076910 WO2022069613A1 (en) 2020-09-30 2021-09-30 Host cells overexpressing translational factors

Publications (1)

Publication Number Publication Date
KR20230075436A true KR20230075436A (ko) 2023-05-31

Family

ID=72709158

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237010094A KR20230075436A (ko) 2020-09-30 2021-09-30 번역 인자를 과발현하는 숙주 세포

Country Status (8)

Country Link
US (1) US20230348545A1 (ko)
EP (1) EP4222266A1 (ko)
JP (1) JP2023543604A (ko)
KR (1) KR20230075436A (ko)
CN (1) CN116490517A (ko)
CA (1) CA3193155A1 (ko)
IL (1) IL301312A (ko)
WO (1) WO2022069613A1 (ko)

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5646009A (en) 1990-09-10 1997-07-08 The University Of Kentucky Research Foundation Hybrid vector and method resulting in protein overproduction by eukaryotic cells
CA2105064A1 (en) 1991-04-01 1992-10-02 Martin Anthony Gleeson Genes which influence pichia proteolytic activity, and uses therefor
US6153424A (en) 1995-11-09 2000-11-28 Zymogenetics, Inc. Protease-deficient strains of Pichia methanolica
JP2010524440A (ja) 2007-04-20 2010-07-22 ポリマン サイエンティフィック イミューンバイオロジッシュ フォーシュング ゲゼルシャフト ミット ベシュレンクテル ファフツング 発現系
EP2401357B1 (en) 2009-02-26 2015-03-25 GlaxoSmithKline LLC Host cells and methods of use
EP3590950A1 (en) 2011-05-09 2020-01-08 Ablynx NV Method for the production of immunoglobulin single varible domains
IN2014DN03419A (ko) 2011-10-07 2015-05-22 Lonza Ag
IN2015DN02771A (ko) 2012-10-29 2015-09-04 Lonza Ag
AU2013382370B2 (en) 2013-03-15 2020-01-23 Lonza Ltd Constitutive promoter
WO2015158800A1 (en) 2014-04-17 2015-10-22 Boehringer Ingelheim Rcv Gmbh & Co Kg Recombinant host cell for expressing proteins of interest
TW201718859A (zh) 2015-08-05 2017-06-01 隆查有限公司 啟動子變體
CN108690139B (zh) 2017-07-31 2019-03-15 康码(上海)生物科技有限公司 新型融合蛋白的制备及其在提高蛋白质合成的应用
US11725086B2 (en) * 2018-03-05 2023-08-15 Berry Global, Inc. Shrink films and methods for making the same
DK3762499T3 (da) 2018-03-06 2024-03-11 Danisco Us Inc Reduktion i acetatproduktion ved hjælp af gær, der overudtrykker pab1
CN110551750A (zh) 2018-05-31 2019-12-10 齐鲁工业大学 一种提高酵母mRNA表达效率的方法
CN113423836B (zh) 2019-01-11 2023-07-11 龙沙有限公司 重组宿主细胞中碳源调节的蛋白的产生

Also Published As

Publication number Publication date
JP2023543604A (ja) 2023-10-17
CA3193155A1 (en) 2022-04-07
WO2022069613A1 (en) 2022-04-07
IL301312A (en) 2023-05-01
CN116490517A (zh) 2023-07-25
EP4222266A1 (en) 2023-08-09
US20230348545A1 (en) 2023-11-02

Similar Documents

Publication Publication Date Title
KR102495283B1 (ko) 재조합 숙주 세포에서 탄소 공급원 조절된 단백질 생산
JP2023156329A (ja) 目的タンパク質を産生するための宿主細胞
US20230126246A1 (en) Helper factors for expressing proteins in yeast
KR20230075436A (ko) 번역 인자를 과발현하는 숙주 세포
EP3947695B1 (en) Mut- methylotrophic yeast
WO2020200415A1 (en) Mut- methylotrophic yeast
WO2020200414A1 (en) Protein production in mut-methylotrophic yeast